Sie sind auf Seite 1von 343

Springer-Handbuch der Mathematik II

Herausgeber und Autor:


Prof. Dr. Eberhard Zeidler, Max-Planck-Institut für Mathematik in den Naturwissen-
schaften, Leipzig, Deutschland
Springer-Handbuch der
Mathematik II
Begründet von I.N. Bronstein und K.A. Semendjaew
Weitergeführt von G. Grosche, V. Ziegler und D. Ziegler
Herausgegeben von E. Zeidler
Herausgeber
Prof. Dr. Eberhard Zeidler
Max-Planck-Institut für Mathematik in den Naturwissenschaften
Leipzig
Deutschland

ISBN 978-3-658-00296-1 ISBN 978-3-658-00297-8 (eBook)


DOI 10.1007/978-3-658-00297-8

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbi-


bliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

Der Verlag und die Autoren haben alle Sorgfalt walten lassen, um vollständige und akkurate
Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch
die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informatio-
nen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck.

Springer Spektrum
© Springer Fachmedien Wiesbaden 2013

Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung,
die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zu-
stimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Über-
setzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen
Systemen.

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem


Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche
Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten
wären und daher von jedermann benutzt werden dürften.

Planung und Lektorat: Ulrike Schmickler-Hirzebruch | Barbara Gerlach

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist eine Marke von Springer DE.


Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media.
www.springer-spektrum.de
Vorwort

Theoria cum praxi


Gottfried Wilhelm Leibniz (1646–1716)

Die Mathematik spielt eine wichtige Rolle in vielen Bereichen unserer modernen Gesellschaft.
Sie ist eine Querschnittswissenschaft und zugleich eine Schlüsseltechnologie mit vielfältigen
engen Verbindungen zu anderen Wissenschaften. Das betrifft die Naturwissenschaften, die
Ingenieurwissenschaften, die Informatik und Informationstechnologie, die Wirtschafts- und
Finanzwissenschaft, die Sozialwissenschaften sowie die Medizin. Mathematik ist abstrakt und
zugleich sehr praktisch. Das vorliegende
SPRINGER-HANDBUCH DER MATHEMATIK,
das sich um einen breit angelegten Brückenschlag zwischen der Mathematik und ihren An-
wendungen bemüht, stellt eine wesentliche Erweiterung des SPRINGER-TASCHENBUCHES
DER MATHEMATIK dar, das 2012 im Verlag Springer Spektrum erschienen ist. Das Springer-
Handbuch umfasst die folgenden vier Teile:
– TEIL I: Analysis.
– TEIL II: Algebra, Geometrie, Grundlagen der Mathematik.
– TEIL III: Variationsrechnung und Physik, Wahrscheinlichkeitsrechnung und mathematische
Statistik, Numerik und Wissenschaftliches Rechnen, Wirtschafts- und Finanzmathematik,
Algorithmik und Informatik.
– TEIL IV: Funktionalanalysis, Dynamische Systeme, Mannigfaltigkeiten, Topologie, Mathe-
matische Physik.
Als mehrbändiges Nachschlagewerk ist das Springer-Handbuch in erster Linie für wissenschaft-
liche Bibliotheken gedacht, die ihren Leserinnen und Lesern parallel zum Springer-Taschenbuch
der Mathematik das umfangreichere Material des Springer-Handbuches (in elektronischer Form
und Papierform) zur Verfügung stellen wollen. Für individuell interessierte Leserinnen und
Leser sei auf folgendes hingewiesen. Die Teile I bis III des Springer-Handbuches der Mathematik
enthalten die entsprechenden Kapitel des Springer-Taschenbuches der Mathematik, die durch
wichtiges zusätzliches Material ergänzt werden. Dagegen sind die neun Kapitel von Teil IV nicht
im Springer-Taschenbuch der Mathematik enthalten.
Teil I enthält neben dem einführenden Kapitel und dem Kapitel 1 des Springer-Taschenbuches
der Mathematik zusätzliches Material zur höheren komplexen Funktionentheorie und zur
allgemeinen Theorie der partiellen Differentialgleichungen.
Teil II enthält neben den Kapiteln 2–4 des Springer-Taschenbuches der Mathematik zusätz-
liches Material zu folgenden Gebieten: multilineare Algebra, höhere Zahlentheorie, projektive
Geometrie, algebraische Geometrie und Geometrien der modernen Physik.
Teil III enthält neben den Kapiteln 5–9 des Springer-Taschenbuches der Mathematik zusätzli-
ches Material zu stochastischen Prozessen.
vi Vorwort

Teil IV enthält die folgenden Zusatzkapitel zum Springer-Taschenbuch der Mathematik:


– Kapitel 10: Höhere Analysis (Tensoranalysis und spezielle Relativitätstheorie, Integralglei-
chungen, Distributionen und lineare partielle Differentialgleichungen der mathematischen
Physik, moderne Maß- und Integrationstheorie).
– Kapitel 11: Lineare Funktionalanalysis und ihre Anwendungen.
– Kapitel 12: Nichtlineare Funktionalanalysis und ihre Anwendungen.
– Kapitel 13: Dynamische Systeme – Mathematik der Zeit.
– Kapitel 14: Nichtlineare partielle Differentialgleichungen in den Naturwissenschaften.
– Kapitel 15: Mannigfaltigkeiten.
– Kapitel 16: Riemannsche Geometrie und allgemeine Relativitätstheorie.
– Kapitel 17: Liegruppen, Liealgebren und Elementarteilchen - Mathematik der Symmetrie.
– Kapitel 18: Topologie - Mathematik des qualitativen Verhaltens.
– Kapitel 19: Krümmung, Topologie und Analysis (Eichheorie in Mathematik und Physik).
Hier werden im Rahmen der mathematischen Physik die Bedürfnisse der modernen Physik
berücksichtigt. Am Ende von Teil IV findet man eine Tafel zur Geschichte der Mathematik.
Die sorgfältig zusammengestellten Literaturangaben am Ende jedes Kapitels sollen dem Leser
helfen, bei auftretenden Fragen geeignete moderne Bücher zu konsultieren, wobei zwischen
einführender Literatur und anspruchsvollen Standardwerken gewählt werden kann.
Das vorliegende Springer-Handbuch der Mathematik wendet sich an:
– Fortgeschrittene Studierende der Mathematik und angrenzender naturwissenschaftlicher,
technischer, wirtschaftswissenschaftlicher Fachrichtungen, Graduierte, Doktoranden
– Mathematiker, Physiker, Ingenieure, Informatiker, Wirtschaftsmathematiker in Forschung,
Lehre und Praxis
– wissenschaftliche Bibliotheken, akademische Institutionen und Firmen.
Die Bedürfnisse eines derart breiten Leserkreises werden berücksichtigt, indem der Bogen von
elementaren Kenntnissen bis hin zu anspruchsvollen mathematischen Resultaten sehr weit
gespannt wird und das Werk ein breites Spektrum mathematischer Gebiete überdeckt. Großer
Wert wird dabei auf folgende Aspekte gelegt:
– ausführliche Motivation und Erläuterung der Grundideen,
– leichte Fasslichkeit, Anschaulichkeit, und Übersichtlichkeit,
– die Verbindung zwischen reiner und angewandter Mathematik,
– vielseitige Anwendungen der Mathematik und Praxisnähe, sowie
– die Diskussion des historischen Hintergrunds.
Es wird gezeigt, dass die Mathematik mehr ist als eine trockene Ansammlung von Formeln,
Definitionen, Theoremen und Rechenrezepten. Sie ist ein unverzichtbarer Partner der modernen
Technik, und sie hilft wesentlich bei der optimalen Gestaltung von Industrie- und Wirtschaftspro-
zessen. Gleichzeitig ist die Mathematik ein wichtiger Bestandteil unserer menschlichen Kultur
und ein wundervolles Erkenntnisorgan des Menschen, das ihn etwa in der Hochtechnologie, der
Elementarteilchenphysik und der Kosmologie in Bereiche vorstoßen lässt, die ohne Mathematik
nicht zu verstehen sind, weil sie von unserer täglichen Erfahrungswelt extrem weit entfernt sind.
Während das Springer-Taschenbuch der Mathematik den Anforderungen des Bachelor-
Studiums angepasst ist, bezieht sich das Springer-Handbuch der Mathematik sowohl auf das
Bachelor-Studium als auch auf das weiterführende Master-Studium.
Vorwort vii

Bei den Anwendungen der Mathematik spielen Phänomene eine große Rolle, die in Natur und
Technik auftreten. Das mathematische Verständnis dieser Phänomene erleichtert dem Anwender
in den Naturwissenschaften und in den Ingenieurwissenschaften den Überblick über die Zusam-
menhänge zwischen unterschiedlichen mathematischen Disziplinen. Deshalb wird in diesem
Springer-Handbuch der Mathematik die Sicht auf wichtige Phänomene besonders betont. Das
betrifft:
– Mathematik der Grenzübergänge (Analysis und Funktionalanalysis),
– Mathematik des Optimalen (Variationsrechnung, optimale Steuerung, lineare und nichtli-
neare Optimierung),
– Mathematik des Zufalls (Wahrscheinlichkeitsrechnung, mathematische Statistik und sto-
chastische Prozesse),
– Mathematik der Zeit und des Chaos (dynamische Systeme),
– Mathematik der Stabilität von Gleichgewichtszuständen in Natur und Technik, von zeitab-
hängigen Prozessen und von Algorithmen auf Computern,
– Mathematik der Komplexität von Algorithmen auf Computern,
– Mathematik der Symmetrie (Gruppentheorie),
– Mathematik der Systeme mit unendlich vielen Freiheitsgraden (Funktionalanalysis),
– Mathematik des qualitativen Verhaltens von Gleichgewichtszuständen und zeitabhängigen
Prozessen in Natur und Technik (Topologie),
– Mathematik der Wechselwirkungskräfte in der Natur (nichtlineare partielle Differential-
gleichungen und nichtlineare Funktionalanalysis, Differentialgeometrie der Faserbündel
und Eichtheorie),
– Mathematik der Strukturen (Kategorientheorie).
Interessant ist die Tatsache, dass klassische Ergebnisse der Mathematik heutzutage im Rahmen
neuer Technologien völlig neue Anwendungen erlauben. Das betrifft etwa die Zahlentheorie,
die lange Zeit als ein reines Vergnügen des menschlichen Geistes galt. Beispielsweise wird die
berühmte Riemannsche Zetafunktion der analytischen Zahlentheorie, die in Kapitel 2 betrachtet
wird, in der modernen Quantenfeldtheorie zur Berechnung von Streuprozessen von Elementar-
teilchen im Rahmen der Renormierungstheorie eingesetzt. Der klassische Satz von Fermat–Euler
über Teilbarkeitseigenschaften von Zahlen wird heute wesentlich benutzt, um die Übermittlung
von Nachrichten in raffinierter Weise zu verschlüsseln. Das findet man ebenfalls in Kapitel 2.
Das „Springer-Handbuch der Mathematik“ knüpft an eine lange Tradition an. Das „Taschen-
buch der Mathematik“ von I. N. Bronstein und K. A. Semendjajew wurde von Dr. Viktor Ziegler
aus dem Russischen ins Deutsche übersetzt. Es erschien 1958 im Verlag B. G. Teubner in Leipzig,
und bis zum Jahre 1978 lagen bereits 18 Auflagen vor. Unter der Herausgabe von Dr. Günter Gro-
sche und Dr. Viktor Ziegler und unter wesentlicher redaktioneller Mitarbeit von Frau Dorothea
Ziegler erschien 1979 die völlig überarbeitete 19. Auflage, an der Wissenschaftler der Leipziger
Universität und anderer Hochschulen des mitteldeutschen Raumes mitwirkten.1 Diese Neubear-
beitung wurde ins Russische übersetzt und erschien 1981 im Verlag für Technisch-Theoretische
Literatur in Moskau. Ferner wurden eine englische und eine japanische Übersetzung publiziert.
Motiviert durch die stürmische Entwicklung der Mathematik und ihrer Anwendungen erschien
in den Jahren 1995 und 1996 ein völlig neuverfasstes, zweibändiges „Teubner-Taschenbuch
der Mathematik“ im Verlag B. G. Teubner, Stuttgart und Leipzig.2 Das daraus entstandene,
vorliegende „Springer-Handbuch der Mathematik“ enthält zwei völlig neu geschriebene Kapitel
über Wirtschafts-und Finanzmathematik sowie über Algorithmik und Informatik.
1
Bis 1995 erschienen sieben weitere Auflagen.
2
Die englische Übersetzung des ersten Bandes erschien 2003 im Verlag Oxford University Press, New York, als „Oxford
Users’ Guide to Mathematics“.
viii Vorwort

Die moderne Konzeption und Koordination des Kapitels 8 über Wirtschafts-und Finanzma-
thematik lag in den erfahrenen Händen von Herrn Prof. Dr. Bernd Luderer (TU Chemnitz). In
das von Herrn Prof. Dr. Juraj Hromkovič (ETH Zürich) verfasste Kapitel 9 über Algorithmik
und Informatik flossen seine reichen Lehrerfahrungen ein. Im Mittelpunkt steht das zentrale
Problem der Komplexität von Algorithmen. Erinnert sei daran, dass eines der berühmten sieben
Milleniumsprobleme der Mathematik aus dem Jahre 2000 eine tiefe Frage der Komplexitäts-
theorie betrifft. Das Kapitel 7 über Numerik und Wissenschaftliches Rechnen wurde von Herrn
Prof. Dr. Wolfgang Hackbusch (Max-Planck-Institut für Mathematik in den Naturwissenschaften,
Leipzig) wesentlich überarbeitet, und die übrigen Kapitel wurden aktualisiert. Der Herausgeber
möchte den Kollegen Hackbusch, Hromkovič und Luderer sowie allen seinen Koautoren für ihre
engagierte Arbeit sehr herzlich danken. Das betrifft:
– Prof. Dr. Hans-Rudolf Schwarz (7.1–7.6) und
Prof. Dr. Wolfgang Hackbusch (7.7),
– Prof. Dr. Bernd Luderer (8.1, 8.13),
Prof. Dr. Jochen Blath (8.2, 8.3),
Prof. Dr. Alexander Schied (8.4, 8.5),
Prof. Dr. Stephan Dempe (8.6–8.10) und
Prof. Dr. Gert Wanka (8.11, 8.12),
– Prof. Dr. Juraj Hromkovič (9.1– 9.9) und
Prof. Dr. Siegfried Gottwald (9.10).
Ein herzliches Dankeschön geht auch an Frau Micaela Krieger-Hauwede für das sorgfältige Anfer-
tigen vieler Abbildungen in den Teilen I bis III, das Lesen der Korrekturen und die einfühlsame,
ästhetisch gelungene Textgestaltung. Frau Kerstin Fölting danke ich sehr herzlich für das sorgfäl-
tige Anfertigen der Abbildungen und der LATEX-Version von Teil IV sowie für zahlreiche Hinweise
zur Verbesserung der Darstellung. Den Mitarbeitern des Leipziger Max-Planck-Institutes für
Mathematik in den Naturwissenschaften, Regine Lübke (Sekretariat), Katarzyna Baier und In-
go Brüggemann (Bibliothek), Oliver Heller und Rainer Kleinrensing (EDV-Abteilung) sei sehr
herzlich für die technische Unterstützung bei der Fertigstellung des Springer-Handbuches der
Mathematik gedankt. Ferner danke ich sehr herzlich Frau Ulrike Schmickler-Hirzebruch vom
Verlag Springer Spektrum für die Koordination des gesamten Projekts und für die kompetente
Aktualisierung des Literaturverzeichnisses. Schließlich sei allen Leserinnen und Lesern gedankt,
die in der Vergangenheit durch ihre Hinweise zur Verbesserung der Darstellung beigetragen
haben.
Alle Beteiligten hoffen, dass dieses Nachschlagewerk in allen Phasen des Studiums und danach
im Berufsleben ein nützlicher Begleiter sein wird, der die Einheit der Mathematik betont.

Leipzig, im Sommer 2012 Der Herausgeber


Inhaltsverzeichnis

Vorwort v

2 Algebra 1
2.1 Elementare Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.1 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.2 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.3 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.4 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1.5 Das Rechnen mit Polynomen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.6 Der Fundamentalsatz der klassischen Algebra von Gauß . . . . . . . . . . . . . . . . . . . . 20
2.1.7 Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2 Matrizenkalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.1 Das Spektrum einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.2 Normalformen von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.3 Matrizenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

2.3 Lineare Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40


2.3.1 Grundideen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.3.2 Lineare Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.3.3 Lineare Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.3.4 Das Rechnen mit linearen Räumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.3.5 Dualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.4 Multilineare Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53


2.4.1 Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.2 Das Rechnen mit Multilinearformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.3 Universelle Produkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.4.4 Liealgebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4.5 Superalgebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

2.5 Algebraische Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66


2.5.1 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.5.2 Ringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.5.3 Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

2.6 Galoistheorie und algebraische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 78


2.6.1 Die drei berühmten Probleme der Antike . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.6.2 Der Hauptsatz der Galoistheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.6.3 Der verallgemeinerte Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . 81
2.6.4 Klassifikation von Körpererweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
2.6.5 Der Hauptsatz über Gleichungen, die durch Radikale lösbar sind . . . . . . . . . . . . . . . 83
2.6.6 Konstruktionen mit Zirkel und Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

2.7 Zahlentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.7.1 Grundideen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.7.2 Der Euklidische Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.7.3 Die Verteilung der Primzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
2.7.4 Additive Zerlegungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2.7.5 Die Approximation irrationaler Zahlen durch rationale Zahlen und Kettenbrüche . . . . . 102
2.7.6 Transzendente Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
x Inhaltsverzeichnis

2.7.7 Anwendung auf die Zahl π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111


2.7.8 Gaußsche Kongruenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
2.7.9 Minkowskis Geometrie der Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
2.7.10 Das fundamentale Lokal-Global-Prinzip der Zahlentheorie . . . . . . . . . . . . . . . . . . . 119
2.7.11 Ideale und höhere Teilbarkeitslehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
2.7.12 Anwendungen auf quadratische Zahlkörper . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
2.7.13 Die analytische Klassenzahlformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
2.7.14 Die Hilbertsche Klassenkörpertheorie für allgemeine Zahlkörper . . . . . . . . . . . . . . . 126

Literatur zu Kapitel 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

3 Geometrie 129
3.1 Die Grundidee der Geometrie (Erlanger Programm) . . . . . . . . . . . . . . . . . . . . . . . 129

3.2 Elementare Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130


3.2.1 Ebene Trigonometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
3.2.2 Anwendungen in der Geodäsie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
3.2.3 Sphärische Trigonometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
3.2.4 Anwendungen im Schiffs- und Flugverkehr . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
3.2.5 Die Hilbertschen Axiome der Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
3.2.6 Das Parallelenaxiom des Euklid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
3.2.7 Die nichteuklidische elliptische Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
3.2.8 Die nichteuklidische hyperbolische Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . 152

3.3 Anwendungen der Vektoralgebra in der analytischen Geometrie . . . . . . . . . . . . . . . 155


3.3.1 Geraden in der Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
3.3.2 Geraden und Ebenen im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
3.3.3 Volumina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

3.4 Euklidische Geometrie (Geometrie der Bewegungen) . . . . . . . . . . . . . . . . . . . . . . 159


3.4.1 Die euklidische Bewegungsgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
3.4.2 Kegelschnitte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
3.4.3 Flächen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

3.5 Projektive Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167


3.5.1 Grundideen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
3.5.2 Projektive Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
3.5.3 Der n-dimensionale reelle projektive Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
3.5.4 Der n-dimensionale komplexe projektive Raum . . . . . . . . . . . . . . . . . . . . . . . . . 172
3.5.5 Die Klassifikation der ebenen Geometrien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

3.6 Differentialgeometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176


3.6.1 Ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
3.6.2 Raumkurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
3.6.3 Die lokale Gaußsche Flächentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
3.6.4 Globale Gaußsche Flächentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197

3.7 Beispiele für ebene Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198


3.7.1 Einhüllende und Kaustik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
3.7.2 Evoluten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
3.7.3 Evolventen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
3.7.4 Die Traktrix von Huygens und die Kettenlinie . . . . . . . . . . . . . . . . . . . . . . . . . . 200
3.7.5 Die Lemniskate von Jakob Bernoulli und die Cassinischen Kurven . . . . . . . . . . . . . . 201
3.7.6 Die Lissajou-Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
3.7.7 Spiralen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
3.7.8 Strahlkurven (Konchoiden) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
3.7.9 Radkurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
Inhaltsverzeichnis xi

3.8 Algebraische Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209


3.8.1 Grundideen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
3.8.2 Beispiele ebener algebraischer Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
3.8.3 Anwendungen in der Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
3.8.4 Die projektiv-komplexe Form einer ebenen algebraischen Kurve . . . . . . . . . . . . . . . 225
3.8.5 Das Geschlecht einer Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
3.8.6 Diophantische Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
3.8.7 Analytische Mengen und der Vorbereitungssatz von Weierstraß . . . . . . . . . . . . . . . . 238
3.8.8 Die Auflösung von Singularitäten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
3.8.9 Die Algebraisierung der modernen algebraischen Geometrie . . . . . . . . . . . . . . . . . . 241

3.9 Geometrien der modernen Physik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242


3.9.1 Grundideen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
3.9.2 Unitäre Geometrie, Hilberträume und Elementarteilchen . . . . . . . . . . . . . . . . . . . . 245
3.9.3 Pseudounitäre Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
3.9.4 Minkowskigeometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
3.9.5 Anwendungen in der speziellen Relativitätstheorie . . . . . . . . . . . . . . . . . . . . . . . 259
3.9.6 Spingeometrie und Fermionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
3.9.7 Fast komplexe Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
3.9.8 Symplektische Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274

Literatur zu Kapitel 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276

4 Grundlagen der Mathematik 281


4.1 Der Sprachgebrauch in der Mathematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
4.1.1 Wahre und falsche Aussagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
4.1.2 Implikationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
4.1.3 Tautologien und logische Gesetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

4.2 Beweismethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286


4.2.1 Indirekte Beweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
4.2.2 Induktionsbeweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
4.2.3 Eindeutigkeitsbeweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
4.2.4 Existenzbeweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
4.2.5 Die Notwendigkeit von Beweisen im Computerzeitalter . . . . . . . . . . . . . . . . . . . . 289
4.2.6 Falsche Beweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291

4.3 Anschauliche Mengentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292


4.3.1 Grundideen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
4.3.2 Das Rechnen mit Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
4.3.3 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
4.3.4 Gleichmächtige Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
4.3.5 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
4.3.6 Mengensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304

4.4 Mathematische Logik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305


4.4.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
4.4.2 Prädikatenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
4.4.3 Die Axiome der Mengentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
4.4.4 Cantors Strukturierung des Unendlichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

4.5 Geschichte der axiomatischen Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314

Literatur zu Kapitel 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317

Index 318
K APITEL 2

A LGEBRA

Algebra ist die Lehre von den vier Grundrechenarten – Addition, Subtraktion,
Multiplikation und Division – und der Auflösung der in diesem Zusammen-
hang entstehenden Gleichungen. Eine solche Lehre wird dadurch möglich, dass
die Dinge, auf die jene Operationen wirken, weitgehend unbestimmt gelassen
werden.
Die alte Algebra sah in den Zeichen, die sie an Stelle der Zahlen in ihren
Rechnungen setzte, nur unbestimmt gelassene Zahlen. Sie ließ also nur die
Quantität unbestimmt, während die Qualität der Gegenstände ihrer algebrai-
schen Rechnungen feststand.
Es kennzeichnet die neue, im letzten Jahrhundert entstandene Algebra und
insbesondere ihre heutige als „abstrakte Algebra“ bekannte Form, dass sie auch
die Qualität der Gegenstände ihrer Rechnungen unbestimmt lässt und somit zu
einer wirklichen Operationenlehre geworden ist.
Erich Kähler (1953)

Eine wichtige formale Voraussetzung für die Entwicklung des algebraischen Denkens war der
Übergang von der Zahlenrechnung zur Buchstabenrechnung mit unbestimmten Ausdrücken.
Diese Revolution in der Mathematik wurde von François Viète (Vieta) in der zweiten Hälfte des
16. Jahrhunderts vollzogen.
Die moderne algebraische Strukturtheorie geht auf Vorlesungen von Emmy Noether (1882–
1935) in Göttingen und Emil Artin (1898–1962) in Hamburg Mitte der zwanziger Jahr zurück
und wurde von Bartel Leendert van der Waerden im Jahr 1930 in dessen „Moderner Algebra“
erstmalig in Buchform dargestellt. Dieses Buch hat viele Auflagen erlebt und ist noch heute ein
sehr gut lesbares Standardwerk der Algebra.
Der Grundstein wurde jedoch bereits im 19. Jahrhundert gelegt. Wichtige Impulse verdankt
man Gauß (Kreisteilungskörper), Abel (algebraische Funktionen), Galois (Gruppentheorie und
algebraische Gleichungen), Riemann (Geschlecht und Divisoren algebraischer Funktionen),
Kummer und Dedekind (Idealtheorie), Kronecker (Zahlkörper), Jordan (Gruppentheorie) und
Hilbert (Zahlkörper und Invariantentheorie).

2.1 Elementare Methoden

2.1.1 Kombinatorik

Die Kombinatorik untersucht, auf wieviel Arten man gewisse Elemente anordnen kann. Man
verwendet dabei das Symbol

n! := 1 · 2 · 3 · . . . · n, 0! := 1, n = 1, 2, . . .
E. Zeidler (Hrsg.), Springer-Handbuch der Mathematik II,
DOI 10.1007/978-3-658-00297-8_1, © Springer Fachmedien Wiesbaden 2013
2 2 Algebra

(sprich: n Fakultät für n!) und die Binomialkoeffizienten1


   
n n ( n − 1) . . . ( n − k + 1) n
:= , : = 1.
k 1·2·...·k 0
 
4 4·3
 Beispiel 1: 3! = 1 · 2 · 3 = 6, 4! = 1 · 2 · 3 · 4 = 24, = = 6,
  2 1·2
4 4·3·2
= = 4.
3 1·2·3

Binomialkoeffizienten und der binomische Lehrsatz: Vgl. 0.1.10.3.

Fakultät und Gammafunktion: Vgl. 1.14.6.

Grundaufgaben der Kombinatorik: Diese lauten:2


(i) Permutationen,
(ii) Permutationen mit Wiederholung (das Buchproblem),
(iii) Kombinationen ohne Wiederholung
(a) ohne Berücksichtigung der Anordnung (das Lottoproblem),
(b) mit Berücksichtigung der Anordnung (das modifizierte Lottoproblem)
(iv) Kombinationen mit Wiederholung
(a) ohne Berücksichtigung der Anordnung (das modifizierte Wortproblem),
(b) mit Berücksichtigung der Anordnung (das Wortproblem).

Permutationen: Es gibt genau

n! (2.1)

unterschiedliche Möglichkeiten, n verschiedene Elemente hintereinander anzuordnen.


 Beispiel 2: Für die beiden Zahlen 1 und 2 gibt es 2! = 1 · 2 Möglichkeiten der Anordnung.
Diese lauten:

12, 21.

Für die drei Zahlen 1,2,3 gibt es 3! = 1 · 2 · 3 Möglichkeiten der Anordnung. Diese lauten:

123, 213, 312,


(2.2)
132, 231, 321.

Das Buchproblem: Gegeben sind n nicht notwendig verschiedene Bücher, die in m1 , . . . , ms


Exemplaren auftreten. Dann gibt es

n!
m1 !m2 ! . . . ms !

unterschiedliche Möglichkeiten, diese Bücher hintereinander anzuordnen, wobei gleiche Exem-


plare nicht unterschieden werden sollen.
1
Diese Definition gilt für reelle oder komplexe Zahlen n und für k = 0, 1, . . .
2
Kombinationen mit Berücksichtigung der Anordnung werden auch Variationen genannt.
2.1 Elementare Methoden 3

 Beispiel 3: Für drei Bücher, von denen zwei gleich sind, gibt es

3! 1·2·3
= =3
2! · 1! 1·2
Möglichkeiten der Anordnung. Man erhält diese Anordnungen, indem man in (2.2) die Zahl 2
durch 1 ersetzt und doppelt vorkommende Anordnungen streicht. Das ergibt:

113, 311, 131.

Das Wortproblem: Aus k Buchstaben kann man genau

kn

verschiedene Wörter der Länge n bilden.


Bezeichnet man zwei Wörter genau dann als äquivalent, wenn sie sich nur um eine Permutation
der Buchstaben unterscheiden, dann ist die Anzahl der Klassen äquivalenter Wörter gleich

 
n+k−1
n

(modifiziertes Wortproblem).
 Beispiel 4: Aus den beiden Zeichen 0 und 1 kann man 22 = 4 Wörter der Länge 2 bilden:

00, 01, 10, 11.


   
n+k−1 3
Die Anzahl A der Klassen äquivalenter Wörter ist mit n = k = 2, also A = =
n 2
3·2
= 3. Repräsentanten sind:
1·2
00, 01, 11.

Ferner gibt es 23 = 8 Wörter der Länge 3:

000, 001, 010, 011,


100, 101, 110, 111.
 
n+k−1
Die Anzahl der Klassen äquivalenter Wörter ist A = mit n = 3, k = 2, also
  n
4 4·3·2
A= = = 4. Als Repräsentanten können wir wählen:
3 1·2·3

000, 001, 011, 111.

Das Lottoproblem: Es gibt

 
n
k

Möglichkeiten, aus n Zahlen genau k Zahlen ohne Berücksichtigung der Anordnung auszuwäh-
len.
4 2 Algebra

Berücksichtigt man die Anordnung, dann gibt es

 
n
k! = n(n − 1) . . . ( n − k + 1)
k

Möglichkeiten.
 Beispiel 5: Bei dem Spiel 6 aus 49 hat man genau
 
49 49 · 48 · 47 · 46 · 45 · 44
= = 13 983 816
6 1·2·3·4·5·6
Lottoscheine auszufüllen, um mit Sicherheit genau einen richtigen Tip zu haben.
 
3
 Beispiel 6: Es gibt = 3 Möglichkeiten, aus den drei Zahlen 1,2,3 zwei Zahlen ohne
2
Berücksichtigung der Anordnung auszuwählen:

12, 13, 23.


 
3
Berücksichtigt man die Anordnung, dann gibt es · 2! = 6 Möglichkeiten:
2
12, 21, 13, 31, 23, 32.

Das Vorzeichen einer Permutation: Gegeben seien n Zahlen 1, 2, . . . , n. Die natürliche An-
ordnung 12 . . . n wird als gerade Permutation dieser Zahlen bezeichnet.
Eine Permutation dieser Zahlen heißt genau dann gerade (bzw. ungerade), wenn man sie aus
der natürlichen Anordnung durch eine gerade (bzw. ungerade) Anzahl von Vertauschungen
zweier Elemente erhält.3 Definitionsgemäß ist das Vorzeichen einer geraden (bzw. ungeraden)
Permutation gleich 1 (bzw. gleich −1).
 Beispiel 7: Die Permutation 12 der Zahlen 1, 2 ist gerade und 21 ist ungerade.
Für die Permutation von drei Elementen 1, 2, 3 gilt:
(i) gerade Permutationen 123, 312, 231;
(ii) ungerade Permutationen 213, 132, 321.

Das Dirichletsche Schubfachprinzip: Bei einer Verteilung von mehr als n Dingen auf n
Schubfächer liegen in mindestens einem Fach mindestens zwei Dinge.
Dieses einfache Prinzip wird nach dem Vorbild von Dirichlet (1805–1859) in der Zahlentheorie
mit Erfolg angewandt.

2.1.2 Determinanten

Grundidee: Eine zweireihige Determinante berechnet man nach der Formel


 
 a b 
  := ad − bc. (2.3)
 c d 

Die Berechnung dreireihiger Determinanten wird durch die sehr regelmäßig aufgebaute Ent-
wicklungsformel nach der ersten Zeile
 
 a b c       
       
 d e f  := a  e f  − b  d f  + c  d e  (2.4)
   h k   g k   g h 
 g h k 
3
Diese Definition ist unabhängig von der Wahl der Vertauschungen.
2.1 Elementare Methoden 5

auf die Berechnung zweireihiger Determinanten zurückgeführt. Dabei ergibt sich beispielsweise
die bei a stehende Determinante durch Streichen der Zeile und Spalte von a usw. Analog kann
man vierreihige Determinanten auf dreireihige Determinanten zurückführen usw. Das ist ein
Spezialfall des Laplaceschen Entwicklungssatzes (vgl. (2.6)).
 Beispiel 1: Es gilt
 
 2 3 
 
 1 4  := 2 · 4 − 3 · 1 = 8 − 3 = 5

und
 
 1 2 3       
   2 3   2 3   2 2 
 2 2 3  = 1 ·  − 2 ·  + 3 · 
  1 4   4 4   4 1 
 4 1 4 

= 1 · 5 − 2 · (−4) + 3 · (−6) = 5 + 8 − 18 = −5.

Definition: Unter der Determinante


 
 a11 a12 a13 . . . a1n 

 a21 a22 a23 . . . a2n 
 (2.5)
 ... 
 
 a an2 an3 . . . ann 
n1

verstehen wir die Zahl

D := ∑ sgn π a1m 1
a2m2 . . . anmn .
π

Summiert wird dabei über alle Permutationen m1 m2 . . . mn der Zahlen 1, 2, . . . , n, wobei sgn π
das Vorzeichen der betreffenden Permutationen bezeichnet.
Alle a jk sind reelle oder komplexe Zahlen.
 Beispiel 2: Für n = 2 haben wir die gerade Permutation 12 und die ungerade Permutation 21.
Deshalb gilt

D = a11 a22 − a12 a21 .

Das stimmt mit Formel (2.3) überein.

Eigenschaften von Determinanten:


(i) Eine Determinante ändert sich nicht, wenn man Zeilen und Spalten miteinander ver-
tauscht.4
(ii) Eine Determinante ändert ihr Vorzeichen, wenn man zwei Zeilen oder zwei Spalten
miteinander vertauscht.
(iii) Eine Determinante ist gleich null, wenn sie zwei gleiche Zeilen oder zwei gleiche Spalten
besitzt.
(iv) Eine Determinante ändert sich nicht, wenn man zu einer Zeile das Vielfache einer anderen
Zeile addiert.
(v) Eine Determinante ändert sich nicht, wenn man zu einer Spalte das Vielfache einer anderen
Spalte addiert.
4
Das ist gleichbedeutend mit einer Spiegelung an der Hauptdiagonalen, die durch a11 , a22 , . . . , ann gegeben ist.
6 2 Algebra

(vi) Eine Determinante multipliziert man mit einer Zahl, indem man eine fest gewählte Zeile
(oder Spalte) mit dieser Zahl multipliziert.
Beispiel 3:
   
 a b   a c 
(a)  = (nach (i));
 c d   b d 
     
 a b   c d   a b 
(b)  = −   (nach (ii));  =0 (nach (iii));
 c d   a b   a b 
   
 a b   a b 
(c)  =  (nach (iv));
 c d   c + λa d + λb 
   
 αa αb   a b 
(d)  = α   (nach (vi)).
 c d   c d 

Dreiecksgestalt: Sind in (2.5) alle Elemente unterhalb der Hauptdiagonalen (bzw. oberhalb
der Hauptdiagonalen) gleich null, dann gilt

D = a11 a22 · · · ann .

 Beispiel 4:
   
 a α β   a 0 0 
   
 0 b γ  = abc,  α b 0  = abc.
   
 0 0 c   β γ c 

Eine wichtige Strategie zur Berechnung großer Determinanten besteht darin, durch Anwendung
der Operationen (ii) und (iii) eine Dreiecksgestalt zu erreichen. Das ist stets möglich.
 Beispiel 5: Für λ = −2 gilt
     
 2 3   2 3   2 3 
 = = = −10.
 4 1   4 + 2λ 1 + 3λ   0 −5 

Laplacescher Entwicklungssatz: Für die Determinante D in (2.5) gilt:

D = ak1 Ak1 + ak2 Ak2 . . . + akn Akn . (2.6)

Dabei ist k irgendeine fest gewählte Zeilennummer.5 Ferner bezeichnet Akj die sogenannte
Adjunkte zu dem Element akj . Definitionsgemäß besteht Akj aus derjenigen Determinante, die
durch Streichen der k-ten Zeile und j-ten Spalte in (2.5) entsteht, multipliziert mit dem Vorzeichen
(−1) j+k .
 Beispiel 6: Die Formel (2.4) ist ein Spezialfall dieses Entwicklungssatzes.

Multiplikation zweier Determinanten: Sind A = ( a jk ) und B = (b jk ) zwei quadratische


Matrizen der Zeilenlänge n, dann gilt:

det A det B = det ( AB).

5
Eine analoge Aussage gilt für die Entwicklung nach der k-ten Spalte.
2.1 Elementare Methoden 7

Dabei bezeichnet det A die Determinante von A (d. h., es ist det A = D in (2.5)), und AB
bezeichnet das Matrizenprodukt. Ferner gilt

det A = det AT ,

wobei AT die transponierte Matrix zu A bezeichnet (vgl. 2.1.3).

Differentiation einer Determinante: Hängen die Elemente einer Determinante von einer
Variablen t ab, dann erhält man die Ableitung D  ( t) der Determinante D ( t), indem man der
Reihe nach jede Zeile bezüglich t differenziert und alle diese Determinanten addiert.
 Beispiel 7: Für die Ableitung von
 
 a( t) b( t) 
D (t) := 
c (t) d(t) 

ergibt sich
    
 a (t) b (t)   a (t) b( t) 
D (t) :=  + .
c (t) d(t )   c  (t) d (t) 

Multiplikationsregel für Funktionaldeterminanten: Es gilt

∂( f 1 , . . . , f n ) ∂ ( f 1 , . . . , f n ) ∂ ( v1 , . . . , vn )
= · .
∂ ( u1 , . . . , u n ) ∂ ( v1 , . . . , v n ) ∂ ( u1 , . . . , u n )

∂( f 1 , . . . , f n )
Dabei bezeichnet die Determinante der ersten partiellen Ableitungen ∂ f j /∂uk
∂ ( u1 , . . . , u n )
(vgl. 1.5.3).

Die Vandermondsche Determinante:


 
 1 a a2 
 
 1 b b  = (b − a)(c − a)(c − b).
2
 
 1 c c2 

Allgemeiner ist die Determinante


 
 1 a1 a21 a31 ... a1n−1 

 

 1 a2 a22 a32 ... a2n−1 
 ... 
 
 1 an a2n a3n ... ann−1 

gleich dem Differenzenprodukt

( a2 − a1 )( a3 − a1 )( a4 − a1 ) . . . ( an − a1 )×
( a3 − a2 )( a4 − a2 ) . . . ( an − a2 )×
..................
( a n − a n − 1 ).
8 2 Algebra

2.1.3 Matrizen

Definition: Unter einer Matrix A vom Typ (m, n) versteht man ein rechteckiges Schema von
Zahlen
⎛ ⎞
a11 a12 a13 . . . a1n
⎜ a21 a22 a23 . . . a2n ⎟
A=⎝ ⎜ ⎟
... ... ... ... ... ⎠
am1 am2 am3 . . . amn

mit m Zeilen und n Spalten. Dabei sind die Elemente a jk reelle oder komplexe Zahlen.6 Die
Matrix A heißt genau dann quadratisch, wenn m = n gilt.
Die Gesamtheit aller Matrizen vom Typ ( m, n) bezeichnen wir mit Mat( m, n).

Zielstellung: Wir wollen für derartige Matrizen algebraische Operationen wie Addition und
Multiplikation erklären. Diese Operationen besitzen nicht mehr alle diejenigen Eigenschaften,
die wir von den reellen oder komplexen Zahlen her gewohnt sind. Zum Beispiel gilt für die
Matrizenmultiplikation in der Regel nicht AB = BA, im Gegensatz zum Kommutativgesetz für
die Multiplikation reeller oder komplexer Zahlen.

Addition zweier Matrizen: Gehören A und B zu Mat(m, n), dann erklären wir die Summen-
matrix A + B durch Addition der entsprechenden Elemente. Dann gehört A + B wieder zu
Mat(m, n).
 Beispiel 1:
     
a b c α β γ a+α b+β c+γ
+ = ;
d e z δ ε ζ d+δ e+ε z+ζ

( a, b) + (α, β) = ( a + α, b + β), (1, 2) + (3, 1) = (4, 3).

Multiplikation einer Matrix mit einer Zahl: Gehört A zu Mat(m, n), dann erklären wir das
Produkt αA von A mit der Zahl α, indem wir jedes Element von A mit α multiplizieren. Dann
gehört αA wiederum zu Mat(m, n).
 Beispiel 2:
       
a b c αa αb αc 1 3 2 4 12 8
α = , 4 = .
d e z αd αe αz 1 2 1 4 8 4

Nullmatrix: Die ( m × n)-Matrix


⎛ ⎞
0 0 ... 0
O := ⎝ . . . . . . . . . . . . ⎠ ,
0 0 ... 0

deren Elemente alle gleich null sind, heißt Nullmatrix.

Rechenregeln: Für A, B, C ∈ Mat( m, n) und α ∈ C gilt:

A + B = B + A, ( A + B ) + C = A + ( B + C ), A + O = A,
α( A + B) = αA + αB.

6
Die Matrix A heißt genau dann reell, wenn alle ihre Elemente a jk reelle Zahlen sind. Anstelle von einer Matrix vom Typ
(m, n) sprechen wir auch von einer (m × n )-Matrix.
2.1 Elementare Methoden 9

Genauer gesprochen bildet Mat( m, n) einen linearen Raum über dem Körper der komplexen
Zahlen (vgl. 2.3.2).

Multiplikation von zwei Matrizen: Die Grundidee der Matrizenmultiplikation ist in der For-
mel
 
α
( a, b) := aα + bβ (2.7)
β

enthalten.
 
2
 Beispiel 3: Es gilt (1, 3) = 1 · 2 + 3 · 4 = 2 + 12 = 14.
4
Die natürliche Verallgemeinerung von Definition (2.7) lautet:
⎛ ⎞
α1
⎜ α2 ⎟
⎜ ⎟
( a1 , a2 , . . . , a n ) ⎜ .. ⎟ : = a 1 α1 + a 2 α2 + . . . + a n α n .
⎝ . ⎠
αn

Die Multiplikation einer Matrix A ∈ Mat( m, n) mit einer Matrix B ∈ Mat( n, p) ergibt eine
Matrix C = AB ∈ Mat(m, p), deren Elemente c jk definitionsgemäß durch die folgende Vorschrift
gegeben sind:

c jk := j-te Zeile von A mal k-te Spalte von B. (2.8)

Bezeichnen wir die Elemente von A (bzw. B) mit a.. (bzw. b.. ), dann gilt

n
c jk = ∑ a js bsk .
s =1

 Beispiel 4: Es sei
   
1 2 2 1
A := , B := .
3 4 4 1

Die Produktmatrix C := AB schreiben wir in der Form


 
c11 c12
C := .
c21 c22

Dann gilt
 
2
c11 = erste Zeile von A mal erste Spalte von B = (1, 2) = 1 · 2 + 2 · 4 = 10,
4
 
1
c12 = erste Zeile von A mal zweite Spalte von B = (1, 2) = 1 · 1 + 2 · 1 = 3,
1
 
2
c21 = zweite Zeile von A mal erste Spalte von B = (3, 4) = 3 · 2 + 4 · 4 = 22,
4
 
1
c22 = zweite Zeile von A mal zweite Spalte von B = (3, 4) = 3 · 1 + 4 · 1 = 7.
1
10 2 Algebra

Insgesamt erhalten wir:


 
10 3
AB = C = .
22 7

Ferner ergibt sich


    
1 2 1 0 2 1 2 4
= .
0 1 0 1 1 0 1 1

Denn es gilt
   
1 1
(1, 2) = 1 · 1 + 2 · 0 = 1, (0, 1) = 0·1+1·0 = 0 usw.
0 0

Das Matrizenprodukt AB existiert genau dann, wenn A mit B verkettet ist, d. h., die
Anzahl der Spalten von A ist gleich der Anzahl der Zeilen von B.

Einheitsmatrix: Die quadratische (3 × 3)-Matrix


⎛ ⎞
1 0 0
E := ⎝ 0 1 0 ⎠
0 0 1

heißt (3 × 3)-Einheitsmatrix. Analog sind die Elemente der quadratischen ( n × n)-Einheitsmatrix


gleich eins in der Hauptdiagonalen, und sonst sind sie gleich null.

Rechenregeln für quadratische Matrizen: Es sei A, B, C ∈ Mat(n, n); E bezeichne die


(n × n)-Einheitsmatrix, und O bezeichne die (n × n)-Nullmatrix. Dann gilt:

A( BC ) = ( AB)C, A( B + C ) = AB + AC,
AE = EA = A, AO = OA = O, A + O = A.

Genauer gesprochen bildet Mat( n, n) einen (nichtkommutativen) Ring und zusätzlich eine
Algebra über dem Körper der komplexen Zahlen (vgl. 2.4.1 und 2.5.2).

Nullteiler des Matrizenprodukts: Für A, B ∈ Mat(n, n) mit n ≥ 2 gilt nicht stets AB = BA.
 Beispiel 5: Es ist
         
0 1 1 0 0 0 1 0 0 1 0 1
= , aber = .
0 0 0 0 0 0 0 0 0 0 0 0

Nullteiler des Matrizenprodukts: Gilt AB = O für zwei Matrizen A und B, dann folgt daraus
nicht notwendigerweise, dass A = O oder B = O gilt. Es sei A, B ∈ Mat(n, n). Ist AB = O für
A = O und B = O, dann heißen die Matrizen A und B Nullteiler im Ring Mat( n, n).
 Beispiel 6: Für
 
0 1
A :=
0 0

gilt A = O, aber AA = O. Denn es ist


    
0 1 0 1 0 0
= .
0 0 0 0 0 0
2.1 Elementare Methoden 11

Inverse Matrix: Es sei A ∈ Mat(n, n). Unter einer inversen Matrix zu A verstehen wir eine
Matrix B ∈ Mat( n, n) mit

AB = BA = E,

wobei E die ( n × n)-Einheitsmatrix bezeichnet. Eine derartige Matrix B existiert genau dann,
wenn det A = 0 gilt, d. h., wenn die Determinante von A ungleich null ist. In diesem Fall ist B
eindeutig bestimmt und wird mit A−1 bezeichnet. Somit gilt im Fall det A = 0:

AA−1 = A−1 A = E.

 Beispiel 7: Die inverse Matrix A−1 zu der Matrix


 
a b
A :=
c d

existiert genau dann, wenn det A = 0, also ad − bc = 0 gilt. Dann ist


 
−1 1 d −b
A = .
ad − bc −c a

Denn es gilt
 
−1 −1 1 0
AA =A A= .
0 1

Satz: Für eine beliebige ( n × n)-Matrix A mit det A = 0 hat man

( A−1 ) jk = (det A)−1 Akj .

Dabei bezeichnet ( A−1 ) jk das Element von A−1 in der j-ten Zeile und k-ten Spalte. Ferner ist Akj
die Adjunkte zu akj in der Determinante von A (vgl. 2.1.2).

Die Gruppe Gl (n, C ): Eine Matrix A ∈ Mat(n, n) heißt genau dann regulär, wenn det A = 0
gilt und somit die inverse Matrix A−1 existiert. Die Menge aller regulären ( n × n)-Matrizen wird
mit Gl (n, C ) bezeichnet.
Genauer gesprochen bildet Gl ( n, C ) eine Gruppe, die man die allgemeine (komplexe) lineare
Gruppe nennt7 (vgl. 2.5.1).

Anwendung auf lineare Gleichungssysteme: Vgl. 2.1.4.

Transponierte und adjungierte Matrizen: Gegeben sei die reelle oder komplexe (m × n)-
Matrix A = ( a jk ). Die transponierte Matrix AT von A ergibt sich, indem man die Zeilen und
Spalten von A miteinander vertauscht. Geht man zusätzlich zu den konjugiert komplexen
Elementen über, dann erhält man die adjungierte Matrix A∗ zu A.
Bezeichnet man die Elemente von AT (bzw. A∗ ) mit aTkj (bzw. a∗kj ), dann gilt:

aTkj := a jk , a∗kj := a jk , k = 1, . . . , n, j = 1, . . . , m.

Somit sind AT und A∗ (n × m)-Matrizen.


7
Analog bildet die Gesamtheit Gl (n, R ) aller reellen regulären (n × n )-Matrizen die sogenannte allgemeine reelle lineare
Gruppe. Sowohl Gl (n, C ) als auch Gl (n, R ) sind sehr wichtige Beispiele für Liegruppen und werden in Kapitel 17
zusammen mit Anwendungen in der Elementarteilchenphysik ausführlich untersucht.
12 2 Algebra

 Beispiel 8:
⎛ ⎞ ⎛ ⎞
  1 4 1 4
1 2 3i
A := , A =⎝ 2
T
5 ⎠, A∗ =⎝ 2 5 ⎠.
4 5 6
3i 6 −3i 6

Für alle reellen oder komplexen Zahlen α und β gilt:

( AT )T = A, ( A∗ )∗ = A,
(αA + βB)T = αAT + βBT , (αA + βB)∗ = αA∗ + βB∗ ,
(CD )T = DT CT , (CD )∗ = D ∗ C ∗ ,
( Q − 1 ) T = ( Q T ) −1 , ( Q −1 ) ∗ = ( Q ∗ ) −1 .

Dabei setzen wir voraus, dass die Matrizen A und B die gleiche Anzahl von Zeilen und die
gleiche Anzahl von Spalten besitzen und dass das Matrizenprodukt CD existiert. Ferner soll die
inverse Matrix Q−1 der quadratischen Matrix Q existieren. Dann existieren auch die inversen
Matrizen zu QT und Q∗ .
Die Matrix ( Q−1 )T heißt kontragredient zu Q.

Die Spur einer Matrix: Unter der Spur tr A der ( n × n)-Matrix A = ( a jk ) versteht man die
Summe der Hauptdiagonalelemente 8 von A, d. h.

tr A := a11 + a22 + . . . + ann .

 Beispiel 9:
 
a 2
tr = a + b.
3 b

Für alle komplexe Zahlen α, β und alle (n × n)-Matrizen A, B gilt:

tr (αA + βB) = α tr A + β tr B, tr ( AB) = tr ( BA ),


tr AT = tr A, tr A∗ = tr A.

 Beispiel 10: Ist die (n × n)-Matrix C invertierbar, dann hat man tr ( C−1 AC ) = tr ( ACC −1 ) =
tr A.

2.1.4 Lineare Gleichungssysteme

Grundideen: Lineare Gleichungssysteme können lösbar oder unlösbar sein. Im Fall der
Lösbarkeit ist die Lösung eindeutig, oder es existiert eine Lösungsschar, die von endlich vielen
Parametern abhängt.
 Beispiel 1 (parameterabhängige Lösung): Um das lineare Gleichungssystem

3x1 + 3x2 + 3x3 = 6,


(2.9)
2x1 + 4x2 + 4x3 = 8
8
Das englische Wort für Spur ist trace.
2.1 Elementare Methoden 13

durch reelle Zahlen zu lösen, multiplizieren wir die erste Zahl mit −2/3. Das liefert
−2x1 − 2x2 − 2x3 = −4.
Diesen Ausdruck addieren wir zur zweiten Zeile von (2.9). Damit entsteht aus (2.9) das neue
System
3x1 + 3x2 + 3x3 = 6,
(2.10)
2x2 + 2x3 = 4.
Aus der zweiten Gleichung von (2.10) folgt x2 = 2 − x3 . Setzen wir diesen Ausdruck in die erste
Gleichung von (2.10) ein, dann erhalten wir x1 = 2 − x2 − x3 = 0. Die allgemeine reelle Lösung
von (2.9) lautet 9 somit:
x1 = 0, x2 = 2 − p, x3 = p. (2.11)
Dabei ist p eine beliebige reelle Zahl.
Wählt man p als eine beliebige komplexe Zahl, dann stellt (2.11) die allgemeine komplexe
Lösung von (2.9) dar.
 Beispiel 2 (eindeutige Lösung): Wenden wir die Methode von Beispiel 1 auf das System
3x1 + 3x2 = 6,
2x1 + 4x2 = 8
an, dann erhalten wir
3x1 + 3x2 = 6,
2x2 = 4
mit der eindeutigen Lösung x2 = 2, x1 = 0.
 Beispiel 3 (keine Lösung): Angenommen, das System
3x1 + 3x2 + 3x3 = 6,
(2.12)
2x1 + 2x2 + 2x3 = 8
besitzt eine Lösung x1 , x2 , x3 . Anwendung der Methode von Beispiel 1 liefert den Widerspruch:
3x1 + 3x2 + 3x3 = 6,
0 = 4.
Somit besitzt (2.12) keine Lösung.

2.1.4.1 Das Superpositionsprinzip

Ein reelles lineares Gleichungssystem besitzt die Gestalt:


a11 x1 + a12 x2 + . . . + a1n xn = b1 ,
a21 x1 + a22 x2 + . . . + a2n xn = b2 ,
(2.13)
...
am1 x1 + am2 x2 + . . . + amn xn = bm .
Gegeben sind die reellen Zahlen a jk , b j . Gesucht werden die reellen Zahlen x1 , . . . , xn . Das System
(2.13) entspricht der Matrizengleichung

Ax = b. (2.14)

9
Unsere Überlegungen ergeben zunächst, dass jede Lösung von (2.9) die Gestalt (2.11) besitzen muss. Die Umkehrung
dieser Überlegungen zeigt dann, dass (2.11) tatsächlich eine Lösung von (2.9) darstellt.
14 2 Algebra

Ausführlich lautet diese Gleichung:


⎛ ⎞⎛ ⎞ ⎛ ⎞
a11 a12 ... a1n x1 b1
⎜ a21 a22 ... a2n ⎟⎜ x2 ⎟ ⎜ b2 ⎟
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ .. .. .. ⎟⎜ .. ⎟=⎜ .. ⎟.
⎝ . . ··· . ⎠⎝ . ⎠ ⎝ . ⎠
am1 am2 ... amn xn bn

Definition: Das System (2.13) heißt genau dann homogen, wenn alle rechten Seiten bj gleich
null sind. Anderenfalls heißt (2.13) inhomogen. Ein homogenes System besitzt stets die triviale
Lösung x1 = x2 = . . . = xn = 0.

Superpositionsprinzip: Kennt man eine spezielle Lösung xspez des inhomogenen Systems
(2.14), dann erhält man alle Lösungen von (2.14) durch

x1 = xspez + y,

wobei y eine beliebige Lösung des homogenen Systems Ay = 0 darstellt. Kurz:

allgemeine Lösung des inhomogenen Systems


= spezielle Lösung des inhomogenen Systems
+ allgemeine Lösung des homogenen Systems.

Dieses Prinzip gilt für alle linearen Probleme der Mathematik (z. B. lineare Differential- oder
Integralgleichungen).

2.1.4.2 Der Gaußsche Algorithmus

Der Gaußsche Algorithmus stellt eine universelle Methode dar, um die allgemeine Lösung von
(2.13) zu bestimmen oder die Unlösbarkeit von (2.13) festzustellen. Es handelt sich dabei um
eine naheliegende Verallgemeinerung der in (2.9) bis (2.12) benutzten Methode.

Dreiecksgestalt: Die Idee des Gaußschen Algorithmus besteht darin, das Ausgangssystem
(2.13) in das folgende äquivalente System mit Dreiecksgestalt zu überführen:

α11 y1 + α12 y2 + . . . + α1n yn = β1 ,


α22 y2 + . . . + α2n yn = β2 ,
... ...
αrr yr + . . . + αrn yn = β r , (2.15)
0 = β r+1 ,
...
0 = βm .

Dabei gilt yk = xk für alle k oder y1 , . . . , yn ergeben sich aus x1 , . . . , xn durch Umnummerierung
(Permutation der Indizes). Ferner hat man

α11 = 0, α22 = 0, ..., αrr = 0.

Das System (2.15) ergibt sich in der folgenden Weise.


(i) Es sei mindestens ein a jk ungleich null. Nach eventueller Umnummerierung der Zeilen
und Spalten können wir annehmen, dass a11 = 0 gilt.
2.1 Elementare Methoden 15

(ii) Wir multiplizieren die erste Zeile von (2.13) mit − ak1 /a11 und addieren sie zur k-ten Zeile
mit k = 2, . . . , m. Das ergibt ein System, dessen erste und zweite Zeile die Gestalt von (2.15)
mit a11 = 0 besitzt.
(iii) Wir wenden die gleiche Prozedur auf die zweite bis m-te Zeile des neuen Systems an usw.
Berechnung der Lösung: Die Lösung von (2.15) lässt sich leicht berechnen. Daraus ergibt
sich dann die Lösung der Ausgangsgleichung (2.13).
Fall 1: Es ist r < m, und nicht alle β r+1 , β r+2 , . . . , β m sind gleich null. Dann besitzen die
Gleichungen (2.15) und (2.13) keine Lösung.
Fall 2: Es ist r = m. Wegen αrr = 0 können wir die r-te Gleichung in (2.15) nach yr auflösen,
wobei yr+1 , . . . , yn als Parameter aufgefasst werden. Anschließend benutzen wir die (r − 1)-te
Gleichung, um yr −1 zu berechnen. In analoger Weise erhalten wir der Reihe nach yr−2 , . . . , y1 .
Somit hängt die allgemeine Lösung der Gleichungen (2.15) und (2.13) von n − r reellen
Parametern ab.
Fall 3: Es ist r < m und β r+1 = . . . = β m = 0. Wir verfahren analog zu Fall 2 und erhalten
wiederum eine allgemeine Lösung der Gleichungen (2.15) und (2.13), die von n − r reellen
Parametern abhängt.
Die Zahl r ist gleich dem Rang der Matrix A (vgl. 2.1.4.5).

2.1.4.3 Die Cramersche Regel

Satz: Es sei n = m und det A = 0. Dann besitzt das lineare Gleichungssystem (2.13) die
eindeutige Lösung

x = A−1 b.

Explizit gilt:

(det A) j
xj = , j = 1, . . . , n. (2.16)
det A

Dabei entsteht die Determinante (det A ) j aus der Determinante der Matrix A, indem man dort
die j-te Spalte durch b ersetzt. Man bezeichnet die Lösungsformel (2.16) als Cramersche Regel.
 Beispiel: Das lineare Gleichungssystem

a11 x1 + a12 x2 = b1 ,
a21 x1 + a22 x2 = b2
besitzt im Fall a11 a22 − a12 a21 = 0 die folgende eindeutige Lösung:
 
 b1 a12 
 
 b2 a22  b a − a12 b2
x1 =   = 1 22 ,
 a11 a12  a 11 a22 − a12 a21
 
 a21 a22 

 
 a11 b1 

 a21 b2  a b − b1 a21
x2 =   = 11 2 .
 a11 a12  a11 a22 − a12 a21

 a21 a22 
16 2 Algebra

2.1.4.4 Die Fredholmsche Alternative

Satz: Das lineare Gleichungssystem Ax = b besitzt genau dann eine Lösung x, wenn

bT y = 0

für alle Lösungen y der homogenen dualen Gleichung AT y = 0 gilt.

2.1.4.5 Das Rangkriterium

Linear unabhängige Zeilenmatrizen: Gegeben seien die m Zeilenmatrizen A1 , . . . , Am der


Länge n mit reellen Elementen. Besteht die Gleichung

α1 A1 + . . . + α m A m = 0

für reelle Zahlen α j nur dann, wenn α1 = α2 · · · = αm = 0 gilt, dann heißen A1 , . . . , Am linear
unabhängig. Anderenfalls nennen wir A1 , . . . , Am linear abhängig.
Eine analoge Definition gilt für Spaltenmatrizen.
 Beispiel 1: (i) Lineare Unabhängigkeit. Für A1 := (1, 0) und A2 := (0, 1) folgt aus

α1 A 1 + α 2 A 2 = 0

die Gleichung (α1 , α2 ) = (0, 0), also α1 = α2 = 0. Somit sind A1 und A2 linear unabhängig.
(ii) Lineare Abhängigkeit. Für A1 := (1, 1) und A2 := (2, 2) gilt

2A1 − A2 = (2, 2) − (2, 2) = 0,

d. h., A1 und A2 sind linear abhängig.

Definition: Der Rang einer Matrix A ist gleich der Maximalzahl der linear unabhängigen
Spaltenmatrizen.
Jede Determinante, die sich aus einer Matrix A durch Streichen von Zeilen und Spalten ergibt,
heißt Unterdeterminante von A.

Satz: (i) Der Rang einer Matrix ist gleich der Maximalzahl der linear unabhängigen Zeilenma-
trizen, d. h., Rang ( A) = Rang ( AT ).
(ii) Der Rang einer Matrix ist gleich der maximalen Länge der von null verschiedenen Unter-
determinanten.

Der Rangsatz: Ein lineares Gleichungssystem Ax = b besitzt genau dann eine Lösung, wenn
der Rang der Koeffizientenmatrix A gleich dem Rang der um die Spalte b erweiterten Matrix
( A, b) ist.
Dann hängt die allgemeine Lösung von n − r reellen Parametern ab, wobei n die Anzahl der
Unbekannten und r den Rang von A bezeichnet.
 Beispiel 2: Wir betrachten das Gleichungssystem

x1 + x2 = 2,
(2.17)
2x1 + 2x2 = 4.
Dann gilt
   
1 1 1 1 2
A := , ( A, b) := .
2 2 2 2 4
2.1 Elementare Methoden 17

(i) Lineare Abhängigkeit der Zeilenmatrizen. Die zweite Zeile von A ist gleich dem 2-fachen der
ersten Zeile, d. h.,
2(1, 1) − (2, 2) = 0.
Somit sind die erste und zweite Zeile von A linear abhängig. Folglich ist r = Rang ( A) = 1.
Analog ergibt sich Rang ( A, b) = 1. Es ist n − r = 2 − 1 = 1.
Das Gleichungssystem (2.17) besitzt deshalb eine Lösung, die von einem reellen Parameter
abhängt.
Dieses Resultat ergibt sich leicht direkt. Da die zweite Gleichung in (2.17) gleich dem 2-fachen
der ersten Gleichung ist, kann man die zweite Gleichung weglassen. Die erste Gleichung in (2.17)
besitzt die allgemeine Lösung
x1 = 2 − p, x2 = p
mit dem reellen Parameter p.
(ii) Determinantenkriterium. Wegen
   
 1 1   1 2 
  = 0,  
 2 2   2 4  = 0,

verschwinden alle Unterdeterminanten von A und ( A, b) der Länge 2. Es gibt jedoch von null
verschiedene Unterdeterminanten der Länge 1. Deshalb ist Rang ( A) = Rang ( A, b ) = 1.

Algorithmus zur Rangbestimmung: Wir betrachten die Matrix


⎛ ⎞
a11 a12 . . . a1n
⎝ ... ⎠.
am1 am2 . . . amn
Sind alle a jk gleich null, dann gilt Rang ( A) = 0.
Anderenfalls kann man durch Vertauschen von Zeilen und Spalten sowie durch Addition des
Vielfachen einer Zeile zu einer anderen Zeile stets eine Dreiecksgestalt
⎛ ⎞
α11 α12 . . . α1n
⎜ 0 α22 . . . α2n ⎟
⎜ ⎟
⎜ . ⎟
⎜ .. ⎟
⎜ ⎟
⎜ ⎟
⎜ 0 ... 0 αrr . . . αrn ⎟
⎜ ⎟
⎜ 0 ... 0 0 ... 0 ⎟
⎜ ⎟
⎝ ... ⎠
0 ... 0 0 ... 0
erreichen, wobei alle α jj ungleich null sind. Dann gilt Rang ( A) = r.
 Beispiel 3: Gegeben sei
 
1 1 1
A := .
2 4 2
Subtrahieren wir das 2-fache der ersten Zeile von der zweite Zeile, dann erhalten wir
 
1 1 1
,
0 2 0
d. h., Rang ( A) = 2.

Komplexe Gleichungssysteme: Sind die Koeffizienten a jk und b j des linearen Gleichungssy-


stems (2.13) komplexe Zahlen, dann suchen wir komplexe Zahlen x1 , . . . , xn als Lösungen. Alle
Aussagen bleiben dann bestehen. Lediglich bei der Definition der linearen Unabhängigkeit muss
man komplexe Zahlen α1 , . . . , αk zulassen.
18 2 Algebra

2.1.5 Das Rechnen mit Polynomen

Unter einem Polynom vom Grad n mit reellen (bzw. komplexen) Koeffizienten versteht man einen
Ausdruck

a 0 + a 1 x + a2 x 2 + . . . + a n x n . (2.18)

Dabei sind a0 , . . . , an reelle (bzw. komplexe) Zahlen mit10 an = 0.

Gleichheit: Definitionsgemäß ist

a0 + a1 x + . . . + an x n = b0 + b1 x + . . . + bm xm

genau dann, wenn n = m und a j = b j für alle j gelten (gleicher Grad und gleiche Koeffizienten).

Addition und Multiplikation: Man benutze die üblichen Regeln (vgl. 1.1.4) und fasse Terme
mit gleichen Potenzen von x zusammen.
 Beispiel 1: ( x2 + 1) + (2x 3 + 4x2 + 3x + 2) = 2x3 + 5x2 + 3x + 3,
( x + 1)( x2 − 2x + 2) = x3 − 2x2 + 2x + x2 − 2x + 2 = x3 − x2 + 2.
7 1
Division: Anstelle von 7 : 2 = 3 mit Rest 1 kann man 7 = 2 · 3 + 1 oder auch = 3+
2 2
schreiben. Analog verfährt man mit Polynomen.
Es seien Z ( x ) und N ( x ) Polynome, wobei der Grad des Polynoms N ( x ) größer gleich eins sei.
Dann gibt es eindeutig bestimmte Polynome Q( x ) und R( x ), so dass

Z ( x ) = N ( x )Q( x ) + R( x ) (2.19)

gilt, wobei der Grad des „Restpolynoms“ R( x ) kleiner als der Grad des „Nennerpolynoms“ N ( x )
ist. Anstelle von (2.19) schreiben wir auch

Z(x) R( x )
= Q( x) + . (2.20)
N (x) N (x)

Man bezeichnet Z ( x ) als „Zählerpolynom“ und Q( x ) als „Quotientenpolynom“.


 Beispiel 2 (Division ohne Rest): Für Z ( x ) := x2 − 1 und N ( x ) := x − 1 gilt (2.19) mit
Q( x ) = x + 1 und R( x ) = 0. Denn es ist x2 − 1 = ( x − 1)( x + 1). Das bedeutet

x2 − 1
= x + 1.
x−1

 Beispiel 3 (Division mit Rest): Es gilt

3x4 − 10x3 + 22x 2 − 24x + 10 −2x − 5


= 3x2 − 4x + 5 + 2 .
x2 − 2x + 3 x − 2x + 3
Um die zugehörige Zerlegung

3x4 − 10x3 + 22x 2 − 24x + 10 = ( x2 − 2x + 3)(3x2 − 4x + 5) + (−2x − 5)


10
Bei einem streng formalen Aufbau der Mathematik stellt (2.18) eine Zeichenreihe dar, der man eine komplexe Zahl
zuordnen kann, falls man für a0 , . . . , an , x feste komplexe Zahlen einsetzt. Man sagt auch, dass a0 , . . . , an , x durch
komplexe Zahlen belegt werden.
2.1 Elementare Methoden 19

mit dem Restpolynom R( x ) := −2x − 5 zu erhalten, benutzen wir das folgende Schema:

3x4 −10x3 +22x2 −24x +10 (Division 3x4 : x2 = 3x2 )

3x4 − 6x3 + 9x2 (Rückmultiplikation ( x2 − 2x + 3) 3x2 )

− 4x3 +13x2 −24x +10 (Subtraktion)(Division − 4x3 : x2 = −4x )

− 4x3 + 8x2 −12x (Rückmultiplikation ( x2 − 2x + 3) (−4x ) )

5x 2 −12x +10 (Subtraktion)(Division 5x2 : x2 = 5 )


5x 2 −10x +15 (Rückmultiplikation ( x2 − 2x + 3) 5 )

− 2x − 5 (Subtraktion).

Die Methode lautet kurz: Division der Terme höchster Ordnung, Rückmultiplikation, Subtraktion,
Division der neuen Terme höchster Ordnung usw. Man beendet das Verfahren, wenn eine
Division der Terme höchster Ordnung nicht mehr möglich ist.
 Beispiel 4: Die Zerlegung

x3 − 1 = ( x − 1)( x2 + x + 1)

folgt aus dem Schema:

x3 −1
x3 − x2
x2 −1
x2 −x
x − 1.

Der größte gemeinsame Teiler zweier Polynome (Euklidischer Algorithmus): Es seien


Z ( x ) und N ( x ) Polynome vom Grad größer gleich eins. Analog zu (2.19) bilden wir die Divisi-
onskette mit Rest:

Z ( x ) = N ( x ) Q ( x ) + R 1 ( x ),
N ( x ) = R 1 ( x ) Q 1 ( x ) + R2 ( x ) ,
R 1 ( x ) = R 2 ( x ) Q 2 ( x ) + R3 ( x ) usw.

Wegen Grad ( R j+1 ) < Grad ( R j ) erhalten wir nach endlich vielen Schritten erstmalig ein ver-
schwindendes Restpolynom, d. h., es ist

R m ( x ) = R m + 1 ( x ) Q m +1 ( x ) .

Dann ist Rm+1 ( x ) der größte gemeinsame Teiler von Z ( x ) und N ( x ).


 Beispiel 5: Für Z ( x ) := x3 − 1 und N ( x ) := x2 − 1 erhalten wir:

x3 − 1 = ( x2 − 1) x + x − 1,
x2 − 1 = ( x − 1)( x + 1).

Somit ist x − 1 der größte gemeinsame Teiler von x3 − 1 und x2 − 1.


20 2 Algebra

2.1.6 Der Fundamentalsatz der klassischen Algebra von Gauß

Fundamentalsatz: Jedes Polynom n-ten Grades p( x ) := a0 + a1 x + · · · + an x n mit komplexen


Koeffizienten und an = 0 besitzt die Produktdarstellung

p( x ) = an ( x − x1 )( x − x2 ) · . . . · ( x − xn ). (2.21)

Die komplexen Zahlen x1 , . . . , xn sind bis auf die Reihenfolge eindeutig bestimmt.
Dieser berühmte Satz wurde von Gauß in seiner Dissertation 1799 bewiesen. Allerdings enthielt
dieser Beweis noch eine Lücke. Einen sehr eleganten funktionentheoretischen Beweis geben wir
in 1.14.9.

Nullstellen: Die Gleichung

p( x ) = 0

besitzt genau die Lösungen x = x1 , . . . , xn . Die Zahlen x j heißen die Nullstellen von p( x ). Kommt
eine Zahl x j in der Zerlegung (2.21) genau m-fach vor, dann heißt m die Vielfachheit der Nullstelle
xj .

Satz: Sind die Koeffizienten von p( x ) reell, dann ist mit x j auch die konjugiert komplexe Zahl
x j eine Nullstelle von p( x ), und beide Nullstellen besitzen die gleiche Vielfachheit.
 Beispiel 1: (i) Für p( x ) := x2 − 1 gilt p( x ) = ( x − 1)( x + 1). Somit besitzt p( x ) die einfachen
Nullstellen x = 1 und x = −1.
(ii) Für p( x ) = x2 + 1 gilt p( x ) = ( x − i)( x + i). Folglich hat p ( x) die einfachen Nullstellen
x = i und x = −i.
(iii) Das Polynom p( x ) := ( x − 1)3 ( x + 1)4 ( x − 2) besitzt die 3-fache Nullstelle x = 1, die
vierfache Nullstelle x = −1 und die einfache Nullstelle x = 2.

Die Divisionsmethode zur Nullstellenbestimmung: Kennen wir eine Nullstelle x1 des Poly-
noms p( x ), dann können wir p( x ) ohne Rest durch x − x1 dividieren, d. h., es ist

p ( x ) = ( x − x1 ) q( x ) .

Die übrigen Nullstellen von p( x ) sind dann gleich den Nullstellen von q( x ). Auf diese Weise
kann man das Problem der Nullstellenbestimmung auf eine Gleichung niedrigeren Grades
reduzieren.
 Beispiel 2: Es sei p( x ) := x3 − 4x2 + 5x − 2. Offensichtlich ist x1 := 1 eine Nullstelle von p( x ).
Division nach (2.19) ergibt

p ( x ) = ( x − 1) q ( x ) mit q( x ) := x2 − 3x + 2.

Die Nullstellen der quadratischen Gleichung q( x ) = 0 lassen sich nach 2.1.6.1 berechnen. Da
man jedoch im vorliegenden Fall leicht erkennt, dass x2 = 1 eine Nullstelle von q( x ) ist, ergibt
erneute Division

q( x ) = ( x − 1)( x − 2).

Somit gilt p( x ) = ( x − 1)2 ( x − 2), d. h., p( x ) besitzt die zweifache Nullstelle x = 1 und die
einfache Nullstelle x = 2.
2.1 Elementare Methoden 21

Explizite Lösungsformeln: Für Gleichungen n-ten Grades mit n = 2, 3, 4 kennt man seit dem
16. Jahrhundert explizite Lösungsformeln mit Hilfe von Wurzelausdrücken (vgl. 2.1.6.1ff). Für
n ≥ 5 existieren derartige Lösungsformeln nicht mehr (Satz von Abel (1825)). Das allgemeine
Instrument zur Untersuchung von algebraischen Gleichungen stellt die Galoistheorie dar (vgl.
2.6).

2.1.6.1 Quadratische Gleichungen

Die Gleichung

x2 + 2px + q = 0 (2.22)

mit komplexen Koeffizienten p und q besitzt die beiden Lösungen


x1,2 = − p ± D.


Dabei ist D := p2 − q die sogenannte Diskriminante. Ferner bezeichnet D eine fest gewählte
Lösung der Gleichung y2 = D. Es gilt stets

−2p = x1 + x2 , q = x1 x2 , 4D = ( x1 − x2 )2 (Satz von Vieta).

Das folgt aus ( x − x1 )( x − x2 ) = x2 + 2px + q. Den Satz von Vieta kann man als Probe zur
Nullstellenbestimmung benutzen.
Das Lösungsverhalten von (2.22) für reelle Koeffizienten findet man in Tabelle 2.1:

Tabelle 2.1 Quadratische Gleichung mit reellen Koeffizienten

D>0 zwei reelle Nullstellen


D=0 eine zweifache reelle Nullstelle
D<0 zwei konjugiert komplexe Nullstellen.

 Beispiel: Die Gleichung x2 − 2x − 3 = 0 besitzt die Diskriminante D = 4 und die beiden


Lösungen x1,2 = 1 ± 2, also x1 = 3 und x2 = −1.

2.1.6.2 Kubische Gleichungen

Normalform: Die allgemeine kubische Gleichung

x3 + ax2 + bx + c = 0 (2.23)
a
mit komplexen Koeffizienten a, b, c geht durch die Substitution y = x + in die Normalform
3

y3 + 3py + 2q = 0 (2.24)

über. Dabei gilt:

2a3 ab a2
2q = − + c, 3p = b − .
27 3 3
22 2 Algebra

Tabelle 2.2 Kubische Gleichung mit reellen Koeffizienten


D>0 eine reelle und zwei konjugiert komplexe Nullstellen
D<0 drei verschiedene reelle Nullstellen
D = 0, q = 0 zwei reelle Nullstellen, von denen eine zweifach ist
D = 0, q = 0 eine dreifache reelle Nullstelle.

Die Größe D := p3 + q2 heißt Diskriminante von (2.24). Tabelle 2.2 zeigt das Lösungsverhalten
von (2.24) und somit auch von (2.23).
Die Cardanoschen Lösungsformeln: Die Lösungen von (2.24) lauten:

y1 = u + + u − , y2 = ρ + u+ + ρ− u − , y3 = ρ − u + + ρ + u − . (2.25)

Dabei gilt
√ 1 √
u± := −q ± ρ± : = (−1 ± i 3).
3
D,
2
Für eine reelle Diskriminante D ≥ 0 sind u+ und u− eindeutig festgelegt. Im allgemeinen Fall
hat man die beiden komplexen dritten Wurzeln u± so zu bestimmen, dass u+ u− = − p gilt.
 Beispiel 1: Für die kubische Gleichung

y3 + 9y − 26 = 0

ergibt sich p = 3, q = −13, D = p3 + q2 = 196. Nach (2.25) gilt



u± = 13 ± 14, u + = 3, u− = −1.
3


Daraus folgen die Nullstellen y1 = u+ + u− = 2, y2,3 = −1 ± 2i 3.
 Beispiel 2: Die Gleichung x3 − 6x2 + 21x − 52 = 0 geht durch die Substitution x = y + 2 in
die Gleichung von Beispiel 1 über. Die Nullstellen sind deshalb x j = y j + 2, d. h. x1 = 4, x2,3 =

1 ± 2i 3.

Die Bedeutung des „casis irreducibilis“ in der Geschichte der Mathematik: Die Formel
(2.25) für y1 wurde von dem italienischen Mathematiker Cardano in seinem 1545 erschienen
Buch „Ars Magna“ (Große Kunst) √ veröffentlicht. In seiner 1550 erschienenen „Geometrie“ führte
Raffael Bombelli das Symbol −1 ein, um den sogenannten „casus irreducibilis“ behandeln
zu können. Dieser entspricht reellen Koeffizienten p, q mit D < 0. Obwohl in diesem Fall die
Nullstellen y1 , y2 , y3 reell sind, bauen sie sich aus den komplexen Größen u+ und u− auf. Dieser
überraschende Umstand hat wesentlich zur Einführung komplexer Zahlen im 16. Jahrhundert
beigetragen.
Der Weg über das Komplexe kann vermieden werden, wenn man die trigonometrischen
Lösungsformeln von Tabelle 2.3 benutzt.

Satz von Vieta: Für die Lösungen y1 , y2 , y3 von (2.24) gilt:

y1 + y2 + y3 = 0, y1 y2 + y1 y3 + y2 y3 = 3p, y1 y2 y3 = −2q,
( y1 − y2 )2 ( y 1 − y3 )2 ( y 2 − y3 )2 = −108D.

Die trigonometrischen Lösungsformeln: Im Fall reeller Koeffizienten kann man zur Lösung
von (2.24) die Tabelle 2.3 benutzen.
2.1 Elementare Methoden 23

Tabelle 2.3 Kubische Gleichung (p, q reell, q = 0, P := (sgn q) | p |)

p < 0, D ≤ 0 p < 0, D > 0 p>0

1 q 1 q 1 q
β := arccos 3 β := arcosh 3 β := arsinh 3
3 P 3 P 3 P

y1 −2P cos β −2P cosh β −2P sinh β

π √ √
y2,3 2P cos β ± P(cosh β ± i 3 sinh β) P(sinh β ± i 3 cosh β)
3

2.1.6.3 Biquadratische Gleichungen

Biquadratische Gleichungen lassen sich auf die Lösung kubischer Gleichungen zurückführen.
Das findet man bereits in Cardanos „Ars Magna“.

Normalform: Die allgemeine Gleichung 4. Grades


x + ax + bx2 + cx + d = 0
4 3
a
mit komplexen Koeffizienten a, b, c, d lässt sich durch die Substitution y = x + in die
4
Normalform

y4 + py2 + qy + r = 0 (2.26)

überführen. Das Lösungsverhalten von (2.26) ist abhängig vom Lösungsverhalten der sogenann-
ten kubischen Resolvente:
z3 + 2pz2 + ( p2 − 4r )z − q2 = 0.
Bezeichnen α, β, γ die Lösungen dieser kubischen Gleichung, dann erhält man die Nullstellen
y1 , . . . , y4 von (2.26) durch die Formel:

2y1 = u + v + w, 2y2 = u − v + w, 2y3 = −u + v + w, 2y4 = −u − v − w.

Dabei sind u, v, w Lösungen der Gleichungen u2 = α, v2 = β, w2 = γ, wobei zusätzlich uvw = q


gefordert wird.
Tabelle 2.4 gibt das Lösungsverhalten von (2.26) im Fall reeller Koeffizienten an.

Tabelle 2.4 Lösungsverhalten biquadratischer Gleichungen mit reellen Koeffizienten


kubische Resolvente biquadratische Gleichung
α, β, γ > 0 vier reelle Nullstellen
α > 0, β, γ < 0 zwei Paare von konjugiert komplexen Nullstellen
α reell, β und γ konjugiert komplex zwei reelle und zwei konjugiert komplexe Nullstellen

 Beispiel: Vorgelegt sei die biquadratische Gleichung


y4 − 25y2 + 60y − 36 = 0.
Die zugehörige kubische Resolvente z3 − 50z2 + 769z − 3600, besitzt die Nullstellen α = 9, β =
16, γ = 25. Daraus folgt u = 3, v = 4, w = 5. Damit erhalten wir die Nullstellen:
1
y1 = (u + v − w) = 1, y2 = 2, y3 = 3, y4 = −6.
2
24 2 Algebra

2.1.6.4 Allgemeine Eigenschaften algebraischer Gleichungen

Wir betrachten die Gleichung

p ( x ) : = a 0 + a 1 x + . . . + a n − 1 x n −1 + x n = 0 (2.27)

mit n = 1, 2, . . .. Wichtige Lösungseigenschaften algebraischer Gleichungen beliebiger Ord-


nung kann man an den Koeffizienten a0 , . . . , an−1 ablesen. Wir nehmen zunächst an, dass alle
Koeffizienten reell sind. Dann gilt:
(i) Mit x j ist auch die konjugiert komplexe Zahl x j eine Nullstelle von (2.27).
(ii) Ist der Grad n ungerade, dann besitzt (2.27) mindestens eine reelle Nullstelle.
(iii) Ist n gerade und gilt a0 < 0, dann besitzt (2.27) mindestens zwei reelle Nullstellen mit
unterschiedlichen Vorzeichen.
(iv) Ist n gerade und besitzt (2.27) keine reellen Nullstellen, dann ist p( x ) > 0 für alle reellen
Zahlen x.

Die Zeichenregel von Descartes (1596–1650): (i) Die Anzahl der (in ihrer Vielfachheit)
gezählten positiven Nullstellen von (2.27) ist gleich der Anzahl der Vorzeichenwechsel A in der
Folge 1, an−1 , . . . , a0 oder um eine gerade Zahl kleiner.
(ii) Besitzt die Gleichung (2.27) nur reelle Nullstellen, dann ist A gleich der Anzahl der
positiven Nullstellen.
 Beispiel 1: Für

p( x ) := x4 + 2x3 − x2 + 5x − 1

besitzt die Folge 1, 2, −1, 5, −1 der Koeffizienten drei Vorzeichenwechsel. Somit besitzt p( x ) eine
oder drei positive Nullstellen.
Ersetzen wir x durch − x, d. h., gehen wir zu q( x ) := p(− x ) = x4 − 2x3 − x2 − 5x − 1 über,
dann gibt es einen Vorzeichenwechsel in der Koeffizientenfolge 1, −2, −1, −5, −1. Deshalb besitzt
q( x ) eine positive Nullstelle, d. h., p( x ) besitzt mindestens eine negative Nullstelle.
Ersetzen wir x durch x + 1, d. h., betrachten wir r ( x ) := p( x + 1) = x4 + 6x3 + 11x2 + 13x + 6,
dann hat r ( x ) nach der Zeichenregel keine positive Nullstelle, d. h., p( x ) besitzt keine Nullstelle
> 1.

Die Regel von Newton (1643–1727): Die reelle Zahl S ist eine obere Schranke für alle reellen
Nullstellen von (2.27), falls gilt:

p(S) > 0, p ( S) > 0, p ( S) > 0, ..., p(n−1) ( S) > 0. (2.28)

 Beispiel 2: Es sei p( x) := x4 − 5x 2 + 8x − 8. Daraus folgt

p ( x ) = 4x3 − 10x + 8, p ( x ) = 12x2 − 10, p ( x ) = 24x.

Wegen

p(2) > 0, p (2) > 0, p (2) > 0, p (2) > 0

ist S = 2 eine obere Schranke für alle reellen Nullstellen von p( x ).


Wendet man dieses Verfahren auf q( x ) := p(− x ) an, dann erhält man, dass alle reellen
Nullstellen von q( x ) kleiner als oder gleich 3 sind.
Somit liegen alle reellen Nullstellen von p( x ) im Intervall [−3, 2].
2.1 Elementare Methoden 25

Die Regel von Sturm (1803–1855): Es sei p( a) = 0 und p( b) = 0 mit a < b. Wir wenden eine
leichte Modifikation des Euklidischen Algorithmus (vgl. 2.1.5) auf das Ausgangspolynom p( x )
und seine Ableitung p ( x ) an:

p = p  q − R1 ,
p  = R1 q1 − R2 ,
R1 = R2 q 2 − R3 ,
...
R m = R m +1 q m +1 .

Mit W ( a) bezeichnen wir die Anzahl der Vorzeichenwechsel in der Folge p( a), p ( a),
R1 ( a), . . . , Rm+1 ( a ). Dann ist W ( a ) − W (b) gleich der Anzahl der verschiedenen Nullstellen
des Polynoms p( x ) im Intervall [ a, b], wobei mehrfache Nullstellen hier nur einmal gezählt
werden.
Ist Rm+1 eine reelle Zahl, dann besitzt p keine mehrfachen Nullstellen.
 Beispiel 3: Für das Polynom p( x ) := x4 − 5x2 + 8x − 8 kann man a = −3 und b = 2 wählen
(vgl. Beispiel 2). Wir erhalten

p ( x ) = 4x3 − 10x + 8,
R1 ( x ) = 5x 2 − 12x + 16, R2 ( x ) = −3x + 284, R3 ( x ) = −1.

Da R3 eine Zahl ist, besitzt p( x ) keine mehrfachen Nullstellen. Die Sturmsche Folge
p( x ), p ( x ), R1 ( x ), . . . , R3 ( x ) ergibt 4, −70, 97, 293, −1 für x = −3 mit drei Vorzeichenwechseln,
also W (−3) = 3. Analog erhält man für x = 2 die Folge 4, 20, 12, 278, −1, also W (2) = 1.
Wegen W (−3) − W (2) = 2 besitzt das Polynom p( x ) zwei reelle Nullstellen in [−3, 2]. Nach
Beispiel 2 liegen alle reellen Nullstellen von p( x ) in [−3, 2].
Eine analoge Überlegung ergibt W (0) = 2. Aus W (−3) − W (0) = 1 und W (0) − W (2) = 1
erhalten wir, dass das Polynom p( x ) jeweils genau eine Nullstelle in [−3, 0] und [0, 2] besitzt. Die
übrigen Nullstellen von p( x ) sind nicht reell, sondern konjugiert komplex.

Elementarsymmetrische Funktionen: Die Funktionen

e1 := x1 + . . . + xn ,
e2 : = ∑ x j x k = x1 x2 + x2 x3 + . . . + x n− 1 x n ,
j<k
e3 := ∑ x j x k x m = x 1 x 2 x 3 + . . . + x n −2 x n − 1 x n ,
j<k <m
······
e n : = x1 x2 · . . . · x n

heißen elementarsymmetrische Funktionen der Variablen x1 , . . . , xn .

Satz von Vieta (1540–1603): Sind x1 , . . . , xn die komplexen Nullstellen des Polynoms p( x ) :=
a0 + a1 x + · · · + an−1 x n−1 + x n mit komplexen Koeffizienten, dann gilt:

a n −1 = − e 1 , a n− 2 = e2 , ..., a0 = (−1)n en .

Das folgt aus p( x ) = ( x − x1 ) · · · ( x − xn ). Somit lassen sich die Koeffizienten eines Polynoms
stets durch seine Nullstellen ausdrücken.
Ein Polynom heißt genau dann symmetrisch, wenn es bei einer beliebigen Permutation der
Variablen unverändert bleibt. Die Polynome e1 , . . . , en sind beispielsweise symmetrisch.
26 2 Algebra

Hauptsatz über symmetrische Polynome: Jedes symmetrische Polynom in den Variablen


x1 , . . . , xn mit komplexen Koeffizienten lässt sich als Polynom (mit komplexen Koeffizienten) der
elementarsymmetrischen Funktionen e1 , . . . , en ausdrücken.

Anwendung auf die Diskriminante: Das symmetrische Polynom


Δ := ∏ ( x j − xk ) 2
j<k

heißt (normierte) Diskriminante.


Bezeichnen x1 , . . . , xn die Nullstellen des Polynoms p, dann heißt Δ die (normierte) Diskrimi-
nante von p. Diese Größe lässt sich stets durch die Koeffizienten von p ausdrücken.
 Beispiel 4: Für n = 2 gilt Δ = ( x1 − x2 )2 und somit
Δ = ( x1 + x2 )2 − 4x1 x2 = e12 − 4e2 .
Für p( x ) := a0 + a1 x + x2 gilt p( x ) = ( x − x1 )( x − x2 ) = x2 − ( x1 + x2 ) x + x1 x2 . Deshalb ist
a1 = −( x1 + x2 ) = −e1 und a0 = x1 x2 = e2 , also

Δ = a21 − 4a0 .

Für die in 2.1.6.1 benutzte (nichtnormierte) Diskriminante gilt D = Δ/4.

Die Resultante zweier Polynome: Gegeben seien die beiden Polynome


p( x ) : = a0 + a1 x + . . . + a n x ,
n
q( x ) := b0 + b1 x + . . . + bm x m
mit komplexen Koeffizienten und n, m ≥ 1 sowie an = 0 und bm = 0. Die Resultante R( p, q) von
p und q wird durch die folgende Determinante definiert:
 
 a n a n −1 ... a0 
 
 a a . . . a0 
 n n −1 
 
 ... ... ... 
 
 an a n− 1 . . . a0 
R( p, q) :=  . (2.29)
 bm bm − 1 ... b0 
 
 bm b m − 1 . . . b0 
 
 ... ... ... 
 
 bm bm−1 . . . b0 
Die hier frei gelassenen Stellen entsprechen der Zahl null.

Hauptsatz über gemeinsame Nullstellen: Die beiden Polynome p und q besitzen genau
dann eine gemeinsame komplexe Nullstelle, wenn eine der beiden folgenden Bedingungen
erfüllt ist:
(i) p und q haben einen größten gemeinsamen Teiler mit einem Grad n ≥ 1.
(ii) R( p, q) = 0.
Der größte gemeinsame Teiler kann mit Hilfe des Euklidischen Algorithmus bequem bestimmt
werden (vgl. 2.1.5).

Hauptsatz über mehrfache Nullstellen: Das Polynom p besitzt genau dann eine mehrfache
Nullstelle, wenn eine der folgenden drei Bedingungen erfüllt ist:
(i) Der größte gemeinsame Teiler von p und der Ableitung p besitzt einen Grad n ≥ 1.
(ii) Die Diskriminante Δ von p ist gleich null.
(iii) R( p, p ) = 0.
Bis auf einen nichtverschwindenden Faktor stimmt Δ mit R( p, p ) überein.
2.1 Elementare Methoden 27

2.1.7 Partialbruchzerlegung

Die Methode der Partialbruchzerlegung erlaubt die additive Darstellung von gebrochen rationa-
len Funktionen durch Polynome und Terme der Form

A
.
( x − a )k

x
Grundideen: Um die Funktion f ( x ) := zu zerlegen, gehen wir aus von dem
( x − 1)( x − 2)2
Ansatz

A B C
f (x) = + + .
x−1 x−2 ( x − 2) 2

Multiplikation mit dem Nennerpolynom ( x − 1)( x − 2)2 liefert:

x = A( x − 2)2 + B( x − 1)( x − 2) + C ( x − 1). (2.30)

1. Methode (Koeffizientenvergleich): Aus (2.30) folgt


x = A( x2 − 4x + 4) + B( x2 − 3x + 2) + C ( x − 1).
Vergleich der Koeffizienten bei x2 , x, 1 ergibt
0 = A + B, 1 = −4A − 3B + C, 0 = 4A + 2B − C.
Dieses lineare Gleichungssystem besitzt die Lösung A = 1, B = −1, C = 2.
2. Methode (Einsetzen spezieller Werte): Wählen wir der Reihe nach x = 2, 1, 0 in (2.30), dann
erhalten wir das lineare Gleichungssystem
2 = C, 1 = A, 0 = 4A + 2B − C
mit der Lösung A = 1, C = 2, B = −1. Die zweite Methode führt in der Regel rascher zum Ziel.

Definition: Unter einer echt gebrochen rationalen Funktion verstehen wir einen Ausdruck
Z( x )
f ( x) := ,
N (x)
wobei Z und N Polynome mit komplexen Koeffizienten sind und die Bedingung 0 ≤ Grad ( Z ) <
Grad ( N ) erfüllt ist.
Das Nennerpolynom N besitze die paarweise verschiedenen Nullstellen x1 , . . . , xr mit den
entsprechenden Vielfachheiten α1 , . . . , αr , d. h., es ist
N ( x ) = ( x − x1 ) α1 . . . ( x − xr ) αr .

Satz: Es sei f eine echt gebrochene rationale Funktion. Für alle komplexen Zahlen x =
x1 , . . . , xr gilt die Zerlegung
⎛ ⎞
r αj
A jβ
f (x) = ∑⎝∑ (x − x j )β

j =1 β =1

mit den eindeutig bestimmten komplexen Zahlen A jβ .


28 2 Algebra

Besitzen Z und N reelle Koeffizienten, dann treten die Nullstellen von N paarweise konjugiert
komplex mit gleichen Vielfachheiten auf. Die entsprechenden Koeffizienten A jβ sind dann auch
konjugiert komplex zueinander.
Die Koeffizienten A jβ lassen sich in jedem Fall nach den beiden oben angegebenen Methoden
berechnen.

Allgemeine gebrochen rationale Funktionen: Gilt Grad ( Z ) ≥ Grad ( N ), dann liefert der
Euklidische Divisionsalgorithmus aus 2.1.5 die Zerlegung

Z(x) z( x )
= P( x) +
N (x) N (x)

in ein Polynom P ( x) und eine echt gebrochene rationale Funktion z( x )/N ( x ).


 Beispiel:
 
x2 1 1 1 1
= 1− 2 = 1− − .
x2 + 1 x +1 2i x−i x+i

2.2 Matrizenkalkül

Elementare Operationen mit Matrizen findet man in 2.1.3. Alle tieferliegenden Aussagen über
Matrizen basieren auf deren Spektrum. Die Spektraltheorie für Matrizen erlaubt tiefliegende
Verallgemeinerungen auf Operatorgleichungen (z. B. Differential- und Integralgleichungen) im
Rahmen der Funktionalanalysis. Das findet man in Kapitel 11.

2.2.1 Das Spektrum einer Matrix

Bezeichnung: Mit CSn bezeichnen wir die Menge aller Spaltenmatrizen


⎛ ⎞
α1
⎜ . ⎟
⎝ .. ⎠
αn

mit komplexen Zahlen α1 , . . . , αn . Dagegen steht Cn für die Menge aller Zeilenmatrizen
(α1 , . . . , αn ) mit komplexen Elementen. Sind α1 , . . . , αn reell, dann ergeben sich in analoger
Weise die Mengen RSn und Rn .

Eigenwerte und Eigenvektoren: Es sei A eine komplexe (n × n)-Matrix. Die komplexe Zahl
λ heißt genau dann ein Eigenwert der Matrix A, wenn die Gleichung

Ax = λx

eine Lösung x ∈ CSn besitzt mit x = 0. Wir nennen dann x einen zu λ gehörigen Eigenvektor
von A.

Spektrum: Die Menge aller Eigenwerte von A heißt Spektrum σ( A) von A. Die komplexen
Zahlen, welche nicht zu σ ( A) gehören, bilden definitionsgemäß die Resolventenmenge ρ( A) von A.

Der größte Wert |λ | aller Eigenwerte λ von A heißt der Spektralradius r ( A) von A.
2.2 Matrizenkalkül 29

 Beispiel 1: Aus
         
a 0 1 1 a 0 0 0
=a , =b
0 b 0 0 0 b 1 1

a 0
folgt, dass die Matrix A := die Eigenwerte λ = a, b mit den zugehörigen Eigenvekto-
0 b
T T
ren x = (1, 0) , (0, 1) besitzt. Die ( n × n)-Einheitsmatrix E hat λ = 1 als einzigen Eigenwert.
Jeder Spaltenvektor x = 0 der Länge n ist Eigenvektor von E.

Charakteristische Gleichung: Die Eigenwerte λ von A sind genau die Nullstellen der soge-
nannten charakteristischen Gleichung

det ( A − λE) = 0

Die Vielfachheit der Nullstelle λ heißt die algebraische Vielfachheit des Eigenwerts λ.
Die inverse Matrix ( A − λE) −1 existiert genau dann, wenn λ zur Resolventenmenge von A
gehört. Man bezeichnet ( A − λE)−1 als Resolvente von A. Die Gleichung

Ax − λx = y (2.31)

besitzt für eine gegebene rechte Seite y ∈ CSn das folgende Lösungsverhalten:
(i) Regulärer Fall: Ist die komplexe Zahl λ kein Eigenwert von A, d. h., λ liegt in der Resolven-
tenmenge von A, dann hat (2.31) die eindeutige Lösung x = ( A − λE)−1 y.
(ii) Singulärer Fall: Ist λ ein Eigenwert von y, d. h., λ liegt im Spektrum von A, dann besitzt
(2.31) keine Lösung, oder die vorhandene Lösung ist nicht eindeutig.
   
0 1  −λ 1 
 Beispiel 2: Es sei A : = . Wegen det ( A − λE) =  = λ2 − 1 lautet die
1 0 1 −λ 
charakteristische Gleichung

λ2 − 1 = 0.

Die Nullstellen λ = ±1 sind die Eigenwerte von A mit der algebraischen Vielfachheit eins. Die
zugehörigen Eigenvektoren sind x+ = (1, 1)T und x− = (1, −1)T .

Spezielle Matrizen: Es sei A eine komplexe ( n × n)-Matrix. Mit A∗ bezeichnen wir die
adjungierte Matrix.
(i) A heißt genau dann selbstadjungiert, wenn A = A∗ .
(ii) A heißt genau dann schiefadjungiert, wenn A = − A∗ .
(iii) A heißt genau dann unitär, wenn AA∗ = A∗ A = E.
(iv) A heißt genau dann normal, wenn AA∗ = A∗ A.
Die Matrizen in (i) bis (iii) sind normal.
Die Matrix AA∗ ist stets selbstadjungiert. Die Matrix A ist genau dann schiefadjungiert, wenn
i A selbstadjungiert ist.
Ist A reell, dann gilt A∗ = AT . In diesem Fall spricht man in (i), (ii), (iii) der Reihe nach auch
von symmetrischen, schiefsymmetrischen und orthogonalen Matrizen.11
11
Eine Tabelle weiterer wichtiger spezieller Matrizen (klassische Liealgebra und Liegruppen) findet man in 17.1.
30 2 Algebra

 Beispiel 3: Wir betrachten die Matrizen


   
a11 a12 cos ϕ sin ϕ
A := , U := .
a21 a22 − sin ϕ cos ϕ
Sind alle a jk reell, dann ist A genau dann symmetrisch, wenn a12 = a21 gilt. Sind die Elemente
a jk komplexe Zahlen, dann ist A genau dann selbstadjungiert, wenn a jk = akj für alle j, k gilt.
Speziell sind dann a11 und a22 reell.
Für jede reelle Zahl ϕ ist U orthogonal (und unitär). Das Spektrum von U besteht aus den
Zahlen e±iϕ .
Die Transformation x  = Ux, d. h.,
x1 = x1 cos ϕ + x2 sin ϕ,
x2 = − x1 sin ϕ + x2 cos ϕ,

entspricht einer Drehung eines kartesischen Koordinatensystems um den Winkel ϕ im mathema-


tisch positiven Sinn (vgl. 3.4.1).

Spektralsatz:
(i) Das Spektrum einer selbstadjungierten Matrix liegt auf der reellen Achse.
(ii) Das Spektrum einer schiefadjungierten Matrix liegt auf der imaginären Achse.
(iii) Das Spektrum einer unitären Matrix liegt auf dem Rand des Einheitskreises.

Satz von Perron: Sind alle Elemente der reellen quadratischen Matrix A positiv, dann ist der
Spektralradius r ( A) ein Eigenwert von A der algebraischen Vielfachheit eins, und alle übrigen
Eigenwerte von A liegen im Innern des Kreises vom Radius r ( A) um den Nullpunkt.
Zu r ( A) gehört ein Eigenvektor, dessen Elemente alle positiv sind.

2.2.2 Normalformen von Matrizen

Grundidee: Sind A und B komplexe ( n × n)-Matrizen, dann heißen sie genau dann ähnlich,
wenn es eine komplexe invertierbare ( n × n)-Matrix C gibt, so dass gilt:

C −1 AC = B.

Die Matrix A nennt man genau dann diagonalisierbar, wenn es eine Diagonalmatrix B gibt, die zu
A ähnlich ist. Dann stehen in der Diagonalen von B genau die Eigenwerte von A (entsprechend
ihrer algebraischen Vielfachheit).

Satz: Die (n × n)-Matrix ist genau dann diagonalisierbar, wenn sie n linear unabhängige
Eigenvektoren besitzt. Dann gilt:

⎛ ⎞
λ1 0
⎜ ⎟
C −1 AC = ⎝ ..
. ⎠. (2.32)
0 λn

Dann sind λ1 , . . . , λn die Eigenwerte von A.

Anwendung: Die lineare Transformation

x + = Ax
2.2 Matrizenkalkül 31

geht durch die Einführung der neuen Koordinaten y = C −1 x in

y+ = (C−1 AC )y (2.33)

über. x = (ξ 1 , . . . , ξ n )T und z = (η1 , . . . , ηn )T . Wegen (2.32) ergibt sich in den neuen Koordinaten
die besonders einfache Gestalt der Transformation:

η j+ = λ j η j , j = 1, . . . , n.

Derartige Überlegungen werden oft in der Geometrie benutzt, um zum Beispiel Drehungen oder
projektive Abbildungen zu vereinfachen.
Jede normale Matrix ist diagonalisierbar. Das Ziel der Normalformtheorie für quadratische
Matrizen besteht darin, in jedem Fall durch Ähnlichkeitstransformation eine besonders einfache
Normalform herzustellen (Jordansche Normalform). Dadurch lassen sich viele geometrische
Aussagen gewinnen.

2.2.2.1 Die Hauptachsentransformation für selbstadjungierte Matrizen

Die Normalformtheorie selbstadjungierter (und normaler) Matrizen wird vom Begriff der Or-
thogonalität beherrscht. Die folgenden Überlegungen erlauben es beispielsweise, durch Wahl
neuer Koordinatenachsen, Kegelschnitte und Flächen zweiter Ordnung in besonders einfache
Normalformen zu überführen. Diese sogenannten Hauptachsen stehen senkrecht aufeinander
(vgl. 3.4.2 und 3.4.3).
Die funktionalanalytische Verallgemeinerung der Hauptachsentransformation durch Hilbert
und von Neumann stellt die mathematische Grundlage der Quantentheorie dar (vgl. 11.6.2 und
13.18).

Orthogonalität: Für x, y ∈ CSn definieren wir12

( x| y) := x ∗ y (2.34)

und || x || := ( x | x ).
Wir nennen x und y genau dann orthogonal, wenn ( x |y) = 0 ist. Ferner bilden x1 , . . . , xn
definitionsgemäß genau dann ein Orthonormalsystem, wenn

( x j | xk ) = δjk

für j, k = 1, . . . , r gilt.13 Im Fall r = n sprechen wir von einer Orthonormalbasis.

12
Gilt x = (ξ 1 , . . . , ξ n )T und y = (η1 , . . . , ηn )T , dann ist
( x |y) = ξ 1 η1 + · · · + ξ n ηn .

13
Das sogenannte Kroneckersymbol wird durch

1 für j = k
δjk =
0 für j = k
erklärt
32 2 Algebra

Schmidtsches Orthogonalisierungsverfahren: Sind x1 , . . . , xr ∈ CSn linear unabhängig,


dann kann man daraus durch Übergang zu geeigneten Linearkombinationen ein Orthonor-
malsystem y1 , . . . , yr konstruieren. Explizit wählen wir z1 := x1 und definieren k = 2, . . . , r der
Reihe nach
k −1 ( xk |z j )
zk := xk − ∑ z.
(z j |z j ) j
j =1

Schließlich setzen wir y j := z j /||z j || für j = 1, . . . , r.

Hauptsatz: Für jede selbstadjungierte ( n × n)-Matrix A gilt:


(i) Alle Eigenwerte sind reell.
(ii) Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal.
(iii) Zu einem Eigenwert der algebraischen Vielfachheit s gehören genau s linear unabhängige
Eigenvektoren.
(iv) Wendet man in (iii) das Schmidtsche Orthogonalisierungsverfahren an, dann entsteht eine
Orthonormalbasis von Eigenvektoren x1 , . . . , xn zu den Eigenwerten λ1 , . . . , λn .
(v) Setzen wir U : = ( x1 , . . . , xn ), dann gilt

⎛ ⎞
λ1 0
⎜ ⎟
U −1 AU = ⎝ ..
. ⎠. (2.35)
0 λn

Dabei ist U unitär, d. h. U −1 = U ∗ .


(vi) det A = λ1 λ2 · · · λn und tr A = λ1 + · · · + λ n .
(vii) Ist A reell, dann sind auch alle Eigenvektoren x1 , . . . , xn reell, und die Matrix U ist
orthogonal, d. h., U ist reell und U −1 = U T .
 
0 1
 Beispiel 1: Die symmetrische Matrix A := besitzt die Eigenwerte λ± = ±1 und
1 0

die Eigenvektoren x+ = (1,√1)T , x− = (1, T
√ −1) . Wegen || x± || = 2 lautet die zugehörige
Orthonormalbasis x1 = x+ / 2, x2 = x− / 2. Die Matrix
 
1 1 1
U : = ( x 1 , x2 ) = √
2 1 −1

ist orthogonal und


 
1 0
U −1 AU = .
0 −1

Morseindex und Signatur: Die Anzahl m der negativen Eigenwerte von A bezeichnet man
als den Morseindex14 von A.
Die Anzahl der von null verschiedenen Eigenwerte von A ist gleich dem Rang r von A. Somit
besitzt A genau m negative und r − m positive Eigenwerte. Das Paar (r − m, m) heißt die Signatur
von A.
14
Die Bedeutung des Morseindex für die Katastrophentheorie und die topologische Theorie der Extremalprobleme von
Funktionen auf Mannigfaltigkeit findet man in 13.13 und 18.2.3.
2.2 Matrizenkalkül 33

Gegeben sei die reelle symmetrische ( n × n)-Matrix A := ( a jk ). Die Signatur von A kann man
direkt aus den Koeffizienten von A bestimmen. Wir betrachten hierzu die sogenannten s-reihigen
Hauptunterdeterminanten von A

Ds := det ( a jk ), j, k = 1, . . . , s.

Eventuell nach gleichzeitiger Umnummerierung der Zeilen und Spalten von A können wir
erreichen, dass gilt:

D1 = 0, D2 = 0, ..., Dρ = 0, D ρ + 1 = . . . = Dn .

Signaturkriterium von Jacobi: Der Rang von A ist gleich ρ, der Morseindex m von A ist
gleich der Anzahl der Vorzeichenwechsel in der Folge 1, D1 , . . . , Dρ . Ferner gilt Signatur( A) =
(ρ − m, m).
   
1 2  1 2 
 Beispiel 2: Für A := ist D1 = 1 und D2 =   = −3. Die Folge 1, D1 , D2
2 1 2 1 
enthält genau einen Vorzeichenwechsel. Das ergibt Morseindex ( A) = 1 und Signatur ( A) =
(1, 1). Tatsächlich besitzt A die Eigenwerte λ = 3, −1.

Anwendung auf quadratische Formen: Wir betrachten die reelle Gleichung

xT Ax = b (2.36)

mit der reellen symmetrischen ( n × n)-Matrix A = ( a jk ), der reellen Spaltenmatrix x =


( x1 , . . . , xn )T und der reellen Zahl b. Explizit lautet (2.36)
n
∑ a jk x j xk = b. (2.37)
j,k =1

Die reellen Koeffizienten a jk genügen der Symmetriebedingung a jk = akj für alle j, k. Das ist für
n = 2 (bzw. n = 3) die Gleichung eines Kegelschnitts (bzw. einer Fläche zweiter Ordnung) (vgl.
3.4.2 und 3.4.3).
Durch die Transformation x = Uy entsteht aus (2.36) unter Berücksichtigung von U −1 = U T
die Gleichung (yT U T ) AUy = yT U −1 AUy = b. Nach (2.35) folgt daraus die Quadratsummenglei-
chung

λ1 y21 + . . . + λ n y2n = b.

Um diese Gleichung weiter zu vereinfachen, setzen wir z j := λ j y j für λ j ≥ 0 und z j :=


− −λ j y j für λ j < 0. Eventuell nach Umnummerierung der Variablen entsteht dann aus (2.37)
endgültig die Normalform:

−z21 − . . . − z2m + z2m+1 + . . . + z2r = b. (2.38)

Dabei gilt Morseindex( A) = m, Rang( A) = r, Signatur( A) = (r − m, m ).

Eindeutigkeit der Normalform (Trägheitsgesetz von Sylvester): Hat man durch eine andere
Transformation x = Bz mit der reellen invertierbaren ( n × n)-Matrix B eine Normalform

α1 z21 + . . . + αn z2n = b (2.39)

von (2.37) mit α j = ±1 oder α j = 0 hergestellt, dann stimmt (2.39) mit (2.38) überein (eventuell
nach Umnummerierung der Variablen).
34 2 Algebra

Definitheit: Die quadratische Form xT Ax in (2.36) ist genau dann positiv definit, d. h., es gilt
xT Ax > 0 für alle x = 0,
wenn eine der beiden folgenden Bedingungen erfüllt ist:
(i) Alle Eigenwerte von A sind positiv.
(ii) Alle Hauptunterdeterminanten von A sind positiv.

2.2.2.2 Normale Matrizen

Hauptsatz: Jede normale ( n × n)-Matrix A besitzt eine vollständige Orthonormalbasis


x1 , . . . , xn von Eigenvektoren zu den Eigenwerten λ1 , . . . , λn . Setzen wir U : = ( x1 , . . . , xn ),
dann ist U unitär, und es gilt

⎛ ⎞
λ1 0
⎜ ⎟
U −1 AU = ⎝ ..
. ⎠. (2.40)
0 λn

Jede selbstadjungierte, schiefadjungierte, unitäre Matrix und jede reelle symmetrische, schief-
symmetrische oder orthogonale Matrix ist normal.

Anwendung auf orthogonale Matrizen (Drehungen): Ist die reelle (n × n)-Matrix A ortho-
gonal, dann erhält man (2.40), wobei die Eigenwerte λ j gleich ±1 sind oder paarweise in der
Form e±iϕ mit der reellen Zahl ϕ auftreten. Die Matrix U ist in der Regel nicht reell.
Es gibt jedoch auch stets eine reelle orthogonale Matrix B, so dass gilt:

⎛ ⎞
A1 0
⎜ ⎟
B−1 AB = ⎝ ..
. ⎠. (2.41)
0 As

Die Matrizen A j bestehen entweder aus der Zahl 1 bzw. −1, oder es gilt
 
cos ϕ sin ϕ
Aj = , (2.42)
− sin ϕ cos ϕ
wobei ϕ reell ist. Die auftretenden Zahlen ±1 sind Eigenwerte von A. Im Fall von (2.42) ist
e±iϕ ein konjugiert komplexes Eigenwertpaar von A. Die Kästchen A j treten entsprechend der
algebraischen Vielfachheit der Eigenwerte auf.
Für beliebige orthogonale Matrizen A gilt det A = ±1.
Die allgemeinste orthogonale (2 × 2)-Matrix A mit det A = 1 hat die Gestalt (2.42), wobei ϕ
eine beliebige reelle Zahl ist.
 Beispiel: Für n = 3 und det A = 1 erhält man die Normalform
⎛ ⎞
1 0 0
B−1 AB = ⎝ 0 cos ϕ sin ϕ ⎠ . (2.43)
0 − sin ϕ cos ϕ
Geometrisch entspricht das der Tatsache, dass jede Drehung des dreidimensionalen Raumes um
einen festen Punkt als Drehung um eine feste Achse mit dem Winkel ϕ dargestellt werden kann.
Die Drehachse ist der Eigenvektor von A zum Eigenwert λ = 1 (Satz von Euler-d’Alembert).
2.2 Matrizenkalkül 35

Im Fall det A = −1 hat man die Zahl 1 in (2.43) durch −1 zu ersetzen. Das entspricht einer
zusätzlichen Spiegelung an der Drehebene, die durch den Drehpunkt geht und senkrecht zur
Drehachse steht.

Anwendung auf schiefsymmetrische Matrizen: Die reelle ( n × n)-Matrix A = ( a jk ) sei


schiefsymmetrisch,15 d. h., es gilt a jj = 0 für alle j und a jk = − akj für alle j, k mit j = k. Dann
erhält man (2.40), wobei die Eigenwerte λ j gleich null sind oder paarweise in der Form ±λi
auftreten. Die Matrix U ist in der Regel nicht reell.
Es gibt jedoch auch stets eine reelle invertierbare Matrix B mit

⎛ ⎞
A1 0
⎜ ⎟
B−1 AB = ⎝ ..
. ⎠.
0 As

Die Matrizen A j bestehen entweder aus der Zahl 0, oder es gilt


 
0 1
Aj = .
−1 0
Die Gesamtlänge dieser 2-Kästchen ist gleich dem Rang von A.

Anwendung auf symplektische Formen: Wir betrachten die reelle Gleichung

xT Ay = b (2.44)

mit der reellen schiefsymmetrischen (n × n)-Matrix, den reellen Spaltenvektoren x, y sowie der
reellen Zahl b. Explizit lautet (2.44):

n
∑ a jk x j yk = b.
j,k =1

Die reellen Koeffizienten a jk genügen der Bedingung a jj = 0 für alle j und a jk = − akj für alle
j = k. Es existiert dann eine reelle invertierbare Matrix B, so dass die Gleichung durch die
Koordinatentransformation u = Bx, v = By in die folgende Normalform übergeht:

(v2 u1 − u2 v1 ) + (v4 u3 − u4 v3 ) + . . . + (v2s u2s−1 − u2s v2s−1 ) = b. (2.45)

Dabei ist 2s der Rang von A.


Wir nennen xT Ay eine symplektische Form, wenn A zusätzlich invertierbar ist. Dann ist n
gerade, und es gilt die Normalform (2.45) mit 2s = n.
Symplektische Formen bilden die Grundlage der symplektischen Geometrie (vgl. 3.9.8), die der
klassischen Mechanik und geometrischen Optik sowie der Theorie der Fourierintegraloperatoren
zugrunde liegt (vgl. 15.6). Viele physikalische Theorien lassen sich parallel zur klassischen Ha-
miltonschen Mechanik als Hamiltonsche Gleichungen formulieren. Alle diese Theorien basieren
auf einer symplektischen Geometrie.
15
Die allgemeinste schiefsymmetrische (2 × 2)-Matrix hat die Gestalt
 
0 a
,
−a 0
wobei a eine beliebige reelle Zahl ist.
36 2 Algebra

Gemeinsame Diagonalisierung: Es seien A1 , . . . , Ar komplexe ( n × n)-Matrizen, die paar-


weise miteinander vertauschbar sind, d. h., es ist A j Ak = Ak A j für alle j, k. Dann haben alle diese
Matrizen einen gemeinsamen Eigenvektor.
Sind zusätzlich alle diese Matrizen normal, dann besitzen sie eine gemeinsame Orthonormalba-
sis x1 , . . . , xn von Eigenvektoren. Bilden wir die Matrix U := ( x1 , . . . , xn ), dann ist U unitär, und
die Matrizen

U −1 A j U

besitzen für alle j Diagonalgestalt, wobei die Eigenwerte von A j in der Diagonale stehen.

2.2.2.3 Die Jordansche Normalform

Die Jordansche Normalform stellt die allgemeinste Normalform für komplexe Matrizen dar. Sie
geht auf den französischen Mathematiker Camille Jordan (1838–1922) zurück. Die Theorie der
Elementarteiler wurde von Karl Weierstraß (1815–1897) im Jahre 1868 geschaffen.

Jordankästchen: Die Matrizen


⎛ ⎞
  λ 1 0
λ 1 ⎝ 0
bzw. λ 1 ⎠
0 λ
0 0 λ

heißen Jordankästchen der Länge 2 bzw. 3. Die Zahl λ ist der einzige Eigenwert dieser Matrizen.
Allgemein bezeichnet man
⎛ ⎞
λ 1 0
⎜ ⎟
⎜ λ 1 ⎟
⎜ ⎟
⎜ .. .. ⎟
⎜ ⎟
J (λ) := ⎜ . . . . ⎟
⎜ .. .. ⎟
⎜ .. ⎟
⎜ .. 1 ⎟
⎝ .. ⎠
0 λ

als Jordankästchen.

Hauptsatz: Zu einer beliebigen komplexen (n × n)-Matrix A existiert eine invertierbare kom-


plexe (n × n)-Matrix C, so dass gilt:

⎛ ⎞
J1 (λ1 ) 0
⎜ ⎟
C −1 AC = ⎝ ..
. ⎠. (2.46)
0 Js ( λs )

Dabei gibt es zu jedem Eigenwert λ j von A ein oder mehrere Jordankästchen.


Die in (2.46) rechts stehende Matrix heißt die Jordansche Normalform von A. Diese ist
eindeutig (bis auf Permutation der Jordankästchen).

Geometrische und algebraische Vielfachheit eines Eigenwerts: Definitionsgemäß ist die


geometrische Vielfachheit eines Eigenwerts λ von A gleich der Anzahl der linear unabhängigen
Eigenvektoren zu λ. Diese geometrische Vielfachheit von λ ist gleich der Anzahl der Jordan-
kästchen in (2.46). Dagegen ist die algebraische Vielfachheit von λ gleich der Gesamtlänge aller
Jordankästchen zu λ.
2.2 Matrizenkalkül 37

 Beispiel 1: Die Matrix


⎛ ⎞
λ1 1 0 0
⎜ 0 λ1 0 0 ⎟
A := ⎜⎝ 0

0 λ1 0 ⎠
0 0 0 λ2

liegt bereits in Jordanscher Normalform vor. Die Zahlen λ1 , λ2 sind Eigenwerte von A, wobei
λ1 = λ2 möglich ist.
Es sei λ1 = λ2 . Dann hat λ1 die algebraische Vielfachheit 3 und die geometrische Vielfachheit
2. Für λ2 ist die algebraische und geometrische Vielfachheit gleich 1.
Bei vielen Betrachtungen ist die algebraische Vielfachheit eines Eigenwerts wichtiger als seine
geometrische Vielfachheit.
Die Länge der Jordankästchen kann man aus den Koeffizienten der Matrix A bestimmen, wie
jetzt gezeigt werden soll.

Elementarteiler: Der größte gemeinsame Teiler D s (λ ) aller s-reihigen Unterdeterminanten


der charakteristischen Matrix A − λE heißt der s-te Determinantenteiler16 von A. Wir setzen
D0 := 1. Die Quotienten J s ( λ) := D s (λ )/D s−1 (λ ), s = 1, . . . , n sind Polynome und heißen die
zusammengesetzten Elementarteiler von A. Die Faktoren der Produktzerlegung

J s ( λ ) = ( λ − α 1 ) r1 · . . . · ( λ − α k ) rk

werden Elementarteiler von A genannt. Die Zahlen α1 , . . . , αn sind stets Eigenwerte von A.

Korollar zum Hauptsatz: Zu jedem Elementarteiler (λ − λm )r von A gehört ein Jordankäst-


chen J (λm ) der Länge r in der Jordanschen Normalform (2.46). Auf diese Weise erhält man alle
Jordankästchen.

Diagonalisierungskriterium: Die Jordansche Normalform der quadratischen Matrix A besitzt


genau dann Diagonalgestalt, wenn eine der folgenden drei Bedingungen erfüllt ist:
(i) Alle Elementarteiler von A haben den Grad 1.
(ii) Für alle Eigenwerte von A stimmen algebraische und geometrische Vielfachheit überein.
(iii) Die Anzahl der linear unabhängigen Eigenvektoren von A ist gleich der Zeilenanzahl
von A.

Spursatz: Die Spur tr A einer quadratischen Matrix A ist gleich der Summe aller Eigenwerte
von A (gezählt entsprechend ihrer algebraischen Vielfachheit).
Das folgt aus (2.46) und tr A = tr (C −1 AC).

Determinantensatz: Die Determinante det A einer quadratischen Matrix A ist gleich dem
Produkt aller Eigenwerte (gezählt entsprechend ihrer algebraischen Vielfachheit).

Ähnlichkeitssatz: Zwei komplexe quadratische Matrizen A und B sind genau dann ähnlich,
wenn sie die gleichen Elementarteiler besitzen.

Methoden zur Berechnung der Jordanschen Normalform: Derartige Methoden findet man
in [Zurmühl und Falk 1992].
16
D s ist ein Polynom in λ, dessen höchstes Glied vereinbarungsgemäß den Koeffizienten 1 besitzen soll.
38 2 Algebra

2.2.3 Matrizenfunktionen

In diesem Abschnitt seien A, B, C komplexe (n × n)-Matrizen, und r ( A) (bzw. σ( A)) bezeichne


den Spektralradius (bzw. das Spektrum) von A (vgl. 2.2.1).

2.2.3.1 Potenzreihen

Definition: Gegeben sei die Potenzreihe

f ( z ) : = a0 + a1 z + a2 z2 + . . .

mit dem Konvergenzradius ρ um den Nullpunkt. Gilt r ( A) < ρ, dann definieren wir

f ( A ) : = a 0 E + a 1 A + a2 A 2 + . . . . (2.47)

Diese Reihe konvergiert absolut für jedes Matrixelement von f ( A).


Ist speziell ρ = ∞ (z. B. f (z) = ez , sin z, cos z oder f (z) = Polynom in z), dann gilt (2.47) für
alle quadratischen Matrizen A.

Satz: (i) C −1 f ( A)C = f (C−1 AC ), falls C −1 existiert.


(ii) f ( A)T = f ( AT ), A f ( A) = f ( A) A.
(iii) f ( A)∗ = f ∗ ( A∗ ), wobei f ∗ (z) := f (z).
(iv) Sind λ1 , . . . , λn die Eigenwerte von A, dann sind f ( λ1 ), . . . , f (λn ) die Eigenwerte von
f ( A) (gezählt entsprechend ihrer algebraischen Vielfachheit).

Diagonalisierbare Matrizen: Aus


⎛ ⎞
λ1 0
⎜ ⎟
C−1 AC = ⎝ ..
. ⎠ (2.48)
0 λn

folgt

⎛ ⎞
f (λ1 ) 0
⎜ .. ⎟ −1
f ( A) = C ⎝ . ⎠C . (2.49)
0 f ( λn )

Die Exponentialfunktion: Für jede quadratische Matrix A und jede komplexe Zahl t gilt17 :

t2 2 t3 3
etA = E + tA + A + A +... .
2! 3!

Die Exponentialfunktion besitzt folgende Eigenschaften:


(i) e A eB = e A+B , falls AB = BA (Additionstheorem),
17
Wichtige Anwendungen von etA auf gewöhnliche Differentialgleichungen (bzw. Liegruppen und Liealgebren) findet man
in 1.12.6 (bzw. in 17.1).
2.2 Matrizenkalkül 39

(ii) det e A = etr A (Determinantenformel),


T ∗
(iii) (e A )−1 = e− A , (e A )T = e A , (e A )∗ = e A .
 
0 1
 Beispiel: Für A = gilt A2 = A3 = · · · = 0, also etA = E + tA.
0 0

Die Logarithmusfunktion: Ist r ( B) < 1, dann existiert



1 2 1 3 (−1)k+1 k
ln( E + B) = B − B + B −... = ∑ B .
2 3 k =1
k

Die Gleichung

eC = E + B

besitzt dann die eindeutige Lösung C = ln( E + B).

2.2.3.2 Funktionen normaler Matrizen

Ist A normal, dann existiert eine vollständige Orthonormalbasis x1 , . . . , xn von Eigenvektoren zu


den Eigenwerten λ1 , . . . , λn . Setzen wir C := ( x1 , . . . , xn ), dann ist C unitär, und es gilt (2.48).

Definition: Für eine beliebige Funktion f : σ( A) −→ C definieren18 wir f ( A) durch (2.49).


Diese Definition ist unabhängig von der Wahl der vollständigen Orthonormalbasis der Eigen-
vektoren von A.

Satz: (i) Die Aussagen des Satzes in 2.2.3.1 bleiben bestehen.


(ii) Ist A selbstadjungiert und ist f reell für reelle Argumente, dann ist auch f ( A) selbstadjun-
giert.

Die Quadratwurzel:
√ Besitzt die selbstadjungierte Matrix A nur nichtnegative Eigenwerte,
dann existiert A. Diese Matrix ist ebenfalls selbstadjungiert.

Polarzerlegung: Jede quadratische komplexe ( n × n)-Matrix A lässt sich in der Form

A = US

darstellen. Dabei ist U eine unitäre ( n × n)-Matrix, und S ist eine selbstadjungierte ( n × n)-Matrix,
deren Eigenwerte alle größer gleich null sind.
Ist A zusätzlich reell, dann sind auch U und S reell.

Ist A invertierbar, dann kann man S : = AA∗ und U : = AS−1 wählen.

18
Liegt gleichzeitig die Situation 2.2.3.1 vor, dann stimmen beide Definitionen von f ( A) überein.
40 2 Algebra

2.3 Lineare Algebra

2.3.1 Grundideen

Die Idee der Linearität: Differentiation und Integration von Funktionen sind lineare Opera-
tionen, d. h., es gilt

(α f + βg) ( x ) = α f  ( x ) + βg ( x ),
  
(α f + βg)dx = α f dx + β g dx ,
G G G

wobei α und β Zahlen sind. Allgemein genügt eine lineare Operation L der Beziehung

L(α f + βg) = αL f + βLg ,

wobei f , g Funktionen, Vektoren, Matrizen usw. sein können.


Die Idee der Linearität spielt bei vielen mathematischen und physikalischen Fragen eine wich-
tige Rolle. Die lineare Algebra fasst in einheitlicher und sehr effektiver Form die vielfältigen
Erfahrungen der Mathematiker und Physiker mit linearen Strukturen zusammen.

Das Superpositionsprinzip: Definitionsgemäß gilt für ein physikalisches System genau dann
das Superpositionsprinzip, wenn neben zwei Zuständen auch deren Linearkombination ein
Zustand ist. Sind beispielsweise die beiden Funktionen x = f (t), g(t) Lösungen der Differential-
gleichung

x  + ω 2 x = 0

des harmonischen Oszillators, dann gilt das auch für die Linearkombination α f + βg.

Das Linearisierungsprinzip: Ein wichtiges und häufig in der Mathematik benutztes Prinzip
besteht in der Linearisierung von Problemen. Ein typisches Beispiel hierfür ist der Begriff
der Ableitung einer Funktion. Im engen Zusammenhang damit stehen Tangenten an Kurven,
Tangentialebenen an Flächen oder allgemeiner Tangentialräume an Mannigfaltigkeiten. Die
Grundidee des Linearisierungsprinzips ist in der Taylorentwicklung

f ( x ) = f ( x0 ) + f  ( x0 )( x − x0 ) + . . .

enthalten, wobei die rechte Seite eine lineare Approximation der Funktion f in einer Umgebung
des Punktes x0 darstellt. In höherer Ordnung ergeben sich durch

f  ( x0 )
f ( x ) = f ( x0 ) + f  ( x0 )( x − x0 ) + ( x − x0 ) 2 + . . .
2
zusätzlich quadratische Terme und Terme höherer Ordnung. Derartige multilineare Strukturen
werden in der multilinearen Algebra betrachtet (vgl. 2.4).
Die Topologie beschäftigt sich mit dem qualitativen Verhalten von Systemen. Eine wichtige
Methode besteht darin, topologischen Räumen gewisse lineare Räume (z. B. de Rhamsche Koho-
mologiegruppen) oder Vektorraumbündel zuzuordnen und deren Eigenschaften mit Methoden
der linearen Algebra zu untersuchen (vgl. die Kapitel 17 und 18).

Unendlichdimensionale Funktionenräume und Funktionalanalysis: In der klassischen


Geometrie hat man es mit endlichdimensionalen linearen Räumen zu tun (vgl. Kapitel 3).
Die modernen Untersuchungsmethoden von Differential- und Integralgleichungen im Rahmen
2.3 Lineare Algebra 41

der Funktionalanalysis basieren auf unendlichdimensionalen linearen Räumen, deren Elemente


Funktionen sind (z. B. Banachräume, Hilberträume, lokalkonvexe Räume; vgl. Kapitel 11).

Quantensysteme und Hilberträume: Versieht man einen linearen Raum zusätzlich mit einem
Skalarprodukt, dann entstehen Hilberträume, die für die mathematische Beschreibung von
Quantensystemen von fundamentaler Bedeutung sind. Dabei entsprechen die Zustände eines
Quantensystems gewissen Elementen eines Hilbertraumes H und die physikalischen Größen
werden durch geeignete lineare Operatoren von H beschrieben (vgl. 13.18).
Die Anfänge der linearen Algebra gehen auf die Bücher „Der Baryzentrische Kalkül“ von Au-
gust Ferdinand Möbius (1790–1868) aus dem Jahre 1827 und „Die lineare Ausdehnungslehre“von
Hermann Graßmann (1809–1877) aus dem Jahre 1844 zurück.

2.3.2 Lineare Räume

Das Symbol K steht im folgenden für R (Menge der reellen Zahlen) oder C (Menge der
komplexen Zahlen). In einem linearen Raum X über K sind Linearkombinationen

αu + βv

erklärt mit u, v ∈ X und α, β ∈ K.


Definition: Eine Menge X heißt genau dann ein linearer Raum über K, wenn jedem geordneten
Paar (u, v) mit u ∈ X und v ∈ X eindeutig ein durch u + v bezeichnetes Element von X
zugeordnet wird und jedem geordneten Paar (α, u) mit α ∈ K und u ∈ X eindeutig ein mit
αu bezeichnetes Element von X zugeordnet wird, so dass für alle u, v, w ∈ X und alle α, β ∈ K
folgendes gilt19 :
(i) u + v = v + u (Kommutativität).
(ii) (u + v) + w = u + (v + w) (Assoziativität).
(iii) Es existiert ein eindeutig bestimmtes Element von X, das wir mit o bezeichnen, so dass

z+o = z für alle z ∈ X gilt (Nullelement).

(iv) Zu jedem z ∈ X gibt es ein eindeutig bestimmtes Element in X, das wir mit (−z)
bezeichnen, so dass

z + (−z) = o für alle z ∈ X gilt (inverses Element).

(v) α (u + v) = αu + αv und ( α + β) u = αu + βu (Distributivität).


(vi) (αβ)u = α( βu) (Assoziativität) und 1u = u.
Lineare Räume über R (bzw. C) bezeichnet man auch als reelle (bzw. komplexe) Räume.

Lineare Unabhängigkeit: Die Elemente u1 , . . . , un eines linearen Raumes über K heißen


genau dann linear unabhängig, wenn aus

α1 u1 + . . . + αn un = 0, α1 , . . . , α n ∈ K

stets α1 = · · · = αn folgt. Anderenfalls nennt man u1 , . . . , un linear abhängig.


19
Anstelle von u + (−v ) schreiben wir in Zukunft kurz u − v. Man kann ferner zeigen, dass sich aus den obigen Eigenschaften
die Beziehungen „0u = o für alle u ∈ X“ und „αo = o für alle α ∈ K“ergeben. Deshalb werden wir für das Nullelement
„0“ in K und das Nullelement „o“ in X von jetzt an das gleiche Symbol „0“ verwenden. Wegen der geltenden Regeln
kann es dabei nicht zu Widersprüchen kommen. In analoger Weise werden lineare Räume über beliebigen Körpern K
definiert.
42 2 Algebra

Dimension: Die Maximalzahl linear unabhängiger Elemente eines linearen Raumes X wird
seine Dimension genannt und mit dim X bezeichnet. Das Symbol dim X = ∞ bedeutet, dass
beliebig viele linear unabhängige Elemente in X existieren. Besteht X nur aus dem Nullelement,
dann ist dim X = 0.

Basis: Es sei dim X < ∞. Ein System b1 , . . . , bn von Elementen des linearen Raumes X über K
heißt genau dann eine Basis von X, wenn sich jedes u ∈ X eindeutig in der Form

u = α1 b1 + . . . + αn bn , α1 , . . . , α n ∈ K

darstellen lässt. Wir nennen dann α1 , . . . , αn die Koordinaten von u bezüglich dieser Basis.

Basissatz: Es sei n eine eigentliche natürliche Zahl. Es gilt genau dann dim X = n, wenn
jedes System von n linear unabhängigen Elementen eine Basis von X bildet.

Der Austauschsatz von Steinitz: Bildet b1 , . . . , bn eine Basis des linearen Raumes X und sind
u1 , . . . , ur linear unabhängige Elemente in X, dann stellt

u1 , . . . , ur , br +1 , . . . , bn

eine neue Basis von X dar (eventuell nach Umnummerierung der Basiselemente b1 , . . . , bn ).
 Beispiel 1 (der lineare Raum R n ): Wir bezeichnen mit R n die Menge aller n-Tupel ( ξ 1 , . . . , ξ n )
reeller Zahlen ξ j . Durch

α(ξ 1 , . . . , ξ n ) + β( η1 , . . . , ηn ) = (αξ 1 + βη1 , . . . , αξ n + βηn )

für alle α, β ∈ R wird R n zu einem n-dimensionalen reellen Raum. Als Basis kann man

b1 := (1, 0, . . . , 0), b2 := (0, 1, 0, . . . , 0), ..., bn := (0, 0 . . . , 0, 1)

wählen, denn es gilt

(ξ 1 , . . . , ξ n ) = ξ 1 b1 + . . . + ξ n bn .

Lässt man komplexe Zahlen ξ j , η j , α und β zu, dann entsteht der n-dimensionale komplexe
lineare Raum C n .
 Beispiel 2: Es sei n eine eigentliche natürliche Zahl. Die Menge aller Polynome

a0 + a 1 x + . . . + a n −1 x n −1

mit reellen (bzw. komplexen) Koeffizienten a0 , . . . , an−1 bildet einen reellen (bzw. komplexen)
n-dimensionalen linearen Raum. Eine Basis wird durch 1, x, x2 , . . . , x n−1 gegeben.
 Beispiel 3: Die Menge aller Funktionen f : R −→ R bildet bezüglich der üblichen Linear-
kombination α f + βg einen reellen linearen Raum. Dieser ist unendlichdimensional, denn die
Potenzfunktionen b j ( x ) := x j , j = 0, 1, . . . , n, sind für jedes n linear unabhängig, d. h., aus

α0 b0 ( x ) + . . . + αn bn ( x ) = 0, α0 , . . . , α n ∈ R ,

folgt α0 = · · · = αn = 0.
 Beispiel 4: Alle stetigen Funktionen f : [ a, b] −→ R auf dem kompakten Intervall [ a, b] bilden
einen reellen (unendlichdimensionalen) linearen Raum C [ a, b ].
Hinter dieser Aussage verbirgt sich der Satz, dass die Linearkombination α f + βg stetiger
Funktionen f und g wiederum stetig ist.
2.3 Lineare Algebra 43

Linearkombinationen von Mengen: Es sei α, β ∈ K. Sind U und V nichtleere Mengen des


linearen Raumes X über K, dann setzen wir

αU + βV := {αu + βv : u ∈ U und v ∈ V }.

Unterraum: Eine Teilmenge Y eines linearen Raumes X über K heißt genau dann ein Unter-
raum (oder Teilraum) von X, wenn

αu + βv ∈ Y

für alle u, v ∈ Y und alle α, β ∈ K gilt.


 Beispiel 5: Wir tragen die beiden Vektoren a und b im Punkt P an (Abb. 2.1). Die Menge
{αa + βb | α, β ∈ R } aller reellen Linearkombinationen bildet einen linearen Raum X welcher
der von a und b aufgespannten Ebene durch den Punkt P entspricht. Der Unterraum Y : =
{αa | α ∈ R } wird von der Geraden durch P in Richtung von a gebildet.

Y
a

P b
Abb. 2.1

Es ist dim X = 2 und dim Y = 1.

Dimensionssatz: Sind Y und Z Unterräume des linearen Raumes X, dann gilt:

dim (Y + Z ) + dim (Y ∩ Z ) = dim Y + dim Z.

Dabei sind die Summe Y + Z und der Durchschnitt Y ∩ Z wieder Unterräume von X.

Kodimension: Es sei Y ein Unterraum von X. Neben der Dimension dim Y spielt auch die
Kodimension codim Y von Y eine wichtige Rolle. Definitionsgemäß gilt20 codim Y := dim X/Y.
Im Fall dim X < ∞ hat man

codim Y = dim X − dim Y.

2.3.3 Lineare Operatoren

Definition: Sind X und Y lineare Räume über K, dann versteht man unter einem linearen
Operator A : X −→ Y eine Abbildung mit der Eigenschaft

A(αu + βv) = αAu + βAv

für alle u, v ∈ X und alle α, β ∈ K.

Isomorphie: Die linearen Räume X und Y heißen genau dann isomorph, wenn es eine lineare
bijektive Abbildung A : X −→ Y gibt. Derartige Abbildungen heißen lineare Isomorphien.21
20
Der Faktorraum X/Y wird in 2.3.4.2 eingeführt.
21
Das griechische Wort „isomorph“ bedeutet „gleiche Gestalt“.
44 2 Algebra

In isomorphen linearen Räumen kann man in gleicher Weise rechnen. Deshalb lassen sich
isomorphe lineare Räume vom abstrakten Standpunkt aus nicht unterscheiden.

Satz: Zwei endlichdimensionale lineare Räume über K sind genau dann isomorph, wenn sie
die gleiche Dimension besitzen.
Somit stellt die Dimension die einzige Charakteristik endlichdimensionaler linearer Räume dar.
Ist b1 , . . . , bn eine Basis in dem n-dimensionalen linearen Raum X über K, dann entsteht durch

A(α1 b1 + . . . + αn bn ) := (α1 , . . . , αn )

eine lineare Isomorphie von X auf Kn .


 Beispiel 1: Es sei [ a, b] ein kompaktes Intervall. Setzen wir

b
Au := u( x )dx,
a

dann ist A : C [ a, b] −→ R ein linearer Operator.


 Beispiel 2: Wir definieren den Ableitungsoperator durch

( Au)( x ) := u ( x ) für alle x ∈ R.

Dann ist A : X −→ Y ein linearer Operator, falls X den Raum aller differenzierbaren Funktionen
u : R −→ R und Y den Raum aller Funktionen v : R −→ R bezeichnet.
 Beispiel 3 (Matrizen): Es bezeichne RSn den reellen linearen n-dimensionalen Raum der reellen
Spaltenmatrizen
⎛ ⎞
u1
⎜ ⎟
u = ⎝ ... ⎠ .
un

Die Linearkombination αu + βv entspricht der üblichen Matrizenoperation. Genau alle linearen


Operatoren A : RSn −→ RSm sind durch reelle (m × n)-Matrizen A = ( a jk ) gegeben. Die Gleichung
Au = v entspricht der Matrizengleichung

⎛ ⎞⎛ u1
⎞ ⎛
v1

a11 a12 ... a1n
⎜ ⎟ ⎜ ⎟
⎜ a21
⎜ a22 ... a2n ⎟
⎟⎜
u2 ⎟ ⎜ v2 ⎟
⎝ ... ⎠⎜ .. ⎟=⎜ .. ⎟.
⎝ . ⎠ ⎝ . ⎠
am1 am2 ... amn un vm

2.3.3.1 Das Rechnen mit linearen Operatoren

Wir betrachten lineare Operatoren A, B : X −→ Y und C : Y −→ Z, wobei X, Y und Z lineare


Räume über K bezeichnen.

Linearkombinationen: Gegeben sei α, β ∈ K. Wir definieren den linearen Operator αA + βB :


X −→ Y durch

(αA + βB)u := αAu + βBu für alle u ∈ X.


2.3 Lineare Algebra 45

Produkt: Das Produkt AC : X −→ Z ist ein linearer Operator, der sich durch Hintereinander-
ausführung ergibt, d. h., es ist

( AC )u = A(Cu) für alle u ∈ X.

Identischer Operator: Der durch Iu : = u für alle u ∈ X definierte lineare Operator I : X −→


X heißt identischer Operator und wird auch mit idX bezeichnet. Für alle linearen Operatoren
A : X −→ X gilt

AI = I A = A.

2.3.3.2 Lineare Operatorgleichungen

Gegeben sei der lineare Operator A : X −→ Y. Wir betrachten die Gleichung

Au = v. (2.50)

Nullraum und Bildraum: Wir definieren den Nullraum N ( A) und den Bildraum R( A) durch22

N ( A) := {u ∈ X | Au = 0} und R( A) := { Au | u ∈ X }.

Definition:
(i) A heißt genau dann surjektiv, wenn R( A) = Y gilt, d. h., die Gleichung (2.50) besitzt für
jedes v ∈ Y eine Lösung u ∈ X.
(ii) A heißt genau dann injektiv, wenn (2.50) für jedes v ∈ Y höchstens eine Lösung u ∈ X
besitzt.
(iii) A heißt genau dann bijektiv, wenn A surjektiv und injektiv ist, d. h., die Gleichung (2.50)
besitzt für jedes v ∈ Y genau eine Lösung u ∈ X.
Dann wird durch A−1 v := u der lineare inverse Operator A−1 : Y −→ X erklärt.

Superpositionsprinzip: Ist u0 eine spezielle Lösung von (2.50), dann stellt u0 + N ( A) die
Menge aller Lösungen von (2.50) dar.
Speziell für v = 0 bildet der Unterraum N ( A) den Lösungsraum von (2.50). Somit gilt: Sind
u und w Lösungen der homogenen Gleichung (2.50) mit v = 0, dann trifft das auch für jede
Linearkombination αu + βw mit α, β ∈ K zu.

Surjektivitätskriterium: Der lineare Operator A ist genau dann surjektiv, wenn es einen
linearen Operator B : Y −→ Y gibt mit

AB = IY .

Injektivitätskritierium: Der lineare Operator A : X −→ Y ist genau dann injektiv, wenn eine
der beiden folgenden Bedingungen erfüllt ist:
(a) Aus Au = 0 folgt u = 0, d. h., N ( A) = {0}.
22
Anstelle von N ( A) (bzw. R( A)) schreibt man auch ker A (bzw. imA). Diese Bezeichnung geht auf die englischen Worte
kernel (Kern) und image (Bild) zurück.
46 2 Algebra

(b) Es existiert ein linearer Operator B : Y −→ X mit

BA = IX .

Rang und Index: Wir setzen

Rang ( A) := dim R( A) und ind ( A) := dim N ( A) − codim R( A).

Der Index ind ( A) ist nur erklärt, falls nicht dim N ( A) und codim R( A) beide unendlich sind.
 Beispiel 1: Für einen linearen Operator A : X −→ Y zwischen den endlichdimensionalen
linearen Räumen X und Y gilt:

ind ( A) = dim X − dim Y, dim N ( A) = dim X − Rang ( A).

(a) Die zweite Aussage beinhaltet, dass die Dimension der linearen Lösungsmannigfaltigkeit
u0 + N ( A) von (2.50) gleich dim X − Rang ( A) ist (vgl. 2.3.4.2).
(b) Gilt ind ( A) = 0, dann folgt aus dim N ( A) = 0 sofort R( A) = Y. Folglich ist A bijektiv,
d. h., die Gleichung Au = v besitzt für jedes v ∈ Y die eindeutige Lösung u = A−1 v.

Bedeutung des Index: Der Index spielt eine fundamentale Rolle. Das ergibt sich erst in
voller Deutlichkeit bei der Untersuchung des Lösungsverhaltens von Differential- und Inte-
gralgleichungen im Fall von unendlichdimensionalen linearen Räumen (vgl. 11.3.4). Eines der
tiefsten Ergebnisse der Mathematik des 20. Jahrhunderts ist das Atiyah-Singer-Indextheorem. Es
besagt, dass man den Index von wichtigen Klassen linearer Differential- und Integraloperatoren
auf kompakten Mannigfaltigkeiten allein durch topologische (qualitative) Eigenschaften der
Mannigfaltigkeit und des sogenannten Symbols des Operators ausdrücken kann. Das hat zur
Konsequenz, dass der Index eines Operators unter beträchtlichen Störungen des Operators und
der Mannigfaltigkeit unverändert bleibt (vgl. 18.1).

2.3.3.3 Exakte Sequenzen

Die moderne lineare Algebra und algebraische Topologie werden in der Sprache der exakten
Sequenzen formuliert. Eine Sequenz
A B
X −→ Y −→ Z
von linearen Operatoren A und B heißt genau dann exakt, wenn R( A) = N ( B) gilt, d. h.

imA = ker B.

Allgemeiner heißt
A A k +1
. . . −→ Xk −→
k
Xk+1 −→ Xk+2 −→ . . .
genau dann exakt, wenn imAk = ker Ak+1 für alle k ist.

Satz: Für einen linearen Operator A : X −→ Y gilt23 :


A
(i) A ist genau dann surjektiv, wenn die Sequenz X −→ Y −→ 0 exakt ist.
A
(ii) A ist genau dann injektiv, wenn 0 −→ X −→ Y exakt ist.
A
(iii) A ist genau dann bijektiv, wenn 0 −→ X −→ Y −→ 0 exakt ist.
23
Mit 0 bezeichnen wir den trivialen Raum {0}. Ferner stehen 0 −→ X und Y −→ 0 für Nulloperatoren.
2.3 Lineare Algebra 47

2.3.3.4 Der Zusammenhang mit dem Matrizenkalkül

Die einem linearen Operator A zugeordnete Matrix A: Es sei A : X −→ Y ein linearer


Operator, wobei X und Y endlichdimensionale lineare Räume über K sind.
Wir wählen eine feste Basis b1 , . . . , bn in X und eine feste Basis c1 , . . . , cm in Y. Für u ∈ X und
v ∈ Y gelten dann die eindeutigen Zerlegungen

u = u 1 b1 + . . . + u n bn , v = v1 c1 + . . . + v m cm

und

m
Abk = ∑ a jk c j , k = 1, . . . , n.
j=1

Dabei ist b j , ck , a jk ∈ K. Wir bezeichnen die (m × n)-Matrix

A := ( a jk ), j = 1, . . . , m, k = 1, . . . , n ,

als die zu A gehörige Matrix (bezüglich der gewählten Basen). Ferner führen wir die zu u bzw. v
gehörigen Koordinatenspaltenmatrizen ein:

U : = ( u1 , . . . , u n ) T und V := ( v1 , . . . , vm ) T .

Dann entspricht der Operatorgleichung

Au = v

die Matrizengleichung:

AU = V.

Satz: Die Summe (bzw. das Produkt) linearer Operatoren entspricht der Summe (bzw. dem
Produkt) der zugehörigen Matrizen.
Der Rang eines linearen Operators ist gleich dem Rang der zugeordneten Matrix.

Basiswechsel: Durch die Transformationsformeln


n m
bk = ∑ trk br , cj = ∑ sij ci , k = 1, . . . , n, j = 1, . . . , m ,
r=1 i =1

gehen wir zu einer neuen Basis b1 , . . . , bn (bzw. c1 , . . . , cm ) in X (bzw. Y) über. Dabei seien die
(n × n)-Matrix T = (trk ) und die (m × m)-Matrix S = ( sij ) invertierbar. Die neuen Koordinaten
uk (bzw. vj ) von u (bzw. v) ergeben sich durch die Zerlegungen:

u = u1 b1 + . . . + un bn , v = v1 c1 + . . . + vm cm .

Daraus erhalten wir die Transformationsformeln für die Koordinaten von u bzw. v:

U = TU  , V = SV  .

Der Operatorengleichung Au = v entspricht die Matrizengleichung A  U  = V mit

A  = S −1 AT.
48 2 Algebra

Im Spezialfall X = Y und bj = c j für alle j gilt S = T. Dann erhalten wir die Ähnlichkeitstrans-
formation A  = T −1 AT der Matrix A.

Spur und Determinante: Es sei dim X < ∞. Wir definieren die Spur tr A und die Determinante
det A des linearen Operators A : X −→ X durch

tr A := tr ( a jk ), det A := det ( a jk ).

Diese Definitionen sind unabhängig von der Basiswahl.

Satz: Für lineare Operatoren A, B : X −→ X gilt:


(i) det ( AB) = (det A)(det B).
(ii) A ist genau dann bijektiv, wenn det A = 0 gilt.
(iii) tr(αA + βB) = αtr A + βtr B für alle α, β ∈ K.
(iv) tr( AB) = tr( BA).
(v) tr IX = dim X.

2.3.4 Das Rechnen mit linearen Räumen

Aus gegebenen linearen Räumen kann man neue lineare Räume gewinnen. Die folgenden
Konstruktionen sind Vorbilder für alle algebraischen Strukturen (z. B. Gruppen, Ringe und
Körper). Tensorprodukte linearer Räume werden in 2.4.3.1 betrachtet.

2.3.4.1 Kartesische Produkte

Sind X und Y lineare Räume über K, dann wird die Produktmenge X × Y := {(u, v) | u ∈
X und v ∈ Y } durch

α(u, v) + β(w, z ) := (αu + βw, αv + βz), α, β ∈ K,

zu einem linearen Raum über K, den man das kartesische Produkt zwischen X und Y nennt.
Sind X und Y endlichdimensional, dann gilt die Dimensionsformel

dim ( X × Y ) = dim X + dim Y.

 Beispiel: Für X = Y = R gilt X × Y = R2 .

2.3.4.2 Faktorräume

Lineare Mannigfaltigkeiten: Es sei Y ein Unterraum des linearen Raumes X über K. Jede
Menge

u + Y := {u + v | v ∈ Y }

mit festem u ∈ X heißt eine lineare Mannigfaltigkeit (parallel zu Y). Es ist

u+Y = w+Y

genau dann, wenn u − w ∈ Y gilt. Wir setzen dim (u + Y ) := dim Y.


2.3 Lineare Algebra 49

Faktorraum: Mit X/Y bezeichnen wir die Menge aller linearen Mannigfaltigkeiten in X
parallel zu Y. Durch die Linearkombination für Mengen

αU + βV

mit U, V ∈ X/Y und α, β ∈ K wird X/Y zu einem linearen Raum, den man den Faktorraum
von X modulo Y nennt. Explizit gilt

α(u + Y ) + β(v + Y ) = (αu + βv) + Y.

Für dim X < ∞ hat man

dim X/Y = dim X − dim Y.

 Beispiel: Es sei X : = R2 . Ist Y eine Gerade durch den Nullpunkt, dann besteht X/Y aus allen
Geraden parallel zu Y (Abb. 2.2).

(u + v) + Y


v+Y
u+v u+Y



v

 

u


Abb. 2.2
0

Alternative Definition: Es sei u, w ∈ X. Wir schreiben

u∼w genau dann, wenn u − w ∈ Y gilt.

Das ist eine Äquivalenzrelation auf X (vgl. 4.3.5.1). Die zugehörigen Äquivalenzklassen [u] :=
u + Y bilden X/Y. Durch

α[u] + β[ z] := [αu + βz]

wird X/Y zu einem linearen Raum. Diese Definition hängt nicht von der Wahl der Repräsentanten
u und z ab.
Die Abbildung u → [u] heißt die kanonische Abbildung von X auf X/Y.

Isomorphiesatz: Sind Y und Z Unterräume von X, dann hat man die Isomorphie

(Y + Z )/Z ∼
= Y/(Y ∩ Z ).

Im Fall Y ⊆ Z ⊆ X gilt zusätzlich

X/Y ∼
= ( X/Z)/(Z/Y ).

2.3.4.3 Direkte Summen

Definition: Es seien Y und Z zwei Unterräume des linearen Raumes X. Wir schreiben genau
dann

X = Y ⊕ Z,
50 2 Algebra

wenn sich jedes u ∈ X eindeutig in der Form

u = y + z, y ∈ Y, z ∈ Z

darstellen lässt. Man nennt Z auch algebraisches Komplement von Y in X. Es gilt

dim (Y ⊕ Z ) = dim Y + dim Z.

Satz: (i) Aus X = Y ⊕ Z folgt die Isomorphie Z ∼


= X/Y.
(ii) Es ist dim Z = codim Y.
Anschaulich gesprochen ist die Kodimension codim Y gleich der Anzahl der Dimensionen,
die dem Unterraum Y fehlen, um den gesamten Raum X aufzuspannen.
 Beispiel 1: Für X = R3 besitzen der Nullpunkt 0, eine Gerade durch 0, eine Ebene durch 0
der Reihe nach die Dimensionen 0, 1, 2 und die Kodimensionen 3, 2, 1.
 Beispiel 2: In Abb. 2.3 gilt R2 = Y ⊕ Z.

Z
u

z
y Y
0 Abb. 2.3

Existenzsatz: Zu jedem Unterraum Y eines linearen Raumes X gibt es ein algebraisches


Komplement Z, d. h., es ist X = Y ⊕ Z.

Lineare Hülle: Ist M eine Menge in dem linearen Raum X über K, dann nennen wir die
Menge

span M := {αu1 + . . . + αn un | u j ∈ M, α j ∈ K, j = 1, . . . , n und n ≥ 1}

die lineare Hülle von M.


span M ist der kleinste Unterraum von X, der M enthält.

Konstruktionssatz: Es sei Y ein m-dimensionaler Unterraum des n-dimensionalen linearen


Raumes X mit 0 < m < n < ∞. Wir wählen eine Basis u1 , . . . , un von Y und ergänzen diese zu
einer Basis u1 , . . . , un von X. Dann gilt

X = Y ⊕ span{um+1 , . . . , un }.

Die direkte Summe beliebig vieler Unterräume: Es sei { Xα }α∈ A eine Familie von Unterräu-
men Xα des linearen Raumes X. Wir schreiben genau dann


X= Xα ,
α∈ A

wenn sich jedes x ∈ X eindeutig in der Form

x= ∑ xα , x α ∈ Xα ,
α∈ A
2.3 Lineare Algebra 51

darstellen lässt, wobei nur endlich viele Summanden auftreten. Ist die Indexmenge A endlich,
dann hat man die Dimensionsformel

dim X = ∑ dim Xα .
α∈ A

Die äußere direkte Summe linearer Räume: Es sei { Xα }α∈ A eine Familie linearer Räume
Xα über K. Dann besteht das kartesische Produkt ∏ Xα aus der Menge aller Tupel ( xα ), die
α∈ A
komponentenweise addiert und komponentenweise mit Zahlen aus K multipliziert werden. Als
äußere direkte Summe


α∈ A

der linearen Räume Xα bezeichnen wir denjenigen Unterraum von ∏ Xα , der aus allen Tupeln
α∈ A
( xα ) besteht, die nur an endlich vielen Stellen von null verschieden sind.
Identifiziert man X β mit allen Tupeln ( xα ), für die xα = 0 im Fall α = β gilt, dann entspricht

Xα der direkten Summe der Unterräume Xα .
α∈ A

Graduierung: Man sagt, dass Xα durch die Räume Xα graduiert ist.
α∈ A

2.3.4.4 Anwendung auf lineare Operatoren

Der Rangsatz: Gegeben sei der lineare Operator A : X −→ Y. Wählen wir irgendeine
Zerlegung X = N ( A) ⊕ Z, dann ist

A : Z −→ R( A)

bijektiv. Daraus folgt

codim N ( A) = dim R( A) = Rang ( A).

Invariante Unterräume: Gegeben sei der lineare Operator A : X −→ X, wobei X einen


linearen Raum über K bezeichnet. Der Unterraum Y von X heißt genau dann invariant bezüglich
A, wenn aus u ∈ Y stets Au ∈ Y folgt.
Zusätzlich heißt Y irreduzibel, wenn Y keinen echten, vom Nullraum verschiedenen invarian-
ten Unterraum bezüglich A besitzt.

Der fundamentale Zerlegungssatz: Gilt dim X < ∞, dann gibt es zu A eine Zerlegung

X = X1 ⊕ X2 ⊕ . . . ⊕ X k

von X in (vom Nullraum verschiedene) irreduzible invariante Unterräume X1 , . . . , Xk , d. h., wir


erhalten Operatoren A : X j −→ X j für alle j.
Ist X ein komplexer linearer Raum, dann kann man in jedem Unterraum X eine Basis wählen,
so dass die zu A auf X j gehörige Matrix einem Jordankästchen entspricht. Die zu A auf X
gehörige Matrix besitzt dann Jordansche Normalform.
52 2 Algebra

Die Längen der Jordankästchen sind gleich den Dimensionen der Räume X j . Diese Längen
können nach der in 2.2.2.3 angegebenen Elementarteilermethode berechnet werden, indem man
diese Methode auf irgendeine zu A gehörige Matrix anwendet.

2.3.5 Dualität

Der Begriff der Dualität spielt in vielen Bereichen der Mathematik (z. B. in der projektiven
Geometrie und in der Funktionalanalysis) eine wichtige Rolle.24

Lineare Funktionale: Unter einem linearen Funktional auf dem linearen Raum X über K
verstehen wir eine lineare Abbildung u∗ : X −→ K.
 Beispiel 1: Durch
b
u∗ (u) := u( x )dx
a

entsteht ein lineares Funktional auf dem Raum C [ a, b] der stetigen Funktionen u : [ a, b] −→ R.

Der duale Raum: Mit X  bezeichnen wir die Menge aller linearen Funktionale auf X. Durch
die Linearkombination αu∗ + βv∗ mit

(αu∗ + βv∗ )(u) := αu∗ (u) + βv∗ (u)

für alle u ∈ X wird X  zu einem linearen Raum über K, den wir den zu X dualen Raum nennen.
Wir setzen X  := ( X  )  .
 Beispiel 2: Es sei X ein n-dimensionaler linearer Raum über K. Dann hat man die Isomorphie

X ∼
= X,

die sich jedoch nicht in natürlicher Weise ergibt, sondern von der Wahl einer Basis b1 , . . . , bn auf
X abhängt. Um das zu zeigen, setzen wir

b∗j (u1 b1 + . . . + un bn ) := u j , j = 1, . . . , n.

Dann bilden die linearen Funktionale b1∗ , . . . , bn∗ eine Basis des dualen Raumes X  , die wir die
duale Basis zu b1 , . . . , bn nennen.
Jedes lineare Funktional u∗ auf X lässt sich in der Form

u∗ = α1 b1∗ + . . . + αn bn∗ , α1 , . . . , αn ∈ K

darstellen. Setzen wir A(u∗ ) := α1 b1 + · · · + αn bn , dann ist A : X  −→ X eine lineare bijektive


Abbildung, die die Isomorphie X  ∼ = X ergibt.
Dagegen erhält man die Isomorphie

X  ∼
=X

in natürlicher (basisunabhängiger) Weise, indem man

u∗∗ (u∗ ) := u∗ (u) für alle u∗ ∈ X 


24
Eine ausführlichere Untersuchung der Dualitätstheorie für lineare Räume und ihre Anwendungen findet man in 11.2.
2.4 Multilineare Algebra 53

setzt. Dann wird jedem u ∈ X ein u∗∗ ∈ X  zugeordnet, und diese Abbildung von X auf X 
ist linear und bijektiv.
Für unendlichdimensionale lineare Räume ist das Verhältnis zwischen X und X  , X  in
der Regel nicht mehr so durchsichtig wie im endlichdimensionalen Fall (vgl. z. B. die Theorie
reflexiver Banachräume in 11.2.4.3).

Der duale Operator: Es sei A : X −→ Y ein linearer Operator, wobei X und Y lineare Räume
über K bezeichnen. Definieren wir A durch

( A v∗ )(u) := v∗ ( Au) für alle u ∈ X,

dann ist A : Y  −→ X  ein linearer Operator, den man den zu A dualen Operator nennt.

Produktregel: Sind A : X −→ Y und B : Y −→ Z lineare Operatoren, dann gilt

( AB) = B A .

2.4 Multilineare Algebra

X, Y und Z seien lineare Räume über K. Die multilineare Algebra untersucht Produkte

uv

mit Werten in Z, d. h., es ist u ∈ X, v ∈ Y und uv ∈ Z. Die typische Eigenschaft eines solchen
Produkts ist durch

(αu + βw)v = α(uv) + β(wv), u(αv + βz) = α(uv) + β(uz)

für alle u, w ∈ X, v, z ∈ Y und α, β ∈ K gegeben. Wichtige Beispiele für derartige Produkte


sind das Tensorprodukt u ⊗ v, das äußere Produkt u ∧ v und das innere Produkt u ∨ v (Cliffordmulti-
plikation).
Alle derartigen Produkte lassen sich durch das Tensorprodukt ausdrücken, d. h., es gibt stets
einen eindeutig bestimmten, linearen Operator L : X ⊗ Y −→ Z mit

uv = L( u ⊗ v)

(vgl. 2.4.3.). Beispielsweise erhält man das äußere Produkt durch u ∧ v := u ⊗ v − v ⊗ u. Das
ergibt die Antisymmetriebeziehung

u ∧ v = −(v ∧ u).

Das äußere Produkt steht im engen Zusammenhang mit der Determinantentheorie. In der
Quantentheorie beschreibt das Tensorprodukt a ⊗ b zusammengesetzte Zustände (z. B. entspricht
a ⊗ b ⊗ c der Zusammensetzung eines Protons aus drei Quarks; vgl. 17.8). Das innere Produkt
wird zur Beschreibung von Teilchen mit halbzahligem Spin (Fermionen) benutzt.
54 2 Algebra

2.4.1 Algebren

Definition: Unter einer Algebra A über K verstehen wir einen linearen Raum, in dem zusätz-
lich eine distributive und assoziative Multiplikation erklärt ist.
Explizit bedeutet dies, dass jedem geordneten Paar ( a, b) von Elementen a und b aus A
eindeutig ein drittes Element aus A zugeordnet wird, das wir mit ab bezeichnen, so dass für alle
a, b, c ∈ A und alle α, β ∈ K gilt:
(i) (αa + βb)c = α( ac) + β(bc ) und c( αa + βb) = α( ca) + β(cb ),
(ii) a(bc) = ( ab)c.
Morphismen: Unter einem Morphismus ϕ : A −→ B der Algebra A in die Algebra B
verstehen wir eine lineare Abbildung, die das Produkt respektiert, d. h., es ist

ϕ( ab) = ϕ ( a) ϕ( b) für alle a, b ∈ A.

Isomorphismen: Die Algebra A heißt genau dann isomorph zur Algebra B, wenn es einen
bijektiven Morphismus ϕ : A −→ B gibt. Bijektive Morphismen zwischen Algebren heißen
Isomorphismen.
Isomorphe Algebren können miteinander identifiziert werden.

2.4.2 Das Rechnen mit Multilinearformen

Mit X, Y, Z und X1 , . . . , Xn , Y1 , . . . , Ym bezeichnen wir lineare Räume über K.


Bilinearformen: Unter einer Bilinearform verstehen wir eine Abbildung B : X × Y −→ Z, die
in jedem Argument linear ist, d. h., es gilt

B(αu + βw, v ) = αB (u, v ) + βB(w, v ),


B(u, αv + βz) = αB (u, v ) + βB(u, z )

für alle u, w ∈ X, v, z ∈ Y und α, β ∈ K.


Produkte: Setzen wir uv := B(u, v), dann ergibt sich ein Produkt zwischen den Elementen
der linearen Räume X und Y mit Werten in Z.
Spezielle Eigenschaften: Es sei B : X × X −→ Z eine Bilinearform.
(i) B heißt genau dann symmetrisch, wenn B(u, v ) = B(v, u ) für alle u, v ∈ X.
(ii) B heißt genau dann antisymmetrisch, wenn B( u, v) = − B( v, u) für alle u, v ∈ X.
(iii) B heißt genau dann nichtentartet, wenn aus B(u, v) = 0 (oder B( v, u) = 0) für alle v ∈ X
stets u = 0 folgt.
Multilinearformen: Unter einer n-Linearform verstehen wir eine Abbildung

M : X1 × . . . × Xn −→ K,

die in jedem Argument linear ist. Die Zahl n heißt der Grad von M.
Setzen wir u1 u2 · · · un := M( u1 , . . . , un ), dann ergibt sich ein Produkt.
Symmetrieeigenschaften: Die n-Linearform M : X × · · · × X −→ Z heißt genau dann
symmetrisch, wenn sich M(u1 , . . . , un ) bei einer Permutation der Argumente u1 , . . . , un nicht
ändert.
2.4 Multilineare Algebra 55

M heißt genau dann antisymmetrisch, wenn sich M( u1 , . . . , un ) bei einer geraden Permutation
der Argumente nicht ändert und bei einer ungeraden Permutation der Argumente mit (−1)
multipliziert.
Determinanten: Es sei A : X −→ X ein linearer Operator auf dem n-dimensionalen linearen
Raum X über K. Dann gilt

M ( Au1 , . . . , Aun ) = (det A) M( u1 , . . . , un )

für alle antisymmetrischen n-Linearformen M : X × · · · × X −→ K und alle u1 , . . . , un ∈ X.


Das Tensorprodukt von Multilinearformen: Es sei M : X1 × · · · × Xm −→ K eine m-
Linearform, und N : Y1 × · · · × Yn −→ K sei eine n-Linearform. Durch

( M ⊗ N )(u1 , . . . , um , v1 , . . . , vn ) := M(u1 , . . . , um ) N (v1 , . . . , vn )

für alle u j ∈ X j und vk ∈ Yk wird eine (m + n)-Linearform

M ⊗ N : X1 × . . . × Xm × Y1 × . . . × Yn −→ K,

erklärt, die wir das Tensorprodukt zwischen M und N nennen.


Rechenregeln: Für beliebige Multilinearformen M, N, K und beliebige Zahlen α, β ∈ K gilt:
(i) (αM + βN ) ⊗ K = α( M ⊗ K ) + β( N ⊗ K ) und K ⊗ (αM + βN ) = α( K ⊗ M ) + β( K ⊗ N ),
and
(ii) ( M ⊗ N ) ⊗ K = M ⊗ ( N ⊗ K ).
In (i) müssen M und N naturgemäß den gleichen Grad besitzen.

2.4.2.1 Antisymmetrische Multilinearformen

Das äußere Produkt: Es sei X ein linearer Raum über K. Mit A q ( X ) bezeichnen wir die
Menge aller antisymmetrischen q-Linearformen

M : X × . . . × X −→ K.

Ferner sei A0 ( X ) := K. In natürlicher Weise wird A q ( X ) zu einem linearen Raum über K.


Für M ∈ A q ( X ) und N ∈ A p ( X ) mit q, p ≥ 1 definieren wir

( M ∧ N )(u1 , . . . , uq+ p ) := ∑(sgn π ) M (uπ (1) , . . . , uπ (q) ) N (uπ(q+1) , . . . , uπ (q+ p) )


π

für alle u1 , . . . , un ∈ X. Summiert wird dabei über alle möglichen Permutationen π der Indizes
mit π (1) < π (2) < · · · < π ( q) und π (q + 1) < · · · < π ( q + p). Mit sgn π bezeichnen wir das
Vorzeichen der Permutation von π.
Die so entstehende antisymmetrische ( p + q)-Linearform M ∧ N heißt das äußere Produkt
zwischen M und N. Es ist M ∧ N ∈ A p+q ( X ).
Für α, β ∈ K und M ∈ A q ( X ) mit q ≥ 1 definieren wir ferner:

α ∧ M = M ∧ α = αM, α ∧ β = αβ.
56 2 Algebra

 Beispiel 1: Im Fall q = p = 1 gilt

( M ∧ N )(u, v) = M(u ) N (v) − M(v) N (u ) für alle u, v ∈ X.

Ist q = 1 und p = 2, dann erhalten wir

( M ∧ N )(u, v, w) = M(u) N (v, w) − M (v) N (u, w ) + M(w) N (u, v).

 Beispiel 2: Es sei a, b, c ∈ X  . Dann erhalten wir


     
 b (v) b (w)   b(w)   b( u ) b(v) 
( a ∧ (b ∧ c))(u, v, w) = a(u)   − a (v )  b( u ) + a ( w )  .
c ( v ) c( w )   c (u ) c( w )   c (u) c(v) 

Der Entwicklungssatz für Determinanten liefert


 
 a( u) a(v) a( w ) 
 
( a ∧ (b ∧ c))(u, v, w) =  b(u) b(v) b(w) 
 für alle u, v, w ∈ X.
 c (u ) c( v ) c (w ) 

In analoger Weise erhält man den gleichen Ausdruck für (( a ∧ b) ∧ c)(u, v, w). Das ergibt das
Assoziativgesetz

a ∧ (b ∧ c) = ( a ∧ b) ∧ c.

Hierfür schreiben wir kurz a ∧ b ∧ c.


Benutzen wir das Tensorprodukt, dann gelten die Beziehungen

a∧b = a⊗b−b⊗a

und

a ∧ b ∧ c = a ⊗ b ⊗ c − a ⊗ c ⊗ b + b ⊗ c ⊗ a − b ⊗ a ⊗ c + c ⊗ a ⊗ b − c ⊗ b ⊗ a.

Das entspricht der Summe über alle Permutationen von a ⊗ b ⊗ c versehen mit dem Vorzeichen
der Permutation.
Rechenregeln: Für alle antisymmetrischen Multilinearformen M, N und K vom Grad ≥ 0
und alle Zahlen α, β ∈ K gilt:

(i) (αM + βN ) ∧ K = α( M ∧ K ) + β( N ∧ K ),
K ∧ (αM + βN ) = α( K ∧ M) + β( K ∧ N );

(ii) ( M ∧ N ) ∧ K = M ∧ ( N ∧ K );

(iii) M ∧ N = (−1)qp N ∧ M.

In (i) wird vorausgesetzt, dass M und N den gleichen Grad besitzen. In (iii) sei q = Grad M
und p = Grad N. Diese graduierte Multiplikationsregel besagt, dass die Kommutativität oder
Antikommutativität des Produkts M ∧ N vom Grad der Faktoren abhängt.
Die Algebra A ( X ): Die äußere direkte Summe


A ( X ) := A p (X )
p= 0
2.4 Multilineare Algebra 57

wird bezüglich der ∧-Multiplikation zu einer Algebra über K, die man die Algebra der antisym-
metrischen Multilinearformen über X nennt. Diese Algebra ist durch die linearen Räume A p ( X )
graduiert. Die Elemente von A ( X ) sind Summen

M0 + M1 + M2 + . . .

mit Mq ∈ A q ( X ), wobei jeweils nur endlich viele Mq ungleich null sind. Die Addition und
∧-Multiplikation geschehen in üblicher Weise unter Beachtung der Reihenfolge der Faktoren.
 Beispiel 3:

( M0 + M1 ) ∧ ( N0 + N1 ) = M0 ∧ N0 + ( M0 ∧ N1 + M1 ∧ N0 ) + M1 ∧ N1 .

Wegen M0 , N0 ∈ K, ist dieser Ausdruck gleich M0 N0 + M0 N1 + N0 M1 + M1 ∧ N1 .


Endlichdimensionale Räume: Es sei b1 , . . . , bn eine Basis von X. Die dazu duale Basis von
X  bezeichnen wir mit b1 , . . . , bn , d. h., es ist

b j (α1 b1 + . . . + αn bn ) = α j , j = 1, . . . , n,

für alle α1 , . . . , αn ∈ K. Dann gilt

b j ∧ b k = −b k ∧ b j

für alle j, k = 1, . . . , n. Insbesondere ist bk ∧ bk = 0.


 Beispiel 4: Für n = 2 und q = 2, erhalten wir alle Elemente von A2 ( X ) durch

M = α ( b1 ∧ b2 ) + β ( b 2 ∧ b 1 ) = ( α − β ) b 1 ∧ b 2

mit beliebigen Zahlen α, β ∈ K. Das bedeutet dim A2 ( X ) = 1. Man kann M auch eindeutig in
der Form
2
1 1
M= (α b1 ∧ b2 + α21 b2 ∧ b1 ) =
2! 12 2! ∑ α jk b j ∧ bk ,
j,k=1

schreiben, wobei α jk antisymmetrisch bezüglich der Indizes ist, d. h., es gilt α jk ∈ K und

α jk = −αkj für alle j, k.

 Beispiel 5: Im Fall dim X = n ist

b j1 ∧ . . . ∧ b jq (2.51)

antisymmetrisch bezüglich aller Indizes. Alle Produkte in (2.51) mit j1 < j2 < · · · < jq und
jk = 1, . . . , n für alle k bilden eine Basis von A q ( X ), und es gilt

 
n
dim A q ( X ) = , dim A ( X ) = 2n .
q

Jedes M ∈ A q ( X ) kann man in eindeutiger Weise durch

1
M= α b j1 ∧ . . . ∧ b jq , (2.52)
q! j1 ...jq

darstellen, wobei α... zu K gehört und bezüglich aller Indizes antisymmetrisch ist. Über gleiche
obere und untere Indizes wird dabei von 1 bis n summiert (Einsteinsche Summenkonvention).
58 2 Algebra

Bei einem Basiswechsel transformieren sich die Koeffizienten α... von M wie ein q-fach kovari-
anter, antisymmetrischer Tensor (vgl. 10.2.1).
Anwendung von Differentialformen im R n : Es sei X = R n . Wir wählen die natürliche Basis

b1 := (1, 0, . . . , 0), . . . , bn := (0, 0, . . . , 1)

in R n . Die dazu duale Basis bezeichnet man mit

dx1 , . . . , dxn ,

d. h., für alle α1 , . . . , αn ∈ R gilt:

dx j (α1 b1 + . . . + αn bn ) = α j , j = 1, . . . , n.

In allen Formeln von Beispiel 5 hat man jetzt b j durch dx j ersetzt. Dann nennt man M in (2.52)
eine Differentialform q-ten Grades (mit konstanten Koeffizienten).
Derartige Differentialformen spielen eine fundamentale Rolle in der modernen Analysis und
Geometrie (vgl. 10.2. und 15.4.3).
 Beispiel 6: Im R2 ist b1 := (1, 0) und b2 := (0, 1). Die duale Basis dx1 , dx2 wird durch

dx1 (αb1 + βb2 ) := α, dx2 (αb1 + βb2 ) := β, α, β ∈ R

definiert. Für alle u, v ∈ R2 gilt

(dx j ∧ dx k )(u, v) = dx j (u)dxk (v) − dx j (v)dxk (u)

und (dx j ⊗ dx k )(u, v) = dx j ( u)dx k (v). Das ergibt

dx j ∧ dx k = dx j ⊗ dx k − dx k ⊗ dx j .

Daraus folgt

dx 1 ∧ dx2 = −dx2 ∧ dx 1 , dx1 ∧ dx1 = dx2 ∧ dx2 = 0.

Die ∧-Produkte von mehr als zwei beliebigen Faktoren dx j sind alle gleich null.
Der zweidimensionale Raum A1 (R2 ) besteht aus allen Linearkombinationen

βdx1 + γdx2 , β, γ ∈ R,

während der eindimensionale Raum A2 (R2 ) aus allen Ausdrücken δ(dx1 ∧ dx2 ) mit δ ∈ R
gebildet wird. Die Algebra A (R2 ) besteht aus allen Ausdrücken der Form

α + βdx1 + γdx2 + δ(dx1 ∧ dx 2 ), α, β, γ, δ ∈ R.

2.4.2.2 Kovariante und kontravariante Tensoren

Tensoren spielen eine fundamentale Rolle in der Differentialgeometrie und in der mathematischen
Physik (vgl. 10.2 sowie die Kapitel 15 und 16).
p
Tensoren: Es sei X ein endlichdimensionaler linearer Raum über X. Die Menge T q ( X ) besteht
definitionsgemäß aus allen Multilinearformen

M : X × . . . × X × X  × . . . × X  −→ K,

wobei der Raum X q-fach und der duale Raum X  p-fach auftritt. Die Elemente T q ( X ) heißen
p

q-fach kovariante und p-fach kontravariante Tensoren über X. Ferner sei T 00 := K.


2.4 Multilineare Algebra 59

p
Tensorprodukt: Für alle M ∈ T q ( X ) und N ∈ Trs ( X ) mit p + q ≥ 1 und r + s ≥ 1 definieren
wir in natürlicher Weise
( M ⊗ N )(u1 , . . . , uq+s , v1 , . . . , v p+r )
: = M ( u 1 , . . . , u q , v 1 , . . . , v p ) N ( u q +1 , . . . , u q + s , v p +1 , . . . , v p +r )

für alle u j ∈ X und alle vk ∈ X  . Das ist das übliche Tensorprodukt, wobei jedoch die Argumente
so angeordnet werden, dass zunächst die Elemente aus X und dann die Elemente X  auftreten.
Ferner sei
p
α ⊗ M = M ⊗ α = αM für alle α ∈ K, M ∈ T q ( X )

mit p, q ≥ 0. Allgemein gilt:

p p +r
Aus M ∈ Tq ( X ) und N ∈ Trs ( X ) folgt M ⊗ N ∈ T q+s ( X ).

Einsteinsche Summenkonvention: Im folgenden wird über gleiche obere und untere Indizes
von 1 bis n summiert.
Basisdarstellung: Es sei b1 , . . . , bn eine Basis des linearen Raumes X über K. Jeder Tensor
p
M ∈ T q ( X ) mit p + q ≥ 1 lässt sich dann eindeutig in der Form

j ...j p
M = ti11 ...iq bi1 ⊗ . . . ⊗ biq ⊗ bj1 ⊗ . . . ⊗ b jp (2.53)

... in K schreiben. Dabei bezeichnet b , . . . , b die duale Basis zu b1 , . . . , bn . In


mit Koeffizienten t... 1 n

(2.53) identifizieren wir b j mit der Linearform b j ( u∗ ) := u∗ (b j ) für alle u∗ ∈ X  .


Basiswechsel: Aus der Basistransformation

j
b j = A j b j

folgt die Transformationsformel

 
bk = Akk bk


für die duale Basis. Dabei ergibt sich Akk in eindeutiger Weise aus dem Gleichungssystem
 j j
Akk Ak = δk , j, k = 1, . . . , n.

j1 ...j p
Satz: Die Koordinaten ti1 ...iq eines Tensors transformieren sich bei einem Basiswechsel in
gleicher Weise wie

b j1 ⊗ . . . ⊗ b jp ⊗ bi1 ⊗ . . . ⊗ biq .

 
 Beispiel 1: Es sei M = trs br ⊗ bs . Das ergibt M = trs bs ⊗ br mit
 
trs = Arr  ass trs .

Verjüngung: Aus M in (2.53) ergibt sich ein neuer Tensor, indem man einen oberen und
unteren Index der Koordinaten t...
... gleichsetzt (z. B. j) und die entsprechenden Basisvektoren b j
j
und b streicht. Diese Operation ist unabhängig von der gewählten Basis.
60 2 Algebra

 Beispiel 2: Aus M = tijk b j ⊗ bk ⊗ bi erhält man N = tiik bk .


Algebra der kovarianten und kontravarianten Tensoren: Die (äußere) direkte Summe

 p
T ( X ) := Tq (X)
p,q=0

wird bezüglich der Operationen + und ⊗ zu einer Algebra.


j j
 Beispiel 3: Aus M = t k bk ⊗ bj und N = sk bk ⊗ b j folgt
j j
M + N = (tk + sk )(bk ⊗ bj )

und
j p
M ⊗ N = t k sq ( bk ⊗ b q ⊗ b j ⊗ b p ) .

2.4.3 Universelle Produkte

2.4.3.1 Das Tensorprodukt linearer Räume

Es seien X und Y lineare Räume über K. Jedem u ∈ X ordnen wir durch

u(u∗ ) := u∗ ( u) für alle u∗ ∈ X T (2.54)

eine Linearform über X  zu. Analog verfahren wir mit Y T . Durch

u⊗v

bezeichnen wir das ⊗-Produkt dieser Linearformen, d. h., es ist

(u ⊗ v)(u∗ , v∗ ) = u(u∗ )v(v∗ ) für alle u∗ ∈ X  , v∗ ∈ Y  .

Das Tensorprodukt X ⊗ Y: Die Gesamtheit aller endlichen Summen

u1 ⊗ v1 + . . . + u k ⊗ v k (2.55)

mit u j ∈ X, v j ∈ Y für alle j und k = 1, . . . bilden einen linearen Raum über K, den man das
Tensorprodukt von X mit Y nennt.
Zwei Summen der Form (2.55) sind definitionsgemäß genau dann gleich, wenn sie als Bilinear-
formen die gleichen Werte besitzen. Das kann für sehr unterschiedliche Summendarstellungen
zutreffen.
Basissatz: Sind u1 , . . . , uk linear unabhängig in X und sind v1 , . . . , vm linear unabhängig in Y,
dann sind alle Produkte

uα ⊗ v β , α = 1, . . . , k, β = 1, . . . , m

in X ⊗ Y linear unabhängig. Ferner bilden diese Produkte eine Basis von X ⊗ Y, falls u1 , . . . , uk
eine Basis von X und v1 , . . . , vm eine Basis von Y ist.
Das Tensorprodukt X1 ⊗ X2 ⊗ · · · ⊗ Xr : Sind X1 , . . . , Xr lineare Räume über K, dann be-
zeichnet X1 ⊗ · · · ⊗ Xr die Gesamtheit aller endlichen Summen von Termen der Form

u1 ⊗ u2 ⊗ . . . ⊗ ur

mit u j ∈ X j für alle j.


2.4 Multilineare Algebra 61

Der obige Basissatz für zwei Räume gilt in analoger Form für r Faktoren, und es ist
dim ( X1 ⊗ X2 ⊗ . . . ⊗ Xr ) = dim X1 · dim X2 · . . . · dim Xr .
Das rechts stehende Produkt ist definitionsgemäß genau dann gleich null, wenn einer der
Faktoren gleich null ist.
Die Universalität des Tensorprodukts: Es seien X1 , . . . , Xn und Z lineare Räume über K.
Ist M : X1 × · · · × Xn −→ Z eine n-lineare Abbildung, dann gibt es eine lineare Abbildung
L : X1 ⊗ · · · ⊗ Xn −→ Z mit

M ( u1 , . . . , u n ) = L ( u1 ⊗ . . . ⊗ u n )

für alle u j ∈ X j , j = 1, . . . , n. Auf diese Weise lassen sich alle Produkte u1 u2 · · · un :=


M(u1 , . . . , un ) auf das Tensorprodukt zurückführen.25
Komplexifizierung eines linearen Raumes: Ist X ein reeller linearer Raum, dann bezeichnet
man den komplexen linearen Raum X ⊗ C, als die Komplexifizierung von X.26 Wegen der
Relation u ⊗ (α + βi) = (αu) ⊗ 1 + ( βu) ⊗ i besteht X ⊗ C aus genau allen Ausdrücken
u⊗1+v⊗i
mit u, v ∈ X. Es gilt u ⊗ 1 + v ⊗ i = u ⊗ 1 + v ⊗ i genau dann, wenn u = u und v = v . Durch
ϕ(u) := u ⊗ 1 ergibt sich eine lineare injektive Abbildung ϕ : X −→ X ⊗ C. Deshalb kann u mit
u ⊗ 1 identifiziert werden. Ferner gilt dim C ( X ⊗ C ) = dim R X.27

2.4.3.2 Die Tensoralgebra eines linearen Raumes

Es sei X ein linearer Raum über K. Mit ⊗ p X bezeichnen wir das p-fache Tensorprodukt X ⊗
· · · ⊗ X. Ferner setzen wir ⊗0 X := K für p = 0.. Die äußere direkte Summe



⊗( X ) := (⊗ p X )
p =0

besteht aus endlichen Summen M0 + M1 + · · · von p-Linearformen M : X × · · · × X −→ K, für


die nach 2.4.2. ein ⊗-Produkt erklärt ist. Dadurch wird ⊗( X ) zu einer Algebra über K, die man
die Tensoralgebra des linearen Raumes X nennt.
 Beispiel: Für u, v, w ∈ X gilt
(2 + u) ⊗ (3 + v ⊗ w) = 6 + 3u + 2v ⊗ w + u ⊗ v ⊗ w.

2.4.3.3 Die äußere Algebra eines linearen Raumes (Graßmannalgebra)

Das äußere Produkt: Es sei X ein linearer Raum über K. Für u, v ∈ X sei nunmehr

u∧v

das ∧-Produkt der im Sinne von (2.54) zugehörigen Linearformen, d. h., es ist
(u ∧ v)(u∗ , v∗ ) = u(u∗ )v(v∗ ) − u (v∗ )v(u∗ )
für alle u∗ , v∗ ∈ X  . Das bedeutet u ∧ v = u ⊗ v − v ⊗ u.
25
Das Tensorprodukt linearer Räume kann man in isomorpher Weise auch durch einen Faktorraum beschreiben (vgl.
11.2.3.2).
26
Wir definieren dabei α(u ⊗ z) := u ⊗ αz für alle α ∈ C und alle u ∈ X, z ∈ C.
27
Das Symbol dim C ( X ⊗ C ) (bzw. dim R X) bezeichnet die Dimension des komplexen Raumes X ⊗ C (bzw. des reellen
Raumes X).
62 2 Algebra

Das äußere Produkt X ∧ X: Die Gesamtheit aller endlichen Summen

u1 ∧ v1 + . . . + u k ∧ v k

mit u j , v j ∈ X für alle j und k = 1, . . . bilden einen linearen Raum über K, den man das äußere
Produkt von X mit X nennt.
X ∧ X ist ein Unterraum von X ⊗ X, der genau aus den antisymmetrischen Bilinearformen
M : X × X −→ K von X ⊗ X besteht.
Basissatz: Sind u1 , . . . , uk linear unabhängig in X, dann sind alle Produkte

ui ∧ u j (2.56)

mit i < j und i, j = 1, . . . , k linear unabhängig. Bildet u1 , . . . , uk eine Basis in X, dann stellen alle
Produkte der Form (2.56) eine Basis von X ∧ X dar.
Das äußere Produkt ∧ p X: Es sei p = 2, 3, . . . Die Gesamtheit aller endlichen Summen von
Produkten der Form

u j1 ∧ u j2 ∧ . . . ∧ u jp (2.57)

bildet einen linearen Raum über K, den man das äußere Produkt ∧ p X nennt.
Ferner setzen wir ∧0 X : = K und ∧1 X : = X.
Basissatz: Sind u1 , . . . , uk linear unabhängig in X, dann sind alle Produkte der Form (2.57)
mit j1 < j2 < · · · < j p und j1 , . . . , j p = 1, . . . , k linear unabhängig. Bildet u1 , . . . , uk eine Basis in
X, dann stellen alle Produkte der Form (2.57) eine Basis von ∧ p X dar.
Abhängigkeitskriterium: Die Elemente u1 , . . . , un in X sind genau dann linear abhängig,
wenn u1 ∧ · · · ∧ un = 0.
Die Universalität des äußeren Produkts: Es seien X und Z lineare Räume über K. Ist
M : X × · · · × X −→ Z eine antisymmetrische p-Linearform, dann gibt es eine lineare Abbildung
L : ∧ p X −→ Z mit

M ( u1 , . . . , u p ) = L ( u1 ∧ . . . ∧ u p ) für alle u j ∈ X.

Die äußere Algebra: Die äußere direkte Summe



∧( X ) := (∧ p X )
p =0

besteht aus endlichen Summen M0 + M1 + · · · von antisymmetrischen p-Linearformen M p :


X × · · · × X −→ K, für die nach 2.4.2. ein ∧-Produkt erklärt ist. Dadurch wird ∧( X ) zu einer
Algebra über K, die man die äußere Algebra des linearen Raumes X nennt.
Ist X endlichdimensional mit dim X = n, dann gilt
 
n
dim ∧ p X = und dim ∧ ( X ) = 2n .
p

 Beispiel: Für u, v, w ∈ X hat man

(2 + u) ∧ (3 + v ∧ w) = 6 + 3u + 2v ∧ w + u ∧ v ∧ w.
2.4 Multilineare Algebra 63

2.4.3.4 Die innere Algebra eines linearen Raumes (Cliffordalgebra)

Es sei X ein n-dimensionaler linearer Raum über K, und B : X × X −→ K sei eine Bilinearform
auf X. Unser Ziel ist es, eine sogenannte innere Multiplikation u ∨ w auf X zu erklären mit der
Eigenschaft

u ∨ w + w ∨ u = 2B( u, w) (2.58)

für alle u, w ∈ X. Außerdem soll

α ∨ u = u ∨ α = αu (2.59)

für alle α ∈ K und u ∈ X gelten.


Cliffordalgebren spielen eine zentrale Rolle in der modernen Physik, um den Spin von
Elementarteilchen zu beschreiben (vgl. 3.9.6.).
Existenzsatz: Es existiert eine Algebra C( X ) über K, deren Multiplikation wir mit ∨ bezeich-
nen, so dass die folgenden Bedingungen erfüllt sind:
(i) C( X ) enthält K und X, wobei (2.58) und (2.59) gelten.
(ii) Ist b1 , . . . , bn eine Basis, dann bilden die geordneten Produkte

1, b1 , . . . , bn , bi1 ∨ bi2 ∨ . . . ∨ bir , r = 2, . . . , n (2.60)

eine Basis von C( X ), falls i1 < i2 < · · · < ir und ik = 1, . . . , n für alle k ist.
Wegen (ii) lässt sich jedes Element von C( X ) als Linearkombination der Elemente aus (2.60)
mit eindeutig bestimmten Koeffizienten aus K darstellen. Die Anzahl dieser Elemente ist gleich
2n . Deshalb gilt

dim C( X ) = 2n .

Eindeutigkeitssatz: Durch (i) und (ii) ist die Algebra C( X ) bis auf Isomorphie eindeutig fest-
gelegt. Wir nennen C( X ) die Cliffordalgebra des linearen Raumes X bezüglich der Bilinearform
B (. , .).
Universalität der Cliffordalgebra: Es sei A eine Algebra über K, deren Multiplikation wir
mit ∨ bezeichnen, so dass K und X in A enthalten sind und die Multiplikationsregeln (2.58)
und (2.59) gelten.
Dann existiert ein Morphismus von C( X ) in A.
 Beispiel 1 (Quaternionen): Es sei b1 , b2 eine Basis des R2 . Dann besteht die Cliffordalgebra
C(R2 ) aus allen Ausdrücken

α + βb1 + γb2 + δb1 ∨ b2

mit α, β, γ, δ ∈ R. Die Multiplikation erfolgt nach der Regel

b j ∨ bk + bk ∨ b j = 2B( bj , bk ), j, k = 1, 2.

Die Addition geschieht in üblicher Weise.


Im Spezialfall B( b j , bk ) = −δjk gilt

b j ∨ bk + bk ∨ b j = −2δjk , j, k = 1, 2.
64 2 Algebra

Dann ist C(R2 ) isomorph zur Algebra der Quaternionen H. In klassischer Weise ergeben sich die
Quaternionen durch

α + βi + γj + δk

mit α, β, γ, δ ∈ R und den Multiplikationsregeln

i2 = j2 = k2 = −1
ij = −ji = k, jk = −kj = i, ki = −ik = j.

Den Isomorphismus von C(R2 ) auf H erhält man durch die Abbildung b1 → i, b2 → j, b1 ∨ b2 →
k.
 Beispiel 2 (Graßmannalgebra): Es sei b1 , . . . , bn eine Basis in dem linearen Raum X über K.
Wählen wir B ≡ 0, dann gilt in der Cliffordalgebra C( X ) die Multiplikationsregel

b j ∨ bk + b k ∨ b j = 0 für alle j, k = 1, . . . , n.

C( X ) ist isomorph zur Graßmannalgebra ∧( X ), falls man das Produktzeichen ∨ durch ∧ ersetzt.
 Beispiel 3 (die Diracsche Spinoralgebra): Es sei b1 , . . . , b4 eine Basis in dem komplexen linearen
Raum X. Wir wählen die Minkowskimetrik

⎨ 1 für j = k = 1, 2, 3,
g jk = −1 für j = k = 4,

0 für j = k

und setzen B(b j , bk ) := g jk . In der zugehörigen Cliffordalgebra C( X ) gilt dann die Multiplikati-
onsregel

b j ∨ bk + bk ∨ b j = 2g jk , j, k = 1, 2, 3, 4.

C( X ) ist isomorph zur Algebra M(4, 4) der komplexen (4 × 4)-Matrizen. Dieser Isomorphismus
ergibt sich durch die Abbildung b j → γ j , wobei das ∨-Produkt durch das Matrizenprodukt
ersetzt wird. Speziell hat man

γ j γk + γk γ j = 2g jk , j, k = 1, 2, 3, 4,

mit den Paulimatrizen


       
0 1 0 −i 1 0 1 0
σ1 = , σ2 = , σ3 = , σ4 = I = ,
1 0 i 0 0 −1 0 1

und den Diracschen Matrizen


   
0 −σj 0 σ4
γj = i , j = 1, 2, 3, γ4 = i .
σj 0 σ4 0

Diese Matrizen spielen eine grundlegende Rolle bei der Formulierung der Diracgleichung für
das relativistische Elektron. Aus der Diracgleichung erhält man die Existenz des Elektronenspins.

2.4.4 Liealgebren

Definition: Unter einer Liealgebra über K versteht man einen linearen Raum L über K, so
dass jedem geordneten Paar ( A, B) mit A, B ∈ L ein durch [ A, B] bezeichnetes Element aus L
zugeordnet wird, wobei für alle A, B, C ∈ L und α, β ∈ K gilt:
2.4 Multilineare Algebra 65

(i) [αA + βB, C] = α[ A, C ] + β[ B, C ],


(ii) [ A, B] = −[ B, A]
(iii) [ A, [ B, C ]] + [ B, [C, A]] + [C, [ A, B]] = 0.
Die Jacobische Identität (iii) ist der Ersatz für die fehlende Assoziativität des Lieprodukts
[ A, B].
 Beispiel 1: Bezeichnet gl( X ) die Menge aller linearen Operatoren A : X −→ X auf dem
linearen Raum X über K, dann wird gl( X ) durch

[ A, B] := AB − BA. (L)

zu einer Liealgebra über K.


 Beispiel 2: Die Menge gl(n, R ) aller reellen (n × n )-Matrizen wird bezüglich (L) zu einer
reellen Liealgebra.
Die Virasoroalgebra: Es sei C∞ (S1 ) der lineare Raum aller Funktionen f : S1 −→ C auf dem
Rand des Einheitskreises S1 := {z ∈ C : |z| = 1}, die auf einer Umgebung von S1 holomorph
sind. Wir setzen
df
L n ( f ) := − z n+1 , n = 0, ±1, ±2, . . .
dz
Bezeichnet W die komplexe lineare Hülle aller Ln , dann wird W bezüglich

[ L n , L m ] = ( n − m ) Ln + m , n, m = 0, ±1, ±2, . . .

zu einer unendlichdimensionalen komplexen Liealgebra. Es ist [ Ln , Lm ] = Ln Lm − Lm Ln .


Wir wählen einen eindimensionalen komplexen linearen Raum Y := span{ Q}. Dann wird die
äußere direkte Summe Vir := W ⊕ Y bezüglich

n3 − n
[ Ln , Lm ] = (n − m) Ln+m + δn,−m Q, n, m = 0, ±1, . . . , (Vir)
12
[ Ln , Q] = 0

zu einer unendlichdimensionalen komplexen Liealgebra, die man die Virasoroalgebra nennt und
auch als zentrale Erweiterung von W bezeichnet.
Die Virasoroalgebra spielt eine wichtige Rolle in der modernen Stringtheorie (vgl. 19.13).
Zahlreiche wichtige Liealgebren und ihre Anwendungen auf die Geometrie und moderne
Elementarteilchenphysik findet man in Kapitel 17.

2.4.5 Superalgebren

Unter einer Superalgebra versteht man eine Algebra A mit der Zerlegung A = A 0 ⊕ A1 und
der Eigenschaft, dass das Produkt in A die Graduierung respektiert, d. h., es gilt:
(a) Aus u, v ∈ A0 folgt uv ∈ A0 .
(b) Aus u, v ∈ A 1 folgt uv ∈ A 1 .
(c) Aus u ∈ A 0 , v ∈ A 1 oder u ∈ A 1 , v ∈ A0 folgt uv ∈ A1 .
Eine derartige Superalgebra heißt genau dann superkommutativ, wenn gilt

uv = (−1) jk vu für alle u ∈ A j , v ∈ A k , j, k = 0, 1.


66 2 Algebra

Superkommutative Superalgebren spielen eine wichtige Rolle in der modernen supersymme-


trischen Elementarteilchentheorie (vgl. 19.14). Dann entsprechen die kommutativen Größen aus
A0 den Bosonen (Teilchen mit ganzzahligem Spin, z. B. Photonen) und die antikommutativen
Größen aus A1 gehören zu Fermionen (Teilchen mit halbzahligem Spin, z. B. Elektronen).
 Beispiel: Die Graßmannalgebra wird durch die Graduierung
⎛ ⎞

 ∞

2p+1
∧( X ) = ∧ (X ) ⊕ ⎝
2p
∧ X⎠ .
p =0 p= 0

zu einer superkommutativen Superalgebra.

2.5 Algebraische Strukturen

Reelle Zahlen kann man addieren und multiplizieren. Derartige Operationen lassen sich jedoch
auch für viele andere mathematische Objekte erklären. Das führt auf die Begriffe Gruppe, Ring
und Körper, die sich im Zusammenhang mit der Lösung algebraischer Gleichungen und der
Lösung zahlentheoretischer und geometrischer Probleme im 19. Jahrhundert herauskristallisiert
haben.

2.5.1 Gruppen

Gruppen sind Mengen, in denen ein Produkt gh erklärt ist. Man benutzt Gruppen, um das
Phänomen der Symmetrie mathematisch zu beschreiben.

Definition: Unter einer Gruppe G versteht man eine Menge, in der jedem geordneten Paar
( g, h) von Elementen g und h aus G ein gh bezeichnetes Element aus G zugeordnet wird, so dass
gilt:
(i) g( hk) = ( gh) k für alle g, h, k ∈ G (Assoziativgesetz).
(ii) Es gibt genau ein Element e mit eg = ge = g für alle g ∈ G (neutrales Element).
(iii) Zu jedem g ∈ G existiert genau ein Element h ∈ G mit gh = hg = e. Anstelle von h
schreiben wir g−1 (inverses Element).
Eine Gruppe heißt genau dann kommutativ (oder Abelsch), wenn das Kommutativgesetz
gh = hg für alle g, h ∈ G gilt.
 Beispiel 1 (Zahlengruppen): Die Menge aller von null verschiedenen reellen Zahlen bildet
bezüglich der Multiplikation eine kommutative Gruppe, die man die multiplikative Gruppe der
reellen Zahlen nennt.
 Beispiel 2 (Matrizengruppen): Die Menge GL(n, R ) aller reellen (n × n)-Matrizen A mit nicht-
verschwindender Determinante bildet bezüglich der Matrizenmultiplikation AB eine Gruppe,
die für n ≥ 2 nichtkommutativ ist. Das neutrale Element entspricht der Einheitsmatrix E.

Symmetrie (Drehgruppe): Die Menge D aller Drehungen des dreidimensionalen Raumes


um einen festen Punkt O bildet eine nichtkommutative Gruppe, die man die dreimensionale
Drehgruppe nennt. Das neutrale Element ist diejenige Transformation, die alle Punkte fest lässt,
während das inverse Element der inversen Drehung entspricht.
Die anschauliche Symmetrie einer Kugel K mit dem Mittelpunkt O kann gruppentheoretisch
dadurch beschrieben werden, dass K unter allen Elementen (Drehungen) von D in sich überführt
wird.
2.5 Algebraische Strukturen 67

Transformationsgruppen: Ist X eine nichtleere Menge, dann bilden alle bijektiven Abbildun-
gen g : X −→ X eine Gruppe G ( X ). Die Gruppenmultiplikation entspricht der Hintereinander-
ausführung der Abbildungen, d. h., für g, h ∈ G ( X ) und alle x ∈ X gilt

( gh)( x ) := g(h( x )).

Dem neutralen Element entspricht die identische Abbildung id : X −→ X mit id( x ) = x für alle
x ∈ X. Ferner repräsentiert das inverse Element g−1 die zu g inverse Abbildung (vgl. 4.3.3).

Permutationsgruppen: Es sei X = {1, . . . , n}. Die Menge aller bijektiven Abbildungen


π : X −→ X bezeichnet man als die symmetrische Gruppe S n . Man nennt S n auch die Permutati-
onsgruppe von n Elementen. Jedes Element π von S n kann man durch ein Symbol
 
1 2 ... n
π=
i1 i 2 . . . i n
beschreiben, was besagt, dass k in ik übergeht, d. h., es ist π ( k) = ik für alle k. Das Produkt
zweier Permutationen π2 π1 entspricht der Hintereinanderausführung der beiden Permutationen,
d. h. zunächst wird π1 und dann wird π2 ausgeführt. Das neutrale Element e und das inverse
Element π −1 ergeben sich durch
   
1 2 ... n i1 i 2 . . . i n
e= und π −1 = .
1 2 ... n 1 2 ... n
Im Spezialfall n = 3 erhält man beispielsweise für
   
1 2 3 1 2 3
π2 = , π1 =
1 3 2 3 2 1
das Produkt
 
1 2 3
π2 π1 = ,
2 3 1
denn π1 bildet 1 in 3 und π2 bildet 3 in 2 ab, d. h. (π2 π1 )(1) = π2 ( π1 (1)) = π2 (3) = 2. Für
n ≥ 3 ist S n nicht kommutativ.

Transposition: Unter einer Transposition ( km) mit k = m versteht man eine Permutation, die
k in m und m in k überführt, während alle übrigen Elemente fest bleiben. Jede Permutation π
kann als Produkt von r Transpositionen geschrieben werden, wobei r stets entweder gerade oder
ungerade ist. Deshalb können wir das Vorzeichen von π durch
sgn π : = (−1)r
definieren. Für π1 , π2 ∈ S n gilt

sgn ( π1 π2 ) = sgn π1 sgn π2 . (2.61)

Im Sinne von 2.5.1.2 bedeutet dies, dass die Abbildung π → sgn π einen Morphismus der
Permutationsgruppe S n in die multiplikative Gruppe der reellen Zahlen darstellt.
Die Permutation π heißt genau dann gerade (bzw. ungerade), wenn sgn π = 1 (bzw. sgn π =
−1) gilt. Jede Transposition ist ungerade.

Zyklen: Mit ( abc ) bezeichnen wir eine Permutation, die a in b, b in c und c in a überführt.
Analog werden Zyklen (z1 z2 . . . zk ) erklärt. Jede Permutation π lässt sich (bis auf die Reihenfolge)
eindeutig als Produkt von Zyklen schreiben. Beispielsweise erhält man die 3! = 6 Elemente von
S3 durch
(1), (12), (13), (23), (123), (132).
68 2 Algebra

2.5.1.1 Untergruppen

Definition: Eine Teilmenge von H einer Gruppe G heißt genau dann eine Untergruppe, wenn
H (bezüglich der von G induzierten Multiplikation) eine Gruppe darstellt. Das ist äquivalent
dazu, dass aus g, h ∈ H stets gh−1 ∈ H folgt.

Normalteiler: Unter einem Normalteiler H von G versteht man eine Untergruppe H von G mit
der zusätzlichen Eigenschaft:

ghg−1 ∈ H für alle g ∈, h ∈ H.

Die Gruppe G selbst und {e } sind stets Normalteiler von G, die man triviale Normalteiler von G
nennt.
Jede Untergruppe einer kommutativen Gruppe ist ein Normalteiler.

Einfachheit: Eine Gruppe G heißt genau dann einfach, wenn sie nur triviale Normalteiler
besitzt.
 Beispiel 1: Alle positiven reellen Zahlen bilden eine Untergruppe (und einen Normalteiler)
der multiplikativen Gruppe aller von null verschiedenen reellen Zahlen.
Unter der Ordnung ord G einer endlichen Gruppe G versteht man die Anzahl ihrer Elemente.

Ordnungssatz von Lagrange: Die Ordnung jeder Untergruppe einer endlichen Gruppe ist
ein Teiler der Gruppenordnung.
 Beispiel 1 (Permutationen): Die geraden Permutationen von Sn bilden eine Untergruppe A n
von S n , die man alternierende n-Gruppe nennt. Für n ≥ 2 gilt:

2ord A n = ord S n = n!.

A n ist ein Normalteiler von S n .


(i) Die Gruppe S 2 besteht aus den Elementen (1), (12) und besitzt nur die trivialen Normalteiler
A2 = (1) und S2 .
(ii) Alle sechs Untergruppen von S3 lauten:

S3 :(1), (12), (13), (23), (123), (132), E : (1),


A3 : (1), (123), (132),
S2 : (1), (12), S 2 : (1), (13), S2 : (1), (23).

Dabei ist A3 der einzige nichttriviale Normalteiler von S3 .


(iii) S4 besitzt A4 und die kommutative Kleinsche Vierergruppe

K 4 : (1), (12)(34), (13)(24), (14)(23)

als nichttriviale Normalteiler.


(iv) Für n ≥ 5 ist A n der einzige nichttriviale Normalteiler von S n , und A n ist einfach.
2.5 Algebraische Strukturen 69

Additive Gruppen: Unter einer derartigen Gruppe versteht man eine Menge G, in der jedem
geordneten Paar ( g, h) von Elementen g und h aus G ein mit g + h bezeichnetes Element aus G
zugeordnet wird, so dass gilt:
(i) g + (h + k) = ( g + h) + k für alle g, h, k ∈ G (Assoziativgesetz).
(ii) Es gibt genau ein Element 0 mit 0 + g = g + 0 = g für alle g ∈ G (Neutrales Element).
(iii) Zu jedem g ∈ G existiert genau ein Element h ∈ G mit g + h = h + g = 0. Anstelle von h
schreiben wir − g (inverses Element).
(iv) g + h = h + g für alle g, h ∈ G (Kommutativität).
Somit stellt eine additive Gruppe eine kommutative Gruppe dar, wobei a + b anstelle von ab
geschrieben und das neutrale Element mit 0 bezeichnet wird.
 Beispiel 2: Die Menge R der reellen Zahlen ist eine additive Gruppe. Die Menge Z der ganzen
Zahlen ist eine additive Untergruppe von R.
 Beispiel 3: Jeder lineare Raum stellt eine additive Gruppe dar.

2.5.1.2 Morphismen von Gruppen

Definition: Unter einem Morphismus26 zwischen den beiden Gruppen G und H versteht man
eine Abbildung ϕ : G −→ H, die die Gruppenoperation respektiert, d. h., es ist

ϕ( gh) = ϕ( g) ϕ( h) für alle g, h ∈ G.

Genau die bijektiven Morphismen heißen Isomorphismen.


Zwei Gruppen G und H heißen genau dann isomorph, wenn es einen Isomorphismus ϕ :
G −→ H gibt. Isomorphe Gruppen besitzen die gleiche Struktur und können miteinander
identifiziert werden.
Surjektive (bzw. injektive) Morphismen werden auch Epimorphismen (bzw. Monomorphismen)
genannt. Unter einem Automorphismus einer Gruppe G versteht man einen Isomorphismus von
G auf sich selbst.
 Beispiel 1: Die Gruppe G := {1, −1} ist isomorph zur Gruppe H : = { E, − E} mit
 
1 0
E := .
0 1
Der Isomorphismus ϕ : G −→ H wird durch ϕ (±1) := ± E gegeben.

Die Symmetrien einer Gruppe: Bezüglich der Hintereinanderausführung bilden alle Auto-
morphismen von G eine Gruppe, die man die Automorphismengruppe Aut( G ) von G nennt.
Diese Gruppe beschreibt die Symmetrien von G.

Innere Automorphismen: Es sei g ein festes Element der Gruppe G. Wir setzen
−1
ϕ g (h) := ghg für alle h ∈ G.
Dann ist ϕ g : G −→ G ein Automorphismus von G. Genau die so konstruierten Automorphismen
heißen innere Automorphismen von G.
Die inneren Automorphismen von G bilden eine Untergruppe von Aut( G ). Eine Untergruppe
H von G ist genau dann ein Normalteiler von G, wenn sie durch alle inneren Automorphismen
von G in sich abgebildet wird.
26
In der älteren Literatur werden Morphismen auch als Homomorphismen bezeichnet. Der Begriff des Morphismus wird in
der modernen Mathematik im Rahmen der Kategorientheorie auf beliebige Strukturen angewandt (vgl. 17.2.4).
70 2 Algebra

Faktorengruppe: Es sei N ein Normalteiler der Gruppe G. Für g, h ∈ G schreiben wir genau
dann

g∼h

wenn gh−1 ∈ N gilt. Das ist eine Äquivalenzrelation auf der Gruppe G (vgl. 4.3.5.1). Die
zugehörigen Äquivalenzklassen [ g] werden durch

[ g][ f ] := [ g f ]

zu einer Gruppe, die man die Faktorgruppe G/N nennt.27 Im Fall einer additiven Gruppe G
schreiben wir g ∼ h genau dann, wenn g − h ∈ N gilt. Dann ergibt sich G/N aus [ g] + [ h] :=
[ g + h ].
 Beispiel 2: Es sei G die multiplikative Gruppe der reellen Zahlen, und es sei N : = { x ∈ R | x >
0}. Dann gilt g ∼ h genau dann, wenn g und h das gleiche Vorzeichen besitzen. Somit besteht
G/N aus den beiden Elementen [1] und [−1] mit der Multiplikationsregel [1][−1] = [−1] usw.
Das bedeutet, dass G/N isomorph zur Gruppe {1, −1} ist.
Ist N ein Normalteiler der endlichen Gruppe G, dann gilt:

ord G
ord ( G/N ) = .
ord N

Die Bedeutung der Faktorgruppe besteht darin, dass sie (bis auf die Isomorphie) alle epimor-
phen Bilder von G beschreiben, wie der folgende Satz zeigt.

Morphismensatz28 für Gruppen:


(i) Ist ϕ : G −→ H ein Epimorphismus der Gruppe G, dann stellt der sogenannte Kern
ker ϕ := ϕ−1 (e) einen Normalteiler von G dar, und man erhält die Isomorphie

H∼
= G/ ker ϕ.

(ii) Ist umgekehrt N ein Normalteiler von G, dann ergibt sich durch

ϕ( g) := [ g]

ein Epimorphismus ϕ : G −→ G/N mit ker ϕ = N.


Speziell ist eine Gruppe G genau dann einfach, wenn jedes epimorphe Bild von G isomorph
zu G oder zu {e} ist, d. h., G besitzt nur triviale epimorphe Bilder.
 Beispiel 3: Es sei Z die additive Gruppe der ganzen Zahlen. Eine Gruppe H ist genau dann
epimorphes Bild von Z, wenn sie zyklisch ist (vgl. 2.5.1.3).

Erster Isomorphiesatz für Gruppen: Ist N ein Normalteiler der Gruppe G und ist H eine
Untergruppe von G, dann ist N ∩ H ein Normalteiler von G, und man hat die Isomorphie:

HN/N ∼
= H/( H ∩ N ).

Dabei setzen wir HN := { hg | h ∈ H, g ∈ N }.


27
Die Definition von [ g ][ f ] hängt nicht von der Wahl der Repräsentanten g und f ab.
28
Dieser Satz wird auch als Homomormorphiesatz für Gruppen bezeichnet.
2.5 Algebraische Strukturen 71

Zweiter Isomorphiesatz für Gruppen: Es seien N und H Normalteiler der Gruppe G mit
N ⊆ H ⊆ G. Dann ist H/N ein Normalteiler von G/N, und man erhält die Isomorphie:

G/H ∼
= ( G/N )/( H/N ).

2.5.1.3 Zyklische Gruppen

Eine Gruppe G heißt genau dann zyklisch, wenn sich jedes g ∈ G in der Form

g = an , n = 0, ±1, . . . .

darstellen lässt.29 Dabei heißt a das erzeugende Element von G.


(i) Gilt an = e für alle natürlichen Zahlen n ≥ 1, dann besteht G aus unendlich vielen
Elementen.
(ii) Gilt an = e für eine natürliche Zahl n ≥ 1, dann besteht G aus endlich vielen Elementen.
Zu jeder natürlichen Zahl m ≥ 1 gibt es eine zyklische Gruppe der Ordnung m.
Zwei zyklische Gruppen sind genau dann isomorph, wenn sie die gleiche (endliche oder
unendliche) Anzahl von Elementen besitzen. Der Isomorphismus ergibt sich dann durch an → bn ,
wobei a und b die entsprechenden erzeugenden Elemente sind.

Satz: (a) Jede zyklische Gruppe ist kommutativ.


(b) Jede endliche Gruppe von Primzahlordnung ist zyklisch.
(c) Zwei endliche Gruppen der gleichen Primzahlordnung sind zyklisch und zueinander
isomorph.
 Beispiel 1: Eine zyklische Gruppe der Ordnung 2 besteht aus den beiden Elementen e und a
mit

a2 = e.

Dann gilt a−1 = a. Eine zyklische Gruppe der Ordnung 3 besteht aus den Elementen e, a, a2 ,
wobei a3 = e gilt. Daraus folgt a−1 = a2 und a−2 = a.
 Beispiel 2: Die additive Gruppe Z der ganzen Zahlen ist eine unendliche additive zyklische
Gruppe, die von 1 erzeugt wird.
 Beispiel 3: Eine additive zyklische Gruppe der Ordnung m ≥ 2 erhalten wir durch die Symbole
0, a, 2a, . . . , ( m − 1) a, mit denen wir in üblicher Weise unter Beachtung von a = 0 und

ma = 0

rechnen.30

Der Hauptsatz über additive Gruppen: Es sei G eine additive Gruppe mit endlich vielen
Erzeugenden a1 , . . . , as ∈ G, d. h., jedes G lässt sich als Linearkombination m1 a1 + · · · + mr ar mit
ganzzahligen Koeffizienten m j darstellen. Dann ist G die direkte Summe31

G = G1 ⊕ G2 ⊕ . . . ⊕ Gr ⊕ Gr+1 ⊕ . . . ⊕ Gs

29
Wir setzen a0 := e, a−2 := ( a−1 )2 usw.
30
Diese Gruppe ist isomorph zur Gaußschen Restklassengruppe Z/mZ (vgl. 2.5.2).
31
Jedes g ∈ G besitzt eine eindeutige Zerlegung g = g1 + · · · + gs mit gj ∈ Gj für alle j.
72 2 Algebra

von (endlich vielen) additiven zyklischen Gruppen Gj . Dabei gilt:


(i) G1 , . . . , Gr ist isomorph zu Z.
(ii) Gr+1 , . . . , Gr+s ist zyklisch von der (entsprechenden) endlichen Ordnung τr +1 , . . . , τr +s ,
wobei τj ein Teiler von τj+1 für alle j ist.
Man bezeichnet r als Rang von G, und τr+1 , . . . , τr +s heißen die Torsionskoeffizienten von G.
Zwei additive Gruppen mit endlich vielen Erzeugenden sind genau dann isomorph, wenn sie
den gleichen Rang und die gleichen Torsionskoeffizienten besitzen.
In der klassischen kombinatorischen Topologie ist G eine Bettische Gruppe (Homologiegruppe).
Dann heißt r auch die Bettische Zahl von G.

2.5.1.4 Auflösbare Gruppen

Auflösbare Gruppen: Eine Gruppe G heißt genau dann auflösbar, wenn es eine Folge

G0 ⊆ G1 ⊆ . . . ⊆ Gn−1 ⊆ Gn := G

von Untergruppen Gj in G gibt mit G0 = {e} und Gn := G, wobei für alle j gilt:

Gj ist Normalteiler von Gj+1 und Gj+1 /Gj ist kommutativ.

 Beispiel 1: Jede kommutative Gruppe ist auflösbar.


 Beispiel 2 (Permutationsgruppe) :
(i) Die kommutative Gruppe S 2 ist auflösbar.
(ii) Die Gruppe S3 ist auflösbar. Man wähle {e} ⊆ A 3 ⊆ S 3 .
(iii) Die Gruppe S4 ist auflösbar. Man wähle {e} ⊆ K4 ⊆ A4 ⊆ S4 .
Man beachte ord(A 3 ) = 3, ord(S j /A j ) = 2 und ord(A4 /K4 ) = 3. Das sind Primzahlen.
Deshalb sind alle diese Gruppen zyklisch und somit kommutativ.
(iv) Die Gruppe S n ist für n ≥ 5 nicht auflösbar. Das beruht wesentlich auf der Einfachheit
von A5 .
Diese Aussagen sind aufgrund der Galoistheorie dafür verantwortlich, dass Gleichungen vom
Grad ≥ 5 nicht durch geschlossene Formeln darstellbar sind (vgl. 2.6.5).

2.5.2 Ringe

In einem Ring sind eine Summe a + b und ein Produkt ab erklärt. In Ringen kann man eine
Teilbarkeitslehre aufbauen (vgl. 2.7.11).

Definition: Eine Menge R heißt genau dann ein Ring, wenn R eine additive Gruppe ist und
jedem geordneten Paar ( a, b) mit a, b ∈ R ein durch ab bezeichnetes Element von R zugeordnet
wird, so dass für alle a, b, c ∈ R gilt:
(i) a(bc) = ( ab)c (Assoziativgesetz).
(ii) a(b + c) = ab + ac und ( b + c) a = ba + ca (Distributivgesetze).
Der Ring R heißt genau dann kommutativ, wenn ab = ba für alle a, b ∈ R gilt.
Besitzt R ein Element e mit ae = ea = a für alle a ∈ R, dann ist e durch diese Eigenschaft
eindeutig bestimmt und heißt das Einselement von R.
Der Ring R heißt genau dann nullteilerfrei, wenn aus ab = 0 stets a = 0 oder b = 0 folgt.
2.5 Algebraische Strukturen 73

Integritätsbereiche: Genau die kommutativen nullteilerfreien Ringe heißen Integritätsberei-


che.
 Beispiel 1: Die Menge Z aller ganzen Zahlen bildet einen Integritätsbereich mit Einselement.
 Beispiel 2: Die Menge aller reellen (n × n)-Matrizen bildet einen Ring mit der Einheitsmatrix
als Einselement. Für n ≥ 2 ist dieser Ring weder nullteilerfrei noch kommutativ. Beispielsweise
ist für n = 2 das Produkt
    
0 1 1 0 0 0
=
0 0 0 0 0 0
gleich null, aber die beiden Faktoren links sind ungleich null.

Unterringe: Eine Teilmenge U eines Rings R heißt genau dann ein Unterring von R, wenn U
(bezüglich der durch R induzierten Operationen) selbst ein Ring ist. Das ist äquivalent dazu,
dass aus a, b ∈ U stets a − b ∈ U und ab ∈ U folgt.

Ideale: Eine Teilmenge J des Ringes R heißt genau dann ein Ideal, wenn J ein Unterring ist
mit der zusätzlichen Eigenschaft:

Aus r ∈ R und a∈J folgt ra, ar ∈ J.

 Beispiel 3: Alle Ideale in Z erhält man durch mZ := {mz | z ∈ Z } mit einer beliebigen
natürlichen Zahl m.

Polynomring P[ x]: Es sei P ein Ring. Durch P[ x ] bezeichnen wir die Gesamtheit aller Aus-
drücke der Form
a 0 + a 1 x + a2 x 2 + . . . + a k x k
mit k = 0, 1, . . . und ak ∈ P für alle k. Bezüglich der üblichen Addition und Multiplikation wird
P[ x ] zu einem Ring.
Ist P ein Integritätsbereich, dann hat auch der Polynomring P[ x ] diese Eigenschaft.

Morphismen eines Ringes: Unter einem Morphismus ϕ : R −→ S zwischen den beiden


Ringen R und S versteht man eine Abbildung, die die Ringoperationen respektiert, d. h., es gilt

ϕ( ab) = ϕ( a) ϕ( b) und ϕ ( a + b) = ϕ( a) + ϕ(b) für alle a, b ∈ R.

Genau die bijektiven Morphismen heißen Isomorphismen. Man kann isomorphe Ringe miteinan-
der identifizieren.
Surjektive (bzw. injektive) Morphismen heißen auch Epimorphismen (bzw. Monomorphismen).
Isomorphismen eines Ringes auf sich werden Automorphismen genannt.

Faktorringe: Es sei J ein Ideal des Ringes R. Für a, b ∈ R schreiben wir genau dann
a∼c
wenn a − c ∈ J gilt. Das ist eine Äquivalenzrelation auf dem Ring R (vgl. 4.3.5.1). Die zugehörigen
Äquivalenzklassen [ a] werden durch

[ a][b] := [ ab] und [ a] + [b] := [ a + b]

zu einem Ring, den man den Faktorring R/J nennt.32


32
Die Definition von [ a][b] und [ a] + [b] hängt nicht von der Wahl der Repräsentanten a und b ab.
74 2 Algebra

Der Gaußsche Restklassenring Z/mZ: Es sei Z die additive Gruppe der ganzen Zahlen,
und es sei m ∈ Z mit m > 0. Wir wählen das Ideal mZ. Dann gilt

z∼w

genau dann, wenn z − w ∈ mZ zutrifft, d. h., die Differenz z − w ist durch m teilbar. Mit Gauß
schreiben wir dafür auch33

z ≡ w mod m.

Für die Restklassen hat man genau dann [ z] = [w], wenn die Differenz z − w durch m teilbar
ist. Der Restklassenring Z/mZ besteht aus genau den m Klassen

[0], [1], . . . , [ m − 1],

mit denen gemäß

[ a ] + [ b ] = [ a + b ], und [ a][b] = [ ab]

gerechnet wird.
 Beispiel 4: Für m = 2 besteht Z/2Z aus den beiden Restklassen [0] und [1]. Es ist genau dann
[z] = [w], wenn z − w durch 2 teilbar ist. Somit entspricht [0] (bzw. [1]) der Menge der geraden
(bzw. ungeraden) ganzen Zahlen. Alle möglichen Operationen in Z/2Z lauten:

[ 1 ] + [ 1 ] = [2 ] = [ 0 ] , [ 0 ] + [ 0 ] = [ 0 ] , [ 0 ] + [ 1 ] = [ 1 ] + [ 0 ] = [ 1 ] ,
[1][1] = [1], [0][1] = [1][0] = [0][0] = [0].

Für m = 3 besteht Z/3Z aus den drei Restklassen [0], [1], [2]. Es gilt genau dann [z] = [w],
wenn die Differenz z − w durch 3 teilbar ist. Beispielsweise erhält man

[2][2] = [4] = [1].

Für m = 4 besteht Z/4Z aus den Restklassen [0], [1], [2], [3]. Aus der Zerlegung 4 = 2 · 2
folgt [2][2] = [4] und somit

[2][2] = [0],

d. h., Z/4Z besitzt Nullteiler.


Der Restklassenring Z/mZ mit m ≥ 2 ist genau dann nullteilerfrei, wenn m eine Primzahl ist.
In diesem Fall ist Z/mZ sogar ein Körper.
Der folgende Satz zeigt, dass man alle Epimorphismen eines Ringes R konstruieren kann,
wenn man alle seine Ideale kennt.

Morphismensatz34 für Ringe:


(i) Ist ϕ : R −→ S ein Epimorphismus des Ringes R, dann stellt der sogenannte Kern
ker ϕ := ϕ−1 (0) ein Ideal von R dar, und S ist isomorph zum Faktorring R/ ker ϕ.
(ii) Ist umgekehrt J ein Ideal von R, dann ergibt sich durch

ϕ( a) : = [ a ]

ein Epimorphismus ϕ : R −→ R/J mit ker ϕ = J.


33
Lies: z ist kongruent w modulo m.
34
Dieser Satz heißt auch Homomorphiesatz.
2.5 Algebraische Strukturen 75

2.5.3 Körper

Körper sind Mengen, in denen eine Addition a + b und eine Multiplikation ab erklärt sind,
wobei die für reelle Zahlen üblichen algebraischen Regeln gelten. In einem gewissen Sinne
sind Körper die perfektesten algebraischen Strukturen. Ein zentrales Thema der Körpertheorie
stellen die Körpererweiterungen dar. Die Galoistheorie führt die Untersuchung von algebraischen
Gleichungen auf Körpererweiterungen und deren Symmetriegruppen zurück.

Definition: Eine Menge K heißt genau dann ein Schiefkörper, wenn gilt:
(i) K ist eine additive Gruppe mit dem Nullelement 0.
(ii) K \ {0} ist eine multiplikative Gruppe mit dem Einselement e.
(iii) K ist ein Ring.
Unter einem Körper verstehen wir einen Schiefkörper mit kommutativer Multiplikation.
Gleichungen: Es sei K ein Schiefkörper. Gegeben seien a, b, c, d ∈ K mit a = 0. Dann besitzen
die Gleichungen

ax = b, ya = b, c + z = d, z+c = d

eindeutig Lösungen in K, die durch x = a−1 b, y = ba−1 und z = d − c gegeben sind.

Unterkörper: Eine Teilmenge U eines Schiefkörpers K heißt genau dann ein Unterkörper von
K, wenn U (bezüglich der durch K induzierten Operationen) ein Schiefkörper ist.
Ein Unterkörper von K heißt genau dann echt, wenn er ungleich {e} und ungleich K ist.

Charakteristik: Ein Schiefkörper K besitzt definitionsgemäß genau dann die Charakteristik


null, wenn

ne = 0 für alle n = 1, 2, . . .

gilt. Ein Schiefkörper besitzt genau dann die Charakteristik m > 0, wenn

me = 0 und ne = 0 für n = 1, . . . , m − 1

gilt. In diesem Fall ist m stets eine Primzahl.


 Beispiel 1: Die Menge R der reellen Zahlen und die Menge Q der rationalen Zahlen sind
Körper der Charakteristik null; Q ist ein Unterkörper von R.
 Beispiel 2: Es sei p ≥ 2 eine Primzahl. Dann ist der Gaußsche Restklassenring Z/pZ ein
Körper der Charakteristik p (vgl. 2.5.2).

Morphismen von Schiefkörpern: Unter einem Morphismus ϕ : K −→ M von dem Schiefkör-


per K in den Schiefkörper M versteht man einen Morphismus der entsprechenden Ringe. Für
alle a, b, c ∈ K gilt dann

ϕ ( a + b ) = ϕ ( a ) + ϕ ( b ), ϕ( ab) = ϕ( a) ϕ( b), ϕ ( c − 1 ) = ϕ ( c ) −1 ,

falls c = 0 existiert. Ferner ist ϕ(e ) = e und ϕ(0) = 0.


Genau die bijektiven Morphismen heißen Isomorphismen. Man kann isomorphe Schiefkörper
miteinander identifizieren.
Surjektive (bzw. injektive) Morphismen heißen auch Epimorphismen (bzw. Monomorphismen).
Isomorphismen eines Körpers auf sich selbst werden Automorphismen genannt.
76 2 Algebra

Primkörper: Ein Schiefkörper heißt genau dann ein Primkörper, wenn er keinen echten
Unterkörper besitzt.
(i) In jedem Schiefkörper gibt es genau einen Unterkörper, der Primkörper ist.
(ii) Dieser Primkörper ist isomorph zu Q oder zu Z/pZ (p beliebige Primzahl).
(ii) Die Charakteristik eines Schiefkörpers ist gleich 0 (bzw. p), wenn sein Primkörper isomorph
zu Q (bzw. Z/pZ) ist.

Galoisfelder: Genau die endlichen Schiefkörper heißen Galoisfelder.


Jedes Galoisfeld ist ein Körper.
Zu jeder Primzahl p und zu n = 1, 2, . . . gibt es einen Körper mit pn Elementen. Auf diese
Weise erhält man alle Galoisfelder.
Zwei Galoisfelder sind genau dann isomorph, wenn sie die gleiche Anzahl von Elementen
besitzen.
Komplexe Zahlen: Wir wollen zeigen, wie man nach dem Vorbild von Hamilton (1805–1865)
algebraische Objekte konstruieren kann, die die Theorie der komplexen Zahlen auf eine gesicherte
Grundlage stellen. Mit C bezeichnen wir die Gesamtheit aller geordneten Paar ( a, b) mit a, b ∈ R.
Durch die Operationen

( a, b) + (c, d) := ( a + c, b + d)

und

( a, b)(c, d) := ( ac − bd, ad + bc)

wird C zu einem Körper. Setzen wir

i := (0, 1),

dann gilt i2 = (−1, 0). Für jedes Element ( a, b ) aus C hat man die eindeutige Zerlegung

( a, b) = ( a, 0) + (b, 0)i.

Die Abbildung ϕ( a) := ( a, 0) ist ein Monomorphismus von R in C. Deshalb können wir a ∈ R


mit ( a, 0) identifizieren. In diesem Sinne kann jedes Element ( a, b) aus C eindeutig in der Form

a + bi

mit a, b ∈ R geschrieben werden. Speziell gilt

i2 = −1.

Damit ist der Anschluss an die übliche Notation hergestellt, und C enthält R als Unterkörper.

Quaternionen: Die Menge H der Quaternionen α + βi + γj + δk mit α, β, γ, δ ∈ R ist ein


Schiefkörper, der den Körper C der komplexen Zahlen als Unterkörper enthält. Für α2 + β2 +
γ2 + δ2 = 0 erhält man das inverse Element durch
α − βi − γj − δk
(α + βi + γj + δk)−1 =
α 2 + β 2 + γ2 + δ 2
(vgl. Beispiel 1 in 2.4.3.4).
2.5 Algebraische Strukturen 77

Quotientenkörper Q(P ): Es sei P ein Integritätsbereich, der nicht nur aus dem Nullelement
besteht (vgl. 2.5.2). Dann gibt es einen Körper Q ( P) mit den beiden folgenden Eigenschaften:
(i) P ist in Q( P) enthalten.
(ii) Ist P in dem Körper K enthalten, dann ist der kleinste Unterkörper von K, der P enthält,
isomorph zu Q( P).
Explizit ergibt sich Q( P) in folgender Weise. Wir betrachten alle geordneten Paare ( a, b) mit
a, b ∈ P und b = 0. Wir schreiben
( a, b) ∼ (c, d) genau dann, wenn ad = bc
gilt. Das ist eine Äquivalenzrelation (vgl. 4.3.5.1). Die Menge Q( P) der zugehörigen Äquivalenz-
klassen [( a, b)] bildet bezüglich der Operationen
[( a, b)][(c, d)] := [( ac, bd)],
[( a, b)] + [(c, d)] = [( ad + bc, bd)]
a
einen Körper.35 Anstelle von [( a, b)] schreibt man auch . Dann besteht Q( P) aus genau allen
b
Symbolen

a
b

mit a, b ∈ P und b = 0, wobei mit diesen Symbolen wie mit Brüchen gerechnet wird, d. h., es gilt
a c
= genau dann, wenn ad = bc
b d
und
ac ac a c ad + bc
= , + = .
bd bd b d bd
ar
Wählen wir ein r aus P mit r = 0 und setzen wir ϕ( a) := , dann ergibt sich ein Monomorphis-
r
mus ϕ : P −→ Q( P), der unabhängig von der Wahl von r ist. In diesem Sinne können wir die
ar r
Elemente a von P mit identifizieren. Dann ist gleich dem Einselement in Q( P) und
r r

a
= ab−1 .
b

Wie bei der Einführung der komplexen Zahlen wird der scheinbar komplizierte Weg über die
Restklassen [( a, b)] nur gewählt, um sicherzustellen, dass das formale Rechnen mit den Brüchen
a
nicht zu Widersprüchen führt.
b
 Beispiel 3: Der Quotientenkörper zum Integritätsbereich Z der ganzen Zahlen ist der Körper
Q der rationalen Zahlen.
 Beispiel 4: Es sei P[ x ] der Polynomring über dem Integritätsbereich P = {0}. Dann ist der
zugehörige Quotientenkörper R P [ x ] zu P( x ) gleich dem Körper der rationalen Funktionen mit
Koeffizienten in P, d. h., die Elemente von R P [ x ] sind Quotienten
p( x)
q( x )
von Polynomen p( x ) und q( x ) mit Koeffizienten in P (vgl. 2.5.2), wobei q = 0 gilt, d. h. q( x ) ist
nicht das Nullpolynom.
35
Diese Operationen sind von der Wahl der Repräsentanten unabhängig.
78 2 Algebra

2.6 Galoistheorie und algebraische Gleichungen

Das Pariser Milieu mit seiner intensiven mathematischen Tätigkeit brachte


um 1830 mit Evariste Galois ein Genie ersten Ranges hervor, das wie ein
Komet ebenso plötzlich verschwand, wie es erschienen war.36
Dirk J. Struik

2.6.1 Die drei berühmten Probleme der Antike

In der griechischen Mathematik des Altertums gab es drei berühmte Probleme, deren Unlösbar-
keit erst im 19. Jahrhundert gezeigt wurde:
(i) die Quadratur des Kreises,
(ii) das Delische Problem der Würfelverdopplung
(iii) und die Dreiteilung eines beliebigen Winkels.
In allen drei Fällen sind nur Konstruktionen mit Zirkel und Lineal erlaubt. In (i) ist ein Quadrat
zu konstruieren, dessen Flächeninhalt gleich dem Flächeninhalt eines gegebenen Kreises ist.
In (ii) soll aus einem gegebenen Würfel die Kantenlänge eines neuen Würfels mit doppeltem
Volumen konstruiert werden.37
Daneben spielte in der Antike die Frage nach der Konstruierbarkeit regelmäßiger Vielecke mit
Zirkel und Lineal eine wichtige Rolle.
Alle diese Probleme können auf die Lösung algebraischer Gleichungen zurückgeführt werden
(vgl. 2.6.6). Die Untersuchung des Lösungsverhaltens algebraischer Gleichungen geschieht mit
Hilfe einer allgemeinen Theorie, die von dem französischen Mathematiker Galois (1811–1832)
geschaffen wurde. Die Galoistheorie ebnete den Weg für das moderne algebraische Denken.
Als Spezialfälle enthält die Galoistheorie die Ergebnisse des jungen Gauß (1777–1855) über
Kreisteilungskörper und die Konstruktion regelmäßiger Vielecke sowie den Satz des norwegi-
schen Mathematikers Niels Henrik Abel (1802–1829) über die Unmöglichkeit der Auflösung der
allgemeinen Gleichung fünften und höheren Grades durch Radikale (vgl. 2.6.5 und 2.6.6).

2.6.2 Der Hauptsatz der Galoistheorie

Körpererweiterungen: Unter einer Körpererweiterung K ⊆ E verstehen wir einen Körper E,


der einen gegebenen Körper K als Unterkörper enthält. Jeder Unterkörper Z von E mit

K⊆Z⊆E

heißt Zwischenkörper der Erweiterung K ⊆ E. Unter einer Körpererweiterungskette

K0 ⊆ K1 ⊆ . . . ⊆ E

verstehen wir eine Menge von Unterkörpern K j des Körpers E mit den angegebenen Inklusions-
beziehungen.
36
Die tragische Lebensgeschichte von Galois, der mit 21 Jahren bei einem Duell getötet wurde und am Vorabend des
Duells wichtige Resultate seiner Theorie in einem Brief an einen Freund niederschrieb, findet man in dem Buch des
Einsteinschülers Leopold Infeld Wenn die Götter lieben, Schönbrunn-Verlag, Wien 1954.
37
Auf der griechischen Insel Delos im Ägäischen Meer befand sich im Altertum ein berühmtes Heiligtum der Artemis und
des Apollo. Das Delische Problem soll sich aus der Aufgabe ergeben haben, einen Altar mit doppeltem Volumen zu
bauen. Mit diesem Problem hat sich auch Giovanni Casanova (1725–1798) beschäftigt, der Protagonist von Mozarts „Don
Giovanni“.
2.6 Galoistheorie und algebraische Gleichungen 79

Die Grundidee der Galoistheorie: Die Galoistheorie behandelt eine wichtige Klasse von
Körpererweiterungen (Galoiserweiterungen) und bestimmt alle Zwischenkörper mit Hilfe aller
Untergruppen der Symmetriegruppe (Galoisgruppe) dieser Körpererweiterung.
Damit wird ein körpertheoretisches Problem auf ein wesentlich einfacheres gruppentheoreti-
sches Problem zurückgeführt.
Es ist eine allgemeine Strategie der modernen Mathematik, die Untersuchung komplizierter
Strukturen auf die Untersuchung zugeordneter einfacherer Strukturen zurückzuführen. Beispiels-
weise kann man topologische Probleme auf die Lösung algebraischer Fragen reduzieren, und
die Untersuchung kontinuierlicher (Liescher) Gruppen wird auf das Studium von Liealgebren
zurückgeführt (vgl. die Kapitel 17 und 17).

Der Grad der Körpererweiterung: Ist K ⊆ E eine Körpererweiterung, dann stellt E einen
linearen Raum über K dar. Die Dimension dieses Raumes heißt der Grad( K ⊆ E) der Kör-
pererweiterung38 . Genau dann, wenn dieser Grad endlich ist, sprechen wir von einer endlichen
Körpererweiterung.
 Beispiel 1: Die Erweiterung Q ⊆ R vom Körper der rationalen Zahlen Q zum Körper der
reellen Zahlen R ist unendlich.
 Beispiel 2: Die Erweiterung R ⊆ C vom Körper R der reellen Zahlen zum Körper C der
komplexen Zahlen ist endlich und vom Grad 2.
Denn jede komplexe Zahl lässt sich in der Form a + bi mit a, b ∈ R darstellen, und aus
a + bi = 0 folgt a = b = 0. Somit bilden die beiden Elemente 1 und i eine Basis des Vektorraums
C über R.
Im Sinne von 2.6.3 ist überdies Q ⊆ R eine transzendente Erweiterung, während R ⊆ C eine
einfache algebraische Erweiterung darstellt.

Gradsatz: Ist Z ein Zwischenkörper der endlichen Körpererweiterung K ⊆ E, dann ist auch
K ⊆ Z eine endliche Körpererweiterung, und es gilt:

Grad (K ⊆ E) = Grad (K ⊆ Z ) Grad ( Z ⊆ E).

Symmetriegruppe einer Körpererweiterung: Ist K ⊆ E eine Körpererweiterung, dann be-


steht die Symmetriegruppe G( K ⊆ E) dieser Erweiterung definitionsgemäß aus genau allen
Automorphismen des Erweiterungskörpers E, die die Elemente des Grundkörpers K fest lassen.
Eine Körpererweiterung K ⊆ E heißt genau dann galoissch, wenn sie endlich ist und

ord G ( K ⊆ E) = Grad (K ⊆ E)

gilt, d. h., die Symmetriegruppe der Körpererweiterung besteht aus genau so vielen Elementen
wie der Grad der Erweiterung angibt.
Die Symmetriegruppe einer galoisschen Körpererweiterung heißt die Galoisgruppe dieser
Erweiterung.

Hauptsatz der Galloistheorie: Es sei K ⊆ E eine galoissche Körpererweiterung.


Dann kann man jedem Zwischenkörper Z dieser Erweiterung eine Untergruppe der Galois-
gruppe zuordnen, die aus genau den Automorphismen des Erweiterungskörpers E besteht, die
die Elemente des Zwischenkörpers Z fest lassen.
Auf diese Weise ergibt sich eine bijektive Abbildung von der Menge aller Zwischenkörper auf
die Menge aller Untergruppen der Galoisgruppe.
38
Man benutze die in der linearen Algebra eingeführten Begriffe und ersetze dort K durch K (vgl. 2.3.2)
80 2 Algebra

Einfache Körpererweiterung: K ⊆ E heißt genau dann einfach, wenn es keine echten Zwi-
schenkörper gibt.
Eine galoissche Körpererweiterung ist genau dann einfach, wenn die zugehörige Galoisgruppe
einfache ist.
 Beispiel 3: Wir betrachten die klassische Körperweiterung

R⊆C

vom Körper R der reellen Zahlen zum Körper C der komplexen Zahlen.
Zunächst bestimmen wir die Symmetriegruppe G (R ⊆ C ) dieser Körpererweiterung. Es
sei ϕ : C −→ C ein Automorphismus, der jede reelle Zahl fest lässt. Aus i2 = −1 folgt dann
ϕ(i)2 = −1. Somit gilt ϕ(i) = i oder ϕ(i) = −i. Diese beiden Möglichkeiten entsprechen dem
identischen Automorphismus id( a + bi) := a + bi auf C und dem Automorphismus

ϕ( a + bi) := a − bi

von C (Übergang zur konjugiert komplexen Zahl).


Somit gilt G (R ⊆ C ) = {id, ϕ} mit ϕ2 = id. Nach Beispiel 2 hat man

Grad (R ⊆ C ) = ord G (R ⊆ C ) = 2.

Folglich ist die Körpererweiterung R ⊆ C galoissch.


Die Galoisgruppe G (R ⊆ C ) ist zyklisch von der Ordnung zwei. Aus der Einfachheit der
Galoisgruppe folgt die Einfachheit der Körpererweiterung R ⊆ C.
 Beispiel 4: Die Gleichung

x2 − 2 = 0

besitzt in Q keine Lösung. Um√einen Körper zu konstruieren, in dem diese Gleichung eine
Lösung besitzt, setzen wir ϑ := 2. Mit Q (ϑ ) bezeichnen wir den kleinsten Unterkörper von C,
der Q und ϑ enthält. Dann gilt ϑ, −ϑ ∈ Q (ϑ ) und

x2 − 2 = ( x − ϑ )( x + ϑ ),

d. h., Q ist der Zerfällungskörper von x2 − 2 (vgl. 2.6.3). Dieser Körper besteht aus allen Aus-
drücken
p(ϑ)
q(ϑ )

wobei p und q Polynome über Q sind mit q = 0. Wegen ϑ2 = 2 und (c + dϑ )(c − dϑ ) = c2 − 2d2
kann man alle diese Ausdrücke auf

a + bϑ, a, b ∈ Q

reduzieren.39 Analog zu Beispiel 3 erhält man, dass die Körpererweiterung Q ⊆ Q (ϑ ) galoissch


vom Grad 2 und somit einfach ist. Die zugehörige Galoisgruppe

G (R ⊆ C ) = {id, ϕ} mit ϕ2 = id
1 1 − 2ϑ 1 2ϑ
39
Zum Beispiel ist = =− + .
1 + 2ϑ (1 + 2ϑ)(1 − 2ϑ) 7 7
2.6 Galoistheorie und algebraische Gleichungen 81

wird durch die Permutation der Nullstellen ϑ, −ϑ von x2 − 2 erzeugt. Der identischen Permuta-
tion entspricht der identische Automorphismus id( a + bϑ ) := a + bϑ von Q (ϑ ). Dagegen gehört
zur Vertauschung von ϑ mit −ϑ der Automorphismus ϕ( a + bϑ ) := a − bϑ von Q (ϑ ).
 Beispiel 5 (Kreisteilungsgleichung): Ist p eine Primzahl, dann besitzt die Gleichung

x p − 1 = 0, x∈Q

die Lösung x = 1. Um den kleinsten Körper E zu konstruieren, in dem alle Lösungen dieser
Gleichung liegen, setzen wir ϑ := e2πi/p und bezeichnen mit Q (ϑ ) den kleinsten Körper in C,
der Q und ϑ enthält. Wegen

x p − 1 = ( x − 1)( x − ϑ) . . . ( x − ϑ p−1 )

stellt E := Q( ϑ ) den Zerfällungskörper des Polynoms x p − 1 dar (vgl. 2.6.3).


Der Körper Q ( ϑ) besteht aus allen Ausdrücken

a 0 + a 1 ϑ + a 2 ϑ 2 + . . . + a p −1 ϑ p − 1 , a j ∈ Q,

die unter Beachtung von ϑ p = 1 in üblicher Weise addiert und multipliziert werden. Da die
Elemente 1, ϑ, . . . , ϑ p−1 über Q linear unabhängig sind, gilt Grad (Q ⊆ Q ( ϑ )) = p. Ferner ist
Q ⊆ Q (ϑ ) eine galoissche Körpererweiterung. Die zugehörige Galoisgruppe G (Q ⊆ Q( θ )) =
{ ϕ0 , . . . , ϕ p−1 } besteht aus Automorphismen ϕk : Q (ϑ ) −→ Q (ϑ), die durch

ϕk (ϑ ) := ϑ k .

p
erzeugt werden. Es gilt id = ϕ0 und ϕ1k = ϕk , k = 1, . . . , p − 1 sowie ϕ1 = id.
Somit ist die Galoisgruppe G (Q ⊆ Q( θ )) zyklisch von der Primzahlordnung p und einfach,
was die Einfachheit der Körpererweiterung Q ⊆ Q( ϑ ) impliziert.

2.6.3 Der verallgemeinerte Fundamentalsatz der Algebra

Algebraische und transzendente Elemente: Es sei K ⊆ E eine Körpererweiterung. Durch


K [ x ] bezeichnen wir den Ring aller Polynome

p ( x ) : = a0 + a1 x + . . . + a n x n

mit ak ∈ K für alle k. Genau diese Ausdrücke heißen Polynome über K. Ferner bezeichne RK ( x )
den Körper aller rationalen Funktionen

p( x )
,
q( x )

wobei p und q Polynome über K sind mit q = 0.


Ein Element ϑ von E heißt genau dann algebraisch über K, wenn ϑ Nullstelle eines Polynoms
über K ist. Andernfalls heißt ϑ transzendent über K.
Die Körpererweiterung K ⊆ E heißt genau dann algebraisch über K, wenn jedes Element von E
algebraisch über K ist. Anderenfalls wird die Körpererweiterung transzendent genannt.
82 2 Algebra

Ein Polynom über K heißt genau dann irreduzibel, wenn es sich nicht als Produkt zweier
Polynome über K vom Grad ≥ 1 darstellen lässt. Ein wichtiges Ziel der Algebra besteht darin,
einen solchen Erweiterungskörper E zu finden, in dem ein vorgegebenes Polynom p ( x) über K
in Linearfaktoren

p( x ) = an ( x − x1 )( x − x2 ) · . . . · ( x − xn )

mit x j ∈ E für alle j zerfällt.

Algebraischer Abschluss: Ein Erweiterungskörper E von K heißt genau dann algebraisch


abgeschlossen, wenn jedes Polynom über K bezüglich E in Linearfaktoren zerfällt.
Unter einem algebraischen Abschluss von K versteht man einen algebraisch abgeschlossenen
Erweiterungskörper E von K, der keinen echten Unterkörper mit dieser Eigenschaft besitzt.

Der verallgemeinerte Fundamentalsatz der Algebra von Steinitz (1910): Jeder Körper K
besitzt einen (bis auf Isomorphie40 ) eindeutigen algebraischen Abschluss K.

Zerfällungskörper eines Polynoms: Der kleinste Unterkörper von K, in dem ein Polynom
p( x ) in Linearfaktoren zerfällt, heißt der Zerfällungskörper dieses Polynoms.
 Beispiel: Der Körper C der komplexen Zahlen ist der algebraische Abschluss des Körpers R
der reellen Zahlen. Wegen

x2 + 1 = ( x − i)( x + i)

ist C zugleich der Zerfällungskörper des über R irreduziblen Polynoms x2 + 1.

2.6.4 Klassifikation von Körpererweiterungen

Die Begriffe endliche, einfache, algebraische und transzendente Körpererweiterung wurden


bereits in 2.6.2 und 2.6.3 eingeführt.

Definition: Es sei K ⊆ E eine Körpererweiterung.


(a) Ein irreduzibles Polynom über K heißt genau dann separabel, wenn es (im algebraischen
Abschluss K) keine mehrfachen Nullstellen besitzt.
(b) K ⊆ E heißt genau dann separabel, wenn diese Erweiterung algebraisch ist und jedes
Element von E Nullstelle eines irreduziblen separablen Polynoms über K ist.
(c) K ⊆ E heißt genau dann normal, wenn diese Erweiterung algebraisch ist und jedes
irreduzible Polynom über K entweder keine Nullstelle in E besitzt oder in E vollständig in
Linearfaktoren zerfällt.

Satz: (i) Jede endliche Körpererweiterung ist algebraisch.


(ii) Jede endliche separable Erweiterung ist einfach.
(iii) Jede algebraische Erweiterung eines Körpers der Charakteristik null oder eines endlichen
Körpers ist separabel.

Charakterisierung galoisscher Körpererweiterungen: Für Körpererweiterung K ⊆ E gilt:


(i) K ⊆ E ist genau dann galoissch, wenn diese Erweiterung endlich, separabel und normal ist.
40
Dieser Isomorphismus lässt die Elemente von K fest.
2.6 Galoistheorie und algebraische Gleichungen 83

(ii) K ⊆ E ist genau dann galoissch, wenn E der Zerfällungskörper eines über K irreduziblen
separablen Polynoms ist.
(iii) Besitzt der Körper K die Charakteristik null oder ist K endlich, dann ist K ⊆ E genau
dann galoissch, wenn E der Zerfällungskörper eines Polynoms über K ist.
Die folgenden Resultate geben eine vollständige Übersicht über alle einfachen Körpererweite-
rungen.

Einfache transzendente Körpererweiterungen: Jede einfache transzendente Erweiterung


eines Körpers K ist isomorph zum Körper R K ( x ) der rationalen Funktionen über K.

Einfache algebraische Körpererweiterungen: Es sei p( x ) ein irreduzibles Polynom über


dem Körper K. Wir betrachten ein Symbol ϑ und alle Ausdrücke

a0 + a1 ϑ + . . . + a m ϑ m , a j ∈ K, (2.62)

die wir unter Beachtung von p(ϑ ) = 0 in üblicher Weise addieren und miteinander multiplizieren.
Dann ergibt sich ein Körper K (ϑ ), der eine einfache algebraische Erweiterung von K darstellt
und die wichtige Eigenschaft besitzt, dass ϑ Nullstelle des Polynoms p ( x ) ist. Ferner gilt

Grad (K ⊆ E) = Grad p( x ).

Bezeichnet ( p( x )) die Menge aller Polynome über K, die sich in der Form q( x ) p( x ) mit einem
Polynom q( x ) darstellen lassen, dann ist der Faktorring K [ x ]/( p( x )) ein Körper und zu K (ϑ )
isomorph.
Wählt man alle über K irreduziblen Polynome p( x ), dann erhält man auf diese Weise (bis auf
Isomorphie) alle einfachen algebraischen Körpererweiterungen von K.
 Beispiel: Es sei K der Körper der reellen Zahlen. Wir wählen p( x ) := x2 + 1. Benutzen wir die
Ausdrücke (2.62) mit p(ϑ ) = 0, dann gilt ϑ2 = −1. Folglich entspricht ϑ der imaginären Einheit i.
Der Erweiterungskörper K ( ϑ) ist der Körper C der komplexen Zahlen, wobei C = R [ x ]/( x2 +
1) gilt (im Sinne einer Isomorphie).

2.6.5 Der Hauptsatz über Gleichungen, die durch Radikale lösbar sind

Es sei K ein gegebener Körper. Wir betrachten die Gleichung

p ( x ) : = a0 + a1 x + . . . + a n − 1 x n − 1 + x n = 0 (2.63)

mit a j ∈ K für alle j. Wir setzen voraus, dass das Polynom p( x ) über K irreduzibel und separabel41
ist. Mit E bezeichnen wir den Zerfällungskörper von p( x ), d. h., es gilt

p( x ) = ( x − x1 )( x − x2 ) · . . . · ( x − xn )

mit x j ∈ E für alle j.

Zielstellung: Man möchte die Nullstellen x1 , . . . , xn der Ausgangsgleichung (2.63) in möglichst


einfacher Weise durch die Elemente des Grundkörpers K und gewisser zusätzlicher Größen
41
Besitzt der Grundkörper K die Charakteristik null (z. B. K = R, Q) oder ist K endlich, dann ist jedes irreduzible Polynom
über K auch separabel.
84 2 Algebra

ϑ1 , . . . , ϑk ausdrücken. Die klassischen Auflösungsformeln für die Gleichungen zweiten, dritten


und vierten Grades kommen mit Ausdrücken ϑ j aus, die Wurzeln der Koeffizienten a0 , . . . , an
sind. Nachdem man diese Auflösungsformeln im 16. Jahrhundert gefunden hatte, ergab sich die
Aufgabe, analoge Formeln auch für die Gleichungen von höherem als vierten Grad zu finden.
Im Anschluss an Untersuchungen von Lagrange (1736–1813) und Cauchy (1789–1857) bewies
der zweiundzwanzigjährige norwegische Mathematiker Abel im Jahre 1824 erstmalig, dass für
Gleichungen fünften Grades keine derartigen Lösungsformeln existieren. Das gleiche Resultat
fand Galois im Jahre 1830 unabhängig von Abel.

Definition: Die Gleichung (2.63) heißt genau dann durch Radikale lösbar, wenn der Zerfäl-
lungskörper E durch sukzessives Hinzufügen von endlich vielen Größen ϑ1 , . . . , ϑk erzeugt
werden kann, die einer Gleichung der Form

nj
ϑj = c j (2.64)

genügen, wobei n j ≥ 2 gilt und c j in dem bereits konstruierten Erweiterungskörper liegt. Ist die
Charakteristik p des Grundkörpers K ungleich null, dann fordern wir zusätzlich, dass p kein
Teiler von n j ist.

Kommentar: Anstelle von (2.64) schreibt man auch


ϑj = nj cj .
Das rechtfertigt die Bezeichnung Radikal (Wurzel). Die obige Definition entspricht dann einer
Körpererweiterungskette

K = : K 1 ⊆ K2 ⊆ . . . ⊆ K k + 1 = : E

mit K j+1 = K j (ϑ j ) und c j ∈ K j für j = 1, . . . , k. Da alle Nullstellen x1 , . . . , xn von (2.63) in E


liegen, erhalten wir

x j = Pj (ϑ1 , . . . , ϑk ), j = 1, . . . , n,

wobei Pj ein Polynom in ϑ1 , . . . , ϑn ist, dessen Koeffizienten im Grundkörper K liegen.

Hauptsatz: Die algebraische Gleichung (2.63) lässt sich genau dann durch Radikale lösen,
wenn die Galoisgruppe der Körpererweiterung K ⊆ E auflösbar ist.

Definition: Unter der allgemeinen Gleichung n-ten Grades verstehen wir die Gleichung (2.63)
über dem Körper K := RZ ( a0 , . . . , an−1 ), der aus allen rationalen Funktionen
p ( a 0 , . . . , a n −1 )
q ( a 0 , . . . , a n −1 )
besteht, wobei p und q Polynome bezüglich der Variablen a0 , . . . , an−1 mit ganzzahligen Koeffizi-
enten sind und q nicht das Nullpolynom ist.

Satz von Abel-Galois: Die allgemeine Gleichung n-ten Grades ist für n ≥ 5 nicht durch
Radikale auflösbar.
Beweisskizze: Wir fassen x1 , . . . , xn als Variable auf und betrachten den Körper E :=
RZ ( x1 , . . . , xn ) aller rationalen Funktionen
P ( x1 , . . . , x n )
(2.65)
Q ( x1 , . . . , x n )
2.6 Galoistheorie und algebraische Gleichungen 85

mit ganzzahligen Koeffizienten. Durch Multiplikation und Koeffizientenvergleich in

p( x) = ( x − x1 )( x − x2 ) · . . . · ( x − xn )
= a 0 + a 1 x + . . . + a n −1 x n −1 + x n

erhalten wir die Größen a0 , . . . , an−1 (bis auf das Vorzeichen) als elementarsymmetrische Funk-
tionen von x1 , . . . , xn (vgl. 2.1.6.4). Zum Beispiel ergibt sich

− a n −1 = x1 + . . . + xn .

Alle Ausdrücke der Form (2.65) mit der Eigenschaft, dass P und Q symmetrisch bezüglich
x1 , . . . , xn sind, bilden einen Unterkörper von E, der isomorph zu K ist und folglich mit K
identifiziert werden kann.
Das Polynom p( x ) ist irreduzibel und separabel in K. Es besitzt E als Zerfällungskörper. Die
Körperweiterung K ⊆ E ist galoissch. Durch eine Permutation von x1 , . . . , xn ergibt sich ein
Automorphismus von E, der die Elemente von K fest lässt. Zu zwei verschiedenen derartigen
Permutationen gehören unterschiedliche Automorphismen von E. Deshalb ist die Galoisgruppe
der Körpererweiterung K ⊆ E isomorph zur Permutationsgruppe von n Elementen, d. h., es gilt

G (K ⊆ E) ∼
= Sn .

Für n = 2, 3, 4 ist S n auflösbar, während S n für n ≥ 5 nicht auflösbar ist (vgl. 2.5.1.4.). Der Satz
von Abel-Galois ist deshalb eine Konsequenz des Hauptsatzes.

2.6.6 Konstruktionen mit Zirkel und Lineal


Es ist jedem Anfänger der Geometrie bekannt, dass verschiedene ordentliche
Vielecke, namentlich das Dreieck, Fünfeck, Fünfzehneck und die, welche durch
Verdopplung der Seitenzahl eines derselben entstehen, sich geometrisch konstru-
ieren lassen. So weit war man schon zu Euklids Zeit, und es scheint, man habe
sich seitdem allgemein überredet, dass das Gebiet der Elementargeometrie sich
nicht weiter erstrecke: wenigstens kenne ich keinen geglückten Versuch, ihre
Grenzen auf dieser Seite zu erweitern.
Desto mehr dünkt mich, verdient die Entdeckung Aufmerksamkeit, dass außer
jenen ordentlichen Vielecken noch eine Menge anderer, z. B. das Siebzehneck,
einer geometrischen Konstruktion fähig ist. Diese Entdeckung ist eigentlich
nur ein Corollarium einer noch nicht ganz vollendeten Theorie von größerem
Umfange, und sie soll, sobald diese ihre Vollendung erhalten hat, dem Publikum
vorgelegt werden
C. F. Gauß, a. Braunschweig
Stud. der Mathematik zu Göttingen
(Intelligenzblatt der allgemeinen Literaturzeitung vom 1. Juni 1796)

Wir betrachten in der Ebene ein kartesischen Koordinatensystem und endlich viele Punkte

P1 = ( x1 , y1 ), . . . , Pn = ( xn , yn ).

Wir können das Koordinatensystem immer so wählen, dass x1 = 1 und y1 = 0 gilt. Mit K
bezeichnen wir den kleinsten Unterkörper des Körpers der reellen Zahlen, der alle Zahlen x j , y j
enthält. Ferner sei Q (y ) der kleinste Unterkörper von R, der alle rationalen Zahlen und die reelle
Zahl y enthält.
86 2 Algebra

Hauptsatz: Ein Punkt ( x, y) lässt sich genau dann aus den Punkten P1 , . . . , Pn mit Zirkel und
Lineal konstruieren, wenn x und y zu einem galoisschen Erweiterungskörper E von K gehören
mit

Grad (K ⊆ E) = 2m , (2.66)

wobei m eine natürliche Zahl ist.


Eine Strecke ϑ lässt sich genau dann aus einer Strecke der Länge y und aus der Einheitsstrecke
mit Zirkel und Lineal konstruieren, wenn ϑ zu einem galoisschen Erweiterungskörper E von
K := Q (y) gehört mit (2.66).

Die Unlösbarkeit des Problems der Quadratur des Kreises: Mit Zirkel und Lineal soll
ein Quadrat konstruiert werden, das den gleichen Flächeninhalt wie der Einheitskreis besitzt.
Bezeichnet ϑ die Seitenlänge dieses Quadrats, dann gilt

ϑ2 = π

(vgl. Abb. 2.4a). Im Jahre 1882 bewies der dreißigjährige Ferdinand Lindemann (der Lehrer von
Hilbert) die Transzendenz der Zahl π über dem Körper Q der rationalen Zahlen. Folglich kann
π (und somit auch ϑ) nicht einem algebraischen Erweiterungskörper von Q angehören.


π 1 ϑ
a) Quadratur des Kreises b) Würfelverdopplung

1 1 1
ϕ/3 1

ϕ
cos ϕ cos n=3 n=4
3
c) Winkeldreiteilung d) Kreisteilung Abb. 2.4

Die Unlösbarkeit des Delischen Problems der Würfelverdopplung: Die Kantenlänge ϑ


eines Würfels vom Volumen 2 ist eine Lösung der Gleichung

x3 − 2 = 0.

Das Delische Problems fordert, aus der Einheitsstrecke (Kante des Einheitswürfels) die Strecke
ϑ mit Zirkel und Lineal zu konstruieren (Abb. 2.4b). Das Delische Problem ist nach dem
Hauptsatz genau dann lösbar, wenn ϑ einem galoisschen Erweiterungskörper E von Q angehört,
wobei Grad (Q ⊆ E) = 2m gilt. Da das Polynom x3 − 2 über Q irreduzibel ist, hat man die
Körpererweiterungskette

Q ⊂ Q (ϑ ) ⊆ E
2.6 Galoistheorie und algebraische Gleichungen 87

mit Grad (Q ⊆ Q (ϑ )) = 3. Aus dem Gradsatz folgt

Grad (Q ⊆ E) = Grad (Q ⊆ Q( ϑ ))Grad (Q ( ϑ ) ⊆ E) = 3Grad (Q (ϑ ) ⊆ E)

(vgl. 2.6.2). Deshalb kann Grad (Q ⊆ E) nicht gleich 2m sein.

Die Unlösbarkeit des Problems der allgemeinen Winkeldreiteilung mit Zirkel und Lineal:
Diese Aufgabe kann nach Abb. 2.4c darauf zurückgeführt werden, aus der Strecke cos ϕ und der
ϕ
Einheitsstrecke die Strecke ϑ = cos zu konstruieren; ϑ ist eine Lösung der Gleichung
3

4x3 − 3x − cos ϕ = 0. (2.67)

1
Für ϕ = 60◦ gilt cos ϕ = , und das in (2.67) links stehende Polynom ist irreduzibel über Q. Das
2
gleiche Gradargument wie beim Delischen Problem zeigt, dass ϑ nicht einem Erweiterungskörper
E von Q vom Grad 2m angehören kann. Folglich lässt sich die Dreiteilung eines Winkels von 60◦
nicht mit Zirkel und Lineal durchführen.

Die Konstruktion regelmäßiger Vielecke mit Zirkel und Lineal: Die komplexen Lösungen
der sogenannten Kreisteilungsgleichung

xn − 1 = 0

enthalten die Zahl 1 und teilen den Einheitskreis in n gleiche Teile (vgl. Abb. 2.4d). Der obi-
ge Hauptsatz zusammen mit Eigenschaften der Kreisteilungsgleichung ergeben das folgende
Resultat.

Satz von Gauß: Ein regelmäßiges n-Eck lässt sich genau dann mit Zirkel und Lineal konstru-
ieren, wenn

n = 2m p1 p2 . . . pr (2.68)

gilt. Dabei ist m eine natürliche Zahl, und alle p j sind paarweise verschiedene Primzahlen der
Form42
k
22 + 1, k = 0, 1, . . . . (2.69)

Bis heute ist bekannt, dass sich für k = 0, 1, 2, 3, 4 Primzahlen ergeben.43 Folglich kann man jedes
regelmäßige n-Eck mit Zirkel und Lineal konstruieren, falls in der Primzahlzerlegung von n nur
die Zahlen

2, 3, 5, 17, 257, 65 537

vorkommen. Für n ≤ 20 lassen sich somit genau alle regelmäßigen n-Ecke mit n =
3, 4, 5, 6, 8, 10, 12, 15, 16, 17, 20 durch Zirkel und Lineal konstruieren.

k k
42
Unter 22 versteht man 2(2 ) .
43
Fermat (1601–1665) vermutete, dass alle Zahlen (2.69) Primzahlen sind. Euler entdeckte jedoch, dass sich für k = 5 in
(2.69) die Zahl 641 · 6700417 ergibt.
88 2 Algebra

2.7 Zahlentheorie
Ihre „Disquisitiones arithmeticae“ haben Sie sogleich unter die ersten Mathe-
matiker eingereiht, und ich ersehe, dass der letzte Abschnitt44 die allerschönste
analytische Entdeckung enthält, die seit langer Zeit gemacht worden ist.
Der fast siebzigjährige Lagrange an den jungen Gauß im Jahre 1804
Fermat hat bekanntlich behauptet, dass die diophantische Gleichung – außer in
gewissen selbstverständlichen Fällen –
xn + yn = zn
in ganzen Zahlen x, y, z unlösbar sei; das Problem, diese Unmöglichkeit nach-
zuweisen, bietet ein schlagendes Beispiel dafür, wie fördernd ein sehr spezielles
und scheinbar unbedeutendes Problem auf die Wissenschaft einwirken kann.
Denn durch die Fermatsche Aufgabe angeregt, gelangte Kummer zu der Einfüh-
rung der idealen Zahlen und zur Entdeckung des Satzes von der eindeutigen
Zerlegung der Zahlen eines Kreisteilungskörpers in ideale Primfaktoren – eines
Satzes, der heute in der ihm durch Dedekind und Kronecker erteilten Verallge-
meinerung auf beliebige algebraische Zahlbereiche im Mittelpunkt der modernen
Zahlentheorie steht und dessen Bedeutung weit über die Grenzen der Zahlen-
theorie hinaus in das Gebiet der Algebra und der Funktionentheorie reicht45 .

David Hilbert (Paris 1900)


Die Zahlentheorie wird oft als Königin der Mathematik bezeichnet. Zahlentheoretische Pro-
bleme lassen sich häufig sehr einfach formulieren, aber nur sehr schwer beweisen. Für den
Beweis der Fermatschen Vermutung benötigte die Mathematik 350 Jahre. Erst nach einer völligen
Umstrukturierung der Mathematik im 20. Jahrhundert durch die Schaffung höchst abstrakter
Methoden konnte Andrew Wiles (Princeton, USA) im Jahre 1994 die von Fermat ausgesprochene
Behauptung beweisen.
Das berühmteste offene Problem der Mathematik – die Riemannsche Vermutung – hängt
sehr eng mit der Verteilung der Primzahlen zusammen (vgl. 2.7.3). Die größten Mathematiker
aller Zeiten haben immer wieder ihre Kräfte an der Beantwortung zahlentheoretischer Fragen
gemessen und dabei wichtige neue mathematische Methoden entwickelt, die andere Gebiete der
Mathematik befruchteten.
Drei grundlegende Werke zur Zahlentheorie sind Diophants „Arithmetika“ aus der Antike,
die „Disquisitiones arithmeticae“ aus dem Jahre 1801, mit denen der vierundzwanzigjährige
Gauß die moderne Zahlentheorie begründet hat, und Hilberts „Zahlbericht“ aus dem Jahre 1897
über algebraische Zahlkörper. Die Zahlentheorie des 20. Jahrhunderts ist entscheidend von den
Versuchen geprägt worden, die von Hilbert im Jahre 1900 auf dem zweiten mathematischen
Weltkongress in Paris gestellten Probleme zu lösen.

2.7.1 Grundideen

2.7.1.1 Unterschiedliche Formen mathematischen Denkens

Man unterscheidet in der Mathematik:


(i) kontinuierliches Denken (z. B. reelle Zahlen und Grenzwerte);
44
Dieser Abschnitt beschäftigt sich mit Kreisteilungskörpern und der Konstruktion regelmäßiger Vielecke mit Zirkel und
Lineal (vgl. 2.6.6).
45
Fermat (1601–1665), Gauß (1777–1855), Kummer (1810–1893), Kronecker (1823–1891), Dedekind (1831–1916) und Hilbert
(1862–1943).
2.7 Zahlentheorie 89

(ii) diskretes Denken (z. B. natürliche Zahlen und Zahlentheorie).


Erfahrungsgemäß lassen sich kontinuierliche Probleme häufig einfacher als diskrete Probleme
behandeln. Die großen Erfolge kontinuierlicher Denkmethoden basieren auf dem Grenzwert-
begriff und den damit zusammenhängenden Theorien (Differential- und Integralrechnung,
Differentialgleichungen, Integralgleichungen und Variationsrechnung) mit vielfältigen Anwen-
dungen in der Physik und in den Naturwissenschaften (vgl. 10.1).
Dagegen ist die Zahlentheorie der Prototyp für die Schaffung wirkungsvoller mathematischer
Methoden zur Beherrschung diskreter Strukturen, denen man heute in der Informatik, in der
Optimierung diskreter Systeme und in den Gittermodellen der statistischen Physik begegnet
(vgl. die Kapitel 8 und 9).
Die epochale Entdeckung von Max Planck im Jahre 1900, dass die Energie eines harmoni-
schen Oszillators nicht kontinuierlich, sondern diskret (gequantelt) ist, hat zu der wichtigen
mathematischen Aufgabe geführt, aus kontinuierlichen Strukturen durch einen nichttrivialen
„Quantisierungsprozess“ diskrete Strukturen zu erzeugen (vgl. 13.8).

2.7.1.2 Die moderne Strategie der Zahlentheorie

Ende des 19. Jahrhunderts stellte Hilbert das Programm auf, die gut ausgearbeiteten Methoden
der komplexen Funktionentheorie (algebraische Funktionen, Topologie Riemannscher Flächen;
vgl. 18.8) auf zahlentheoretische Fragen zu übertragen. Es handelt sich hier um die Aufgabe,
Begriffe des kontinuierlichen Denkens so zu fassen, dass sie sich auch auf diskrete Strukturen an-
wenden lassen. Die Zahlentheorie des 20. Jahrhunderts ist durch diese Strategie geprägt worden,
die zu sehr abstrakten, aber auch zu sehr schlagkräftigen Methoden geführt hat. Wesentliche
Impulse in dieser Richtung verdankt man André Weil (geb. 1902) sowie Alexandre Grothendieck
(geb. 1928), der die algebraische Geometrie und Zahlentheorie mit seiner Theorie der Schemata
revolutionierte.
Höhepunkte der Zahlentheorie des 20. Jahrhunderts sind:
(a) der Beweis des allgemeinen Reziprozitätsgesetzes für algebraische Zahlkörper durch Emil
Artin im Jahre 1928,
(b) der Beweis der von André Weil ausgesprochenen Variante der Riemannschen Vermutung
für die ζ-Funktion algebraischer Varietäten über einem endlichen Körper durch Pierre Deligne
im Jahre 1973 (Fields-Medaille 1978)46 ,
(c) der Beweis der Mordellschen Vermutung für diophantische Gleichungen durch Gerd
Faltings im Jahre 1983 (Fields-Medaille 1986) und
(d) der Beweis der Fermatschen Vermutung durch Andrew Wiles im Jahre 1994.

2.7.1.3 Anwendungen der Zahlentheorie

Heutzutage setzt man Supercomputer ein, um zahlentheoretische Vermutungen zu testen. Seit


1978 benutzt man zahlentheoretische Methoden zur raffinierten Verschlüsselung von Daten und
Informationen (vgl. 2.7.8.1). Klassische Aussagen über die Approximation von irrationalen Zahlen
durch rationale Zahlen spielen heute eine wichtige Rolle bei der Untersuchung von chaotischen
und nichtchaotischen Zuständen dynamischer Systeme (z. B. in der Himmelsmechanik). Eine
Brücke zwischen Zahlentheorie und moderner Physik wird in den letzten Jahren durch die
46
Die Fields-Medaille wird seit 1936 aller vier Jahre auf den mathematischen Weltkongressen für bahnbrechende neue
mathematische Ergebnisse vergeben. Sie kann mit dem Nobelpreis verglichen werden. Im Unterschied zum Nobelpreis
dürfen jedoch die Empfänger nicht älter als 40 Jahre sein. Für das Lebenswerk der bedeutendsten Mathematiker unserer
Zeit wird in Israel der Wolf-Preis und in Norwegen der Abel-Preis verliehen.
90 2 Algebra

Superstringtheorie geschlagen, die zu einem fruchtbaren Ideenstrom von der Physik in die reine
Mathematik und in umgekehrter Richtung geführt hat47 ) (vgl. 18.13).

2.7.1.4 Komprimierung von Information in Mathematik und Physik

Um die Fruchtbarkeit der Wechselwirkungen zwischen Zahlentheorie und Physik philosophisch


zu verstehen, sei darauf hingewiesen, dass die Mathematiker in einem mühevollen Erkenntnispro-
zess gelernt haben, Informationen über die Struktur diskreter Systeme in sehr komprimierter
Form zu kodieren, um daraus wesentliche Aussagen über die Systeme zu gewinnen. Ein typisches
Beispiel hierfür sind die Riemannsche ζ-Funktion, die die Struktur der Menge aller Primzahlen
kodiert, und der Primzahlverteilungssatz. Andere wichtige Beispiele sind die Dirichletschen
L-Reihen (vgl. 2.7.3.) und die Modulformen, die aus der Theorie der elliptischen Funktionen
heraus erwachsen sind (vgl. 1.14.18). Die wesentlichen Informationen über die Feinstruktur einer
reellen Zahl sind in ihrem Kettenbruch kodiert (vgl. 2.7.5).
Auf einem völlig anderem Weg sind die Physiker auf den Begriff der Zustandssumme gestoßen,
die das Verhalten von physikalischen Systemen mit großer Teilchenzahl kodiert. Kennt man
die Zustandssumme, dann kann man daraus alle physikalischen Eigenschaften des Systems
berechnen48 . Die Riemannsche ζ-Funktion kann man als eine spezielle Zustandssumme auffassen.
Der fruchtbare Austausch von Ideen zwischen Mathematik und Physik beruht beispielsweise
darauf, dass ein mathematisches Problem der physikalischen Intuition zugänglich wird, wenn
man es in die Sprache der Physiker übersetzt. Ein Pionier auf diesem Gebiet ist Edward Witten
(Institute for Advanced Study in Princeton, USA), der als Physiker im Jahre 1990 die Fields-
Medaille für Mathematik erhielt. Es ist interessant, dass viele große Zahlentheoretiker wie Fermat,
Euler, Lagrange, Legendre, Gauß und Minkowski auch bedeutende Leistungen in der Physik
vollbracht haben. Das Erscheinen der „Disquisitiones arithmeticae“ von Gauß im Jahre 1801
markiert eine Wende von der Mathematik als einer universellen Wissenschaft, wie sie Gauß noch
vertrat, hin zu Spezialdisziplinen. Insbesondere ging die Zahlentheorie lange Zeit ihre eigenen
Wege. Zur Zeit beobachtet man jedoch wieder einen erfreulichen Trend der Zusammenführung
zwischen Mathematik und Physik.

2.7.2 Der Euklidische Algorithmus

Teiler: Sind a, b und c ganze Zahlen mit

c = ab,

dann heißen a und b Teiler von c. Zum Beispiel folgt aus 12 = 3 · 4, dass die Zahlen 3 und 4
Teiler der Zahl 12 sind.
Eine ganze Zahl heißt genau dann gerade, wenn sie durch zwei teilbar ist, anderenfalls
bezeichnet man sie als ungerade.
 Beispiel 1: Gerade Zahlen sind 2, 4, 6, 8, . . . Ungerade Zahlen sind 1, 3, 5, 7, . . .

Elementares Teilbarkeitskriterium: Die folgenden Aussagen gelten für die Dezimaldarstel-


lung natürlicher Zahlen n.
(i) n ist genau dann durch 3 teilbar, wenn die Quersumme von n durch 3 teilbar ist.
47
Zahlreiche Anwendungen der Zahlentheorie in den Naturwissenschaften und in der Informatik findet man in [Schroeder
1984]. Der Zusammenhang zwischen Zahlentheorie und moderner Physik wird in [Waldschmidt u.a. 1992] dargestellt.
48
In der Quantenfeldtheorie stellt das Feynmansche Pfadintegral die Zustandssumme dar.
2.7 Zahlentheorie 91

(ii) n ist genau dann durch 4 teilbar, wenn die aus den letzten beiden Ziffern von n bestehende
Zahl durch 4 teilbar ist.
(iii) n ist genau dann durch 5 teilbar, wenn die letzte Ziffer eine 5 oder eine 0 ist.
(iv) n ist genau dann durch 6 teilbar, wenn n gerade und die Quersumme von n durch 3 teilbar
ist.
(v) n ist genau dann durch 9 teilbar, wenn die Quersumme von n durch 9 teilbar ist.
(vi) n ist genau dann durch 10 teilbar, wenn die letzte Ziffer von n eine 0 ist.
 Beispiel 2: Die Quersumme der Zahl 4656 ist 4 + 6 + 5 + 6 = 21. Die Quersumme von 21
ergibt 2 + 1 = 3. Folglich ist 21 und damit auch 4656 durch 3 teilbar, aber nicht durch 9.
Die Quersumme der Zahl n = 1234656 lautet 1 + 2 + 3 + 4 + 6 + 5 + 6 = 27. Die erneute
Quersummenbildung liefert 2 + 7 = 9. Somit sind 27 und n durch 9 teilbar.
Die letzten beiden Ziffern der Zahl m = 1 234 567 897 216 bilden die durch 4 teilbare Zahl 16.
Deshalb ist m durch 4 teilbar. Die Zahl 1 456 789 325 ist durch 5 teilbar, aber nicht durch 10.

Primzahlen: Ein natürliche Zahl p heißt genau dann eine Primzahl, wenn p ≥ 2 gilt und p
außer den Zahlen 1 und p keine weiteren natürlichen Zahlen n ≥ 2 als Teiler besitzt. Die ersten
Primzahlen lauten 2, 3, 5, 7, 11.

Das Sieb des Eratosthenes (um 300 v. Chr.): Gegeben sei die natürliche Zahl n > 11. Um
alle Primzahlen

p≤n

zu bestimmen, geht man folgendermaßen vor:


(i) Man schreibt alle natürlichen Zahlen ≤ n auf (und zwar bequemerweise sofort ohne die
durch 2, 3 und 5 teilbaren Zahlen).

(ii) Man betrachtet alle Zahlen ≤ n und unterstreicht der Reihe nach deren Vielfache.
Alle nicht unterstrichenen Zahlen sind dann Primzahlen.

 Beispiel 3: Es sei n = 100. Alle Primzahlen ≤ 100 sind durch 2, 3, 5, 7 gegeben. Wir haben
hier lediglich die durch 7 teilbaren Zahlen zu unterstreichen und erhalten:
2 3 5 7; 11 13 17 19 23 29 31 37 41
43 47 49 53 59 61 67 71 73 77 79 83 89 91 97.
Alle Primzahlen ≤ 100 erhält man durch die nicht unterstrichenen Zahlen.
Eine Tabelle der Primzahlen < 4000 findet man in 0.6.

Satz des Euklid (um 300 v. Chr.): Es gibt unendlich viele Primzahlen.
Diesen Satz bewies Euklid in seinen „Elementen“. Den folgenden Satz findet man dort nur
implizit. Er wurde zuerst streng von Gauß bewiesen.

Fundamentalsatz der Arithmetik: Jede natürliche Zahl n ≥ 2 ist das Produkt von Primzahlen.
Diese Darstellung ist eindeutig, wenn man die Primzahlen im Produkt ihrer Größe nach ordnet.
 Beispiel 4: Es gilt
24 = 2 · 2 · 2 · 3 und 28 = 2 · 2 · 7.

Kleinstes gemeinsames Vielfaches: Sind m und n zwei positive natürliche Zahlen, dann
erhält man das kleinste gemeinsame Vielfache

kgV(m, n )
92 2 Algebra

von n und m, indem man alle Primzahlen in der Zerlegung von n und m miteinander multipliziert,
wobei gemeinsame Faktoren nur einmal berücksichtigt werden.
 Beispiel 5: Aus Beispiel 4 folgt

kgV(24, 28) = 2 · 2 · 2 · 3 · 7 = 168.

Größter gemeinsamer Teiler: Sind m und n zwei positive natürliche Zahlen, dann bezeichnet
man mit

ggT(m, n)

den größten gemeinsamen Teiler von m und n. Man erhält diesen, indem man in den Prim-
zahlzerlegungen von m und n alle gemeinsamen Primzahlen aufsucht und diese miteinander
multipliziert.
 Beispiel 6: Aus Beispiel 4 folgt ggT(24, 28) = 2 · 2 = 4.

Der Euklidische Algorithmus zur Berechnung des größten gemeinsamen Teilers: Sind n
und m zwei gegebene ganze Zahlen ungleich null, dann setzen wir r0 := |m| und benutzen das
folgende Verfahren der Division mit Rest:

n = α0 r0 + r1 , 0 ≤ r1 < r0 ,
r 0 = α1 r1 + r2 , 0 ≤ r2 < r1 ,
r 1 = α2 r2 + r3 , 0 ≤ r3 < r2 etc.

Dabei sind α0 , α1 , . . . und die Reste r1 , r2 , . . . eindeutig bestimmte ganze Zahlen. Nach endlich
vielen Schritten erhält man erstmalig r k = 0. Daraus ergibt sich

ggT(m, n) = rk−1 .

Kurz:
Der größte gemeinsame Teiler ist der letzte nicht verschwindende Rest im Euklidischen
Algorithmus.
 Beispiel 7: Für m = 14 und n = 24 erhält man:

24 = 1 · 14 + 10 (Rest 10),
14 = 1 · 10 + 4 (Rest 4),
10 = 2·4+ 2 (Rest 2),
4 = 2·2 (Rest 0).

Folglich gilt ggT(14, 24) = 2.

Relativ prime Zahlen: Zwei positive natürliche Zahlen m und n heißen genau dann relativ
prim, wenn

ggT(m, n) = 1.

 Beispiel 8: Die Zahl 5 ist relativ prim zu 6, 7, 8, 9 (aber nicht zu 10).


2.7 Zahlentheorie 93

Die Eulersche ϕ-Funktion: Es sei n eine positive natürliche Zahl. Mit ϕ (n) bezeichnen wir
die Anzahl aller positiven natürlichen Zahlen m mit m ≤ n, die relativ prim zu n sind. Für
n = 1, 2, . . . gilt:
 
1
ϕ (n ) = n ∏ 1 − .
p|n
p

Das Produkt ist dabei über alle Primzahlen p zu nehmen, die Teiler von n sind.
 Beispiel 9: Es ist ϕ(1) = 1. Für n ≥ 2 gilt genau dann ϕ( n) = n − 1, wenn n eine Primzahl ist.
Aus ggT(1, 4) = ggT(3, 4) = 1 und ggT(2, 4) = 2, ggT(4, 4) = 4, folgt
ϕ(4) = 2.

Die Möbiussche Funktion: Es sei n eine positive natürliche Zahl. Wir setzen

⎪ 1 für n = 1



(−1) falls die Primzahlzerlegung von n lauter verschiedene
r
μ(n) :=

⎪ Primzahlen enthält (r Stück)


0 sonst.

 Beispiel 10: Aus 10 = 2 · 5 folgt μ(10) = 1. Wegen 8 = 2 · 2 · 2 ist μ(8) = 0.

Die Berechnung zahlentheoretischer Funktionen aus ihren Summen: Gegeben sei eine
Funktion f , die jeder positiven natürlichen Zahl n eine ganze Zahl f (n ) zuordnet. Dann gilt
n
f (n) = ∑ μ s( d) für n = 1, 2, . . .
d|n
d

mit
s( d ) := ∑ f ( c ).
c|d

Summiert wird dabei jeweils über alle Teiler d ≥ 1 von n und alle Teiler c ≥ 1 von d
(Umkehrformel von Möbius (1790–1868)).
Dieser Satz besagt, dass man f ( n) aus den Summen s( d) rekonstruieren kann.

2.7.3 Die Verteilung der Primzahlen


Meinen Dank für die Auszeichnung, welche mir die Berliner Akademie durch
die Aufnahme unter ihre Korrespondenten hat zu Theil werden lassen, glaube ich
am besten dadurch zu erkennen zu geben, dass ich von der hierdurch erhaltenen
Erlaubnis baldigst Gebrauch mache durch Mittheilung einer Untersuchung über
die Häufigkeit der Primzahlen; ein Gegenstand, welcher durch das Interesse,
welches Gauss und Dirichlet demselben längere Zeit geschenkt haben, einer
solchen Mittheilung vieleicht nicht ganz unwerth erscheint.49
Bernhard Riemann (1859)
49
So beginnt eine der berühmtesten Arbeiten in der Geschichte der Mathematik. Auf nur 8 Seiten entwickelt Riemann
seine neuen Ideen und formuliert die „Riemannsche Vermutung“. Die gesammelten Werke von Riemann, die man mit
ausführlichen modernen Kommentaren versehen in [Riemann 1990] findet, umfassen nur einen einzigen Band. Jede
dieser Arbeiten ist jedoch eine Perle der Mathematik. Mit seinem Ideenreichtum hat Riemann die Mathematik des
20. Jahrhunderts nachhaltig beeinflusst.
94 2 Algebra

Eines der Hauptprobleme der Zahlentheorie besteht darin, Gesetzmäßigkeiten für die Vertei-
lung der Primzahlen festzustellen.

Lückensatz: Die Zahlen n! + 2, n! + 3, . . . , n! + n sind für n = 2, 3, 4, . . . keine Primzahlen, und


diese Kette aufeinanderfolgender natürlicher Zahlen wird für wachsendes n immer länger.

Satz von Dirichlet (1837) über arithmetische Progressionen: Die Folge50

a, a + d, a + 2d, a + 3d, ... (2.70)

enthält unendlich viele Primzahlen, falls a und d zwei teilerfremde positive natürliche Zahlen
sind.
 Beispiel 1: Man kann a = 3 und d = 5. wählen. Dann enthält die Sequenz

3, 8, 13, 18, 23, ...

unendlich viele Primzahlen.

Korollar: Für eine beliebige reelle Zahl x ≥ 2 definieren wir

Pa,d ( x ) := Menge aller Primzahlen p in (2.70) mit p ≤ x.

Dann gilt:

ln p 1
∑ p
=
ϕ ( d)
ln x + O(1), x → + ∞, (P)
p∈ Pa,d ( x )

wobei ϕ die Eulersche Funktion bezeichnet (vgl. 2.7.2). Das Restglied O(1) hängt nicht von a ab.
In Beispiel 1 hat man ϕ( d) = 4.
Die Formel (P) präzisiert die Aussage, dass alle Folgen (2.70) mit gleicher Differenz d unab-
hängig vom Anfangsglied a „asymptotisch gleichviele“ Primzahlen enthalten.
Speziell für a = 2 und d = 1 enthält (2.70) alle Primzahlen. Dann ist ϕ(d) = 1.

Analytische Zahlentheorie: Beim Beweis seines Satzes führte Dirichlet völlig neue Methoden
in die Zahlentheorie ein (Fourierreihen, Dirichletreihen und L-Reihen), die sich auch in der
Theorie der algebraischen Zahlen als grundlegend erwiesen haben. Damit begründete er einen
neuen Zweig der Mathematik – die analytische Zahlentheorie.51

2.7.3.1 Der Primzahlsatz

Primzahlverteilungsfunktion: Für eine beliebige reelle Zahl x ≥ 2 definieren wir

π ( x ) := Anzahl der Primzahlen ≤ x.

50
In (2.70) handelt es sich um eine arithmetische Progression, d. h., die Differenz zweier aufeinanderfolgender Glieder ist
konstant.
Sind a und d nicht teilerfremd, dann treten in (2.70) trivialerweise überhaupt keine Primzahlen auf, falls a keine Primzahl
ist
51
Nach dem Tod von Gauß im Jahre 1855 wurde Dirichlet (1805–1859) dessen Nachfolger in Göttingen. Im Jahre 1859
übernahm Riemann diesen berühmten Göttinger Lehrstuhl. Von 1886 bis zu seinem Tod im Jahre 1925 wirkte Felix Klein
in Göttingen; 1895 holte Felix Klein David Hilbert nach Göttingen, der dort bis zu seiner Emeritierung im Jahre 1930
wirkte.
In den zwanziger Jahren war Göttingen das führende Zentrum der Mathematik und Physik in der Welt. Im Jahre 1933
emigrierten viele führende Wissenschaftler und Göttingen büßte seine führende Rolle ein.
2.7 Zahlentheorie 95

π (x)
Satz von Legendre (1798): = 0. lim
x x →∞
Somit gibt es wesentlich weniger Primzahlen als natürliche Zahlen.

Der fundamentale Primzahlsatz: Für große Zahlen x hat man die folgende asymptotische
Gleichheit:52

x
π (x) ∼ ∼ li x, x → + ∞.
ln x

Das ist die berühmteste asymptotische Formel der Mathematik. Tabelle 2.5 vergleicht π ( x ) mit
li x.

Tabelle 2.5
x π (x) li x
103 168 178
106 78 498 78 628
109 50 847 534 50 849 235

Noch Euler (1707–1783) glaubte, dass die Primzahlen völlig unregelmäßig verteilt sind. Das
asymptotische Verteilungsgesetz für π ( x ) fanden unabhängig voneinander der dreiunddrei-
ßigjährige Legendre im Jahre 1785 und der vierzehnjährige Gauß im Jahre 1792 durch das
umfangreiche Studium von Logarithmentafeln.
Den strengen Beweis für den Primzahlsatz gaben unabhängig voneinander der dreißigjährige
Hadamard und der dreißigjährige de la Vallee-Poussin im Jahre 1896. Bezeichnet pn die n-te
Primzahl, dann gilt:

pn ∼ n · ln n, n → +∞.

Fehlerabschätzung: Es gibt positive Konstanten A und B, so dass für alle x ≥ 2 die Beziehung
x
π (x) = (1 + r ( x ))
ln x
gilt mit
A B
≤ r(x) ≤ .
ln x ln x
Aussage von Riemann: Die wesentlich schärfere Fehlerabschätzung

|π ( x ) − li x | ≤ const · x ln x für alle x ≥ 2

gilt, falls sich die Riemannsche Vermutung (2.72) als richtig erweist.53
52
Explizit entspricht das der Grenzwertbeziehung
π (x) π( x)
lim  x  = lim = 1.
x →+∞ x→+ ∞ li x
ln x
Die Definition des Integralalgorithmus lautet:
⎛ ⎞
x 1− ε
 x
dt ⎝ dt dt ⎠
li x := PV = lim + .
ln t ε→+0 ln t ln t
0 0 1+ ε

53
Im Jahre 1914 bewies Littlewood, dass die Differenz π ( x ) − li x für wachsendes x unendlich oft das Vorzeichen wechselt.
96 2 Algebra

Die Riemannsche ζ-Funktion: Es sei


1
ζ (s) := ∑ n s
, s ∈ C, Re s > 1.
n =1

Der überraschende Zusammenhang mit der Primzahltheorie ergibt sich aus dem folgenden
Resultat.

Der fundamentale Satz von Euler (1737): Für alle reellen Zahlen s > 1 gilt

 
1 −1
∏ 1−
ps
= ζ ( s ), (2.71)
p

wobei das Produkt über alle Primzahlen p zu nehmen ist. Das bedeutet:

Die Riemannsche ζ-Funktion kodiert die Struktur der Menge aller Primzahlen.

Der fundamentale Satz von Riemann (1859):


(i) Die ζ-Funktion lässt sich analytisch zu einer auf C\{1} holomorphen Funktion fortsetzen,
die im Punkt s = 1 einen Pol erster Ordnung mit dem Residuum gleich eins besitzt, d. h., für alle
komplexen Zahlen s = 1 gilt:

1
ζ (s) = + Potenzreihe in s.
s−1
1
Beispielsweise ist ζ (0) = − .
2
(ii) Für alle komplexen Zahlen s = 1 hat man die Funktionalgleichung

 
s 1 s
π −s/2 Γ ζ (s) = π (s−1)/2 Γ − ζ (1 − s ).
2 2 2

(iii) Die ζ-Funktion besitzt die sogenannten trivialen Nullstellen s = −2k mit k = 1, 2, 3, . . .
(Abb. 2.5).

kritische
Nullstellen Nullstellengerade

Pol
−6 −4 −2 0 1 1
2

Abb. 2.5

Bezeichnet x0 die Stelle des ersten Vorzeichenwechsels, dann gilt nach Skewes (1955) die Abschätzung 10700 < x0 <
1034
1010 .
2.7 Zahlentheorie 97

2.7.3.2 Die berühmte Riemannsche Vermutung

In Jahre 1859 formulierte Riemann die folgende Vermutung:

Alle nichttrivialen Nullstellen der ζ-Funktion liegen in der komplexen


1 (2.72)
Ebene auf der Geraden Re s = .
2

1
Satz von Hardy (1914): Auf der kritischen Geraden Re s = liegen unendlich viele Nullstel-
2
len der Riemannschen ζ-Funktion.54
Man kennt heute eine Reihe unterschiedlicher Aussagen, die zur Riemannschen Vermutung
äquivalent sind. Umfangreiche geistvolle Experimente auf Supercomputern haben bisher keinen
Hinweis auf die Falschheit der Riemannschen Vermutung ergeben. Die Rechnungen liefern
Milliarden von Nullstellen auf der kritischen Geraden. Exakte asymptotische Abschätzungen
ergeben, dass mindestens ein Drittel aller Nullstellen der ζ-Funktion auf der kritischen Geraden
liegen müssen.

2.7.3.3 Riemannsche ζ-Funktion und statistische Physik

Eine fundamentale Erkenntnis der statistischen Physik besteht darin, dass man alle physikali-
schen Eigenschaften eines statistischen Systems mit den Energiezuständen E1 , E2 , . . . bei fester
Teilchenzahl aus der Zustandssumme

Z= ∑ e−E /kT n
(2.73)
n =1
erhält. Dabei bezeichnet T die absolute Temperatur des Systems, und k ist die Boltzmannkon-
stante (vgl. 15.7.1). Setzen wir
En := kTs · ln n, n = 1, 2, . . . ,
dann gilt

Z = ζ ( s ).

Dies bedeutet, dass die Riemannsche ζ-Funktion eine spezielle Zustandssumme darstellt. Dar-
aus erklärt sich, dass Funktionen vom Typ der ζ-Funktion außerordentlich wichtig sind, um
Modelle der statistischen Physik exakt behandeln zu können (und nicht nur approximativ auf
Supercomputern).

2.7.3.4 Riemannsche ζ-Funktion und Renormierung in der Physik

In der statistischen Physik und in der Quantenfeldtheorie treten unglücklicherweise häufig


divergente Ausdrücke auf. Die Physiker haben in diesem Zusammenhang geistvolle Verfahren
entwickelt, um zunächst sinnlosen (divergenten) Ausdrücken doch einen Sinn zu geben. Das ist
das weite Feld der physikalischen Renormierungstheorie, die im Rahmen der Quantenelektro-
dynamik und des Standardmodells der Elementarteilchen trotz zweifelhafter mathematischer
Argumente in phantastischer Übereinstimmung mit dem physikalischen Experiment steht.55
54
In Riemanns Nachlass in der Göttinger Universitätsbibliothek wurde entdeckt, dass dieser Satz bereits von Riemann
bewiesen, aber nicht veröffentlicht wurde.
55
Euler hat häufig mit divergenten Reihen gerechnet. Sein ausgeprägter mathematischer Instinkt führte ihn jedoch zu
richtigen Ergebnissen. Die Renormierungstheorie knüpft in einem gewissen Sinn an die Eulersche Vorgehensweise an.
Ein berühmtes offenes Problem der mathematischen Physik stellt der Aufbau einer strengen Quantenfeldtheorie dar, in
der die heuristische Renormierungstheorie tiefer verstanden und gerechtfertigt wird.
98 2 Algebra

 Beispiel: Die Spur der (n × n)-Einheitsmatrix In hat den Wert

tr In = 1 + 1 + . . . + 1 = n.

Für die unendliche Einheitsmatrix I erhalten wir daraus

tr I = lim n = ∞.
n→∞

Um tr I in nichttrivialer Weise einen endlichen Wert zuzuordnen, betrachten wir die Gleichung

1
ζ (s) = ∑ n s
. (2.74)
n =1

Für Re s > 1 ist das eine korrekte Formel im Sinne konvergenter Reihen. Die linke Seite besitzt
nach Riemann (im Sinne einer analytischen Fortsetzung) für jede komplexe Zahl s = 1 einen
eindeutig bestimmten Wert. Diese Tatsache benutzen wir, um die rechte Seite von (2.74) für alle
komplexen Zahlen s = 1 zu definieren. Im Spezialfall s = 0 ist die rechte Seite von (2.74) formal
gleich 1 + 1 + 1 + . . . Deshalb können wir den renormierten Wert von tr I durch

1
(tr I )ren := ζ (0) = −
2

definieren. Eine „unendliche Summe“ 1 + 1 + 1 + . . . positiver Zahlen ist hier überraschender-


weise gleich einer negativen Zahl!

2.7.3.5 Das Lokalisierungsprinzip für Primzahlen modulo m von Dirichlet

Es sei m eine eigentliche natürliche Zahl. Um seinen fundamentalen Primzahlsatz über arithmeti-
sche Progressionen zu beweisen, verallgemeinerte Dirichlet den Eulerschen Satz (2.71) in der
Form:

 
χ m ( p ) −1
∏ 1−
ps
= L(s, χm ) für alle s > 1.
p

Das Produkt erstreckt sich über alle Primzahlen p. Dabei setzen wir

χm ( n)
L(s, χm ) := ∑ ns
.
n =1

Diese Reihe heißt Dirichletsche L-Reihe. Dabei ist χm ein Charakter mod m. Definitionsgemäß
heißt das folgendes:
(i) Die Abbildung χ : Z/mZ −→ C \ {0} ist ein Gruppenmorphismus.56
(ii) Für alle g ∈ Z wählen wir
 
χ ([ g]) falls ggT( g, m) = 1,
χm ( g) :=
0 sonst.

 Beispiel: Im Fall m = 1 erhalten wir χ1 ( g) = 1 für alle g ∈ Z. Dann gilt

L(s, χ1 ) = ζ ( s) für alle s > 1.


56
Bezeichnet [ g] = g + mZ die zu g ∈ Z gehörige Restklasse modulo m (vgl. 2.5.2), dann gilt χ ([ g]) = 0 und χ ([ g ][h]) =
χ ([ g])χ ([ h]) für alle g, h ∈ Z.
2.7 Zahlentheorie 99

Somit verallgemeinert die Dirichletsche L-Funktion die Riemannsche ζ-Funktion. Grob gespro-
chen gilt:

Die Dirichletsche Funktion L (·, χm ) kodiert die Struktur der Menge der
Primzahlen modulo m.

Die Theorie der L-Funktion lässt sich auf viel allgemeinere Zahlbereiche ausdehnen (algebraische
Zahlkörper).

2.7.3.6 Die Vermutung über Primzahlzwillinge

Zwei Primzahlen, deren Differenz gleich zwei ist, heißen Primzahlzwillinge. Beispielsweise
sind 3, 5 sowie 5, 7 und 11, 13 derartige Zwillinge. Es wird vermutet, dass es unendlich viele
Primzahlzwillinge gibt.

2.7.4 Additive Zerlegungen

Die additive Zahlentheorie beschäftigt sich mit der Zerlegung von Zahlen in Summen.

2.7.4.1 Die Goldbachsche Vermutung

Im Jahre 1742 formulierte Goldbach in einem Brief an Euler die folgenden beiden Vermutungen:
(G1) Jede gerade Zahl n > 2 ist die Summe von zwei Primzahlen.
(G2) Jede ungerade Zahl n > 5 ist die Summe von drei Primzahlen.

 Beispiel: Es gilt

4 = 2 + 2, 6 = 3 + 3, 8 = 5 + 3, 10 = 7 + 3, ...

und

7 = 3 + 2 + 2, 9 = 5 + 2 + 2, 11 = 7 + 2 + 2, 13 = 7 + 3 + 3, ... .

Benutzt man die Zerlegung n = 3 + m, dann folgt sofort, dass (G2) eine Konsequenz von (G1)ist.
Computerexperimente zeigen, dass die beiden Aussagen (G1) und (G2) für n ≤ 108 richtig
sind.
Der Beweis der Vermutung (G1) ist bis heute völlig offen. Dagegen zeigte Vinogradov im Jahre
1937 die Richtigkeit der Aussage (G2) für alle natürlichen Zahlen n mit

15
n ≥ 33 .

Diese untere Schranke besitzt mehr als 6 Millionen Dezimalziffern.

2.7.4.2 Das Waringsche Problem

Im Jahre 1770 bewies Lagrange, dass man jede natürliche Zahl als Summe von vier Quadraten
ganzer Zahlen darstellen kann.
 Beispiel 1: Es gilt

2 = 12 + 12 + 02 + 02 und 7 = 22 + 12 + 12 + 12 .
100 2 Algebra

Ebenfalls im Jahre 1770 formulierte Waring die Vermutung, dass es zu jeder natürlichen Zahl
k ≥ 2 eine natürliche Zahl g(k ) ≥ 1 gibt, so dass sich jede natürliche Zahl n in der Gestalt

n = m1k + . . . + mkg(k )

mit ganzen Zahlen m1 , m2 , . . . darstellen lässt.


Diese Vermutung wurde im Jahre 1909 von Hilbert bewiesen. Die minimalen Anzahlen sind
g(2) = 4 (vier Quadrate), g(3) = 9 (neun Kuben), g(4) = 19 (neunzehn Biquadrate). Allgemein
hat man die Abschätzung
  
3 k
g ( k ) ≥ 2k + −2 für alle k ≥ 2.
2

Dabei bezeichnet [ m] die größte ganze Zahl ≤ m.

Der Spezialfall zweier Quadrate: Eine natürliche Zahl n ≥ 2 lässt sich genau dann als
Summe zweier Quadrate ganzer Zahlen darstellen, wenn in der Primzahlzerlegung von n alle
vorkommenden Primzahlen der Gestalt

4m + 3, m = 0, 1, 2, . . .

nur in gerader Potenz auftreten.

Satz von Fermat (1659): Eine Primzahl ist genau dann als Summe zweier Quadrate natürlicher
Zahlen darstellbar, wenn sie die Form

4m + 1, m = 1, 2, . . . .

besitzt. Diese Zerlegung ist (bis auf die Reihenfolge) eindeutig.


 Beispiel 2: Die Primzahl 13 = 4 · 3 + 1 gestattet die eindeutige Zerlegung

13 = 22 + 32 .

Mit N (n) bezeichnen wir die Anzahl der verschiedenen Möglichkeiten, die positive natürliche
Zahl n durch eine Summe von vier Quadraten ganzer Zahlen darzustellen.

Satz von Jacobi (1829):

 
Summe aller positiven Teiler von n,
N (n) = 8 ·
die nicht durch 4 teilbar sind).

 Beispiel 3: Es ist N (1) = 8 · 1. Tatsächlich gilt:

1 = (±1)2 + 02 + 02 + 02 , 1 = 02 + (±1)2 + 02 + 02 + 02 ,
1 = 02 + 02 + (±1)2 + 02 , 1 = 02 + 02 + 02 + (±1)2 .
2.7 Zahlentheorie 101

2.7.4.3 Partitionen

Es sei n eine positive natürliche Zahl. Wir definieren

 
Anzahl der Zerlegungen von n in eine Sum-
p(n) :=
me von positiven natürlichen Zahlen.

 Beispiel 1: Es gilt p(3) = 3, denn

3 = 1 + 1 + 1, 3 = 2 + 1, 3 = 3.

Kodierung von Information: Wir definieren die Partitionsfunktion



P(q) := ∑ p( n)q n
n =0

mit p(0) := 1. Diese Reihe konvergiert für alle komplexen Zahlen q mit |q| < 1. Damit sind
alle Informationen über Partitionen in der Funktion P kodiert. Die Aufgabe besteht darin,durch
geschickte Umformungen von P Informationen über Partitionen zu erhalten. Dieses Problem
wurde von Euler gelöst.

Satz von Euler: Für alle q ∈ C mit |q| < 1 hat man die konvergente Produktdarstellung

1
P ( q) = ∞
∏ (1 − q n )
n =1

zusammen mit
∞ ∞ 3n2 + n
∏ (1 − q n ) = ∑ (−1)n q 2 = 1 − q − q2 + q 5 + q 7 + . . . .
n =1 n=−∞

Diese überraschend einfache Formel hat Euler empirisch gefunden. Danach hat er lange Zeit
um einen Beweis gerungen.

Die Eulersche Rekursionsformel: Wir setzen p( n) := 0 für n < 0. Für alle n = 1, 2, . . . gilt
dann:

n
p(n) = ∑ (−1)k+1 { p(n − ω (k)) + p(n − ω (−k))}
k =1

1
mit ω (k ) := (3k2 − k). Explizit lauten die ersten Terme
2
p ( n ) = p ( n − 1) + p ( n − 2) − p ( n − 5) − p ( n − 7) + . . . .

 Beispiel 2: p (2 ) = p(1) + p(0) = 2,


p (3 ) = p(2) + p(0) = 3,
p (4 ) = p(3) + p(2) = 5,
...
p(200) = 3 972 999 029 388.
102 2 Algebra

Die asymptotische Formel von Hardy und Ramanunjan (1918)57 : Es sei K : = π (2/3).
Dann hat man für n → ∞ die asymptotischen Gleichheiten

eK n
p(n) ≈ √ ,
4n 3

2n
ln p(n) ≈ π .
3

Die Produktformel von Jacobi (1829): Für alle komplexen Zahlen q und z = 0 mit |q| < 1
gilt:

∞ ∞
∏ (1 − q2n )(1 + q2n−1 z)(1 + q2n−1 z−1 ) = ∑
2
q n zn .
n =1 n =−∞

2.7.5 Die Approximation irrationaler Zahlen durch rationale Zahlen und


Kettenbrüche

Wir beschäftigen uns mit der Frage, wie genau man irrationale Zahlen durch rationale Zah-
len approximieren kann. Dabei spielen Kettenbrüche eine zentrale Rolle. Kettenbüche treten
erstmalig im 17. Jahrhundert auf. Beispielsweise stieß Christiaan Huygens (1629–1695) auf Ket-
tenbrüche, als er ein Zahnradmodell unseres Sonnensystems bauen wollte und dabei versuchte,
die Periodenverhältnisse der Planeten durch möglichst wenige Zähne zu approximieren.
Die Theorie der Kettenbrüche geht auf Euler (1707–1783) zurück. Im Unterschied zu Dezi-
malbrüchen enthalten Kettenbrüche Informationen über die Feinstruktur reeller Zahlen. Zum
Beispiel wird das grundlegende Problem der besten Approximation von irrationalen Zahlen
durch rationale Zahlen mit Hilfe von Kettenbrüchen gelöst (vgl. 2.7.5.3.). Häufig sind Ketten-
bruchentwicklungen auch Potenzreihen deutlich überlegen. Bei Computeralgorithmen werden
Kettenbrüche in vielfältiger Weise eingesetzt.

Grundidee: Aus der Identität


√ 1
2 = 1+ √
1+ 2
folgt durch wiederholtes Einsetzen
√ 1
2 = 1+  
1
1+ 1+ √
1+ 2
und
√ 1
2 = 1+ usw. (2.75)
1
2+
1
2+ √
1+ 2
57
Rademacher entdeckte 1937, dass man p (n) bezüglich n in eine konvergente Reihe entwickeln kann. Der Beweis benutzt
die Dedekindsche Modulfunktion

η(τ ) := eπτi/12 ∏ (1 − qn ) mit q := e2πτi ,
n =1
die in der offenen oberen Halbebene holomorph ist (vgl. [Apostol 1990]). Das ist ein typisches Beispiel für die Fruchtbarkeit
der tiefliegenden Theorie der Modulformen (vgl. 1.14.18).
2.7 Zahlentheorie 103

2.7.5.1 Endliche Kettenbrüche

Definition: Unter einem endlichen Kettenbruch verstehen wir einen Ausdruck der Form
1
a0 +
1
a1 +
1
a2 +
a3 + ...
..
..
..
..
.
1
.
1
a n −1 +
an
Dafür schreiben wir das Symbol
[ a0 , a1 , . . . , an ].
Dabei sind a0 , a1 , . . . reelle oder komplexe Zahlen, die mit Ausnahme von a0 ungleich null sind.
 Beispiel 1:
1 1 3 8
1+ = 1+ = 1+ = .
1 2 5 5
1+ 1+
1 3
1+
2
 Beispiel 2:
1
[ a0 , a1 ] = a0 + ,
a1
1 a2
[ a0 , a 1 , a2 ] = a0 + = a0 + .
1 a1 a2 + 1
a1 +
a2
Rekursionsformel: Es gilt

1
[ a 0 , a1 , . . . , a n ] = a 0 + .
[ a1 , . . . , a n ]

Effektiver Algorithmus: Benutzt man das Iterationsverfahren


p k = ak pk − 1 + p k − 2 ,
k = 0, 1, . . . , n, (2.76)
q k = a k q k − 1 + q k −2 ,
mit den Anfangswerten p−2 := 0, p−1 := 1 und q−2 := 1, q−1 := 0, dann gilt

pn
[ a 0 , a1 , . . . , a n ] = , n = 0, 1, . . . .
qn

 Beispiel 3: Um
11
[2, 1, 2, 1] =
4
gemäß (2.76) bequem zu berechnen, benutzen wir das in Tabelle 2.6 angegebene Rechenschema.
Jede Zahl der dritten Zeile entsteht, indem man die darüberstehende Zahl an mit der vorausge-
henden Zahl der dritten Zeile multipliziert und die nächstvorausgehende Zahl der dritten Zeile
hinzuzählt. Analog verfährt man mit der vierten Zeile.
104 2 Algebra

Tabelle 2.6
n −2 −1 0 1 2 3
an 2 1 2 1
pn 0 1 2 3 8 11
qn 1 0 1 1 3 4

pn 2 3 8 11
(kanonische Näherungsbrüche)
qn 1 1 3 4

2.7.5.2 Unendliche Kettenbrüche

Definition: Unter einem unendlichen Kettenbruch

[ a0 , a1 , . . . ] (2.77)

 
pn
verstehen wir die Folge der endlichen Teilkettenbrüche
qn
pn
= [ a0 , a1 , . . . , a n ] .
qn
Der unendliche Kettenbruch (2.77) heißt genau dann konvergent, wenn der endliche Grenzwert

pn
lim =α
n→∞ qn

existiert. Dann ordnen wir dem unendlichen Kettenbruch (2.77) die Zahl α zu.

Konvergenzkriterium: Der unendliche Kettenbruch (2.77) konvergiert genau dann, wenn die
unendliche Reihe

∑ an
n =1

divergiert. Dann hat man zusätzlich die Intervallschachtelung

p2m p
< α < 2m+1 , m = 0, 1, 2, . . . (2.78)
q2m q2m+1

und die (in der Regel) viel schärfere Fehlerabschätzung (2.83).


 Beispiel 1: Ein Kettenbruch [ a0 , a1 , . . .] heißt genau dann regelmäßig, wenn alle a j ganze
Zahlen sind mit a j > 0 für alle j ≥ 1. Jeder derartige Kettenbruch konvergiert.
 Beispiel 2: Der Kettenbruch [1, 2] = [1, 2, 2, 2, . . .] konvergiert.58 Nach (2.75) gilt:


2 = [1, 2].

58
Bequemerweise werden Perioden durch einen Querstrich angegeben. Zum Beispiel gilt
[ a, b, c, d] = [ a, b, c, d, c, d, c, d, . . .].
2.7 Zahlentheorie 105

Eindeutige Darstellung reeller Zahlen durch Kettenbrüche: Jede reelle Zahl α lässt sich
eindeutig durch einen Kettenbruch darstellen. Dabei gilt:

(i) α ist rational, wenn der zugehörige Kettenbruch endlich ist.59


(ii) α ist irrational, wenn der zugehörige Kettenbruch unendlich ist.

Mit diesem Satz hat man ein allgemeines Hilfsmittel in den Händen, um die Irrationalität
einer reellen Zahl zu bestimmen. Man berechnet hierzu den Kettenbruch dieser Zahl und stellt
fest, ob er unendlich ist.

 Beispiel 3: Die Zahl 2 ist irrational, denn ihre Kettenbruchentwicklung ist nach Beispiel 2
unendlich.

Konstruktives Verfahren: Es sei ρ0 := α. Die Bestimmung des zu α gehörigen Kettenbruches


geschieht mit Hilfe des folgenden (modifizierten) Euklidischen Algorithmus:60

1
ρ0 = [ ρ 0 ] + ,
ρ1
1
ρ1 = [ ρ 1 ] + , (2.79)
ρ2
1
ρ2 = [ ρ 2 ] + usw.
ρ3

Das Verfahren wird abgebrochen, sobald erstmalig kein Rest mehr auftritt. Setzen wir a0 :=
[ρ0 ], a1 := [ρ1 ], . . . , dann gilt

α = [ a0 , a1 , . . . ].

10
 Beispiel 4: Für α = erhalten wir
7
10 3
= 1 + ,
7 7
7 1
= 2 + ,
3 3
3
= 3.
1
10
Das ergibt = [1, 2, 3].
7
 Beispiel 5: Euler erhielt für die Zahl e die übersichtliche Kettenbruchentwicklung

e = [2, 1, 2n, 1]∞


n=1 . (2.80)

Das bedeutet e = [2, 1, 2, 1, 1, 4, 1, 1, 6, 1, . . .]. Da diese Kettenbruchentwicklung unendlich ist,


konnte Euler im Jahre 1737 auf diesem Weg die Irrationalität der Zahl e zeigen. Erst 150 Jahre
später bewies Hermite die Transzendenz von e.
59
Um triviale Mehrdeutigkeiten in der Darstellung α = [ a0 , . . . , an ] für eine rationale Zahl α zu vermeiden, verlangen wir
zusätzlich an = 1 für alle n ≥ 1. Die angegebenen Algorithmen berücksichtigen automatisch diese Konvention.
60
Hier bezeichnet [ x ] die größte ganze Zahl ≤ x.
106 2 Algebra

Tabelle 2.7

reelle Zahl Kettenbruchentwicklung

1 √
( 5 − 1) [0, 1]
2
(goldener Schnitt)

1 √
( 5 + 1) [1]
2

2 [1, 2]

3 [1, 1, 2]

4 [2]

5 [2, 4]

6 [2, 2, 4]

7 [2, 1, 1, 1, 4]

e [2, 1, 2n, 1]∞


n =1

π [3, 7, 15, 1, 292, 1, 1, 1, 2, 1, 3, 1, 14, . . .]

(keine Gesetzmäßigkeit)

Tatsächlich leitete Euler zunächst die Formel


ek/2 + 1
= [k, 3k, 5k, . . .], k = 1, 2, . . .
ek/2 − 1
her und erriet daraus die Formel (2.80), ehe er sie dann streng bewies. Weitere Kettenbruchent-
wicklungen findet man in Tabelle 2.7.

0 x 1 Abb. 2.6

Der goldene Schnitt: Teilt man die Einheitsstrecke [0, 1] durch den Punkt x, wobei

1 x
= , (2.81)
x 1−x

ist, dann heißt diese Streckenteilung seit der Antike der goldene Schnitt und gilt bei Skulpturen,
Gemälden und Bauwerken als besonders ästhetisch (Abb. 2.6). Aus (2.81) folgt x2 + x − 1 = 0,
also
1 √
x = ( 5 − 1) = 0, 618 . . .
2
mit der Kettenbruchentwicklung

x = [0, 1] = [0, 1, 1, 1, . . .].

Interessanterweise ist das die einfachste Kettenbruchentwicklung.


2.7 Zahlentheorie 107

2.7.5.3 Beste rationale Approximationen

Hauptsatz: Es sei α eine irrationale reelle Zahl, und es sei n ≥ 2. Dann gilt61

   
   
α − pn  < α − p  , (2.82)
 qn   q

falls p und q ganze Zahlen mit der zusätzlichen Eigenschaft


p pn
0 < q ≤ qn und =
q qn
sind.

Korollar: Es sei n = 0, 1, 2, . . . . Für den Approximationsfehler ergibt sich die Abschätzung

 
1  pn  1

< α − ≤ . (2.83)
q n ( q n + q n+1 ) qn  q n q n+1

1 √
 Beispiel 1 (goldener Schnitt): Die goldene Schnittzahl αg = ( 5 − 1) besitzt die Darstellung
2
αg = [0, 1]. Für n = 0, 1, . . . lauten die kanonischen Näherungsbrüche:
pn 0 1 1 2 3 5 8 13
= , , , , , , , ,... .
qn 1 1 2 3 5 8 13 21
8
Somit ist die beste rationale Näherung von αg mit einem Nenner ≤ 13. Aus (2.83) folgt die
13
Fehlerabschätzung
 
 
 αg − 8  ≤ 1 = 1
<
4
.
 13  q 6 q7 13 · 21 1 000

 Beispiel 2: Für 2 = [1, 2, 2, 2, . . .] erhalten wir die kanonischen Näherungsbrüche
3 7 17 41
1, , , , , ...
2 5 12 29
17 √
Somit ist die beste rationale Näherung von 2 mit einem Nenner ≤ 12. Aus (2.83) ergibt sich
12
die Fehlerabschätzung
 
√ 
 2 − 17  ≤ 1
<
3
.
 12  12 · 29 1 000

 Beispiel 3: Für e = [2, 1, 2, 1, 1, 4, 1, . . . ] lauten die kanonischen Näherungsbrüche


2 3 8 11 19 87 106
, , , , , , , ... .
1 1 3 4 7 32 39
87
Somit ist die beste rationale Näherung für e mit einem Nenner ≤ 32. Ferner hat man die
32
Fehlerabschätzung:
 
 
e − 87  ≤ 1
<
1
.
 32  32 · 39 1 000
61
Man hat sogar die stärkere Aussage |αqn − p n | < |αq − p|.
108 2 Algebra

Die Bestimmung optimaler rationaler Approximationen hat in der Geschichte der Mathematik
eine besondere Rolle im Zusammenhang mit der Approximation des Kreisumfangs gespielt
(Approximation von π; vgl. 2.7.7).

Der diophantische Approximationssatz von Dirichlet (1842): Eine reelle Zahl α ist genau
dann irrational, wenn die Ungleichung

1
|qα − p| <
q

unendlich viele teilerfremde ganze Zahlen p und q > 0 als Lösungen besitzt.

Der optimale Approximationssatz von Hurwitz (1891): Für jede irrationale Zahl α besitzt
die Ungleichung
 
 
α − p  < √ 1 (2.84)
 q 5q2

p
eine unendliche Anzahl von rationalen Lösungen .
q

Die Konstante 5 ist optimal62 . Am schlechtesten lässt sich die goldene Schnittzahl αg =
1 √
( 5 − 1) approximieren63 . In diesem Sinne ist αg die „irrationalste“ aller reellen Zahlen.
2
Die Rolle des goldenen Schnitts in der Chaosforschung: Hat man zwei gekoppelte schwin-
gende Systeme mit den Kreisfrequenzen ω1 und ω2 , dann ist der Resonanzfall

ω1
= rationale Zahl
ω2

besonders gefährlich. Praktisch hat man auf einem Computer nur rationale Zahlen zur Verfügung.
Die Erfahrung zeigt jedoch, dass man die Irrationalität des Quotienten ω1 /ω2 auf dem Computer
simulieren kann, indem man für ω1 /ω2 die kanonischen Näherungsbrüche des goldenen Schnitts
aus Beispiel 1 wählt (vgl. die KAM-Theorie in 13.2).

2.7.6 Transzendente Zahlen

Die Klassifikation reeller Zahlen (vgl. Abb. 2.7): Eine reelle Zahl heißt genau dann rational,
wenn sie Lösung einer Gleichung der Form

c1 x + c0 = 0

√ganzzahligen Koeffizienten c0 und c1 = 0. Den Pythagoreern (500 v. Chr.) war bekannt,


ist mit
dass 2 eine irrationale Zahl ist. Eine reelle oder komplexe Zahl heißt genau dann algebraisch,
wenn sie Lösung einer Gleichung der Form

cn x n + cn−1 xn−1 + . . . + c1 x + c0 = 0, n≥1 (2.85)

mit ganzzahligen Koeffizienten c j für alle j und cn = 0. Der Grad des niedrigsten Polynoms,
dem eine algebraische Zahl α genügt, heißt der Grad von α. Algebraische Zahlen vom Grad 2
bezeichnet man auch als quadratisch.
2.7 Zahlentheorie 109

reelle Zahl

rational irrational

algebraisch transzendent Abb. 2.7

Die tiefgründige Untersuchung algebraischer Zahlen geschieht in der algebraischen Zahlen-


theorie. Dabei spielen die Idealtheorie, die Galoistheorie und die Theorie p-adischer Zahlen eine
fundamentale Rolle.

Irrationalitätskriterien: Eine reelle Zahl α ist genau dann irrational, wenn eine der folgenden
Bedingungen erfüllt ist:

(i) Der Kettenbruch zu α ist unendlich.


(ii) In der Dezimalbruchentwicklung von α treten keine Perioden auf.
(iii) (Satz von Gauß). Die Zahl α ist Lösung einer algebraischen Gleichung

xn + cn−1 x n−1 + . . . + c1 x + c0 = 0, n≥2

mit ganzzahligen Koeffizienten c j , und diese Gleichung besitzt keine ganzzahligen Lösungen.

Ein weiteres Kriterium stellt der diophantische Approximationssatz von Dirichlet aus Abschnitt
2.7.5.3 dar.

 Beispiel 1: Die Zahl 2 ist Lösung der quadratischen Gleichung

x2 − 2 = 0

und somit eine (quadratische)


√ algebraische Zahl. Da diese Gleichung offensichtlich keine ganz-
zahlige Lösung besitzt, ist 2 nach dem Satz von Gauß irrational.
Reelle oder komplexe Zahlen, die nicht algebraisch sind, heißen transzendent. Die Existenz
transzendenter Zahlen wurde erstmalig im Jahre 1844 von Liouville mit Hilfe seines Approxima-
tionssatzes bewiesen (vgl. Beispiel 3).

Satz von Euler-Lagrange: Eine reelle Zahl ist genau dann eine quadratische algebraische
Zahl, wenn sie eine unendliche periodische Kettenbruchentwicklung besitzt.
√ √ √
 Beispiel 2: Die Kettenbruchentwicklung von 2, 3 und 5 ist periodisch (vgl. Tabelle 2.7).

Existenz transzendenter Zahlen nach Cantor (1874): Ein erster sensationeller Erfolg der
Mengentheorie Cantors bestand darin, dass er im Unterschied zu Liouville völlig elementar die
Existenz transzendenter Zahlen nachweisen konnte. Er zeigte:

(i) Die Menge der algebraischen Zahlen ist abzählbar.


(ii) Die Menge der reellen Zahlen ist nicht abzählbar.

Folglich muss es transzendente Zahlen geben. Greift man aus einem festen kompakten Intervall
eine beliebige reelle Zahl heraus, dann ist die Wahrscheinlichkeit gleich eins, eine transzendente
Zahl zu erhalten. In diesem Sinne sind fast alle reellen Zahlen transzendent.

62
Ersetzt man 5 in (2.84) durch eine größere Zahl, dann findet man stets eine irrationale Zahl α, so dass die neue
Ungleichung  (2.84) nur noch endlich viele rationale Lösungen p/q hat.
 p n  2 1
63
Es gilt lim αg − q = √ .
n→∞ qn  n 5
110 2 Algebra

Die Approximationsordnung: Eine irrationale Zahl α besitzt definitionsgemäß genau dann


die reelle Zahl κ > 0 als Approximationsordnung, wenn der Ungleichung
 
 
α − p  < 1
 q qκ
unendlich viele rationale Zahlen p/q mit q > 0 genügen. Speziell folgt daraus die Existenz einer
unendlichen Folge ( Pn /Qn ) rationaler Zahlen mit
 
 
α − Pn  < 1 und Qn ≥ n für alle n = 1, 2, . . . .
 Qn  Qκn

Satz: Jede irrationale Zahl besitzt mindestens die Approximationsordnung zwei.

Approximationssatz von Liouville (1844): Eine algebraische Zahl vom Grad n ≥ 1 kann
höchstens die Approximationsordnung n besitzen.
 Beispiel 3: Die Zahl
1 1 1
+ 2! + 3! + . . .
101! 10 10
besitzt jede beliebige Approximationsordnung. Folglich muss sie transzendent sein.
Auf diesem Weg bewies Liouville die Existenz transzendenter Zahlen. Viel schärfer ist das
folgende Resultat.

Approximationssatz von Roth64 (1955): Die maximale Approximationsordnung einer irra-


tionalen algebraischen Zahl ist gleich zwei.
Grob gesprochen gilt somit:

Algebraische irrationale Zahlen lassen sich schlecht durch rationale Zahlen


approximieren, und transzendente Zahlen lassen sich gut durch rationale Zahlen
approximieren.

Satz von Hermite (1873): Die Zahl e ist transzendent.

Satz von Lindemann (1882): Die Zahl π ist transzendent.


Diese beiden berühmten Sätze sind Spezialfälle des folgenden Resultats (vgl. Beispiel 4).

Satz von Lindemann-Weierstraß (1882): Sind α1 , . . . , αn paarweise verschiedene komplexe


algebraische Zahlen, dann folgt aus

β 1 eα1 + . . . + β n eαn = 0,

dass entweder mindestens ein komplexer Koeffizient β j transzendent ist oder der triviale Fall
(β k = 0 für alle k) vorliegt.

Korollar: Die komplexe Zahl

ez ist transzendent,

falls die komplexe Zahl z = 0 algebraisch ist.


64
Für dieses fundamentale Resultat erhielt Klaus Roth im Jahr 1958 die Fields-Medaille.
2.7 Zahlentheorie 111

Beweis: Wir setzen α: = 0 und α2 := z. Nach dem Satz von Lindemann-Weierstraß folgt dann
aus der nichttrivialen Relation
(ez )e0 + (−1)ez = 0
die Transzendenz des Koeffizienten ez .
 Beispiel 4:

(i) Wählen wir die algebraische Zahl z = 1, dann ist e transzendent.


(ii) Für z = 2πi ist ez = 1 nicht transzendent, folglich kann 2πi nicht algebraisch sein, d. h., π
ist nicht algebraisch, also transzendent.

Satz von Gelfond-Schneider (1934): Es ist mindestens eine der komplexen Zahlen

α, β, α β

transzendent, falls die trivialen Fälle (α = 0 oder ln α = 0 oder β = rationale Zahl) ausgeschlossen
werden.
Dieser berühmte Satz löste das siebente Hilbertsche Problem aus dem Jahre 1900.
 Beispiel 5: Die Zahl

5
2
√ √
ist transzendent, denn von der Folge 2, 5, 2 5 kann nur die letzte Zahl transzendent sein.
Aussagen dieser Form wurden bereits von Euler vermutet.
 Beispiel 6: eπ ist transzendent.
Beweis: Es gilt eπ = i−2i . Von den drei Zahlen i, −2i, i−2i kann nur die letzte transzendent
sein.

2.7.7 Anwendung auf die Zahl π

Die Berechnung des Kreisumfangs, d. h., die Berechnung der Zahl π hat seit uralten Zeiten die
Phantasie der Mathematiker beflügelt.
Im Alten Testament der Bibel findet man für π den Näherungswert 3. Im 1. Buch der Könige
7,23 steht: „Und er machte ein Meer, gegossen von einem Rand zum andern zehn Ellen weit,
rund umher, und fünf Ellen hoch, und eine Schnur dreißig Ellen lang war das Maß rings um.“
1
Im Papyrus Rind der Ägypter (etwa 1650 v. Chr.) liest man: „Nimm von einem Durchmesser
9
weg und konstruiere ein Quadrat über dem was bleibt, und es wird den gleichen Flächeninhalt
wie der Kreis haben.“ Das ergibt die recht brauchbare Näherung:
 2
16
π= = 3,16 . . . .
9

Die Leistung des Archimedes (287–212 v. Chr.): Dieser approximierte die Kreislinie durch
Polygone und fand mit Hilfe des 96-Ecks nach aufwendigen Rechnungen seine berühmte
Abschätzung 65

223 22
<π< .
71 7

65
Das Symbol π wurde von Euler im Jahre 1737 eingeführt. Möglicherweise hat Euler dabei an das griechische Wort
περιϕέρεια für Peripherie gedacht.
112 2 Algebra

22
Dabei gilt = 3,14 . . .
7
Beste rationale Approximationen von π: Wie wir weiter unten zeigen werden, ergibt sich
für die Zahl π: die Kettenbruchentwicklung

π = [3, 7, 15, 1, 292, 1, 1, 1, . . .], (2.86)

die keinerlei Gesetzmäßigkeiten aufweist. Die kanonischen Näherungsbrüche dazu lauten:

22 333 355 103 993


3, , , , , ... .
7 106 113 33 102
22
An zweiter Stelle tritt bereits der Näherungsbruch des Archimedes auf. Aus dem Hauptsatz
7
22
in 2.7.5.3. folgt, dass die beste rationale Approximation von π ist, falls wir als Nenner nur
7
Zahlen ≤ 7 betrachten. Analog ist

355
(2.87)
113

die beste rationale Approximation von π, falls wir nur Nenner ≤ 113 zulassen. Die bemerkens-
werte Güte dieser Approximation ergibt sich nach (2.83) aus der Abschätzung
 
 
π − 355  ≤ 1 = 1
< 10−6 .
 113  q 3 q4 113 · 33 102

Erstaunlicherweise findet man den Näherungswert (2.87) für π bereits bei dem chinesischen
Mathematiker Zu Chong-Zhi (430–501).
Im Jahre 1766 wurde in Japan die folgende Abschätzung gefunden:

5 419 351 428 224 593 349 304


<π< .
1 725 033 136 308 121 570 117
Das sind kanonische Näherungsbrüche der Kettenbruchentwicklung von π.
Wir wollen noch nachtragen, wie man die Kettenbruchentwicklung (2.86) erhält. Man benötigt
dazu die Dezimalbruchdarstellung

3,14 15 92 65 35 8 < π < 3,14 15 92 65 35 9, (2.88)

die man mit einem der im folgenden angegebenen numerischen Verfahren erhält. Der Ketten-
bruchalgorithmus (2.79) liefert

3,14 15 92 65 35 8 = [3, 7, 15, 1, 292, 1, 1, 1, 1, . . .],


3,14 15 92 65 35 9 = [3, 7, 15, 1, 292, 1, 1, 1, 2, . . .].

Das ergibt (2.86).

Die Produktformel von Vieta: Eine analytische Formel für π wurde erstmalig im Jahre 1579
von Vieta angegeben. Sie lautet


2
= ∏ an
π n =1
2.7 Zahlentheorie 113

mit
 
1 √
a n +1 = 1 + an und a0 := 0.
2
n
Setzen wir bn := ∏ ak , dann gilt die Fehlerabschätzung
k =1

2 1
0 < bn − < n, n = 1, 2, . . . .
π 4
Aus b22 erhält man dann die Einschließung (2.88).

Die Produktformel von Wallis: Im Jahre 1655 veröffentlichte Wallis in seiner „Arithmetica
infinitorum“ die folgende unendliche Produktformel


π (2n)2
= ∏ . (2.89)
2 n =1
(2n − 1)(2n + 1)

Die unendliche Summenformel von Newton: im Jahre 1665 benutzt der 22jährige Newton
die Reihe

1 · 3 · . . . · (2n − 1) z2n+1
arcsin x = ∑ 2 · 4 · . . . · (2n)
·
2n + 1
n =1

und erhält im Spezialfall x = 1/2 die Formel

π 1 1 1·3 1·3·5
= + + + +...
6 2 2 · 3 · 8 2 · 4 · 5 · 32 2 · 4 · 6 · 7 · 128

die ihm die ersten 14 Dezimalstellen von π liefert.

Die unendliche Summenformel von Leibniz: Der 28jährige Leibniz entdeckt 1674 durch
geometrische Überlegungen die nach ihm benannte Summenformel

π 1 1 1
= 1− + − +..., (2.90)
4 3 5 7

die sich durch größte Einfachheit auszeichnet. Der Fehler wird durch das erste vernachlässigte
Glied bestimmt. Deshalb konvergiert diese Reihe nur sehr langsam und ist für die Berechnung
von π unbrauchbar.66

Die Eulersche Produktformel: Etwa 80 Jahre nach Wallis fand Euler seine berühmte Produkt-
formel:

∞  
z2
sin πz = πz ∏ 1− für alle z ∈ C. (2.91)
k =1
k2

Im Spezialfall z = 1/2 erhält man daraus die Wallissche Formel (2.89).


66
Tatsächlich wurde diese Reihe bereits drei Jahre vor Leibniz durch Gregory entdeckt.
114 2 Algebra

Genaue Berechnung von π: Ludolf van Ceulen (1540–1610) berechnete erstmalig die Zahl π
bis auf 35 Stellen nach dem Komma. Deshalb wird π auch als Ludolfsche Zahl bezeichnet.
Von Beginn des 18. Jahrhunderts an benutzte man zur Berechnung von π die Formel von John
Machin

   
π 1 1
= 4 arctan − arctan
4 5 239

zusammen mit der Potenzreihe für arctan x (vgl. (2.93)).

Ramanunjans Formel: Der indische Mathematiker Srinivasa Ramanunjan67 fand 1914 die
Formel:


1 8 ∞ (4n)! [1 103 + 26 390n]
9 801 n∑
= .
π =0 (n! )4 3964n

Diese Formel hängt mit der äußerst geistvollen Theorie der Modularformen zusammen
(vgl. 1.14.18.). Die Gebrüder David und Gregory Chudnovsky von der Columbia University
(New York, USA) berechneten 1992 mit einer modifizierten (sehr komplizierten) Formel vom
Ramanunjan-Typ über 2 Milliarden (genauer 2 260 321 336) Dezimalstellen von π.

Das Iterationsverfahren der Gebrüder Borwein: Von Peter und Jonathan Borwein (Universi-
ty of Waterloo, Canada) stammt das folgende spektakuläre Iterationsverfahren:

1 − (1 − y4n )1/4
y n +1 = , n = 0, 1, . . . ,
1 + (1 − y4n )1/4

αn+1 = (1 + yn+1 )4 αn − 22n+3 yn+1 (1 + yn+1 + y2n+1 )

√ √
mit den Anfangswerten y0 := 2 − 1, α0 := 6 − 4 2. Es gilt

1
lim = π.
n→∞ αn

Hier liegt eine so phantastisch hohe Konvergenzgeschwindigkeit vor, dass bereits 15 Iterationen
ausreichen, um 2 Milliarden richtige Dezimalstellen von π zu erhalten (vgl. [Borwein 1992]).
Dieses Verfahren ist Ausdruck einer Revolution in der modernen Mathematik. Leistungsfähige
Computer rufen nach völlig neuen Methoden und Algorithmen, die man heutzutage mit dem
Stichwort „Wissenschaftliches Rechnen“ umreißt.
67
Ramanunjan (1887–1920) ist in seiner Genialität die erstaunlichste Erscheinung unter den Mathematikern aller Zeiten. Er
entdeckte mathematische Formeln von unglaublicher Komplexität. Durch einen Brief, den er dem großen englischen
Mathematiker Godefroy Harold Hardy (1877–1947) schrieb, wurde dieser auf ihn aufmerksam und holte ihn 1914
nach England. Ramanunjans Notizbuch ist mit seinem Reichtum an genialen mathematischen Formeln, die aus einer
anderen Welt zu kommen scheinen, ein einmaliges mathematisches Dokument, das durch die beigefügten Beweise und
Kommentare der Herausgeber jedem empfohlen wird, der sich vom Geist tiefgründiger Mathematik gefangen nehmen
lassen will (vgl. [Berndt 1985]). Eine sehr interessante Biographie Ramanunjans wurde von [Kanigel 1995] verfasst.
2.7 Zahlentheorie 115

Allgemeine Kettenbrüche: Unter einem allgemeinen endlichen Kettenbruch verstehen wir


einen Ausdruck der Form
b1
a0 +
b2
a1 +
b3
a2 +
a3 + ...
..
..
..
..
.
bn− 1
.
bn
a n −1 +
an

Dafür schreibt man das Symbol

b1  b  bn 
a0 +  +  2 + ... +  .
a1 a2 an

Im Spezialfall bj = 1 für alle j ergibt sich das Symbol [ a0 , . . . , an ] (vgl. 2.7.5.1.).

Der Irrationalitätsbeweis für π von Legendre (1806): Im Jahre 1766 fand Lambert (1728–
1777) die (allgemeine) Kettenbruchentwicklung68 :

z2  z2  z2 
tan z = − − − ... .
1 3 5

Daraus zog er den Schluss, dass tan z irrational ist, falls z = 0 rational ist. Speziell ergab sich
aus diesem Resultat und der Rationalität des Ausdrucks
π
tan =1
4
dass π irrational sein muss. Der Beweis von Lambert enthielt jedoch eine Lücke, die erst im Jahre
1806 von Legendre geschlossen wurde. .
Bereits Aristoteles hatte 2000 Jahre zuvor die Irrationalität von π in Form der Hypothese
ausgesprochen, dass der Radius und die Länge eines Kreises inkommensurabel sind.

Der Satz von Lindemann (1882) über die Unmöglichkeit der Quadratur des Kreises: Lin-
demann zeigte im Jahre 1882, dass die Zahl π transzendent ist. Damit ergab sich nach über 2000
Jahren die Unmöglichkeit der Quadratur des Kreises (vgl. 2.6.6).

Die allgemeine Kettenbruchentwicklung von π: Für alle reellen Zahlen x hat man die
konvergente Kettenbruchentwicklung

x 12 · x 2  22 · x 2  32 · x 3 
arctan x =  + + + + ... . (2.92)
1  3  5  7

Dagegen konvergiert die Potenzreihe

x3 x5
arctan x = x − + −... (2.93)
3 5
68
Dieser Kettenbruch konvergiert für alle komplexen Zahlen z, die keine Pole von tan z sind
116 2 Algebra

nur für −1 ≤ x ≤ 1. Benutzen wir

π
= arctan 1,
4

dann erhalten wir aus (2.93) für x = 1 die Leibnizsche Reihe (2.90), die außerordentlich langsam
konvergiert. Um π mit einer Genauigkeit von 10−7 zu berechnen, benötigt man etwa 106 Terme
der Leibnizschen Reihe. Die gleiche Genauigkeit von π erhält man, indem man x = 1 in (2.92)
setzt und neun Terme berechnet. Allgemein ergibt sich der sehr regelmäßig gebaute Ausdruck:

π
=   +
1 12 22 33
+ + + ... . (2.94)
4 1 3 5 7

2.7.8 Gaußsche Kongruenzen

Definition: Sind a, b und m ganze Zahlen, dann schreibt man mit Gauß das Symbol

a ≡ b mod m

genau dann, wenn die Differenz a − b durch m teilbar ist .


 Beispiel 1: 5 ≡ 2 mod 3, denn 5 − 2 ist durch 3 teilbar.

Rechenregeln: (i) a ≡ a mod m.


(ii) Aus a ≡ b mod m folgt b ≡ a mod m.
(iii) Aus a ≡ b mod m und b ≡ c mod m folgt a ≡ c mod m.
(iv) Aus a ≡ b mod m zusammen mit c ≡ d mod m erhält man

a + c ≡ b + d mod m und ac ≡ bd mod m.

Satz: Sind die positiven natürlichen Zahlen s und m relativ prim, dann besitzt die Gleichung

ts ≡ 1 mod m

eine positive natürliche Zahl t als Lösung.

Der Satz von Fermat (1640) und Euler (1760): Für positive natürliche Zahlen a und m, die
relativ prim sind, gilt

a ϕ(m) ≡ 1 mod m.

Dabei bezeichnet ϕ(m) die Anzahl der Zahlen 1, . . . , m, die zu m relativ prim sind.
 Beispiel 2: Für eine Primzahl p, die a nicht teilt, hat man

a p−1 ≡ 1 mod p.

In dieser Form wurde der Satz ursprünglich von Fermat formuliert.


2.7 Zahlentheorie 117

2.7.8.1 Anwendungen des Satzes von Fermat-Euler in der modernen


Verschlüsselungstheorie

Über 200 Jahre lang galt der Satz von Fermat-Euler als Resultat der reinen Mathematik. Im Jahre
1977 veröffentlichten Rivest, Shamir und Adleman die folgende verblüffend einfache und doch
außerordentlich sichere Verschlüsselungsmethode, die auf dem Satz von Euler-Fermat basiert
und heute sehr häufig benutzt wird.

Vorbereitungen in der Zentrale: (i) Dort werden zwei Primzahlen p und q in der Größenord-
nung von 10100 ausgewählt, die streng geheim zu halten sind.
(ii) Man bildet das Produkt

m = pq

und berechnet ϕ(m) = ( p − 1)(q − 1).


(iii) Ferner wählt man eine natürliche Zahl s aus mit 1 < s < ϕ( m).
(iv) Der Außenstelle werden ohne jede Geheimhaltung die beiden Zahlen

m und s

mitgeteilt.

Die Verschlüsselung der Nachricht in der Außenstelle: Dort wird die Nachricht in einfach-
ster Weise durch eine natürliche Zahl

beschrieben. Man kann zu diesem Zweck jeden Buchstaben a, b, c, . . . durch eine zweistellige
Zahl 10, 11, 12, . . . kodieren und hat dann diese Zahlen lediglich aneinanderzureihen, um n zu
erhalten. Beispielsweise wird aus dem Wort ab die Zahl 1011. Die Außenstelle dividiert nun ns
durch m und übermittelt den Rest r der Zentrale, d. h., es gilt

ns ≡ r mod m .

Die Entschlüsselung der Nachricht in der Zentrale: Dort muss man aus r die Zahl n rekon-
struieren.
Da s und ϕ(m) relativ prim sind, existiert eine natürliche Zahl t ≥ 1 mit

ts ≡ 1 mod ϕ (m). (2.95)

Satz: rt ≡ n mod m.
Die Zentrale hat deshalb nur r t durch m zu teilen. Der Rest n ist die gesuchte Zahl. Man
beachte, dass wegen der Größe der Zahl m stets n < m gilt.
Beweis des Satzes: Nach dem Satz von Fermat-Euler hat man

n ϕ(m) ≡ 1 mod m.

Wegen (2.95) gibt es eine ganze Zahl k mit ts = 1 + kϕ(m). Daraus folgt

r t ≡ nst ≡ n1+kϕ(m) ≡ n mod m. ()


118 2 Algebra

Die Sicherheit des Verfahrens: Will ein Außenstehender die Nachricht entschlüsseln, dann
benötigt er die Zahl t, also ϕ( m) = ( p − l )(q − 1). Zu diesem Zweck muss er die ihm bekannte
Zahl m in ihre Primfaktoren m = pq zerlegen. Der Trick des Verfahrens besteht nun lediglich
darin, dass ein Computer wegen der Größe von m bisher nicht in der Lage ist, die Faktoren p
und q in einem vernünftigen Zeitraum zu bestimmen.
Da die Computer immer leistungsfähiger werden, ist die Sicherheit der Methode jedoch nur
dadurch gewährleistet, dass man von Zeit zu Zeit die Primzahlen p und q vergrößert.
Die Methode könnte zusammenbrechen, wenn es gelänge, extrem schnelle Faktorisierungsal-
gorithmen zu entwickeln. Deshalb erfreuen sich alle Mathematiker, die sich mit diesem Problem
beschäftigen, der besonderen Aufmerksamkeit der National Security Agency in den USA.

2.7.8.2 Das quadratische Reziprozitätsgesetz

Wir studieren die Lösbarkeit der beiden Gleichungen

x2 ≡ q mod p (2.96)

und

x2 ≡ p mod q. (2.97)

Legendresymbol: Wir setzen


  
q 1, falls (2.96) lösbar ist,
:=
p −1, falls (2.96) nicht lösbar ist.

Das quadratische Reziprozitätsgesetz von Gauß (1796): Sind p und q Primzahlen größer
als zwei, dann gilt

   
q p
= (−1)( p−1)(q−1)/4 .
p q

Ferner hat man


   
−1 2
= (−1)( p−1)/2 , = (−1)( p −1)/8 .
2

p p

Historische Bemerkung: Dieser Satz wurde unabhängig von Euler (1722), Legendre
(1785)und Gauß empirisch entdeckt. Den ersten vollständigen Beweis gab Gauß. Dieses Rezipro-
zitätsgesetz gehört mit seinen weitreichenden Verallgemeinerungen auf algebraische Zahlkörper
zu den tiefsten Gesetzmäßigkeiten der Zahlentheorie.
 Beispiel: Es sei p = 4n + 1 eine Primzahl, wobei n eine positive natürliche Zahl bezeichnet.
Dann ist die Gleichung

x2 ≡ −1 mod p
 
−1
lösbar, denn = 1.
p
2.7 Zahlentheorie 119

Satz von Gauß (1808): Es sei ε := e2πi/p , wobei p eine Primzahl bezeichnet. Dann gilt
! √
p −1  
k p für p ≡ 1 mod 4,
∑ p
ε =
k

i p für p ≡ 3 mod 4.
k =1

Derartige Summen heißen Gaußsche Summen. Um dieses Resultat hat Gauß lange Zeit
gerungen.

2.7.9 Minkowskis Geometrie der Zahlen

Gitter: Es seien b1 , . . . , bn linear unabhängige Spaltenvektoren des R n mit n ≥ 2. Die Punkt-


menge
!  "
n 

G := ∑ αk bk  α1 , . . . , αn ganze Zahlen
k =1

heißt ein Gitter des Rn . Die Zahl Vol ( G ) := |det (b1 , . . . , bn )| ist gleich dem Volumen des von
b1 , . . . , bn aufgespannten Quaders und wird Gittervolumen genannt.

Gitterpunktsatz von Minkowski (1891): Es sei G ein Gitter, und K sei eine konvexe Menge,
die zentralsymmetrisch zum Ursprung liegt, d. h., aus x ∈ K folgt − x ∈ K. Gilt für das Volumen
Vol (K ) von K die Ungleichung

Vol (K ) ≥ 2n Vol ( G )

dann enthält K einen Gitterpunkt x = 0.


 Beispiel: Ist K eine Kugel des R3 um den Ursprung mit Vol ( K ) ≥ 8, dann enthält K einen
ganzzahligen Gitterpunkt x = 0.

2.7.10 Das fundamentale Lokal-Global-Prinzip der Zahlentheorie

2.7.10.1 Bewertungen eines Körpers

Definition: Gegeben sei ein Körper K. Eine (reelle) Bewertung von K ordnet jedem Element u
in K eine reelle Zahl B(u) ≥ 0 zu mit folgenden Eigenschaften:

(i) B (u) = 0 genau dann, wenn u = 0.


(ii) B (uv) = B(u) B(v) und B(u + v) ≤ B( u) + B(v) für alle u, v ∈ K.

 Beispiel 1: Die triviale Bewertung lautet B(0) = 0 und B( u) = 1 für u = 0.


 Beispiel 2: Es sei Q der Körper der rationalen Zahlen. Durch

B∞ ( u) := |u|

ergibt sich eine Bewertung von Q.


Ist p eine feste Primzahl, dann lässt sich jede Zahl u = 0 in Q in der Form
a m
u= p
b
120 2 Algebra

darstellen, wobei m eine ganze Zahl ist, und die beiden Zahlen a und b nicht durch p teilbar
sind. Setzen wir

B p ( u ) := p −m ,

dann erhalten wir die sogenannte p-adische Bewertung von Q.

2.7.10.2 p-adische Zahlen

Jeder metrische Raum X lässt sich zu einem vollständigen metrischen Raum Y erweitern. Diese
Erweiterung ist bis auf Isometrie eindeutig (vgl. 11.2.2).
Der Körper Q der rationalen Zahlen wird durch

d(u, v) := B∞ ( u − v)

zu einem metrischen Raum. Die Vervollständigung dieses metrischen Raumes ergibt den Körper
R der reellen Zahlen.
Wählen wir dagegen die p-adische Bewertung B p , dann liefert die Vervollständigung von Q
bezüglich der Metrik

d(u, v) := B p (u − v)

den Körper Q p der p-adischen Zahlen.



 Beispiel: Eine unendliche Reihe ∑ an ist genau dann in Q p konvergent, wenn ( an ) eine
n =0
Nullfolge ist.
Ein derart einfaches Resultat steht in R nicht zur Verfügung.

Satz von Ostrowski (1918): Hat man eine nichttriviale Bewertung B des Körpers Q der
rationalen Zahlen, dann ergibt der Vervollständigungsprozess von Q bezüglich der Metrik
d(u, v) := B(u − v) entweder den Körper R oder einen der p-adischen Zahlkörper Q p

Kommentar: Stellt man sich auf den Standpunkt, dass die rationalen Zahlen eindeutig durch
die natürlichen Zahlen bestimmt sind, dann zeigt der Satz von Ostrowski, dass der klassische
Abstraktionsprozess von Q zum Körper R der reellen Zahlen nicht zwingend ist, sondern
dass man auch den Übergang von Q zu Q p in Betracht ziehen kann und sich damit aber alle
Möglichkeiten erschöpfen.
Die p-adischen Zahlen wurden 1904 von Hensel in die Zahlentheorie eingeführt und erwiesen
sich als ein fundamentales Instrument. Es gibt Mathematiker und Physiker, die der Meinung sind,
dass die bisherige theoretische Physik so unvollkommen ist, weil sie aus historischen Gründen
auf den Körper der reellen Zahlen fixiert ist und nicht die zusätzlichen Körper Q p berücksichtigt.

2.7.10.3 Der Satz von Minkowski-Hasse

Wir betrachten die Gleichung

a1 x12 + . . . + an x2n = 0. (2.98)

Dabei seien a1 , . . . , an rationale Zahlen ungleich null.


2.7 Zahlentheorie 121

Satz: Besitzt die Gleichung (2.98) eine nichttriviale Lösung


x1 , . . . , x n ∈ K (2.99)
für K = R und alle K = Q p (p beliebige Primzahl), dann hat sie auch eine nichttriviale Lösung
x1 , . . . , xn ∈ Q. (2.100)

Kommentar: Man nennt die Lösungen (2.99) lokal und die Lösungen (2.100) global. Der Satz
besagt somit, dass aus der lokalen Lösbarkeit von (2.98) die globale Lösbarkeit folgt. Das ist
der Spezialfall eines allgemeinen Lokal-Global-Prinzips der Zahlentheorie, das die Bedeutung der
p-adischen Zahlen unterstreicht.

2.7.11 Ideale und höhere Teilbarkeitslehre

Jede natürliche Zahl lässt sich als ein Produkt von Primzahlen darstellen. Dieser Tatbestand gilt
nicht für allgemeine Ringe. Dort muss man die Idealtheorie benutzen (vgl. Abb. 2.8).
Euklidische Ringe

Hauptidealringe

Ringe mit eindeutiger Noethersche Ringe


Primelementzerlegung

Satz von Lasker-Noether Abb. 2.8

Den Ausgangspunkt für die Idealtheorie bildete eine Arbeit von Kummer aus dem Jahre
1843, die einen irrigen Beweis für die Fermatsche Vermutung enthielt. Dirichlet erkannte den
Fehler, der darin bestand, dass in allgemeineren Zahlbereichen der Satz von der eindeutigen
Zerlegung in Primelemente nicht mehr gilt. Daraufhin beschäftigte sich Kummer mit diesem
Zerlegungsproblem. Durch Einführung idealer Zahlen erhielt er verallgemeinerte Zerlegungsätze,
die ihm den Beweis der Fermatschen Vermutung in Spezialfällen ermöglichten. Dedekind
führte 1871 den Begriff des Ideals ein und begründete damit die Idealtheorie, die heute im
Zusammenhang mit Operatorenalgebren auch in der modernen mathematischen Physik eine
wichtige Rolle spielt (vgl. 11.7).

2.7.11.1 Grundbegriffe

Es sei R ein Integritätsbereich mit Einselement, d. h., R ist ein kommutativer Ring ohne Nullteiler.

Einheiten: Ein Element ε von R heißt genau dann eine Einheit, wenn auch ε−1 zu R gehört.
 Beispiel 1: Im Ring Z der ganzen Zahlen sind ±1 die einzigen Einheiten.

Primelement: Ein Ringelement p heißt genau dann ein Primelement, wenn p = 0 gilt und aus
der Zerlegung
p = ab
folgt, dass a oder b eine Einheit ist.
122 2 Algebra

Eindeutige Zerlegung in Primelemente: Definitionsgemäß liegt diese Eigenschaft in R ge-


nau dann vor, wenn sich jedes Ringelement ungleich null (bis auf Einheiten und bis auf die
Reihenfolge der Primelemente) eindeutig als Produkt von Primelementen schreiben lässt.
 Beispiel 2: Der Ring Z der ganzen Zahlen besitzt diese Eigenschaft.

2.7.11.2 Hauptidealringe und Euklidische Ringe

Es sei R ein kommutativer Ring mit Einselement.

Ideale: Eine nichtleere Teilmenge A von R heißt genau dann ein Ideal, wenn gilt:

(i) Aus a, b ∈ A folgt a − b ∈ A.


(ii) Aus a ∈ A und r ∈ R folgt ra ∈ A.

Mit ( a) bezeichnen wir das kleinste Ideal, das a enthält. Explizit gilt ( a) = {ra : r ∈ R}. Diese
Ideale heißen Hauptideale.

Hauptidealringe: Genau die Integritätsbereiche mit Einselement, in denen jedes Ideal ein
Hauptideal ist, heißen Hauptidealringe.

Satz 1: Jeder Hauptidealring besitzt die Eigenschaft der eindeutigen Zerlegung in Primele-
mente.

Euklidische Ringe: Ein Integritätsbereich mit Einselement heißt genau dann ein Euklidischer
Ring, wenn jedem Ringelement r = 0 eine ganze Zahl h (r ) ≥ 0 zugeordnet wird, so dass gilt:

(i) h(rs) ≥ h(r ) für alle r = 0 und s = 0.


(ii) Zu zwei Ringelementen a und b mit b = 0 gibt es eine Darstellung

a = qb + r,

für die entweder r = 0 oder h(r ) < h( b). gilt.

Satz 2: Jeder Euklidische Ring ist ein Hauptidealring.


 Beispiel 1: Der Ring Z der ganzen Zahlen ist ein Euklidischer Ring mit h(r ) := |r |.
 Beispiel 2: Ist K ein Körper, dann bildet die Menge K [ x] der Polynome in x mit Koeffizienten
in K einen Euklidischen Ring. Die Höhe eines Polynoms ist sein Grad.
Die Einheiten in K [ x] sind die von null verschiedenen Elemente von K. Die Primelemente in
K [ x ] werden auch irreduzible Polynome genannt. .
Der Polynomring Z [ x ] ist kein Hauptidealring.

Primideale und Primärideale: Es sei A ein Ideal des Rings R.

(i) A heißt genau dann ein Primideal, wenn der Faktorring R/A nullteilerfrei ist.
(ii) A heißt genau dann ein Primärideal, wenn die Nullteiler von R/A idempotent sind (d. h.,
eine ihrer Potenzen ist gleich null).

Satz 3: Zu jedem Primärideal A gehört ein Primideal, das aus allen Ringelementen besteht,
von denen eine Potenz zu A gehört.
 Beispiel 3: Im Ring Z der ganzen Zahlen ist ( p) genau dann ein Primideal, wenn p eine
Primzahl ist).
Ferner ist ( a) genau dann ein Primärideal, wenn a eine Primzahlpotenz ist.
2.7 Zahlentheorie 123

2.7.11.3 Der Satz von Lasker-Noether

Mit ( a1 , . . . , as ) bezeichnen wir das kleinste Ideal, das von den Ringelementen a1 , . . . , as erzeugt
wird

Noethersche Ringe: Ein Ring heißt genau dann ein Noetherscher Ring, wenn er kommutativ
ist und jedes Ideal durch endlich viele Elemente erzeugt wird.

Der Basissatz von Hilbert (1893): Ist R ein Noetherscher Ring mit Einselement, dann gilt
das auch für jeden Polynomring R[ x1 , . . . , xn ] in n Variablen mit Koeffizienten in R.
Der folgende Satz stellt den Hauptsatz der Teilbarkeitslehre in Ringen dar.
Der Satz von Emanuel Lasker (1905) und Emmy Noether (1926): Es sei R ein Noether-
scher Ring. Dann lässt sich jedes Ideal von R in unverkürzbarer Weise als Durchschnitt von
Primäridealen darstellen, deren zugehörige Primideale alle verschieden sind.
Zwei derartige Darstellungen besitzen die gleiche Anzahl von Primäridealen und (bis auf die
Reihenfolge) die gleichen zugehörigen Primideale.

Produkte von Idealen: Sind A und B Ideale eines Rings R, dann bezeichnet man mit
AB
das kleinste Ideal, das alle Produkte ab mit a ∈ A und b ∈ B enthält. Ferner sind A ∩ B und
A + B := { a + b | a ∈ A, b ∈ B } Ideale.

2.7.12 Anwendungen auf quadratische Zahlkörper



Der Körper Q ( d): Es sei d eine ganze Zahl mit d = 0 und d = 1. Ferner sei d nicht durch√
das
Quadrat einer Primzahl teilbar. Definitionsgemäß besteht der quadratische Zahlkörper Q( d)
aus allen Zahlen

a+b d mit a, b ∈ Q,

wobei Q den Körper der rationalen Zahlen bezeichnet. Die konjugierte Zahl z zu z := a + b d
lautet definitionsgemäß

z := a − b d.
Ferner definieren wir die Norm N(z) und die Spur tr(z) von z durch
N(z) := zz und tr ( z) := z + z .

Satz 1: Jeder Erweiterungskörper K des Körpers√ Q der rationalen Zahlen vom Grad 2 ist
isomorph zu einem quadratischen Zahlkörper Q ( d).
Die Galoisgruppe von K über Q besteht aus den durch
ϕ+ (z) := z und ϕ− ( z ) := z 
gegebenen Automorphismen ϕ± : K → K.

Ganze Zahlen: Eine Zahl z ∈ Q ( d) heißt genau dann ganz, wenn sie einer Gleichung der
Form
z n + a n −1 z n − 1 + . . . + a 1 z + a 0 = 0
124 2 Algebra

genügt mit ganzzahligen Koeffizienten


√ a0 , . . . , an−1 und einer positiven natürlichen Zahl n. Die
Menge der ganzen Zahlen von Q ( d) wird mit Gd bezeichnet.

Satz 2: Für d ≡ 2 mod 4 und d ≡ 3 mod 4 gilt



Gd := { a + b d | a, b ∈ Z }, D := 4d,

und für d ≡ 1 mod 4 hat man


! √  "
1 + d 
Gd := a + b  a, b ∈ Z , D := d.
2

Die Zahl D heißt die Diskriminante von Q( d).

Korollar: Die Einheiten in dem Ring G sind:

±1, ±i für d = −1,


für d = −3 mit η := eiπ/3 ,
1, η, . . . , η 5
1, −1 für d < 0, d = −1, −3,
±εk , k ∈ Z für d > 0.

Dabei gilt ε := x + y d, wobei ( x, y) die kleinste Lösung der Fermatschen Gleichung x2 − dy2 = 1
mit x, y ∈ N darstellt (vgl. 3.8.6.1).

Der fundamentale Zerlegungssatz von Dedekind (1871): Gd ist ein Ring, in dem jedes Ideal
A = 0 in eindeutiger Weise (bis auf die Reihenfolge) als Produkt von Primidealen geschrieben
werden kann.

 Beispiel 1: Es sei d = −5. Im Körper Q ( −5) hat man die beiden Zerlegungen

9 = 3·3

und
√ √
9 = (2 + −5)(2 − −5)
der Zahl 9 in Primelemente, d. h., die Zerlegung in Primelemente ist im Ring G−5 nicht eindeutig.
Geht man jedoch zu dem Hauptideal (9) über, dann erhält man die eindeutige Zerlegung

(9) = PQ
√ √
mit den Primidealen P := (3, 2 + −5) und Q := (3, 2 − − 5 ).
 Beispiel 2:

(i) Es sei d < 0. Dann gilt in Gd genau dann der Satz von der eindeutigen Zerlegung in
Primelemente, wenn

d = −1, −2, −3, −7, −11, −19, −43, −67, −163.

Genau für d = −1, −2, −3, −7 und −11 ist Gd ein Euklidischer Ring.
(ii) Es sei d > 0. Dann ist Gd genau dann ein Euklidischer Ring, wenn

d = 2, 3, 5, 6, 7, 11, 13, 17, 19, 21, 29, 33, 37, 41, 57, 73.

In diesen Ringen Gd liegt eine eindeutige Zerlegung in Primelemente vor. Eine vollständige
Beschreibung aller Ringe Gd mit eindeutiger Zerlegung in Primelemente ist im Fall d > 0 bis
heute ein ungelöstes Problem.
2.7 Zahlentheorie 125


Gebrochene Ideale: Eine Teilmenge A von Q( d) heißt genau dann ein gebrochenes Ideal,
wenn gilt:

(i) Genau die Elemente von A lassen sich in der Form

a 1 z1 + . . . + an z n

schreiben mit festen Zahlen z1 , . . . , zn aus Q ( d ) und beliebigen Koeffizienten a1 , . . . , an ∈ Z.
(ii) Aus z ∈ A und r ∈ Od folgt rz ∈ A.

 Beispiel 3: Gd ist ein gebrochenes Ideal.


Zwei gebrochene Ideale√A und B heißen genau dann äquivalent, wenn A = hB gilt mit einer
festen Zahl h = 0 aus Q ( d). Sind A und B gebrochene Ideale, dann bezeichnet man mit

AB

das kleinste gebrochene Ideal, welches alle Produkte ab mit a ∈ A und b ∈ B enthält.

√ Klassenzahl von Q ( d): Die Menge der Äquivalenzklassen gebrochener
Die fundamentale
Ideale von Q ( d ) bildet bezüglich der Multiplikation
√ AB eine endliche kommutative Grup-
pe, die man die Klassengruppe
√ von Q ( d ) nennt und deren Ordnung (Elementanzahl) die
Klassenzahl von Q ( d) heißt.
Diese Begriffsbildung geht auf die Disquisitiones arithmeticae von Gauß (1801) zurück. Je
größer die Klassenzahl ist, um so komplizierter ist die Struktur von Gd .

Satz 3: Gd ist genau dann ein Hauptidealring, wenn die Klassenzahl √ von Q ( d) gleich eins
ist, d. h., bis auf Äquivalenz ist Gd das einzige gebrochene Ideal in Q ( d).
 Beispiel 4: Alle Euklidischen Ringe in Beispiel 2 sind Hauptidealringe und besitzen somit die
Klassenzahl eins.

2.7.13 Die analytische Klassenzahlformel


Im Jahre 1855, nach Gauß’ Tod, bemühte sich die Universität Göttingen, welche ein
halbes Jahrhundert hindurch den Ruhm genossen hatte, den ersten aller lebenden
Mathematiker zu besitzen, durch Dirichlet’s Berufung an Gauß’ Stelle sich diesen
Ruhm auch ferner zu erhalten.
Eduard Kummer (1810–1893)

Dirichlet (1805–1859) setzte als erster systematisch analytische Methoden in der Zahlentheorie
ein und schuf damit die analytische Zahlentheorie. Unter anderem erhielt er mit Hilfe seiner
L-Reihen eine Klassenzahlformel.

Klassenzahlformel: Für die Klassenzahl k von h( d) of Q ( d) hat man


⎪ 1 für d = −1, −3,



⎨ 1
h(d) = | D | L(1, χ) für d < 0, d = −1, −3,
⎪ π

⎪ √

⎪ D
⎩ L(1, χ) für d > 0.
2 ln ε
Dabei ist D die Diskriminante und ε die Grundeinheit. Ferner gilt

χ( n)
L(s, χ) := ∑ ns
n =1
126 2 Algebra

mit
⎧  

⎪ n


⎪ ∏ p
für d ≡ 1 mod 4,

⎪ p| d

⎪  

⎨ n
χ(n) := (−1)(n−1)/2 ∏ für d ≡ 3 mod 4,
⎪ p| d
p



⎪  

⎪ n




(− 1 ) ρ
∏ p für d = 2δ und δ ungerade,
p|δ

n2 − 1 (n − 1)(δ − 1)
sowie ρ := + . Die Produkte sind über alle Primzahlen p zu nehmen, die
8 4  
n
Teiler von d (bzw. von δ) sind. Ferner ist das Legendresymbol (vgl. 2.7.8.2.). Man bezeichnet
√ p
χ als den Charakter von Q ( d).

2.7.14 Die Hilbertsche Klassenkörpertheorie für allgemeine Zahlkörper


Die Theorie der Zahlkörper ist wie ein Bauwerk von wunderbarer Schönheit und
Harmonie.
David Hilbert,
Zahlbericht (1895)

Das endgültige Ziel der Körpertheorie besteht darin, eine vollständige Klassifikation aller
Körper zu geben. Bereits im scheinbar einfachen Fall der algebraischen Zahlkörper erweist sich
diese Aufgabe als sehr schwierig.

Abelsche Körpererweiterungen von Zahlkörpern: Eine Körpererweiterung von K zu L heißt


genau dann abelsch, wenn die zugehörige Galoisgruppe abelsch (d. h. kommutativ) ist.
Unter einem algebraischen Zahlkörper versteht man eine endliche Körpererweiterung des
Körpers Q der rationalen Zahlen. Ist K ein algebraischer Zahlkörper, dann möchte man alle seine
endlichen abelschen Erweiterungen L studieren.
Zu diesem Zweck betrachtet man eine spezielle endliche Erweiterung H ( K ) von K, die man
den Hilbertschen Klassenkörper von K nennt. Dieser Körper H ( K ) enthält wichtige Informationen.
√ √
 Beispiel: Der Hilbertsche Klassenkörper zu K = √
Q ( −5) ist H (K ) = Q (i, 5), d. h., H ( K ) ist
der kleinste Erweiterungskörper von Q, der i und 5 enthält.
Eine Darstellung der modernen Klassenkörpertheorie auf der Basis der homologischen Algebra
(Kohomologie von Gruppen) einschließlich sehr tiefliegender Reziprozitätsgesetze findet man
in [Koch 1992]. Dabei kommen weitreichende Formulierungen des Lokal-Global-Prinzips der
Zahlentheorie zum Tragen, die die Idealtheorie mit der Bewertungstheorie verknüpfen und die
Theorie der p-adischen Zahlen verallgemeinern (vgl. 2.7.10.3).
Den Ausgangspunkt der Hilbertschen Theorie bildete das folgende klassische Resultat von
Kronecker und Weber (1887).

Satz: Jede endliche abelsche Erweiterung L des Körpers Q der rationalen Zahlen ist in einem
Kreisteilungskörper Q (ζ n ) enthalten.

Kommentar: Dabei gilt ζ n := e2πi/n , und Q ( ζ ) bezeichnet den kleinsten Körper in C, der ζ n
enthält. Die Galoisgruppe der Erweiterung von Q zu Q ( ζ n ) ist gleich (Z/nZ )× (Gruppe der
Einheiten im Restklassenring Z/nZ der Restklassen von Z modulo n). Aus der Galoistheorie
Literatur zu Kapitel 2 127

folgt, dass eine bijektive Abbildung

U→L

existiert zwischen der Menge aller Untergruppen U von (Z/nZ )× und der Menge aller abelschen
Erweiterungskörper L von Q, die in Q ( ζ n ) enthalten sind.

Literatur zu Kapitel 2
[Aigner 2011] Aigner, M.: Zahlentheorie. Vieweg+Teubner. Wiesbaden (2011)
[Apostol 1986] Apostol, T.: Introduction to Analytic Number Theory. Springer, New York (1986)
[Apostol 1990] Apostol, T.: Modular Functions and Dirichlet Series in Number Theory. Springer, New York
(1990)
[Berndt 1985/95] Berndt, B. (ed.): Ramanunjan’s Notebook. Part I–IV. Springer, New York (1985/95)
[Beutelspacher 2010] Beutelspacher, A.: Lineare Algebra. 7. Auflage. Vieweg+Teubner, Wiesbaden (2010)
[Bewersdorff 2009] Bewersdorff, J.: Algebra für Einsteiger. 4. Auflage. Vieweg+Teubner, Wiesbaden (2009)
[Birkhoff und Bartee 1970] Birkhoff, G., Bartee, T.: Modern Applied Algebra. McGraw-Hill, New York(1970)
[Borwein et al. 1989] Borwein, J., Borwein, P.: Ramanunjan, modular equations, and approximations to π, or
how to compute one billion digits of π. The American Mathematical Monthly 96, 201–219 (1989)
[Bosch 2009] Bosch, S.: Algebra. 7. Auflage. Springer, Heidelberg (2009)
[Bosch 2008] Bosch, S.: Lineare Algebra. 4. Auflage. Springer, Heidelberg (2008)
[Brüdern 1995] Brüdern, J.: Einführung in die analytische Zahlentheorie. Springer, Berlin (1995)
[Bundschuh 2008] Bundschuh, P.: Einführung in die Zahlentheorie. 6. Auflage. Springer, Heidelberg (2008)
[Burg et al. 2008] Burg, K., Haf, H., Wille, F., Meister, A.: Höhere Mathematik für Ingenieure Band II. Lineare
Algebra. 6. Auflage. Teubner, Wiesbaden (2008)
[Diamond und Shurman 2005] Diamond, F., Shurman, J.: A First Course in Modular Forms. Springer, New
York (2005)
[Fischer 2011, 1] Fischer, G.: Lehrbuch der Algebra. 2. Auflage. Vieweg+Teubner, Wiesbaden (2011)
[Fischer 2011, 2] Fischer, G.: Lernbuch Lineare Algebra und Analytische Geometrie. Vieweg+Teubner, Wies-
baden (2011)
[Fischer 2011, 3] Fischer, G.: Lineare Algebra. 17. Auflage. Vieweg+Teubner, Wiesbaden (2011)
[Greub 1967] Greub, W.: Multilineare Algebra. Springer, Berlin (1967)
[Huppert und Willems 2010] Huppert, B., Willems, W.: Lineare Algebra. 2. Auflage. Vieweg+Teubner, Wies-
baden (2010)
[Jänich 2008] Jänich, K.: Lineare Algebra. 11. Auflage. Springer, Heidelberg (2008)
http://www.springer.com/mathematics/algebra/book/978-3-540-75501-2
[Jantzen und Schwermer 2006] Jantzen, J. C., Schwermer, J.: Algebra. Springer, Heidelberg (2006)
[Kanigel 1995] Kanigel, R.: Der das Unendlich kannte. Das Leben des genialen indischen Mathematikers
Srinivasa Ramanunjan. 2. Auflage, Vieweg, Wiesbaden (1995)
[Koch 1992] Koch, H.: Algebraic number fields. In: A. Parshin, I. Shafarevich (Hrsg.), Number Theory II,
Enyclopedia of Mathematical Sciene, Berlin (1992)
[Kühnel 2011] Kühnel, W.: Matrizen und Lie-Gruppen. Vieweg+Teubner, Wiesbaden (2011)
[Karpfinger et al. 2010] Karpfinger, C., Meyberg, K.: Algebra. 2. Auflage. Spektrum Akademischer Verlag,
Heidelberg (2010)
[Kowalsky und Michler 2003] Kowalsky, H.-J., Michler, G.: Lineare Algebra. 12. Auflage. De Gruyter, Berlin
(2003)
[Lang 1995] Lang, S.: An Introduction to Diophantine Approximations. Springer, New York (1995)
[Lang 2002] Lang, S.: Algebra, Springer, New York (2002)
[Müller-Stach und Piontkowski 2011] Müller-Stach, S., Piontkowski, J.: Elementare und algebraische Zah-
lentheorie. 2. Auflage. Vieweg+Teubner, Wiesbaden (2011)
128 Allgemeine Literaturhinweise

[Perron 1977] Perron, O.: Die Lehre von den Kettenbrüchen, Bd. 1, 2, Teubner, Stuttgart (1977)
[Scharlau und Opolka 1980] Scharlau, W., Opolka, H.: Von Fermat bis Minkowski. Springer, Berlin (1980)
[Scheid und Frommer 2006] Scheid, H., Frommer, A.: Zahlentheorie. 4. Auflage. Spektrum Akademischer
Verlag (2006)
[Schroeder 1986] Schroeder, M.: Number Theory in Science and Communication. With Applications in
Crytography, Physics, Biology, Digital Communication, and Computing. Springer, Berlin (1986)
[Schulze-Pillot 2008] Schulze-Pillot, R.: Einführung in Algebra und Zahlentheorie. 2. Auflage. Springer, Hei-
delberg (2008) http://www.springer.com/mathematics/algebra/book/978-3-540-79569-8
[Stoppel und Griese 2011] Stoppel, H., Griese, B.: Übungsbuch zur Linearen Algebra. 7. Auflage. Vie-
weg+Teubner, Wiesbaden (2011)
[Strang 2003] Strang, G.: Lineare Algebra. Springer, Heidelberg (2003)
[van der Waerden 1993] van der Waerden, B.: Algebra. 6. Auflage, Bd. 1, 2, Springer, Berlin (1993)
[Varadarajan 2006] Varadarajan, V.: Euler through Time: A New Look at Old Themes. Amer. Math. Soc.,
Providence, Rhode Island (2006)
[Waldschmidt et al. 1992] Waldschmidt, M. et al.: From Number Theory to Physics. Springer, Berlin (1992)
[Wolfart 2011] Wolfart, J.: Einführung in die Zahlentheorie und Algebra. 2. Auflage. Vieweg+Teubner,
Wiesbaden (2011)
[Wüstholz 2004] Wüstholz, G.: Algebra. Vieweg, Wiesbaden (2004)
[Zagier 1981] Zagier, D.: Zetafunktionen und quadratische Körper: Eine Einführung in die höhere Zahlen-
theorie. Springer, Berlin (1981)

Allgemeine Literaturhinweise
[Deiser 2008] Deiser, O.: Reelle Zahlen. 2. Auflage. Springer, Heidelberg (2008)
http://www.springer.com/mathematics/book/978-3-540-79375-5
[Deiser 2010, 1] Deiser, O.: Einführung in die Mengenlehre. 3. Auflage. Springer, Heidelberg (2010)
[Deiser 2010, 2] Deiser, O.: Grundbegriffe der wissenschaftlichen Mathematik. Springer, Heidelberg (2010)
[Ebbinghaus et al. 1992] Ebbinghaus, H.-D., Hermes, H., Hirzebruch, F., Koecher, M., Mainzer, K., Neukirch,
J., Prestel, A., Remmert, R.: Zahlen. 3. Auflage. Springer, Heidelberg (1992)
[Luderer et al. 2011] Luderer, B., Nollau, V., Vetters, K.: Mathematische Formeln für Wirtschaftswissenschaft-
ler. 7. Auflage. Vieweg+Teubner, Wiesbaden (2011)
[Papula 2009] Papula, L.: Mathematische Formelsammlung. 10. Auflage. Vieweg+Teubner, Wiesbaden (2009)
[Rade und Westergren 2011] Rade, L., Westergren, B.: Springers Mathematische Formeln. 3. Auflage, Sprin-
ger, Heidelberg (2000)
K APITEL 3

G EOMETRIE

Wer die Geometrie versteht, der versteht alles in der Welt.


Galileo Galilei (1564–1642)

Geometrie ist die Invariantentheorie von Transformationsgruppen.


Felix Klein,
Erlanger Programm 1872

3.1 Die Grundidee der Geometrie (Erlanger Programm)

Die Geometrie der Antike war die euklidische Geometrie, die über 2000 Jahre lang die Mathematik
beherrschte. Die berühmte Frage nach der Existenz nichteuklidischer Geometrien führte im 19.
Jahrhundert zur Entwicklung einer Reihe von unterschiedlichen Geometrien. Daraus ergab sich
das Problem der Klassifizierung von Geometrien. Der dreiundzwanzigjährige Felix Klein löste
das Problem und zeigte im Jahre 1872 mit seinem Erlanger Programm, wie man Geometrien
mit Hilfe der Gruppentheorie übersichtlich klassifizieren kann. Man benötigt dazu eine Gruppe
G von Transformationen. Jede Eigenschaft oder Größe, die bei Anwendung von G invariant
(d. h. unverändert) bleibt, ist eine Eigenschaft der zu G gehörigen Geometrie, die man auch
G-Geometrie nennt. Von diesem Klassifizierungsprinzip werden wir in diesem Kapitel ständig
Gebrauch machen. Wir wollen die Grundidee am Beispiel der euklidischen Geometrie und der
Ähnlichkeitsgeometrie erläutern.

Euklidische Geometrie (Geometrie der Bewegungen): Wir betrachten eine Ebene E. Mit
Aut ( E) bezeichnen wir die Gesamtheit aller Abbildungen von E auf E, die sich aus folgenden
Transformationen zusammensetzen:
(i) Verschiebungen (Translationen),
(ii) Drehungen um irgendeinen Punkt und
(iii) Spiegelungen an einer festen Geraden (Abb. 3.1).
Genau alle Zusammensetzungen derartiger Transformationen heißen Bewegungen1 von E.
Durch das Produktsymbol

hg

bezeichnen wir diejenige Bewegung, die sich ergibt, wenn wir zunächst die Bewegung g und
dann die Bewegung h ausführen. Mit dieser Multiplikation hg wird

Aut ( E)

1
Alle Transformationen von E, die sich nur aus Verschiebungen und Drehungen zusammensetzen, heißen eigentliche
Bewegungen von E.

E. Zeidler (Hrsg.), Springer-Handbuch der Mathematik II,


DOI 10.1007/978-3-658-00297-8_2, © Springer Fachmedien Wiesbaden 2013
130 3 Geometrie

a) Translation b) Drehung um
einen Punkt

c) Spiegelung an d) Ähnlichkeits- Abb. 3.1


einer Geraden transformation

zu einer Gruppe. Das neutrale Element e in Aut (E) entspricht der Ruhe (keine Bewegung).
Definitionsgemäß gehören alle diejenigen Eigenschaften und Größen zur euklidischen Geometrie
der Ebene E, die bei Bewegungen invariant bleiben. Das sind zum Beispiel die Begriffe „Länge
einer Strecke“ und „Kreis vom Radius“.

Kongruenz: Zwei Teilmengen der Ebene (z. B. Dreiecke) heißen genau dann kongruent, wenn
sie sich durch eine Bewegung ineinander überführen lassen. Die Kongruenzsätze für Dreiecke
sind Sätze der euklidischen Geometrie (vgl. 3.2.1.5).

Ähnlichkeitsgeometrie: Unter einer speziellen Ähnlichkeitstransformation der Ebene E ver-


stehen wir eine Abbildung von E auf E, bei der alle Geraden durch einen festen Punkt P wieder in
sich übergehen und dabei alle Abstände P mit einem festen positiven Faktor multipliziert werden.
Der Punkt P heißt das Ähnlichkeitszentrum. Mit Ähnlich (E) bezeichnen wir die Gesamtheit aller
Abbildungen von E auf E, die sich aus Bewegungen und speziellen Ähnlichkeitstransformationen
zusammen setzen. Dann bildet

Ähnlich(E)

bezüglich der Zusammensetzung hg eine Gruppe, die man die Gruppe der Ähnlichkeitstransfor-
mationen von E nennt.
Der Begriff „Länge einer Strecke“ ist kein Begriff der Ähnlichkeitsgeometrie. Dagegen ist „das
Verhältnis zweier Strecken“ ein Begriff der Ähnlichkeitsgeometrie.

Ähnlichkeit: Zwei Teilmengen von E (z. B. Dreiecke) heißen genau dann ähnlich, wenn sie sich
durch eine Ähnlichkeitstransformation ineinander überführen lassen. Die Ähnlichkeitssätze für
Dreiecke sind Sätze der Ähnlichkeitsgeometrie (vgl. 3.2.1.6).
Jede technische Zeichnung ist ein ähnliches Bild der Wirklichkeit.

3.2 Elementare Geometrie

Wenn nicht ausdrücklich das Gegenteil betont wird, beziehen sich alle Winkelangaben auf das
Bogenmaß (vgl. 0.1.2).
3.2 Elementare Geometrie 131

3.2.1 Ebene Trigonometrie

Bezeichnungen: Ein ebenes Dreieck besteht aus drei Punkte, die nicht auf einer Geraden
liegen, und den zugehörigen Verbindungsstrecken. Die den Seiten a, b, c gegenüberliegenden
Winkel werden der Reihe nach mit α, β, γ bezeichnet (Abb. 3.2). Ferner setzen wir:
1
s= ( a + b + c) (halber Umfang),
2
F Flächeninhalt, h a Höhe des Dreiecks über der Seite a,
R Umkreisradius, r Inkreisradius.

Der Umkreis ist der kleinste Kreis, in dem das Dreieck enthalten ist und der durch die drei
Eckpunkte geht. Der Inkreis ist der größte Kreis, den das Dreieck enthält.

C · C
ha b
b γ a γ a
α β α β
A c B A c B
a) b) Abb. 3.2

3.2.1.1 Vier fundamentale Gesetze für Dreiecke

Winkelsummensatz: α + β + γ = π. (3.1)

Kosinussatz: c2 = a2 + b2 − 2ab cos γ. (3.2)

a sin α
Sinussatz: = . (3.3)
b sin β

α− β α− β
a−b tan 2 tan
Tangenssatz: = α+ β
= 2
γ . (3.4)
a+b tan 2 cot 2

Dreiecksgleichung: c < a + b.

Umfang: C = a + b + c = 2s.

Höhe: Für die Höhe des Dreiecks über der Seite a gilt (Abb. 3.2b):

h a = b sin γ = c sin β.

Flächeninhalt: Man hat die Höhenformel

1 1
F= h a a = ab · sin γ.
2 2

In Worten: Der Flächeninhalt eines Dreiecks ist gleich dem halben Produkt aus Seite und Höhe.
132 3 Geometrie

Ferner kann man auch die Heronische Formel2 benutzen:

F= s(s − a)(s − b)(s − c) = rs.

In Worten: Der Flächeninhalt eines Dreiecks ist gleich dem halben Produkt aus Inkreisradius
und Umfang.

Weitere Dreiecksformeln:

γ (s − a)(s − b)
Halbwinkelsätze: sin = ,
2 ab

γ s(s − c ) γ sin γ2
cos = , tan = .
2 ab 2 cos γ2
α− β α− β
a+b cos 2 cos
Mollweidsche Formeln: = α+ β
= 2
γ ,
c cos 2 sin 2
α− β α− β
a−b sin 2 sin
= α+ β
= 2
γ .
c sin 2 cos 2
c sin α c sin β
Tangensformel: tan γ = = .
b − c cos α a − c cos β
Projektionssatz: c = a cos β + b cos α . (3.5)

Zyklische Vertauschung: Weitere Formeln erhält man aus den Formeln (3.1) bis (3.5) durch
zyklische Vertauschung der Seiten und Winkel:
a −→ b −→ c −→ a und α −→ β −→ γ −→ α.

Spezielle Dreiecke: Ein Dreieck heißt genau rechtwinklig, wenn ein Winkel gleich π/2 (d. h.,
gleich 90◦ ) ist (Abb. 3.3).

α
· a a a h
b a b a
γ h
α β α α α
c p q a a

a) γ = 90◦ b) h2 = pq α = 60◦ , h = 3a
2
2
Abb. 3.3 Rechtwinkliges Dreieck. Abb. 3.4 Gleichseitiges Dreieck.

Ferner heißt ein Dreieck genau dann gleichschenklig (bzw. gleichseitig) wenn zwei (bzw. drei)
Seiten gleich sind (Abb. 3.5 und Abb. 3.4).

Spitze und stumpfe Winkel: Der Winkel γ heißt genau dann spitz (bzw. stumpf), wenn γ
zwischen 0 und 90◦ (bzw. zwischen 90◦ und 180◦ ) liegt.

Dreiecksberechnung auf einem Taschenrechner: Um die im folgenden angegebenen For-


meln anwenden zu können, benötigt man die Werte für sin α, cos α usw. Diese findet man auf
jedem Taschenrechner.
2
Diese Formel ist nach Heron von Alexandria (1. Jahrhundert) benannt, der einer der bedeutendsten angewandten Mathe-
matiker der Antike war und zahlreiche Bücher zur angewandten Mathematik und Ingenieurwissenschaft veröffentlichte.
3.2 Elementare Geometrie 133

γ ·
a a a a a
γ α h
α α
α β α
A
c c h√ P Abb. 3.5 Gleichschenkliges
a) b) α = β = 45◦ , γ = 90◦ , h = a 2 2 Dreieck.

3.2.1.2 Das rechtwinklige Dreieck

Im rechtwinkligen Dreieck heißt die dem rechten Winkel gegenüberliegende Seite Hypotenuse.
Die beiden anderen Seiten nennt man Katheten. Beide Worte kommen aus dem Griechischen. Wir
benutzen im Folgenden die in Abb. 3.3 verwendeten Bezeichnungen.

Flächeninhalte:

1 a2 c2
F= ab = tan β = sin 2β.
2 2 4

Satz des Pythagoras:

c 2 = a 2 + b2 . (3.6)

In Worten: Das Quadrat über der Hypotenuse ist gleich der Summe der beiden Kathetenquadrate.
Wegen γ = π/2 und cos γ = 0, ist (3.6) ein Spezialfall des Kosinussatzes (3.2).

Höhensatz des Euklid:

h2 = pq.

In Worten: Das Höhenquadrat ist gleich dem Produkt der Hypotenusenabschnitte, die durch
Projektion der Katheten auf die Hypotenuse entstehen.

Kathetensätze des Euklid:

a2 = qc, b2 = pc.

In Worten: Das Kathetenquadrat ist gleich dem Produkt aus der Hypotenuse und der Projektion
dieser Kathete auf die Hypotenuse.

Winkelrelationen:

a b a b
sin α = , cos α = , tan α =, cot α = ,
c c b a
(3.7)
π
sin β = cos α, cos β = sin α, α+β = .
2

a
Wegen sin β = cos α geht der Sinussatz (3.3) in tan α = über. Man bezeichnet a (bzw. b) als
b
Gegenkathete (bzw. Ankathete) zum Winkel α.
134 3 Geometrie

Tabelle 3.1
r

Gegebene Bestimmung der übrigen Größen in einem recht-
Größen winkligen Dreieck c β a


r α
 r
b

a a π
a, b α = arctan , c= , β= −α
b sin α 2
a π
a, c α = arcsin , b = c cos α, β= −α
c 2
b π
b, c α = arccos , a = b tan α, β= −α
c 2
a π
a, α b = a cot α, c= , β= −α
sin α 2
π a
a, β α= − β, b = a cot α, c=
2 sin α
a π
b, α a = b tan α, c= , β= −α
sin α 2
π a
b, β α= − β, a = b tan α, c=
2 sin α

Berechnung rechtwinkliger Dreiecke: Alle an einem rechtwinkligen Dreieck auftretenden


Aufgaben kann man mit Hilfe von (3.7) lösen (vgl. Tabelle 3.1).
 Beispiel 1: (Abb. 3.5b): In einem gleichschenkligen rechtwinkligen Dreieck gilt für die Höhe über
der Seite c:

a 2
hc = .
2

Beweis: Das Dreieck APC in Abb. 3.5b ist rechtwinklig. Da die Winkelsumme im Dreieck 180◦
γ
beträgt, gilt α = β = 45◦ . Wegen = 45◦ ist das Dreieck APC rechtwinklig und gleichschenklig.
2 √
Somit
√ ergibt der Satz des Pythagoras: a2 = h2 + h2 . Daraus folgt h2 = a2 /2, also h = a/ 2 =
a 2/2. 
Ferner erhalten wir

◦ h 2
sin 45 = = , cos 45◦ = sin 45◦ .
a 2
 Beispiel 2: (Abb. 3.4b): In einem gleichseitigen Dreieck gilt für die Höhe über der Seite c:


a 3
hc = .
2

a 2
Beweis: Der Satz des Pythagoras ergibt a2 = h2 + . Daraus folgt 4a2 = 4h2 + a2 , also
√ 2
4h2 = 3a2 . Das liefert 2h = 3a.
3.2 Elementare Geometrie 135

Ferner erhalten wir



h 3
sin 60◦ = = , cos 30◦ = sin 60◦ .
a 2

3.2.1.3 Vier Grundaufgaben der Dreiecksberechnung

Aus der Gleichung sin α = d lässt sich der Winkel α nicht eindeutig bestimmen, da α spitz oder
stumpf sein kann und sin( π − α) = sin α gilt. Die folgenden Methoden für die erste bis dritte
Grundaufgabe ergeben jedoch alle Winkel in eindeutiger Weise.

Erste Grundaufgabe: Gegeben sind die Seite c und die beiden anliegenden Winkel α, β.
Gesucht werden die übrigen Seiten und Winkel des Dreiecks (Abb. 3.2).
(i) Der Winkel γ = π − α − β folgt aus dem Winkelsummensatz.
(ii) Die beiden Seiten a und b folgen aus dem Sinussatz:
sin α sin β
a=c , b=c .
sin γ sin γ

1
(iii) Flächeninhalt: F = ab sin γ.
2
Zweite Grundaufgabe: Gegeben sind die beiden Seiten a und b und der eingeschlossene
Winkel γ.
α−β
(i) Man berechnet eindeutig aus dem Tangenssatz:
2
α−β a−b γ π α−β π
tan = cot , − < < .
2 a+b 2 4 2 4

(ii) Aus dem Winkelsummensatz folgt:


α−β π−γ π−γ α−β
α= + , β= − .
2 2 2 2

(iii) Die Seite c folgt aus dem Sinussatz:


sin γ
c= a.
sin α

1
(iv) Flächeninhalt: F = ab sin γ.
2
Dritte Grundaufgabe: Gegeben sind alle drei Seiten a, b und c.
1
(i) Man berechnet den halben Umfang s = ( a + b + c) und den Inkreisradius
2

(s − a)(s − b)(s − c)
r= .
s

(ii) Die Winkel α und β ergeben sich eindeutig aus den Gleichungen:
α r β r α β π
tan = , tan = , 0< , < .
2 s−a 2 s−b 2 2 2

(iii) Der Winkel γ = π − α − β folgt aus dem Winkelsummensatz.


(iv) Flächeninhalt F = rs.
136 3 Geometrie

Vierte Grundaufgabe: Gegeben sind die Seiten a und b und der der Seite gegenüberliegende
Winkel α .
(i) Wir bestimmen den Winkel β.
Fall 1: a > b. Dann gilt β < 90◦ , und β folgt nach dem Sinussatz eindeutig aus der Gleichung
b
sin β = sin α . (3.8)
a

Fall 2: a = b. Hier gilt α = β.


Fall 3: a < b. Wenn b sin α < a, dann liefert die Gleichung (3.8) einen spitzen und einen
stumpfen Winkel β als Lösung. Im Fall b sin α = b ist β = 90◦ . Für b sin α > a existiert kein
Dreieck zu den Vorgaben.
(ii) Der Winkel γ = π − α − β folgt aus dem Winkelsummensatz.
(iii) Die Seite c folgt aus dem Sinussatz:
sin γ
c= a.
sin α
1
(iv) Flächeninhalt: F = ab sin γ.
2

3.2.1.4 Spezielle Linien im Dreieck

Seitenhalbierende und Schwerpunkt: Eine Seitenhalbierende geht definitionsgemäß durch


einen Eckpunkt und den Mittelpunkt der gegenüberliegenden Seite.
Alle drei Seitenhalbierenden eines Dreiecks schneiden sich im Schwerpunkt des Dreiecks.
Zusätzlich weiß man, dass der Schwerpunkt jede Seitenhalbierende im Verhältnis 2 : 1 teilt (vom
Eckpunkt aus gerechnet; vgl. Abb. 3.6a).

a) Seitenhalbierende

b) Mittelsenkrechte c) Winkelhalbierende Abb. 3.6

Länge der zur Seite c gehörenden Seitenhalbierenden:


1 1
sc = a2 + b2 + 2ab cos γ = 2 ( a 2 + b 2 ) − c2 .
2 2

Mittelsenkrechte und Umkreis: Eine Mittelsenkrechte steht definitionsgemäß auf einer Drei-
ecksseite senkrecht und geht durch den Mittelpunkt dieser Seite. Die drei Mittelsenkrechten
eines Dreiecks schneiden sich im Mittelpunkt des Umkreises.
a
Radius des Umkreises: R = .
2 sin α
Winkelhalbierende und Inkreis: Eine Winkelhalbierende geht durch einen Eckpunkt und
halbiert den zum Eckpunkt gehörigen Winkel.
Alle drei Winkelhalbierenden schneiden sich im Mittelpunkt des Inkreises.
3.2 Elementare Geometrie 137

α F (s − a)(s − b)(s − c)
Radius des Inkreises: r = (s − a) tan = = ,
2 s s

α β γ α β γ
r = s tan
tan tan = 4R sin sin sin .
2 2 2 2 2 2
Länge der Winkelhalbierenden zum Winkel γ:
 
2ab γ ab ( a + b)2 − c2
wγ = cos = .
a+b 2 a+b

Satz des Thales3 : Liegen drei Punkte auf einem Kreis (mit dem Mittelpunkt M), dann ist der
Zentriwinkel 2γ gleich dem doppelten Peripheriewinkel γ (Abb. 3.7).

γ
M


A B
Abb. 3.7

3.2.1.5 Kongruenzsätze

Zwei Dreiecke sind genau dann kongruent (d. h., sie gehen durch eine in 3.1 erklärte Bewegung
ineinander über), wenn einer der folgenden vier Fälle vorliegt (Abb. 3.8a):
(i) Zwei Seiten und der eingeschlossene Winkel sind gleich.
(ii) Eine Seite und die beiden anliegenden Winkel sind gleich.
(iii) Drei Seiten sind gleich.
(iv) Zwei Seiten und der der größeren dieser beiden Seiten gegenüberliegende Innenwinkel
sind gleich.

C
C C
A C

A B B A B A B
a) kongruente Dreiecke b) ähnliche Dreiecke Abb. 3.8

3.2.1.6 Ähnlichkeitssätze

Zwei Dreiecke sind genau dann ähnlich (d. h., sie lassen sich durch eine in 3.1 eingeführte
Ähnlichkeitstransformation ineinander überführen), wenn einer der folgenden vier Fälle vorliegt
(Abb. 3.8b):
(i) Zwei Winkel sind gleich.
(ii) Zwei Seitenverhältnisse sind gleich.
3
Thales von Milet (624–548 v. Chr.) gilt als der Vater der griechischen Mathematik.
138 3 Geometrie

(iii) Ein Seitenverhältnis und der eingeschlossene Winkel sind gleich.


(iv) Ein Seitenverhältnis und der der größeren dieser beiden Seiten gegenüberliegende Innen-
winkel sind gleich.

A B
α β
A α β B

Abb. 3.9

Der Ähnlichkeitssatz des Thales (Strahlensatz): Gegeben seien zwei Geraden, die sich im
Punkt C schneiden. Werden diese von zwei parallelen Geraden geschnitten, dann sind die so
entstehenden Dreiecke ABC und A B C ähnlich (Abb. 3.9).
Deshalb sind die Winkel beider Dreiecke gleich und die Verhältnisse entsprechender Seiten
sind gleich. Zum Beispiel gilt:
CA CB
 = .
CA CB

3.2.2 Anwendungen in der Geodäsie

Die Geodäsie beschäftigt sich mit der Vermessung von Punkten der Erde. Dabei werden Drei-
ecke benutzt (Triangulation). Streng genommen handelt es sich dabei um Dreiecke auf einer
Kugeloberfläche (sphärische Dreiecke). Sind diese Dreiecke jedoch hinreichend klein, dann kann
man sie als eben ansehen und die Formeln der ebenen Trigonometrie anwenden. Das trifft für die
üblichen Vermessungsaufgaben zu. Im Schiffs- und Flugverkehr sind jedoch die Dreiecke so
groß, dass man die Formeln der sphärischen Trigonometrie benutzen muss (vgl. 3.2.4).

Höhe eines Turmes: Gesucht wird die Höhe h eines Turms (Abb. 3.10).

h
α
d Abb. 3.10

Berechnung: h = d tan α.

Entfernung zu einem Turm: Wir messen den Erhebungswinkel α und kennen die Höhe h des
Turmes.
Messgrößen: Wir messen die Entfernung d zum Turm und den Erhebungswinkel α.
Berechnung: d = h cot α.

Die Grundformel der Geodäsie: Gegeben sind zwei Punkte A und B mit den kartesischen
Koordination ( x A , y A ) und ( x B , y B ), wobei x A < x B gelten soll (Abb. 3.11). Dann erhalten wir
für die Entfernung d = AB und den Winkel α die Formeln:

yB − yA
d= ( x A − x B )2 + ( y A − y B )2 , α = arctan .
xB − x A
3.2 Elementare Geometrie 139

3.2.2.1 Die erste Grundaufgabe (Vorwärtschreiben)

Problem: Gegeben sind zwei Punkte A und B mit den kartesischen Koordinaten ( x A , y A ) und
( x B , y B ). Gesucht sind die kartesischen Koordinaten ( x, y ) eines dritten Punktes P.

Messgrößen: Wir messen die Winkel α und β (vgl. Abb. 3.12).

Berechnung: Wir bestimmen b, δ durch

c= ( x B − x A )2 + ( y B − y A ) 2 ,

sin β yB − y A
b=c , δ = arctan
sin( α + β) xB − x A
und erhalten

x = x A + b cos( α + δ), y = y A + b sin( α + δ) .

y y y Q Δx
P P
B A γ
β Δy ε
d d α B α β
α α δ
A B A A
x x x
a) y B > y A , α > 0 b) y B < y A , α < 0 a) Vorwärtseinschneiden b) b = AP, c = AB
Abb. 3.11 Abb. 3.12

Beweis: Wir benutzen das rechtwinklige Dreieck APQ in Abb. 3.12 Dann gilt

x = x A +  x = x A + b sin ε, y = y A +  y = y A + b cos ε .
π
Wegen ε = − α − δ hat man sin ε = cos(α + δ) und cos ε = sin(α + δ). Aus dem Sinussatz folgt
2
sin β
b=c .
sin γ
Schließlich ist γ = π − α − β, also sin γ = sin( α + β). 

3.2.2.2 Die zweite Grundaufgabe (Rückwärtseinschneiden)

Problem: Gegeben sind drei Punkte A, B und C mit den kartesischen Koordinaten
( x A , y A ), ( x B , y B ) und ( xC , yC ). Gesucht sind die kartesischen Koordinaten ( x, y) des Punk-
tes P.

Messgrößen: Gemessen werden die Winkel α und β (vgl. Abb. 3.13).


Das Problem ist nur lösbar, wenn die vier Punkte A, B, C und P nicht auf einem Kreis liegen.

Berechnung: Aus den Hilfsgrößen

x1 = x A + (yC − y A ) cot α, y1 = y A + ( xC − x A ) cot α,


x2 = x B + (y B − yC ) cot β, y2 = y B + ( x B − xC ) cot β
140 3 Geometrie

y B
C
A α β

P
x Abb. 3.13

berechnen wir μ und η durch


y2 − y1 1
μ= , η=
x2 − x1 μ
und erhalten

xC − x1 + ( yC − y1 ) μ
y = y1 + ,
μ+η
!
xC − ( y − y C ) μ für μ < η
x=
x1 + ( y − y1 ) η für η < μ .

3.2.2.3 Die dritte Grundaufgabe (Berechnung einer unzugänglichen Entfernung)

Problem: Gesucht ist die Entfernung d = PQ zwischen den beiden Punkten P und Q, die zum
Beispiel durch einen See getrennt sind. Deshalb kann man die Entfernung nicht direkt messen.

Messgrößen: Man misst die Entfernung c = AB zwischen zwei anderen Punkten A und B,
sowie die vier Winkel α, β, γ und δ (vgl. Abb. 3.14).

See
P Q

d = PQ

α γ
β δ
A c B Abb. 3.14

Berechnung: Aus den Hilfsgrößen


1 1
= , σ=
cot α + cot δ cot β + cot γ
und x = σ cot β −  cot α, y = σ −  erhalten wir

d= x 2 + y2 .

3.2.3 Sphärische Trigonometrie

Die sphärische Trigonometrie beschäftigt sich mit der Geometrie auf einer Sphäre (Kugelo-
berfläche). Im Fall der Erdoberfläche kann man näherungsweise die Methoden der ebenen
Trigonometrie anwenden, falls es sich um kleine Entfernungen handelt (z. B. bei der Vermessung
3.2 Elementare Geometrie 141

von Grundstücken). Handelt es sich jedoch um größere Entfernungen (z. B. Transatlantikflüge


oder längere Schiffsreisen), dann spielt die Krümmung der Erdoberfläche eine wichtige Rolle,
d. h., man muss bei der Navigation die Methoden der sphärischen Trigonometrie einsetzen.

3.2.3.1 Entfernungsmessung und Großkreise

Wir betrachten eine Kugel vom Radius R und bezeichnen deren Oberfläche mit S R (Sphäre vom
Radius R).

An die Stelle der Geraden in der Ebene treten auf der Sphäre die Großkreise.

Definition: Sind A und B Punkte auf S R , dann erhält man den Großkreis durch A und B,
indem man die Ebene A, B und den Kugelmittelpunkt M mit der Sphäre S R zum Schnitt bringt
(Abb. 3.15).

SR

A B
M
M
A B
SR
(a) (b) Abb. 3.15

 Beispiel 1: Der Äquator und die Längenkreise der Erde sind Großkreise. Breitenkreise sind
keine Großkreise.

Entfernungsmessung auf einer Sphäre: Die kürzeste Verbindung zwischen den Punkte
A und B auf S R erhält man, indem man einen Großkreis durch A und B betrachtet und den
kürzeren der beiden Großkreisbögen wählt (Abb. 3.15).

Die Entfernung zwischen zwei Punkten A und B auf einer Sphäre ist definitionsgemäß
gleich dem kürzesten Abstand der beiden Punkte auf der Sphäre.

 Beispiel 2: Will ein Schiff (oder ein Flugzeug) die kürzeste Route vom Punkt A und B wählen,
dann muss es sich auf einen Großkreisbogen g bewegen.
(i) Liegen A und B auf dem Äquator, dann muss das Schiff entlang des Äquators fahren (Abb.
3.15a).
(ii) Befinden sich dagegen A und B auf einem Breitenkreis, dann ist die Route entlang des
Breitenkreises weiter als entlang des Großkreisbogens (Abb. 3.15b).

Eindeutigkeit der kürzesten Verbindungskurve: Liegen A und B nicht diametral zueinander,


dann gibt es eine eindeutig bestimmte kürzeste Verbindungslinie.
Sind dagegen A und B diametral gelegene Punkte, dann gibt es unenendlich viele kürzeste
Verbindungslinien zwischen A und B.
 Beispiel 3: Eine kürzeste Verbindungslinie zwischen Nord- und Südpol ergibt sich, indem
man irgendeinen Längenkreishalbbogen benutzt.

Geodätische Linien: Alle Teilkurven von Großkreisen heißen geodätische Linien.


142 3 Geometrie

3.2.3.2 Winkelmessung

Definition: Schneiden sich zwei Großkreise in einem Punkt A, dann ist der Winkel zwischen
ihnen gleich dem Winkel zwischen den Tangenten an die Großkreise im Punkt A (Abb. 3.16).

Kugelzweieck: Verbindet man zwei diametrale Punkte A und B auf S R durch zwei Großkreis-
bögen, dann entsteht ein sogenanntes Kugelzweieck mit dem Flächeninhalt

F = 2R2 α ,

wobei α den Winkel zwischen den beiden Großkreisbögen bezeichnet (Abb. 3.17).

α C
S
α b γ a
α β
c B
A
B

Abb. 3.16 Abb. 3.17 Abb. 3.18

3.2.3.3 Sphärische Dreiecke

Definition: Ein sphärisches Dreieck wird durch drei Punkte A, B und C auf S R und den
kürzesten Verbindungslinien zwischen diesen Punkten gebildet.4 Die Winkel bezeichnen wir mit
α, β und γ. Die Längen der Seiten seien a, b und c (Abb. 3.18).

Zyklische Vertauschung: Alle weiteren Formeln bleiben richtig, wenn man die folgenden
zyklischen Vertauschungen vornimmt:

a −→ b −→ c −→ a und α −→ β −→ γ −→ α.

Flächeninhalt eines sphärischen Dreiecks:

F = ( α + β + γ − π ) R2 .

Traditionsgemäß heißt ein sphärisches Dreieck genau dann regulär (oder vom Eulerschen Typ),
wenn die Länge seiner Seiten kleiner als πR ist (Länge des halben Äquators). Deshalb ist der
Flächeninhalt eines regulären sphärischen Dreiecks kleiner als der Oberflächeninhalt 2πR2 einer
Halbkugel. Aus 0 < F < 2πR2 erhalten wir für die Winkelsumme in einem regulären sphärischen
Dreieck die Ungleichung

π < α + β + γ < 3π .

4
Wir setzen zusätzlich voraus, dass kein Punktepaar diametral ist und dass die drei Punkte A, B und C nicht auf einem
gemeinsamen Großkreis liegen.
3.2 Elementare Geometrie 143

Weiß man nicht, ob man auf einer Ebene oder einer Sphäre lebt, dann kann man diese Frage
allein durch Messung der Winkelsumme im Dreieck entscheiden. Für ebene Dreiecke gilt stets
α + β + γ = π.
Die Differenz α + β + γ − π heißt sphärischer Exzess.
 Beispiel 1: Das Dreieck in Abb. 3.19 wird vom Nordpol C und zwei Punkten A und B auf dem
Äquator gebildet. Hier gilt α = β = π/2. Für die Winkelsumme erhalten wir α + β + γ = π + γ.
Der Flächeninhalt ist durch F = R2 γ gegeben.

C
·
γ

· ·
A B
Abb. 3.19

Dreiecksungleichung:

| a − b| < c < a + b .

Größenverhältnisse der Seiten: Der größeren Seite liegt stets der größere Winkel gegenüber.
Explizit gilt:

α < β ⇐⇒ a < b, α > β ⇐⇒ a > b, α = β ⇐⇒ a = b .

Konvention:5 Wir setzen


a b c
a∗ := , b∗ : = , c ∗ := .
R R R

Sinussatz:6

sin α sin a∗
= . (3.9)
sin β sin b∗

Seitenkosinussatz und Winkelkosinussatz: 6

cos c∗ = cos a∗ cos b∗ + sin a∗ sin b∗ cos γ , (3.10)


cos γ = sin α sin β cos c∗ − cos α cos β.
(3.11)

5
Häufig wählt man R = 1. Dann ist a∗ = a usw. Wir führen den Kugelradius R in Formeln mit, um den Grenzübergang
R → ∞ (euklidische Geometrie) und die Ersetzung R → iR (Übergang zur nichteuklidischen hyperbolischen Geometrie)
vornehmen zu können (vgl. 3.2.8).
6
Ist α (bzw. γ) ein rechter Winkel, dann gilt sin α = 1 (bzw. cos γ = 0).
144 3 Geometrie

1
Halbwinkelsatz: Wir setzen s∗ := ( a∗ + b∗ + c∗ ). Dann gilt:
2

γ sin(s∗ − a∗ ) sin( s∗ − b∗ )
tan = , 0 < γ < π, (3.12)
2 sin s∗ sin(s∗ − c∗ )

γ sin(s∗ − a∗ ) sin( s∗ − b∗ ) γ sin s ∗ sin( s∗ − c∗ )


sin = , cos = .
2 sin a∗ sin b∗ 2 sin a∗ sin b∗
Formel für den Flächeninhalt F des sphärischen Dreiecks:

F s∗ s∗ − a∗ s ∗ − b∗ s∗ − c ∗
tan = tan tan tan tan
4 2 2 2 2
(verallgemeinerte Heronische Flächenformel).
1
Halbseitensatz: Es sei σ := (α + β + γ). Dann gilt:
2

c∗ − cos σ cos(σ − γ)
tan = , 0 < c∗ < π , (3.13)
2 cos(σ − α) cos(σ − β)

c∗ cos σ cos( σ − γ) c∗ cos( σ − α) cos(σ − β)


sin = − , cos = .
2 sin α sin β 2 sin α sin β

Nepersche Formeln:
c∗ α−β a ∗ + b∗ α+β
tan cos = tan cos ,
2 2 2 2
c∗ α−β a ∗ − b∗ α+β
tan sin = tan sin ,
2 2 2 2
γ a ∗ − b∗ α+β a ∗ + b∗
cot cos = tan cos ,
2 2 2 2
γ a ∗ − b∗ α−β a ∗ + b∗
cot sin = tan sin .
2 2 2 2
Mollweidsche Formeln:
γ a ∗ + b∗ c∗ α−β
sin sin = sin cos ,
2 2 2 2
γ a ∗ + b∗ c∗ α+β
sin cos = cos cos ,
2 2 2 2
γ a ∗ − b∗ c∗ α−β
cos sin = sin sin ,
2 2 2 2
γ a ∗ − b∗ c∗ α+β
cos cos = cos sin .
2 2 2 2
Inkreisradius r und Umkreisradius eines sphärischen Dreiecks:

sin(s∗ − a∗ ) sin(s∗ − b∗ ) sin(s∗ − c∗ ) α


tan r = = tan sin(s∗ − a∗ ) ,
sin s∗ 2

cos( σ − α) cos(σ − β) cos(σ − γ) a∗
cot  = − = cot cos( σ − α) .
cos σ 2
3.2 Elementare Geometrie 145

Grenzübergang zur ebenen Trigonometrie: Führt man in den obigen Formeln den Grenz-
übergang R → ∞ durch (der Kugelradius geht gegen unendlich), dann wird die Krümmung der
Kugelfläche immer kleiner. Im Grenzfall ergeben sich die Formeln der ebenen Trigonometrie.
x2
 Beispiel 2: Aus dem Seitenkosinussatz (3.10) folgt wegen cos x = 1 − + o ( x2 ), x → 0, und
2
sin x = x + o ( x ), x → 0 die Beziehung
    b 
c2 a2 b2 a
1− + . . . = 1 − + . . . 1 − + . . . + + . . . + . . . cos γ .
2R2 2R2 2R2 R R

Nach Multiplikation mit R2 erhalten wir für R → +∞ den Ausdruck

c2 = a2 + b2 − 2ab cos γ .

Das ist der Kosinussatz der ebenen Trigonometrie.

3.2.3.4 Die Berechnung sphärischer Dreiecke

Man beachte a∗ := a/R usw. Wir betrachten hier nur Dreiecke, bei denen alle Winkel und Seiten
zwischen Null und π liegen.

1. Grundaufgabe: Gegeben sind zwei Seiten a, b und der eingeschlossene Winkel γ. Dann
berechnet man die restliche Seite c und die übrigen Winkel α, β mit Hilfe des Seitenkosinussatzes:

cos c∗ = cos a∗ cos b∗ + sin a∗ sin b∗ cos γ ,

cos a∗ − cos b∗ cos c∗


cos α = ,
sin b∗ sin c∗
cos b∗ − cos c∗ cos a∗
cos β = .
sin c∗ sin a∗

2. Grundaufgabe: Gegeben sind die drei Seiten a, b und c, die alle zwischen 0 und π liegen
sollen. Die Winkel α, β und γ ergeben sich dann aus den Halbwinkelsätzen:

α sin( s∗ − b∗ ) sin( s∗ − c∗ )
tan = usw.
2 sin s∗ sin( s∗ − a∗ )

β γ α
Die Formeln für tan und tan erhält man aus tan durch zyklische Vertauschung.
2 2 2
3. Grundaufgabe: Gegeben sind die drei Winkel α, β und γ. Die Seiten a, b und c erhält man
dann aus den Halbseitensätzen:

a∗ − cos σ cos(σ − α)
tan = usw. (3.14)
2 cos(σ − β) cos(σ − γ)

b∗ c∗ a∗
Die Formeln für tan und tan ergeben sich aus tan durch zyklische Vertauschung.
2 2 2
4. Grundaufgabe: Gegeben sind die Seite c und die beiden anliegenden Winkel α und β. Den
fehlenden dritten Winkel γ erhalten wir aus dem Winkelkosinussatz:

cos γ = sin α sin β cos c∗ − cos α cos β.

Die restlichen Seiten a und b folgen dann aus (3.14).


146 3 Geometrie

3.2.4 Anwendungen im Schiffs- und Flugverkehr

Um das Prinzip zu verdeutlichen, rechnen wir mit gerundeten Werten.

Eine Schiffsfahrt von San Diego (Kalifornien) nach Honolulu (Hawaii): Wie weit ist die
kürzeste Entfernung zwischen diese beiden Hafenstädten? Mit welchem Winkel β muss das
Schiff in San Diego starten?

b γ a
β
α B
c
A

Abb. 3.20

Antwort: Wir betrachten Abb. 3.20:

c = Entfernung = 4 100 km, β = 97◦ .

Lösung: Beide Städte besitzen die folgenden geographischen Koordinaten:

A (Honolulu) : 22◦ nördliche Breite, 157◦ westliche Länge,


B (SanDiego) : 33◦ nördliche Breite, 117◦ westliche Länge.

Wir benutzen das Winkelmaß. Mit den Bezeichnungen von Abb. 3.20 gilt:
γ = 157◦ − 117◦ = 40◦ , a∗ = 90◦ − 33◦ = 57◦ , b∗ = 90◦ − 22◦ = 68◦ .
Die 1. Grundaufgabe in 3.2.3.4 liefert:
cos c∗ = cos a∗ cos b∗ + sin a∗ sin b∗ cos γ, (3.15)
cos b∗ − cos a∗ cos c∗
cos β = . (3.16)
sin a∗ sin c∗

Das ergibt c∗ = 37◦ und β = 97◦ . Der Radius der Erde beträgt R = 6370 km. Somit ist die
Dreieckseite c gegeben durch
2πc◦∗
c=R = 4100.
360◦
Transatlantikflug von Kopenhagen nach Chicago: Wie weit ist die kürzeste Entfernung
zwischen diese beiden Städten? Mit welchem Winkel β muss das Flugzeug starten?
Antwort: Wir betrachten wiederum Abb. 3.20

c = Entfernung = 6 000 km, β = 82◦ .

Lösung: Beide Städte besitzen die folgenden geographischen Koordinaten:

A (Chicago) : 42◦ nördliche Breite, 88◦ westliche Länge,


B (Kopenhagen) : 56◦ nördliche Breite, 12◦ östliche Länge.
3.2 Elementare Geometrie 147

Wir verwenden das Winkelmaß. Mit den Bezeichnungen in Abb. 3.20 gilt:

γ = 12◦ + 88◦ = 100◦ , a∗ = 90◦ − 56◦ = 34◦ , b∗ = 90◦ − 42◦ = 38◦ .


2πc◦∗
Aus (3.15) folgt c∗ = 54◦ , also c = R = 6000. Der Winkel β ergibt sich aus (3.16).
360◦

3.2.5 Die Hilbertschen Axiome der Geometrie

So fängt denn alle menschliche Erkenntnis mit Anschauungen an, geht von da
zu Begriffen und endigt mit Ideen.
Immanuel Kant (1724–1804)
Kritik der reinen Vernunft, Elementarlehre
Die Geometrie bedarf – ebenso wie die Arithmetik der Zahlen – zu ihrem
folgerichtigen Aufbau nur weniger und einfacher Grundsätze. Diese Grundsätze
heißen Axiome der Geometrie. Die Aufstellung der Axiome der Geometrie und
die Erforschung ihres Zusammenhangs ist eine Aufgabe, die seit Euklid in
zahlreichen vortrefflichen Abhandlungen der Mathematik sich erörtert findet.
Die bezeichnete Aufgabe läuft auf die logische Analyse unserer räumlichen
Anschauung hinaus.
David Hilbert (1862–1943)
Grundlagen der Geometrie

Den ersten systematischen Aufbau der Geometrie findet man in den berühmten Elementen
des Euklid (365 v. Chr.–300 v. Chr.), die 2 000 Jahre lang unverändert gelehrt wurden. Eine
allen Anforderungen mathematischer Strenge genügende Axiomatik der Geometrie wurde 1899
von David Hilbert in seinem Buch Grundlagen der Geometrie geschaffen, das nichts von seiner
intellektuellen Frische eingebüßt hat und 1987 die 13. Auflage im Teubner-Verlag erlebte. Die
folgenden sehr formal und trocken erscheinenden Axiome sind das Ergebnis eines langen,
mühevollen und mit Irrtümern beladenen Erkenntnisprozesses der Mathematik, der im engen
Zusammenhang mit dem euklidischen Parallelenaxiom stand, das wir in 3.2.6 diskutieren werden.
Der Übersichtlichkeit halber beschränken wir uns hier auf die Axiome der ebenen Geometrie. Zur
Veranschaulichung der Axiome fügen wir Abbildungen hinzu. Wir weisen jedoch ausdrücklich
darauf hin, dass derartige Veranschaulichungen 2 000 Jahre lang die Mathematiker genarrt und
das wahre Wesen der Geometrie verschleiert haben (vgl. 3.2.6 bis 3.2.8).

Grundbegriffe der ebenen Geometrie:

Punkt, Gerade, inzidieren,7 zwischen, kongruent.

Beim Aufbau der Geometrie werden diese Grundbegriffe nicht inhaltlich erläutert. Dieser radikale
Standpunkt, den zuerst Hilbert betonte, ist heute die Basis für jede axiomatische mathematische
Theorie. Die fehlende inhaltliche Interpretation des modernen axiomatischen Aufbaus der Geo-
metrie scheint eine philosophische Schwäche zu sein; tatsächlich ist sie jedoch die entscheidende
Stärke dieses Zugangs und spiegelt das Wesen mathematischen Denkens wider. Durch den
Verzicht auf eine allgemeingültige inhaltliche Deutung der Grundbegriffe kann man mit einem
7
Anstelle der Aussage „der Punkt P inzidiert die Gerade g“ benutzt man aus stilistischen Gründen auch „P liegt auf g“
oder „g geht durch P“. Liegt P auf den Geraden g und h, dann sagt man, dass sich die Geraden g und h im Punkt P
schneiden.
148 3 Geometrie

Schlag unterschiedliche anschauliche Situationen einheitlich behandeln und logisch analysieren


(vgl. 3.2.6 bis 3.2.8).

Inzidenzaxiome (Abb. 3.21a): (i) Zu zwei verschiedenen Punkten A und B gibt es genau eine
Gerade g, die durch A und B geht.
(ii) Auf einer Geraden liegen mindestens zwei verschiedene Punkte.
(iii) Es gibt drei Punkte, die nicht auf einer Geraden liegen.
Anordnungsaxiom (Abb. 3.21b): (i) Wenn ein Punkt B zwischen den Punkten A und C liegt,
dann sind A, B und C drei verschiedene Punkte, die auf einer Geraden liegen und der Punkt B liegt
auch zwischen C und A.
(ii) Zu zwei verschiedenen Punkten A und C gibt es einen Punkt B, der zwischen A und C liegt.
(iii) Liegen drei verschiedene Punkte auf einer Geraden, dann gibt es genau einen dieser Punkte, der
zwischen den beiden anderen liegt.

g AB
A B A B C A B
(a) (b) (c)
C
g
C c

g b
A B A B C D C A B
(d) (e) (f) (g)
Abb. 3.21 Inzidenz und Anordnung.

Definition einer Strecke (Abb. 3.21c): Es seien A und B zwei verschiedene Punkte, die auf
der Geraden g liegen. Unter der Strecke AB versteht man die Menge aller Punkte von g, die
zwischen A und B liegen. Hinzu werden die Punkte A und B genommen.

Das Axiom von Pasch (Abb. 3.21d): Es seien A, B und C drei verschiedene Punkte, die nicht alle
auf einer Geraden liegen. Ferner sei g eine Gerade, auf der keiner der Punkte A, B und C liegt. Wenn
g die Strecke AB schneidet, dann schneidet g auch die Strecke BC oder die Strecke AC.

Definition von Halbstrahlen (Abb. 3.21 e,f): Es seien A, B, C und D vier verschiedene Punkte,
die auf einer Geraden g liegen, wobei C zwischen A und D, aber nicht zwischen A und B liegt.
Dann sagen wir, dass die Punkte A und B auf der gleichen Seite von C liegen, während A und D
auf verschiedenen Seiten von C liegen.
Die Menge aller auf einer Seite von C liegenden Punkte der Geraden g heißt ein Halbstrahl.

Definition eines Winkels (Abb. 3.21g): Unter einem Winkel (b, c) verstehen wir eine Menge
{b, c} von zwei Halbstrahlen b und c, die zu verschiedenen Geraden gehören und vom gleichen
Punkt A ausgehen. Anstelle von (b, c) benutzen wir auch die Bezeichnung (c, b).8
8
Bei dieser Konvention sind die beiden Halbstrahlen b und c gleichberechtigt. Anschaulich wird immer derjenige von b
und c gebildete Winkel gewählt, der kleiner als 180◦ ist.
3.2 Elementare Geometrie 149

Ist B (bzw. C) ein Punkt auf dem Halbstrahl b (bzw. c), wobei B und C von A verschieden sind,
dann schreiben wir auch BAC oder CAB anstelle von (b, c).
Mit Hilfe der bisherigen Axiome kann man das folgende Resultat beweisen.

A
A
A
g
B
B

B Abb. 3.22

Der Satz über die Zerlegung der Ebene durch eine Gerade (Abb. 3.22): Ist g eine Gerade,
dann liegen alle Punkte entweder auf g oder in einer der beiden disjunkten Mengen A, B mit
den folgenden Eigenschaften:
(i) Liegt der Punkt A in A und liegt Punkt B in B, dann schneidet die Strecke AB die Gerade g.
(ii) Liegen zwei Punkte A und A (bzw. B und B ) in A (bzw. B), dann schneidet die Strecke
AA (bzw. BB ) nicht die Gerade g.

Definition: Die Punkte von A (bzw. B) liegen jeweils auf einer der Seiten der Geraden g.
Bei der Kongruenz von Strecken und Winkeln handelt es sich um Grundbegriffe, die nicht
näher erläutert werden. Anschaulich entsprechen kongruente Gebilde solchen, die durch eine
Bewegung ineinander überführt werden können. Das Symbol

AB  CD

bedeutet, dass die Strecke AB kongruent zur Strecke CD ist, und

ABC  EFG

bedeutet, dass der Winkel ABC kongruent zum Winkel EFG ist.

Kongruenzaxiome für Strecken (Abb. 3.23a,b): (i) Die beiden Punkte A und B mögen auf
der Geraden g liegen, und der Punkt C liege auf der Geraden h. Dann gibt es einen Punkt D auf h,
so dass

AB  CD.

(ii) Wenn zwei Strecken zu einer dritten Strecke kongruent sind, dann sind sie auch untereinander
kongruent.
(iii) Es seien AB und BC zwei Strecken auf der Geraden g, die außer B keine gemeinsamen
Punkte besitzen. Ferner seien A B und B C  zwei Strecken auf der Geraden g , die außer B keine
gemeinsamen Punkte besitzen. Dann folgt aus

AB  A B and BC  B C 

stets

AC  A C  .
150 3 Geometrie

A B A B C
g g
C D A B C
h g
(a) (b)
C C

c c
b b
A B A B
g
(c) (d) Abb. 3.23

Definition eines Dreiecks: Ein Dreieck ABC besteht aus drei verschiedenen Punkten A, B
und C, die nicht alle auf einer Geraden liegen.

Kongruenzaxiome für Winkel (Abb. 3.23c,d): (i) Jeder Winkel ist sich selbst kongruent, d. h.,
(b, c)  (b, c).
(ii) Es sei (b, c) ein Winkel. Ferner sei b ein Halbstrahl auf der Geraden g . Dann gibt es einen
Halbstrahl c mit

(b, c)  (b , c ),

und alle inneren Punkte von (b , c ) liegen auf einer Seite der Geraden g . (iii) Gegeben seien zwei
Dreiecke ABC und A B C . Dann folgt aus

AB  A B , AC  A C  und BAC  B A C 

stets

ABC  A B C .

Das Axiom des Archimedes (Abb. 3.24): Sind AB und CD zwei gegebene Strecken, dann
gibt es auf der durch A und B gehenden Geraden Punkte

A1 , A2 , . . . , A n

so dass die Strecken AA1 , A1 A2 , . . . , An−1 An alle der Strecke CD kongruent sind und B zwischen
A und An liegt.9

Vollständigkeitsaxiom: Es ist nicht möglich, durch Hinzunahme von neuen Punkten oder neuen
Geraden das System so zu erweitern, dass alle Axiome ihre Gültigkeit behalten.

Der Satz von Hilbert (1899): Ist die Theorie der reellen Zahlen widerspruchsfrei, dann ist
auch die Geometrie widerspruchsfrei.
9
Anschaulich bedeutet dies, dass sich durch n-faches Abtragen der Strecke CD eine Strecke ergibt, die die Strecke AB
enthält.
Es gibt Geometrien, in denen alle Axiome außer dem Axiom des Archimedes gelten. Derartige Geometrien heißen
nichtarchimedisch.
3.2 Elementare Geometrie 151

C D P
p

A B
g
A1 A2 A3 A4 A5
Abb. 3.24 xxxxxxxxxxxxxxxxxxxxx Abb. 3.25 xxxxxxxxxxxxxxxxxxxx

3.2.6 Das Parallelenaxiom des Euklid

Definition von Parallelen: Zwei Geraden g und h heißen genau dann parallel, wenn sie sich
nicht in einem Punkt schneiden.

Euklidisches Parallelaxiom (Abb. 3.25): Liegt der Punkt P nicht auf der Geraden
g, dann gibt es zu g genau eine Parallele p durch den Punkt P.

Historischer Kommentar: Das Parallelenproblem lautete:

Kann man das Parallelenaxiom aus den übrigen Axiomen des Euklid beweisen?

Über 2 000 Jahre lang war das ein berühmtes ungelöstes Problem der Mathematik. Carl-Friedrich
Gauß (1777–1855) erkannte als erster, dass man das Parallelenaxiom nicht mit Hilfe der übrigen
Axiome des Euklid beweisen kann. Um jedoch möglichen unsachlichen Streitigkeiten aus dem
Weg zu gehen, veröffentlichte er seine Erkenntnisse nicht. Der russische Mathematiker Nikolai
Iwanowitsch Lobatschewski (1793–1856) publizierte 1830 ein Buch über eine neuartige Geometrie,
in der das Parallelenaxioms des Euklid nicht gilt. Das ist die Lobatschewskische Geometrie (oder
hyperbolische nichteuklidische Geometrie). Zu ähnlichen Resultaten gelangte unabhängig davon
zur gleichen Zeit der ungarische Mathematiker Janos Bólyai (1802–1860).

Die Euklidische Geometrie der Ebene: Die Hilbertschen Axiome aus 3.2.5 gelten einschließ-
lich des euklidischen Parallelenaxioms für die übliche Geometrie der Ebene, wie sie in den
Abbildungen 3.21 bis 3.25 dargestellt ist.

Anschauung kann irreführen: Die Abbildung 3.25 suggeriert, dass das Parallelenaxiom
offensichtlich richtig ist. Diese Ansicht ist jedoch falsch! Sie beruht darauf, dass wir mit dem
Wort „Gerade“ die Vorstellung von ungekrümmten Linien verbinden. Davon ist jedoch in den
Axiomen der Geometrie keine Rede. Die folgenden beiden Modelle der Geometrie in 3.2.7 und
3.2.8 verdeutlichen das.

3.2.7 Die nichteuklidische elliptische Geometrie

Wir betrachten eine Sphäre S vom Radius R = 1. Als „Grundebene“ Eellip wählen wir die
nördliche Halbkugel einschließlich des Äquators.
(i) „Punkte“ sind entweder klassische Punkte, die nicht auf dem Äquator liegen oder diametral
gelegene Punktepaare { A, B} auf dem Äquator.
(ii) „Geraden“ sind Großkreisbögen.
(iii) „Winkel“ sind die üblichen Winkel zwischen Großkreisen (Abb. 3.26).

Satz: In dieser Geometrie gibt es keine Parallelen.


152 3 Geometrie

P g
h

A B

Äquator Abb. 3.26

 Beispiel: Gegeben sei die „Gerade“ g und der nicht auf g liegende Punkt P (Nordpol). Jede
„Gerade“ durch P ist der Bogen eines Längenkreises. Alle diese „Geraden“ schneiden g in einem
„Punkt“. In Abb. 3.26 schneidet beispielsweise die „Gerade“ g die „Gerade“ h im „Punkt“ { A, B}.

Kongruenz: „Bewegungen“ in dieser Geometrie sind die Drehungen um die durch den Nord-
pol und den Südpol gehende Achse. Kongruente Strecken und Winkel sind definitionsgemäß
solche, die durch eine „Bewegung“ ineinander übergehen.
Diese Geometrie erfüllt alle Hilbertschen Axiome der Geometrie bis auf das euklidische
Parallelenaxiom. Deshalb nennt man diese Geometrie nichteuklidisch. Es ist erstaunlich, dass
2 000 Jahre lang kein Mathematiker auf die Idee kam, dieses einfache Modell zu benutzen, um zu
zeigen, dass das euklidische Parallelenaxiom nicht aus den übrigen Axiomen des Euklid folgen
kann. Offensichtlich gab es hier eine Denkbarriere. „Punkte“ hatten übliche Punkt zu sein und
„Geraden“ durften nicht gekrümmt sein. Tatsächlich spielen derartige inhaltliche Vorstellungen
beim Beweis von geometrischen Sätzen mit Hilfe der Axiome und den Gesetzen der Logik keine
Rolle.

3.2.8 Die nichteuklidische hyperbolische Geometrie

Das Poincaré-Modell: Wir wählen ein kartesisches ( x, y )-Koordinatensystem und betrachten


die offene obere Halbebene
Ehyp := {( x, y) ∈ R2 | y > 0},
die wir als hyperbolische Ebene bezeichnen. Wir treffen folgende Konventionen:
(i) „Punkte“ sind klassische Punkte der oberen Halbebene.
(ii) „Geraden sind Halbkreise der oberen Halbebene, deren Mittelpunkt auf der x-Achse liegt
(Abb. 3.27).

A B

M x
Abb. 3.27

Satz (Abb. 3.28): (i) Durch zwei Punkte A und B von Ehyp geht genau eine „Gerade“ g.
(ii) Ist g eine „Gerade“, dann gehen durch jeden Punkt P außerhalb von g unendlich viele
„Geraden“ p, die g nicht schneiden, d. h., es gibt zu g unendlich viele Parallelen p durch P.

Das euklidische Parallelenaxiom ist in der hyperbolischen Geometrie nicht erfüllt.


3.2 Elementare Geometrie 153

P p b
γ C
A B g α β a
c
A B
Q
(a) (b) Abb. 3.28

Winkelmessung: Der „Winkel“ zwischen zwei „Geraden“ ist gleich dem Winkel zwischen
den entsprechenden Kreisbögen (Abb. 3.28b).
Entfernungsmessung: Die Länge L einer Kurve y = y( x ), a ≤ x ≤ b in der hyperbolischen
Ebene Ehyp ist durch das Integral

b
1 + y  ( x )2
L= dx.
y( x )
a

gegeben.
Die „Geraden“ sind bezüglich dieser Längenmessung die kürzesten Verbindungslinien (geodä-
tische Linien).
 Beispiel 1: Die Entfernung zwischen den Punkten P und Q in Abb. 3.28a ist unenendlich. Des-
halb bezeichnet man die x-Achse in Abb. 3.28a als die unendlich ferne Gerade der hyperbolischen
Ebene.

Hyperbolische Trigonometrie: Darunter versteht man die Berechnung von Dreiecken der hy-
perbolischen Geometrie. Alle Formeln der hyperbolischen Geometrie kann man sehr elegant aus
den Formeln der sphärischen Geometrie erhalten, indem man das folgende Übertragungsprinzip
benutzt:

Man ersetze in den Formeln der sphärischen Geometrie den Radius R durch
iR mit der imaginären Einheit i2 = −1 und wähle dann R = 1.

 Beispiel 2: Aus dem Seitenkosinussatz der sphärischen Trigonometrie


c a b a b
cos = cos cos + sin sin cos γ
R R R R R
folgt durch Ersetzung R → iR die Beziehung10
c a b a b
cosh = cosh cosh − sinh sinh cos γ.
R R R R R
Für R = 1 erhalten wir den Seitenkosinussatz der hyperbolischen Geometrie:
cosh c = cosh a cosh b − sinh a sinh b cos γ.
Ist γ ein rechter Winkel, dann gilt cos γ = 0, und wir erhalten den Satz des Pythagoras der
hyperbolischen Geometrie

cosh c = cosh a cosh b.

Weitere wichtige Formeln findet man in Tab. 3.2. Die Formeln der elliptischen Geometrie
entsprechen dabei denen der sphärischen Trigonometrie auf einer Kugel vom Radius R = 1.
10
Man beachte cos ix = cosh x und sin ix = i sinh x.
154 3 Geometrie

Tabelle 3.2

euklidische elliptische hyperbolische


Geometrie Geometrie Geometrie

Winkelsumme im Drei- α + β + γ = π α+β+γ = π+F α+β+γ = π−F


eck (F Flächeninhalt)

Flächeninhalt eines πr2 2π (1 − cos r ) 2π (cosh r − 1)


Kreises vom Radius r

Umfang eines Kreises 2πr 2π sin r 2π sinh r


vom Radius r

Lehrsatz c2 = a 2 + b 2 cos c = cos a cos b cosh c = cosh a cosh b


des Pythagoras

Kosinussatz c2 = a 2 + b 2 cos c = cos a cos b cosh c = cosh a cosh b


−2ab cos γ + sin a sin b cos γ − sinh a sinh b cos γ
sin α a sin α sin a sin α sinh a
Sinussatz = = =
sin β b sin β sin b sin β sinh b

Gaußsche Krümmung K=0 K=1 K = −1

Weitere Formeln erhält man durch die zyklischen Vertauschungen


a −→ b −→ c −→ a and α −→ β −→ γ −→ α.

Bewegungen: Wir setzen z = x + iy und z = x  + iy . Die „Bewegungen“ der hyperbolischen


Ebene werden dann durch die speziellen Möbiustransformationen

αz + β
z =
γz + δ

mit reellen Zahlen α, β, γ und δ gegeben, wobei zusätzlich αδ − βγ > 0 gilt. Alle diese Trans-
formationen bilden eine Gruppe, die man die Bewegungsgruppe der hyperbolischen Ebene
nennt.
(i) Durch die „Bewegungen“ gehen „Geraden“ wieder in „Geraden“ über.
(ii) „Bewegungen“ sind winkeltreu und „längentreu“.
Nach dem Erlanger Programm von Felix Klein versteht man unter einer Eigenschaft der
hyperbolischen Geometrie Ehyp eine solche, die invariant ist unter allen „Bewegungen“.

Satz: Die hyperbolische Geometrie erfüllt alle Hilbertschen Axiome der Geometrie mit Aus-
nahme des euklidischen Parallelenaxioms.

Riemannsche Geometrie: Die hyperbolische Geometrie ist eine Riemannsche Geometrie der
Metrik

dx2 + dy2
ds2 = , y>0
y2

und der (negativen) konstante Gaußschen Krümmung K = −1 (vgl. 16.1.5.).


3.3 Anwendungen der Vektoralgebra in der analytischen Geometrie 155

Physikalische Interpretation: Eine einfache Interpretation des Poincaré-Modells im Rahmen


der geometrische Optik findet man in 5.1.2.

3.3 Anwendungen der Vektoralgebra in der analytischen Geometrie

Die Entdeckung der Methode der kartesischen Koordinaten durch Descartes


(1596–1650) und Fermat (1601–1665), die zu Ende des 18. Jahrhunderts „ana-
lytische Geometrie“ genannt wurde, erhöhte die Bedeutung der Algebra bei
geometrischen Fragestellungen.
Jean Dieudonné (1906–1992)
Die Vektoralgebra gestattet es, geometrische Gebilde durch Gleichungen zu beschreiben, die
unabhängig von einem speziell gewählten Koordinatensystem sind.
−→
Es sei O ein fest gewählter Punkt. Mit r = OP bezeichnen wir den Radiusvektor des Punktes
P. Wählen wir drei paarweise aufeinander senkrecht stehende Einheitsvektoren i, j, k , die ein
rechtshändiges System bilden, dann gilt

r = xi + yj + zk.

Die reellen Zahlen x, y, z heißen die kartesischen Koordinaten des Punktes P (Abb. 3.29 und
Abb. 1.85). Ferner sei a = a1 i + a2 j + a3 k usw.

P
y P
k r j r
j

0 i 0 i x
(a) (b) Abb. 3.29

Alle folgenden Formeln enthalten die vektorielle Formulierung und die Darstellung in kartesi-
schen Koordinaten.

3.3.1 Geraden in der Ebene

Gleichung einer Geraden durch den Punkt P0 ( x0 , y0 ) in Richtung des Vektors v


(Abb. 3.30a):

r = r0 + tv, −∞ < t < ∞,

x = x0 + tv1 , y = y0 + tv2 .

Fassen wir den reellen Parameter t als Zeit auf, dann ist das die Gleichung für die Bewegung
eines Punktes mit dem Geschwindigkeitsvektor v = v1 i + v2 j und r j = x j i + y j j.
Gleichung einer Geraden durch die beiden Punkte Pj ( x j , yj ), j = 0, 1 (Abb. 3.30b):

r = r0 + t ( r1 − r0 ) , −∞ < t < ∞,

x = x0 + t ( x 1 − x 0 ) , y = y 0 + t ( y 1 − y 0 ).
156 3 Geometrie

y y
P0 P0
v v = r1 − r0
P1
r0 r0
P r1
P
r r

x x
(a) (b) Abb. 3.30

Gleichung der Geraden g durch den Punkt P0 ( x0 , y0 ) senkrecht zum Einheitsvektor n (Abb.
3.31a):

n(r − r0 ) = 0,

n1 ( x − x0 ) + n2 ( y − y0 ) = 0.

Dabei gilt n21 + n22 = 1.

Abstand eines Punktes P∗ von der Geraden g:

d = n ( r ∗ − r0 ) ,

d = n1 ( x ∗ − x0 ) + n2 ( y∗ − y0 ) .
−→
Dabei gilt r∗ = OP∗ . Es ist d > 0 (bzw. d < 0), falls der Punkt P∗ relativ zu n auf der positiven
(bzw. negativen) Seite der Geraden g liegt (Abb. 3.31b). Ferner ist n = n1 i + n2 j.

y y
n n
P0
P∗
+
P − r∗
r0 g r0
r r
g

x x
(a) (b) Abb. 3.31

Abstand der beiden Punkte P1 und P0 (Abb. 3.32a):

d = | r1 − r 0 | ,

d= ( x 1 − x 0 )2 + ( y 1 − y 0 )2 .

Flächeninhalt eines Dreiecks durch die drei Punkte Pj ( x j , yj ), j = 0, 1, 2 (Abb. 3.32b):

1  
F= k ( r1 − r0 ) × ( r2 − r0 ) .
2
3.3 Anwendungen der Vektoralgebra in der analytischen Geometrie 157

Explizit gilt:
 
1  x1 − x0 y1 − y0 
F=  .
2 x2 − x0 y2 − y 0 

y y

P0 r1 − r0 P1
r1
r0
r1 r0
r2

O x O x
(a) (b) Abb. 3.32

3.3.2 Geraden und Ebenen im Raum

Gleichung einer Geraden durch den Punkt P0 ( x0 , y0 , z0 ) in Richtung des Vektors v (Abb.
3.33a):

r = r0 + tv, −∞ < t < ∞,

x = x0 + tv1 , y = y0 + tv2 , z = z0 + tv3 .

Fassen wir den reellen Parameter t als Zeit auf, dann ist das die Gleichung für die Bewegung
eines Punktes mit dem Geschwindigkeitsvektor v = v1 i + v2 j + v3 k and r = xi + yj + zk.

Gleichung einer Geraden durch die beiden Punkte Pj ( x j , yj , z j ), j = 0, 1 (Abb. 3.33a):

r = r0 + t ( r1 − r0 ) , −∞ < t < ∞,

x = x0 + t ( x 1 − x 0 ) , y = y 0 + t ( y 1 − y 0 ), z = z 0 + t ( z 1 − z 0 ).

E P∗
n n r∗

P0 v
P1 r − r0
P0
r1 +
r0 − E
r r0 r

O O O

(a) (b) (c) Abb. 3.33


158 3 Geometrie

Gleichung einer Ebene durch die drei Punkte P ( x j , yj , z j ), j = 0, 1, 2:

r = r0 + t(r1 − r0 ) + s(r2 − r0 ), −∞ < t, s < ∞,

x = x 0 + t ( x 1 − x 0 ) + s ( x 2 − x 0 ),

y = y 0 + t ( y 1 − y 0 ) + s ( y 2 − y 0 ),

z = z 0 + t ( z 1 − z 0 ) + s ( z 2 − z 0 ).

Gleichung einer Ebene E durch den Punkt P ( x0 , y0 , z0 ) senkrecht zu dem Einheitsvektor n


(Abb. 3.33b):

n(r − r0 ) = 0,

n1 ( x − x0 ) + n2 ( y − y0 ) + n3 (z − z0 ) = 0.

Dabei gilt n21 + n22 + n23 = 1. Man bezeichnet n als Einheitsnormalenvektor der Ebene E. Sind
drei Punkte P1 , P2 und P3 auf E gegeben, dann erhält man n durch

(r1 − r0 ) × (r2 − r0 )
n= .
|(r1 − r0 ) × (r2 − r0 )|

Abstand eines Punktes P∗ von der Ebene E:

d = n ( r ∗ − r0 ) ,

d = n 1 ( x ∗ − x 0 ) + n 2 ( y ∗ − y 0 ) + n 3 ( z ∗ − z 0 ).

Es ist d > 0 (bzw. d < 0) wenn der Punkt P∗ relativ zu n auf der positiven (bzw. negativen) Seite
der Ebene E liegt (Abb. 3.33c).

Abstand zwischen den beiden Punkten P0 und P1 :

d = | r1 − r 0 | ,

d= ( x 1 − x 0 )2 + ( y 1 − y 0 )2 + ( z 1 − z 0 )2 .

Winkel ϕ zwischen den beiden Vektoren a und b:

ab
cos ϕ = ,
|a| |b|

a1 b1 + a2 b2 + a3 b3
cos ϕ = .
a21 + a22 + a23 b12 + b22 + b32
3.4 Euklidische Geometrie (Geometrie der Bewegungen) 159

3.3.3 Volumina

Volumen des von den Vektoren a, b und c aufgespannten Parallelepipeds (Abb. 3.34a):

V = (a × b)c,
 
 a1 a 2 a 3 
 
V =  b1 b2 b3  .
c c c 
1 2 3

c b
b
a a
(a) (b) Abb. 3.34

Es gilt V > 0 (bzw. V < 0) falls a, b, c ein rechtshändiges (bzw. linkshändiges) System bilden.

Volumen des von den Punkten Pj ( x j , yj , z j ), j = 0, 1, 2, 3, aufgespannten Parallelepipeds:


Setze a := r1 − r0 , b := r2 − r0 , c := r3 − r0 .

Flächeninhalt des von den Vektoren a und b aufgespannten Dreiecks (Abb. 3.34b):

1
F= |a × b|,
2

     
 a 2 a 3  2  a3 a 1  2  a1 a 2  2
F=   +  + 
 b2 b3   b3 b1   b1 b2  .

3.4 Euklidische Geometrie (Geometrie der Bewegungen)

3.4.1 Die euklidische Bewegungsgruppe

Mit x1 , x2 , x3 and x1 , x2 , x3 bezeichnen wir zwei kartesische Koordinatensysteme. Unter einer
euklidischen Bewegung verstehen wir eine Transformation

x  = Dx + a

mit einem konstanten Spaltenvektor a = ( a1 , a2 , a3 )T und einer reellen orthogonalen (3 × 3)


Matrix D, d. h., DDT = DT D = E (Einheitsmatrix.) Explizit lautet diese Transformation:

x j  = d j1 x1 + d j2 x2 + d j3 x3 + a j , j = 1, 2, 3.

Klassifikation: (i) Translation: D = E.


(ii) Drehung: det D = 1, a = 0.
(iii) Drehspiegelung: det D = −1, a = 0.
(iv) eigentliche Bewegung: det D = 1.
160 3 Geometrie

Definition: Die Gesamtheit aller Bewegungen bildet bezüglich der Hintereinanderausführung


eine Gruppe, die man die euklidische Bewegungsgruppe nennt.
Alle Drehungen bilden eine Gruppe, die man die Drehgruppe nennt.11
Alle Translationen (bzw. alle eigentlichen Bewegungen) bilden eine Untergruppe der eukli-
dischen Bewegungsgruppe, die man die Translationsgruppe (bzw. die eigentliche euklidische
Bewegungsgruppe) nennt.
 Beispiel 1: Eine Drehung um die ζ-Achse mit dem Drehwinkel ϕ im mathematisch positiven
Sinne in einem kartesischen (ξ, η, ζ )-System lautet:

ξ  = ξ cos ϕ + η sin ϕ, ζ  = ζ,
η  = − ξ sin ϕ + ξ cos ϕ.

Abb. 3.35 zeigt die Drehung in der (ξ, η )-Ebene.

η ξ
ϕ
ξ Abb. 3.35

 Beispiel 2: Eine Spiegelung an der (ξ, η )-Ebene lautet:

ξ  = ξ, η  = η, ζ  = −ζ.

Struktursatz: (i) Jede Drehung lässt sich in einem geeigneten kartesischen Koordinatensystem
als Drehung um die ζ-Achse darstellen.
(ii) Jede Drehspiegelung lässt sich in einem geeigneten ( ξ, η, ζ )-Koordinatensystem als Zu-
sammensetzung aus einer Drehung um die ζ-Achse und einer Spiegelung an der (ξ, η )-Ebene
darstellen.

Euklidische Geometrie: Nach dem Erlanger Programm von Felix Klein sind die Eigenschaf-
ten der euklidischen Geometrie genau solche Eigenschaften, die invariant unter euklidischen
Bewegungen bleiben (z. B. die Länge einer Strecke).

3.4.2 Kegelschnitte

Die elementare Theorie der Kegelschnitte findet man in 0.1.7.

Quadratische Formen: Wir betrachten die Gleichung

xT Ax = b.

Explizit lautet diese Gleichung

a11 x12 + 2a12 x1 x2 + a22 x22 = b (3.17)


 
a11 a12
mit der reellen symmetrischen Matrix A = . Es sei A = 0. Dann gilt det A =
a21 a22
a11 a22 − a12 a21 und tr A = a11 + a22 .
11
Das ist eine reelle dreidimensionale Liegruppe (vgl. 17.1).
3.4 Euklidische Geometrie (Geometrie der Bewegungen) 161

Satz: Durch eine Drehung des kartesischen ( x1 , x2 )-Koordinatensystems kann man stets die
Normalform

λx2 + μy2 = b (3.18)

erreichen. Dabei sind λ und μ die Eigenwerte von A, d. h., es ist


 
 a11 − ζ a12 
 =0
 a21 a22 − ζ 

mit ζ = λ, μ. Es gilt det A = λμ und tr A = λ + μ.


Beweis: Wir bestimmen zwei Eigenvektoren u und v der Matrix A, d. h.,

Au = λu und Av = μv.

Dabei kann man u und v so wählen, dass uT v = 0 und uT u = vT v = 1 gilt. Wir setzen D : = (u, v).
Dann ist

x = Dx 

eine Drehung. Aus (3.17) folgt


 
λ 0
b = xT Ax = x  ( DT AD ) x  = x  x  = λ x1 + μ x2 .
T T 2 2

0 μ

Allgemeine Kegelschnitte: Wir studieren jetzt die Gleichung

xT Ax + xT a + a33 = 0

mit a = ( a13 , a23 )T , also

a11 x12 + 2a12 x1 x2 + a22 x22 + a13 x1 + a23 x2 + a33 = 0 (3.19)

mit den reellen symmetrischen Matrizen


⎛ ⎞
  a11 a12 a13
a11 a12
A= , A = ⎝ a21 a22 a23 ⎠ .
a21 a22
a31 a32 a33

Hauptfall 1: Mittelpunktsgleichungen. Ist det A = 0, dann besitzt das lineare Gleichungssy-


stem
a11 α1 + a12 α2 + a13 = 0,
a21 α1 + a22 α2 + a23 = 0

eine eindeutige Lösung (α1 , α2 ). Durch die Translation X j := x j − α j , j = 1, 2, geht (3.19) in die
Gleichung
det A
a11 X12 + 2a12 X1 X2 + a22 X22 = − .
det A
über. Analog zu (3.17) erhalten wir daraus durch eine Drehung:

det A
λx2 + μy2 = − .
det A
162 3 Geometrie

Tabelle 3.3 Mittelpunktskurven

det A det A Normalform Name graphische Darstellung


( a > 0, b > 0, c > 0)
x2 y2 y6
>0 <0 2
+ 2 =1 Ellipse
a b
-
x

x2 y2
>0 2
+ 2 = −1 imaginäre Ellipse
a b

x2 y2 y6
=0 + 2 =0 doppelter Punkt
a2 b
b -
x

x2 y2 y6
<0 <0 2
− 2 =1 Hyperbel
a b
-
x

y6
y2 x2
>0 − 2 =1 Hyperbel
b2 a
-
x

x2 y2 y6
=0 − 2 =0 Doppelgerade
a 2 b @
@ -
@ x
@

Wegen det A = λμ und tr A = λ + μ erhält man so die in Tab. 3.3 angegebenen Normalformen.

Hauptfall 2: Keine Mittelpunktsgleichung. Es sei det A = 0, also λ = 0 und μ = 0. Durch eine


Drehung von (3.19) ergibt sich

λx2 + 2qx + py + c = 0.

Die quadratische Ergänzung liefert

q 2 q2
λ x+ + py + c − = 0.
λ λ

1. Ist p = 0, dann liegt eine Parabel vor.


2. Ist p = 0, dann erhält man nach Translation x2 = 0 oder x2 = ± a2 (vgl. Tab. 3.4).
3.4 Euklidische Geometrie (Geometrie der Bewegungen) 163

Tabelle 3.4 Keine Mittelpunktskurve (det A = 0).

Normalform ( a > 0) Name graphische Darstellung


y6
y = ax2 Parabel

-
x

y2 = 0 Doppelgerade y6
-
x

y6
y2 = a2 zwei Geraden y = ± a
-
x

y2 = − a2 zwei imaginäre Geraden

3.4.3 Flächen zweiter Ordnung

Quadratische Formen: Wir betrachten die Gleichung

xT Ax = b .

Explizit lautet diese Gleichung


a11 x12 + 2a12 x1 x2 + 2a13 x1 x3 + 2a23 x2 x3 + a22 x22 + a33 x32 = b (3.20)
mit der reellen symmetrischen Matrix A = ( a jk ). Es sei A = 0. Dann gilt tr A = a11 + a22 + a33 .

Satz: Durch eine Drehung des kartesischen ( x1 , x2 , x3 )-Koordinatensystems kann man stets
die Normalform

λx2 + μy2 + ζz2 = b .

erreichen. Dabei sind λ, μ und ζ die Eigenwerte von A, d. h., es ist det ( A − νE ) = 0 mit
ν = λ, μ, ζ. Es gilt det A = λμζ und tr A = λ + μ + ζ.
Beweis: Wir bestimmen drei Eigenvektoren u, v und w der Matrix A, d. h.,
Au = λu, Av = μv, Aw = ζw .

Dabei kann man u, v und w so wählen, dass uT v = uT w = vT w = 0 und uT u = vT v = wT w = 1


gilt. Wir setzen D := (u, v, w). Dann ist
x = Dx 
eine Drehung. Aus (3.20) folgt
⎛ ⎞
λ 0 0
T  T ⎝
0 ⎠ x = λ x1 + μ x2 + ζ x3 .
2 2 2
b = x Ax = x ( D AD ) x = x
T T
0 μ 
0 0 ζ
164 3 Geometrie

Allgemeine Flächen zweiter Ordnung: Wir studieren jetzt die Gleichung

xT Ax + xT a + a44 = 0

mit a = ( a14 , a24 , a34 )T . Explizit lautet diese Gleichung

a11 x12 + 2a12 x1 x2 + 2a13 x1 x3 + 2a23 x2 x3 + a22 x22 + a33 x32


+ a14 x1 + a24 x2 + a34 x3 + a44 = 0 (3.21)

mit den reellen symmetrischen Matrizen


⎛ ⎞
⎛ ⎞ a11 a12 a13 a14
a11 a12 a13 ⎜ a21
⎝ ⎠ ⎜ a22 a23 a24 ⎟
⎟.
A = a21 a22 a23 , A=⎝
a31 a32 a33 a34 ⎠
a31 a32 a33
a41 a42 a43 a44

Hauptfall 1: Mittelpunktsflächen. Ist det A = 0, dann besitzt das lineare Gleichungssystem


a11 α1 + a12 α2 + a13 α3 + a14 = 0,
a21 α1 + a22 α2 + a23 α3 + a24 = 0,
a31 α1 + a32 α2 + a33 α3 + a34 = 0

eine eindeutige Lösung (α1 , α2 , α3 ). Durch die Translation X j := x j − α j , j = 1, 2, 3, geht (3.21) in


die Gleichung

det A
a11 X12 + 2a12 X1 X2 + 2a13 X1 X3 + 2a23 X2 X3 + a22 X22 + a33 X32 = −
det A
über. Analog zu (3.20) erhalten wir daraus durch eine Drehung:

det A
λx2 + μy2 + ζz2 = − .
det A

Hauptfall 2: Keine Mittelpunktsfläche. Durch eine Drehung von (3.21) ergibt sich

λx2 + μy2 + px + ry + sz + c = 0.

Bildung der quadratischen Ergänzung und Translationen liefern dann die in Tab. 3.6 angegebenen
Normalformen.
3.4 Euklidische Geometrie (Geometrie der Bewegungen) 165

Tabelle 3.5 Mittelpunktsflächen

Normalform Name graphische Darstellung


( a > 0, b > 0, c > 0)

x2 y2 z2 z 6
+ + =1 Ellipsoid
a2 b2 c2
>y


 -
x

x2 y2 z2
2
+ 2 + 2 = −1 imaginäres Ellipsoid
a b c

x2 y2 z2 z 6
+ 2 + 2 =0 Nullpunkt
>y

a 2 b c 

b -
 x


z 6
x2 y2 z2
+ 2 − 2 =1 einschaliges Hyperboloid
a 2 b c 3

 y

 -
x

z 6
x2 y2 z2 S 
+ − =0 Doppelkegel
a2 b2 c2 S 
>y
S 
S
 -
S x
 S
 S
 S

z 6
z2 x2 y2
− − =1 zweischaliges Hyperboloid
c2 a2 b2 >y



 -
x
166 3 Geometrie

Tabelle 3.6 Keine Mittelpunktsfläche (det A = 0).

Normalform Name graphische Darstellung


( a > 0, b > 0, c > 0)

x2 y2 z 6
2
+ 2 = 2cz elliptisches Paraboloid
a b

>y



r
 -
x

x2 y2 z 6
− = 2cz hyperbolisches Paraboloid >y

a2 b2 
(Sattelfläche) 

r -
x

x2 y2 z 6
2
+ 2 =1 elliptischer Zylinder
a b >

 y

r -
x

z 6
x2 y2
− 2 =1 hyperbolischer Zylinder 3


 y
a 2 b



r -
x

x2 y2
2
− 2 =0 zwei sich schneidende Ebenen z 6
a b

r -
x

x = 2cy2 parabolischer Zylinder z 6


>

 y



r -
x
3.5 Projektive Geometrie 167

Tabelle 3.6 (Fortsetzung)

Normalform Name graphische Darstellung


( a > 0, b > 0, c > 0)

x 2 = a2 zwei parallele Ebenen ( x = ± a)

x2 = 0 Doppelebene

x2 y2
+ = −1 imaginärer elliptischer Zylinder
a2 b2

x2 y2
2
+ 2 =0 ausgearteter elliptischer Zylinder z 6
a b
(die z-Achse) y
-
x

3.5 Projektive Geometrie

3.5.1 Grundideen

In der ebenen euklidischen Geometrie besteht keine Dualität zwischen Punkten und Geraden. Es
gilt:
(i) Durch zwei verschiedene Punkte geht stets genau eine Gerade.
(ii) Zwei verschiedene Geraden schneiden sich jedoch nicht stets in einem Punkt.
Um diese Asymmetrie zu beheben, definiert man:

unendlich ferner Punkt = unorientierte Richtung.

Zwei parallele Geraden besitzen die gleiche Richtung, d. h., sie haben den gleichen unendlich
fernen Punkt gemeinsam. Mit dieser Konvention gilt: Zwei verschiedene Geraden schneiden sich
stets in einem Punkt.
Homogene Koordinaten: Um diese Idee rechnerisch zu fassen, ersetzen wir beispielsweise in
der Geradengleichung

y = 2x + 1

die Größe x (bzw. y) durch x/u (bzw. y/u) und multiplizieren mit u. Das ergibt

y = 2x + u.
168 3 Geometrie

Jedem Punkt ( x, y) ordnen wir die Menge aller homogenen Koordinaten ( xu, yu) zu, wobei u
eine beliebige reelle Zahl ungleich null ist. Den beiden parallelen Geraden

y = 2x + 1, y = 2x + 3

entsprechen die Gleichungen

y = 2x + u, y = 2x + 3u

mit der Lösung x = 1, y = 2, u = 0, die dem gemeinsamen unendlich fernen Punkt entspricht
(Abb. 3.36). Die Gleichung

u=0

ist die Gleichung der unendlich fernen Geraden.

1
x
Abb. 3.36

Projektive Punkte der Ebene: Unter einem projektiven Punkt verstehen wir die Menge
# $ % &
( x, y, u) := (λx, λy, λu) | λ ∈ R, λ = 0

mit x2 + y2 + u2 = 0. Die Menge aller dieser projektiven Punkte wird durch RP2 bezeichnet und
reelle projektive Ebene genannt.
Jedes Tupel (λx, λy, λu) mit λ = 0 heißt eine homogene Koordinate des Punktes [( x, y, u)].
Genau die projektiven Punkte [( x, y, u)] mit u = 0 heißen unendlich ferne Punkte.
Projektive Geraden: Die Menge aller projektiven Punkte [( x, y, u)], die der Gleichung

ax + by + cu = 0

genügen, bezeichnet man als eine projektive Gerade. Dabei seien a, b und c reelle Koeffizienten
mit a2 + b2 + c2 = 0.
Zwei projektive Geraden

a1 x + b1 y + c1 u = 0,
a2 x + b2 y + c2 u = 0
 
a1 b1 c1
heißen genau dann verschieden, wenn Rang = 2.
a2 b2 c2
Dualitätsprinzip: (i) Durch zwei verschiedene projektive Punkte geht genau eine projektive
Gerade.
(ii) Zwei verschiedene projektive Geraden schneiden sich in genau einem projektiven Punkt.
Realisierung der projektiven Ebene am Einheitskreis: Mit RP∗2 bezeichnen wir die Ge-
samtheit aller Punkte des offenen Einheitskreises. Hinzu nehmen wir die diametral gelegenen
Punktepaare A, B auf dem Rand des Einheitskreises (Abb. 3.37) d. h., wir identifizieren diametral
gelegene Randpunkte miteinander.
3.5 Projektive Geometrie 169

y ( x, y, 1)

 A

x
(ξ, η )
B RP∗2 Abb. 3.37

Satz: Es existiert eine bijektive Abbildung von RP2 auf RP∗2 .


Beweis: Dem projektiven Punkt [( x, y, 1)], der den kartesischen Koordinaten ( x, y) entspricht,
ordnen wir den Punkt (ξ, η ) zu, der auf der durch den Punkt ( x, y) und (0, 0) gehenden Strecke
liegt und vom Ursprung (0, 0) den Abstand
2
= arctan r
π
besitzt mit r := x2 + y2 . Dagegen soll dem unendlich fernen Punkt [(1, m, 0)] das diame-
trale Punktepaar { A, B} entsprechen, das sich durch Schnitt der Geraden y = mx mit dem
Einheitskreis ergibt (Abb. 3.37). 
Der Satz von Desargues (1593–1662): Gehen die Verbindungslinien entsprechender Ecken
zweier Dreiecke durch einen Punkt, dann liegen die Schnittpunkte entsprechender Seiten auf
einer Geraden (Abb. 3.38).

Abb. 3.38

Doppelverhältnis: Liegen vier Punkte A, B, C und D auf einer Geraden, dann bezeichnet man
die reelle Zahl

AC BC
:
AD BD

als das Doppelverhältnis dieser vier Punkte (Abb. 3.39). Dabei ist AC die Länge der Strecke von
A nach C usw.
Das Doppelverhältnis ist die wichtigste Invariante der projektiven Geometrie.

A B C D Abb. 3.39

3.5.2 Projektive Abbildungen

Projektion zweier Geraden aufeinander: Abb. 3.40 zeigt eine Parallelprojektion und eine Zen-
tralprojektion. Dabei kann sich die Länge von Strecken ändern. Es gilt jedoch das fundamentale
Resultat:

Das Doppelverhältnis von vier Punkten bleibt unverändert.


170 3 Geometrie

E

a) Parallelprojektion b) Zentralprojektion
Abb. 3.40 Abb. 3.41

Projektion zweier Ebenen aufeinander: Abb. 3.41 zeigt eine Zentralprojektion der Ebene
E auf die Ebene E  . Dabei bleibt wiederum das Doppelverhältnis von vier auf einer Geraden
liegenden Punkten unverändert.
Kollineationen: Führen wir in E und E  die homogenen Koordinaten ( x, y, u) und ( x  , y , u )
ein, dann ist eine Kollineation definitionsgemäß eine Abbildung der Gestalt
⎛ ⎞ ⎛ ⎞⎛ ⎞
x a11 a12 a13 x
⎝ y ⎠ = ⎝ a21 a22 a23 ⎠ ⎝ y ⎠
u a31 a32 a33 u

mit einer reellen (3 × 3)-Matrix ( a jk ), deren Determinante nicht verschwindet.


Struktursatz: (i) Jede Abbildung von E auf E  , die sich aus endlich vielen Parallel und
Zentralprojektionen ergibt, ist eine Kollineation. Auf diese Weise erhält man alle Kollineationen
von E auf E  .
(ii) Das Doppelverhältnis von vier auf einer Geraden liegenden Punkten bleibt bei Kollineatio-
nen unverändert.
 Beispiel: Bei einer photographischen Aufnahme ist das Doppelverhältnis von vier auf einer
Geraden liegenden Landschaftspunkten gleich dem Doppelverhältnis der vier Bildpunkte auf
dem Photo. Kennt man deshalb die Koordinaten von drei dieser Landschaftspunkte, dann
kann man die Koordinaten des vierten Landschaftspunktes dadurch berechnen, dass man das
Doppelverhältnis der vier Punkte auf dem Photo ausmisst.
Projektive Eigenschaften: Nach dem Erlanger Programm sind die projektiven Eigenschaften
genau diejenigen, welche unter der Gruppe der Kollineationen unverändert bleiben.

3.5.3 Der n-dimensionale reelle projektive Raum

Es sei n = 1, 2, . . .
Projektive Punkte: Unter einem projektiven Punkt verstehen wir die Menge
# $ % &
x1 , . . . , xn+1 := ( λx1 , . . . , λxn+1 ) | λ ∈ R, λ = 0 .

Dabei sind alle x j reelle Zahlen mit x12 + . . . + x2n+1 = 0. Wir nennen ( λx1 , . . . , λxn+1 ) mit λ = 0
homogene Koordinaten von [ x1 , . . . , xn+1 ].
Die Menge aller dieser Punkte wird mit RPn bezeichnet und heißt n-dimensionaler projektiver
Raum. Die projektiven Punkte mit xn+1 = 0 nennt man unendlich ferne Punkte.
3.5 Projektive Geometrie 171

Projektive Teilräume: Gegeben seien m linear unabhängige Vektoren p1 , . . . , pm ∈ R n+1 . Die


Gesamtheit aller projektiven Punkte [ x ], deren homogene Koordinaten x sich in der Form

x = t1 p1 + . . . + t m p m

mit beliebigen reellen Parametern t1 , . . . , tm , darstellen lassen, ist definitionsgemäß ein m-


dimensionaler projektiver Teilraum von RPn , der von den Punkten [ p1 ], . . . , [ pm ] erzeugt wird.
Ist m = 1 (bzw. m = n − 1), dann sprechen wir von einer projektiven Geraden (bzw. projektiven
Hyperebene).
Kollineationen: Darunter verstehen wir eine Abbildung

x  = Ax

zwischen den homogenen Koordinaten x und x  . Dabei ist A eine reelle quadratische Matrix mit
n + 1 Zeilen und det A = 0.
Jeder derartigen Kollineation entspricht eine Abbildung

ϕ A : RPn −→ RP n .

Es gilt genau dann ϕ A = ϕ B wenn sich die Matrizen A und B um einen von Null verschiedenen
reellen Faktor unterscheiden.
Projektive Gruppe: Die Gesamtheit dieser Abbildungen ϕ bildet die projektive Gruppe
PGL(n + 1, R ). Das ist eine Faktorgruppe der Form

PGL(n + 1, R ) = GL(n + 1, R )/D.

Dabei bezeichnet GL( n + 1, R) die Gruppe aller reellen invertierbaren ( n + 1)-Matrizen, während
D für die Untergruppe aller Diagonalmatrizen λI mit λ = 0 steht.
Satz: Kollineationen überführen m-dimensionale projektive Teilräume in ebensolche und
erhalten die Inzidenzen.
Die topologische Struktur von RPn : Der Raum RP n ist eine n-dimensionale zusammenhän-
gende kompakte glatte reelle Mannigfaltigkeit.12 Bezeichnen wir mit
%  &
S n : = x ∈ R n +1  | x | = 1

die n-n-dimensionale Einheitssphäre und mit Z2 die zyklische Gruppe der Ordnung 2 , dann ist
Sn /Z2 diffeomorph zu RPn . Dafür schreiben wir

RPn  Sn /Z2 .

Dabei ergibt sich Sn /Z2 aus Sn , indem man Antipodenpunkte von Sn miteinander identifiziert.
Benutzen wir die abgeschlossene Nordhalbkugel
% &
S+n
: = x ∈ S n | x n+1 ≥ 0

dann haben wir den Homöomorphismus

RPn  S+
n
/Z2 .

12
Diese grundlegenden Begriffe werden in Kapitel 15 eingeführt und ausführlich untersucht.
172 3 Geometrie

n /Z , indem Antipodenpunkte auf dem Äquator von S n miteinander identifi-


Hier ergibt sich S+ 2 +
ziert werden.
 Beispiel 1: Für n = 1 ist S1+ der obere Halbkreis { x2 + y2 = 1 | y ≥ 0}, und S1+ /Z2 ergibt sich
durch die Identifizierung (Zusammenkleben) der beiden Randpunkte (−1, 0) und (1, 0). Daraus
erhalten wir eine deformierte Kreislinie, die in die Kreislinie S1 verbogen werden kann. Das
motiviert den Homöomorphismus

RP1  S1

der tatsächlich ein Diffeomorphismus ist.


 Beispiel 2: Im Fall n = 2 haben wir die Homöomorphismen

RP2  S2+ /Z2  RP∗2 ,

wobei sich RP∗2 aus dem Einheitskreis {( x, y) ∈ R2 | x2 + y2 ≤ 1} durch Identifizierung von


diametral gelegenen Randpunkten ergibt (vgl. Abb. 3.37).
Satz: RP2 ist eine nichtorientierbare Fläche.
Bei jeder normalen Fläche kann man zwei Seiten unterscheiden. Zum Beispiel besitzt je-
de Kugeloberfläche eine äußere und eine innere Seite. Eine derartige Unterscheidung ist bei
nichtorientierbaren Flächen unmöglich.

3.5.4 Der n-dimensionale komplexe projektive Raum

Lassen wir bei der Definition des projektiven Punktes komplexe Zahlen x1 , . . . , xn+1 und λ zu,
dann ergibt sich der Raum CPn in analoger Weise zu RPn in 3.5.3.
Ebenso werden Kollineationen von CPn analog zum Raum RPn erklärt, indem man zulässt,
dass die Transformationsmatrizen komplex sind. Ferner wird die komplexe projektive Gruppe
PGL(n + 1, C ) durch die Faktorgruppe

PGL(n + 1, C ) = GL( n + 1, C ) /D.

definiert. Dabei ist GL( n + 1, C ) die Gruppe aller komplexen invertierbaren (n + 1)-Matrizen,
und D bezeichnet die Untergruppe aller Diagonalmatrizen λI mit λ = 0.
Projektive Eigenschaften: Eine Eigenschaft gehört genau dann zur komplexen n-
dimensionalen projektiven Geometrie, wenn sie invariant ist unter Kollineationen von CPn ,
d. h., sie ist invariant unter der Gruppe PGL( n + 1, C ).
Die topologische Struktur von CP n : Der Raum CPn ist eine n-dimensionale zusammenhän-
gende kompakte glatte komplexe Mannigfaltigkeit. Bezeichnen wir mit
! "
 n+1
n +1 
n
SC := x∈C  ∑ | x j |2 = 1
j =1

die n-dimensionale komplexe Einheitssphäre, dann haben wir den Diffeomorphismus

CPn  SC
n 1
/SC .
3.5 Projektive Geometrie 173

In 3.8.4 werden wir die Fruchtbarkeit der Methoden der komplexen projektiven Geometrie für
die Untersuchung ebener algebraischer Kurven erläutern. Die Theorie dieser Kurven wäre ohne
die Verwendung solcher Methoden nur ein Torso von Einzelaussagen, bei deren Formulierung
ständig störende Ausnahmefälle auftreten würden.

Die idealen algebraischen und topologischen Eigenschaften von CPn


sind für den Erfolg der projektiven Methoden in der algebraischen
Geometrie verantwortlich.

3.5.5 Die Klassifikation der ebenen Geometrien

Wir betrachten eine Ebene E. Die Klassifikation der ebenen Geometrien geschieht nach dem
Erlanger Programm von Felix Klein (1872), indem man Transformationsgruppen der Ebene E
auf sich betrachtet und deren Invarianten studiert.

3.5.5.1 Euklidische Geometrie

Die euklidische Bewegungsgruppe: Die Gruppe dieser Geometrie ist die euklidische Bewe-
gungsgruppe von E, die sich aus Translationen, Drehungen und Spiegelungen zusammensetzt.
Analytisch wird diese Gruppe durch die Transformationen x → x  der Ebene E beschrieben, die
die Form

x  = Ax + a (T)

besitzen mit x = ( x1 , x2 )T und a = ( a1 , a2 )T . Dabei ist A eine orthogonale Matrix, d. h., es gilt
AT A = AAT = E (Einheitsmatrix). Für A = I beschreibt die Transformationsformel (T) eine
Translation.13
Kongruenz: Zwei Figuren in der Ebene E heißen genau dann kongruent, wenn sie sich durch
eine euklidische Bewegung ineinander überführen lassen.

3.5.5.2 Ähnlichkeitsgeometrie

Die Gruppe der Ähnlichkeitstransformationen: Die Gruppe dieser Geometrie ist die Ähn-
lichkeitsgruppe, die aus genau allen Transformationen (T) besteht, bei denen A das Produkt aus
einer orthogonalen Transformation und einer Diagonalmatrix mit positiven Elementen ist.
Geometrische Charakterisierung: Man erhält genau dann eine eigentliche Ähnlichkeitstrans-
formation, wenn man auf zwei parallele Ebenen E und F im Raum eine Zentralprojektion ausübt
und anschließend die Bildpunkte von F mit Punkten von E identifiziert. Das entspricht (T) mit
einer Diagonalmatrix
 
λ 0
A= .
0 λ

Die positive Zahl λ stellt den Vergrößerungsfaktor der Ähnlichkeitstransformation dar. Beliebige
Ähnlichkeitstransformationen setzen sich aus eigentlichen Ähnlichkeitstransformationen und
euklidischen Bewegungen zusammen.
13
Explizit gilt
x1 = a11 x1 + a12 x2 + a1 ,
x2 = a21 x1 + a22 x2 + a2 ,
mit reellen Koeffizienten a jk , a j und reellen Variablen x j und x j .
174 3 Geometrie

Ähnliche Figuren: Zwei Figuren der Ebene E heißen genau dann ähnlich,, wenn sie sich durch
eine Ähnlichkeitstransformation ineinander überführen lassen.

3.5.5.3 Affine Geometrie

Die affine Gruppe: Diese Transformationsgruppe der Ebene E besteht aus genau allen Trans-
formationen der Form (T) mit einer invertierbaren Matrix A . Diese Transformationen heißen
Affinitäten.
Geometrische Charakterisierung: Geometrisch erhält man genau dann eine Affinität, wenn
man auf endlich viele Ebenen E, E1 , . . . , En , F im Raum nacheinander Parallelprojektionen ausübt
und die so entstehenden Bildpunkte von F mit Punkten von E identifiziert.
Affine Äquivalenz: Zwei Figuren der Ebene E heißen genau dann affin äquivalent, wenn sie
sich durch eine Affinität ineinander überführen lassen.
 Beispiel: Bei einer Affinität gehen Kreise in Ellipsen und Ellipsen in Ellipsen über. Deshalb ist
der Begriff der Ellipse ein Begriff der affinen Geometrie.
Dagegen ist der Begriff des Kreises kein Begriff der affinen Geometrie, sondern nur ein Begriff
der euklidischen Geometrie.

3.5.5.4 Projektive Geometrie

Die Gruppe der Kollineationen (Projektivitäten): Die Gruppe der ebenen projektiven Geo-
metrie besteht aus den Kollineationen14

y = By .

mit den homogenen Koordinaten y = (y1 , y2 , y3 )T und b = (b1 , b2 , b3 )T . Dabei ist y = 0 und
y = 0. Ferner ist B eine invertierbare reelle (3 × 3)-Matrix. werden auch als Projektivitäten
bezeichnet.
Unendlich ferne Punkte: Durch die Hinzunahme von unendlich fernen Punkten y mit y3 = 0 wird
die Ebene E zur projektiven Ebene E∞ erweitert, die dem zweidimensionalen reellen projektiven
Raum RP2 . entspricht. Zwei Tupel y und y sind genau dann die homogenen Koordinaten des
gleichen Punktes der projektiven Ebene E∞ , wenn y = αy mit einer reellen Zahl α = 0 gilt.
Geometrische Charakterisierung: Geometrisch erhält man genau dann eine Projektivität,
wenn man auf endliche viele Ebenen E, E1 , . . . , En , F im Raum nacheinander Zentralprojektionen
ausübt und die so entstehenden Bildpunkte von F mit Punkten von E identifiziert.
Projektive Äquivalenz: Zwei Figuren der Ebene E heißen genau dann projektiv äquivalent,
wenn sie sich durch eine Projektivität ineinander überführen lassen.
 Beispiel: Bei einer Projektivität können Kreise, Ellipsen, Parabeln und Hyperbeln ineinander
übergeführt werden. Deshalb ist nur der Begriff des nichtentarteten Kegelschnitts ein Begriff der
ebenen projektiven Geometrie.
14
Explizit hat man
y1 = b11 y1 + b12 y2 + b13 y3 ,
y2 = b21 y1 + b22 y2 + b23 y3 ,
y3 = b31 y1 + b32 y2 + b33 y3 .
Die Koeffizienten b jk und alle Variablen y j und yj sind reell.
Der Übergang zu affinen Koordinaten und Affinitäten wird vollzogen, indem man y3 = 1 und b31 = b32 = 0 sowie
b33 = 1 setzt.
3.5 Projektive Geometrie 175

Ferner gehören die folgenden Begriffe zur ebenen projektiven Geometrie: „Gerade“, „Punkt“,
„ein Punkt liegt auf einer Geraden“, „zwei Geraden schneiden sich in einem Punktünd „Doppel-
verhältnis von vier Punkten auf einer Geraden“.

3.5.5.5 Historische Bemerkungen:

Die euklidische Geometrie hat Euklid von Alexandria (etwa 365 v. Chr. bis 300 v. Chr.) in seinem
Werk sehr ausführlich dargestellt. Diese Bücher haben über 2 000 Jahre lang den Schulunterricht
beherrscht.
Affinitäten gehen auf Euler (1707–1783) zurück.
Darstellende Geometrie und orthogonale Projektionen: Die darstellende Geometrie, die
orthogonale Projektionen auf eine oder zwei Ebenen benutzt, wurde von Monge (1746–1818)
zwischen 1766 und 1770 im Zusammenhang mit Problemen des Festungsbaus geschaffen. Im
Jahre 1798 erschien sein grundlegendes Werk Géométrie descriptive (darstellende Geometrie).
Projektive Geometrie und Zentralprojektionen: In der Renaissance vollzog sich eine Revolu-
tion in der europäischen Malerei durch die Erfindung der Perspektive, die auf Zentralprojektionen
beruht. Daran beteiligt waren die großen Maler Leon Batista Alberti (1404–1472) (Erbauer des
Petersdoms in Rom), Leonardo da Vinci (1452–1519) und Albrecht Dürer (1471–1528). Von Dürer
stammt das Buch Unterweisung der Messung mit Zirkel und Richtscheit. Bis etwa zum Jahre 1900
malte man in Europa perspektivisch.
Die Photographie beruht ebenfalls auf einer Zentralprojektion. Die erste Kamera wurde im
Jahre 1500 von Leonardo da Vinci beschrieben. Niecéphore Niepce erzeugte 1822 die ersten
Bilder mit der camera obscura.
Synthetische projektive Geometrie: Die Entwicklung der projektiven Geometrie als mathematischer
Disziplin begann mit dem im Jahre 1822 erschienenen Buch Traité des proprietés pojectives des figures
des französischen Mathematikers Poncelet (Lehrbuch der projektiven Eigenschaften von Figuren).
Dabei benutzte Poncelet (1788–1867) rein zeichnerische Methoden, die man im Gegensatz zur
analytischen Geometrie von Descanes (1596–1650) häufig synthetische Geometrie nennt. Poncelet
stand damit in der Tradition der französischen Mathematiker Desargues (1591–1661), Pascal
(1623–1662) und Monge (1746–1818).
Die baryzentrischen Koordinaten von Möbius Die rechnerische Handhabung von Projektivitäten
verdankt man dem Buch von Möbius (1827) Der barycentrische Calcul, ein neues Hilfsmittel zur
analytischen Behandlung der Geometrie.15 Möbius führte darin die baryzentrischen Koordinaten
(m1 , m2 , m3 ) ein. Sind P1 , P2 , P3 drei nicht auf einer Geraden liegende Punkte der Ebene E, dann
kann man jeden Punkt P von E eindeutig durch reelle Koordinaten m1 , m2 , m3 mit m1 + m2 +
m3 = 1 beschreiben. Sind x1 , x2 , x3 und x die entsprechenden Ortsvektoren von P1 , P2 , P3 und P,
dann gilt:

x = m 1 x1 + m 2 x2 + m 3 x3 .

 Beispiel: Die Punkte P1 , P2 und P3 besitzen der Reihe nach die Koordinaten (1, 0, 0), (0, 1, 0)
und (0, 0, 1).
Die baryzentrischen Koordinaten erlauben eine einfache physikalische Interpretation. Bringt
man in den Punkten P1 , P2 , P3 die positiven Massen m1 , m2 , m3 an, dann ist P der Schwerpunkt
dieser drei Massenpunkte und liegt im Innern des von den drei Punkten aufgespannten Dreiecks.
15
August Ferdinand Möbius (1790–1868) wirkte von 1816 bis zu seinem Tod an der Universität Leipzig und war Direktor
der Leipziger Sternwarte
176 3 Geometrie

Lässt man auch negative Massen und Nullmassen zu, dann erhält man die restlichen Punkte der
Ebene.
Verzichtet man auf die Bedingung m1 + m2 + m3 = 1, dann werden auch die üblichen
unendlich fernen Punkte erfasst.
Wesentlichen Anteil an der weiteren Ausgestaltung der projektiven Geometrie im 19. Jahrhun-
dert hatten Steiner (1796–1863), von Staudt (1798–1867), Plücker (1801–1868), Cayley (1821–1895)
und Klein (1849–1925). Der Begriff des projektiven Raumes hatte sich um 1870 als fundamen-
taler geometrischer Begriff voll durchgesetzt. Zwischen den Elementen des Euklid und diesem
Zeitpunkt lagen über 2 000 Jahre.16

3.6 Differentialgeometrie

Es gibt keine Wissenschaft, die sich nicht aus der Kenntnis der Phänomene
entwickelt, aber um Gewinn aus den Kenntnissen ziehen zu können, ist es
unerlässlich, Mathematiker zu sein.
Daniel Bernoulli (1700–1782)

Die Differentialgeometrie untersucht die Eigenschaften von Kurven und Flächen mit den Metho-
den der Differential- und Integralrechnung. Die wichtigste differentialgeometrische Eigenschaft
ist die Krümmung. Im 19. und 20. Jahrhundert haben die Mathematiker versucht, diesen Be-
griff unserer Anschauung auf höhere Dimensionen und auf immer abstraktere Situationen zu
verallgemeinern (Theorie der Hauptfaserbündel).
Die Physiker bemühten sich dagegen seit Newton, die in unserer Welt wirkenden Kräfte zu
verstehen. Überraschenderweise basieren die heute bekannten vier fundamentalen Kräfte im Kos-
mos und im Bereich der Elementarteilchen (Gravitation, starke, schwache und elektromagnetische
Wechselwirkung) auf der fundamentalen Relation

Kraft = Krümmung,

die den zur Zeit bekannten tiefsten Zusammenhang zwischen Mathematik und Physik darstellt.
Das wird ausführlich in 14.9 und 18 erläutert.
In diesem Abschnitt betrachten wir die klassische Differentialgeometrie der Kurven und
Flächen im dreidimensionalen Raum. Die Kurventheorie wurde im 18. Jahrhundert von Clairaut,
Monge und Euler geschaffen und im 19. Jahrhundert von Cauchy, Frenet und Serret weiter-
entwickelt. In den Jahren 1821 bis 1825 führte Gauß unter großen körperlichen Strapazen im
Königreich Hannover umfangreiche Landvermessungsarbeiten durch. Das veranlasste ihn, der
stets Theorie und Praxis in vorbildlicher Weise miteinander vereinte, zu umfangreichen Untersu-
chungen über gekrümmte Flächen. Im Jahre 1827 erschien sein epochales Werk Disquisitiones
generales circa superficies curvas, mit dem er die Differentialgeometrie der Flächen schuf, in deren
Mittelpunkt das „theorema egregium“ steht. Dieses tiefe mathematische Theorem besagt, dass man
die Krümmung einer Fläche allein durch Messungen auf der Fläche bestimmen kann, ohne den
umgebenden Raum zu benutzen. Damit legte Gauß den Grundstein für das imposante Gebäude
der Differentialgeometrie, dessen Weiterentwicklung durch Riemann und Élie Cartan in der
allgemeinen Relativitätstheorie Einsteins für die Gravitation (Kosmologie) und im modernen
Standardmodell der Elementarteilchen gipfelt. Dieses Standardmodell basiert auf einer Eich-
feldtheorie, die vom mathematischen Standpunkt aus der Krümmungstheorie eines geeigneten
Hauptfaserbündels entspricht.
16
Die Geschichte der Geometrie, die im 19. Jahrhundert explodierte, findet man meisterhaft dargestellt in den klassischen
Vorlesungen über die Entwicklung der Mathematik im 19. Jahrhundert von Felix Klein (vgl. [Klein 1979]).
3.6 Differentialgeometrie 177

Lokales Verhalten: Um das lokale Verhalten von Kurven und Flächen in der Umgebung
eines Punktes zu untersuchen, benutzt man die Taylorentwicklung.17 Das führt auf die Begriffe
„Tangente, Krümmung und Windung“ einer Kurve sowie auf die Begriffe „Tangentialebene und
Krümmung“ einer Fläche.

Globales Verhalten: Neben diesem Verhalten im Kleinen interessiert das Verhalten im Großen.
Ein typisches Resultat hierfür ist der Satz von Gauß-Bonnet der Flächentheorie, der den Aus-
gangspunkt für die moderne Differentialtopologie im Rahmen der Theorie der charakteristischen
Klassen darstellt (vgl. 18.10).

3.6.1 Ebene Kurven

Parameterdarstellung: Eine ebene Kurve wird durch eine Gleichung der Form

x = x ( t ), y = y ( t ), a ≤ t ≤ b, (3.22)

in kartesischen ( x, y )-Koordinaten gegeben (Abb. 3.42).

y y

y0 y0

x0 x x0 x
(a) (b) Abb. 3.42

Interpretieren wir den reellen Parameter t als Zeit, dann beschreibt (3.22) die Bewegung eines
Punktes, der sich zur Zeit t am Ort ( x (t), y( t)) befindet.
 Beispiel 1: Im Spezialfall t = x entsteht die Kurvengleichung y = y( x ).

Bogenlänge s der Kurve:

b
s= x ( t)2 + y (t)2 dt.
a

Gleichung der Tangente im Punkt ( x0 , y0 ) (Abb. 3.42a):

x = x0 + (t − t0 ) x0 , y = y0 + (t − t0 )y0 , −∞ < t < ∞.

Dabei setzen wir x0 := x ( t0 ), x0 := x  (t0 ), y0 := y( t0 ), y0 := y (t0 ).

Gleichung der Normalen im Punkt ( x0 , y0 ) (Abb. 3.42b):

x = x0 − (t − t0 ) y0 , y = y0 + (t − t0 ) x0 , −∞ < t < ∞. (3.23)

17
Es wird stets stillschweigend vorausgesetzt, dass alle auftretenden Funktionen hinreichend glatt sind.
178 3 Geometrie

R
P
M

Abb. 3.43

Krümmungsradius R: Ist die Kurve (3.22) vom Typ C2 in einer Umgebung des Punktes
P( x0 , y0 ), dann gibt es einen eindeutig bestimmten Kreis vom Radius R mit dem Mittelpunkt
M(ξ, η ), der mit der Kurve im Punkt P in zweiter Ordnung übereinstimmt (Abb. 3.43 ).18

P P P

(a) K > 0 (b) K < 0 (c) K = 0 Abb. 3.44

Krümmung K: Diese Größe wird so eingeführt, dass

1
|K | := .
R

gilt. Das Vorzeichen von K im Punkt P ist definitionsgemäß positiv (bzw. negativ), falls die Kurve
im Punkt „P“ oberhalb (bzw. unterhalb) der Tangente liegt (Abb. 3.44). Für die Kurve (3.22) gilt

x  y − y0 x0


K=  0 0 3/2
x0 2 + y0 2

mit dem Krümmungsmittelpunkt M (ξ, η ):

y0 ( x0 + y0 ) x0 ( x0 + y0 )


2 2 2 2
ξ = x0 − , η = y0 + .
x0 y0 − y0 x0 x0 y0 − y0 x0

Wendepunkt: Definitionsgemäß besitzt eine Kurve in P einen Wendepunkt, wenn K ( P) = 0


gilt und K in P das Vorzeichen wechselt (Abb. 3.44c).

Scheitelpunkt: Kurvenpunkte, in denen die Krümmung K ein Maximum oder Minimum


besitzt, heißen Scheitelpunkte.
18
Dies bedeutet, dass die Taylorentwicklungen für die Kurve und den Kreis im Punkt „P“ bis zu den quadratischen Termen
übereinstimmen.
3.6 Differentialgeometrie 179

Winkel ϕ zwischen zwei Kurven x = x(t ), y = y(t ) und X = X (τ ), Y = Y (τ ) im Schnitt-


punkt:

x0 X0 + y0 Y0


cos ϕ = , 0≤ ϕ < π.
x0 2 + y0 2 X0 2 + Y0 2

Dabei ist ϕ gleich dem Winkel zwischen den Tangenten im Schnittpunkt gemessen im mathema-
tisch positiven Sinn (Abb. 3.45).

Abb. 3.45

Die Werte x0 , X0 usw. beziehen sich auf den Schnittpunkt.

Anwendungen:
 Beispiel 2: Die Gleichung eines Kreises vom Radius R mit dem Mittelpunkt (0, 0) lautet:

x = R cos t, y = R sin t, 0 ≤ t < 2π

(Abb. 3.46). Der Punkt (0, 0) ist der Krümmungsmittelpunkt, und R der Krümmungsradius. Das
ergibt die Krümmung
1
K= .
R

S
ϕ
R x

Abb. 3.46

Aus den Ableitungen x ( t) = − R sin t und y (t ) = R cos t erhalten wir die Gleichung der
Tangente in Parameterform:
x = x0 − ( t − t 0 ) y 0 , y = y0 + ( t − t0 ) x0 , −∞ < t < ∞.
Für die Bogenlänge s ergibt sich wegen cos2 t + sin2 t = 1 die Beziehung

s= x  (t)2 + y (t )2 dt = Rϕ .
0

Schreiben wir die Kreisgleichung in der impliziten Form

x 2 + y2 = R2 ,
180 3 Geometrie

dann folgt aus Tab. 3.8 mit F( x, y) := x2 + y2 − R2 die Gleichung der Tangente im Punkt (x0 , y0 ):

x0 ( x − x0 ) + y0 (y − y0 ) = 0,

d. h., x0 x + y0 y = R2 . In Polarkoordinaten lautet die Kreisgleichung

r = R.

Tabelle 3.7

Kurvengleichungen y = y( x ) r = r ( ϕ)
(explizite Form) (Polarkoordinaten)

b β
Bogenlänge s= 1 + y ( x )2 dx r2 + r  2 dϕ
a α

Gleichung der Tangente im y = x0 + y0 ( x − x0 )


Punkt P( x0 , y0 )

Gleichung der Normalen im −y0 (y − y0 ) = x − x0


Punkt P( x0 , y0 )

y0 r2 + 2r  − rr 
2
K im Punkt P ( x0 , y0 )    3/2
1 + y0  2 3/2 r2 + r  2

y0 (1 + y0 )
2
(r2 + r  2 )( x0 + r  sin ϕ)
Krümmungsmittelpunkt ξ = x0 − ξ = x0 −
y0 r2 + 2r  2 − rr 
1 + y0
2
(r + r  2 )(y0 − r  cos ϕ)
2
η = y0 + η = y0 −
y0 r2 + 2r  2 − rr

 Beispiel 3: Die Parabel

1 2
y= ax
2

mit a > 0 besitzt nach Tab. 3.7 im Punkt x = 0 die Krümmung K = a.


 Beispiel 4: Es sei y = x3 . Aus Tab. 3.7 erhalten wir

y ( x ) 6x
K=  3/2 =  3/2 .
1 + y  ( x )2 1 + 9x 4

Im Punkt x = 0 wechselt das Vorzeichen von K. Deshalb liegt dort ein Wendepunkt vor.

Singuläre Punkte: Wir betrachten die Kurve x = x (t), y = y( t). Definitionsgemäß heißt
( x (t0 ), y(t0 )) genau dann ein singulärer Punkt der Kurve, wenn

x  (t0 ) = y ( t0 ) = 0.
3.6 Differentialgeometrie 181

Tabelle 3.8

implizite Kurvengleichung F ( x, y ) = 0

Tangentengleichung im Punkt P( x0 , y0 ) Fx ( P)( x − x0 ) + Fy ( P)(y − y0 ) = 0

Normalengleichung im Punkt P( x0 , y0 ) Fx ( P)(y − y0 ) − Fy ( P)( x − x0 ) = 0

− Fy2 Fxx + 2Fx Fy Fxy − Fx2 Fyy


Krümmung K im Punkt P (Fx := Fx ( P) usw.)  2 3/2
Fx + Fy2
Fx ( Fx2 + Fy2 )
Krümmungsmittelpunkt ξ = x0 −
Fy2 Fxx − 2Fx Fy Fxy + Fx2 Fyy
Fy ( Fx2 + Fy2 )
η = y0 −
Fy2 Fxx − 2Fx Fy Fxy + Fx2 Fyy

gilt. In einem solchen Punkt existiert keine Tangente. Die Untersuchung des Verhaltens der
Kurve in der Umgebung eines singulären Punktes geschieht mit Hilfe der Taylorentwicklung

(t − t0 )2  (t − t0 )3 
x ( t ) = x ( t0 ) + x ( t0 ) + x ( t0 ) + . . . ,
2 6
(t − t0 ) 
2 (t − t0 ) 
3
y ( t ) = y ( t0 ) + y ( t0 ) + y ( t0 ) + . . . .
2 6
 Beispiel 5: Für

x = x0 + ( t − t 0 ) 2 + . . . , y = y0 + ( t − t 0 ) 3 + . . .

liegt ein Rückkehrpunkt vor (Abb. 3.47a). Im Fall

x = x0 + ( t − t 0 ) 2 + . . . , y = y0 + ( t − t 0 ) 2 + . . .

endet die Kurve im Punkt ( x0 , y0 ) (Abb. 3.47b).

( t > t0 )

t ≷ t0
( x0 , y0 ) ( x 0 , y0 )

( x 0 , y0 )
(a) Rückkehrpunkt (b) Endpunkt Abb. 3.47

Singuläre Punkte für implizit gegebene Kurven: Ist die Kurve durch die Gleichung F ( x, y ) =
0 gegeben mit F ( x0 , y0 ) = 0, dann ist ( x0 , y0 ) definitionsgemäß genau dann ein singulärer Punkt
der Kurve, wenn

Fx ( x0 , y0 ) = Fy ( x0 , y0 ) = 0

gilt. Das Verhalten der Kurve in einer Umgebung von ( x0 , y0 ) untersucht man mit Hilfe der
Taylorentwicklung

F ( x, y) = a( x − x0 )2 + 2b( x − x0 )(y − y0 ) + c( y − y0 )2 + . . . . (3.24)


182 3 Geometrie

Dabei setzen wir a : = 2 Fxx ( x0 , y0 ),


1
b := 2 Fxy ( x0 , y0 )
1
und c := 2 Fyy ( x0 , y0 ).
1
Ferner sei D :=
ac − b2 .
Fall 1: D > 0. Dann ist ( x0 , y0 ) ein isolierter Punkt (Abb. 3.48a).
Fall 2: D < 0. Hier schneiden sich zwei Kurvenzweige im Punkt ( x0 , y0 ) (Abb. 3.48b).
Gilt D = 0, dann muss man Terme höherer Ordnung in (3.24) berücksichtigen. Beispielsweise
können die folgenden Situationen auftreten: Berührung, Rückkehrpunkt, Endpunkt, dreifacher
Punkt oder allgemeiner n-facher Punkt (vgl. Abb. 3.47 und Abb. 3.48).

( x0 , y0 )

( x0 , y 0 )
( x 0 , y0 )
(a) isolierter (b) Doppel- (c) Selbst- (d) dreifacher
Punkt punkt berührung Punkt Abb. 3.48

Katastrophentheorie: Eine Diskussion von Singularitäten im Rahmen der Katastrophentheo-


rie findet man in 13.13.

Asymptoten: Nähert sich eine Kurve bei immer größer werdender Entfernung vom Koordina-
tenursprung einer Geraden, dann heißt diese Gerade eine Asymptote.
 Beispiel 6: Die x-Achse und die y-Achse sind Asymptoten der Hyperbel xy = 1 (Abb. 3.49).
Es sei a ∈ R. Wir betrachten die Kurve x = x ( t), y = y( t) und den Grenzübergang t → t0 + 0.
(i) Für y(t) → ±∞, x ( t) → a ist die Gerade x = a eine vertikale Asymptote.
(ii) Für x (t) → ±∞, y( t) → a ist die Gerade y = a eine horizontale Asymptote.
(iii) Es sei x (t) → +∞ und y(t) → +∞. Existieren die beiden Grenzwerte

y(t)  
m = lim and c = lim y (t) − mx( t) ,
t → t0 +0 x (t) t → t0 + 0

dann ist die Gerade y = mx + c eine Asymptote.


Analog verfährt man für t → t0 − 0 und t → ± ∞.
 Beispiel 7: Die Hyperbel

x2 y2
2
− 2 =1
a b

y y

x x

Abb. 3.49 xxxxxxxxxxxxxxxxxxxxxxxx Abb. 3.50 xxxxxxxxxxxxxxxxxxxx


3.6 Differentialgeometrie 183

besitzt die Parameterdarstellung x = a cosh t, y = b sinh t. Die beiden Geraden

b
y=± x
a
sind Asymptoten (Abb. 3.50).
Beweis: Beispielsweise gilt

b sinh t b
lim = , lim (b sinh t − b cosh t) = 0.
t→+∞ a cosh t a t→+ ∞

3.6.2 Raumkurven

Parameterdarstellung: Es seien x, y und z kartesische Koordinaten mit den Basisvektoren


−→
i, j, k und dem Radiusvektor r = OP des Punktes P. Eine Raumkurve ist durch die Gleichung

r = r ( t ), a ≤ t ≤ b,

gegeben, d. h., x = x ( t), y = y( t), z = z(t) a ≤ t ≤ b.

Gleichung der Tangente im Punkt r0 := r(t0 ):

r = r0 + ( t − t 0 ) r  ( t 0 ) , t ∈ R.

r ( t )

r( t )
k
j

i Abb. 3.51

Physikalische Interpretation: Bezeichnet t die Zeit, dann beschreibt die Raumkurve r = r( t)


die Bewegung eines Massenpunktes mit dem Geschwindigkeitsvektor r ( t) und dem Beschleuni-
gungsvektor r ( t) zur Zeit t (Abb. 3.51).
184 3 Geometrie

3.6.2.1 Krümmung und Windung

Bogenlänge s der Kurve:

b b
s := |r (t)|dt = x  (t)2 + y ( t)2 + z (t)2 dt .
a a

Ersetzt man b durch t0 , dann erhält man die Bogenlänge zwischen dem Anfangspunkt und dem
Kurvenpunkt zur Zeit t0 .
Wir beziehen jetzt die Raumkurve r(s) auf die Bogenlänge s als Parameter und bezeichnen
mit r (s) die Ableitung nach s.

Taylorentwicklung:

(s − s0 )2  (s − s0 )3 
r ( s ) = r ( s 0 ) + ( s − s 0 ) r ( s 0 ) + r ( s0 ) + r ( s0 ) + . . . . (3.25)
2 6
Auf dieser Formel basieren die folgenden Definitionen.

Tangenteneinheitsvektor:

t : = r ( s 0 ).

Krümmung:

k := |r ( s0 )|.

Die Zahl R := 1/k heißt Krümmungsradius.

Hauptnormalenvektor:

1 
n := r ( s0 ) .
k

Binormalenvektor:

b := t × n.

Windung:

w := Rbr (s0 ).

Geometrische Deutung: Die drei Vektoren t, n, b bilden das sogenannte begleitende Dreibein
im Kurvenpunkt P0 . Das ist ein rechtshändiges System von paarweise aufeinander senkrecht
stehenden Einheitsvektoren (Abb. 3.53).
(i) Von t und n wird die Schmiegebene der Kurve im Punkt P0 aufgespannt.
(ii) Von n und b wird die Normalebene im Punkt P0 aufgespannt.
(iii) Von t und b wird die rektifizierende Ebene im Punkt P0 aufgespannt.
3.6 Differentialgeometrie 185

n n

t t

(a) k > 0 (b) k < 0 Abb. 3.52

b b

n n

t t

(a) w > 0 (b) w < 0 Abb. 3.53

Nach (3.25) liegt die Kurve im Punkt P0 in zweiter Ordnung in der Schmiegebene (Abb. 3.52).
Hat man w = 0 im Punkt P0 , dann ist die Kurve nach (3.25) in dritter Ordnung in P0 eben.
Ist w > 0 (bzw. w < 0) in P0 , dann bewegt sich die Kurve in einer Umgebung von P0 in
Richtung von b (bzw. −b) (Abb. 3.53).

Allgemeine Parameterform: Liegt die Kurve in der Gestalt r = r(t) mit dem beliebigen
Parameter t vor, dann gilt:

r r − (r r )2


2 2
1
k2 = =  2 3
R2 r
( x 2 + y 2 + z 2 )( x 2 + y 2 + z 2 ) − ( x  x + y y + z z )2
=  2 3 ,
x  + y 2 + z  2
  
x   
  y z 
x y z 


( r × r )r   x  y  z 
w = R2   3 = R2  3 . (3.26)
r 2 x  2 + y 2 + z  2

 Beispiel: Wir betrachten die Schraubenlinie

x = a cos t, y = a sin t, z = bt, t∈R

mit a > 0 und b > 0 (Rechtsschraube; Abb. 3.54) bzw. b < 0 (Linksschraube). Es gilt:

1 a b
k= = 2 , w= .
R a + b2 a2 + b2

Beweis: Wir ersetzen den Parameter t durch die Bogenlänge


t
s= ẋ 2 + ẏ2 + ż2 dt = t a2 + b2 .
0
186 3 Geometrie

x Abb. 3.54

Dann gilt
s s bs
x = a cos √ , y = a sin √ , z= √ ,
a2 + b2 a2 + b2 a2 + b2
also
 2  2  2
1 d2 x d2 y d2 z a
k= = + + = .
R ds2 ds2 ds2 a 2 + b2
Die Krümmung k ist somit konstant. Für die Windung ergibt sich nach (3.26) der Wert
 
 − a sin t a cos t b 

 − a cos t − a sin t 0 
 2 2  
a +b 2  a sin t − a cos t 0  b
w= # $3 = 2 .
a (− a sin t) + ( a cos t) + b
2 2 2 a + b2

Die Windung ist ebenfalls konstant. 

3.6.2.2 Der Hauptsatz der Kurventheorie

Frenetsche Formeln: Für die Ableitungen der Vektoren t, n, b nach der Bogenlänge gilt:

t = kn, n = −kt + wb, b = −wn. (3.27)

Hauptsatz: Gibt man sich im Intervall a ≤ s ≤ b zwei stetige Funktionen

k = k(s) und w = w(s )

mit k (s) > 0 für alle s vor, dann existiert, abgesehen von der räumlichen Lage, genau ein
Kurvenstück r = r( s), a ≤ s ≤ b, das s als Bogenlänge besitzt und dessen Krümmung (bzw.
Windung) mit k (bzw. w) übereinstimmt.

Konstruktion der Kurve: (i) Die Gleichung (3.27) beinhaltet ein System von neun gewöhnli-
chen Differentialgleichungen für die jeweils drei Komponenten von t, n und b. Durch Vorgabe
von t(0), n(0) und b(0) (Vorgabe des begleitenden Dreibeins im Punkt s = 0) ist die Lösung von
(3.27) eindeutig festgelegt.
3.6 Differentialgeometrie 187

(ii) Gibt man ferner den Ortsvektor r(0) vor, dann erhält man
s
r ( s ) = r ( 0) + t( s) ds .
0

3.6.3 Die lokale Gaußsche Flächentheorie


Es sind von Zeit zu Zeit in der Weltgeschichte hochbegabte, selten bevorzugte Natu-
ren aus dem Dunkel ihrer Umgebung hervorgetreten, welche durch die schöpferische
Kraft ihrer Gedanken und durch die Energie ihres Wirkens einen so hervorragenden
Einfluss auf die geistige Entwicklung der Völker ausgeübt haben, dass sie gleichsam
als Marksteine zwischen den Jahrhunderten dastehen... Als solche bahnbrechenden
Geister haben wir in der Geschichte der Mathematik und der Naturwissenschaften
für das Altertum Archimedes von Syracus, nach dem Schlusse des Mittelalters
Newton und für unsere Tage Gauß hervorzuheben, dessen glänzende, ruhmvolle
Laufbahn vollendet ist, nachdem am 23. Februar dieses Jahres die kalte Hand des
Todes seine einst tiefdenkende Stirn berührt hat.
Sartorius von Waltershausen, 1855
Gauß zum Gedächtnis

Parameterdarstellung einer Fläche: Es seien x, y und z kartesische Koordinaten mit den


−→
Basisvektoren i, j, k und dem Radiusvektor r = OP des Punktes P. Eine Fläche ist durch eine
Gleichung

r = r(u, v )

mit den reellen Parametern u und v gegeben, d. h.,


x = x ( u, v), y = y( u, v), z = z( u, v).

Das begleitende Dreibein: Wir setzen

e1 × e2
e1 : = r u ( u 0 , v 0 ) , e 2 : = rv ( u 0 , v 0 ) , N= .
| e1 × e2 |

Dann ist e1 (bzw. e2 ) der Tangentenvektor an die Koordinatenlinie v = const (bzw. u = const)
durch den Flächenpunkt P0 (u0 , v0 ). Ferner ist N der Normaleneinheitsvektor in P0 (Abb. 3.55).

N
e2
u =const
e1
v =const
r

O Abb. 3.55

Explizit gilt
e1 = xu ( u0 , v0 )i + yu ( u0 , v0 )j + zu (u0 , v0 )k,
e2 = xv ( u0 , v0 )i + yv (u0 , v0 )j + zv ( u0 , v0 )k.
188 3 Geometrie

Gleichung der Tangentialebene im Punkt P0 :

r = r0 + t1 e1 + t2 e2 , t1 , t 2 ∈ R .

Implizite Flächengleichung: Ist die Fläche durch die Gleichung F ( x, y, z) = 0 gegeben, dann
erhält man den Normaleneinheitsvektor im Punkt P0 ( x0 , y0 , z0 ) durch

grad F ( P0 )
N= .
|grad F ( P0 )|
Die Gleichung der Tangentialebene im Punkt P0 lautet:

grad F ( P0 )(r − r0 ) = 0.

Explizit bedeutet das

Fx ( P0 )( x − x0 ) + Fy ( P0 )(y − y0 ) + Fz ( P0 )(z − z0 ) = 0.

Explizite Flächengleichung: Die Gleichung z = z( x, y) kann man in der Form F ( x, y, z) = 0


schreiben mit F ( x, y, z) := z − z( x, y).
 Beispiel 1: Die Gleichung der Oberfläche einer Kugel vom Radius R lautet:

x 2 + y2 + z2 = R2 .

Setzen wir F ( x, y, z) := x2 + y2 + z2 − R2 , dann erhalten wir die Gleichung der Tangentialebene


im Punkt P0 :

x0 ( x − x0 ) + y0 ( y − y0 ) + z0 ( z − z0 ) = 0

mit dem Einheitsnormalenvektor N = r0 /|r0 |.

Singuläre Flächenpunkte: Für eine Fläche r = r( u, v) ist der Punkt P0 ( u0 , v0 ) genau dann
singulär, wenn e1 und e2 keine Ebene aufspannen.
Im Fall der impliziten Gleichung F ( x, y, z) = 0 ist P0 definitionsgemäß genau dann singulär,
wenn kein Einheitsnormalenvektor existiert, d. h., es gilt grad F ( P0 ) = 0. Explizit heißt das

Fx ( P0 ) = Fy ( P0 ) = Fz ( P0 ) = 0.

 Beispiel 2: Der Kegel x2 + y2 − z2 = 0 besitzt den singulären Punkt x = y = z = 0, der der


Kegelspitze entspricht.

Parameterwechsel und Tensorkalkül: Wir setzen u1 = u, u2 = v. Sind auf der Fläche zwei
Funktionen aα (u1 , u2 ), α = 1, 2, gegeben, die sich beim Übergang vom uα -System zu einem
α
u -System auf der Fläche gemäß

∂uγ
aα (u , u ) =
1 2
a γ ( u1 , u 2 ) (3.28)
∂u α
transformieren, dann nennen wir aα (u1 , u2 ) ein einfach kovariantes Tensorfeld auf der Fläche. In
(3.28) wird (wie in dem gesamten Abschnitt 3.6.3) die Einsteinsche Summenkonvention in der Form
angewandt, dass über gleiche obere und untere kleine griechische Indizes von 1 bis 2 summiert
wird.
3.6 Differentialgeometrie 189

β ··· β
Die 2k + 2l Funktionen aα11···αkl (u1 , u2 ) bilden definitionsgemäß ein k-fach kovariantes und l-fach
kontravariantes Tensorfeld auf der Fläche, wenn sie sich beim Übergang vom uα System zu einem
α
u -System nach
β β
β ··· β ∂uγ1 ∂uγ2 ∂uγk ∂u 1 ∂u l δ1 ···δl 1 2
a α11···αkl ( u , u ) =
1 2
α α · · · α · · · aγ1 ···γk ( u , u )
∂u 1 ∂u 2 ∂u k ∂uδ1 ∂uδl
transformieren.

Vorteil des Tensorkalküls: Wendet man den Tensorkalkül auf die Flächentheorie an, dann
erkennt man sofort, wann ein Ausdruck eine geometrische Bedeutung besitzt, d. h. unabhängig
von der gewählten Parametrisierung ist. Dieses Ziel wird durch die Verwendung von Tensoren
und die Konstruktion von Skalaren erreicht (vgl. 10.2).

3.6.3.1 Die erste Gaußsche Fundamentalform und die metrischen Eigenschaften von
Flächen

Erste Fundamentalform: Diese besitzt nach Gauß für eine Fläche r = r(u, v ) die Gestalt

ds2 = Edu2 + Fdudv + Gdv2

mit

E = r2u = x2u + y2u + z2u , G = r2v = x2v + y2v + z2v ,


F = ru r v = x u x v + y u y v + z u z v .

Ist die Fläche in der Form z = z( x, y), gegeben, dann hat man E = 1 + z2x , G = 1 + z2y , F = zx zy .

Die erste Fundamentalform beinhaltet alle metrischen Eigenschaften der Fläche.

Bogenlänge: Die Bogenlänge einer Kurve r = r( u(t), v (t)) auf der Fläche zwischen den
Punkten mit den Parameterwerten t0 und t ist gleich

t t  2  2
du du dv dv
s= ds = E + 2F +G dt .
dt dt dt dt
t0 t0

Flächeninhalt: Das Flächenstück, das entsteht, wenn die Parameter u, v ein Gebiet D der
u, v-Ebene durchlaufen, besitzt den Flächeninhalt

EG − F2 dudv.
D

Winkel zwischen zwei Flächenkurven: Sind r = r( u1 ( t), v1 ( t)) und r = r(u2 ( t), v2 ( t)) zwei
Kurven auf der Fläche r = r( u, v) die sich im Punkt P schneiden, dann ergibt sich der Schnitt-
winkel α (Winkel zwischen den positiven Tangentenrichtungen in P) zu

Eu̇1 u̇2 + F (u̇1 v̇2 + v̇1 u̇2 ) + G v˙1 v˙2


cos α = .
Eu̇21 + 2F u̇1 v̇1 + G v̇21 Eu̇22 + 2F u̇2 v̇2 + G v̇22

Dabei sind u̇1 bzw. u̇2 die ersten Ableitungen von u1 (t ) bzw. u2 (t) in den P entsprechenden
Parameterwerten usw.
190 3 Geometrie

Abbildungen zwischen zwei Flächen: Es mögen zwei Flächen

F1 : r = r1 ( u, v) und F2 : r = r2 ( u, v)

vorliegen, die beide (eventuell nach einer Parameteränderung) auf die gleichen Parameter u und
v bezogen sind. Ordnet man dem Punkt P1 von F1 mit dem Radiusvektor r1 (u, v ) den Punkt P2
von F2 mit dem Radiusvektor r2 ( u, v) zu, dann entsteht eine bijektive Abbildung ϕ : F1 −→ F2
zwischen den beiden Flächen.
(i) ϕ heiße genau dann längentreu, wenn die Länge eines beliebigen Kurvenstücks ungeändert
bleibt.
(ii) ϕ heißt genau dann winkeltreu (konform), wenn die Winkel zwischen zwei beliebigen sich
schneidenden Kurven ungeändert bleiben.
(iii) ϕ heißt genau dann flächentreu, wenn die Flächeninhalte beliebiger Flächenstücke ungeän-
dert bleiben.
In Tab. 3.9 sind Ej , Fj , Gj die Koeffizienten der ersten Fundamentalform von F j , bezogen auf
die gleichen Parameter u und v. Die in Tab. 3.9 angegebenen Bedingungen müssen in jedem
Flächenpunkt gelten.

Satz: (i) Jede längentreue Abbildung ist konform und flächentreu.


(ii) Jede flächentreue und konforme Abbildung ist längentreu.
(iii) Bei einer längentreuen Abbildung bleibt die Gaußsche Krümmung K in jedem Punkt
unverändert (vgl. 3.6.3.3).

Tabelle 3.9
Abbildung Notwendige und hinreichende Bedingung an die erste Fundamentalform
längentreu E1 = E2 , F1 = F2 , G1 = G2
winkeltreu E1 = λE2 , F1 = λF2 , G1 = λG2 , λ(u, v ) > 0
(konform)
flächentreu E1 G1 − F12 = E2 G2 − F22

Der metrische Tensor gαβ : Setzt man u1 = u, u2 = v, g11 = E, g12 = g21 = F und g22 = G,
dann kann man mit der Einsteinschen Summenkonvention schreiben:

ds2 = gαβ duα du β .

α
Beim Übergang zu einem anderen krummlinigen u -Koordinatensystem auf der Fläche gilt
α β
 du du  mit
ds2 = gαβ

 ∂uγ ∂uδ
gαβ = g .
∂u α ∂u β γδ
Die gαβ bilden somit die Koordinaten eines zweifach kovarianten Tensorfeldes (metrischer Tensor).
Ferner setzt man

g = det gαβ = EG − F2

und
G −F E
g11 = , g12 = g21 = , g22 = .
g g g
3.6 Differentialgeometrie 191

α
Es gilt gαβ g βγ = δγα . Beim Übergang vom uα -System zu einem u -System transformieren sich
gαβ bzw. g wie
α β
αβ ∂u ∂u γδ
g = g
∂uγ ∂uδ
(zweifach kontravariantes Tensorfeld) bzw.
' (2
 ∂ ( u1 , u 2 )
g = g
∂(u 1 , u 2 )

mit der Funktionaldeterminante

∂ ( u 1 , u2 ) ∂u1 ∂u2 ∂u2 ∂u1


= − .
∂ (u 1 , u 2 ) ∂u 1 ∂u 2 ∂u 1 ∂u 2

Um krummlinigen Koordinatensystemen auf der Fläche eine Orientierung η = ±1 zuzuordnen,


zeichnet man ein festes u0α -System als positiv aus (η = +1) und erklärt η für ein beliebiges
∂ ( u1 , u 2 )
uα -System durch das Vorzeichen der Funktionaldeterminante η = sgn . Setzen wir
∂(u10 , u20 )
ε11 = ε22 = 0 und ε12 = −ε21 = 1, dann transformieren sich die Levi-Civita-Tensoren
η √
Eαβ := √ εαβ bzw. Eαβ := η g ε αβ
g

wie gαβ bzw. gαβ .

3.6.3.2 Die zweite Gaußsche Fundamentalform und die Krümmungseigenschaften von


Flächen

Zweite Fundamentalform: Diese besitzt für eine Fläche r = r(u, v ) nach Gauß die Gestalt

−dNdr = Ldu2 + 2Mdudv + Ndv2

mit
l n m
L = ruu N = √ , N = rvv N = √ , M= √
EG − F2 EG − F2 EG − F2
und
     
 xuu yuu zuu   xvv yvv zvv   xuv yuv zuv 
     
l :=  xu yu zu ,
 n :=  xu yu zu ,
 m :=  xu yu zu  .

 xv y v z v   x v y v zv   xv y v z v 

Setzt man u1 = u, u2 = v und b11 = L, b12 = b21 = M, b22 = N, dann kann man

−dNdr = bαβ duα du β

α α β
schreiben. Beim Übergang vom uα -System zu einem u -System gilt −dNdr = bαβ
 du du mit

 ∂uγ ∂uδ
bαβ =ε b ,
∂u α ∂u β γδ
192 3 Geometrie

∂(u , u )
1 2
wobei ε das Vorzeichen der Funktionaldeterminante ist: ε = sgn . Folglich bilden bαβ
∂ ( u1 , u 2 )
die Koordinaten eines zweifach kovarianten Pseudotensors. Ferner erklärt man b := det bαβ =
LN − M2 . Die Größe b transformiert sich nach dem gleichen Transformationsgesetz wie g.

Die zweite Fundamentalform enthält die Krümmungseigenschaften der Fläche.

Das kanonische kartesische Koordinatensystem im Flächenpunkt P0 : Zu P0 kann man


stets ein kartesisches x, y, z-System wählen, dessen Ursprung in P0 liegt und dessen x, y-Ebene
mit der Tangentialebene durch P0 übereinstimmt (Abb. 3.56). In diesem x, y, z-System besitzt die
Fläche (in einer Umgebung von P0 ) die Darstellung z = z( x, y) mit z (0, 0) = z x (0, 0) = zy (0, 0) =
0. Das zugehörige begleitende Dreibein im Punkt P0 besteht aus den drei Einheitsvektoren i, j
und N = i × j. Die Taylorentwicklung in einer Umgebung von P0 lautet:
1 1
z= z xx (0, 0) x2 + z xy (0, 0) xy + zyy (0, 0) y2 + . . . .
2 2
Durch eine zusätzliche Drehung dieses kartesischen Koordinatensystems um die z-Achse kann
man stets erreichen, dass gilt:

1
z= ( k x2 + k 2 y2 ) + . . . .
2 1

Dieses x, y-System heißt das kanonische kartesische Koordinatensystem der Fläche im Punkt
P0 . Man bezeichnet die x-Achse und die y-Achse als Hauptkrümmungsrichtungen und k1 , k2 als
Hauptkrümmungen der Fläche im Punkt P0 .

z
N

P0
x
Abb. 3.56

Ferner heißen R1 := 1/k 1 und R2 := 1/k 2 die Hauptkrümmungsradien im Punkt P0 .

Die Gaußsche Krümmung K im Punkt P0 : Wir definieren

K := k1 k2 .

Das ist die fundamentale Krümmungsgröße einer Fläche.


 Beispiel: Für eine Kugel vom Radius R gilt R1 = R2 = R und K = 1/R2 .
Flächen mit K = const heißen Flächen von konstanter Gaußscher Krümmung. Beispiele hierzu
sind:
(a) K > 0 (Kugel).
(b) K < 0 (Pseudosphäre, die durch Rotation einer Traktrix entsteht; vgl. Abb. 3.57).
Die mittlere Krümmung H im Punkt P0 : Wir setzen

1
H := (k + k2 )
2 1

Flächen mit H ≡ 0 heißen Minimalflächen (vgl. 18.12).


3.6 Differentialgeometrie 193

Abb. 3.57

Gehen wir durch die Transformation x → y, y → x, z → −z einem neuen kanonischen


Koordinatensystem über, dann gilt k1 → −k2 und k2 → −k 1 . Daraus folgt K → K und H → − H.
Das bedeutet, K stellt eine echte geometrische Größe dar, während das nicht für H, sondern nur
für | H | zutrifft.
Tabelle 3.10 gibt die geometrische Bedeutung des Vorzeichens von K an.

Tabelle 3.10
Bezeichnung des Punk- analytische Definition Verhalten der Fläche in Umgebung von
tes P0 P0 in zweiter Ordnung wie
elliptischer Punkt K = k 1 k2 > 0 Ellipsoid
(d. h. LN − M2 > 0)
Nabelpunkt K = k 1 k2 > 0, k1 = k2 Kugel
hyperbolischer Punkt K = k 1 k2 < 0 einschaliges Hyperboloid
(d. h. LN − M2 < 0)
parabolischer Punkt K = k 1 k2 = 0
(d. h. LN − M2 = 0)
(a) k21 + k22 = 0 Zylinder
(b) k1 = k2 = 0 Ebene

Satz: Die Fläche sei in der Parametergestalt r = r(u, v) gegeben.


(i) Es gilt

LN − M2 LG − 2FM + EN
K= , H= .
EG − F2 2( EG − F2 )

(ii) Die Hauptkrümmungen k 1 , k2 sind die Lösungen der quadratischen Gleichung

k2 − 2Hk + K = 0.
194 3 Geometrie

(iii) Bezeichnet e1 , e2 , N das begleitende Dreibein, dann erhält man die Hauptkrümmungsrich-
tungen durch λ1 e1 + μe2 , wobei λ und μ Lösungen der Gleichung

λ2 ( FN − GM) + λμ( EN − GL) + μ2 ( EM − FL) = 0 (3.29)

sind.
Beweisskizze: In dem kanonischen kartesischen Koordinatensystem erhält man für die erste
und zweite Fundamentalform die einfachen Ausdrücke:

ds2 = dx2 + dy2 , −dNdr = k 1 dx2 + k 2 dy2 .

Daraus ergibt sich

b 1 αβ
K= , H= g bαβ .
g 2

Aus dem Tensorkalkül folgt, dass diese Ausdrücke in einem beliebigen uα -System gültig
bleiben, denn K ist ein Skalar, und H ist ein Pseudoskalar. Die Gleichung (3.29) entspricht
Eαβ gασ bβμ λσ λμ = 0.

Abwickelbare Regelflächen: Eine Fläche nennt man Regelfläche, wenn man sie durch Bewe-
gung einer Geraden im Raum erzeugen kann (z. B. Kegel, Zylinder, einschaliges Hyperboloid,
hyperbolisches Paraboloid). Lässt sich die Regelfläche sogar in eine Ebene abwickeln, dann
spricht man von einer abwickelbaren Fläche (z. B. Kegel, Zylinder). In allen Punkten einer abwickel-
baren Fläche gilt K = 0, also LN − M2 = 0.

Flächenschnitte: Es sei e1 , e2 , N das begleitende Dreibein der Fläche r = r(u, v) im Punkt P0 .


Wir schneiden die Fläche mit einer Ebene E, die durch den Punkt P0 und die von λe1 + μe2
erzeugte Gerade geht. Ferner bilde E mit dem Normalenvektor N den Winkel γ. Dann gilt für
die vorzeichenbehaftete Krümmung k der Schnittkurve im Punkt P0 Beziehung

kN
k=
cos γ

mit

Lλ2 + 2Mλμ + Nμ2


kN = .
Eλ2 + 2Fλμ + Gμ2

Krümmung einer Flächenkurve: Eine Kurve auf der Fläche besitzt im Punkt P0 die gleiche
vorzeichenbehaftete Krümmung k wie der von ihrer Schmiegebene erzeugte Flächenschnitt. Bildet
die Schmiegebene mit N den Winkel γ und mit der zu k 1 gehörigen Hauptkrümmungsrichtung
den Winkel α, dann gilt

k1 cos2 α + k2 sin2 α
k=
cos γ

(Satz von Euler-Meusnier).


3.6 Differentialgeometrie 195

3.6.3.3 Der Hauptsatz der Flächentheorie und das theorerna egregiurn von Gauß

Die Ableitungsgleichungen von Gauß und Weingarten: Die Änderung des begleitenden
Dreibeins wird beschrieben durch die sogenannten Ableitungsgleichungen:

∂eα
= Γσαβ eσ + bαβ N (Gauß),
∂u β
∂N
= − gσγ bγα eσ (Weingarten).
∂uα

Alle Indizes durchlaufen die Werte 1 und 2. Über gleiche obere und untere Indizes wird von 1
bis 2 summiert. Die Christoffelsymbole Γσαβ werden durch
 
1 σδ ∂gαδ ∂gβδ ∂gαβ
Γσαβ := g β
+ α

2 ∂u ∂u ∂uδ
erklärt. Sie besitzen keinen Tensorcharakter. Die Ableitungsgleichungen stellen ein System von 18
partiellen Differentialgleichungen erster Ordnung für die jeweils drei Komponenten von e1 , e2 , N
dar, die mit Hilfe des Satzes von Frobenius gelöst werden (vgl. 1.13.5.3).

∂2 eα ∂2 eα ∂2 N ∂2 N
Integrabilitätsbedingungen: Aus β
= β
, α β = ergeben sich die
∂u ∂u γ γ
∂u ∂u ∂u ∂u ∂u β ∂uα
sogenannten Integrabilitätsbedingungen
∂b11 ∂b
− 12 − Γ112 b11 + (Γ111 − Γ212 )b12 + Γ211 b22 = 0,
∂u2 ∂u1
(3.30)
∂b12 ∂b
− 22 − Γ122 b11 + (Γ112 − Γ222 )b12 + Γ212 b22 = 0
∂u2 ∂u1
(Gleichungen von Mainardi-Codazzi) und

R1212
K= (3.31)
g

(theorema egregium von Gauß).


Dabei ist Rαβγδ = R...ν
αβ,γ· gνδ der Riemannsche Krümmungstensor mit

∂Γναγ ∂Γνβγ
αβ,γ· =
R...ν + Γνβσ Γσαγ − − Γνασ Γσβγ .
∂x β ∂x α

Hauptsatz: Gibt man sich die Funktionen

g11 (u1 , u2 ) ≡ E(u, v ), g12 ( u1 , u2 ) = g21 (u1 , u2 ) ≡ F (u, v), g22 ( u1 , u2 ) ≡ G (u, v )

(zweimal stetig differenzierbar) und

b11 (u1 , u2 ) ≡ L( u, v), b12 ( u1 , u2 ) = b21 ( u1 , u2 ) ≡ M( u, v), b22 (u1 , u2 ) ≡ N (u, v )

(einmal stetig differenzierbar) vor, so dass diese den Integrabilitätsbedingungen (3.30), (3.31) ge-
nügen und außerdem für beliebige reelle Zahlen λ, μ mit λ2 + μ2 = 0 stets Eλ2 + 2Fλμ + Gμ2 > 0
ist, dann gibt es eine Fläche r = r(u, v) (dreimal stetig differenzierbar), deren Koeffizienten der
ersten und zweiten Fundamentalform gerade mit den vorgegebenen Funktionen übereinstimmen.
Die Fläche ist bis auf Translationen und Drehungen eindeutig bestimmt.
196 3 Geometrie

Die Konstruktion dieser Fläche geschieht folgendermaßen: 1. Aus den Ableitungsformeln von
Gauß und Weingarten erhält man eindeutig das begleitende Dreibein e1 , e2 , N, wenn man dieses
in einem festen Punkt P0 (u0 , v0 ) vorgibt. 2. Wegen ∂r/∂uα = eα kann dann r(u, v) berechnet
werden; r(u, v) ist eindeutig festgelegt, wenn man fordert, dass die Fläche durch P0 geht.

Das fundamentale theorema egregium: Die Gaußsche Krümmung K einer Fläche wurde in
3.6.3.2 mit Hilfe des sie umgebenden dreidimensionalen Raumes eingeführt. Nach (3.29) hängt
jedoch K nur vom metrischen Tensor gαβ und seinen Ableitungen ab, also nur von der ersten
Fundamentalform.

Die Gaußsche Krümmung K kann allein durch Messungen auf der Fläche
bestimmt werden.

Damit ist die Krümmung K eine innere Eigenschaft der Fläche, d. h., sie ist unabhängig vom sie um-
gebenden Raum. Das ist der Ausgangspunkt für die Krümmungstheorie von Mannigfaltigkeiten.
In der allgemeinen Relativitätstheorie ist beispielsweise die Krümmung der vierdimensionalen
Raum-Zeit-Mannigfaltigkeit für die Gravitationskraft verantwortlich (vgl. 14.9).
Um das theorema egregium (das vorzügliche Theorem) hat Gauß hart gerungen. Es stellt den
Höhepunkt seiner Flächentheorie dar.
 Beispiel: Bei einer längentreuen Abbildung bleiben die erste Fundamentalform und damit die
Gaußsche Krümmung erhalten. Für die Kugeloberfläche (bzw. die Ebene) hat man K = 1/R2
(bzw. K = 0). Deshalb kann man die Kugeloberfläche nicht längentreu auf eine Ebene abbilden.
Folglich gibt es keine längentreuen Landkarten der Erdoberfläche.
Man kann jedoch winkeltreue Landkarten anfertigen. Das ist für die Seefahrt sehr wichtig.

3.6.3.4 Geodätische Linien

Geodätische Linien: Eine Flächenkurve heißt genau dann eine geodätische Linie, wenn in
jedem Punkt die Hauptnormale der Kurve und die Flächennormale parallel bzw. antiparallel
sind. Die kürzeste Verbindungslinie zwischen zwei Punkten auf der Fläche ist stets Teil einer
geodätischen Linie. In der Ebene sind genau die Geraden geodätische Linien. Auf der Kugel
bilden die Großkreise (z. B. Längenkreise und Äquator) geodätische Linien. Die geodätischen
Linien entsprechen somit auf gekrümmten Flächen den Geraden der Ebene. Die geodätischen
Linien r = r(u1 (s), u2 ( s)) (s Bogenlänge) genügen den Differentialgleichungen

d2 u α du β duγ
2
+ Γαβγ = 0, α = 1, 2 ,
ds ds ds

und umgekehrt stellen die Lösungen dieser Differentialgleichungen stets geodätische Linien dar.
Liegt die Fläche in der Form z = z( x, y), vor, dann lautet die Differentialgleichung der
geodätischen Linien z = z( x, y( x )):

(1 + z2x + z2y )y = z x zyy (y )3 + (2z x z xy − zy zyy )(y )2 + (z x z xx − 2zy z xy )y − zy z xx .

Geodätische Krümmung: Für eine Flächenkurve r = r(u( s), v( s)) (s Bogenlänge) existiert
stets eine Zerlegung der Form

 
d2 r dr
= k N N + k g N ×
ds2 ds
3.6 Differentialgeometrie 197

mit
 
d2 r dr d2 r
kN = N , kg = N× .
ds2 ds ds2

Die Zahl k g heißt geodätische Krümmung. Eine Flächenkurve ist genau dann eine geodätische
Linie, wenn k g ≡ 0 gilt.

3.6.4 Globale Gaußsche Flächentheorie

Der Satz von Gauß (1827) über die Winkelsumme im Dreieck: Gegeben sei ein geodätisches
Dreieck D auf einer Fläche mit den Winkeln α, β und γ, d. h., die Seiten seien geodätische Linien.
Dann gilt:


K dF = α + β + γ − π (3.32)
D

wobei dF das Oberflächenmaß bezeichnet (Abb. 3.58).

γ
D

α β
Abb. 3.58

)
 Beispiel: Für die Einheitssphäre ist K = 1, d. h., KdF ist gleich dem Flächeninhalt des
D
Dreiecks.

Die Gesamtkrümmung: Für jede Kugeloberfläche F gilt


K dF = 4π. (3.33)
F

Diese Relation bleibt für jede geschlossene glatte Fläche F richtig, die diffeomorph zu einer
Kugeloberfläche ist. In diesem fundamentalen Ergebnis begegnen sich Differentialgeometrie
und Topologie. Der Zusammenhang mit der Eulerschen Charakteristik und der Theorie der
charakteristischen Klassen wird in 17.2 und 18.10 erläutert.
Ist die Fläche F ein Torus oder diffeomorph zu einem Torus, dann hat man in (3.33) „= 4π“
durch „= 0“ zu ersetzen.

Der Satz von Bonnet (1848): Sind die Dreiecksseiten in Abb. 3.58 beliebige Kurven mit der
Bogenlänge s, dann hat man (3.32) durch die Relation

 
K dF + k g ds = α + β + γ − π
D ∂D

zu ersetzen, wobei die Randkurve ∂D im mathematisch positiven Sinne zu durchlaufen ist.


198 3 Geometrie

3.7 Beispiele für ebene Kurven

3.7.1 Einhüllende und Kaustik

Wir betrachten eine von dem reellen Parameter c abhängige Kurvenschar

F ( x, y, c ) = 0.

Die Einhüllende dieser Schar erhält man durch Elimination des Parameters c aus den Gleichungen

Fc ( x, y, c) = 0, F ( x, y, c) = 0.

 Beispiel: Für die Kreisschar ( x − c)2 + y2 − 1 = 0 erhalten wir x − c = 0 und somit

y2 = 1.

Das sind die beiden Geraden y = ±1 (Abb. 3.59).

Abb. 3.59 Abb. 3.60 Kaustik des Kreises bei parallelem Licht-
einfall

Kaustik: Abb. 3.60 zeigt einen Kreisspiegel, auf den parallele Lichtstrahlen fallen. Die Ein-
hüllende der reflektierten Lichtstrahlen heißt Brennlinie (Katakaustik oder kurz Kaustik ). Das
Auftreten von Kaustiken verursacht typische Schwierigkeiten in der geometrischen Optik und
allgemeiner in der Variationsrechnung.
Kaustiken waren bereits im antiken Griechenland bekannt.

3.7.2 Evoluten

Definition: Der geometrische Ort aller Krümmungsmittelpunkte einer gegebenen Kurve C ist
heißt Evolute E.
Liegt die Kurve C in der Form y = f ( x ) vor, dann erhält man die Evolute E in der Parameter-
gestalt:

 
f  ( t ) 1 + f  ( t )2 1 + f  ( t )2
x = t− , y = f (t) +
f  ( t) f  (t )

(vgl. Tabelle 3.7).


Satz: Die Normale in einem Punkt einer Kurve C ist gleich der Tangente an die Evolute E im
entsprechenden Krümmungsmittelpunkt (vgl. die Strecke PQ in Abb. 3.64).
3.7 Beispiele für ebene Kurven 199

1 2
 Beispiel 1: Für die Parabel C : y = x erhalten wir
2
3 2
x = − t3 , y = 1+ t .
2
Elimination von t ergibt die semikubische Parabel
3 2/3
y = 1+ x
2
als Evolute E der Parabel (vgl. Abb. 3.61).

y y

x x

a) Parabel b) Evolute Abb. 3.61

 Beispiel 2: Die Evolute der Ellipse

x2 y2
2
+ 2 =1
a b
ist die Sternkurve (Astroide)
 2  2
ax by
+ =1
c2 c2

mit c2 = a2 − b2 (vgl. Abb. 3.62).

Ellipse Evolute

Abb. 3.62

3.7.3 Evolventen

Definition: Ist eine Kurve E gegeben, dann ergibt sich eine Evolvente C von E, indem man
einen Faden konstanter Länge abwickelt (oder aufwickelt) (Abb. 3.63).
Satz: Ist E die Evolute von C, dann ist C eine Evolvente von E.
 Beispiel: Eine Evolvente des Kreises

E : x2 + y2 = R2 (3.34)
200 3 Geometrie

lautet:

C : x = R(cos ϕ + ϕ sin ϕ), y = R(sin ϕ − ϕ cos ϕ) (3.35)

(Abb. 3.64). Genauer gesprochen liegt die folgende Situation vor: Der Kreis (3.34) ist die Evolute
der Kurve (3.35). Betrachten wir in Abb. 3.64 das Tangentenstück PQ von E, dann ergibt sich
durch Aufwickeln von PQ ein Bogenstück von C.

Evolute E P
Evolvente C
ϕ Q

Evolvente
Abb. 3.63 Abb. 3.64

3.7.4 Die Traktrix von Huygens und die Kettenlinie

Traktrix: (Abb. 3.65a):

 
a
x = ± a arcosh − a2 − y2 .
y

y y

P Q

S
K

0 H x x

a) Traktrix b) Kettenlinie Abb. 3.65

Geometrische Charakterisierung: Betrachten wir eine Tangente durch den Punkt K, die die
x-Achse im Punkt H schneidet, dann ist die Strecke KH konstant.
Der Name Traktrix (Schleppkurve) rührt daher, dass sie entsteht, wenn ein Hund H einen
Karren K zieht, wobei sich der Hund auf der x-Geraden bewegt. Diese Situation entstand früher
in Bergwerken.
Die x-Achse ist Asymptote der Traktrix. Bezeichnet s(y) := SK die Länge des Bogens von der
Spitze bis zum Karren K, und ist x ( y) = OH der Abstand des Hundes vom Ursprung O dann
gilt

lim |s(y) − x ( y)| = a (1 − ln 2).


y →0
3.7 Beispiele für ebene Kurven 201

Dieser Wert ist angenähert gleich 0,3069 · a.


Durch Rotation der Traktrix um die x-Achse entsteht eine Fläche konstanter negativer Krüm-
mung, die man Pseudosphäre nennt (Abb. 3.57).
Kettenlinie (Abb. 3.65b):

x
y = a cosh .
a

Physikalische Charakterisierung: Diese Kurve entspricht der Gestalt einer Wäscheleine, die in
den Punkten P und Q aufgehängt ist und der Schwerkraft unterliegt.
Die Länge des Bogens zwischen P und Q ist gleich 2a · sinh( x/a).
Geometrische Charakterisierung: Die Kettenlinie ist die Evolute der Traktrix.
Durch Rotation der Kettenlinie um die x-Achse entsteht eine Fläche der mittleren Krümmung
null (Minimalfläche), die man Katenoide nennt. .

3.7.5 Die Lemniskate von Jakob Bernoulli und die Cassinischen Kurven

Gleichung der Lemniskate in kartesischen Koordinaten (Abb. 3.66a):

 2  
x 2 + y2 − 2a2 x2 − y2 = 0.

Die Konstante a ist positiv.

−a a
B A
x

a) Lemniskate b) Cassinische Kurven Abb. 3.66

Geometrische Charakterisierung: Die Lemniskate ist der geometrische Ort aller Punkte, für die
das Produkt der Abstände von den beiden Punkten A = ( a, 0) und B = (− a, 0) gleich a2 ist.
Im Ursprung berühren die beiden Geraden y = ± x die Lemniskate.
Gesamtfläche: 2a2 .
Kurvenlänge: Für a = 1 besitzt die Lemniskate die Gesamtlänge
1
dx
L=2 √ .
1 − x4
0

Das ist ein elliptisches Integral. Der zweiundzwanzigjährige Gauß entdeckte 1799 die Formel

π √
= M (1, 2). (3.36)
L

Dabei bezeichnet M( a0 , b0 ) das arithmetisch-geometrische Mittel der beiden positiven Zahlen a0


und b0 , d .h., es gilt
M ( a0 , b0 ) = lim an = lim bn
n →∞ n →∞
202 3 Geometrie

mit
a n + bn
a n +1 : = , b n +1 : = a n bn .
2
Die Gaußsche Formel (3.36) ist Spezialfall der allgemeineren Formel

π/2

dϕ π
K (k) := = √ (3.37)
1 − k2 sin2 ϕ 2M(1, 1 − k2 )
0

für das vollständige elliptische Integral K (k ) erster Gattung mit 0 < k < 1.
Gleichung der Cassinischen Kurven in kartesischen Koordinaten (Abb. 3.66b):

 2  
x 2 + y2 − 2a2 x2 − y2 + a4 − c4 = 0.

Die Konstanten a und c sind positiv.


Geometrische Charakrerisierung: Die Cassinische Kurve ist der geometrische Ort aller Punkte,
für die das Produkt der Abstände von zwei festen Punkten A = ( a, 0) und B = (− a, 0) konstant
gleich c2 ist.
Die Lemniskate ist für a = c ein Spezialfall der Cassinischen Kurven. Diese Kurven wurden
von dem Astronomen Cassini (1625–1712) erdacht.

3.7.6 Die Lissajou-Kurven

Parameterdarstellung in kartesischen Koordinaten (Abb. 3.67):

x = a sin ωt, y = b sin( ω  t + α).

Interpretieren wir t als Zeit, dann sind das Schwingungen, die 1815 von dem amerikanischen
Astronomen Bowditch und 1850 von Lissajou untersucht wurden. Durch Variation der Kreis-
frequenzen ω und ω  sowie der Phasenverschiebung α kann man mit einem Laserstrahl einen
großen Formenreichtum an Kurven erzeugen, die in einem modernen Laserium vorgeführt
werden.

ω 1 ω 1 ω 2
a) = b) = c) =
ω 2 ω 3 ω 3 Abb. 3.67 Lissajou-Kurven

3.7.7 Spiralen

Archimedische Spirale (Abb. 3.68a): Die Gleichung in Polarkoordinaten lautet:

r = aϕ, ϕ > 0.
3.7 Beispiele für ebene Kurven 203

Die Konstante a ist positiv.


Die logarithmische Spirale (Abb. 3.68b):

r = a ebϕ , −∞ < ϕ < ∞.

Die Konstanten a und b sind positiv.


Geometrische Eigenschaft: Jeder vom Koordinatenursprung 0 ausgehende Strahl schneidet die
logarithmische Spirale unter dem konstanten Winkel α mit cot α = b.

1 + b2
Länge des Bogens β ≤ ϕ ≤ γ: L = ( γ − β) .
b
y

a
0
x

a) Archimedische Spirale b) logarithmische Spirale c) hyperbolische Spirale Abb. 3.68

Krümmungsradius: r 1 + b2 .
Für b = 0 entsteht ein Kreis vom Radius a.
Die hyperbolische Spirale (Abb. 3.68c):

a
r= , ϕ > 0.
ϕ

Die Konstante a ist positiv.


Spinnkurven (Klothoiden) (Abb. 3.69):

a2
R= . (3.38)
s

Dabei ist R der Krümmungsradius, und s stellt die Bogenlänge zwischen dem Kurvenpunkt und
dem Ursprung 0 dar. Die Konstante a ist positiv.
Wird eine Kurve durch eine Gleichung zwischen rein geometrischen Größen wie in (3.38)
beschrieben, dann spricht man von einer natürlichen Kurvengleichung.
Parameterdarstellung in kartesischen Koordinaten:

√  √ 
t t
πu2 πu2
x = a π cos du, y = a π sin du, −∞ < t < ∞.
2 2
0 0

Diese Kurve liegt symmetrisch zum Ursprung (0, 0).



Bogenlänge: s = at π.
 √ √   √ √ 
a π a π a π a π
Asymptotische Punkte: A = , , B= − ,− .
2 2 2 2
204 3 Geometrie

0 x

Abb. 3.69 Spinnkurve

3.7.8 Strahlkurven (Konchoiden)

Definition: Ist eine Kurve C

r = f ( ϕ)

in Polarkoordinaten gegeben, dann lautet die Konchoide von C

r = f ( ϕ) + b

(oder r = f ( ϕ) − b). Dabei ist b eine positive Konstante.

3.7.8.1 Die Konchoide des Nikomedes

Gleichung in Polarkoordinalert (Abb. 3.70):

a π π
r= ± b, − <ϕ< . (3.39)
cos ϕ 2 2

Hier sind a und b positive Konstanten. Für „+"(bzw. „−“) entsteht der positive (bzw. negative)
Zweig Setzt man b = 0 in (3.39), dann ergibt sich die Gleichung der Geraden x = a (Abb. 3.70a).
Die Konchoide des Nikomedes ist deshalb die Konchoide einer Geraden.
Diese Kurven wurden um 180 v. Chr. ersonnen, um das Delische Problem der Würfelverdopp-
lung und das Problem der Dreiteilung des Winkels graphisch zu lösen.

3.7.8.2 Die Pascalsche Schnecke und die Kardioide

Gleichung in Polarkoordinaten (Abb. 3.71):

r = a cos ϕ + b, −π < ϕ ≤ π. (3.40)

Hier sind a und b positive Konstanten.


π
Die Gleichung des Kreises ( x − a)2 + y2 = a2 lautet in Polarkoordinaten r = a cos ϕ, − <
2
π
ϕ ≤ . Deshalb bezeichnet man (3.40) als Konchoide des Kreises.
2
3.7 Beispiele für ebene Kurven 205

y y y y y

r b
a
a x a x x x x

b<a b>a b=a


a) Gerade b) positiver c) negativer Zweig
Zweig
Abb. 3.70 Konchoide des Nikomedes

y y y y

Kardioide

x x x x

a) b ≥ 2a b) a < b < 2a c) b < a d) a = b

Abb. 3.71 Pascalsche Schnecke

πa2
Flächeninhalt:19 F = + πb2 .
2
Kartesische Koordinaten: ( x2 + y2 − ax)2 = b2 ( x2 + y2 ).
Der Spezialfall der Kardioide (Herzkurve): Dieser Spezialfall ergibt sich für a = b.
3πa2
Flächeninhalt: F = .
2
Scheitelpunkt: x = 2a, y = 0.

3.7.9 Radkurven

Zahlreiche Kurven kann man dadurch erzeugen, dass man ein Rad ohne Gleitung mit konstanter
Winkelgeschwindigkeit auf einer gegebenen Kurve (z. B. Gerade oder Kreis) abrollen lässt und
die Bahn eines festen Punktes P auf einer Radspeiche (z. B. der Peripherie) verfolgt (vgl. Abb.
3.72 bis Abb. 3.74). Solche Kurven, mit denen sich seit der Renaissance viele Mathematiker
beschäftigt haben, werden in vielfältiger Weise in der Technik benutzt.

19
Im Fall b < a wird die innere Schleife doppelt gezählt (vgl. Abb. 3.71c).
206 3 Geometrie

3.7.9.1 Das Abrollen eines Rades auf einer Geraden (Zykloiden)

Parametergleichung in kartesischen Koordinaten (Abb. 3.72):

x = a( ϕ − μ sin ϕ), y = a(1 − μ cos ϕ), −∞ < ϕ < ∞.

Dabei ist a der Radius, und ϕ ist der Wälzwinkel des rollenden Kreises.

y
2a F

P 2πa 4πa x
a) Zykloide

A B

P x
b) verkürzte Zykloide

y P

x
A B
c) verlängerte Zykloide Abb. 3.72

Klassifikation: (i) μ = 1 (Zykloide),


(ii) 0 < μ < 1 (verkürzte Zykloide),
(iii) μ > 1 (verlängerte Zykloide).
Im Fall (i) liegt der Punkt P auf der Peripherie des rollenden Rades. In (ii) (bzw. (iii)) liegt
der Punkt P im Inneren (bzw. außerhalb) des abrollenden Kreises. Diese Kurven heißen auch
Trochoiden.
Fläche F zwischen einem Zykloidenbogen und der x-Achse: F = 3πa2 .
Länge eines Zykloidenbogens zwischen den Punkten x = 0 und x = a: L = 8a.
ϕ
Krümmungsradius der Zykloide: 4a sin .
2
a(1 + μ2 − 2μ cos ϕ)3/2
Krümmungsradius der Trochoide: .
μ (cos ϕ − μ )
 2π
Länge eines Trochoidenbogens von A nach B: L = a 1 + μ2 − 2μ cos ϕ dϕ.
0
Die Zykloide ist die Lösung des berühmten Problems der Brachystochrone von Johann
Bernoulli (vgl. 5.1.2).
3.7 Beispiele für ebene Kurven 207

y y
P

ϕ P
P x x

a) Epizykloide (n = 3) b) Epizykloide (n = 32 )

y y

P
P
x x

c) verkürzte Epizykloide ( n = 4, μ < 1) d) verlängerte Epizykloide (n = 4, μ > 1) Abb. 3.73

3.7.9.2 Das Abrollen eines Rades auf dem Äußeren eines Kreises
(Epizykloiden)

Parameterdarstellung in kartesischen Koordinaten (Abb. 3.73):

A+a
x = ( A + a) cos ϕ − μa cos ϕ,
a
A+a
y = ( A + a) sin ϕ − μa sin ϕ.
a

Dabei rollt ein Kreis vom Radius a auf einem Kreis vom Radius A. Der Punkt P besitzt die
Polarkoordinaten ϕ und r.
Klassifikation: (i) μ = 1 (Epizykloide),
(ii) 0 < μ < 1 (verkürzte Epizykloide),
208 3 Geometrie

(iii) μ > 1 (verlängerte Epizykloide).


4a( A + a) Aϕ
Krümmungsradius der Epizykloide: sin .
A + 2a 2a
A
Besonderheit: Wir setzen n = .
a
(i) Ist n eine natürliche Zahl, dann schließt sich die Kurve nach einem Umlauf des Kreises.
(ii) Ist n eine rationale Zahl, dann schließt sich die Kurve nach endlich vielen Umläufen.
(iii) Ist n eine irrationale Zahl, dann schließt sich die Kurve nicht.
Länge eines Bogens von Spitze zu Spitze für die Epizykloide: 8( A + a) /n.

3.7.9.3 Das Abrollen eines Rades auf dem Inneren eines Kreises
(Hypozykloiden)

Parameterdarstellung in kartesischen Koordinaten (Abb. 3.74):

A−a
x = ( A − a) cos ϕ + μa cos ϕ,
a
A−a
y = ( A − a) sin ϕ − μa sin ϕ.
a

y y y

P P
P
x x x

a) Hypozykloide ( n = 4) b) verkürzte Hypozykloide c) verlängerte Hypozykloide Abb. 3.74

Dabei rollt ein Kreis vom Radius a im Innern eines Kreises vom Radius A ab. Der Punkt P
besitzt die Polarkoordinaten ϕ (und) r.
Klassifikation: (i) μ = 1 (Hypozykloide),
(ii) 0 < μ < 1 (verkürzte Hypozykloide),
(iii) μ > 1 ((verlängerte Hypozykloide).
4a ( A − a) Aϕ
Krümmungsradius der Hypozykloide: sin .
( A − 2a) 2a
 Beispiel 1: Für A = 2a und μ > 0 ergibt sich eine Ellipse, die im Falle μ = 1 in eine Strecke
entartet.
A
 Beispiel 2: Im Spezialfall n = = 4 und μ = 1 erhalten wir die Parameterdarstellung
a
x = A cos3 ϕ, y = A sin3 ϕ, 0 ≤ ϕ < 2π.
Das ist eine Astroide (Sternkurve), deren Gleichung in kartesischen Koordinaten durch

x2/3 + y2/3 = A2/3


3.8 Algebraische Geometrie 209

oder ( x2 + y2 − A2 )3 + 27x2 y2 A2 = 0 gegeben ist (Abb. 3.74a). Die Astroide ist somit eine
algebraische Kurve 6. Ordnung.

3.7.9.4 Die Epizyklen des Hipparchos

Parameterdarstellung in kartesischen Koordinaten (Abb. 3.75):

x = A cos ωt + a cos ω  t, y = A sin ωt + a sin ω  t. (3.41)

Wir interpretieren t als Zeit. Dann beschreibt (3.41) die Bewegung eines Punktes P auf einem

y
P

Abb. 3.75 Epizyklus

Kreis Ka vom Radius a. Dabei bewegt sich der Mittelpunkt von Ka auf einem Kreis K A vom
Radius A mit der Winkelgeschwindigkeit ω, während sich K a mit der Winkelgeschwindigkeit ω 
dreht.
Diese Epizyklen wurden von den großen Astronomen der Antike Hipparchos (180–125 v.
Chr.) und Ptolemäus (ca. 150 n. Chr.) benutzt, um die komplizierte Bewegung der Planeten am
Himmel angenähert zu beschreiben.

3.8 Algebraische Geometrie


Der Geometer schätzt an seiner Wissenschaft, dass er sieht, was er denkt.
Felix Klein (1849–1925)
3.8.1 Grundideen

3.8.1.1 Das Grundproblem

Gegeben seien m Polynome p j = p j (z) mit komplexen Koeffizienten in den n komplexen


Variablen z1 , . . . , zn . Wir setzen z = (z1 , . . . , zn ). Die algebraische Geometrie beschäftigt sich mit
der Lösung von Gleichungssystemen der Form

p j (z) = 0, z ∈ Cn , j = 1, . . . , m . (3.42)

Das ist eine zentrale Frage der Mathematik, deren Beantwortung für viele Anwendungen
bedeutsam ist.20
20
Eine weitere wichtige Verallgemeinerung dieser Aufgabe besteht darin, dass wir den Körper C der komplexen Zahlen
durch einen beliebigen Körper K ersetzen.
Im Fall des Körpers K = Q der rationalen Zahlen erhalten wir beispielsweise die diophantische Geometrie, die seit fast
2 000 Jahren von den scharfsinnigsten Mathematikern untersucht wird (vgl. 3.8.6).
210 3 Geometrie

3.8.1.2 Singularitäten und ihre physikalische Relevanz

Eine typische Schwierigkeit der algebraischen Geometrie


besteht im Auftreten von Singularitäten

Definition: Es sei m < n. Ein Lösungspunkt z von (3.42) heißt genau dann ein regulärer Punkt,
wenn
' (
∂p j ( z)
Rang =m
∂zk

gilt (maximaler Rang). Anderenfalls heißt z ein singulärer Punkt.


Treten in (3.42) nur reguläre Punkte auf, dann ist die Lösungsmenge von (3.42) eine glatte
Mannigfaltigkeit. Derartige Mannigfaltigkeiren werden in der Differentialtopologie untersucht
(vgl. die Kapitel 15 bis 19).

a) Mannigfaltigkeiten (keine singulären Punkte)


y y

x x

b) Doppelpunkt c) Semikubische Parabel mit Spitze


(singulärer Punkt) (singulärer Punkt) Abb. 3.76

 Beispiel 1 (Mannigfaltigkeit): Die Geradengleichung

y = mx + b

und die Kreisgleichung

x 2 + y2 = r2

mit r > 0 beschreiben Kurven ohne Singularitäten, d. h., diese Kurven bilden eindimensionale
Mannigfaltigkeiten. Typisch hierfür ist, dass es in jedem Kurvenpunkt genau eine Tangente gibt
(vgl. Abb. 3.76a).
3.8 Algebraische Geometrie 211

 Beispiel 2 (Doppelpunkt als singulärer Punkt): Die Gleichung

x 2 − y2 = 0

zerfällt wegen der Faktorisierung x2 − y2 = ( x − y)( x + y ) = 0 in die beiden Geradengleichungen


x − y = 0 und x + y = 0. Diese beiden Geraden schneiden sich im Punkt (0, 0)), der ein
Doppelpunkt genannt wird. In einem Doppelpunkt gibt es zwei Tangenten, d. h., es liegt keine
Mannigfaltigkeit vor (Abb. 3.76b).
Doppelpunkte können zu Punkten gehören, in denen sich die Kurve selbst schneidet, wie zum
Beispiel beim kartesischen Blatt (vgl. Abb. 3.82 in 3.8.2.3.).
 Beispiel 3 (Spitze als singulärer Punkt): Die semikubische Parabel

y2 − x 3 = 0 , (3.43)

besitzt im Punkt (0, 0) eine sogenannte Spitze. In dem Spitzenpunkt existiert keine Tangente,
d. h., es liegt keine Mannigfaltigkeit vor (Abb. 3.76c).
Doppelpunkte und Spitzen sind die einfachsten Singularitäten.
Die physikalische Relevanz von Singularitäten: Ein fundamentales Phänomen in der Natur
besteht darin, dass ein System unter einem kritischen äußeren Einfluss sein qualitatives Verhalten
drastisch ändert. Man spricht von einer Bifurkation (Verzweigung). Dazu können ökologische
Katastrophen oder Wirtschaftskrisen gehören.
 Beispiel 4 (Bifurkation von Gleichgewichtslagen): Befindet sich ein System in einem Gleich-
gewichtszustand, dann kann es bei einem kritischen äußeren Einfluss in einen neuen Gleichge-
wichtszustand übergehen. Wirken z. B. auf einen Stab in Längsrichtung Kräfte, dann tritt bei
einer kritischen Kraft eine Ausbeulung auf.
 Beispiel 5 (Hopfbifurkation): Ein dynamisches System, das sich in einem Gleichgewichtszu-
stand befindet, kann bei einem kritischen äußeren Einfluss zu schwingen beginnen.

Bifurkationen in der Natur können mathematisch durch Singularitäten


modelliert werden.

Das ist der Inhalt der Bifurkationstheorie, die wir in 12.4 und 13.6 darstellen. Auch die Katastro-
phentheorie von René Thom gehört zu diesem Problemkreis (vgl. 13.13).
Wir betrachten jetzt die einfachsten Spezialfälle von (3.42).
Gleichungen ersten Grades
Besitzen alle Polynome p j den Grad eins, dann stellt (3.42) ein lineares Gleichungssystem dar,
für welches eine perfekte Lösungstheorie existiert (vgl. 2.3.).
Vom geometrischen Standpunkt aus entspricht die Untersuchung linearer Gleichungssysteme
dem Schnittverhalten von Geraden und Ebenen.
Funktionalanalysis: Bereits der aus heutiger Sicht triviale Fall von Gleichungen ersten Grades
hat zur Entwicklung der linearen Algebra geführt, die die Grundlage für die Funktionalanalysis
darstellt. Die moderne Theorie der partiellen Differentialgleichungen und die Quantentheorie
werden in der Sprache der Funktionalanalysis formuliert (vgl. Kapitel 11).
Topologie: Eine Grundstrategie der modernen Mathematik besteht darin, komplizierte Struk-
turen dadurch zu untersuchen, dass man ihnen Objekte der linearen Algebra zuordnet. Diese
Methode wird zum Beispiel in der algebraischen Topologie bei der Einführung der de Rhamschen
212 3 Geometrie

Kohomologie benutzt, die die Basis der modernen Differentialtopologie bildet (vgl. Kapitel 18
und 19).
Gleichungen zweiten Grades
Sind die Polynome p j vom zweiten Grad, dann erfasst die Grundgleichung (3.42) Kegelschnitte
und deren Schnittverhalten. Betrachten wir eine einzige Gleichung

p ( x, y) = 0

zweiten Grades, wobei das Polynom p irreduzibel ist, dann entsteht ein glatter Kegelschnitt.
Singularitäten können im vorliegenden Fall nur für reduzible Polynome p auftreten. Das trifft
auf Beispiel 2 zu (vgl. Abb. 3.76b).
Zahlentheorie: Gleichungen zweiten Grades entsprechen quadratischen Formen, die in der
Zahlentheorie intensiv untersucht werden. Den Ausgangspunkt bildete die Theorie der quadrati-
schen Formen von Gauß , die dieser in seinem 1801 erschienenen Werk, Disquisitiones arithmeticae
entwickelte. Das war der Ausgangspunkt für die Theorie der quadratischen Zahlkörper sowie
für die moderne algebraische und analytische Zahlentheorie.
Spektraltheorie: Eine quadratische Gleichung in n Variablen
n
∑ a jk x j xk = const
j,k =1

kann man elegant in der Matrizenform

xT Ax = const

schreiben. Die Untersuchung einer derartigen Gleichung bedeutet, Normalformen der Matrix A
herzustellen. Diese Theorie wurde in der zweiten Hälfte des 19. Jahrhunderts entwickelt. Aus-
gangspunkt waren Untersuchungen von Euler (1765) und Lagrange (1773) über Trägheitsachsen
rotierender starrer Körper, die auf spezielle Hauptachsentransformationen führten. Die allge-
meine Hauptachsentransformation wurde von Cauchy 1829 behandelt. Hilbert verallgemeinerte
um 1904 im Zusammenhang mit seiner Theorie der Integralgleichungen die Hauptachsentrans-
formation auf unendlichdimensionale symmetrische Matrizen. John von Neumann erkannte
um 1928, dass sich die Hilbertschen Überlegungen zu einer Spektraltheorie unbeschränkter,
selbstadjungierter Operatoren im Hilbertraum ausbauen lassen, die die mathematische Grund-
lage der Quantentheorie darstellt. Das Spektrum des Hamiltonoperators verallgemeinert die
Eigenwerte einer symmetrischen Matrix und beschreibt genau die möglichen Energiewerte eines
Quantensystems (vgl. 11.6 und 13.8).
Quadratische Formen und Geometrien der modernen Physik: Gruppen von Transforma-
tionen, die quadratische Formen invariant lassen und insbesondere zu Normalformen führen,
sind die Grundlage wichtiger Geometrien, die in 3.9. betrachtet werden.
Spezielle Funktionen: Sucht man eine Parameterdarstellung des Kreises

x 2 + y2 = 1 ,

dann wird man auf die trigonometrischen Funktionen geführt. Die globale Parameterdarstellung
(Uniformisierung) des Kreises lautet:

x = cos t , y = sin t , t ∈ C.
3.8 Algebraische Geometrie 213

Die Tatsache, dass man hierzu periodische Funktionen benötigt, hat einen tieferen topologischen
Grund, der darin besteht, dass der Kreis eine irreduzible algebraische Kurve zweiter Ordnung
vom Geschlecht 0 ist.
Aus der Parametrisierung des Kreises erhält man sofort eine globale Parametrisierung (Unifor-
misierung) der Hyperbel

x 2 − y2 = 1

indem man y durch iy und t durch is ersetzt:

x = cos is , y = −i sin is , s ∈ C.

Das ist identisch mit der Parameterdarstellung der Hyperbel

x = cosh s , y = sinh s , s∈C

durch Hyperbelfunktionen.
Im Reellen sieht man den Hyperbelfunktionen ihre Periodizität nicht an. Euler entdeckte, dass
die Umkehrfunktionen gewisser elliptischer Integrale periodisch sind. Bei seinen Untersuchungen
zur Lemniskate machte der zwanzigjährige Gauß im Jahre 1796 die sehr folgenreiche Entdeckung,
dass die Umkehrfunktionen gewisser elliptischer Integrale neben der reellen Periode Eulers
noch eine zweite rein imaginäre Periode besitzen. Diese Tatsache erwies sich später im Rahmen
der Theorie der doppelperiodischen (elliptischen) Funktionen von Weierstraß als der Schlüssel
zum vollständigen Verständnis der elliptischen Integrale. Der tiefere topologische Grund für die
Doppelperiodizität der Umkehrfunktionen elliptischer Integrale wird in 1.14.19 erläutert.
Uniformisierung und Auflösung der Singularitäten: Man kann sich die Aufgabe stellen, für
allgemeine Kurven und Flächen globale Parametrisierungen zu finden. Das bezeichnet man
als Uniformisierung der Kurven und Flächen oder als Auflösung der Singularitäten. Dieser
Problemkreis gehört bei hinreichender Allgemeinheit der zu uniformisierenden Objekte zu den
härtesten Aufgaben der Mathematik.
(i) Die Uniformisierung aller algebraischen Kurven dritter Ordnung führt auf die Theorie der
elliptischen Funktionen und elliptischen Integrale (vgl. 3.8.1.3).
(ii) Die Uniformisierung beliebiger algebraischer Kurven ist der Inhalt des berühmten Uni-
formisierungstheorems von Koebe und Poincaré aus dem Jahre 1907. Diese Uniformisierung
erlaubt die Berechnung Abelscher Integrale durch automorphe Funktionen.
(iii) Im Jahre 1964 gelang Hironaka die Uniformisierung (Auflösung der Singularitäten)
projektiver Varietäten beliebiger Dimension.
Gleichungen dritten Grades
Algebraische Kurven dritten Grades können (auch im Fall der Irreduzibilität der Gleichung)
Singularitäten besitzen. Das sind Punkte, in denen keine Tangente existiert. Das einfachste
Beispiel hierfür ist die semikubische Parabel in (3.43).

3.8.1.3 Elliptische Kurven und elliptische Integrale

Elliptische Kurven: Gegeben sind die komplexen Zahlen g2 , g3 mit g23 − 27g32 = 0. Alle
komplexen Lösungen (z, w ) der Gleichung

w2 = 4z3 − g2 z − g3 (3.44)
214 3 Geometrie

werden nach Weierstraß (1815–1897) durch die Parameterdarstellung

z = ℘(t) , w = ℘ ( t) , t∈C (3.45)

erfasst. Dabei bezeichnet ℘ die Weierstraßsche elliptische Funktion mit den beiden komplexen
Perioden 2ω1 , 2ω2 und den Konstanten
e1 := ℘(ω1 ) , e2 := ℘(ω1 + ω2 ) , e3 := ℘(ω2 ) ,
g 2 : = − 4 ( e 1 e2 + e 1 e3 + e2 e 3 ) , g3 := 4e1 e2 e3 .

Es gilt 4z3 − g2Z − g3 = 4(z − e1 )(z − e2 )(z − e3 ) (vgl. 1.14.17.3).


Elliptische Integrale: Das Integral
  
J = R z, 4z3 − g2 z − g3 dz

ist im Sinne von



J= R(z, w) dz (3.46)

zu verstehen, wobei ( z, w) Lösungen der Gleichung (3.44) sind. Durch die Substitution z =
℘(t), w = ℘ (t) erhalten wir

J= R(℘(t), ℘ (t ))℘ (t) dt .

Wegen des Zusammenhangs mit der Theorie elliptischer Funktionen bezeichnet man (3.44)
als eine elliptische Kurve. In der komplexen Funktionentheorie spricht man dagegen von der
Riemannschen Fläche21 der durch (3.44) gegebenen „mehrdeutigen Funktion“. w = w(z) Somit
gilt:

Die Untersuchung elliptischer Kurven führt auf die Theo-


rie der elliptischen Funktionen und elliptischen Integrale.

Die topologische Struktur einer elliptischen Kurve: Alle komplexen Zahlenpaare (z, w)
die der Gleichung (3 .44) genügen, bilden definitionsgemäß die elliptische Kurve C. Da die
℘-Funktion die Perioden 2w1 und 2w2 besitzt, können wir uns bei der Parameterdarstellung
in (3.45) auf die t-Werte im Periodenparallelogramm T beschränken, wobei gegenüberliegende
Punkte von T miteinander identifiziert werden (Abb. 3.77a). Mit Hilfe der Formeln

z = ℘(t) , w = ℘ ( t) , t ∈ T,

entsteht eine bijektive Abbildung zwischen der elliptischen Kurve C und T.


Kleben wir die gegenüberliegenden Punkte von T zusammen, dann erhalten wir einen Torus
T (Abb. 3.77b). Die elliptische Kurve C ist deshalb auch bijektiv zum Torus T. Versehen wir C
mit der durch T gegebenen Topologie, dann ist C homöomorph zu einem Torus und besitzt
deshalb das Geschlecht (vgl. 17.2.1)

p = 1.

21
Definitionsgemäß ist eine Riemannsche Fläche eine zusammenhängende, glatte, eindimensionale, komplexe Mannigfaltig-
keit (vgl. 15.1.1). Die einfachste Riemannsche Fläche ist die komplexe Zahlenebene C, die im Komplexen eindimensional,
im Reellen aber dem R 2 entspricht und somit zweidimensional ist. Das erklärt die unterschiedliche Verwendung der
Begriffe Kurve und Fläche für das gleiche Objekt
3.8 Algebraische Geometrie 215

T
T
2ω2

2ω1
a)

b)

t3
2ω2
t∗3
T
2ω1
c) Abb. 3.77

Die Gruppenstruktur einer elliptischen Kurve: Auf T wirkt in natürlicher Weise eine Gruppe
G, die durch

t1 + t2 = t3 mod T

gegeben ist. Dabei konstruieren wir zunächst die Summe t1 + t2 als Summe der beiden komplexen
Zahlen t1 und t2 . Liegt diese Summe in T, dann setzen wir t1 + t2 := t3 . Befindet sich dagegen t3
außerhalb von T, dann gibt es eindeutig bestimmte ganze Zahlen m1 und m2 so dass der Punkt
t3∗ := t1 + t2 − 2m1 ω1 − 2m2 ω2 in T liegt. Dann setzen wir t1 + t2 := t3∗ (Abb. 3.77c).
Die Gruppe G wird in einfacher Weise zu einer Gruppe G für die Punkte der elliptischen
Kurve C, indem wir durch

( z 1 , w1 ) + ( z 2 , w2 ) = ( z 3 , w3 ) . (3.47)

eine (ungewöhnliche) Addition erklären. Dabei sei

z j = ℘(t j ), w j = ℘ ( t j ) and t 3 = t 1 + t2 .

Aus dem Additionstheorem:


  
1 ℘ (u) − ℘  (υ ) 2
℘(u + υ) = −℘(u) − ℘(υ) +
4 ℘(u) − ℘( υ)
für die ℘-Funktion folgt:

 2
1 w1 − w2
z3 = − z1 − z2 + . (3.48)
4 z1 − z2

Die Gruppenoperation (3.47) wurde im Jahre 1834 von Jacobi entdeckt. Er benutzte dabei die
berühmten, von Euler im Jahre 1753 gefundenen Additionstheoreme für elliptische Integrale,
hinter denen sich die Additionstheoreme für elliptische Funktionen verbergen.
216 3 Geometrie

Die anschauliche Deutung der Gruppenstruktur einer elliptischen Kurve: Wir betrachten
eine elliptische Kurve C, d. h., eine Kurve dritter Ordnung ohne singuläre Punkte mit reellen
Koeffizienten in der reellen Ebene R2 .
(i) Wir fixieren einen Punkt P0 .
(ii) Zwei Punkten P1 und P2 ordnen wir durch die in Abb. 3.78 angegebene Konstruktion einen
dritten Punkt P3 zu.

P3 P0
S
P2
P1
C Abb. 3.78

Das heißt, wir bestimmen den Schnittpunkt S der Verbindungsgeraden P1 P2 mit C. Dann ist
P3 der Schnittpunkt der Verbindungsgeraden P0 S mit C. Wir definieren nunmehr die „Summe“
P1 + P2 durch

P1 + P2 := P3 . (3.49)

Satz: (a) Durch die so erklärte Addition wird C zu einer additiven Gruppe mit dem neutralen
Element P0 = 0.
(b) Wählt man P0 als einen Wendepunkt von C, dann liegen drei Kurvenpunkte P, Q, R genau
dann auf einer Geraden, wenn

P+Q+R =0 (3.50)

gilt.
Die Aussage (b) wurde von Poincaré im Jahre 1901 entdeckt und spielte eine zentrale Rolle bei
seinen Untersuchungen zur diophantischen Geometrie (vgl. 3.8.6.).
Das Analogieprinzip als ein Entwicklungsprinzip der Mathematik: Eine elliptische Kurve
C besitzt die typische Eigenschaft, dass jede Gerade durch zwei verschiedene Kurvenpunkte
die Kurve in genau einem dritten Punkt schneidet.22 Die Bezeichnung „Summe“ verwundert
zunächst, denn damit verknüpft man die Vorstellung von linearen Gebilden, wie Geraden und
Ebenen. Hier aber haben wir es mir einer gekrümmten Kurve zu tun. Eine der Stärken der
Mathematik beruht jedoch darauf, dass man neue Verknüpfungen in Analogie zu bekannten
Verknüpfungen für völlig andere Objekte setzt. In diesem Fall benutzen wir die wohlbekannte
Addition von Zahlen, um Analogieschlüsse für Punkte einer Kurve durchzuführen.
Auf diese Weise werden bereits gewonnene Erfahrungen der Mathematiker auf immer kompli-
ziertere Objekte übertragen und führen zu neuen Erkenntnissen. Es zeigt sich, dass die Anzahl
der tiefen Grundstrukturen relativ klein ist. Deshalb kommt man mit wenigen Grundstruk-
turen aus (z. B. Gruppe, Ring, Körper, topologischer Raum, Mannigfaltigkeit). Ein nächster
Erkenntnisschritt besteht in der

Kombination von Grundstrukturen.

Zum Beispiel ergibt sich aus einer Kombination der Begriffe Gruppe und Mannigfaltigkeit, der für
die moderne Physik fundamentale Begriff der Liegruppe (vgl. Kapitel 17).
22
Diese Aussage ist nur dann richtig, wenn man auch unendlich ferne Punkte zulässt, also mit Methoden der projektiven
Geometrie arbeitet (vgl. 3.8.4.).
3.8 Algebraische Geometrie 217

Allerdings folgt die Geschichte der Mathematik in der Regel nicht dieser Logik, sondern
geht häufig krumme und seltsam verschlungene Wege. Die entscheidende Antriebskraft für
die Entwicklung der Mathematik ist die Lösung komplizierter Probleme. Dabei wird der Ma-
thematiker gezwungen, nach neuen kraftvollen Ideen Ausschau zu halten. Die ersten Beweise
sind dann häufig sehr schwerfällig und umständlich. Das führt zu dem Wunsch, die Beweise
wesentlich zu vereinfachen. In Verfolgung dieses Ziels kommt es dann zur Herausarbeitung
neuer Theorien, deren Anwendung ehemals komplizierte Problem auf einer höheren Ebene
wieder einfach und durchsichtig werden lassen. Von dieser höheren Ebene aus kann man dann
neue, noch kompliziertere Probleme in Angriff nehmen.
Vergleicht man das Bemühen der Mathematiker um die die Gewinnung immer neuer Erkennt-
nisse mit dem Ersteigen eines Gipfels, dann arbeitet sich die Bergsteigergruppe von Plateau
zu Plateau vor. Während einige besonders Wagemutige unermüdlich ohne Seil vorausstürmen,
erkundet der größere Teil der Gruppe ein Plateau nach dem anderen und räumt die Felsbrocken
beiseite, damit die Nachfolgenden rascher vorankommen.

3.8.1.4 Algebraische Kurven höherer Ordnung und Abelsche Integrale

Bisher haben wir elliptische Kurven betrachtet, die auf das Engste mit elliptischen Integralen
und elliptischen Funktionen zusammenhängen. Die Untersuchung komplizierterer Integrale,
vor denen man zunächst hilflos zu stehen scheint, lassen sich mit Hilfe der Untersuchung
komplizierterer Kurven nach Riemann (1857) überraschend elegant behandeln. Es handelt sich
dabei um Integrale der Form.


R ( z, w) dz ,

wobei der Punkt ( z, w) auf der Kurve

p (z, w) = 0 (3.51)

liegt. Dabei ist p ein Polynom in z und w. Die „mehrdeutige Funktion“ w = w(z), die (3.51) ge-
nügt, heißt eine algebraische Funktion. Solche Integrale wurden erstmalig in großer Allgemeinheit
von dem jungen norwegischen Mathematiker Niels Henrik Abel (1802–1829) betrachtet.
Historische Bemerkung: Die Untersuchung Abelscher Integrale spielte eine zentrale Rolle in
der Mathematik des 19. Jahrhunderts und führte zur Entwicklung der komplexen Funktionen-
theorie durch Riemann und Weierstraß. In genialer Weise erkannte Riemann (1826–1866), dass
die Behandlung Abelscher Integrale sehr durchsichtig und anschaulich wird, wenn man das qua-
litative Verhalten (d. h. die Topologie) der zur Gleichung (3.51) gehörigen Riemannschen Fläche
studiert. Dabei spielt der Begriff des Geschlechts einer Riemannschen Fläche die entscheidende
Rolle, weil das Geschlecht die einzige topologische Invariante kompakter Riemannscher Flächen
darstellt (vgl. 18.8). Das war die Wurzel für die Entwicklung der Topologie, die heute zu den
mächtigsten Instrumenten der modernen Mathematik und Physik gehört (vgl. Kapitel 18 und
19).
Die Gleichung (3.45) beinhaltet eine Parameterdarstellung der elliptischen Kurve (3.44). Felix
Klein (1849–1925) und Henri Poincaré (1854–1912) stellten sich als junge Männer die außeror-
dentlich komplizierte Aufgabe, für beliebige algebraische Funktionen (3.51) ebenfalls geeignete
Parametrisierungen zu finden. Das führte zur Entwicklung der Theorie automorpher Funktionen,
welche die elliptischen Funktionen verallgemeinern.
218 3 Geometrie

Die endgültige Lösung des allgemeinen Parametrisierungsproblems für (3.51) gelang unab-
hängig voneinander Paul Koebe (1882–1945) und Henri Poincaré im Jahre 1907 mit dem Beweis
des berühmten Uniformisierungstheorems (vgl. 18.8).
Die Sprache der Schemata: In der modernen algebraischen Geometrie wird das System (3.42)
über beliebigen Körpern betrachtet. Ein Werkzeug zur Untersuchung derartiger Probleme sind
Schemata. Der Begriff des Schemas, der zu den wichtigsten Begriffen der Mathematik gehört
(und zum Beispiel in seiner allgemeinsten Formulierung Mannigfaltigkeiten umfasst), vereint
Topologie, Differentialtopologie, algebraische Geometrie und Zahlentheorie. Die Grundobjekte
dieser zentralen mathematischen Disziplinen sind Schemata.
Die Fermatsche Vermutung und die Shimura-Taniyama-Weil-Vermutung: Im Jahre 1994
gelang Andrew Wiles in Princeton (USA) der Beweis für die seit 300 Jahren unbewiesene Fermat-
sche Vermutung. Ein entscheidender Ansatzpunkt bestand darin, die Teilaussage einer noch viel
tieferliegenden geometrischen Vermutung über elliptische Kurven zu beweisen (die Shimura-
Taniyama-Weil-Vermutung). Inzwischen ist auch die Shimura-Taniyama-Weil-Vermutung voll-
ständig bewiesen worden (vgl. [Diamond und Shurman 2005]).
Stringtheorie: Der gegenwärtig laufende Versuch, alle fundamentalen Wechselwirkungen in
der Natur (Gravitation, elektromagnetische, starke und schwache Wechselwirkung) im Rahmen
der Stringtheorie zu vereinen, hat zu einem sehr fruchtbaren, wechselseitigen Ideenstrom zwischen
Physik und Mathematik geführt. Dabei spielen die Methoden der algebraischen Geometrie eine
zentrale Rolle (vgl. 19.13).
Die algebraische Geometrie stellt eine mathematische Disziplin dar, die in viele andere Gebiete
der Mathematik sowie in die Naturwissenschaften hineinreicht und zum harten Kern der
Mathematik gehört. Im folgenden soll eine Brücke geschlagen werden von den klassischen
algebraischen Kurven unserer Anschauung bis hin zur modernen Abstraktion, die jedoch nicht
um ihrer selbst betrieben wird, sondern um besonders schwierige Probleme zu lösen, bei denen
die herkömmlichen Methoden versagten.

3.8.2 Beispiele ebener algebraischer Kurven

Die wichtigste Charakteristik einer ebenen algebraischen Kurve ist ihr Geschlecht p (vgl. 3.8.5.).
Im folgenden seien a, b und c positive Konstanten.

3.8.2.1 Kurven erster und zweiter Ordnung

Algebraische Kurven erster Ordnung sind Geraden; sie besitzen das Geschlecht p = 0.
Irreduzible algebraische Kurven zweiter Ordnung sind nichtentartete Kegelschnitte (Kreise,
Ellipsen, Parabeln oder Hyperbeln); sie besitzen das Geschlecht p = 0.
Reduzible algebraische Kurven zweiter Ordnung sind Geradenpaare.
Alle in 3.8.2.1. und 3.8.2.2. angeführten Kurven sind irreduzibel. Eine irreduzible Kurve dritter
Ordnung besitzt das Geschlecht p = 1, falls keine Singularitäten vorhanden sind23 , ansonsten
gilt p = 0.
Eine irreduzible Kurve vierter Ordnung besitzt das Geschlecht p = 3 oder p = 0. Dabei ist p = 3,
falls keine Singularitäten vorhanden sind.

23
Diese Aussage bezieht sich auf die projektive Schreibweise der Kurve im Komplexen (vgl. 3.8.4.). Die graphische
Darstellung der Kurven im Reellen liefert deshalb nur ein unvollständiges Bild von den Singularitäten der komplexen
Kurven.
3.8 Algebraische Geometrie 219

3.8.2.2 Kurven dritter Ordnung

Die Versiera der Maria Agnesi (Abb. 3.79):

( x 2 + a2 ) y − a3 = 0 . (3.52)

Asymptote: y = 0.
Flächeninhalt zwischen Kurve und Asymptote: πa2 .
Krümmungsradius im Scheitelpunkt (0, a): R = a/2.

Zwei Wendepunkte: (± a/ 3, 3a/4).
Geschlecht: p = 0.

a a x
−√ √
3 3 Abb. 3.79 Versiera der Agnesi

Gestalt der Versiera im zweidimensionalen komplexen projektiven Raum CP2 : Die


projektiv-komplexe Form der Kurve (3.52) lautet:

x2 y + a2 yu2 − a3 u3 = 0 . (3.53)

Man erhält diese Gleichung, indem man in (3.52) die Variablen x und y durch x/u, y/u ersetzt
und den so entstehenden Ausdruck mit u3 multipliziert.
Dabei sind x, y und u komplexe Zahlen, wobei der Fall x = y = u = 0 ausgeschlossen
wird. Zwei Lösungen ( x j , y j , u j ), j = 1, 2, von (3.53) entsprechen genau dann dem gleichen
Kurvenpunkt, wenn es eine komplexe Zahl λ = 0 gibt mit

( x1 , y1 , u1 ) = λ( x2 , y2 , u2 ) := ( λx2 , λy2 , λu2 ) .

Setzt man u = 1, dann erhält man die sogenannte affine Form (3.52) von (3.53).
Unendlich ferne Punkte: Die Kurve (3.53) schneidet die unendlich ferne Gerade u = 0 in den
Punkten

(1, 0, 0) und (0, 1, 0) ,

die in Abb. 3.79 der Richtung der x-Achse und der Richtung der y-Achse entsprechen.
Singularitäten: Die einzige Singularität der Kurve ist der unendlich ferne Doppelpunkt (1, 0, 0),
der der Asymptote y = 0 der Kurve in Abb. 3.79 entspricht.
Geschlecht: p = 0.
Die Kissoide des Diocles (Abb. 3.80):

x 3 + ( x − a ) y2 = 0 .
220 3 Geometrie

B Efeublatt
A
P
a
O
x

a) b) Abb. 3.80 Kissoide

at2 at3
Rationale Parameterdarstellung: x = , y= , −∞ < t < ∞. In Polarkoordinaten gilt
1+t 2 1 + t2
t = tan ϕ.
a sin2 ϕ
Darstellung in Polarkoordinaten: r = .
cos ϕ
Asymptote: x = a.
Flächeninhalt zwischen Kurve und Asymptote: 3πa2 /4.
Geometrische Charakterisierung: Es sei K ein Kreis vom Radius a/2, mit dem Mittelpunkt ( a/2, 0),
und g sei die Gerade x = a. Ein vom Ursprung O ausgehender Strahl schneidet K im Punkt A
und g im Punkt B. Der Punkt P auf der Kissoide hat die Eigenschaft, dass

OP = AB.

gilt. Das Wort Kissoide ist griechischen Ursprungs und steht für Efeublattlinie (κισσoς) (kissos
Efeu).
Die Kissoide besitzt im Ursprung (0, 0) eine Spitze als Singularität.
Strophoide (Abb. 3.81):

( x + a ) x 2 + ( x − a ) y2 = 0 .

a ( t2 − 1) at(t2 − 1)
Rationale Parameterdarstellung: x = , y= , −∞ < t < ∞. In Polarkoordina-
1+t 2 1 + t2
ten gilt t = tan ϕ.
a cos 2ϕ
Gleichung in Polarkoordinaten: r = − .
cos ϕ
Asymptote: x = a.
Tangenten im Ursprung O: y = ± x.
π 2
Flächeninhalt der Schleife: 2 − a .
2
π 2
Flächeninhalt zwischen Kurve und Asymptote: 2 + a .
2
3.8 Algebraische Geometrie 221

P2
Y
P1
O
−a a x

Abb. 3.81 Strophoide

Geschlecht: p = 0.
Geometrische Deutung: Wir zeichnen einen vom Punkt (− a, 0) ausgehenden Strahl, der die
y-Achse im Punkt Y schneidet. Die Strophoidenpunkte P1 und P2 genügen dann der Bedingung

Pj Y = OY , j=1,2 .

Von dieser Eigenschaft rührt die aus dem Griechischen stammende Bezeichnung Strophoide her.
Die Strophoide besitzt im Ursprung (0, 0) einen Doppelpunkt als Singularität.
Kartesisches Blatt (Abb. 3.82):

x3 + y3 − 3axy = 0 .

y
P

−a x
−a
Abb. 3.82 Kartesisches Blatt

3at 3at2
Rationale Parameterdarstellung: x = ,y= ,
1+t 3 1 + t3
−∞ < t < −1 und −1 < t < ∞. In Polarkoordinaten gilt t = tan ϕ.
Asymptote: x + y + a = 0.
Flächeninhalt der Schleife: 3a2 /2.
Flächeninhalt zwischen Kurve und Asymptote: 3a2 /2.
Scheitelpunkt P: (3a/2, 3a/2).
Tangenten im Ursprung: x = 0 und y = 0.
222 3 Geometrie

Krümmungsradius im Ursprung für beide Zweige: R = 3a/2. Geschlecht: p = 0.


Das kartesische Blatt besitzt im Ursprung (0, 0) einen Doppelpunkt als singulären Punkt.

3.8.2.3 Kurven vierter Ordnung

Die folgenden Kurven findet man ausführlich diskutiert in 3.7.


Konchoide des Nikomedes (Abb. 3.83):

( x − a )2 ( x 2 + y2 ) − b 2 x 2 = 0 .

Geschlecht: p = 2.

y y y

a a a
x x x

a) b < a b) b > a c) b = a

Abb. 3.83 Konchoide des Nikomedes

Der Name Konchoide ist griechischen Ursprungs und bedeutet Muschelkurve (κóνχη =
Muschel). Die Konchoide besitzt in Abhängigkeit von den Parameterwerten a und b eine Spitze
oder einen Doppelpunkt als Singularität.
Pascalsche Schnecke (Abb. 3.71):

( x2 + y2 − ax)2 − b2 ( x2 + y2 ) = 0 .

Geschlecht: p = 2 oder p = 3 in Abhängigkeit von den Parameterwerten a und b.


Kardioide (Abb. 3.84a): Pascalsche Schnecke mit a = b.
Geschlecht: p = 2.
Die Kardioide besitzt im Ursprung (0, 0) eine Spitze als Singularität.
Cassinische Kurven (Abb. 3.66b):

( x2 + y2 )2 − 2c2 ( x2 − y2 ) + c4 − a4 = 0 .

Geschlecht: p = 3 oder p = 2 in Abhängigkeit von den Parameterwerten a und c.


Die Lemniskate von Jakob Bernoulli (Abb. 3.84b): Cassinische Kurve mit a = c.
3.8 Algebraische Geometrie 223

y y

x x

a) Kardioide b) Lemniskate Abb. 3.84

Geschlecht: p = 2.
Die Lemniskate besitzt im Ursprung (0, 0) einen Doppelpunkt als Singularität.
Historische Bemerkungen: Die Kissoide des Diocles (Efeukurve) und die Konchoide des
Nikomedes (Muschelkurve) sind die ältesten algebraischen Kurven mit Singularitäten (um 180 v.
Chr.). Sie wurden erfunden, um die beiden berühmten Delischen Probleme der Würfelverdopp-
lung und der Dreiteilung des Winkels graphisch zu lösen (vgl. 2.6.1.). In der Antike benutzte
man die Konchoide des Nikomedes auch zur Konstruktion des Längsschnitts von Säulen (vgl.
Abb. 3.83c).
Eigenschaften der Pascalschen Schnecke wurden vom Vater des berühmten Blaise Pascal
(1623–1662) studiert.
Das Kartesische Blatt (folium Cartesii) wurde von Descartes (1596–1650) eingeführt, der
wesentlich zur Algebraisierung der Geometrie beigetragen hat, indem er geometrische Gebilde
durch Gleichungen in „kartesischen Koordinaten“ darstellte. Die Cassinischen Kurven gehen auf
den italienischen Astronomen Cassini (1650–1700) zurück.
Umfangreiche Untersuchungen zum Verhalten algebraischer Kurven wurden von Newton
(1643–1727) durchgeführt. Die Lemniskate (Schleifenkurve) von Jakob Bernoulli (1655–1705)
spielte eine wichtige Rolle bei der Entwicklung der Theorie der elliptischen Integrale (vgl. 3.7.5.).
Im Jahre 1748 schrieb die italienische Mathematikerin Maria Gaetana Agnesi (1718–1799) ein
Buch mit dem Titel Instituzioni analitiche, das das Wissen ihrer Zeit in Algebra und Analysis
zusammenfasste und wegen seiner klaren Darstellung mehrfach übersetzt wurde. In origineller
Weise wird dort die heute als Versiera der Agnesi bezeichnete Kurve behandelt. Das italienische
Wort versiera bedeutet Schreckgespenst.

3.8.3 Anwendungen in der Integralrechnung

Wir betrachten das Integral


J= R ( x, w) dx . (3.54)

Dabei bezeichnet R eine rationale Funktion in den Variablen x und w. Ferner ist w eine algebrai-
sche Funktion von x, d. h., die Paare ( x, w) sind Punkte der ebenen algebraischen Kurve

C: p ( x, w ) = 0 .

Ist eine Parameterdarstellung

x = x ( t ), w = w(t) (3.55)
224 3 Geometrie

der Kurve C gegeben, dann ergibt sich für das Integral (3.54) durch Substitution der Ausdruck

J= R( x (t), w( t)) x  (t ) dt . (3.56)

Die Integrale rationaler Funktionen kann man mit Hilfe einer Partialbruchzerlegung berechnen.
Seit den Zeiten von Newton und Leibniz um 1700 hat man deshalb nach immer neuen Substitutio-
nen gesucht, um Integrale der Gestalt (3.54) durch eine rationale Substitution auf Integrale (3.56)
mit einem rationalen Integranden zurückzuführen und zu berechnen. Allmählich kristallisierte
sich die folgende Frage heraus: Für welche Integrale existiert eine rationale Substitution?
Die Faustregel lautet:24

Die Kurve C besitzt genau dann eine rationale Parameter-


darstellung (3.55), wenn ihr Geschlecht gleich null ist.

 Beispiel 1: Das Integral


 
J= R x, 1 − x2 dx (3.57)

schreiben wir in der Form R( x, w)dx mit

C: x 2 + w2 = 1 .

Das ist ein Kreis, der als Kegelschnitt das Geschlecht null besitze. Eine rationale Parameterdar-
stellung des Kreises lautet

t2 − 1 2t
x= , w= .
t2 + 1 t2 + 1
Setzen wir

ϕ
t = tan , (3.58)
2

dann gilt

x = cos ϕ , y = sin ϕ . (3.59)

Das erklärt den universellen Erfolg der Substitution (3.58) bei der Berechnung von Integralen der
Form

R(cos ϕ, sin ϕ ) dϕ .

 Beispiel 2: Es sei −∞ < e1 < e2 < e3 < ∞ mit e1 + 3e2 + e3 = 0. Das Integral
  
R x, 4( x − e1 )( x − e2 )( x − e3 ) dx (3.60)

schreiben wir in der Gestalt R( x, w)dx mit

w2 = 4( x − e1 )( x − e2 )( x − e3 ) .
24
Die präzise Antwort gibt der Satz von Poincaré (1901) in 3.8.5. Dazu benötigt man die projektive komplexe Form der
Kurve C, die im nächsten Abschnitt eingeführt wird.
3.8 Algebraische Geometrie 225

Diese Kurve ist von dritter Ordnung ohne Singularitäten und besitzt das Geschlecht eins. Das
ist der tiefere Grund dafür, dass sich elliptische Integrale nicht durch rationale Substitutionen
berechnen lassen. Dieser Umstand wurde allmählich im 18. Jahrhundert erkannt und führte im
19. Jahrhundert zur Entwicklung der Theorie der elliptischen Funktionen.
Das Integral (3.57) kann man durch die Substitution (3.58) mit Hilfe periodischer trigonome-
trischer Funktionen lösen. Zur Berechnung des elliptischen Integrals (3.60) benötigt man die
Substitution

x = ℘(t), w = ℘ ( t) ,

mit der doppeltperiodischen (elliptischen) Weierstraßschen ℘-Funktion (vgl. 1.14.17.3).

3.8.4 Die projektiv-komplexe Form einer ebenen algebraischen Kurve

Grundidee: Eine übersichtliche Theorie für ebene algebraische Kurven lässt sich nur ent-
wickeln, wenn man zu homogenen komplexen Koordinaten übergeht, d. h., wir betrachten die
Kurve im komplexen zweidimensionalen projektiven Raum CP2 (vgl. 3.5.4.).
 Beispiel 1: In der Kreisgleichung

x 2 + y2 = 1

ersetzen wir x und y durch x/u und y/u. Multiplikation mit u2 ergibt die projektiv-komplexe
Form

x 2 + y2 = u2

des Kreises. Hier sind x, y, u komplexe Zahlen, wobei das Tupel (0, 0, 0) ausgeschlossen wird.
Zwei Tupel ( x, y, u) und ( x∗ , y∗ , u∗ ) entsprechen genau dann dem gleichen Punkt, wenn sie sich
um einen von Null verschiedenen komplexen Faktor λ unterscheiden, d. h., es ist ( x, y, u) =
λ ( x ∗ , y ∗ , u ∗ ).
Definition: Jede ebene algebraische Kurve n-ter Ordnung kann man in der Form

p ( x, y, u) = 0 (3.61)

schreiben, wobei p ein homogenes Polynom25 n-ten Grades mit komplexen Koeffizienten in den
komplexen Variablen x, y und u darstellt. Diese Kurven heißen algebraische Kurven in CP2 . Die
Zahl n nennt man die Ordnung der Kurve.
Irreduzible Kurven: Die durch die Gleichung (3.61) gegebene Kurve heißt genau dann irredu-
zibel, wenn das Polynom p über dem Körper C irreduzibel ist.
 Beispiel 2: Die Gleichung x = 0 ist irreduzibel und beschreibt eine Gerade. Die Gleichung

xy = 0

ist von zweiter Ordnung und reduzibel. Sie stellt einen entarteten Kegelschnitt dar, der in die
beiden Geraden x = 0 und y = 0 zerfällt.
Die irreduziblen Kurven zweiter Ordnung entsprechen Ellipsen, Parabeln und Hyperbeln
(nicht entartete Kegelschnitte).
25
Die Summe der Exponenten jedes Terms ist gleich n.
226 3 Geometrie

3.8.4.1 Der Satz von Bézout über die Schnittpunkte von Kurven

Der folgende Satz ist einer der wichtigsten Sätze der algebraischen Kurventheorie.
Die generische Schnittsituation: Schneiden sich zwei irreduzible Kurven in einem Punkt P,
dann heißt dieser genau dann regulär wenn beide Kurven in diesem Punkt genau eine Tangente
besitzen und diese Tangenten nicht zusammenfallen (Abb. 3.85). Diese Situation liegt in der
Regel vor.

a) regulärer b) irregulärer
Schnittpunkt Schnittpunkt Abb. 3.85

Satz von Bézout (1779): Gegeben seien zwei irreduzible algebraische Kurven C und D in
CP2 mit den Ordnungen m und n, die keine gemeinsame Komponente besitzen. Dann gibt es
höchsten mn Schnittpunkte zwischen C und D.
Sind alle Schnittpunkte regulär, dann wird die maximale Zahl mn der Schnittpunkte erreicht.
 Beispiel 1: Zwei Kegelschnitte (ohne gemeinsame Komponente) können sich wegen n = m = 2
in höchstens 4 Punkten schneiden.
 Beispiel 2: Der Einheitskreis x2 + y2 = 1 und die Gerade x = 2 schneiden sich nicht im
Endlichen. Übergang zu homogenen Koordinaten ergibt

x 2 + y2 = u2 , x = 2u

mit den beiden Schnittpunkten (2, ±i 3, 1).
Korollar: Man kann jedem Schnittpunkt eine Multiplizität zuordnen, so dass gilt:26

Die Summe der Multiplizitäten der Schnittpunkte ist gleich mn.

Reguläre Schnittpunkte besitzen die Multiplizität eins.

3.8.4.2 Rationale Transformationen von Kurven

In der Mathematik gehören zu jeder Klasse von Objekten Transformationen dieser Objekte. In
der Theorie der algebraischen Kurven im projektiven Raum CP2 denkt man als erstes an die
projektiven Transformationen von CP2 auf sich. Eine damit zusammenhängende Klassifikation
26
Die beiden Kurven seien durch die Gleichungen
R( x, y, u) = 0 und q( x, y, u ) = 0.
gegeben. Mit Hilfe einer Koordinatentransformation (Kollineation) können wir stets erreichen, dass der Ursprung (0, 0, 1)
nicht auf der Verbindungsgeraden zweier Schnittpunkte liegt.
Wir setzen R : = C [ x, u] ((Polynomring über C in den Variablen x und u). Dann ist
p, q ∈ R [y ] .
Die Resultante R( p, q) von p und q verschwindet im Schnittpunkt P der beiden Kurven. Die Vielfachheitmultiplicity der
zugehörigen Nullstelle y der Resultante als Polynom über R [y] heißt die Multiplizität des Schnittpunktes.
3.8 Algebraische Geometrie 227

der Kurven erweist sich jedoch wegen ihrer Feinheit als wenig praktikabel. Durchgesetzt hat sich
die Klassifikation bezüglich birationaler Transformationen.
Rationale Abbildungen von Kurven: Gegeben seien zwei algebraische Kurven C und C  in
CP2 . Die Abbildung

x  = X ( x, y, u) , y = Y ( x, y, u) , u = U ( x, y, u) (3.62)

von C auf C  heißt genau dann rational, wenn X, Y und U homogene Polynome in x, y und u
sind, die alle den gleichen Grad besitzen.27
Die Abbildung (3.62) heißt genau dann birational, wenn sie rational und bijektiv ist, wobei
zusätzlich auch die Umkehrabbildung rational ist.
Rationale Kurven: Eine Kurve heißt genau dann rational, wenn sie das rationale Bild einer
Geraden ist. Explizit entspricht das einer Darstellung

x = X ( λ, μ) , y = Y (λ, μ ) , u = U (λ, μ ) (3.63)

wobei X, Y und U homogene Polynome in den komplexen Variablen λ und μ sind, die alle den
gleichen Grad besitzen.
 Beispiel 1: Geraden und Kegelschnitte sind rationale Kurven.
Birationale Äquivalenz von Kurven: Zwei ebene algebraische Kurven heißen genau dann
birational äquivalent, wenn sie sich durch eine birationale Transformation ineinander überführen
lassen.

Die algebraische Geometrie der ebenen algebraischen Kurven ist die Invariantentheorie
dieser Objekte unter birationalen Transformationen.

 Beispiel 2: Die Ordnung einer Kurve ist keine birationale Invariante, wohl aber ihr Geschlecht
(vgl. 3.8.5.).
Cremonagruppe: Die birationalen Abbildungen des CP2 auf sich bilden eine Gruppe, die der
italienische Geometer Luigi Cremona in den Jahren 1863 bis 1865 ausführlich untersucht hat.
Diese Gruppe trägt heute seinen Namen.

3.8.4.3 Singularitäten

Tangente: Die Tangente an die Kurve p( x, y, u) = 0 im Punkt P := ( x0 , y0 , u0 ) ist durch die


Gleichung

p x ( P)( x − x0 ) + py ( P)(y − y0 ) + pu ( P)(u − u0 ) = 0. (3.64)

gegeben.
 Beispiel 1: Die Gleichung der Tangente an den Einheitskreis x2 + y2 − u2 = 0 lautet:

2x( x − x0 ) + 2y( y − y0 ) − 2u(u − u0 ) = 0 .

Das ist gleichbedeutend mit der sogenannten Polarengleichung

xx0 + yy0 − uu0 = 0 .


27
Genauer Beshreibt (3.62) eine Abbildung von C auf C mit Ausnahme von höchstens endlich vielen Punkten.
228 3 Geometrie

Regulärer Punkt: Der Kurvenpunkt P heißt genau dann regulär, wenn eine eindeutig be-
stimmte Tangente in P existiert, d. h., es ist

( p x ( P), py ( P), pu ( P )) = (0, 0, 0) .

Singulärer Punkt: Ein Kurvenpunkt, der nicht regulär ist, heißt singulär.
Ein singulärer Punkt P besitzt genau dann die Ordnung s, wenn alle partiellen Ableitungen
des Polynoms p bis zur Ordnung s − 1 im Punkt P gleich null sind, während irgendeine partielle
Ableitung von p der Ordnung s in P ungleich null ist.
Doppelpunkte und Spitzen: Singuläre Punkte der Ordnung s = 2 (bzw. s = 3) heißen
Doppelpunkte (bzw. Spitzen).
 Beispiel 2 (Doppelpunkt): Für p ( x, y) := x2 − y2 und P := (0, 0, 1) gilt:

px ( P) = py ( P) = pu ( P) = 0 und pxx ( P) = 2 .

Deshalb ist der Schnittpunkt P der durch x2 − y2 = 0 gegebenen Geraden y = ± x ein Doppelpunkt
(vgl. Abb. 3.76 in 3.8.1.2.).
 Beispiel 3 (Spitze): Für p ( x, y, u) := x3 − y2 u und P := (0, 0, 1) hat man

p xxx ( P) = 6 ,

während alle partiellen Ableitungen bis zur zweiten Ordnung in P gleich null sind. Folglich ist P
eine Spitze. Dieser Punkt entspricht dem Ursprung (0, 0) der semikubischen Parabel x3 − y2 = 0
(vgl. Abb. 3.76 in 3.8.1.2.).
Satz: Reguläre Punkte und singuläre Punkte einschließlich ihrer Ordnung sind invariante
Begriffe bezüglich der birationalen Äquivalenz von Kurven.
Anwendung auf die Versiera der Agnesi: Die Gleichung dieser Kurve lautet

C: x2 y + yu2 − u3 = 0

(vgl. Abb. 3.79 in 3.8.2.2.). Wir setzen p = x2 y + yu2 − u3 .


(i) Die Schnittpunkte dieser Kurve mit der unendlich fernen Geraden u = 0 sind (1, 0, 0) und
(0, 1, 0).
(ii) Die singulären Punkte dieser Gleichung bestimmen sich aus dem System

p x = 2xy = 0 , p y = x 2 + u2 = 0 , pu = 2uy − 3u2 = 0 , p = 0.

Das ergibt die Lösung (0, 1, 0) und die geometrisch bedeutungslose triviale Lösung (0, 0, 0).
Wegen p xx (0, 1, 0) = 2 ist der unendlich ferne Punkt (0, 1, 0) ein Doppelpunkt von C, der der
Asymptote von C in Abb. 3.79 entspricht

3.8.4.4 Dualität

Duale Kurve: Gegeben sei die algebraische Kurve C : p( x, y, u) = 0. Die Abbildung

C∗ : x∗ = p x ( x, y, u) , y∗ = py ( x, y, u) , u∗ = pu ( x, y, u) ,

die für alle regulären Punkte ( x, y, u) von C, betrachtet wird, beschreibt eine algebraische Kurve
in CP2 , die man die duale Kurve zu C nennt. Die Ordnung der dualen Kurve heißt die Klasse
der Ausgangskurve C.
3.8 Algebraische Geometrie 229

Vom geometrischen Standpunkt aus sind die Punktkoordinaten der dualen Kurve die Gera-
denkoordinaten der Tangenten an die Ausgangskurve.
Satz: Zweimalige Dualisierung einer Kurve C ergibt wiederum C.
 Beispiel: Es sei p( x, y, u) := x2 + y2 − u2 . Für den Einheitskreis C : p ( x, y, u) = 0 erhalten wir
die Parameterdarstellung

x∗ = 2x , y∗ = 2y , u∗ = −2u

der dualen Kurve C∗ . Wegen x2∗ + y2∗ − u2∗ = 0 gilt C = C∗ , d. h., der Einheitskreis ist zu sich
selbst dual.

3.8.5 Das Geschlecht einer Kurve

In diesem Abschnitt betrachten wir irreduzible ebene algebraische Kurven C in CP2 , d. h.,
wir gehen zu projektiven komplexen Koordinaten über. Die wichtigste Charakteristik einer
ebenen algebraischen Kurve ist ihr Geschlecht. Die Definition des Geschlechts basiert auf einer
geeigneten Parameterwahl der Kurve, die durch das Uniformisierungstheorem gegeben ist.
Das Uniformisierungstheorem für ebene algebraische Kurven: Jede Kurve

C: p ( x, y, u) = 0

besitzt eine globale Parametrisierung

x = x (t) , y = y(t) , u = u(t) , t∈T (3.65)

mit den folgenden Eigenschaften.


(i) Der Parameterraum T ist eine kompakte zusammenhängende eindimensionale komplexe
Mannigfaltigkeit, also eine kompakte Riemannsche Fläche.
(ii) Die durch (3.65) gegebene Abbildung π : T −→ C ist holomorph und surjektiv.
Mit S bezeichnen wir die stets endliche Menge der Singularitäten der Kurve C. Die Urbild-
menge S := π −1 (S) heißt die Menge der kritischen Parameterwerte.
(iii) Die Abbildung

π: T \S → C \S

ist biholomorph, und die kritische Parametermenge S ist kompakt und besitzt keine inneren
Punkte, d. h. S ist „dünn“.
Kommentar: Wir interpretieren den Kurvenparameter t als Zeit. Dann stellt (3.65) die Kurve
C als die (verallgemeinerte) Bahnkurve eines Punktes dar. Wichtig ist, dass der Parameterraum
T keine Singularitäten besitzt. Deshalb bezeichnet man die Parameterdarstellung (3.65) als eine
Auflösung der Singularitäten der Kurve C.
 Beispiel 1: Wir betrachten die Strophoide ( x + u) x2 + ( x − u) y2 = 0 zunächst im R2 . Dann
existiert die Parameterdarstellung

t2 − 1 t ( t2 − 1)
x= , y= , u = 1, −∞ < t < ∞ . (3.66)
t2 + 1 t2 + 1

Der Parameterraum ist hier die reelle Achse R, die keine Singularität besitzt. Durchläuft
die Zeit t alle reellen Werte, dann wird die Kurve in Abb. 3.86 genau einmal durchlaufen.
Die Parameterdarstellung (3.66) ist jedoch für unsere Zwecke noch nicht geeignet. Denn wir
230 3 Geometrie

=⇒
t 1 x

Abb. 3.86

müssen alle komplexen Kurvenpunkte ( x, y, u) einschließlich der unendlich fernen Kurvenpunkte


erfassen und der Parameterraum T muss kompakt sein, was auf R nicht zutrifft.
Bereits dieses einfache Beispiel zeigt, dass die allgemeine Aussage des Uniformisierungs-
theorems keineswegs trivial ist. Es handelt sich im Gegenteil um ein tiefes mathematisches
Resultat.
Definition des Geschlechts: Unter dem Geschlecht der Kurve C versteht man das Geschlecht
p des Parameterraums T.28
(i) Ist T homöomorph zur Riemannschen Zahlenkugel, dann gilt p = 0 (Abb. 3.87a).
(ii) Ist T homöomorph zu einem Torus, dann hat man p = 1 (Abb. 3.87b).
(iii) Liegen nicht diese beiden Fälle vor, dann ist T homöomorph zu einer Fläche, die sich
aus der Riemannschen Zahlenkugel durch das Anbringen von p Henkeln ergibt. Dann ist p das
Geschlecht der Kurve (Abb. 3.87c).

a) p = 0 b) p = 1 c) p = 2

d) p = 2 Abb. 3.87 Geschlecht p

Kommentar: Das Geschlecht ist sinnvoll definiert, weil unterschiedliche Parametrisierungen


von der Art des Uniformisierungstheorems zu homöomorphen Parameterräumen T mit identi-
schem Geschlecht führen.
28
Ein allgemeines Resultat der Topologie besagt: Jede orientierbare zusammenhängende kompakte zweidimensionale
reelle Mannigfaltigkeit ist homöomorph zu einer Sphäre mit p Henkeln, wobei p das Geschlecht der Mannigfaltigkeit
heißt. Zwei derartige Mannigfaltigkeiten sind genau dann homöomorph, wenn sie das gleiche Geschlecht p besitzen.
Anschaulich sind zwei Flächen genau dann homöomorph, wenn sie durch eine gummiartige Verbiegung ohne auftretende
Risse ineinander übergehen (vgl. 17.2.1).
3.8 Algebraische Geometrie 231

 Beispiel 2: Die beiden Flächen in Abb. 3.87c) und d) sind homöomorph, d. h., sie gehen durch
eine gummiartige Verbiegung ineinander über, und besitzen deshalb das gleiche Geschlecht
p = 2.
Das Geschlecht Riemannscher Flächen wurde der Sache nach durch Riemann im Jahre 1857 in
seiner fundamentalen Arbeit über Abelsche Integrale eingeführt. Der Name Geschlecht wurde
erst sieben Jahre später von Clebsch geprägt.
Die fundamentale Invarianzeigenschaft des Geschlechts: Das Geschlecht einer Kurve
bleibt unter birationalen Transformationen unverändert.
Es gilt die Faustregel:

Je höher das Geschlecht einer algebraischen Kurve ist, um


so komplizierter ist ihre Struktur.

Beispiele zur Bestimmung des Geschlechts:


(i) Satz von Poincaré: Genau die rationalen Kurven besitzen das Geschlecht p = 0.
Dazu gehören die Geraden, die Kegelschnitte (Kurven zweiter Ordnung) und die Kurven
dritter Ordnung mit Singularitäten.
(ii) Genau die nichtsingulären Kurven dritter Ordnung besitzen das Geschlecht p = 1. Das
sind definitionsgemäß genau die elliptischen Kurven.
(iii) Eine nichtsinguläre Kurve C von n-ter Ordnung besitzt das Geschlecht

(n − 1)(n − 2)
p= , n=1,2, . . .
2

Die Eulercharakteristik χ von C ergibt sich aus der Beziehung

χ = 2 − 2p = 2 − (n − 1)(n − 2) .

(iv) Formel von Clebsch: Besitzt eine Kurve n-ter Ordnung nur Doppelpunkte und Spitzen als
Singularitäten, dann gilt für ihr Geschlecht

(n − 1)(n − 2)
p= −c−d, (3.67)
2

wobei d die Anzahl der Doppelpunkte und c die Anzahl ihrer Spitzen bezeichnet.
(v) Satz von Harnack: Eine (irreduzible) algebraische Kurve mit reellen Koeffizienten vom
Geschlecht p hat im Reellen nie mehr als p + 1 Komponenten.
 Beispiel 3: Es seien e1 , e2 und e3 reelle Zahlen mit e1 < e2 < e3 . Dann wird durch die Gleichung

y2 = ( x − e1 )( x − e2 )( x − e3 )

eine Kurve vom Geschlecht p = 1 gegeben, die aus p + 1 = 2 Komponenten besteht (Abb. 3.88).
 Beispiel 4: Besitzt eine Kurve C dritter Ordnung nur Doppelpunkte oder Spitzen, dann folgt
aus (3.67) die Ungleichung

p = 1−c −d ≥ 0,
232 3 Geometrie

e1 e 2 e3 x

Abb. 3.88

d. h., für C sind nur die folgenden drei Fälle möglich:


(i) keine Singularität p = 1.
(ii) ein Doppelpunkt und keine Spitze (p = 0).
(iii) eine Spitze und kein Doppelpunkt (p = 0).
 Beispiel 5: Die Versiera der Agnesi ist von dritter Ordnung und besitzt genau einen Doppel-
punkt, der auf der unendlich fernen Geraden liegt und der reellen Asymptote entspricht (Abb.
3.79). Deshalb gilt d = 1, c = 0 und p = 0.

3.8.6 Diophantische Geometrie


In der Mathematik und in den Naturwissenschaften gibt es keine unvollendeten
Symphonien. Über Jahrhunderte hinweg können thematische Problemkreise ihre
Dynamik behalten; im historischen Rückblick erscheinen dann lange, zusammen-
hängende Problemketten von einer faszinierenden Kontinuität des menschlichen
Denkens.
Hans Wussing, 1974
DIOPHANT ist eines der größten Rätsel in der Geschichte der Wissenschaft.
Wir wissen weder genau, zu welcher Zeit er gelebt hat, noch kennen wir seine
Wegbereiter, die auf demselben Gebiet gearbeitet haben.
Die Zeit, während er in Alexandria gelebt haben könnte, umfasst ein halbes Jahr-
tausend. In seinem Buch über Polygonalzahlen erwähnt Diophant mehrmals den
Mathematiker Hypsikles von Alexandria, der um die Mitte des 2. Jahrhunderts
v. Chr. lebte. Andererseits sind in den Kommentaren des Theon von Alexandria
zum Almagest des Astronomen Ptolemäus Auszüge aus den Werken Diophants
angeführt. Theon lebte um die Mitte des 4. Jahrhunderts n. Chr.
Isabella Baschmakowa, 1974

3.8.6.1 Elementare diophantische Gleichungen

Bei diophantischen Gleichungen interessiert man sich für ganzzahlige (oder rationale) Lösungen.
In diesem Abschnitt betrachten wir zunächst den Fall ganzzahliger Lösungen.
Lineare diophantische Gleichungen und der euklidische Algorithmus: Gegeben seien die
ganzen Zahlen a, b und c die nicht alle gleich null sind. Gesucht werden ganze Zahlen x und y
mit

ax + by = c .

Das ist eine lineare diophantische Gleichung.


3.8 Algebraische Geometrie 233

(i) Diese Gleichung ist genau dann lösbar, wenn der größte gemeinsame Teiler d von a und b
auch Teiler von c ist.
(ii) Die allgemeinste Lösung erhält man durch
cx0 − bg cy0 + ag
x= , y=
d d
mit einer beliebigen ganzen Zahl g. Ferner gilt x0 := αn sgn a und y0 := β n sgn b. Dabei benutzt
man zur Berechnung von αn , β n den euklidischen Algorithmus

r0 = q 0 r1 + r2 , ..., r n − 1 = q n − 1 r n + r n +1 , r n = q n r n +1

mit r0 := | a|, r1 := |b|; und man setzt

α0 := 0, β 0 := 1, α k : = β k −1 , β k : = α k −1 − q n − k β k −1 , k = 1, . . . , n .

 Beispiel 1: Die diophantische Gleichung

9973x − 2137y = 1

besitzt die allgemeine Lösung x = 3 + 2137g, y = 14 + 9973g mit einer beliebigen ganzen Zahl g.
Beweis: Der euklidische Algorithmus lautet

9973 = 4 · 2137 + 1425 ,


2137 = 1 · 1425 + 712 ,
1425 = 2 · 712 + 1 ,
712 = 712 · 1 .

Deshalb ist n = 3, q0 = 4, q1 = 1 and q2 = 2. Daraus folgt

α1 = 1, β 1 = −q2 = −2,
α2 = β 1 = −2, β 2 = α1 − q1 β1 = 3,
α3 = β 2 = 3, β 3 = α2 − q0 β2 = −14 ,

also x0 = α3 = 3, y0 = − β3 = 14.
Diese Lösungsmethode findet man bei indischen Astronomen im 6. Jahrhundert n. Chr.
Pythagoreische Zahlen: Wegen

32 + 42 = 52

ist jedes Dreieck mit den Seiten x = 3, y = 4 und z = 5 rechtwinklig. Diese Tatsache kann man
ausnutzen, um einen rechten Winkel zu konstruieren, was bereits den alten Ägyptern bekannt
war.
Interessanterweise entsprechen drei Saiten mit den Längenverhältnissen 3 : 4 : 5 dem Akkord
Grundton, Quarte und Sexte (Quartsextakkord).
Satz: Die quadratische diophantische Gleichung

x 2 + y2 = z2

besitzt die allgemeine Lösung

x = 2ab , y = a 2 − b2 , z = a 2 + b2
234 3 Geometrie

mit beliebigen natürlichen Zahlen a und b, 0 < b ≤ a, falls man sich auf natürliche Zahlen x, y, z
als Lösungen beschränkt, die zusätzlich teilerfremd sind.
Dieses Resultat war bereits vor etwa 3 500 Jahren der babylonischen Mathematik bekannt.
 Beispiel 2: Für a = 11, b = 10 erhalten wir die pythagoreischen Zahlen x = 220, y = 21, z =
221.
Die Fermatsche oder Pellsche Gleichung und Kettenbrüche: Es sei d > 0 eine natürliche
Zahl, die kein Quadrat einer Primzahl als Teiler hat. Gesucht werden natürliche Zahlen x und y,
die der Beziehung

x2 − dy2 = 1

genügen.
(i) Alle Lösungen ( xn , yn ) erhält man durch
√ √
x n + y n d = ( x1 + y1 d ) n , n = 2, 3, . . .

(ii) Die kleinste Lösung ( x1 , y1 ) ergibt sich in folgender Weise.



Die Zahl d besitzt eine Kettenbruchentwicklung der Periode k.
Sind p j /q j für j = 0, 1, . . . die entsprechenden Näherungsbrüche, dann ist

x1 = p k −1 , y1 = q k − 1 für gerades k

und

x1 = p2k−1 , y1 = q2k−1 für ungerades k.

Dieser Satz stammt von Lagrange (1736–1813), der Nachfolger von Euler an der Berliner Akade-
mie wurde und 1787 nach Paris zurückkehrte. Neben anderen großen französischen Persönlich-
keiten liegt er im Pantheon in Paris begraben.
 Beispiel 3: Für d = 13 hat man

x1 = 649 , y1 = 180 .

Allgemein sind die Lösungen x1 , y1 sehr unregelmäßig auf kleine und extrem große Werte
verteilt. Für d = 60 erhält man beispielsweise die Lösung x1 = 31, y1 = 4, während sich für den
Nachbarwert d = 61 die Lösung

x1 = 1 766 319 049 , y1 = 226 153 980

ergibt.

3.8.6.2 Rationale Kurvenpunkte und die Rolle des Geschlechts der Kurve

Das Grundproblem: Wir betrachten eine Gleichung

p( x, y) = 0 , (3.68)

wobei p ein Polynom in x und y darstellt. Entscheidend ist die Voraussetzung, dass die Koeffizi-
enten des Polynoms rationale Zahlen sind.

Gesucht werden alle rationalen Zahlen x und y die der Gleichung (3.68) genügen.
3.8 Algebraische Geometrie 235

Geometrische Interpretation: Fassen wir (3.68) als die Gleichung einer Kurve im R2 auf, die
wir diophantisch nennen, dann suchen wir alle rationalen Punkte, die auf dieser Kurve liegen.
Ein Punkt heißt genau dann rational, wenn seine Koordinaten x und y rationale Zahlen sind.
Die rationalen Punkte liegen zwar in der Ebene dicht, aber es gibt ungleich mehr nichtrationale
Punkte. Denn die Menge der rationalen Punkte ist nach Cantor (1845–1918) gleichmächtig zur
Menge der ganzzahligen Gitterpunkte der Ebene, während die Menge der nichtrationalen Punkte
zur gesamten Ebene gleichmächtig ist (vgl. 4.3.4.). Deshalb ist in keiner Weise anschaulich klar,
wieviel rationale Punkte eine komplizierte Kurve trifft. Man erwartet, dass das Geschlecht bei
der Lösung dieses Problems eine wichtige Rolle spielt, denn je größer das Geschlecht einer Kurve
ist, um so komplizierter ist ihre Struktur.
 Beispiel 1: Auf der Geraden

y=x

liegen unendlich viele rationale Punkte und unendlich viele irrationale Punkte, je nachdem ob x
rational oder irrational ist.
 Beispiel 2: Auf dem Kreis

x 2 + y2 = 1

liegen unendlich viele rationale Punkte.


Beweis (nach Diophant): Die Gerade y = m( x + 1) schneidet den Kreis für jeden rationalen
Anstieg in einem rationalen Punkt (Abb. 3.89).

−1 x

Abb. 3.89

Satz des Diophant: (i) Auf jeder diophantischen Geraden liegen unendlich viele rationale
Punkte.
(ii) Auf jedem diophantischen Kegelschnitt gibt es entweder keinen oder unendlich viele
rationale Kurvenpunkte.
Wir betrachten jetzt eine diophantische Kurve C von dritter Ordnung ohne singuläre Punkte,
d. h., das Geschlecht der Kurve ist gleich eins.
(iii) Sekantenmethode des Diophant: Liegen auf C zwei rationale Punkte, so schneidet deren
Verbindunsstrecke die Kurve C in einem dritten rationalen Kurvenpunkt (Abb. 3.90a).

a) b) Abb. 3.90
236 3 Geometrie

(iv) Tangentenmethode des Diophant: Liegt ein rationaler Punkt P auf C, dann schneidet die
Tangente durch P die Kurve C in einem weiteren rationalen Kurvenpunkt (Abb. 3.90b).29
Kommentar: Diese Resultate findet man anhand von Beispielen in der Arithmetica des Dio-
phant, dem ersten großen Werk über Zahlentheorie in der Geschichte der Mathematik. Dort
verwendet Diophant bereits positive und negative rationale Zahlen und führt die Symbole

ζ, Δυ̃ , K υ̃ , Δυ̃ Δ, ΔK υ̃ , K υ̃ K

ein, die unseren heutigen Symbolen x, x2 , x3 , x4 , x5 , x6 entsprechen.30


Entscheidende Fortschritte in der diophantischen Geometrie wurden erst 1901 in einer grund-
legenden Arbeit von Poincaré erzielt. Dieser löste das Problem vollständig für das Geschlecht
null. Für elliptische Kurven (p = 1) erkannte er als erster den tieferen Sinn der Sekanten- und
Tangentenmethode des Diophant, indem er entdeckte, dass sich dahinter die Gruppenstruktur
einer elliptischen Kurve verbirgt (vgl. (3.47)). Die Genialität der Methoden des Diophant zeigt
sich darin, dass die folgenden Sätze von Poincaré und Mordell; Universalität seiner Resultate für
Geschlecht p = 0 und p = 1 aufzeigen.
Die diophantischen birationalen Transformationen von Poincaré: Eine Transformation

x = f (ξ, η ), y = g( ξ, η )

heißt genau dann diophantisch rational, wenn f und g rationale Funktionen mit rationalen
Koeffizienten sind.
Ist diese Transformation umkehrbar und stellt auch die Umkehrfunktion eine diophantisch
rationale Transformation dar, dann sprechen wir von einer diophantisch birationalen Transfor-
mation.
Diophantische Äquivalenz: Zwei diophantische Kurven heißen genau dann äquivalent, wenn
zwischen ihren Punkten eine diophantisch birationale Transformation existiert.
Satz von Poincaré (1901) für das Geschlecht p = 0: (i) Jede diophantische Kurve vom
Geschlecht p = 0 von ungerader Ordnung ist zu einer diophantischen Geraden äquivalent.
Deshalb besitzt sie unendlich viele rationale Punkte.
(ii) Jede diophantische Kurve vom Geschlecht p = 0 von gerader Ordnung ist zu einem
diophantischen Kegelschnitt äquivalent und besitzt deshalb entweder keinen rationalen Punkt
oder unendlich viele rationale Punkte.
Poincaré vermutete ferner das folgende Resultat, das später von Mordell bewiesen wurde.
Satz von Mordell (1922) für das Geschlecht p = 1: Auf einer diophantischen elliptischen
Kurve (p = 1) gibt es entweder keinen rationalen Kurvenpunkt oder endlich viele rationale
Kurvenpunkte P1 , . . . , Pn , aus denen man durch sukzessive Anwendung der Sekanten- und
Tangentenmethode des Diophant alle rationalen Kurvenpunkte gewinnen kann.
In der Sprache der Gruppentheorie bedeutet dies, dass die additive Gruppe der elliptischen
Kurve von den Punkten P1 , . . . , Pn erzeugt wird, d. h., genau alle rationalen Kurvenpunkte erhält
man durch

P = m1 P1 + . . . + mn Pn

mit ganzen Zahlen m1 , . . . , mn . Die Addition ist dabei im Sinne von (3.47) zu verstehen.
29
In (iii) und (iv) hat man auch unendlich ferne Punkte von C zu berücksichtigen.
30
Das Symbol Δṽ ((für unseres heutiges x2 ) leitet sich von dem griechischen Wort Δύναμιζ (dynamis) her, was Kraft oder
Potenz bedeutet. Ferner steht die dritte Potenz K ṽ für K ύβoζ (kubos), was Würfel bedeutet.
Für Zahlen, unter denen Diophant immer nur rationale Zahlen versteht, benutzt er das Wort ὰριθμóζ (arithmos). Daraus
leitet sich die Bezeichnung Arithmetik her (Lehre von den Grundgesetzen des Rechnens mit Zahlen und Buchstaben ).
Die negativen Zahlen werden von Diophant mit λει̃ψιζ (leipsis), bezeichnet (Mangel oder Defekt ). Ferner führt
Diophant auch Symbole für unsere heutigen negativen Potenzen x −1 , . . . , x −6 ein.
3.8 Algebraische Geometrie 237

Das folgende Resultat wurde von Mordell 1922 vermutet und widerstand lange Zeit allen
Beweisversuchen.
Hauptsatz der diophantischen Geometrie von Faltings (1983) für das Geschlecht p ≥ 2:

Auf jeder diophantischen Kurve vom Geschlecht p ≥ 2


liegen höchstens endlich viele rationale Punkte.

Für dieses fundamentale Resultat erhielt Gerd Faltings (geb. 1954) auf dem Internationalen
Mathematikerkongress 1986 in Berkeley die Fieldsmedaille, die mit dem Nobelpreis vergleichbar ist.
Der Beweis von Faltings basiert wesentlich auf sehr abstrakten mathematischen Denkmethoden,
die erst in der Mitte des 20. Jahrhunderts geschaffen worden sind.

3.8.6.3 Die Fermatsche Vermutung

Das Zeitalter der modernen Mathematik beginnt mit vier großen französischen
Mathematikern: Girard Desargues (1591–1661), René Descartes (1596–1650),
Pierre de Fermat (1601–1665) und Blaise Pascal (1623–1662).
Ein gegensätzlicheres Quartett als diese vier ist nur schwer vorstellbar; Desar-
gues – der originellste, Architekt von Beruf – wird als verschrullter Sonderling
geschildert, der sein Hauptwerk in einer Art Geheimsprache verfasste und mit
mikroskopisch kleinen Lettern drucken ließ.
Descartes – der berühmteste – war zunächst Berufssoldat und konnte sich
notfalls mit dem Degen räuberischer Rheinschiffer erwehren; in der Manier
eines Berufssoldaten plante er auch seinen Generalangriff (Discours sur la
méthode) auf die Grundlegung der Wissenschaften.
Pascal – der genialste – wandte sich von der Mathematik ab und wurde zum
religiösen Schwärmer, der zeitlebens von Verstopfungen geplagt wurde.
Fermat schließlich – der bedeutendste – hatte als königlicher Hofrat am Parla-
ment von Toulouse eine Stellung inne, die man heute am ehesten mit der eines
höheren Verwaltungsbeamten vergleichen könnte. Entsprechend viel Muße hatte
er offenbar zur Beschäftigung mit der Mathematik . . .
Winfried Scharlau und Hans Opolka
Von Fermat bis Minkowski’, 1990 31

Fermat gehört zu den Mitbegründern der analytischen Geometrie und Wahrscheinlichkeits-


rechnung; seine Methoden zur Berechnung von Maxima und Minima sind Vorläufer der Diffe-
rentialrechnung von Newton und Leibniz. In Fermats Exemplar der Arithmetica des Diophant
findet sich folgende lateinische Randnotiz:
Cubum autem in duos eubos, aut quadrato-quadratum in duos quadrato-quadratos, et generaliter
nullam in infinitum ultra quadratum potesratem in duas ejusdem nominis fas est diuidere; ujus rei
demonstrationem mirabilem sane detexi. Hane marginis exiguitas non caperet.
In moderner Terminologie behauptet Fermat hier, dass die Gleichung

x n + y n = zn

31
Als eine sehr lebendig geschriebene Einführung in die Zahlentheorie mit vielen historischen Anmerkungen empfehlen
wir [Scharlau und Opolka 1990].
238 3 Geometrie

für n = 3, 4, . . . keine nichttriviale Lösung in ganzen Zahlen x, y und z besitzt. Weiter schreibt er,
dass er einen wunderbaren Beweis hierfür entdeckt hat, aber der Rand sei zu klein, um ihn zu
fassen. Diese Bemerkung stammt vermutlich aus der Zeit zwischen 1631 und 1637.
Euler bewies um 1760 die Fermatsche Vermutung für n = 3. Zwischen 1825 bis 1830 erledigten
Dirichlet und Legendre den Fall n = 4. Im Jahre 1843 schickte Kummer eine Arbeit an Dirichlet, in
der er behauptete, eine Lösung für alle n ≥ 3 gefunden zu haben. Dirichlet entdeckte jedoch einen
entscheidenden Fehler, der darin bestand, dass Kummer stillschweigend die Gültigkeit des Satzes
über die eindeutige Zerlegung in Primelemente für beliebige Zahlkörper voraussetzte, was nicht
richtig ist. Um seinen Fehler zu korrigieren, untersuchte Kummer intensiv die Teilbarkeitsgesetze
in Zahlkörpern und legte damit das Fundament für die spätere Idealtheorie Dedekinds. Mit
Hilfe seiner Teilbarkeitstheorie konnte Kummer zeigen, dass die Fermatsche Vermutung für alle
sogenannten regulären Primzahlen richtig ist, zum Beispiel für alle Primzahlen n < 100 außer
n = 37, 59 und 67. Im Jahre 1977 bewies Wagstaff unter Computereinsatz, dass die Fermatsche
Vermutung für alle Primzahlen 2 < p < 125 000 richtig ist. Die Fermatsche Vermutung ist
äquivalent zu der folgenden Aussage der diophantischen Geometrie: Auf der Kurve

x n + yn = 1

liegen für n ≥ 3 keine rationalen Punkte.


Der Satz von Wiles (1994): Die Fermatsche Vermutung ist richtig.

3.8.7 Analytische Mengen und der Vorbereitungssatz von Weierstraß

Analytische Mengen sind lokal die Nullstellengebilde von endlich vielen holomorphen Funktio-
nen.
Definition: Eine Teilmenge X des n-dimensionalen Raumes C n heißt genau dann analytisch,
wenn es zu jedem Punkt z0 ∈ X eine offene Umgebung U und endlich viele holomorphe
Funktionen f 1 , . . . , f k : U ⊆ C n −→ C gibt, so dass die Menge X ∩ U mit der Menge aller
Lösungen des Gleichungssystems

f 1 (z) = 0, . . . , f k (z) = 0 , z∈U

übereinstimmt.
Analytische Varietäten: Irreduzible analytische Mengen werden analytische Varietäten ge-
nannt.32
Da eine glatte komplexe Mannigfaltigkeit M lokal wie eine offene Menge in Cn aussieht,
überträgt sich der Begriff der analytischen Menge in natürlicher Weise auf M.
Das Faktorisierungsproblem: Die Gleichung

sin z = 0 ,
z∈C (3.69)
 
z2
besitzt wegen sin z = z 1 − + · · · die Faktorisierung
3!
zg(z) = 0 , z ∈ C,

mit g(0) = 0. Deshalb ist das Ausgangsproblem (3.69) in einer hinreichend kleinen Nullumge-
bung äquivalent zur viel einfacheren Gleichung z = 0.
32
Die Irreduzibilität von X bedeutet definitionsgemäß, dass eine disjunkte Zerlegung X = Y ∪ Z mit nichtleeren analytischen
Mengen Y und Z unmöglich ist.
3.8 Algebraische Geometrie 239

Allgemein suchen wir für eine Gleichung

f (z, t) = 0 , z ∈ C n −1 , t ∈ C, n≥2

eine Faktorisierung der Form

f (z, t) = p (z, t ) g( z, t) , g(0, 0) = 0 (3.70)

mit der in einer Nullumgebung holomorphen Funktion g : V ⊆ Cn −→ C und dem t-Polynom

p(z, t) := tk + ak−1 (z) tk−1 + . . . + a1 (z) t + a0 (z) , k ≥ 1.

Die Koeffizienten a1 , . . . , ak−1 sollen in einer Nullumgebung holomorph sein.


Vorbereitungssatz von Weierstraß: Es sei f : U ⊆ Cn −→ C eine in einer Nullumgebung
holomorphe Funktion, wobei die Funktion w = f (0, t) eine Potenzreihe darstellt, die mit dem
Term tk beginnt. Dann existiert eine eindeutig bestimmte Faktorisierung der Gestalt (3.70).

3.8.8 Die Auflösung von Singularitäten

Gegeben sei eine analytische Menge in C n mit einer isolierten Singularität im Punkt z = 0. Wir
suchen eine lokale Parameterdarstellung

z = π (t) , t∈T

der Menge X, wobei der Parameterraum T keine Singularitäten besitzen soll. Mit S := π −1 (0)
bezeichnen wir die kritische Parametermenge.
Der lokale Uniformisierungssatz von Hironaka (1964):33 Es existiert eine Parametrisierung
π : T −→ X mit den folgenden Eigenschaften:
(i) Der Parameterraum T ist eine glatte komplexe Mannigfaltigkeit.
(ii) π ist eine holomorphe und eigentliche34 Abbildung von T auf eine Nullumgebung von X.
(iii) Die Abbildung π : T \S −→ X \{0} ist biholomorph.
(iv) Die kritische Parametermenge S ist eine analytische Menge in T der Kodimension 1, d. h.,
dim S = dim T − 1.
Man bezeichnet π : T −→ X als eine Auflösung der Singularität im Nullpunkt.
Das Aufblasen einer Singularität: Bei ihrer Auflösung wird eine Singularität endlich oft auf-
geblasen.35 Diesen für die algebraische Geometrie fundamentalen Prozess wollen wir anschaulich
an einem einfachen Beispiel erläutern.
 Beispiel (Abb. 3.91): Wir betrachten die Kurve

X : x 2 − y2 = 0 , ( x, y ) ∈ C2 , (3.71)

mit dem Doppelpunkt P = (0, 0).


33
Für seine fundamentalen Ergebnisse über die lokale und globale Uniformisierung von Varietäten erhielt der japanische
Mathematiker Heisuke Hironaka (geb. 1931) im Jahre 1970 die Fieldsmedaille.
34
Eine eigentliche Abbildung besitzt die wichtige Eigenschaft, dass die Urbilder kompakter Mengen wieder kompakt sind.
35
Im Englischen benutzt man das Wort blowing up.
240 3 Geometrie

f Π
⇐= ⇐= GP
P gP

g− g+ g− g+

a) Kurve mit b) Aufblasen des c) abheben


Doppelpunkt Doppelpunkts Abb. 3.91

1. Schritt: Wir blasen den Doppelpunkt P zur Geraden gP auf (Abb. 3.91b). Das geschieht
durch die Parametrisierung

( x, y) = f (u, v), (u, v) ∈ C (3.72)

mit f (u, v) := (v, uv ). Aus (3.71) entsteht

v2 (1 − u2 ) = 0 , (u, v) ∈ C2 .

Das ergibt die Geraden, g± : u = ±1 und die Gerade g P : v = 0.


Die Geraden g+ und g− (bzw. die Gerade gP ) gehen durch die Abbildung (3.72) in die beiden
Geraden von X (bzw. in den Doppelpunkt P) über.
2. Schritt: Wir heben die Gerade g P im dreidimensionalen Raum nach oben ab und erhalten
daraus die Gerade GP (Abb. 3.91c). Analytisch kann man zum Beispiel folgende Wahl treffen:

GP := ((u, v, w) ∈ C3 : v = 0, w = 1) , g± := {(u, v, w) ∈ C3 : u = ±1, w = 0} .

3. Schritt – Konstruktion der Auflösung: Als Parameterraum T wählen wir die Vereinigung der
drei sich nicht schneidenden Geraden g+ , g− und GP . Die Auflösungsabbildung π : T −→ X ergibt
sich in einfacher Weise durch

proj f
π : T −→ C2 −→ X

mit der Projektionsabbildung Π( u, v, w) := (u, v).


Im vorliegenden einfachen Beispiel könnte man die Auflösung sofort durch Abheben einer
Kurve in den dreidimensionalen Raum bewerkstelligen (Abb. 3.92). Der Vorteil der oben be-
nutzten Idee des Aufblasens einer Singularität besteht darin, dass sie sich zu einer universellen
Konstruktion ausbauen lässt.

Abb. 3.92
3.8 Algebraische Geometrie 241

3.8.9 Die Algebraisierung der modernen algebraischen Geometrie

Die algebraische Geometrie hat sich in Wellen entwickelt, jede mit ihrer eigenen
Sprache und Philosophie. In der zweiten Hälfte des 19. Jahrhunderts hatte man
den funktionentheoretischen Zugang von Riemann, den mehr geometrischen Zu-
gang von Brill und Noether und den rein algebraischen Zugang von Kronecker,
Dedekind und Weber. Es folgte die italienische Schule mit Castelnuovo, Enriques
und Severi, die in der Theorie der klassischen algebraischen Flächen gipfelte. In
der ersten Hälfte des 20. Jahrhunderts gab die „amerikanische Schule“ mit Chow,
Weil und Zariski den auf Intuition beruhenden Argumenten der italienischen
Schule eine feste algebraische Basis. Kürzlich haben Serre und Groehendieck die
französische Schule initiiert, die die Grundlagen der algebraischen Geometrie
in der Sprache der Schemata und der Kohomologie neu geschrieben und eine
beeindruckende Reihe von alten Problemen mit der neuen Technik gelöst hat.

Robin Hartshorne (1977),


University of California Berkeley

Die moderne algebraische Geometrie ist stark algebraisiert. Diese sehr fruchtbare Entwick-
lungstendenz zeichnete sich bereits in der zweiten Hälfte des 19. Jahrhunderts ab. Kummer
(1810–1893) entwickelte im Zusammenhang mit Teilbarkeitsfragen in Zahlkörpern und seinen
damit verbundenen Lösungsversuchen für das Fermatsche Problem die Theorie idealer Zahlen,
aus der heraus die Idealtheorie Dedekinds entstand. Ferner entdeckten Dedekind (1831–1916)
und Weber (1843–1913) eine rein körpertheoretische Formulierung des tiefliegenden Satzes von
Riemann–Roch und legten damit dessen algebraischen Kern bloß.36 Hilbert (1862–1943) stellte
Ende des 19. Jahrhunderts das visionäre Programm auf, die gut ausgearbeiteten kontinuierlichen
Methoden der Analysis so zu fassen, dass sie sich auch weitgehend auf diskrete Strukturen der
Zahlentheorie und auf die mit Singularitäten behafteten Objekte der algebraischen Geometrie
anwenden lassen. An der Verwirklichung dieses Programms wurde im 20. Jahrhundert intensiv
gearbeitet. Zentral ist dabei die Sprache der Schemata, die von dem französischen Mathematiker
Alexandre Grothendieck um 1960 eingeführt wurde und die sich als sehr erfolgreich bei der
Lösung schwieriger Probleme erwies. Schemata basieren auf dem Garbenbegriff, der um 1945
von dem französischen Mathematiker Jean Leray ersonnen wurde.
Als eine elementare Einführung in die moderne algebraische Geometrie (ohne Beweise, aber
mit ausführlicher Motivation, vielen Beispielen und Abbildungen) empfehlen wir K. Smith et
al., An Invitation to Algebraic Geometry, Springer, New York (2000). Dort findet man auch
das fundamentale Uniformisierungstheorem von Hironaka aus dem Jahr 1964: Jedes projektive
Varietät ist birational äquivalent zu einer glatten projektiven Mannigfaltigkeit. (Grob gesprochen
besagt dieses Theorem, dass man durch eine geeignete Transformation die Singularitäten der
Varietät beseitigen kann.
Den Zusammenhang zwischen der klassischen algebraischen Geometrie und der modernen
Theorie der Schemata findet man in dem zweibändigen Lehrbuch [Shafarevich 1994].

36
Der Satz von Riemann-Roch und seine moderne Verallgemeinerung durch Hirzebruch (1927–2012) zum Satz von Riemann-
Roch-Hirzebruch ergeben sich aus dem Atiyah-Singer-Indextheorem, das zu den tiefsten Ergebnissen der Mathematik
des 20. Jahrhunderts gehört. Dieser Problemkreis wird in Kapitel 19 dargestellt.
242 3 Geometrie

3.9 Geometrien der modernen Physik

Die Anschauungen über Raum und Zeit, die ich Ihnen hier entwickeln möchte,
sind auf experimentell-physikalischem Boden erwachsen. Darin liegt ihre Stärke.
Ihre Tendenz ist eine radikale.
Von Stund an sollen Raum für sich und Zeit für sich völlig zu Schatten
herabsinken, und nur noch eine Art Union der beiden soll Selbständigkeit
bewahren.
Hermann Minkowski,
Tagung der Gesellschaft deutscher Naturforscher
und Ärzte in Köln im Jahre 1908
Die moderne Physik wird in der Sprache der Geometrie formuliert. Die physikalischen Erschei-
nungen entsprechen geometrischen Objekten. Die Beschreibung physikalischer Beobachtungen
in unterschiedlichen Bezugssystemen erfolgt durch die Koordinaten der geometrischen Objekte
in unterschiedlichen Koordinatensystemen.

3.9.1 Grundideen

Pseudounitäre Geometrie und Relativitätstheorie: Die Geometrisierung der Physik geht


auf Minkowski zurück, der 1908 die drei Jahre zuvor von Einstein geschaffene spezielle Relativi-
tätstheorie als eine pseudounitäre Geometrie der vierdimensionalen Raum-Zeit-Mannigfaltigkeit
interpretierte und zeigte, dass die von Einstein benutzten Lorentztransformationen zwischen
Inertialsystemen die Symmetriegruppe der Geometrie des Minkowskiraumes bilden.
Die Einsteinsche Gravitationstheorie (allgemeine Relativitätstheorie) aus dem Jahre 1915 geome-
trisiert die Gravitationskraft, die der Krümmung der vierdimensionalen pseudo-Riemannschen
Raum-Zeit-Mannigfaltigkeit entspricht. Liegt keine Krümmung vor, dann ergibt sich der Min-
kowskiraum.
Unitäre Geometrie und Quantentheorie: Die moderne Quantenmechanik wurde 1925 von
Heisenberg (1901–1976) als Matrizenmechanik und 1926 von Schrödinger (1887–1961) als Wel-
lenmechanik geschaffen. Im Jahre 1928 entwickelte Dirac (1902–1984) einen mathematischen
Formalismus, der zeigte, dass die Matrizenmechanik und die Wellenmechanik nur unterschiedli-
che Darstellungen der gleichen abstrakten Hilbertraumtheorie sind. Zur gleichen Zeit erkannte
John von Neumann (1903–1957) dass sich die Quantenmechanik als streng mathematische
Theorie für selbstadjungierte Operatoren in einem Hilbertraum formulieren lässt. Das Spek-
trum des Energieoperators (Hamiltonoperators) ist identisch mit den möglichen Energiewerten
des Quantensystems. Die Heisenbergsche Unschärferelation besagt, dass man Ort und Im-
puls (Geschwindigkeit) eines Teilchens nicht gleichzeitig beliebig genau messen kann. Diese
fundamentale Tatsache der Quantentheorie ist geometrischen Ursprungs. Sie folgt aus einer
unendlichdimensionalen Version der Tatsache. dass für das Skalarprodukt

ab = |a| |b| cos γ

im dreidimensionalen Raum wegen | cos γ| ≤ 1 stets die Schwarzsche Ungleichung

|ab| ≤ |a| |b|

folgt (vgl. 13.18). Hinter der Quantentheorie verbirgt sich die unitäre Geometrie von Hilberträu-
men.
Spingeometrie, Cliffordalgebren und der Elektronenspin: Um die experimentell beobach-
tete Aufspaltung der Spektrallinien von Atomen in Magnetfeldern zu deuten, postulierten
3.9 Geometrien der modernen Physik 243

Uhlenbeck und Goudsmit im Jahre 1925 die Existenz eines Eigendrehimpulses der Elektronen,
den sie Spin nannten.37 Drei Jahre später formulierte Dirac seine berühmte Grundgleichung für
das relativistische Elektron mit Hilfe der zur Minkowskimetrik gehörigen Cliffordalgebra. Aus
der Diracgleichung ergibt sich der Elektronenspin in sehr natürlicher Weise; dieser Spin stellt
somit einen relativistischen Effekt dar (vgl. 14.8.3). Im engen Zusammenhang mit dem Spinfor-
malismus steht die Spingeometrie, die elegant mit Hilfe der inneren Algebra (Cliffordalgebra)
von Vektorräumen beschrieben werden kann.
Die einfachste Spingeometrie ergibt sich mit Hilfe der Cliffordalgebra eines Hilbertraumes.
Diese Geometrie ist die Invariantentheorie der Spingruppe Spin( n). Speziell gilt

Spin(3) = SU (2),

und diese Gruppe beschreibt den Elektronenspin.


Cliffordalgebren spielen auch eine zentrale Rolle bei der Formulierung des modernen Standard-
modells der Elementarteilchen, das die elektromagnetische starke und schwache Wechselwirkung
im Rahmen einer Eichfeldtheorie miteinander vereint.
Symplektische und klassische Mechanik: Die symplektische Geometrie basiert auf schief-
symmetrischen „Skalarprodukten“. Diese Geometrie steht hinter der klassischen geometrischen
Optik, der klassischen Mechanik (z. B. Himmelsmechanik) und der klassischen statistischen
Physik von Gibbs.
Kähler-Geometrie und Stringtheorie:

Die Bedeutung der Kähler-Geometrie besteht darin, dass sie eine Synthese
aus symplektischer Geomertie und unitärer Geometrie darstellt.

Diese Geometrie, die ihre Wurzeln in einer Arbeit von Erich Kähler (geb. 1906) aus dem Jahre 1932
hat, wird entscheidend in der modernen Stringtheorie genutzt, die es sich zum Ziel setzt, eine
einheitliche Theorie für alle fundamentalen Wechselwirkungen in der Natur zu schaffen, wobei
im Gegensatz zum Standardmodell der Elementarteilchen auch die Gravitation berücksichtigt
wird (vgl. 19.13). Dabei spielen der Satz von Yau und die damit im Zusammenhang stehenden
Calabi-Yau-Räume als Zustandsräume der Strings eine fundamentale Rolle (vgl. 19.10.4).
Konforme Geometrie: Hinter der klassischen komplexen Funktionentheorie steht eine kon-
forme Geometrie, weil die biholomorphen Abbildungen konform (winkeltreu) sind. Die Gruppe
aller biholomorphen Abbildungen der Riemannschen Zahlenkugel auf sich ist die automorphe
Gruppe, die aus allen Möbiustransformationen besteht.
Die eigentliche Lorentzgruppe SO+ (3, 1) lässt sich durch die Gruppe SL(2, C ) der komplexen
(2 × 2)-Matrizen mit Determinante gleich eins beschreiben. Diese Gruppe ist isomorph zur
Untergruppe aller Möbiustransformationen, die die obere Halbebene konform auf sich abbilden.
Meromorphe Funktionen, die gegenüber diskreten Untergruppen der automorphen Gruppe inva-
riant sind, heißen automorphe Funktionen. Das ist eine außerordentlich wichtige Funktionenklasse,
die zum Beispiel die elliptischen Funktionen umfasst und bei der Berechnung (Uniformisierung)
Abelscher Integrale auftritt.
Der mathematische Reichtum der Stringtheorie beruht darauf, dass diese Theorie invariant ist
unter konformen Transformationen (konforme Quantenfeldtheorie) und dass auf zweidimensio-
nalen Riemannschen Mannigfaltigkeiten die Gruppe der konformen Transformationen besonders
groß ist im Vergleich zu höheren Dimensionen.
37
Das englische Wort spin bedeutet Drall.
244 3 Geometrie

Infinitesimale Symmetrien: Linearisiert man die Symmetriegruppe G einer Geometrie in


einer Umgebung der identischen Transformation, dann erhält man in der Sprache der Physiker
sogenannte infinitesimale Symmetrien. In der Sprache der Mathematik sind infinitesimale
Symmetrien genau die Elemente der Liealgebra L ( G ) der Liegruppe G.
Das wichtigste Resultat der von Sophus Lie (1842–1899) geschaffenen Theorie der Liegruppen
besagt:

Die Liealgebra L ( G ) enthält alle Informationen über das Verhalten der Lie-
gruppe G in einer Umgebung des Einheitselements.

Global können jedoch mehrere Liegruppen zur gleichen Liealgebra gehören. Der kanonische
Vertreter aller dieser Liegruppen ist die universelle Überlagerungsgruppe einer Liealgebra, die
einfach zusammenhängend ist (vgl. 17.5.3).
 Beispiel: (i) Die universelle Überlagerungsgruppe zur Gruppe SO(3) aller Drehungen im
dreidimensionalen Raum ist die für den Elektronenspin verantwortliche Gruppe SU (2).
(ii) Die universelle Überlagerungsgruppe zu SO( n) ist für n ≥ 3 die Spingruppe Spin(n ) mit
Spin(3) = SU (2).
(iii) Die universelle Überlagerungsgruppe zur Gruppe SO+ (3, 1) aller eigentlichen Lorentz-
transformationen ist die Gruppe SL(2, C ).
Mannigfaltigkeiten: In diesem Abschnitt betrachten wir die für die moderne Physik relevanten
Geometrien auf linearen Räumen (lineare Mannigfaltigkeiten). Diese Geometrien sind alle mit
Bilinearformen verbunden, die man als verallgemeinerte Skalarprodukte ansehen kann.
Entscheidend für die Physik sind jedoch die nichtlinearen Versionen dieser Geometrien auf
Mannigfaltigkeiten.

Eine Mannigfaltigkeit ist ein globales geometrisches Objekt, das lokal wie ein
linearer Raum aussieht. Dadurch lassen sich alle Geometrien linearer Räume
auf Mannigfaltigkeiten übertragen.38

Beim Begriff der Mannigfaltigkeit denke man an die gekrümmte Erdoberfläche, die sich lokal
auf den ebenen Karten eines geographischen Atlasses darstellen lässt.
Die mathematische Effektivität der Natur: Eine Beobachtung drängt sich beim Studium der
in der modernen Physik vorkommenden Geometrien sofort auf. Rein mathematisch existiert
eine ungeheure Fülle von Symmetriegruppen (Liegruppen und Liealgebren), zu denen nach
dem Erlanger Programm von Felix Klein Geometrien gehören. Bis heute fehlt eine vollständige
Klassifikation aller dieser möglichen Symmetrien. Nach unserer gegenwärtigen Kenntnis rei-
chen jedoch bereits sehr einfache Symmetrien aus, um fundamentale Phänomene der Natur
mathematisch zu beschreiben. Das sind die folgenden Gruppen:

SL(2, C ) (Relativitätstheorie) ,
U (1) (Elektromagnetismus) ,
SU (2) (Elektronenspin) ,
SU (3) (Aufbau des Protons aus drei Quarks) ,
U (1) × SU (2) × SU (3) (Standardmodell der Elementarteilchen) .

38
Das findet man in den Kapiteln 15 bis 19. Insbesondere wird das fundamentale Prinzip Kraft = Krümmung ausführlich in
14.9. diskutiert.
3.9 Geometrien der modernen Physik 245

Der Physiker und Nobelpreisträger Eugene Wigner (1902–1995), der lange Zeit in Princeton
(USA) gewirkt hat, sprach in diesem Zusammenhang einmal sehr pointiert von der unvernünftig
hohen Effizienz der Mathematik.
Konvention: Im folgenden betrachten wir nur endlichdimensionale lineare Räume X über K mit

dim X = n .

Die Elemente von X nennen wir Vektoren. Es sei K = R (Körper der reellen Zahlen) oder K = C
(Körper der komplexen Zahlen).
Die Vision von Leibniz: Entsprechend einer Forderung von Leibniz (1646–1716) arbeitet
man in der modernen Geometrie direkt mit den geometrischen Objekten und vermeidet nach
Möglichkeit den Gebrauch von Koordinaten. Nur so ist es möglich, die meisten der folgenden
Aussagen auf unendlichdimensionale Räume zu verallgemeinern, die in der Physik Systeme mit
unendlich vielen Freiheitsgraden beschreiben. Das findet man im Rahmen der Funktionalanalysis
in Kap. 11ff.

3.9.2 Unitäre Geometrie, Hilberträume und Elementarteilchen

Die unitäre Geometrie basiert auf dem Begriff des positiv definiten Skalarprodukts, welches das
klassische Skalarprodukt uv für Vektoren u und v verallgemeinert (vgl. 1.8.3.). Alle wichtigen
Begriffe der unitären Geometrie erlauben, wie wir sehen werden, eine direkte physikalische
Interpretation im Quarkmodell der Elementarteilchen.
Definition: Unter einem unitären Raum verstehen wir einen linearen Raum über K, auf dem
ein Skalarprodukt gegeben ist. Das bedeutet, jedem Vektorpaar u, v ∈ X wird eine Zahl (u, v) ∈ K
zugeordnet, so dass für alle u, v, w ∈ X und alle α, β ∈ K gilt:
(i) (u, u) ≥ 0 ; (u, u) = 0 genau dann, wenn u = 0 ;
(ii) (w, αu + βv) = α(w, u) + β(w, v ) ;
(iii) (u, v ) = (v, u ) .
Aus (ii) und (iii) folgt

(αu + βv, w) = α(u, w ) + β(v, w ) fr alle u, v, w ∈ X , α, β ∈ K .

Dabei bezeichnet α die konjugierte komplexe Zahl zu α, d. h., im Falle eines reellen Raumes
K = R kann man überall die Querstriche weglassen.
Hilbertraum: Jeder endlichdimensionale unitäre Raum ist zugleich ein Hilbertraum im Sinne
der allgemeinen Definition, die man in 11.2.5 findet.
Der adjungierte Operator: Ist A : X −→ X ein linearer Operator, dann ordnen wir ihm in
eindeutiger Weise einen linearen Operator A∗ : X −→ X zu, welcher der Relation

(u, Av) = ( A∗ u, v)

für alle u, v ∈ X genügt. Wir nennen A∗ den adjungierten Operator zu A.


Die unitäre Gruppe U (n, X ): Ein Operator U : X −→ X heißt genau dann unitär, wenn er
das Skalarprodukt invariant lässt, d. h., U ist linear, und es gilt

(Uv, Uw) = (v, w)


246 3 Geometrie

für alle v, w ∈ X. Alle unitären Operatoren auf X bilden eine Gruppe, die man die unitäre
Gruppe U (n, X ) nennt. Alle Operatoren in U ( n, X ) mit
det U = 1
bilden eine Untergruppe von U ( n, X ), die wir mit SU (n, X ) bezeichnen und spezielle unitäre
Gruppe nennen. Ein linearer Operator U : X −→ X gehört genau dann zu U ( n, X ), wenn

UU ∗ = U ∗ U = I.

gilt. Im Falle eines reellen Raumes X schreiben wir O(n, X ) (bzw. SO(n, X )) anstelle von U ( n, X )
((bzw. SU (n, X )) und sprechen von der orthogonalen Gruppe (bzw. der speziellen orthogonalen
Gruppe).39
 Beispiel 1: Die auf einen festen Ursprungspunkt O bezogenen Ortsvektoren u, v des dreidi-
mensionalen Raumes unserer Anschauung bilden einen reellen, dreidimensionalen Hilbertraum
H mit dem üblichen Skalarprodukt

(u,v) = uv

(Abb. 3.93). Die Gruppe SO(3, H ) besteht aus allen Drehungen um den Punkt O. Nimmt man
noch die Spiegelung u → −u am Punkt O hinzu, dann erhält man die Gruppe O(3, H )

v
O
Abb. 3.93

Unitäre Geometrie: Eine Eigenschaft gehört genau dann zur unitären Geometrie des Hilbert-
raumes X, wenn sie unter den Operatoren der Gruppe U (n, X ) invariant ist. Alle folgenden
Eigenschaften gehören zur unitären Geometrie. Eine Ausnahme bildet das Volumen, das nur
unter orientierungstreuen Abbildungen invariant ist.
Die unitäre Geometrie verallgemeinert die anschauliche Situation von Beispiel 1 auf beliebige
Dimensionen.
Orthogonalität: Zwei Vektoren u, v ∈ X heißen genau dann orthogonal, wenn

(u, v) = 0

gilt. Ist L ein linearer Unterraum von X, dann bezeichnen wir mit L⊥ das orthogonale Komplement
von L. Definitionsgemäß hat man
L⊥ := {w ∈ X | (v, w ) = 0 fr alle v ∈ L} .
Für einen beliebigen Vektor u ∈ X existiert die eindeutige Zerlegung

u = v+w, v ∈ L , w ∈ L⊥ .

39
Die Gruppen U (n, X ), SU (n, X ), O (n, X ) und SO(n, X ) sind reelle kompakte Liegruppen mit den Dimensionen
dim U (n, X ) = n2 , dim SU (n, X ) = n2 − 1 ,
n( n − 1)
dim O(n, X ) = dim SO(n, X ) = .
2
Diese Dimensionen geben an, von wieviel reellen Parametern diese Gruppen abhängen (vgl. 17.1).
3.9 Geometrien der modernen Physik 247

insbesondere ist X = L ⊕ L⊥ , und es gilt die Dimensionsformel

dim L + dim L⊥ = dim X .

Länge und Abstand: Jedem Vektor u ∈ X ordnen wir die Länge ||u|| zu, d. h., wir setzen

||u|| := (u, u) .

Es gilt genau dann ||u|| > 0, wenn u = 0. Ferner ist ||u|| = 0 für u = 0. Die Zahl

d(u, v) := ||u − v||

heißt der Abstand zwischen den Vektoren u und v. Mit diesem Abstandsbegriff wird jeder
Hilbertraum zu einem metrischen Raum.
Winkel: Zu zwei Vektoren u, v ∈ X in dem reellen Hilbertraum X gehört definitionsgemäß der
durch die Beziehung

(u, v)
cos α = , 0 ≤ α ≤ π.
||u|| ||v||
eindeutig definierte Winke α zwischen u and v. Dabei sei u = 0 und v = 0. In einem beliebigen
reellen oder komplexen Hilbertraum X hat man die Schwarzsche Ungleichung

|(u, v)| ≤ ||u|| ||v|| für alle u, v ∈ X .

Orthonormalbasis: Die n Vektoren e1 , . . . , en in X heißen genau dann eine Orthonormalbasis


des Hilbertraumes X, wenn gilt:

(e j , ek ) = δjk , j, k = 1, . . . , n .

Dann hat man für jeden Vektor u ∈ X die Fourierentwicklung


n
u= ∑ uj ej (3.73)
j =1

mit den Fourierkoeffizienten

u j := (e j , u) .

Das Tupel ( u1 , . . . , un ) bildet definitionsgemäß die kartesischen Koordinaten von u bezüglich


e1 , . . . , e n .
Basissatz: Jeder Hilbertraum besitzt eine Orthonormalbasis.
Konstruktion von unitären Operatoren: Sind e1 , . . . , en und e1 , . . . , en zwei beliebige ortho-
normale Basen des Hilbertraums X, dann wird durch

Ue j := ej , j = 1, . . . , n (3.74)

und lineare Fortsetzung ein unitärer Operator U : X −→ X definiert. Auf diese Weise kann man
alle unitären Operatoren auf X erhalten.
248 3 Geometrie

Satz 1: Ein linearer Operator U : X −→ X ist genau dann unitär, wenn er jede Orthonormal-
basis wieder in eine Orthonormalbasis abbildet.
Orientierung: Wir orientieren den reellen Hilbertraum X, indem wir eine feste Orthonormal-
basis e1 , . . . , en auszeichnen und die Volumenform

μ := dx1 ∧ dx2 ∧ . . . ∧ dx n

definieren. Dabei ist dx j : X −→ R eine lineare Abbildung mit dx j ( ek ) = δjk für alle j, k = 1, . . . , n.
Ist b1 , . . . , bn eine beliebige Basis X, dann nennen wir die Zahl

α := sgn μ( b1 , . . . , bn )

die Orientierung der Basis. Es ist stets α = 1 (positive Orientierung) oder α = −1 (negative
Orientierung).
Satz 2: (i) Für eine beliebige orthonormierte Basis e1 , . . . , en gilt

μ = αdx  ∧ dx  ∧ . . . ∧ dx  ,
1 2 n

d. h., die Definition der Volumenform μ hängt nur von der Orientierung des Hilbertraumes ab.
(ii) Eine unitäre Transformation U ist genau dann orientierungserhaltend, wenn det U = 1 gilt,
d. h., es ist U ∈ SO(n, X ).
Volumen: Es sei G ein beschränktes Gebiet in dem reellen orientierten Hilbertraum X. Das
Volumen von G wird durch

Vol (G ) := μ
G

erklärt. Um diese Formel zu interpretieren, benutzen wir die Zerlegung (3.73). Mit G bezeichnen
wir die Menge aller kartesischen Koordinaten ( x1 , . . . , xn ) der Punkte in G. Dann erhalten wir
die klassische Formel
 
μ= dx1 dx2 . . . dxn .
G G

Dieses Volumen hängt nur von der Wahl der Orientierung des Hilbertraums X ab. Bei einem
Orientierungswechsel ändert das Volumen sein Vorzeichen.
Ist U : X −→ X ein Operator aus O( n, X ), dann gilt

Vol (U G ) = ( sgn U ) Vol (G )

mit sgn U = ±1 und sgn U = 1 if U ∈ SO( n, X ).


Infinitesimale unitäre Operatoren und die Liealgebra u(n, X ): Ein Operator A : X −→ X
heißt genau dann infinitesimal unitär, wenn er linear ist und die Beziehung

(u, Av) = −( Au, v) für alle u, v ∈ X

gilt. Das ist äquivalent zu A∗ = − A. Alle diese Operatoren bilden definitionsgemäß die Menge
u(n, X ). Genau alle Operatoren A ∈ u( n, X ) mit tr A = 0 (Spur gleich null) gehören definitions-
gemäß zur Menge su(n, X )
3.9 Geometrien der modernen Physik 249

Ist X ein reeller Hilbertraum, dann bezeichnen wir u (n, X ) (bzw. su( n, X )) mit o ( n, X ) (bzw.
mit so (n, X )).
Satz 3: Es sei X ein komplexer Hilbertraum mit dim X = n.
(i) Bezüglich der Lieklammer

[ A, B] := AB − BA (3.75)

und der üblichen Linearkombination αA + βB, α, β ∈ R von linearen Operatoren wird u( n, X )


zu einem reellen Vektorraum und zu einer Liealgebra mit dim u (n, X ) = n2 .
Ferner ist su( n, X ) eine Lieunteralgebra von u( n, X ) mit dim su(n, X ) = n2 − 1.
(ii) Aus A ∈ u(n, X ) folgt exp( A) ∈ U ( n, X ). Umgekehrt gibt es eine Zahl ε > 0 so dass für
jedes U ∈ U (n, X ) mit || I − U || < ε genau ein Operator A ∈ u( n, X ) existiert, so dass

U = eA (3.76)

gilt, d. h., A = ln U.
(iii) Aus A ∈ su( n, X ) folgt exp( A) ∈ SU ( n, X ). Umgekehrt gibt es eine Zahl ε > 0 so dass
für jedes U ∈ SU ( n, X ) mit || I − U || < ε genau ein Operator A ∈ su(n, X ) existiert, welcher der
Gleichung (3.76) genügt.
Die Aussagen (ii) (bzw. (iii)) bedeuten, dass u( n, X ) (bzw. su( n, X )) die Liealgebra der Liegrup-
pe U (n, X ) (bzw. SU ( n, X )) darstellt (vgl. 17.5.2).
Satz 4: Es sei X ein reeller Hilbertraum mit dim X = n.
(i) Bezüglich der Lieklammer (3.75) wird o (n, X ) zu einem reellen Vektorraum und einer
Liealgebra mit dim o ( n, X ) = n(n − 1)/2.
Ferner ist so ( n, X ) eine Lieunteralgebra von o (n, X ) mit dim so( n, X ) = n(n − 1)/2.
(ii) Aus A ∈ o ( n, X ) folgt exp( A) ∈ O(n, X ). Umgekehrt gibt es eine Zahl ε > 0, so dass für
jedes U ∈ O( n, X ) mit || I − U || < ε genau ein Operator A ∈ o ( n, X ) existiert, so dass U = exp( A)
gilt.
(iii) Aus A ∈ so ( n, X ) folgt exp( A) ∈ SO(n, X ). Umgekehrt gibt es eine Zahl ε > 0 so dass
für jedes U ∈ SO(n, X ) mit || I − U || < ε genau ein Operator A ∈ so (n, X ) existiert, so dass
U = exp( A) gilt.
Nach (ii) (bzw. (iii)) ist o (n, X ) (bzw. so ( n, X )) die Liealgebra der Liegruppe O( n, X )
(bzw. SO(n, X )).
Konstruktion eines Hilbertraums: Es sei e1 , . . . , en eine Basis des linearen Raumes X. Wir
definieren

(e j , ek ) := δjk für alle j, k . (3.77)

Auf diese Weise wird X zu einem Hilbertraum mit der Orthonormalbasis e1 , . . . , en . Explizit gilt

(u, v) = x1 y1 + x2 y2 + . . . + x n yn ,

wobei ( x j ) bzw. ( y j ) die kartesischen Koordinaten von u bzw. v bezeichnen.


Auf diese Weise wird jeder lineare Raum zu einem Hilbertraum. Das Skalarprodukt hängt
jedoch von der Wahl einer Basis ab.
250 3 Geometrie

Anwendungen auf das Quarkmodell der Elementarteilchenphysik: Wir betrachten einen


dreidimensionalen komplexen Hilbertraum X mit der Orthonormalbasis e1 , e2 , e3 . Wir interpre-
tieren
e1 als u-Quark, e2 als d-Quark und e3 als s-Quark.40

Genau die Einheitsvektoren u in X entsprechen physikalischen Zuständen. Ist u ∈ X mit


||u|| = 1, dann erlaubt die Fourierentwicklung

u = ( e 1 , u ) e 1 + ( e 2 , u ) e2 + ( e 3 , u ) e3

wegen
|(e1 , u)|2 + |(e2 , u)|2 + |(e3 , u)|2 = (u, u) = 1.
die folgende physikalische Interpretation:

|(e j , u)|2 ist die Wahrscheinlichkeit dafür, dass im Zustand u ein Quark e j vorliegt.

Zwei Einheitssvektoren u und v repräsentieren definitionsgemäß genau dann den gleichen


physikalischen Zustand, wenn u = λv gilt mit einer komplexen Zahl λ vom Betrag | λ| = 1.
Die physikalischer Größen werden durch lineare selbstadjungierte Operatoren A : X −→ X be-
schrieben, d. h., es ist A = A∗ . Die stets reelle Zahl

A := (u, Au)

ist der Erwartungswert bei einer Messung der physikalischen Größe A im Zustand u. Die
zugehörige Streuung ΔA ≥ 0 ergibt sich aus

(ΔA)2 := ( A − A)2 = u, ( A − A)2 u .

Hyperladung und Isospin der Quarks: Die entscheidende Rolle für das Quarkmodell spielen
die Gruppe SU (3, X ) und ihre Liealgebra su(3, X ). Definitionsgemäß ist die Cartanalgebra C einer
Liealgebra L die größte kommutative Lieunteralgebra von L.
Für su(3, X ) gilt dim C = 2. Eine Basis von C bilden die beiden Operatoren iT3 und iY, wobei
T3 , Y : X −→ X selbstadjungierte lineare Operatoren sind. Explizit gilt:

1 1
T 3 e1 =e , T 3 e2 = − e 2 , T 3 e3 = 0 ,
2 1 2
(3.79)
1 1 2
Ye1 = e1 , Ye2 = e2 , Ye3 = − e3 .
3 3 3

Man nennt T3 (bzw. Y) Operator der dritten Komponente des Isospins (bzw. der Hyperladung).
Die Eigenwerte T3 (bzw. Y) von T3 (bzw. Y) heißen die dritte Komponente des Isospins (bzw.
Hyperladung) des entsprechenden Quarkteilchens
40
In der Natur existieren 6 Quarks. Nach dem sechsten Quark, dem Top-Quark, wurde lange Zeit gesucht, bis man es 1994
entdeckte. Ein Proton besteht aus zwei u-Quarks und einem d-Quark. Es entspricht dem Zustand

1
p = √ (e1 ⊗ e1 ⊗ e2 − e2 ⊗ e1 ⊗ e1 ) . (3.78)
2

Eine genauere Diskussion der Physik und Mathematik des Quarkmodells findet man in 17.8.
3.9 Geometrien der modernen Physik 251

Y
1 e2 e1
3

− 12 1
2
T3

e3 Abb. 3.94 Quarks

 Beispiel 2: Nach (3.79) gilt T3 = 1/2 und Y = 1/3 für das u-Quark e1 (Abb. 3.94).
Der Ladungsoperator der Quarks: Nach Gell-Mann und Nishijima (1953) ergibt sich der
Ladungsoperator Q für Elementarteilchen aus der berühmten Formel

1 
Q : = T 3 + (Y + S ) | e | .
2

Dabei ist S der Operator der Seltsamkeit41 , und e bezeichnet die Ladung des Elektrons. Im
Hilbertraum X oder drei Quarks e1 , e2 , e3 gilt S = 0. Somit erhalten wir

2 1 1
Qe1 = | e | e1 , Qe2 = | e | e2 , Qe3 = − |e |e3 .
3 3 3

 Beispiel 3 ((Ladung des Protons): Die neun Tensorprodukte ei ⊗ e j ⊗ ek , i, j, k = 1, 2, 3, bilden


eine Basis von Z : = X ⊗ X ⊗ X. Ein linearer Operator A : X → X wirkt vermöge der Formel

A(ei ⊗ e j ⊗ ek ) = ( Aei ) ⊗ e j ⊗ ek + ei ⊗ ( Ae j ) ⊗ ek + ei ⊗ e j ⊗ ( Aek ).

auf Z. Deshalb erhalten wir für den Protonenzustand p aus (3.78) die Eigenwertformeln
1
Qp = √ (Qe1 ⊗ e1 ⊗ e2 + . . .) + . . .
2
Das ergibt

Qp = |e| p ,

d. h., das Proton besitzt die Ladung |e|.


Zusammenhang mit dem Matrizenkalkül: Es sei X ein n-n-dimensionaler Hilbertraum über
K. Wir wählen eine Orthonormalbasis e1 , . . . , en und ordnen jedem linearen Operator A : X → X
eine Matrix A = ( aij ) zu, indem wir

a jk := (e j , Aek ) .

setzen. Dann gilt


n n
A ( α1 e1 + . . . + α n en ) = ∑ (A α ) j e j = ∑ a jk αk e j .
j =1 j,k=1

41
Die Eigenwerte von S entsprechen einer Quantenzahl s; im Fall s = 0 heißen die Teilchen seltsam. Die drei Quarks
e1 , e2 , e3 sind nicht seltsam.
252 3 Geometrie

Wir bezeichnen mit L( X, X ) den Ring aller linearen Operatoren A : X → X. Ferner sei L(Kn , Kn )
der Ring aller (n × n)-Matrizen mit Elementen in K.
Satz 5: Durch die Zuordnung A → A ergibt sich eine lineare bijektive Abbildung

ϕ: L( X, X ) → L(K n , K n ) (3.80)

die auch die multiplikative und die ∗-Struktur respektiert, d. h., für alle A, B ∈ L( X, X ) und alle
α, β ∈ K gilt:
(i) ϕ(αA + βB) = αϕ ( A) + βϕ( B);
(ii) ϕ( AB) = ϕ( A) ϕ( B);
(iii) ϕ( A∗ ) = ϕ( A)∗ .
Man beachte, dass für reelle Matrizen A∗ gleich AT ist.
 Beispiel 4: Es sei X ein komplexer Hilbertraum. Durch ϕ erhält man die Gruppenisomorphis-
men

U (n, X )  U (n) und SU ( n, X )  SU ( n) .

Dabei bezeichnet U ( n) die Gruppe aller unitären komplexen ( n × n)-Matrizen, die durch U ∗ U =
UU ∗ = E charakterisiert sind. Ferner steht das Symbol SU ( n) für die Untergruppe aller Matrizen
von U (n) mit det U = 1.
 Beispiel 5: Es sei X ein reeller Hilbertraum. Durch ϕ erhält man die Gruppenisomorphismen

O(n, X )  O(n) und SO(n, X )  SO( n) .

Dabei bezeichnet O(n) die Gruppe aller reellen orthogonalen ( n × n)-Matrizen, die durch
U T U = UU T = E charakterisiert sind. Ferner ist SO( n) die Untergruppe aller Matrizen U ∈ O(n)
mit det U = 1.

3.9.3 Pseudounitäre Geometrie

Die pseudounitäre Geometrie existiert nicht in der Welt unserer täglichen Erfahrungen. Es ist die
Geometrie der speziellen Relativitätstheorie Einsteins.
 Beispiel 1: Der Raum R2 wird durch

B(u, v) := u1 v1 − u2 v2 für alle u, v ∈ R2 .

zu einem reellen pseudounitären Raum vom Morse-Index m = 1 und der Signatur (1, 1) im
Sinne der weiter unten gegebenen Definitionen. Die zugehörige pseudoorthogonale Gruppe
O(1, 1) besteht aus genau allen Transformationen
     
u1 cosh α − sinh α u1
 = (±1) , α ∈ R.
u2 − sinh α cosh α u2
Eine wichtige Besonderheit dieser Geometrie besteht darin, dass es Vektoren u = 0 mit der
Eigenschaft B(u, u) = 0 gibt; zum Beispiel trifft das auf u = (1, 1)T zu. Derartige Vektoren heißen
isotrop.
Definition: Unter einem pseudounitären Raum erstehen wir einen endlichdimensionalen linearen
Raum X über K zusammen mit einer Abbildung B : X × X −→ K, so dass für alle u, v, w ∈ X
und alle α, β ∈ K gilt:
3.9 Geometrien der modernen Physik 253

(i) B(w, αu + βv) = αB( w, u) + βB( w, v) .


(ii) B(u, v) = B( v, u) .
(iii) Aus B( u, v) = 0 für alle v ∈ X folgt u = 0.
Die Bedingung (iii) bedeutet, dass B nicht entartet ist. Aus (i) und ( ii) folgt

B(αu + βv, w) = αB( u, w) + βB( v, w) .

Dabei bezeichnet α die konjugiert komplexe Zahl zu α. In einem reellen Raum X, d. h. K = R,


darf man überall den Querstrich weglassen.
Morse-Index und Signatur: Ist e1 , . . . , en eine Basis von X, dann konstruieren wir die Matrix
B = (b jk ) durch

b jk := B(e j , ek ) , j, k = 1, . . . , n .

Dann ist B selbstadjungiert, d. h., B ∗ = B. Alle Eigenwerte von B sind reell und ungleich null.
Die Anzahl m der negativen Eigenwerte von B heißt der Morse-Index von B und (n − m, m)
nennt man die Signatur von B. Diese Definition ist unabhängig von der gewählten Basis.
Pseudoorthonormierte Basis: Eine Basis e1 , . . . , en des Raumes X heißt genau dann pseu-
doorthonormiert, wenn gilt:

⎨ 0 for j = k,
B ( e j , ek ) = 1 for j = k, j = 1, . . . , n − m ,

−1 for j = k, j = n − m + 1, . . . , n .

Basissatz:
(i) Es existiert stets eine pseudoorthonormierte Basis e1 , . . . , en von X.
(ii) Jeder Vektor u ∈ X lässt sich eindeutig in der Form

u = x 1 e1 + . . . + x n e n .

darstellen. Die Zahlen x1 , . . . , xn ∈ K heißen die pseudokartesischen Koordinaten von u.


(iii) Definieren wir eine lineare Abbildung dx j : X −→ K durch

dx j (α1 e1 + . . . + αn en ) = α j ,

dann gilt

B = dx1 ⊗ dx1 + dx2 ⊗ dx2 + . . . + dx n ⊗ dx n .

Die pseudounitäre Gruppe U (n − m, m; X ): Ein Operator U : X −→ X heißt genau dann


pseudounitär, wenn er die hermitesche Form B invariant lässt, d. h., U ist linear, und es gilt

B(Uv, Uw) = (v, w ) für alle v, w ∈ X .

Alle pseudounitären Operatoren auf X bilden eine Gruppe, die man die pseudounitäre Gruppe
U (n − m, m; X ) nennt. Alle Operatoren in U ( n − m, m; X ) mit

det U = 1

bilden eine Untergruppe, die wir mit SU (n − m, m; X ) bezeichnen und spezielle pseudounitäre
Gruppe nennen.
254 3 Geometrie

Im Falle eines reellen Raumes X schreiben wir O(n − m, m; X ) (bzw. SO(n − m, m; X )) anstelle
von U (n − m, m; X ) (bzw. SU ( n − m, m; X )) und sprechen von der pseudoorthogonalen Gruppe
(bzw. der speziellen pseudoorthogonalen Gruppe).42
Satz: Es sei X ein komplexer linearer Raum. Ein linearer Operator U : X −→ X gehört
genau dann zu U (n − m, m; X ), wenn U jede pseudorthonormierte Basis von X wieder in eine
pseudoorthonormierte Basis überführt.
Ist X ein reeller linearer Raum, dann gilt eine analoge Aussage, wenn man U (n − m, m, X
durch O(n − m, m, X ) ersetzt.
Pseudounitäre Geometrie: Eine Eigenschaft gehört genau dann zur pseudounitären Geome-
trie des linearen Raumes X, wenn sie unter den Operatoren der Gruppe U ( n − m, m, X ) invariant
ist.
 Beispiel 2: Die Begriffe orthogonale Vektoren, pseudoorthonormale Basis und isotroper Vektor
gehören zur pseudounitären Geometrie.
Zwei Vektoren u und v heißen genau dann orthogonal , wenn

B(u, v) = 0

gilt. Ferner heißt der Vektor u genau dann isotrop, wenn er zu sich selbst orthogonal ist, d. h.,
B(u, u) = 0.
Infinitesimale pseudounitäre Operatoren und die Liealgebra u(n − m, m, X ): Ein Operator
A : X −→ X heißt genau dann infinitesimal pseudounitär, wenn er linear ist und die Beziehung

B(u, Av) = − B( Au, v) für alle u, v ∈ X

gilt. Alle diese Operatoren bilden definitionsgemäß die Menge u (n − m, m; X ). Genau alle
Operatoren A ∈ u(n − m, m; X ) mit tr A = 0 (Spur gleich null) gehören definitionsgemäß zur
Menge su(n − m, m; X ).
Ist X ein reeller pseudounitärer Raum, dann bezeichnen wir u(n − m, m; X ) (bzw. su( n −
m, m; X ) durch o (n − m, m; X )) (bzw. so (n − m, m; X )).
Die Sätze 3 und 4 in 3.9.2. bleiben bestehen, falls man „Hilbertraum“ durch „pseudounitären
Raum“ ersetzt. Ferner muss man U ( n, X ) durch U ( n − m, m; X ) ersetzen. Analog hat man bei
allen anderen Gruppen und Liealgebren „n“ durch „n − m, m“ zu ersetzen.
Der Zusammenhang mit dem Matrizenkalkül: Wir wählen eine feste pseudoorthonormierte
Basis e1 , . . . , en und versehen den linearen Raum X mit einem Skalarprodukt, indem wir (e j , ek ) :=
δjk setzen. Jedem linearen Operator A : X −→ X ordnen wir durch

a jk := (e j , Aek ).

eine Matrix A := ( a jk ) zu.


Ist X ein komplexer linearer Raum, dann entstehen durch die Zuordnung A → A die
Gruppenisomorphismen.

U (n − m, m; X )  U (n − m, m) und SU (n − m, m; X )  SU (n − m, m) .

42
Die Gruppen U (n − m, m; X ), SU (n − m, m; X ), O(n − m, m; X ) und SO(n − m, m; X ) sind reelle Liegruppen mit den
Dimensionen
dim U (n − m, m; X ) = n2 , dim SU (n − m, m; X ) = n2 − 1 ,
n ( n − 1)
dim O (n − m, m; X ) = dim SO(n − m, m; X ) = .
2
Diese Dimensionen geben an, von wieviel reellen Parametern diese Gruppen abhängen (vgl. 17.1).
3.9 Geometrien der modernen Physik 255

Analog erhält man für einen reellen linearen Raum X die Gruppenisomorphismen

O(n − m, m; X )  O(n − m, m) und SO( n − m, m; X )  SO( n − m, m) .

Definition: Die Gruppe U (n − m, m) besteht aus genau allen komplexen ( n × n)-Matrizen A


mit der Eigenschaft

A ∗ D n−m,m A = D n−m,m .

Dabei ist D n−m,m eine Diagonalmatrix der Form


 
In−m 0
D n−m : = ,
0 − Im

wobei Ir die r-zeilige Einheitsmatrix bezeichnet. Genau die Matrizen A ∈ U (n − m, n) mit


det A = 1 bilden die Gruppe SU (n − m, m). Ferner besteht O( n − m, m) (bzw. SO( n − m, m)) aus
allen reellen Matrizen in U (n − m, m ) (bzw. SU (n − m, m)).

3.9.4 Minkowskigeometrie

Die Minkowskigeometrie entspricht einer vierdimensionalen Vektorrechnung mit einem indefini-


ten Skalarprodukt

u v := B(u, v ) für alle u, v ∈ M4 . (3.81)

Im folgenden benutzen wir nur geometrische Begriffe, die von einem gewählten Koordinatensy-
stem unabhängig sind. In 3.9.5. zeigen wir, wie man dadurch eine elegante Formulierung der
speziellen Relativitätstheorie erhält, die dem wichtigsten Prinzip der Physik – dem Einsteinschen
Relativitätsprinzip – voll gerecht wird.
Definition: Der Minkowskiraum M4 ist ein reeller pseudounitärer vierdimensionaler Raum
mit der Signatur (3, 1).
Pseudoorthonormierte Basis: Eine Basis e1 , e2 , e3 , e4 mit M4 ist genau dann pseudoortho-
normiert, wenn

e12 = e22 = e32 = 1 , e42 = −1 ,


(3.82)
e j ek = 0 für j = k

gilt.43 Aus der Zerlegung

u = x 1 e1 + x 2 e2 + x 3 e 3 + x 4 e 4 (3.83)

erhalten wir für das Skalarprodukt uu∗ die Komponentendarstellung

uu∗ = x1 x1∗ + x2 x2∗ + x3 x3∗ − x4 x4∗ für alle u, u∗ ∈ M4 . (3.84)

43
In der Literatur wird häufig auch ein Skalarprodukt verwendet, das –uv entspricht. Die hier gewählte Konvention hat den
Vorteil, dass sich das übliche Skalarprodukt im dreidimensionalen Raum als Spezialfall ergibt.
Die andere Konvention besitzt in der allgemeinen Relativitätstheorie den Vorzug, dass die pseudo-Riemannsche
Bogenlänge der vierdimensionalen Bahnkurve eines bewegten Teilchens proportional zur Eigenzeit τ des Teilchens ist
und somit eine direkte physikalische Bedeutung besitzt (vgl. 16.5).
256 3 Geometrie

Symmetriegruppen: Die zu O(3, 1; M4 ) gehörende pseudoorthogonale Gruppe M4 heißt


Lorentzgruppe. Ein linearer Operator A : M4 −→ M4 gehört genau dann zur Lorentzgruppe, wenn
er das Skalarprodukt erhält, d. h., es ist

( Au)( Av) = uv für alle u, v ∈ M4 .

Die Gruppe SO(3, 1; M4 ) besteht definitionsgemäß aus genau allen Transformationen A ∈


O(3, 1; M4 ) mit det A = 1.
Die eigentliche Lorentzgruppe SO+ (3, 1; M4 ) enthält definitionsgemäß genau alle Matrizen
A ∈ SO(3, 1; M4 ) mit

sgn( Au)e4 = sgn ue4 für alle u ∈ M4 .

Diese Definition ist unabhängig von der Wahl der pseudoorthonormierten Basis e1 , e2 , e3 , e4 .
Wir werden sehen, dass die Elemente von SO(3, 1; M4 ) die Orientierung erhalten, während die
Transformationen aus SO+ (3, 1; M4 ) zusätzlich die Richtung des Zeitsinns unverändert lassen.
Die Poincarégruppe P ( M4 ): Diese Gruppe, die die wichtigste Gruppe der Quantenfeldtheorie
darstellt, besteht definitionsgemäß aus genau allen Transformationen

u = Au + a , u ∈ M4

von M4 auf M4 , für die A ∈ O(3, 1; M4 ) und a ∈ M4 gilt.


Klassifikation von Vektoren: Es sei u ∈ M4 .
(i) u heißt genau dann raumartig, wenn u2 > 0.
(ii) u heißt genau dann zeitartig, wenn u2 < 0.
(i) u heißt genau dann lichtartig, wenn u2 = 0.
Bogenlänge: Ist u = u (σ), σ1 ≤ σ ≤ σ2 eine Kurve auf M4 , dann definieren wir die Ableitung
der Bogenlänge s nach dem Kurvenparameter σ durch

ds ⎨ u  ( σ )2 für u (σ)2 ≥ 0 ,
=
dσ ⎩
i − u  ( σ )2 für u (σ)2 < 0 .

Dafür schreibt man kurz:

ds2 = u ( σ)2 dσ2 . (3.85)

Fall 1: Ist die Kurve u = u(σ ) raumartig, d. h., u (σ) ist raumartig für alle σ, dann kann man
die Bogenlänge


s= u ( σ)2 dσ
σ1

als neuen Kurvenparameter einführen.


3.9 Geometrien der modernen Physik 257

Fall 2: Ist die Kurve u = u( σ) zeitartig, d. h., u ( σ) ist zeitartig für alle σ, dann können wir die
sogenannte Eigenzeit


1
τ := −u (σ)2 dσ (3.86)
c
σ1

als neuen Kurvenparameter einführen. Dabei ist c die Lichtgeschwindigkeit im Vakuum44


Orientierung: Wir orientieren den Minkowskiraum M4 , indem wir eine feste Pseudoorthonor-
malbasis e1 , e2 , e3 , e4 auszeichnen und die Volumenform

μ := dx 1 ∧ dx2 ∧ dx3 ∧ dx4 . (3.87)

definieren. Dabei ist dx j : X −→ R eine lineare Abbildung mit dx j (ek ) = δjk für alle j, k = 1, 2, 3, 4.
Ist b1 , b2 , b3 , b4 eine beliebige Basis in M4 , dann nennen wir die Zahl

α := sgn μ(b1 , b2 , b3 , b4 )

die Orientierung der Basis. Es ist stets α = 1 (positive Orientierung) oder α = −1 (negative
Orientierung).
Satz: (i) Für eine beliebige pseudoorthonormierte Basis e1 , . . . , e4 gilt

μ = α dx  ∧ dx  ∧ dx  ∧ dx  .
1 2 3 4

Dabei ist α = 1 (bzw. α = −1), falls die Basis positiv orientiert (bzw. negativ orientiert) ist.
(ii) Eine Lorentztransformation A ist genau dann orientierungserhaltend, wenn det A = 1, gilt,
d. h., es ist A ∈ SO(3, 1; M4 ).
Multilineare Algebra auf M4 : Der Minkowskiraum M4 ist ein linearer Raum. Deshalb hat
man für ihn alle Begriffe der multilinearen Algebra zur Verfügung. Dazu gehören
(i) die Tensoralgebra,
(ii) die äußere Algebra (Graßmannalgebra),
(iii) die innere Algebra (Cliffordalgebra),
(iv) der Cartansche Differentialkalkül und
(v) der ∗-Dualitätsoperator von Hodge
Wir werden im folgenden eine Reihe von Operationen mit Hilfe einer Pseudoorthonormalbasis
erklären. Diese Formeln sind Spezialfälle des allgemeinen Tensorkalküls, den man in 10.2
findet. Insbesondere zeigt dieser Kalkül, dass alle betrachteten Operationen d, δ, Div eine
invariante Bedeutung besitzen und insbesondere nicht von der Wahl der Pseudoorthonormalbasis
abhängen. Der ∗-Operator besitzt eine invariante Bedeutung, wenn man nur positiv orientierte
Pseudoorthonormalbasen benutzt. Bei Orientierungswechsel geht ∗ in (−1)∗ über.
Die Tensoralgebra von M4 : Für Vektoren u, v ∈ M4 ist das Tensorprodukt

u⊗v

erklärt (vgl. 2.4.3.1.).


44
In der speziellen Relativitätstheorie beschreiben zeitartige Kurven die Bewegung von Teilchen mit Unterlichtgeschwindig-
keit. Die Eigenzeit τ ist dann die Zeitangabe einer Uhr, die fest mit dem Teilchen verbunden ist.
258 3 Geometrie

Die äußere Algebra von M4 : Für Vektoren u, v ∈ M4 ist das äußere Produkt u ∧ v = u ⊗ v −
v ⊗ u definiert. Es gilt

u ∧ v = −v ∧ u .

Dieses Produkt tritt an die Stelle des Vektorprodukts im dreidimensionalen Raum. Allerdings
gehört u ∧ v nicht zu M4 , sondern u ∧ v ist eine antisymmetrische Bilinearform auf dem dualen
Raum M4∗ .
Dualität: Auf die äußeren Produkte wirkt der ∗-Operator von Hodge. Ist e1 , . . . , e4 eine
Pseudoorthonormalbasis von M4 , dann gilt:

∗(e1 ∧ e2 ) = e4 ∧ e3 , ∗(e2 ∧ e3 ) = e4 ∧ e1 , ∗(e3 ∧ e1 ) = e4 ∧ e2 ,


∗ ( e 1 ∧ e 4 ) = e2 ∧ e3 , ∗(e2 ∧ e4 ) = e3 ∧ e1 , ∗(e3 ∧ e4 ) = e1 ∧ e2 .

Die allgemeine Wirkung des ∗-Operator auf u ∧ v ergibt sich aus diesen Formeln und seiner
Linearität. Es gilt

∗ ∗ (u ∧ v) = v ∧ u für alle u, v ∈ M4 .

 Beispiel 1: ∗(e1 ∧ ( ae1 + be2 )) = ∗(be1 ∧ e2 ) = b ∗ (e1 ∧ e2 ) = b(e4 ∧ e3 ) .


Die innere Algebra (Cliffordalgebra) von M4 : Für alle u, v ∈ M4 , gilt

u ∨ v + v ∨ u = 2uv .

Differentialformen auf M4 : Es sei e1 , . . . , e4 eine Pseudoorthonormalbasis mit der zugehörigen


dualen Basis dx1 , . . . , dx4 , die durch

dx j (ek ) = δjk , j, k = 1, 2, 3, 4

gegeben ist. Daraus erhalten wir p-Formen mit p = 1, 2, 3, 4.


 Beispiel 2: 1-Formen besitzen die Gestalt

ω = a1 dx1 + a2 dx2 + a3 dx3 + a4 dx4

mit reellwertigen Funktionen a j : M4 −→ R. Linearkombinationen der Produkte dx j ∧ dx k


vergeben 2-Formen, usw. Die Volumenform

μ = dx1 ∧ dx 2 ∧ dx3 ∧ dx 4

stellt eine 4-Form dar.


Die d-Ableitung: Für p-Formen ω ist die Ableitung

in invarianter Weise erklärt (vgl. 1.5.10.5.).


 Beispiel 3: Für eine Funktion a : M4 −→ R gilt

da = (∂1 a)dx1 + . . . + (∂4 a)dx 4


3.9 Geometrien der modernen Physik 259

mit ∂ j := ∂/∂x j . Daraus folgt

d ( adx1 ) = da ∧ dx1 = (∂2 a )dx2 ∧ dx 1 + (∂3 a)dx 3 ∧ dx1 + ∂4 adx4 ∧ dx 1 .

Für die Volumenform μ ergibt sich dμ = 0.


Die δ-Ableitung von Hodge: Für beliebige p-Formen setzen wir

δω := −(−1)(4− p) p ∗ d ∗ ω . (3.88)

Dabei ergibt sich der lineare ∗-Operator von Hodge aus den folgenden Formeln:
(i) Dualisierung von 0-Formen: ∗1 = dx 1 ∧ dx2 ∧ dx 3 ∧ dx4 .
(ii) Dualisierung von 1-Formen:45 ∗dx1 = dx2 ∧ dx3 ∧ dx 4 .
(iii) Dualisierung von 2-Formen: ∗ (dx 1 ∧ dx2 ) = dx 3 ∧ dx4 , ∗(dx2 ∧ dx3 ) = dx 1 ∧ dx4 ,
∗ (dx3 ∧ dx1 ) = dx2 ∧ dx4 .
Die noch fehlenden Ausdrücke erhält man aus der Dualisierungsformel

∗ ∗ ω = −(−1)(4− p) p ω

für beliebige p-Formen ω.


 Beispiel 4: ∗(dx3 ∧ dx4 ) = ∗ ∗ (dx 1 ∧ dx2 ) = dx2 ∧ dx1 ,
∗ (dx2 ∧ dx3 ∧ dx4 ) = ∗ ∗ dx1 = dx1 , ∗μ = ∗(dx1 ∧ dx2 ∧ dx3 ∧ dx4 ) = ∗ ∗ 1 = −1 .
Die Anwendung des ∗-Operators auf beliebige Formen ergibt sich aus den obigen Formeln
und der Linearität dieses Operators.
 Beispiel 5: ∗( adx1 + bdx2 ) = a ∗ dx1 + b ∗ dx 2 = adx2 ∧ dx3 ∧ dx4 + bdx3 ∧ dx4 ∧ dx1 .
Die Divergenz: Für F = T jk e j ⊗ ek setzen wir

Div F := ∂ j T jk ek .

Dabei wird über gleiche obere und untere Indizes von 1 bis 4 summiert.
Die Operatoren Alt (B): Für B = B1 e1 + B2 e2 + B3 e3 definieren wir

Alt(B) := B1 ( e2 ∧ e3 ) + B2 ( e3 ∧ e1 ) + B3 (e1 ∧ e2 ) .

3.9.5 Anwendungen in der speziellen Relativitätstheorie

Das Einsteinsche Relativitätsprinzip (1905):

In jedem Inertialsystem verlaufen alle physikalischen Prozesse bei


(3.89)
gleichen Anfangs- und Randbedingungen in gleicher Weise.

Unter einem Inertialsystem Σ verstehen wir ein kartesisches ( x, y, z)-Koordinatensystem mit der
Orthonormalbasis i, j, k und der Zeit t, in dem ein kräftefreier Körper ruht oder sich geradlinig
mit konstanter Geschwindigkeit bewegt.
45
Man erhält daraus ∗dx j durch zyklische Vertauschung.
260 3 Geometrie

 Beispiel 1: In jedem Inertialsystem breitet sich das Licht im Vakuum mit der gleichen
Geschwindigkeit c aus.
Das Einsteinsche Relativitätsprinzip ersetzte das klassische Relativitätsprinzip von Galilei
(1564–1642), wonach (3.89) nur für alle physikalischen Prozesse der Mechanik gilt.

z z

y y

x x v
Σ Σ Abb. 3.95

 Beispiel 2: Es seien Σ und Σ zwei achsenparallele Inertialsysteme, wobei ein Beobachter in Σ


für den Ursprung von Σ die Bewegungsgleichung

x = vt

feststellt (Abb. 3.95). Nach Galilei hat man dann die Transformationsformeln

x  = x − vt , y = y , z = z , t = t (3.90)

zwischen den Koordinaten x, y, z, t in Σ und den Koordinaten x  , y , z , t in Σ zu benutzen


(Galileitransformation). Aus einem Lichtstrahl

x = ct in Σ

wird ein Lichtstrahl

x  = (c − v ) t  in Σ .

Besitzt somit das Licht in Σ die Geschwindigkeit c, dann hat es in Σ die Geschwindigkeit
c − v. Dies bedeutet, dass die Aussage von Beispiel 1 nicht gilt. Deshalb ersetzte Einstein die
Galileitransformation durch die spezielle Lorentztransformation

x − vt t − vx/c2
x = √ , y = y , z = z , t = √ . (3.91)
1 − v2 /c2 1 − v2 /c2

Aus x = ct folgt x = ct , d. h., die Aussage von Beispiel 1 ist jetzt tatsächlich erfüllt.
Ist v sehr klein gegenüber der Lichtgeschwindigkeit c, dann stimmt die Lorentztransformation
(3.91) näherungsweise mit der Galileitransformation (3.90) überein. Genauer gesprochen geht
(3.91) für c → ∞ in (3.90) über. Allgemeiner gilt:

Die relativistische Physik geht für c → ∞ in die klassische Physik über.

 Beispiel 3: Ist das Inertialsystem Σ gegenüber Σ gedreht, dann kann man durch eine Drehung
D zunächst Achsenparallelität erreichen. Anschließend hat man die spezielle Lorentztrans-
formation (3.91) anzuwenden und durch die inverse Drehung D−1 die Drehung D wieder
rückgängig zu machen.
Die spezielle Lorentztransformation (3.91) kann man besonders elegant mit Hilfe von Hyper-
belfunktionen in der Form

x  = x cosh α − ct sinh α , y = y , z = z , ct = ct cosh α − x sinh α


3.9 Geometrien der modernen Physik 261

schreiben. Dabei gilt


v v
tanh α = , d. h. α := arctanh
c c
und |v| < c.
Aus heutiger Sicht ist das Einsteinsche Relativitätsprinzip (3.89) viel natürlicher als das Galilei-
sche Relativitätsprinzip, das eine bestimmte physikalische Disziplin – die Mechanik – besonders
auszeichnet. Tatsächlich hat das Einsteinsche Relativitätsprinzip eine totale Revision der klassi-
schen Vorstellungen von Raum und Zeit zur Folge. Es gibt keine absolute Weltzeit mehr, sondern
jedes Inertialsystem besitzt seine eigene Zeitmessung. Ferner sind nur Geschwindigkeiten v mit
|v| < c möglich. Einstein postulierte in diesem Zusammenhang die viel stärkere Aussage:

Physikalische Wirkungen können sich in einem Inertialsystem höchstens


mit der Geschwindigkeit c ausbreiten.

Lorentztransformationen: Wir betrachten Transformationen


⎛  ⎞ ⎛ ⎞ ⎛ ⎞
x x x0
⎜ y ⎟ ⎜ y ⎟ ⎜ y0 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ z  ⎠ = A ⎝ z ⎠ + ⎝ z0 ⎠ (3.92)
ct ct ct0

und setzen
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
β 0 0 − βv/c d11 d12 d13 0 s1 0 0 1
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
L v := ⎜
0 1 0 0 ⎟ , D := ⎜ d21 d22 d23 0 ⎟ , S := ⎜ 0 s2 0 0 ⎟ .
⎝ 0 0 1 0 ⎠ ⎝ d31 d32 d33 0 ⎠ ⎝ 0 0 s3 0 ⎠
− βv/c 0 0 β 0 0 0 1 0 0 0 s4

Dabei gilt β := 1/ 1 − v2 /c2 und s j = ±1 für alle j. Ferner ist D eine Drehung, d. h., es
ist, DDT = DT D = E und det D = 1. Die Matrix S beschreibt für s4 = 1 die identische
Transformation oder räumliche Spiegelungen. Im Fall s4 = −1 ergibt sich eine Zeitspiegelung.
Definition: Die Lorentzgruppe O(3, 1) besteht aus allen möglichen Matrizen A der Gestalt

A = SD1 L v D2 .

Daraus folgt det A = det S = ±1. Ferner besteht die Gruppe SO(3, 1) (bzw. SO+ (3, 1)) defini-
tionsgemäß aus allen diesen Matrizen A ∈ O(3, 1) mit det S = 1 (bzw. S = E). Ist A ∈ O(3, 1)
dann heißt (3.92) eine Poincarétransformation. Alle diese Poincarétransformationen bilden defi-
nitionsgemäß die Poincarégruppe.
Poincarétransformationen mit x0 = y0 = z0 = t0 = 0 heißen Lorentztransformationen,
d. h., Raum- und Zeittranslationen werden ausgeschlossen. Ferner werden alle Lorentztrans-
formationen mit A ∈ SO+ (3, 1) eigentlich genannt, d. h., Raum- und Zeitspiegelungen werden
ausgeschlossen. Für die Elementarteilchenphysik benötigt man die volle Poincarégruppe.46
Geometrische Interpretation: Wir betrachten den Minkowskiraum. Einer Pseudoorthonor-
malbasis e1 , e2 , e3 , e4 mit der Zerlegung47

u = x 1 e1 + x 2 e2 + x 3 e 3 + x 4 e 4 (3.93)
46
Die Poincarégruppe P ist eine zehndimensionale reelle Liegruppe. In der Liealgebra von P kann man 10 Basisoperatoren
finden, denen in relativistischen Quantenfeldtheorien die Erhaltung von Energie, Impuls und Drehimpuls entsprechen.
47
Anstelle von x j schreibt man auch x j .
262 3 Geometrie

entspricht ein Inertialsystem mit den kartesischen Koordinaten

x = x1 , y = x2 , z = x3

und x4 = ct. Ferner gilt e1 = i, e2 = j, e3 = k. Daraus folgt

u = x + cte4 with x = xi + yj + zk .

Satz: Die Gruppe P der Poincarétransformationen (3.92) ist isomorph zur Gruppe P( M4 ) der
Poincarétransformationen

u = Au + a

auf M4 . Dieser Isomorphismus ergibt sich, indem man

u = x1 e1 + x2 e2 + x3 e3 + x4 e4 , a = x0 e1 + y0 e2 + z0 e3 + ct0 e4

setzt und zur Berechnung von x j die Formel (3.92) benutzt.


Die Eigenzeit: Wir betrachten die Bewegung eines Massenpunktes

x = x( t )

mit Unterlichtgeschwindigkeit in einem Inertialsystem. Dazu gehört die Kurve

u = u(t) = x( t) + cte4

auf M4 . Es gilt u ( t) = x (t) + ce4 und u (t)2 = x (t )2 − c2 . Aus (3.86) folgt die Eigenzeit

t
τ= 1 − x (σ)2 /c2 dσ (3.94)
t0

Das ist die Zeit, die eine Uhr anzeigt, die fest mit dem bewegten Massenpunkt verbunden ist.
Das Einsteinsche Zwillingsparadoxon: Wir nehmen an, dass Zwillinge Z und Z  im Ur-
sprung x = 0 eines Inertialsystems zur Zeit t0 = 0 geboren werden.

z
Z

x
Z Abb. 3.96

Während Z  im Ursprung verbleibt, unternimmt Z eine Reise mit einem Raumschiff und kehrt
zur Zeit t zurück. Dann erlebt Z die Eigenzeit τ und Z  erlebt wegen x = 0 die Eigenzeit τ  = t.
Aus (3.94) folgt

τ < t,
3.9 Geometrien der modernen Physik 263

d. h., Z ist bei seiner Rückkehr jünger als Z . Der Altersunterschied wird um so gravierender, je
größer die Reisegeschwindigkeit |x ( t)| von Z gewesen ist.
Die Maxwellschen Gleichungen der Elektrodynamik: In einem beliebigen Inertialsystem
betrachten wir die folgenden Größen:
E Vektor der elektrischen Feldstärke,
B Vektor der magnetischen Feldstärke,
 elektrische Ladungsdichte,
J elektrischer Stromdichtevektor.
Diesen Größen ordnen wir die folgenden geometrischen Objekte auf M4 zu:

F = E ∧ e4 − Alt(B) , J = J + e4 . (3.95)

Daraus folgt

∗ F = −B ∧ e4 − Alt(E) . (3.96)

Man nennt F den elektromagnetischen Feldtensor. Dann besitzen die Maxwellschen Gleichungen
der Elektrodynamik die überraschend einfache und elegante Gestalt:

Div F = J , Div ∗ F = 0 . (3.97)

Die erste Gleichung DivF = J drückt aus, dass elektrische Ladungen und Ströme die Quellen
für den elektromagnetischen Feldtensor F sind. Die zweite Gleichung Div ∗ F = 0 reflektiert
eine Dualität zwischen elektrischen und magnetischen Feldern und zugleich eine Asymmetrie,
die im Fehlen eines inhomogenen Gliedes besteht. Die Ursache besteht darin, dass man in
der klassischen Elektrodynamik keine magnetischen Einzelladungen (Monopole) kennt. Diese
Asymmetrie störte Dirac. Um sie zu beheben, sagte er die Existenz von magnetischen Monopolen
voraus. In den modernen Eichfeldtheorien ergibt sich rein mathematisch die Existenz derartiger
magnetischer Monopole (vgl. 14.8.6). Nach ihrer Existenz im Weltall wird zur Zeit gefahndet.
Diskussion: Die Formulierung (3.97) ist auf dem Minkowskiraum M4 gültig. Bezieht man F
und J auf irgend eine Basis b1 , . . . , b4 von M4 , dann erhält man die Gestalt der Maxwellschen
Gleichungen in einem Bezugssystem, das zu b1 , . . . , b4 gehört. Dabei können sich elektrische
Felder in magnetische Felder verwandeln und umgekehrt.48
Für jede Pseudoorthonormalbasis besitzen F und J die gleiche Struktur. Deshalb ergibt sich in
jedem Inertialsystem die gleiche Gestalt der Maxwellschen Gleichungen. Diese lauten explizit:49

div E =  , div B = 0 ,
(3.98)
rot B = Et + J , rot E = −Bt .

48
Eine ruhende elektrische Ladung erzeugt nur ein elektrisches Feld. Ein bewegter Beobachter sieht dagegen eine bewegte
Ladung, die einem elektrischen Strom entspricht, der ein Magnetfeld erzeugt.
Um 1900 bildete die Elektrodynamik bewegter Medien ein wichtiges offenes Problem der Physik. Gesucht wurden die
richtigen Transformationsformeln für das elektromagnetische Feld beim Wechsel der Bezugssysteme. Einstein erkannte
im Jahre 1905, dass man die Maxwellschen Gleichungen unverändert lassen kann und lediglich die Galileitransformation
durch die Lorentztransformation zu ersetzen hat.
49
Diese Formulierung ist besonders bequem, weil sie keine physikalischen Konstanten enthält. Wir erreichen das durch den
Übergang vom internationalen MKSA-System zu dimensionslosen Größen, indem wir in Tab. 1.5 folgende Substitutionen
vornehmen:
x ⇒ re x , t ⇒ re t/c , m 0 ⇒ m e m0 , Q ⇒ eQ , v ⇒ cv ,
e 1 ec e
E⇒ E, B ⇒ B, J ⇒ J,  ⇒ 
4πε 0 re2 4πε 0 re2 c 4πre3 4πε 0 re3 c
(e Ladung des Elektrons, me Masse des Elektrons, re Radius des Elektrons, ε 0 Dielektrizitätskonstante im Vakuum).
264 3 Geometrie

Beim Übergang von einem Inertialsystem Σ zu einem Inertialsystem Σ vermöge der speziellen
Lorentztransformation (3.91) hat man das elektromagnetische Feld sowie die Ladungen und
Ströme in folgender Weise zu transformieren:
 = β( − vJ) , J = β(J − v) , Q = Q ,
E  = β ( E ∗ + v × B∗ ) , B  = β ( B∗ + E ∗ × v ) .

Dabei ist v := vi, E = E1 i + E2 j + E3 k und E∗ = β−1 ( E1 i + E2 j + E3 k) mit β−1 := 1 − v2 . Wir
verwenden dabei dimensionslose Größen.
Dualitätssymmetrie der Maxwellschen Gleichungen: Wegen ∗∗ F = − F besitzt die Maxwell-
sche Gleichung (3.97) eine Dualität, die sich nach (3.95) und (3.96) im Fall  = 0 und j = 0 aus
der Substitution
E ⇒ −B , B ⇒ E.
ergibt.
Die Bewegungsgleichung eines geladenen Teilchens im elektromagnetischen Feld: Die
Bewegung u = u( τ ) eines Teilchens der Ruhemasse m0 und der Ladung Q wird durch die
Gleichung

m0 u (τ ) = QF ( u(τ ))u (τ ) (3.99)

beschrieben.50 Das entspricht in einem beliebigen Inertialsystem der Differentialgleichung

p (t) = QE (x(t ), t) + Qx ( t) × B(x(t ), t)

für die Bahnkurve x = x( t) Dabei ist p := mx der Impulsvektor; die Größe
m0
m=
1 − x (t)2 /c2

heißt die relativistische Masse des Teilchens. Sie wird um so größer, je näher sich die Geschwindig-
keit |x (t)| des Teilchens der Lichtgeschwindigkeit c nähert.
Die vierte Komponente der Bewegungsgleichung (3.99) lautet in einem Inertialsystem:

E (t) = QE (x(t), t)x ( t) .

Dies bedeutet, dass die zeitliche Änderung der Energie

E = mc2

gleich der Leistung ist, welche die elektrische Kraft K = QE an dem bewegten Teilchen vollbringt.
Ruht das Teilchen, dann ist m = m0 , und wir erhalten als Spezialfall die berühmte Einsteinsche
Masse-Energieäquivalenzrelation

E0 = m0 c2

50
Ist b1 , b2 , b3 , b4 eine Basis in M4 , dann gilt
F = F jk b j ∧ bk , u = x j bj , Fu = ( F jk xk ) b j
mit xk = gkr x und gkr = bk br . Über gleiche obere und untere Indizes wird dabei von 1 bis 4 summiert. Diese Definition
r

von Fu ist unabhängig von der Wahl der Basis.


3.9 Geometrien der modernen Physik 265

für die Ruheenergie eines relativistischen Teilchens. Diese Energie wird bei der Kernfusion in
der Sonne frei und liefert die lebenspendende Energie der Sonne.
Bemerkung: Die Maxwellschen Gleichungen kann man neben der Sprache der vierdimen-
sionalen Vektoranalyis, die wir in (3.97) benutzt haben, auch in der Sprache der allgemeinen
Tensoranalysis, in der Sprache der Differentialformen und in der Sprache der Hauptfaserbündel
formulieren. Das wird ausführlich in 10.2.8 diskutiert. Dort findet man auch das relativisti-
sche Additionstheorem der Geschwindigkeiten sowie die relativistische Längenkontraktion und
Zeitdilatation.

Den Maxwellschen Gleichungen der Elektrodynamik verdankt man wich-


tige Impulse zur Entwicklung von Physik und Mathematik.

Insbesondere kann man die Maxwellschen Gleichungen im Rahmen einer U (1)-Eichfeldtheorie


formulieren. Ersetzt man die abelsche Gruppe. U (1) durch andere Liegruppen (z. B. SU (2) oder
SU (3)), dann erhält man nichtabelsche Eichfeldtheorien, in deren Rahmen das Standardmodell
der modernen Elementarteilchenphysik formuliert wird (vgl. 10.2.10 und 18.1).

3.9.6 Spingeometrie und Fermionen

Das relativistische Elektron hängt sehr eng mit der Cliffordalgebra des Minkowskiraumes M4
zusammen. Der Spin des Elektrons ergibt sich dabei aus der universellen Überlagerungsgruppe
Spin(3) der Drehgruppe SO(3) des dreidimensionalen Raumes; Spin(3) ist isomorph zur Gruppe
SU (2). Auf Cliffordalgebren wird man geführt, wenn man versucht, die (zweidimensionalen)
komplexen Zahlen auf höhere Dimensionen zu verallgemeinern. Hamilton (1805–1865) entdeckte
zunächst 1843 die vierdimensionalen Quaternionen, nachdem er sich vergeblich um eine drei-
dimensionale Verallgemeinerung der komplexen Zahlen bemüht hatte.51 Die Cliffordalgebren
des euklidischen Raumes wurden von Clifford (1845–1879) ein Jahr vor seinem Tode eingeführt.
Diese Algebren besitzen die Dimensionen 2n mit n = 1, 2, 3, . . .
Bezeichnungen: Das Symbol SL(2, C ) steht für die Gruppe aller komplexen (2 × 2)-Matrizen
A mit det A = 1. Die unitären Matrizen in SL(2, C ) bilden definitionsgemäß die Gruppe SU (2).
Ferner bezeichnet U (1) die (multiplikative) Gruppe aller komplexen Zahlen z mit | z| = 1.
Die Gruppe SO(n) besteht definitionsgemäß aus allen reellen orthogonalen ( n × n)-Matrizen
A mit det A = 1. Insbesondere besteht SO (2) genau aus den reellen Matrizen in SU (2).

3.9.6.1 Die Cliffordalgebra des Minkowskiraumes

Es sei C( M4 ) die Cliffordalgebra des Minkowskiraums M4 . Dann ist M4 ⊂ C( M4 ). Für alle


u, v ∈ M4 gilt

u ∨ v + v ∨ u = 2uv.

Wählt man eine Pseudoorthonormalbasis e1 , . . . , e4 , dann hat man

e j ∨ ek + ek ∨ e j = 2e j ek , (3.100)
51
Nach Hamiltons Angaben wurde er auf die Quaternionen durch die Frage seiner beiden Söhne beim Frühstück geführt:
Papa, kannst du Zahlentripel ( a, b, c) miteinander multiplizieren? Das konnte er trotz langen Nachdenkens nicht, aber er
entdeckte, wie man reelle 4-Tupel ( a, b, c, d ), d. h., Quaternionen miteinander multipliziert (vgl. 3.9.6.3.).
Der anschauliche Grund für das Fehlen einer assoziativen Multiplikation von Zahlentripeln besteht darin, dass das
klassische Vektorprodukt nicht assoziativ ist. Der Begriff des Vektors wurde von Hamilton im Jahre 1845 eingeführt.
Man beobachtet immer wieder in der Geschichte der Mathematik, dass intellektuelle Neugier mathematische Resultate
hervorbringt, die sich später als sehr fruchtbar für die Naturbeschreibung erweisen.
266 3 Geometrie

d. h., e1 ∨ e1 = e2 ∨ e2 = e3 ∨ e3 = 1 und e4 ∨ e4 = −1 sowie

e j ∨ e k = − ek ∨ e j , j = 1, 2, 3, 4 .

Es gilt dim C( M4 ) = 16. Eine Basis von C( M4 ) erhält man durch die folgenden sechzehn
Elemente:
(i) 1, e1 , e2 , e3 , e4 ;
(ii) e1 ∨ e2 , e 1 ∨ e3 , e1 ∨ e4 , e2 ∨ e3 , e2 ∨ e4 , e3 ∨ e4 ;
(iii) e1 ∨ e2 ∨ e3 , e1 ∨ e2 ∨ e4 , e 1 ∨ e3 ∨ e4 , e2 ∨ e3 ∨ e4 ;
(iv) e1 ∨ e2 ∨ e3 ∨ e4 .
Alle anderen Produkte lassen sich wegen (3.100) durch diese Produkte ausdrücken.
Die Paulimatrizen und die Liealgebra su(2): Definitionsgemäß besteht su(2) aus genau allen
komplexen (2 × 2)-Matrizen A mit A∗ = − A und tr A = 0. Die Matrizen
       
0 1 0 −i 1 0 1 0
σ1 := , σ2 := , σ3 := , σ4 :=
1 0 i 0 0 −1 0 1

heißen Paulimatrizen; iσ1 , iσ2 und iσ3 bilden eine Basis des reellen linearen Raumes su(2), der
durch

[ A, B] := AB − BA.

zu einer Liealgebra wird.52


Die Pauli-Dirac-Matrizen: Diese komplexen (4 × 4)-Matrizen werden durch
   
0 −σα 0 σ4
γα : = i , γ4 := i , α = 1, 2, 3
σα 0 σ4 0

definiert. Außerdem setzen wir γα := γα für α = 1, 2, 3 und γ4 := −γ4 . Mit Mat(4, 4) bezeichnen
wir die Gesamtheit aller komplexen (4 × 4)-Matrizen. Es gilt

γ j γk + γk γ j = 2γ j γk , j = 1, 2, 3, 4 . (3.101)

Es fällt sofort die Analogie zwischen (3.100) und (3.101) auf.


Satz: Mat(4, 4) wird bezüglich der Matrizenmultiplikation zu einer Cliffordalgebra. Vermöge
der Zuordnung

e j −→ γ j

ergibt sich ein Isomorphismus zwischen der Cliffordalgebra C( M4 ) des Minkowskiraumes und
der Cliffordalgebra Mat(4, 4).
 Beispiel: Bei diesem Isomorphismus geht e j ∨ ek in γj γk über usw.

52
Durch SU (n) bezeichnen wir die Liegruppe aller komplexen unitären (n × n )-Matrizen B mit det B = 1. Dann ist su (2)
die Liealgebra zu SU (2) (vgl. 17.1).
3.9 Geometrien der modernen Physik 267

3.9.6.2 Die Diracgleichung des relativistischen Elektrons

In diesem Abschnitt summieren wir über gleiche lateinische obere und untere Indizes von 1 bis
4. Über gleiche griechische Indizes wird von 1 bis 3 summiert.
Diracgleichung: Die von Dirac im Jahre 1928 aufgestellte Gleichung für ein freies Elektron
lautet:
m0 c
∂∨Ψ+ Ψ = 0. (3.102)
h

Dabei heißt die komplexe 4-Spaltenmatrix Ψ = ( ϕ1 , ϕ2 , iχ1 , iχ2 )T die Wellenfunktion des Elek-
trons. Wir schreiben kurz Ψ = ( ϕ, iχ)T .
Die Diracgleichung (3.102) bezieht sich auf ein Inertialsystem mit den Koordinaten x =
( x1 , x2 , x3 , x4 ) und x4 = ct (vgl. 3.9.5.). Die Funktion Ψ = Ψ( x ) hängt vom Raum-Zeitpunkt x ab.
Ferner setzen wir

∂ ∨ Ψ := γk ∂k Ψ

mit ∂k := ∂/∂x k . Außerdem gilt: c Lichtgeschwindigkeit im Vakuum, m0 Ruhemasse des Elek-


trons, h Plancksches Wirkungsquantum h = h/2π.
Die Diracgleichung (3.102) entspricht dem System53

m0 c
σα ∂α ϕ − σ4 ∂4 ϕ + χ = 0,
h
(3.103)
m c
σα ∂α χ + σ4 ∂4 χ + 0 ϕ = 0 .
h

Transformationsverhalten: Beim Übergang von einem Inertialsystem zu einem anderen


Inertialsystem durch eine eigentliche Lorentztransformation gilt:

x  = L( A) x ,
ϕ = A ∗ ϕ , χ = A −1 χ , A ∈ SL(2, C ) .

Dabei geht die Diracgleichung in die entsprechende Gleichung für Ψ über. Zu jeder Matrix
A ∈ SL(2, C ) gehört eine Lorentztransformation x = L ( A) x, wobei sich x  aus der Gleichung


σj x j = A−1 (σj x j )( A∗ ) −1 .

ergibt. Man bezeichnet ϕ und χ als Spinoren und Ψ als Bispinor:


Satz: (i) die Zuordnung A → L( A) liefert einen Homomorphismus von der Gruppe SL(2, C )
auf die eigentliche Lorentzgruppe SO+ (3, 1) mit dem Kern N = { E, − E}.
(ii) Man hat den Isomorphismus

SL(2, C )/N ∼
= SO+ (3, 1) .

53
In der Literatur werden unterschiedliche Formulierungen der Diracgleichung verwendet. Beispielsweise benutzt man
verschiedene Definitionen der Matrizen γ j , und häufig wird im Minkowskiraum M4 das Skalarprodukt −e j ek durch e j ek .
ersetzt. Alle diese Formulierungen lassen sich jedoch leicht ineinander transformieren und ergeben die gleiche Physik.
268 3 Geometrie

(iii) Ist die Matrix A aus SL(2, C ) zusätzlich unitär, dann entspricht x  = L( A) x einer räumli-
chen Drehung. Auf diese Weise liefert die Zuordnung A → L( A) einen Homomorphismus der
Gruppe SU (2) auf die Drehgruppe SO (3) des dreidimensionalen Raumes.
(iv) Es ergibt sich der Isomorphismus54

SU (2)/N ∼
= SO(3) .

Räumliche Spiegelungen P:
 
x α = − x α , α = 1, 2, 3, x4 = x4 ,
ϕ = χ , χ = − ϕ .

Zeitliche Spiegelungen T:
 
xα = x α , α = 1, 2, 3, x4 = − x4 ,
ϕ = χ , χ = ϕ .

Ladungskonjugation C:

x j = x j , j = 1, 2, 3, 4 ,
ϕ = −σ2 χ , χ = σ2 ϕ .

Die Diracgleichung ist gegenüber diesen drei Transformationen P, C und T einzeln invariant.
Für allgemeine Elementarteilchenprozesse hat man nur Invarianz bezüglich der kombinierten
Transformation PCT. Anschaulich verbirgt sich dahinter das folgende fundamentale Prinzip:

Ist ein Elementarteilchenprozess P in der Natur möglich, dann ist auch der
Prozess P  möglich, der sich aus P durch räumliche Spiegelung, zeitliche
Spiegelung und Übergang von den Teilchen zu ihren Antiteilchen ergibt.

Der Elektronenspin: Der Operator

h
DΨ = (x × p)Ψ + sΨ
2

heißt der Operator des Gesamtdrehimpulses. Dabei gilt


 
h σα 0
p := eα ∂α and s := eα ,
i 0 σα
wobei über α von 1 bis 3 summiert wird. Schreiben wir die Diracgleichung (3.102) in der Form
ih∂4 Ψ = HΨ, dann ergibt sich

H D − D H = 0. (3.104)

Deshalb repräsentiert D eine Erhaltungsgröße, was für den Ausdruck x × p ohne den Spinopera-
tor s nicht gilt. Für die e3 -Komponente von s hat man

h
s3 Ψ ± = ± Ψ ±
2

54
Die Gruppe SL(2, C ) (bzw. SU (2)) ist die universelle Überlagerungsgruppe von SO+ (3, 1) (bzw. SO(3)) (vgl. 17.5.3).
3.9 Geometrien der modernen Physik 269

mit Ψ+ := 2−1/2 (1, 0, 1, 0)T und Ψ− = 2−1/2 (0, 1, 0, 1)T . Die Funktionen Ψ± repräsentieren
Zustände des Elektrons mit einem Spin (Eigendrehimpuls) in Richtung der e3 -Achse der Größe
±h/2.
Die natürliche Forderung (3.104) der Erhaltung des Gesamtimpulses erzwingt somit die
Existenz des Elektronenspins.
Chiralität: Wir definieren den Operator

1
P := ( 1 + γ5 )
2

mit γ5 := −iγ1 γ2 γ3 γ4 . Es gilt γ52 = E und

P2 = P.

Den Zuständen Ψ mit PΨ = Ψ ordnen wir die Chiralität +1 zu, und den Zuständen mit
( I − P)Ψ = Ψ ordnen wir die Chiralität −1 zu. Explizit gilt
 
σ4 0
γ5 = .
0 −σ4

Genau die Eigenvektoren Ψ von γ5 besitzen eine Chiralität. Aus γ5 Ψ = αΨ folgt die Chiralität α.
 Beispiel: Ψ := ( ϕ, 0) besitzt die Chiralität +1, während Ψ := (0, iχ) die Chiralität −1 hat. Bei
Raumspiegelungen gilt

ϕ = χ , χ = − ϕ ,

d. h., die Chiralität ändert ihr Vorzeichen.


Im Jahre 1956 stellten Lee und Yang die Hypothese auf, dass das Neutrino nur mit der
Chiralität −1 in der Natur vorkommt. Das bedeutet, dass bei einem Prozess, an dem Neutrinos
beteiligt sind, der räumlich gespiegelte Vorgang nicht auftritt. Diesen Effekt bezeichnet man
als Paritätsverletzung bei der schwachen Wechselwirkung. Dieser räumliche Asymmetrieeffekt
wurde 1957 von Frau Wu experimentell beim β-Zerfall von Kobalt beobachtet. Im gleichen Jahr
erhielten Lee und Yang für ihre Theorie der Paritätsverletzungen den Nobelpreis für Physik.
Fermionen, Bosonen und das Standardmodell der Elementarteilchen: Alle Teilchen mit
halbzahligem Spin

kh/2 , k = 1, 3, 5, . . . ,

heißen Fermionen; alle Teilchen mit ganzzahligem Spin

mh , m = 0, 1, . . . ,

nennt man Bosonen. Im modernen Standardmodell der Elementarteilchen benutzt man

6 Quarks und 6 Leptonen (z. B. das Elektron und das Neutrino)

sowie deren Antiteilchen.55 Alle diese Teilchen sind Fermionen und werden durch Gleichungen
vom Typ der Diracgleichung beschrieben. An diese Diracgleichungen müssen aufgrund des
Prinzips der lokalen Eichinvarianz zusätzliche Felder angekoppelt werden, die Eichbosonen
entsprechen, welche die Wechselwirkungen zwischen den 12 fundamentalen Fermionen beschrei-
ben (vgl. 14.8). Beispielsweise wird die elektromagnetische Wechselwirkung durch Photonen
beschrieben (vgl. Tab. 3.11).
270 3 Geometrie

Tabelle 3.11
Wechselwirkung in der Natur Teilchen Spin
elektromagnetisch Photon h
stark (Kernkräfte) 8 Gluonen h
schwach (radioaktiver Zerfall) W±, Z h
Gravitation Graviton 2h

Die Existenz von Antiteilchen ergibt sich erst zwingend nach der (zweiten) Quantisierung der
Diracgleichung im Rahmen der Quantenfeldtheorie..
Supersymmetrie: Man nimmt an, dass kurz nach dem Urknall die Welt supersymmetrisch
war, d. h., zu jedem Boson gehörte als Partner ein Fermion. Zum Beispiel entspricht dem Graviton
mit Spin 2h̄ das Gravitino mit Spin 3h/2.
Mit einer neuen Generation von Teilchenbeschleunigern (supercollider) hofft man Teilchen zu
finden, die aufgrund der Annahme der Supersymmetrie vorhergesagt werden.

3.9.6.3 Die Cliffordalgebra eines Hilbertraumes und die Spingruppen

Es sei X ein reeller Hilbertraum mit dim X = n. Für die Cliffordalgebra C( X ) gilt X ⊆ C( X ) und

u ∨ v + v ∨ u = −2(u, v) X für alle u, v ∈ X ,

wobei (u, v) X das Skalarprodukt auf X bezeichnet.


Wir wählen eine Orthonormalbasis e1 , . . . , en von X. Dann gilt

e j ∨ ek + ek ∨ e j = −2δjk , j, k = 1, . . . , n ,

d. h., e j ∨ ek = −ek ∨ e j für j = k und

e j ∨ e j = −1 , j = 1, . . . , n .

Diese Beziehung verallgemeinert die Gleichung i2 = −1 für die imaginäre Einheit. Wir setzen
e0 := 1 und

e α : = e α1 ∨ eα 2 ∨ . . . ∨ eα k

für 1 ≤ α1 < · · · < αk ≤ n, α = (α1 , . . . , αk ) und |α| = α1 + · · · + αk , k = 1, . . . , n.


Basissatz: Es gilt dim C( X ) = 2n . Eine Basis von C( X ) wird durch e0 und alle eα gebildet.
 Beispiel 1: Es sei dim X = 1. Dann gilt e1 ∨ e1 = −1. Deshalb kann man mit den Elementen
a + be1 der Cliffordalgebra C( X ) im Fall dim X = 1 wie mit komplexen Zahlen rechnen, d. h.,
man hat die Isomorphie

C( X ) ∼
= C(R) ∼
=C
zwischen der Cliffordalgebra C(R ) und dem Körper C der komplexen Zahlen.
Der Hilbertraum C( X ): Wir versehen C( X ) mit dem eindeutig bestimmten Skalarprodukt
( ., . )C(X ) , bezüglich dessen die Basis e0 , eα , . . . orthonormiert ist, d. h., es gilt (e β , eγ )C(X ) = 0 für
β = γ und (e β , eγ )C( X ) = 1 für β = γ.
55
Das lange Zeit gesuchte sechste Quark (das Top-Quark) wurde 1994 am Fermilaboratorium (in der Nähe von Chicago)
entdeckt
3.9 Geometrien der modernen Physik 271

 Beispiel 2: Für C(R) gilt

( a + be1 , c + e1 d)C(X ) = ac + bd .

Die Cliffordnorm: Für jedes u ∈ C( X ) definieren wir

|u| := sup || u ∨ w||C(X ) .

Das Supremum ist über alle w ∈ C( X ) zu nehmen mit || w||C( X) ≤ 1.


 Beispiel 3: Im Fall von C(R ) erhalten wir

| a + be1 | = a2 + b2 .

Diese Formel entspricht dem Betrag | a + bi| der zu a + bi gehörigen komplexen Zahl a + be1 .
Der Operator der Konjugation: Durch die Festsetzung

ϕ ( e0 ) : = e 0 , ϕ ( e j ) : = −e j , j = 1, . . . , n ,

ergibt sich ein Automorphismus ϕ : C( X ) −→ C( X ) der Cliffordalgebra, d. h., die Abbildung ϕ


respektiert Linearkombinationen und das Produkt „∨“. Anstelle von ϕ(u ) schreiben wir u.
 Beispiel 4: Für j, k = 1, . . . , n gilt

e j = −e j , e j ∨ ek = e j ∨ e k = e j ∨ e k .

 Beispiel 5: Für C(R) erhält man

( a + e1 b) = a − be1 .

Das entspricht dem Übergang a + bi = a − bi zur konjugiert komplexen Zahl.


Der ∗-Operator: Wir setzen

e0∗ := e0 , e∗j := e j , j = 1, . . . , n .

Die Wirkung auf die übrigen Basiselemente erhält man durch Inversion der Produkte:

( e α 1 ∨ e α 2 ∨ . . . ∨ e α k ) ∗ : = e α k ∨ . . . ∨ e α2 ∨ e α 1 .

Schließlich ergibt sich der ∗-Operator auf C( X ) durch lineare Fortsetzung.


 Beispiel 6: ( a + be1 + ce1 ∨ e2 )∗ = a + be1 + c( e2 ∧ e1 ).
Die Quaternionen von Hamilton (1843): Wir betrachten alle formalen Summen

a+v

aus reellen Zahlen a und klassischen Vektoren v. Wir erklären eine Addition

( a + v) + ( b + w) : = ( a + b ) + ( v + w)

und eine Multiplikation

( a + v) ∨ (b + w) := ab + aw + bv + (v × w) − vw .

Dabei bezeichnet v × w (bzw. vw) das klassische Vektorprodukt (bzw. das klassische Skalarpro-
dukt).
272 3 Geometrie

Diese Operationen genügen dem Assoziativ- und Distributivgesetz. Ferner definieren wir

a + v := a − v .

Insbesondere ergibt sich

( a + v ) ∨ ( a + v ) = a 2 + v2 .
Schließlich setzen wir

| a + v| = a 2 + v2 .

Dann bilden alle diese Quaternionen einen Schiefkörper mit


a−v
( a + v) −1 = .
| a + v|

 Beispiel 7: Es sei i, j, k eine Orthonormalbasis. Dann gilt

i ∨ j = −j ∨ i = k , i ∨ i = −1 . (3.105)

Die übrigen Produkte erhält man durch die zyklische Vertauschung: i → j → k → i. Schreibt
man

a + v = a + αi + βj + γk ,

dann lässt sich die Multiplikation leicht mit Hilfe von (3.105) durchführen. Zum Beispiel gilt

(1 + i) ∨ (j + k) = j + k + i ∨ j + i ∨ k = j + k + k − j = 2k .

Satz: Ist X ein reeller Hilbertraum mit dim X = 2 und der Orthonormalbasis i und j, dann ist
die Cliffordalgebra C( X ) isomorph zur Algebra der Quaternionen. Dieser Isomorphismus wird
durch die Zuordnung

a + αi + βj + γ(i ∨ j) → a + αi + βj + γk.

gegeben. Dabei gehen Beträge und konjugierte Elemente ineinander über.


Die Drehformel von Hamilton: Es sei
ϕ ϕ
Q := cos + e sin
2 2
mit e2 = 1. Dann entspricht die elegante Formel

x = Q ∨ x ∨ Q (3.106)

einer Drehung des Vektors x um den Winkel ϕ im mathematisch positiven Sinn bezüglich der
Drehachse e (Abb. 3.97).
Unser Ziel ist es, die Formel (3.106) auf höhere Dimensionen mit Hilfe von Cliffordalgebren
zu verallgemeinern.
Die Gruppe Spin(n, X ), n ≥ 2: Die Gesamtheit aller Produkte

a = u1 ∨ u2 ∨ . . . ∨ u2k ,

die eine gerade Anzahl von Faktoren enthalten und zusätzlich die beiden Bedingungen

a ∨ a∗ = 1 und | a| = 1
3.9 Geometrien der modernen Physik 273

x

e x

Abb. 3.97

erfüllen, bilden bezüglich der Multiplikation „∨” eine Gruppe, die wir mit Spin(n, X ) bezeichnen.
Satz von Brauer und Weyl (1935): Jedes Element a ∈ Spin(n, X ) erzeugt durch

D ( a ) u : = a ∨ u ∨ a∗ für alle u∈X

eine unitäre Tranformation (Drehung) D ( a) : X −→ X. Die Zuordnung

a → D (a)

erzeugt einen Homomorphismus von der Gruppe Spin(n, X ) auf die Gruppe SO(n, X ) mit dem
Kern N = { I, − I }. Deshalb hat man den Isomorphismus56

Spin (n, X )/N ∼


= SO(n, X ) .

Für X = R n schreiben wir Spin( n) anstelle von Spin( n, X ).


 Beispiel 8: Man hat die folgenden Gruppenisomorphismen:
(i) SO(2) ∼
= U (1), R/Z ∼ = SO(2); die additive Gruppe R der reellen Zahlen ist die universelle
Überlagerungsgruppe der Gruppe SO(2).
(ii) Spin(3) ∼
= SU (2).
(iii) Spin(4) ∼
= SU (2) × SU (2).
∼ Spin(n) für jeden reellen Hilbertraum X mit dim X = n.
(iv) Spin( n, X ) =
Der elliptische Diracoperator: Dieser Operator wird durch
n
Dψ := ∑ e j ∂ j ψ.
j =1

definiert. Er wirkt auf Funktionen ψ : R n −→ C( X ) mit Werten in der Cliffordalgebra C( X ).


Außerdem definieren wir den Laplaceoperator57

n
Δ := ∑ ∂2j .
j =1

Satz: Es gilt

D ∨ D = −Δ .

56
Spin(n, X ) ist für n ≥ 2 eine reelle kompakte Liegruppe der Dimension n (n − 1)/2. Ferner ist Spin(n, X ) für n ≥ 3 die
universelle Überlagerungsgruppe von SO(n, X ).
57
In der Literatur werden D und Δ zum Teil mit anderen Vorzeichen eingeführt.
274 3 Geometrie

Kommentar: Diese Relation zeigt, dass der Laplaceoperator aus dem Diracoperator aufgebaut
werden kann. Das ist einer der Gründe, warum der Diracoperator eine fundamentale Rolle in der
modernen Analysis spielt. Die Aufgabe, den Index des Diracoperators auf Mannigfaltigkeiten zu
berechnen, führte beispielsweise um 1960 zur Entdeckung des Atiyah-Singer-Indextheorems, das
zu den tiefsten Resultaten der Mathematik des 20. Jahrhunderts gehört (vgl. 19.11).

3.9.7 Fast komplexe Strukturen

Definition: Ein reeller linearer Raum X der geraden Dimension 2n heißt genau dann fast
komplex, wenn ein linearer bijektiver Operator J : X −→ X existiert mit

J2 = − I .

Satz: Jeder fast komplexe (reelle) lineare Raum X mit dim X = 2n wird durch

(α + βi)u := αu + βJu
für alle α, β ∈ R und u ∈ X zu einem komplexen linearen Raum der Dimension n.

3.9.8 Symplektische Geometrie

Definition: Unter einem symplektischen linearen Raum X verstehen wir einen reellen linearen
Raum X der geraden Dimension 2n, auf dem eine bilineare Abbildung ω : X × X −→ R gegeben
ist, so dass gilt:
(i) ω ist schiefsymmetrisch, d. h., man hat ω (u, v ) = −ω (v, u ) für alle u, v ∈ X.
(ii) ω ist nichtentartet, d. h., aus ω (u, v ) = 0 für alle u ∈ X folgt v = 0.
Basissatz: In einem symplektischen linearen Raum existiert eine Basis e1 , . . . , en , f 1 , . . . , f n , so
dass
ω ( e j , ek ) = ω ( f j , f k ) = 0 ,
ω (e j , f k ) = δjk , j, k = 1, . . . , n .

gilt. Jede derartige Basis von X heißt symplektische Basis.


Normalform von ω: Setzen wir

dqi (e j ) = dpi ( f j ) = δij , dqi ( f j ) = dpi ( e j ) = 0 , i, j = 1, . . . , n ,

dann hat man

n
ω= ∑ dq j ∧ dp j .
j =1

Insbesondere ergibt sich

dω = 0 .

Mit u = q1 e1 + · · · + qn en + p1 f 1 + · · · + pn f n erhalten wir


n
ω (u, u ) = ∑ q j pj − p j qj for all u, u ∈ X .
j =1
3.9 Geometrien der modernen Physik 275

In der Sprache der Matrizen bedeutet das


⎛  ⎞
  q1
0 In ⎜ . ⎟
ω (u, u ) = (q1 , . . . , qn , p1 , . . . , pn ) ⎝ .. ⎠
− In 0
pn
(In ist die n-dimensionale Einheitsmatrix).
Symplektische Abbildungen: Unter einer symplektischen Abbildung A : X −→ X verstehen
wir eine lineare Abbildung mit

ω ( Au, Av) = ω (u, v ) für alle u, v ∈ X .

Eine lineare Abbildung A : X −→ X ist genau dann symplektisch, wenn sie symplektische Basen
wieder in symplektische Basen transformiert.
Die symplektische Gruppe Sp (2n, X ): Alle symplektischen Abbildungen A : X −→ X bilden
eine Gruppe, die wir die symplektische Gruppe Sp(2n, X ) von X nennen.
Die Invarianten dieser Gruppe sind Eigenschaften der symplektischen Geometrie von X.
Volumen: Wir definieren die Volumenform

μ := ω ∧ ω ∧ . . . ∧ ω (n Faktoren) .

Das Volumen einer Menge G in X wird dann analog zu 3.9.2. durch



Vol(G ) := μ.
G

definiert. Für A ∈ Sp(2n, X ) gilt Vol ( A(G )) = Vol (G ).


Bezüglich einer symplektischen Basis hat man

μ = αdq1 ∧ dq2 ∧ . . . ∧ dqn ∧ dp1 ∧ . . . ∧ dpn

mit einem geeigneten reellen Faktor α. Deshalb stimmt das symplektische Volumen bis auf den
Faktor α mit dem klassischen Volumen überein.
Qrthogonalität: Zwei Vektoren u, v ∈ X sind genau dann zueinander orthogonal, wenn
ω (u, v) = 0 gilt.
Lagrangesche Unterräume: Ein linearer Unterraum L von X heißt genau dann isotrop, wenn

ω (u, v) = 0 für alle u, v ∈ L gilt.

Ein derartiger Unterraum wird genau dann ein Lagrangescher Unterraum genannt, wenn er sich
nicht zu einem umfassenderen isotropen Unterraum erweitern lässt. Lagrangesche Unterräume
haben stets die Dimension n.
Die fast komplexe Struktur eines symplektischen Raumes: Es sei e1 , . . . , en , f 1 , . . . eine sym-
plektische Basis von X. Wir konstruieren durch die Formel
n
(u, u ) := ∑ q j qj + p j pj
j =1

mit u = q1 e1 + · · · + qn en + p1 f 1 + · · · + pn f n ein Skalarprodukt auf X. Dann existiert ein


eindeutig bestimmter linearer bijektiver Operator J : X −→ X mit der Eigenschaft

ω (u, v) = ( Ju, v) für alle u, v ∈ X .


276 Literatur zu Kapitel 3

Wegen J 2 = − I ist X fast komplex bezüglich J (vgl. 3.9.7.).


Satz: Eine lineare Abbildung A : X −→ X ist genau dann symplektisch, wenn gilt:

A∗ J A = J .

Symplektische Matrizen: Setzen wir b j := e j und bn+ j := f j für j = 1, . . . , n, und ordnen wir
jedem linearen Operator A : X −→ X die Matrix A := ( a jk ) zu mit

a jk := (b j , Abk ) ,

dann entspricht dem Operator J die Matrix


 
0 In
S := .
− In 0

Ferner ist A genau dann symplektisch, wenn die zugehörige Matrix A symplektisch ist, d. h., es
gilt

AT SA = S .

Alle diese Matrizen bilden die symplektische Matrizengruppe Sp(2n). Die Zuordnung A → A
vermittelt einen Isomorphismus von Sp(2n, X ) auf Sp(2n).

Literatur zu Kapitel 3
[Abhyankar 1990] Abhyankar, S.: Algebraic Geometry for Scientists and Engineers. Amer. Math. Soc.,
Providence, Rhode Island (1990)
[Abhyankar 1988] Abhyankar, S.: Resolution of Singularities of Embedded Algebraic Surfaces. Springer,
New York (1988)
[Abraham und Marsden 1978] Abraham, R., Marsden J.: Foundations of Mechanics (based on symplectic
geometry). Benjamin, Reading Massachusetts (1978)
[Adams 1995] Adams, C.: Das Knotenbuch. Einführung in die mathematische Theorie der Knoten. Spektrum
Akademischer Verlag, Heidelberg (1995)
[Agricola und Friedrich 2010] Agricola, I, Friedrich, T.: Vektoranalysis. Vieweg+Teubner, Wiesbaden (2010)
[Agricola und Friedrich 2011] Agricola, I, Friedrich, T.: Elementargeometrie. Vieweg+Teubner, Wiesbaden
(2011)
[Bär 2010] Bär, C.: Elementare Differentialgeometrie. De Gruyter, Berlin (2010)
[Benn und Tucker 1987] Benn, I., Tucker, R.: An Introduction to Spinors and Geometry with Applications in
Physics. Adam Hilger, Bristol (1987)
[Berger 1987] Berger, M.: Geometry I, II. Springer, Berlin (1987)
[Berger und Gostiaux 1988] Berger, M., Gostiaux, B.: Differential Geometry. Springer, Berlin (1988)
[Beutelspacher und Rosenbaum 2004] Beutelspacher, A., Rosenbaum, U.: Projektive Geometrie. Von den
Grundlagen bis zur Anwendung. Vieweg+Teubner, Wiesbaden (2004)
[Boltjanskij und Efrimovič 1986] Boltjanskij, V., Efrimovič, V.: Anschauliche kombinatorische Topologie.
Deutscher Verlag der Wissenschaften, Berlin (1986)
[Bredon 1993] Bredon, G.: Topology and Geometry, Springer, New York (1993)
[Brieskorn 1983] Brieskorn, E., Lineare Algebra und analytische Geometrie. Vieweg , Wiesbaden (1983)
[Brieskorn und Knörrer 1981] Brieskorn, E., Knörrer, H.: Ebene algebraische Kurven. Birkhäuser, Basel (1981)
[Choquet-Bruhat et al. 1986] Choquet-Bruhat, Y., DeWitt-Morette, C., Dillard-Bleick, M.: Analysis, Manifolds,
and Physics. Vol. 1: Basics. Vol 2: 92 Applications. Elsevier, Amsterdam (1996)
[Coxeter 1996] Coxeter, H.: Unvergängliche Gemetrie. 2, Auflage. Birkhäuser, Boston (1996)
Literatur zu Kapitel 3 277

[Coxeter 1995] Coxeter, H.: Projective Geometry. Springer, New York (1995).
[Cox et al. 1996] Cox, D., Little, J., O’Shea, D.: Ideals, Varieties, and Algorithms. An Introduction to Compu-
tational Algebraic Geometry and Commutative Algebra. Springer, New York (1996)
[Crantz und Hauptmann 1962, 1] Crantz, P., Hauptmann, M.: Ebene Trigonometrie. 11. Auflage. Teubner,
Leipzig (1962)
[Crantz und Hauptmann 1962, 2] Crantz, P, Hauptmann, M.: Sphärische Trigonomterie. 8. Auflage. Teubner,
Leipzig (1962)
[Diamond und Shurman 2005] Diamond, F., Shurman, J.: A First Course in Modular Forms. Springer. Berlin
(2005)
[Dubrovin et al. 1992] Dubrovin, B., Fomenko, A., Novikov, S.: Modern Geometry: Methods and Applicati-
ons, Vols. 1–3. Springer, New York (1992)
[Eisenbud 1994] Eisenbud, D.: Commutative Algebra with a View Toward Algebraic Geometry. Springer,
New York (1994)
[Farmelo 2003] Farmelo, G. (ed.): It Must be Beautiful. Great Equations of Modern Science. Granta Publicati-
ons, London (2003)
[Felsager 1997] Felsager, B.: Geometry, Particles, and Fields. Springer, New York (1997)
[Fischer 2001] Fischer, G.: Analytische Geometrie. Vieweg+Teubner, Wiesbaden (2001)
[Fischer 1994] Fischer, G.: Ebene algebraische Kurven. Vieweg, Wiesbaden (1994)
[Frankel 2004] Frankel, T.: The Geometry of Physics. 2nd edition. Cambridge University Press, Cambridge,
United Kingdom (2004)
[Friedrich 1997] Friedrich, T.: Dirac-Operatoren in der Riemannschen Geometrie. Vieweg, Braunschweig
(1997)
[Fucke et al. 2007] Fucke, R., Kirch, K., Nickel, H.: Darstellende Geometrie für Ingenieure. Carl Hanser
Verlag, München (2007)
[Fuchs und Tabachnikov 2011] Fuchs, D., Tabachnikov, S.: Ein Schaubild der Mathematik. Springer, Berlin
(2011)
[Gilbert und Murray 1991] Gilbert, J., Murray, M.: Clifford Algebras and Dirac Operators in Harmonic
Analysis. Cambridge University Press, Cambridge, United Kingdom (1991)
[Glaeser 2007] Glaeser, G.: Geometrie und ihre Anwendungen in Kunst, Natur und Technik. Spektrum
Akademischer Verlag, Heidelberg (2007)
[Glaeser und Polthier 2010] Glaeser, G., Polthier, K.: Bilder der Mathematik. Spektrum Akademischer Verlag,
Heidelberg (2010)
[Görtz und Wedhorn 2010/11] Görtz, U., Wedhorn, T.: Algebraic Geometry I, II. Vieweg+Teubner, Wiesba-
den (2010/11)
[Greene 2006] Greene, B.: Das elegante Universum. Superstrings, verborgene Dimensionen und die Suche
nach der Weltformel. 6. Auflage. Goldmann, München (2006)
[Griffith und Harris 1978] Griffith, P, Harris, J.: Prinicples of Algebraic Geometry, Wiley. New York (1978)
[Griffiths und Harris 2006/2011] Griffiths, P., Harris, J.: Geometry of Algebraic Curves. Vols. I, II. Springer,
New York (2006/11)
[Guillemin und Pollack 1974] Guillemin, V., Pollack, A.: Differential Topology. Prentice Hall, Englewood
Cliffs, New Jersey (1974)
[Guillemin und Sternberg 1989] Guillemin, V., Sternberg, S.: Geometric Asymptotics. Amer. Math. Soc.
Providence, Rhode Island (1989)
[Guillemin und Sternberg 1990] Guillemin, V., Sternberg, S.: Symplectic Techniques in Physics. Cambridge
University Press, Cambridge, United Kingdom (1990)
[Harder 2011] Harder, G.: Lectures on Algebraic Geometry I, II. Vieweg+Teubner, Wiesbaden (2011/12)
[Hartshorne 1997] Hartshorne, R.: Algebraic Geometry, Springer, New York (1997)
[Hellegouarch 2002] Hellegouarch, Y.: Invitation to the Mathematics of Fermat–Wiles. Academic Press, New
York (2002)
[Henkel 1999] Henkel, M.:. Conformal Invariance and Critical Phenomena (in Physics). Springer, Berlin
(1999)
278 Literatur zu Kapitel 3

[Hilbert 1999] Hilbert, D.: Grundlagen der Geometrie. Mit Supplementen von P. Bernays. 13. Auflage.
Teubner, Leipzig (1999)
[Hilbert und Cohn-Vossen] Hilbert, D., Cohn-Vossen, S.: Anschauliche Geometrie, Springer, Berlin (1932)
[Hofer und Zehnder 1994] Hofer, H., Zehnder, E.: Sympletcic Invariants and Hamiltonian Dynamics. Birk-
häuser, Basel (1994)
[Hulek 2000] Hulek, K.: Elementare algebraische Geometrie. Vieweg, Wiesbaden (2000)
[Husemoller 2004] Husemoller, D.: Elliptic Curves. Springer, New York (2004)
[Joswig und Theobald 2007] Joswig, M., Theobald, T.: Algorithmische Geometrie. Vieweg+Teubner, Wiesba-
den (2007)
[Jost und Eschenburg 2007] Jost, J., Eschenburg, J.-H.: Differentialgeometrie und Minimalflächen. Springer,
Berlin (2007)
[Jost 2011] Jost, J., Riemannian Geometry and Geometric Analysis. 6th edition, Springer, Berlin (2011)
[Jost 2009] Jost, J.: Geometry and Physics. Springer, Berlin (2009)
[Klein 1968] Klein, F.: Vorlesungen über höhere Geometrie. Springer, Berlin (1968)
[Klein 2009] Klein, F.: Einleitung in die höhere Geometrie, BiblioBazaar, Charlston (2009)
[Klein 1979] Klein, F.: Vorlesungen über die Entwicklung der Mathematik im 19. Jahrhundert, Bd. 1, 2.
Springer, Berlin (1979)
[Kock und Vainsencher 2006] Kock, J., Vainsencher, I. (2006): An Invitation to Quantum Cohomology. Kont-
sevich’s Formula for Plane Curves. Birkhäuser, Basel (2006)
[Kostrikin und Manin 1989] Kostrikin, A., Manin, Yu.: Linear Algebra and Geometry. Gordon and Breach,
New York (1989)
[Kosyakov 2007] Kosyakov, B.: Introduction to the Classical Theory of Particles and Fields. Springer, Berlin
(2007)
[Knörrer 2006] Knörrer, H.: Geometrie. Geometrische Anschauung auf hohem Niveau. Vieweg+Teubner,
Wiesbaden (2006)
[Koecher und Krieg 2007] Koecher, M., Krieg, A.: Ebene Geometrie. Springer, Berlin (2007)
[Kühnel 2010] Kühnel, W.: Differentialgeometrie. Vieweg+Teubner, Wiesbaden (2010)
[Kunz 2010] Kunz, E.: Einführung in die algebraische Geometrie. Vieweg+Teubner, Wiesbaden (2010)
[Lang 1995, 1] Lang, S.: Introduction to Diophantine Approximation. Springer, Berlin (1995)
[Lang 1995, 2] Lang, S.: Introduction to Algebraic and Abelian Functions. 2nd edition. Springer, New York
(1995)
[Lang 1995, 3] Lang, S.: Introduction to Modular Forms. 2nd edition. Springer, New York (1995)
[Lang 1999] Lang, S.: Fundamentals of Differential Geometry, Springer, New York (1999)
[Laures und Szymik 2009] Laures, G., Szymik, M.: Grundkurs Topologie. Spektrum Akademischer Verlag,
Heidelberg (2009)
[Lawson und Michelsohn 1989] Lawson, H., Michelsohn, H.: Spin Geometry. Princeton University Press,
Princeton, New Jersey (1989)
[Livingstone 1995] Livingstone, C.: Knotentheorie für Einsteiger. Vieweg Verlagsgesellschaft (1995)
[Lück 2005] Lück, W.: Algebraische Topologie, Vieweg+Teubner, Wiesbaden (2005)
[Massey 1987] Massey, W.: Algebraic Topology: An Introduction. 7th printing. Springer, New York (1987)
[Massey 1980] Massey, W.: Singular Homology Theory. Springer, New York (1980)
[Matthews 1993] Matthews, V.: Vermessungskunde, Bd. 1, 2. 16. Auflage. Teubner, Stuttgart (1993)
[Nakahara 2003] Nakahara, M.: Geometry, Topology and Physics. 2n edition. Institute of Physics Publishing,
Bristol (2003)
[Nash und Sen 2011] Nash, C., Sen, S.: Topology and Geometry for Physicists. Dover, Mineola, New York
(2011)
[Novikov und Fomenko 1978] Novikov, S., Fomenko, A.: Basic Elements of Differential Geometry and
Topology. Kluwer, Dordrecht (1978)
[Novikov und Taimanov 2006] Novikov, S., Taimanov, T.: Geometric Structures and Fields in Physics. Amer.
Math. Soc., Providence, Rhode Island (2006)
Literatur zu Kapitel 3 279

[Oloff 2010] Oloff, R.: Geometrie und Raumzeit. Vieweg+Teubner, Wiesbaden (2010)
[O’Shea 2007] O’Shea, D.: Die Poincaré-Vermutung. Fischer, Frankfurt/Main (2007)
[Ossa 2009] Ossa, E.: Topologie, Vieweg+Teubner, Wiesbaden (2009)
[Scharlau und Opolka 1980] Scharlau, W., Opolka, H.: Von Fermat bis Minkowski. Springer, Berlin (1980)
[Scheid und Schwarz 2006] Scheid, H., Schwarz, W.: Elemente der Geometrie. Spektrum Akademischer
Verlag, Heidelberg (2006)
[Scriba und Schreiber 2003] Scriba, C., Schreiber, P.: 5000 Jahre Geometrie. Geschichte, Kulturen, Menschen.
Springer, Berlin (2003)
[Shafarevich 1994] Shafarevich, I.: Basic Algebraic Geometry. Vol 1: Varieties in Projective Space. Vol 2:
Schemes and Complex Manifolds. Springer, Berlin (1994)
[Singh 2001] Singh, S.: Fermats letzter Satz. Die abenteuerliche Geschichte eines mathematischen Rätsels,
das die größten Geister über 385 Jahre lang beschäftigte. 6. Auflage. Hanser Verlag, München (2001)
[Singh 2005] Singh, S.: Big bang. Der Ursprung des Kosmos und die Erfindung der modernen Naturwissen-
schaft. Hanser Verlag, München (2005)
[Smith und Kahanpää 2000] Smith, K., Kahanpää, L., Kekäläinen, P., Traves, W.: An Invitation to Algebraic
Geometry, Springer, New York (2000)
[Spivak 1979] Spivak, M.: A Comprehensive Introduction to Differential Geometry. Vols. 1–5. Publish or
Perish, Boston (1979)
[Straumann 2004] Straumann, N.: General Relativity with Applications to Astrophysics. Springer, New York
(2004)
[Triebel 2011] Triebel, H.: Anmerkungen zur Mathematik. Drei Vorträge. 1. Über das Verhältnis von Geo-
metrie und Realität im Wandel der Zeiten (anläßlich des 100. Geburtstages von Einstein), Jena 1979.
2. Mathematische Modellbildung, Berlin 1993. 3. Grundlagen der Mathematik, Leipzig 2011. EAGLE,
Leipzig (2011)
[Weinberg 2008] Weinberg, S.: Cosmology. Oxford University Press, Oxford (2008)
[Wünsch 1997] Wünsch, V.: Differentialgeometrie der Kurven und Flächen. Teubner, Leipzig (1997). 2. Aufla-
ge, Wissenschaftsverlag Thüringen, Ilmenau (2012)
[Wussing 2011] Wussing, H.: Carl Friedrich Gauß. Biographie und Dokumente. EAGL, Leipzig (2011),
2. Aufl., Wissenschaftsverlag, Thüringen (2012)
[Yau und Nadis 2010] Yau, S., Nadis, S.: The Shape of Inner Space. String Theory and the Geometry of the
Universe’s Hidden Dimensions. Basic Books, New York (2010)
[Zeidler 1997] Zeidler, E.: Nonlinear Functional Analysis and its Applications. Vol. 4: Applications to
Mathematical Physics. 2nd edition. Springer, New York (1997)
[Zeidler 2011] Zeidler, E.: Quantum Field Theory. A Bridge between Mathematicians and Physicists. Vol. 3:
Gauge Theory (from Gauss’ theorema egregium on the curvature of surfaces to both Einstein’s theory of
gravitation and the modern theory of elementary particles). Springer, Berlin (2011)
K APITEL 4

G RUNDLAGEN DER M ATHEMATIK

Wir müssen wissen,


Wir werden wissen.1
David Hilbert (1862–1943)

4.1 Der Sprachgebrauch in der Mathematik

Im Unterschied zur Umgangssprache benutzt die Mathematik eine sehr präzise Sprache, deren
Grundbegriffe wir hier erläutern wollen.

4.1.1 Wahre und falsche Aussagen

Unter einer Aussage versteht man ein sinnvolles sprachliches Gebilde, das entweder wahr oder
falsch sein kann.

Die Alternative: Bezeichnen A und B Aussagen, dann ist die zusammengesetzte Aussage

A oder B

wahr, wenn mindestens eine der beiden Aussagen wahr ist. Sind beide Aussagen A und B falsch,
dann ist auch die zusammengesetzte Aussage „A oder B “ falsch.
 Beispiel 1: Die Aussage „2 teilt 4 oder 3 teilt 5“ ist wahr, denn die erste Aussage ist wahr.
Dagegen ist die Aussage „2 teilt 5 oder 3 teilt 7“ falsch, denn keine der beiden Aussagen ist
wahr.

Die strenge Alternative: Die Aussage

entweder A oder B

ist wahr, wenn eine der beiden Aussagen wahr und die andere falsch ist. Anderenfalls ist die
zusammengesetzte Aussage falsch.
 Beispiel 2: Es sei m eine ganze Zahl. Die Aussage „entweder ist m gerade oder m ist ungerade“
ist wahr.
Dagegen ist die Aussage „entweder ist m gerade oder m ist durch 3 teilbar“ falsch.

Die Konjunktion: Die Aussage

A und B
1
Diese Worte Hilberts stehen auf seinem Grabstein in Göttingen. Obwohl sich Hilbert sehr wohl der Grenzen menschlicher
Erkenntnis bewusst war, drückt dieser Satz seine optimistische erkenntnistheoretische Grundhaltung aus.

E. Zeidler (Hrsg.), Springer-Handbuch der Mathematik II,


DOI 10.1007/978-3-658-00297-8_3, © Springer Fachmedien Wiesbaden 2013
282 4 Grundlagen der Mathematik

ist wahr, wenn beide Aussagen wahr sind. Anderenfalls ist diese Aussage falsch.
 Beispiel 3: Die Aussage „2 teilt 4 und 3 teilt 5“ ist falsch.

Negation: Die Aussage

nicht A

ist wahr (bzw. falsch) wenn A falsch (bzw. wahr) ist.

Existenzaussagen: Es sei D ein festumrissener Bereich von Dingen. Zum Beispiel kann D
die Menge der reellen Zahlen bedeuten.
Anstelle der Aussage

es gibt ein Ding x in D mit der Eigenschaft E

schreibt man kurz:

∃ x ∈ D : E (oder ∃ x ∈ D | E).

Eine solche Aussage ist wahr, wenn es ein Ding x in D mit der Eigenschaft E gibt, und diese
Aussage ist falsch, wenn es kein Ding x in D mit der Eigenschaft E gibt.
 Beispiel 4: Die Aussage „es gibt eine reelle Zahl x mit x2 + 1 = 0“ ist falsch.

Generalisatoren: An Stelle der Aussage

alle Dinge x aus D haben die Eigenschaft E

schreiben wir kurz:

∀ x ∈ D : E (oder ∀ x ∈ D | E).

Diese Aussage ist wahr, wenn alle Dinge x in D die Eigenschaft E haben, und diese Aussage ist
falsch, wenn es ein Ding x in D gibt, das die Eigenschaft E nicht hat.
 Beispiel 5: Die Aussage „alle ganzen Zahlen sind Primzahlen“ ist falsch, denn 4 ist keine
Primzahl.

4.1.2 Implikationen

Anstelle der Aussage

aus A folgt B

benutzen wir auch das Zeichen

A ⇒ B. (4.1)

Man nennt eine solche zusammengesetzte Aussage eine Schlussfolgerung (Implikation). Anstelle
von (4.1) haben sich auch die folgenden beiden festen Sprechweisen eingebürgert:
4.1 Der Sprachgebrauch in der Mathematik 283

(i) A ist hinreichend für B ;


(ii) B ist notwendig für A.
Die Implikation „A ⇒ B “ ist falsch, wenn die Voraussetzung A wahr und die Behauptung B
falsch ist. Anderenfalls ist die Implikation stets wahr. Das entspricht der zunächst überraschenden
Konvention in der Mathematik, Schlussfolgerungen aus falschen Voraussetzungen stets als
wahr anzusehen. Kurz: Mit Hilfe einer falschen Voraussetzung kann man alles beweisen. Das
folgende Beispiel zeigt, dass diese Konvention sehr natürlich ist und der üblichen Formulierung
mathematischer Sätze entspricht.
 Beispiel 1: Es sei m eine ganze Zahl. Die Aussage A (bzw. B ) laute: m ist durch 6 teilbar (bzw.
m ist durch 2 teilbar). Die zusammengesetzte Aussage A ⇒ B kann dann so formuliert werden:

Aus der Teilbarkeit von m durch 6 folgt die Teilbarkeit von m durch 2. (4.2)

Man sagt auch:


(a) Die Teilbarkeit von m durch 6 ist hinreichend für die Teilbarkeit von m durch 2.
(b) Die Teilbarkeit von m durch 2 ist notwendig für die Teilbarkeit von m durch 6.
Wir haben das Gefühl, dass die Aussage (4.2) stets wahr ist, d. h., sie stellt einen mathematischen
Satz dar.
Tatsächlich müssen wir zwei Fälle unterscheiden.
Fall 1: m ist durch 6 teilbar.
Dann gibt es eine ganze Zahl k mit m = 6k. Daraus folgt m = 2(3k), d. h., m ist auch durch 2
teilbar.
Fall 2: m ist nicht durch 6 teilbar. Dann ist die Voraussetzung falsch, und die Schlussfolgerung
(4.2) ist nach unserer Konvention richtig.
Insgesamt ist also die Aussage (4.2) stets wahr. Die vorangegangene Argumentation nennt
man einen Beweis.

Logische Äquivalenzen: Es ist falsch, aus A ⇒ B auf B ⇒ A zu folgern. Beispielsweise


darf man die Aussage (4.2) nicht umkehren. Man sagt auch, die Teilbarkeit von m durch 2 ist
notwendig, aber nicht hinreichend für die Teilbarkeit von m durch 6.
Eine Aussage der Form

A ⇐⇒ B (4.3)

steht für A ⇒ B und B ⇒ A. Anstelle der sogenannten logischen Äquivalenz (4.3) verwendet
man in der Mathematik die folgende feststehende Sprechweise:
(i) A gilt genau dann, wenn B gilt.
(ii) A ist hinreichend und notwendig für B .
(iii) B ist hinreichend und notwendig für A.
 Beispiel 2: Es sei m eine ganze Zahl. Die Aussage A (bzw. B ) laute: „m ist durch 6 teilbar“
(bzw. „m ist durch 2 und 3 teilbar“). Dann bedeutet A ⇐⇒ B :

Die ganze Zahl m ist genau dann durch 6 teilbar, wenn m durch 2 und 3
teilbar ist.

Man kann auch sagen: Die Teilbarkeit von m durch 2 und 3 ist hinreichend und notwendig für
die Teilbarkeit von m durch 6.
284 4 Grundlagen der Mathematik

Mathematische Aussagen in der Form von logischen Äquivalenzen enthalten stets ein gewisses
abschließendes Resultat und sind deshalb für die Mathematik von besonderer Bedeutung.

Kontraposition einer Implikation: Aus der Implikation A ⇒ B folgt stets die neue Implikati-
on:

nicht B ⇒ nicht A.

 Beispiel 3: Aus der Aussage (4.2) erhalten wir die neue Aussage: Ist m nicht durch 2 teilbar,
dann ist m auch nicht durch 6 teilbar.

Kontraposition einer logischen Äquivalenz: Aus der logischen Äquivalenz A ⇐⇒ B


erhalten wir die neue logische Äquivalenz

nicht A ⇐⇒ nicht B .

 Beispiel 4: Es sei ( an ) eine monotone reelle Zahlenfolge. Wir betrachten den Satz:2

( an ) ist konvergent ⇐⇒ (an ) ist beschränkt.

Daraus erhalten wir durch Negation den neuen Satz:

( an ) ist nicht konvergent ⇐⇒ ( an ) ist nicht beschränkt.

In Worten: (i) Eine monotone Folge ist genau dann konvergent, wenn sie beschränkt ist.
(ii) Eine monotone Folge ist genau dann nicht konvergent, wenn sie unbeschränkt ist.

4.1.3 Tautologien und logische Gesetze

Tautologien sind zusammengesetzte Aussagen, die unabhängig vom Wahrheitswert der einzelnen
Aussagen stets wahr sind. Unser gesamtes logisches Denken, das die Basis für die Mathematik
darstellt, beruht auf der Anwendung von Tautologien. Solche Tautologien kann man auch als
logische Gesetze auffassen. Die wichtigsten Tautologien lauten folgendermaßen.
(i) Die Distributivgesetze für Alternativen und Konjunktionen:

A und (B oder C) ⇐⇒ (A und B) oder (A und C) ,


A oder (B und C) ⇐⇒ (A oder B) und (A oder C) .

(ii) Negation der Negation:

nicht (nicht A ) ⇐⇒ A .

(iii) Kontraposition einer Implikation:

(A ⇒ B ) ⇐⇒ (nicht B ⇒ nicht A ) .

(iv) Kontraposition einer logischen Äquivalenz:

(A ⇐⇒ B ) ⇐⇒ (nicht A ⇐⇒ nicht B ) .
2
Unter einer konvergenten Folge verstehen wir hier eine Folge, die einen endlichen Grenzwert besitzt.
4.1 Der Sprachgebrauch in der Mathematik 285

(v) Negation einer Alternative (de Morgansche Regel):

nicht (A oder B ) ⇐⇒ ( nicht A und nicht B ) .

(vi) Negation einer Konjunktion (de Morgansche Regel):

nicht (A und B ) ⇐⇒ ( nicht A oder nicht B ) .

(vii) Negation einer Existenzaussage:

(nicht ∃ x | E ) ⇐⇒ (∀ x | nicht E) .

(viii) Negation einer generalisierenden Aussage:

(nicht ∀ x | E) ⇐⇒ (∃ x | nicht E) .

(ix) Negation einer Implikation:

nicht (A ⇒ B ) ⇐⇒ {A und nicht B } .

(x) Negation einer logischen Äquivalenz:

nicht (A ⇐⇒ B ) ⇐⇒ {(A und nicht B ) oder (B und nicht A )} .

(xi) Die fundamentale Abtrennungsregel (modus ponens) des Theophrast von Eresos (372 v.
Chr. bis 287 v. Chr.):

{(A ⇒ B ) und A } ⇒ B .

Die beiden Tautologien in (i) sind verantwortlich für die Distributivgesetze (bezüglich Durch-
schnitt und Vereinigung) in der Mengenlehre (vgl. 4.3.2).
Das Gesetz der Negation der Negation besagt, dass die doppelte Verneinung einer Aussage
zur ursprünglichen Aussage logisch äquivalent ist.
Die Tautologien (iii) und (iv) haben wir bereits in den Beispielen 3 und 4 von 4.1.2 benutzt.
Die Tautologien (iv) bis (x) werden sehr oft bei indirekten mathematischen Beweisen verwendet
(vgl. 4.2.1).
Die Abtrennungsregel (xi) enthält das folgende logische Gesetz, das sehr oft in der Mathematik
benutzt wird und deshalb den Rang eines logischen Hauptgesetzes besitzt:

Folgt die Behauptung B aus der Voraussetzung A und ist die Voraussetzung
A erfüllt, dann gilt auch die Behauptung B .

Die de Morgansche Regel (v) beinhaltet das folgende logische Gesetz:

Die Negation einer Alternative ist logisch äquivalent zur Konjunktion der
negierten Alternativaussagen.
286 4 Grundlagen der Mathematik

 Beispiel: Es sei m eine ganze Zahl. Dann gilt:


(i) Trifft auf die Zahl m nicht zu, dass sie gerade oder durch 3 teilbar ist, dann ist m nicht
gerade und m nicht durch 3 teilbar.
(ii) Trifft auf die Zahl m nicht zu, dass sie gerade und durch 3 teilbar ist, dann ist m nicht
gerade oder m nicht durch 3 teilbar.
Die Tautologie (vii) lautet in Worten: Gibt es kein Ding x mit der Eigenschaft E, dann besitzen
alle Dinge x nicht die Eigenschaft E und umgekehrt.
Die Tautologie (viii) lautet explizit: Stimmt es nicht, dass alle Dinge x die Eigenschaft E haben,
dann gibt es ein Ding x, das die Eigenschaft E nicht besitzt und umgekehrt.

4.2 Beweismethoden

4.2.1 Indirekte Beweise

Viele Beweise in der Mathematik werden so geführt: Man nimmt an, dass die Behauptung falsch
ist und führt diese Annahme zum Widerspruch.
Den folgenden Beweis findet man bereits bei Aristoteles.

 Beispiel: Die Zahl 2 ist nicht rational.

Beweis (direkt): Wir nehmen an, dass die Behauptung falsch ist. Dann ist 2 eine rationale
Zahl und lässt sich in der Form
√ m
2= (4.4)
n
mit ganzen Zahlen m und n = 0 darstellen. Wir dürfen ferner annehmen, dass die beiden Zahlen
m und n keinen echten gemeinsamen Teiler besitzen. Das lässt sich stets durch Kürzen des
Bruches in (4.4) erreichen.
Wir benutzen nun die folgenden beiden elementaren Tatsachen für eine beliebige ganze Zahl p.
(i) Ist p gerade, dann ist p2 durch 4 teilbar.
(ii) Ist p ungerade, dann ist auch p2 ungerade.3
Quadrieren von (4.4) ergibt

2n2 = m2 . (4.5)

Die Quadratzahl m2 ist somit gerade. Folglich muss auch m gerade sein. Dann ist m2 durch 4
teilbar, und n2 ist nach (4.5) gerade. Somit sind m und n gerade. Das widerspricht jedoch der
Tatsache, dass m und n keine echten gemeinsamen Teiler besitzen.

Dieser Widerspruch
√ zeigt, dass unsere ursprüngliche Annahme „ 2 ist rational“ falsch war.
Folglich ist 2 nicht rational. 

4.2.2 Induktionsbeweise

Das Induktionsgesetz aus 1.2.2.2 wird sehr oft in der folgenden Form angewandt. Gegeben sei
eine Aussage A(n ), die von der ganzen Zahl n mit n ≥ n0 abhängt. Ferner gelte folgendes:
(i) Die Aussage A( n) ist für n = n0 richtig.
(ii) Aus der Richtigkeit der Aussage A(n) folgt die Richtigkeit von A( n + 1).
3
Das folgt aus (2k )2 = 4k2 und (2k + 1)2 = 4k2 + 4k + 1.
4.2 Beweismethoden 287

Dann ist die Aussage A(n) für alle ganzen Zahlen n mit n ≥ n0 richtig.

 Beispiel: Es ist
n ( n + 1)
1+2+...+n = (4.6)
2
für alle positiven natürlichen Zahlen n, d. h., für n = 1, 2, . . .
Beweis: Die Aussage A(n) lautet: Es gilt (4.6) für die positive natürliche Zahl n.
1. Schritt (Induktionsanfang): A(n) ist offensichtlich für n = 1 richtig.
2. Schritt (Induktionsschritt): Es sei n irgendeine fest gewählte positive natürliche Zahl. Wir
nehmen an, dass A(n) gilt und haben zu zeigen, dass daraus die Gültigkeit von A( n + 1) folgt.
Addieren wir n + 1 zu beiden Seiten von (4.6), dann erhalten wir
n ( n + 1)
1 + 2 + . . . + n + ( n + 1) = +n+1.
2
Ferner gilt

(n + 1)(n + 2) n2 + n + 2n + 2 n ( n + 1)
= = +n +1.
2 2 2
Daraus folgt

(n + 1)(n + 2)
1 + 2 + . . . + n + ( n + 1) = .
2
Das entspricht A(n + 1).
3. Schritt (Induktionsschluss): Die Aussage A( n) gilt für alle natürlichen Zahlen n mit n ≥ 1. 

4.2.3 Eindeutigkeitsbeweise

Eine Eindeutigkeitsaussage beinhaltet, dass es höchstens ein mathematisches Objekt mit einer
vorgegebenen Eigenschaft gibt.

 Beispiel: Es gibt höchstens eine positive reelle Zahl x mit

x2 + 1 = 0 . (4.7)

Beweis: Angenommen, die beiden positiven reellen Zahlen a und b sind Lösungen. Aus a2 + 1 = 0
und b2 + 1 = 0 folgt a2 − b2 = 0. Das ergibt

( a − b)( a + b) = 0 .

Wegen a > 0 und b > 0 erhalten wir a + b > 0. Division durch a + b liefert a − b = 0. Folglich ist
a = b. 

4.2.4 Existenzbeweise

Man muss streng zwischen Eindeutigkeit und Existenz einer Lösung unterscheiden. Die Glei-
chung (4.7) besitzt höchstens eine positive reelle Lösung. Tatsächlich besitzt die Gleichung (4.7)
keine reelle Lösung. Denn wäre x eine reelle Lösung von (4.7), dann würde aus x2 ≥ 0 sofort
x2 + 1 > 0 folgen, was im Widerspruch zu x2 + 1 = 0 steht. Existenzbeweise sind in der Regel
wesentlich schwieriger als Eindeutigkeitsbeweise zu führen. Man unterscheidet zwischen
(i) abstrakten Existenzbeweisen und
288 4 Grundlagen der Mathematik

(ii) konstruktiven Existenzbeweisen.


 Beispiel 1: Die Gleichung

x2 = 2 (4.8)

besitzt eine reelle Zahl x als Lösung.

Abstrakter Existenzbeweis: Wir setzen

A := {a ∈ R : a < 0 oder { a ≥ 0 und a2 ≤ 2}} ,


B := { a ∈ R : a ≥ 0 und a2 > 2 } .

In Worten: Die Menge A besteht aus genau allen reellen Zahlen a, die einer der beiden
Bedingungen „a < 0“ oder „a ≥ 0 und a2 ≤ 2“ genügen.
Analog besteht die Menge B aus genau allen reellen Zahlen a mit a ≥ 0 und a2 > 2.
Offensichtlich gehört jede reelle Zahl a entweder zu A oder zu B. Wegen 0 ∈ A und 2 ∈ B
sind die beiden Mengen A und B nicht leer. Deshalb gibt es nach dem Vollständigkeitsaxiom in
1.2.2.1 eine reelle Zahl α mit der Eigenschaft:

a≤α≤b für alle a ∈ A und alle b ∈ B . (4.9)

Wir zeigen, dass α2 = 2 gilt. Anderenfalls haben wir wegen (±α)2 = α2 die beiden folgenden
Fälle zu unterscheiden.
Fall 1: α2 < 2 und α > 0.
Fall 2: α2 > 2 und α > 0.
Im Fall 1 wählen wir die Zahl ε > 0 so klein, dass

(α + ε)2 = α2 + 2εα + ε2 < 2.

gilt.4 Dann ist α + ε ∈ A. Nach (4.9) müsste dann α + ε ≤ α gelten, was unmöglich ist. Deshalb
scheidet Fall 1 aus. Analog ergibt sich, dass auch Fall 2 ausscheidet. 
Eindeutigkeitsbeweis: Wie in 4.2.3 zeigt man, dass die Gleichung (4.8) höchstens eine positive
Lösung x besitzt.

Die Existenz- und Eindeutigkeitsaussage: Damit haben wir gezeigt, dass √ die Gleichung
x2 = 2 genau eine positive reelle Lösung x besitzt, die man üblicherweise mit 2 bezeichnet.

Konstruktiver Existenzbeweis: Wir zeigen, dass das Iterationsverfahren

an 1
a n +1 = + , n = 1, 2, . . . (4.10)
2 an
√ √
mit a1 := 2 gegen 2 konvergiert, d. h., lim an = 2.
n→ ∞
1. Schritt: Wir zeigen, dass an > 0 für n = 1, 2, . . . gilt.
Das ist für n = 1 richtig. Ferner folgt aus an > 0 für ein festes n und aus (4.10), dass auch
an+1 > 0 gilt . Nach dem Induktionsgesetz ergibt sich deshalb an > 0 für n = 1, 2, . . .
2. Schritt: Wir zeigen, dass a2n ≥ 2 für n = 1, 2, . . . gilt.
 
2 − α2
4
Man kann beispielsweise ε = min ,1 wählen.
2α + 1
4.2 Beweismethoden 289

Diese Aussage ist für n = 1 richtig. Gilt a2n ≥ 2 für ein festes n, dann folgt aus der Bernoulli-
schen Ungleichung:5
 2  
2 − a2n 2 − a2n
a2n+1 = a2n 1 + ≥ a 2
n 1 + = 2.
2a2n a2n

Somit ist a2n+1 ≥ 2. Nach dem Induktionsgesetz gilt dann a2n ≥ 2 für n = 1, 2, . . .
3. Schritt: Aus (4.10) folgt

1 2 1 
a n − a n +1 = a n − an + = a2n − 2 ≥ 0 , n = 1, 2, . . .
2 an 2an
Somit ist die Folge ( an ) monoton fallend und nach unten beschränkt. Das Monotoniekriterium in
1.2.4.1 liefert die Existenz des Grenzwerts

lim an = x .
n→∞

Gehen wir in Gleichung (4.10) zum Grenzwert über, dann erhalten wir

x 1
x = lim an+1 = + .
n→ ∞ 2 x
Das bedeutet 2x2 = x2 + 2, also

x2 = 2.

Aus an ≥ 0 für alle n ergibt sich ferner x ≥ 0. Somit gilt x = 2. 

4.2.5 Die Notwendigkeit von Beweisen im Computerzeitalter

Man könnte meinen, dass theoretische Überlegungen in der Mathematik durch Höchstleistungs-
rechner überflüssig geworden sind. Das Gegenteil ist jedoch der Fall. Hat man ein mathematisches
Problem vorliegen, dann kann man es in der folgenden Form bearbeiten:
(i) Existenz der Lösung (abstrakter Existenzbeweis);
(ii) Eindeutigkeit der Lösung (Eindeutigkeitsbeweis);
(iii) Stabilität der Lösung gegenüber kleinen Störungen von Einflussgrößen des vorgelegten
Problems;
(iv) Entwicklung eines Algorithmus zur Berechnung der Lösung auf dem Computer;
(v) Konvergenzbeweis für den Algorithmus, d. h., man zeigt, dass der Algorithmus unter
gewissen Voraussetzungen gegen die eindeutige Lösung konvergiert;
(vi) Beweis von Fehlerabschätzungen für den Algorithmus;
(vii) Untersuchung der Konvergenzgeschwindigkeit des Algorithmus;
(viii) Beweis der numerischen Stabilität des Algorithmus.
Im Fall von (v) und (vi) ist es wichtig, dass die Existenz einer eindeutigen Lösung des Problems
durch abstrakte (möglicherweise nichtkonstruktive) Überlegungen gesichert ist; anderenfalls
kann ein Verfahren auf dem Computer eine Lösung vortäuschen, die gar nicht vorhanden ist
(sogenannte Geisterlösung).
5
Für alle reellen Zahlen r mit r ≥ −1 und alle natürlichen Zahlen n hat man
(1 + r)n ≥ 1 + nr.
290 4 Grundlagen der Mathematik

Ein Problem heißt genau dann korrekt gestellt, wenn (i), (ii) und (iii) vorliegen. Bei Fehlerab-
schätzungen unterscheidet man zwischen
(a) a priori Fehlerabschätzungen und
(b) a posteriori Fehlerabschätzungen.
Diese Bezeichnungen sind der Philosophie von Immanuel Kant (1724–1804) entlehnt. Eine a
priori Fehlerabschätzung liefert eine Information über den Fehler der Näherungslösung vor der
Rechnung auf dem Computer. Dagegen nutzen a posteriori Fehlerabschätzungen die Informationen
aus, die man auf Grund durchgeführter Rechnungen auf dem Computer besitzt. Es gilt die
Faustregel:

A posteriori Fehlerabschätzungen sind genauer als a priori Fehlerabschätzungen.

Algorithmen müssen numerisch stabil sein, d. h., sie müssen robust gegenüber auftretenden
Rundungsfehlern im Computer sein. Besonders vorteilhaft bezüglich der numerischen Stabilität
sind Iterationsverfahren.

 Beispiel: Wir betrachten
√ die Folge ( an ) aus (4.10) zur iterativen Berechnung von 2. Den
absoluten Fehler an − 2 bezeichnen wir mit Δn . Für n = 1, 2, . . . gelten die folgenden Abschät-
zungen.
(i) Konvergenzgeschwindigkeit:

Δn+1 ≤ Δ2n .

Es liegt somit eine sogenannte quadratische Konvergenz vor, d. h., das Verfahren konvergiert sehr
rasch.6
(ii) A priori Fehlerabschätzung:

Δn+2 ≤ 10−2 .
n

(iii) A posteriori Fehlerabschätzung:

2 √
≤ 2 ≤ an .
an

Nach Tabelle 4.1 gilt deshalb



2 = 1,414213562 ± 10−9 .

Tabelle 4.1: 2
2
n an
an
1 2 1
2 1,5 1,33
3 1,4118 1,4116
4 1,414215 1,414211
5 1,414213562 1,414213562

6
Die Iterationsmethode (4.10) entspricht dem Newton-Verfahren für die Gleichung f ( x ) := x2 − 2 = 0 (vgl. 7.4.1).
4.2 Beweismethoden 291

4.2.6 Falsche Beweise

Die beiden häufigsten Typen fehlerhafter Beweise beruhen auf der „Division durch null“ und
auf Beweisen „in der falschen Richtung“.

4.2.6.1 Division durch null

Bei allen Umformungen von Gleichungen hat man darauf zu achten, dass niemals durch null
dividiert wird.
Falsche Behauptung: Die Gleichung

( x − 2)( x + 1) + 2 = 0 (4.11)

besitzt genau die reelle Lösung x = 1.


Falscher Beweis: Die Probe zeigt, dass x = 1 der Gleichung (4.11) genügt. Um nachzuweisen,
dass es keine weitere Lösungen gibt, nehmen wir an, dass x0 eine Lösung von (4.11) ist. Dann
gilt

x02 − 2x0 + x0 − 2 + 2 = 0.

Das liefert x02 − x0 = 0, also

x0 ( x0 − 1) = 0. (4.12)

Division durch x0 ergibt x0 − 1 = 0. Das bedeutet x0 = 1.


Die Behauptung ist offensichtlich falsch, denn neben x = 1 ist auch x = 0 eine Lösung von
(4.11). Der Fehler im Beweis besteht darin, dass in (4.12) nur unter der Voraussetzung x0 = 0
durch x0 dividiert werden darf.
Richtige Behauptung: Die Gleichung (4.11) besitzt genau die beiden Lösungen x = 0 und x = 1.
Beweis: Ist x eine Lösung von (4.11), dann folgt daraus (4.12), was x = 0 oder x − 1 = 0
impliziert.
Die Probe zeigt, dass x = 0 und x = 1 tatsächlich Lösungen von (4.11) sind. 

4.2.6.2 Beweis in der falschen Richtung

Ein häufiger Fehlschluss besteht darin, dass man zum Beweis von

A⇒B

irrtümlicherweise die Richtigkeit der umgekehrten Implikation B ⇒ A zeigt. Hierzu gehören die
sogenannten „0 = 0“-Beweise. Wir erläutern das an dem folgenden Beispiel.
Falsche Behauptung: Jede reelle Zahl x ist eine Lösung der Gleichung

x2 − 4x + 3x + 1 = ( x − 1)2 + 3x . (4.13)

Falscher Beweis: Es sei x ∈ R. Aus (4.13) folgt

x2 − x + 1 = x2 − 2x + 1 + 3x = x2 + x + 1 . (4.14)

Addition von − x2 − 1 auf beiden Seiten ergibt

−x = x . (4.15)
292 4 Grundlagen der Mathematik

Durch Quadrieren erhalten wir daraus

x2 = x2 . (4.16)

Das liefert

0 = 0. (4.17)

Diese korrekte Schlusskette besagt:

(4.13) ⇒ (4.14) ⇒ (4.15) ⇒ (4.16) ⇒ (4.17) .

Das ist allerdings kein Beweis für (4.13). Um diese Aussage zu beweisen, müssten wir die
umgekehrte Schlusskette benutzen:

(4.17) ⇒ (4.16) ⇒ (4.15) ⇒ (4.14) ⇒ (4.13) .

Das ist jedoch unmöglich, weil wir den Schluss (4.15) ⇒ (4.16) nicht umkehren können. Die
Implikation (4.16) ⇒ (4.15) ist nur für x = 0 gültig.
Richtige Behauptung: Die Gleichung (4.13) besitzt die eindeutige Lösung x = 0.
Beweis:1. Schritt: Angenommen, die reelle Zahl x ist eine Lösung von (4.13). Die obige Schlus-
skette ergibt:

(4.13) ⇒ (4.14) ⇒ (4.15) ⇒ x = 0 .

Somit kann die Gleichung (4.13) höchstens die Zahl x = 0 als Lösung besitzen.
2. Schritt: Wir zeigen

x = 0 ⇒ (4.15) ⇒ (4.14) ⇒ (4.13) .

Diese Schlussweise ist korrekt. 


Bei diesem einfachen Beispiel könnte man den zweiten Schritt einsparen und direkt durch
Einsetzen überprüfen, dass x = 0 eine Lösung von (4.13) darstellt. In komplizierteren Fällen
verfährt man häufig so, dass man darauf achtet, nur logisch äquivalente Umformungen vorzu-
nehmen, d. h., alle Implikationen können auch umgekehrt werden. Der obige Beweis lautet dann
folgendermaßen:

(4.13) ⇐⇒ (4.14) ⇐⇒ (4.15) ⇐⇒ x = 0 .

4.3 Anschauliche Mengentheorie

In diesem Abschnitt beschreiben wir den Umgang mit Mengen in naiver Weise. Eine axiomatische
Begründung der Mengentheorie findet man in 4.4.3

4.3.1 Grundideen

Gesamtheiten und Elemente: Unter einer Gesamtheit versteht man eine Zusammenfassung
von Dingen. Das Symbol

a∈A
4.3 Anschauliche Mengentheorie 293

bedeutet, dass das Ding a Element der Gesamtheit A ist. Dagegen bedeutet

a ∈ A ,

dass das Ding a nicht Element von A ist. Es gilt entweder a ∈ A oder a ∈ A Gesamtheiten heißen
auch Klassen.
In der Mathematik fasst man häufig Gesamtheiten zu neuen Gesamtheiten zusammen. Zum
Beispiel stellt eine Ebene eine Gesamtheit von Punkten dar; die Gesamtheit aller Ebenen durch
den Nullpunkt im dreidimensionalen Raum bildet eine sogenannte Graßmann-Mannigfaltigkeit
usw. Es gibt zwei Arten von Gesamtheiten (Abb. 4.1):
(i) Eine Gesamtheit heißt genau dann eine Menge, wenn sie Element einer neuen Gesamtheit
sein kann.
(i) Eine Gesamtheit heißt genau dann eine Unmenge, wenn sie nicht Element einer neuen
Gesamtheit sein kann.

Gesamtheit (Klasse)

Mengen Unmengen Abb. 4.1

Anschaulich hat man sich unter Unmengen Gesamtheiten vorzustellen, die so riesig sind, dass
keine weitere Gesamtheit sie zu fassen vermag. Zum Beispiel stellt die Gesamtheit aller Mengen
eine Unmenge dar.
Die Mengentheorie wurde von Georg Cantor (1845–1918) im letzten Viertel des 19. Jahrhun-
derts geschaffen. Die kühnste Idee Cantors war die Strukturierung des Unendlichen durch die
Einführung transfiniter Mächtigkeiten (vgl. 4.3.4) und durch die Entwicklung einer Arithmetik
für transfinite Ordinal- und Kardinalzahlen (vgl. 4.4.4). Cantor definierte:
„Eine Menge ist eine Zusammenfassung von bestimmten wohlunterschiedenen Objekten unseres
Denkens oder unserer Anschauung (welche die Elemente der Menge genannt werden) zu einem
Ganzen.“
Im Jahre 1901 entdeckte der englische Philosoph und Mathematiker Bertrand Russel dass der
Begriff der „Menge aller Mengen“ widersprüchlich ist (Russelsche Antinomie). Das löste eine
Grundlagenkrise der Mathematik aus, die jedoch durch
(i) die Unterscheidung zwischen Mengen und Unmengen und
(ii) einen axiomatischen Aufbau der Mengentheorie behoben werden konnte.
Der Russelsche Widerspruch löst sich dadurch, dass die Gesamtheit aller Mengen keine Menge,
sondern eine Unmenge ist. Das werden wir in 4.4.3 beweisen.

Teilmengen und Mengengleichheit: Sind A und B Mengen, dann bedeutet das Symbol

A⊆B

dass jedes Element von A zugleich ein Element von B ist. Man sagt auch, dass A eine Teilmenge
von B ist (Abb. 4.2). Zwei Mengen A und B heißen genau dann gleich, in Zeichen,

A = B,
294 4 Grundlagen der Mathematik

wenn A ⊆ B und B ⊆ A gilt. Ferner schreiben wir genau dann

A ⊂ B,

wenn A ⊆ B zusammen mit A = B vorliegt. Für Mengen A, B und C gilt:

A
B Abb. 4.2

(i) A ⊆ A (Reflexivität).
(ii) Aus A ⊆ B und B ⊆ C folgt A ⊆ C (Transitivität).
(iii) Aus A ⊆ B und B ⊆ A folgt A = B (Antisymmetrie).
Die Beziehung (iii) wird benutzt, um die Gleichheit zweier Mengen zu beweisen (vgl. das
Beispiel in 4.3.2).

Mengendefinition: Die wichtigste Methode zur Definition einer Menge wird durch die Vor-
schrift

A := { x ∈ B | für x gilt die Aussage A( x )}

gegeben. Das heißt, die Menge A besteht aus genau den Elementen der Menge B, für die die
Aussage A( x ) wahr ist.
 Beispiel: Bezeichnet Z die Menge der ganzen Zahlen, dann wird durch

A := { x ∈ Z | x ist durch 2 teilbar}

die Menge A der geraden Zahlen definiert. Sind a und b Dinge, dann bezeichnet { a} (bzw. { a, b})
diejenige Menge, die genau a (bzw. genau a und b) enthält.

Leere Menge: Das Symbol ∅ bezeichnet die leere Menge, die nichts enthält.

4.3.2 Das Rechnen mit Mengen

In diesem Abschnitt seien A, B, C, X Mengen.

Durchschnitt zweier Mengen: Der Durchschnitt

A∩B

der beiden Mengen A und B besteht definitionsgemäß genau aus den Elementen, die zu A und
B gehören (Abb. 4.3a). Kurz: A ∩ B := { x | x ∈ A und x ∈ B}.
Die beiden Mengen A und B heißen genau dann durchschnittsfremd (oder disjunkt), wenn
A ∩ B = ∅ gilt.

Vereinigung zweier Mengen: Die Vereinigungsmenge

A∪B
4.3 Anschauliche Mengentheorie 295

A B A B A B

A∩B A∪B A\ B
(a) (b) (c) Abb. 4.3

besteht definitionsgemäß aus genau den Elementen, die zu A oder zu B gehören (Abb. 4.3b).
Kurz: A ∪ B := { x : x ∈ A oder x ∈ B}. Man hat die Inklusionsbeziehungen

( A ∩ B) ⊆ A ⊆ ( A ∪ B) .

Ferner ist A ⊆ B äquivalent zu A ∩ B = A (bzw. A ∪ B = B).


Der Durchschnitt A ∩ B ((bzw. die Vereinigung A ∪ B) verhalten sich analog zu einem Produkt
(bzw. zu einer Summe) zweier Zahlen; die leere Menge ∅ übernimmt die Rolle der Zahl Null.
Explizit gellen die folgenden Regeln:
(i) Kommutativgesetze:

A∩ B = B∩ A, A∪ B = B∪ A.

(ii) Assoziativgesetze:

A ∩ ( B ∩ C ) = ( A ∩ B) ∩ C , A ∪ ( B ∪ C ) = ( A ∪ B) ∪ C .

(iii) Distributivgesetze:

A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C ) , A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C ) .

(iv) Nullelement:

A∩∅ = ∅, A∪∅ = A.

 Beispiel 1: Wir wollen A ∩ B = B ∩ A beweisen.


1. Schritt: Wir zeigen ( A ∩ B) ⊆ ( B ∩ A). Tatsächlich gilt:

a ∈ ( A ∩ B) =⇒ ( a ∈ A und a ∈ B) =⇒ ( a ∈ B und a ∈ A) =⇒ a ∈ ( B ∩ A) .

2. Schritt: Wir zeigen ( B ∩ A) ⊆ ( A ∩ B). Das folgt analog zum 1. Schritt.


Aus beiden Beweisschritten ergibt sich A ∩ B = B ∩ A. 

Differenz zweier Mengen: Die Differenzmenge

A\ B

besteht definitionsgemäß aus genau den Elementen von A die nicht zu B gehören (Abb. 4.3c).
Kurz: A\ B := { x ∈ A | x ∈ B}. Neben der Inklusionsbeziehung

A\ B ⊆ A
296 4 Grundlagen der Mathematik

und A\ A = ∅ gelten die folgenden Regeln.


(i) Distributivgesetze:

( A ∩ B)\C = ( A\C ) ∩ ( B\C ) , ( A ∪ B)\C = ( A\C) ∪ ( B\C ) .

(ii) Verallgemeinerte Distributivgesetze:

A \( B ∩ C ) = ( A\ B) ∩ ( A\C ) . A\( B ∪ C ) = ( A\ B) ∩ ( A\C ) .

(iii) Verallgemeinerte Assoziativgesetze:

( A\ B)\C = A\( B ∪ C ) , A\( B\C ) = ( A\ B) ∪ ( A ∩ C ) .

Das Komplement einer Menge: A und B seien Teilmengen der Menge X. Das Komplement

CX A

besteht definitionsgemäß aus genau den Elementen von X die nicht zu A gehören, d. h., CX A :=
X \ A (Abb. 4.4b). Man hat die disjunkte Zerlegung:

X = A ∪ CX A, A ∩ CX A = ∅.

A A

X CX A

(a) A ⊆ X (b) X = A ∪ CX A Abb. 4.4

Ferner gelten die sogenannten de Morganschen Regeln:

C X ( A ∩ B ) = CX A ∪ CX B , C X ( A ∪ B ) = CX A ∩ CX B .

Außerdem hat man CX X = ∅, CX ∅ = X und CX (CX A) = A. Die Inklusion A ⊆ B ist


äquivalent zu CX B ⊆ CX A.

Geordnete Paare: Anschaulich gesprochen versteht man unter einem geordneten Paar ( a, b)
eine Zusammenfassung der Dinge a und b, wobei a vor b angeordnet sein soll. Die präzise
mengentheoretische Definition lautet:7

( a, b) := { a, { a, b}}.

Daraus folgt: Es ist ( a, b) = (c, d) genau dann, wenn a = c und b = d gilt.


Für n = 1, 2, 3, 4, . . . definiert man dann sukzessiv n-Tupel durch die Beziehungen:

⎨ a1 für n = 1 ,
( a1 , . . . , a n ) : = ( a1 , a2 ) für n = 2 ,

(( a1 , . . . , an−1 ), an ) für n > 2 .
7
Dies bedeutet, dass ( a, b) eine Menge ist. die aus der Einermenge { a} und der Zweiermenge { a, b} besteht.
4.3 Anschauliche Mengentheorie 297

Das kartesische Produkt zweier Mengen: Sind A und B Mengen, dann besteht das kartesi-
sche Produkt

A×B

definitionsgemäß aus genau allen geordneten Paaren ( a, b) mit a ∈ A und b ∈ B. Für beliebige
Mengen A, B, C, D gelten die folgenden Distributivgesetze:

A × ( B ∪ C ) = ( A × B ) ∪ ( A × C ), A × ( B ∩ C ) = ( A × B) ∩ ( A × C ) ,
( B ∪ C ) × A = ( B × A ) ∪ (C × A ), ( B ∩ C ) × A = ( B × A) ∩ (C × A) ,
A × ( B\C ) = ( A × B)\( A × C ), ( B\C ) × A = ( B × A)\(C × A) .

Es ist A × B = ∅ genau dann, wenn A = ∅ oder B = ∅ gilt.


In analoger Weise wird für n = 1, 2, . . . das kartesische Produkt

A1 × · · · × A n

als die Menge aller n-Tupel ( a1 , . . . , an ) mit a j ∈ A j für j = 1, . . . , n definiert. Dafür schreibt man
n
auch ∏ A j .
j =1

Disjunkte Vereinigung: Unter der disjunkten Vereinigung,

A ∪d B

verstehen wir die Vereinigungsmenge ( A × {1}) ∪ ( B × {2}).

 Beispiel 2: Für A : = { a, b} gilt A ∪ A = A, aber

A ∪d A = {( a, 1), ( b, 1), ( a, 2), ( b, 2)} .

4.3.3 Abbildungen

Anschauliche Definition: Unter einer Abbildung

f : X −→ Y

von der Menge X in die Menge Y verstehen wir die Vorschrift, die jedem Element x von X ein
eindeutig bestimmtes Element y von Y zuordnet, das wir mit f ( x ) bezeichnen und den Bildpunkt
von x nennen. Abbildungen werden auch Funktionen genannt.
Gilt A ⊆ X, dann definieren wir die Bildmenge von A durch

f ( A ) : = { f ( a ) | a ∈ A }.

Die Menge X heißt der Definitionsbereich von f , und die Menge f ( X ) bezeichnet man als den
Wertevorrat von f .
Der Definitionsbereich von f wird auch mit D( f ) oder dom f bezeichnet. Für den Wertevorrat8
benutzt man auch die Bezeichnungen R ( f ) oder im f .
8
Die Bezeichnungen dom f , R( f ) und im f entsprechen der Reihe nach den englischen Worten domain, range, image.
298 4 Grundlagen der Mathematik

Die Menge

G ( f ) := {( x, f ( x )) | x ∈ X }

heißt der Graph von f .


Beispiel 1: Durch die Vorschrift f ( x ) := x2 für alle reellen Zahlen x ergibt sich eine Funktion
f : R −→ R mit D( f ) = R und R ( f ) = [0, ∞[. Der Graph G ( f ) entspricht der in Abb. 4.5
dargestellten Parabelmenge.

y y
x**2 x**2

G( f ) G(h)

x x
(a) (b) Abb. 4.5

Klassifikation von Funktionen: Gegeben sei die Abbildung f : X −→ Y. Wir betrachten die
Gleichung

f (x) = y . (4.18)

(i) f heißt genau dann surjektiv, wenn die Gleichung (4.18) für jedes y ∈ Y eine Lösung x ∈ X
besitzt, d. h. f ( X ) = Y.
(ii) f heißt genau dann injektiv, wenn die Gleichung (4.18) für jedes y ∈ Y höchstens eine
Lösung besitzt, d. h., aus f ( x ) = f ( z) folgt stets x = z.
(iii) f heißt genau dann bijektiv, wenn f sowohl surjektiv als auch injektiv ist, d. h., die
Gleichung (4.18) besitzt für jedes y ∈ Y genau eine Lösung x ∈ X.9

Inverse Abbildung: Ist die Abbildung f : X −→ Y injektiv, dann bezeichnen wir die eindeutige
Lösung x von (4.18) mit f −1 (y) und nennen f −1 : f ( X ) −→ X die inverse Abbildung zu f .

 Beispiel 2: Es sei X := { a, b }, Y := {c, d, e}. Wir setzen

f ( a) := c , f ( b) := d .

Dann ist f : X −→ Y injektiv, aber nicht surjektiv. Die inverse Abbildung f −1 : f ( X ) −→ X ist
durch

f −1 ( c ) = a , f −1 (d) = b.

gegeben.

 Beispiel 3: Setzen wir f ( x ) := x2 für alle reellen Zahlen x, dann ist die Abbildung f : R −→
[0, ∞[ surjektiv, aber nicht injektiv, weil zum Beispiel die Gleichung f ( x ) = 4 die beiden Lösungen
x = 2 und x = −2 besitzt, also nicht eindeutig lösbar ist (Abb. 4.5a ).
Definieren wir dagegen h( x ) := x2 für alle nichtnegativen reellen Zahlen, dann ist die Ab-

bildung h : [0, ∞[−→ [0, ∞[ bijektiv. Die zugehörige inverse Abbildung ist durch h−1 (y) = y
gegeben (Abb. 4.5b).
9
In der älteren Literatur bezeichnet man surjektive, injektive, bijektive Abbildungen der Reihe nach als „Abbildungen von
X auf Y“, „eineindeutige Abbildungen“, „eineindeutige Abbildungen von X auf Y“.
4.3 Anschauliche Mengentheorie 299

 Beispiel 4: Setzen wir pr1 ( a, b) := a, dann ist die sogenannte Projektionsabbildung pr1 :
A × B −→ A surjektiv.
Rechenregeln: Die durch
idX ( x ) := x für alle x∈X
definierte Abbildung id X : X → X heißt die identische Abbildung auf X. Sie wird mitunter auch
durch I bezeichnet. Sind
f :X→Y und g:Y→Z
zwei Abbildungen, dann wird die zusammengesetzte Abbildung g ◦ f : X −→ Z durch

( g ◦ f )( x ) := g( f ( x ))

erklärt. Es gilt das Assoziativgesetz:


h ◦ ( g ◦ f ) = (h ◦ g) ◦ f .

Kommutative Diagramme: Viele Relationen zwischen Abbildungen kann man sich bequem
mit Hilfe sogenannter kommutativer Diagramme verdeutlichen. Ein Diagramm
f
X Y
g
h

Z
heißt genau dann kommutativ, wenn h = g ◦ f gilt, d. h., es ist gleichgültig, ob man das Diagramm
von X über Y nach Z oder direkt von X nach Z durchläuft. Analog wird beispielsweise das
Diagramm
f
X Y

r g

V s Z

genau dann kommutativ genannt, wenn g ◦ f = s ◦ r gilt.

 Beispiel 5: Ist die Abbildung f : X −→ Y bijektiv, dann hat man


f −1 ◦ f = idX und f ◦ f −1 = idY .

Satz: Gegeben sei die Abbildung f : X −→ Y. Dann gilt:


(i) f ist genau dann surjektiv, wenn es eine Abbildung g : Y −→ X gibt mit
f ◦ g = idY ,
d. h., das Diagramm in Abb. 4.6a ist kommutativ.
(ii) f ist genau dann injektiv, wenn es eine Abbildung h : Y −→ X gibt mit
h ◦ f = idX ,
d. h., das Diagramm in Abb. 4.6b ist kommutativ.
300 4 Grundlagen der Mathematik

(iii) f ist genau dann bijektiv, wenn es Abbildungen g : Y −→ X und h : Y −→ X gibt mit

f ◦ g = idY und h ◦ f = idX ,

d. h., die beiden Diagramme in Abb. 4.6 sind kommutativ. Dann gilt h = g = f −1 .
f f
X Y X Y
g h
idY idX

Y X
(a) f ist surjektiv (b) f ist injektiv Abb. 4.6

Urbildmengen: Es sei f : X −→ Y eine Abbildung, und B sei eine Teilmenge von Y. Wir
setzen

f −1 ( B ) : = { x : f ( x ) ∈ B } ,

d. h., f −1 ( B) besteht aus genau allen Punkten von X, deren Bilder in der Menge B liegen. Wir
nennen f −1 ( B) die Urbildmenge von B.
Für beliebige Teilmengen B und C von Y gilt:

f − 1 ( B ∪ C ) = f −1 ( B ) ∪ f −1 ( C ) , f −1 ( B ∩ C ) = f −1 ( B ) ∩ f −1 ( C ) .

Aus B ⊆ C folgt f −1 ( B) ⊆ f −1 ( C ) und f −1 (C \ B) = f −1 (C )\ f −1 ( B).

Potenzmenge: Ist A eine Menge, dann bezeichnet 2 A die Potenzmenge von A, d. h., 2 A ist
die Menge aller Teilmengen von A.

Korrespondenzen: Unter einer Korrespondenz K zwischen den beiden Mengen A und B


verstehen wir eine Abbildung

c : A −→ 2B

von der Menge A in die Potenzmenge 2B , d. h., jedem Punkt a ∈ A wird eine eindeutig bestimmte
Teilmenge von B zugeordnet, die wir mit K ( a) bezeichnen.
Unter dem Nachbereich von K verstehen wir diejenige Teilmenge von B, die sich durch
Vereinigung aller Mengen K ( a) mit a ∈ A ergibt.

Die präzise mengentheoretische Definition einer Abbildung: Unter einer Abbildung f von
X nach Y verstehen wir eine Teilmenge f des kartesischen Produkts X × Y mit den beiden
folgenden Eigenschaften:
(i) Für jedes x ∈ X gibt es ein y ∈ Y mit ( x, y) ∈ f .
(ii) Aus ( x, y1 ) ∈ f und ( x, y2 ) ∈ f folgt y1 = y2 .
Das durch (ii) eindeutig bestimmte Element y bezeichnen wir mit f ( x ). Anstelle von f schreiben
wir auch f : X −→ Y oder G ( f ).
4.3 Anschauliche Mengentheorie 301

4.3.4 Gleichmächtige Mengen

Definition: Zwei Mengen A und B heißen genau dann gleichmächtig, in Zeichen

A∼
=B

wenn es eine bijektive Abbildung ϕ : A −→ B gibt.


Für beliebige Mengen A, B, C gilt:
∼ A (Reflexivität).
(i) A =
(ii) Aus A ∼
= B folgt B ∼
= A (Symmetrie).
(iii) Aus A ∼
= B und B ∼
= C folgt A ∼
= C (Transitivität).

Endliche Mengen: Eine Menge A heißt genau dann endlich, wenn sie entweder leer ist oder es
eine positive natürliche Zahl n, gibt, so dass A gleichmächtig zur Menge B := {k ∈ N | 1 ≤ k ≤ n}
ist. Im letzteren Fall heißt n die Anzahl der Elemente von A.
Besteht A aus n Elementen, dann besitzt die Potenzmenge 2 A genau 2n Elemente.

Unendliche Mengen: Eine Menge heißt genau dann unendlich, wenn sie nicht endlich ist.

 Beispiel 1: Die Menge der natürlichen Zahlen ist unendlich

Satz: Eine Menge ist genau dann unendlich, wenn sie zu einer echten Teilmenge gleichmächtig
ist.
Eine Menge ist genau dann unendlich, wenn sie eine unendliche Teilmenge enthält.

Abzählbare Mengen: Eine Menge A heißt genau dann abzählbar, wenn sie zur Menge der
natürlichen Zahlen gleichmächtig ist.
Eine Menge heißt genau dann höchstens abzählbar, wenn sie endlich oder abzählbar ist.
Eine Menge heißt genau dann überabzählbar, wenn sie nicht höchstens abzählbar ist.
Abzählbare und überabzählbare Mengen sind unendlich.

 Beispiel 2: (a) Die folgenden Mengen sind abzählbar: die Menge der ganzen Zahlen, die Menge
der rationalen Zahlen, die Menge der algebraischen reellen Zahlen.
(b) Die folgenden Mengen sind überabzählbar: die Menge der reellen Zahlen, die Menge
der irrationalen reellen Zahlen, die Menge der transzendenten reellen Zahlen, die Menge der
komplexen Zahlen.
(c) Die Vereinigung von n abzählbaren Mengen M1 , . . . , Mn ist wieder abzählbar.
(d) Die Vereinigung M1 , M2 , . . . von abzählbar vielen abzählbaren Mengen ist wieder abzählbar.

 Beispiel 3: Die Menge N × N ist abzählbar.


Beweis: Wir ordnen die Paare ( m, n) mit n, m ∈ N in Gestalt einer Matrix

(0, 0) −→ (0, 1) (0, 2) . . .


↓ ↓
(1, 0) ←− (1, 1) (1, 2) . . .

(2, 0) ←− (2, 1) ←− (2, 2) . . .
... ... ...
302 4 Grundlagen der Mathematik

an. Durchläuft man nun die Matrixelemente der Reihe nach in der durch die Pfeile angegebenen
Weise, dann kann man jedem Matrixelement eine natürliche Zahl zuordnen, und umgekehrt
entspricht jeder natürlichen Zahl ein Matrixelement. 
Wir schreiben genau dann

AB

wenn B eine Teilmenge enthält, die gleichmächtig zu A. ist. Wir sagen genau dann, dass B
mächtiger als A ist, wenn A  B gilt und A nicht gleichmächtig zu B ist.

Satz von Schröder-Bernstein: Für beliebige Mengen A, B, gilt:


(i) A  A (Reflexivität).
(ii) Aus A  B und B  A folgt A ∼
= B (Antisymmetrie).
(iii) Aus A  B und B  C folgt A  C (Transitivität).

Satz von Cantor: Die Potenzmenge einer Menge ist stets mächtiger als die Menge selbst.

4.3.5 Relationen

Anschaulich versteht man unter einer Relation in einer Menge X eine Beziehung, die zwischen
zwei Elementen x und y aus X besteht oder nicht besteht. Formal definiert man eine Relation in
X als eine Teilmenge R der Produktmenge X × X.
 Beispiel: Die Menge R bestehe aus allen geordneten Paaren ( x, y) reeller Zahlen x und y mit
x ≤ y. Dann entspricht die Teilmenge R von R × R der Ordnungsrelation der reellen Zahlen.

4.3.5.1 Äquivalenzrelationen

Definition: Unter einer Äquivalenzrelation in der Menge X versteht man eine Teilmenge
X × X mit den folgenden drei Eigenschaften.

(i) Es ist ( x, x ) ∈ R für alle x ∈ X (Reflexivität).


(ii) Aus ( x, y) ∈ R folgt (y, x ) ∈ R (Symmetrie).
(iii) Aus ( x, y) ∈ R und (y, z ) ∈ R folgt ( x, z ) ∈ R (Transitivität).

Anstelle von ( x, y ) ∈ R schreibt man häufig x ∼ y. Mit dieser Notation gilt:

(a) Es ist x ∼ x für alle x ∈ X (Reflexivität).


(b) Aus x ∼ y folgt y ∼ x (Symmetrie).
(c) Aus x ∼ y und y ∼ z folgt x ∼ z (Transitivität).

Es sei x ∈ X. Unter der zu x gehörigen Äquivalenzklasse [ x ] verstehen wir die Menge aller zu
x äquivalenten Elemente von X,d. h.,

[ x ] := {y ∈ X | x ∼ y} .

Die Elemente von [ x ] heißen Repräsentanten von [ x ]

Satz: Die Menge X zerfällt in paarweise disjunkte Äquivalenzklassen.

Faktormenge: Mit X/ ∼ bezeichnen wir die Menge aller Äquivalenzklassen. Diese Menge
heißt häufig auch Faktormenge (oder Faktorraum).
4.3 Anschauliche Mengentheorie 303

Sind auf X Operationen erklärt, dann kann man diese auf den Faktorraum übertragen, falls
die Operationen mit der Äquivalenzrelation verträglich sind. Das ist ein allgemeines Prinzip der
Mathematik zur Konstruktion neuer Strukturen (Faktorstrukturen10 ).

 Beispiel: Sind x und y ganze Zahlen, dann schreiben wir genau dann x ∼ y wenn x − y durch
2 teilbar ist. Es gilt:

[0] = {0, ±2, ±4, . . . } , [1] = {±1, ±3, . . .} ,

d. h., die Äquivalenzklasse [0] (bzw. [1]) besteht aus den geraden (bzw. ungeraden) ganzen
Zahlen.
Ferner folgt aus x ∼ y und u ∼ v stets x + u ∼ y + v. Deshalb ist die Definition

[ x ] + [y ] := [ x + y ]

unabhängig von der Wahl der Repräsentanten. Somit gilt:

[ 0 ] + [ 1 ] = [1 ] + [ 0 ] = [ 1 ] , [1] + [1] = [0] , [0] + [0] = [0] .

Jeder Erkenntnisprozess basiert darauf, dass man unterschiedliche Dinge miteinander identifi-
ziert und Aussagen über die zugehörigen Identifizierungsklassen trifft (z. B. die Klassifizierung
von Tieren durch die übergeordneten Begriffe Säugetier, Fisch, Vogel usw.). Äquivalenzrelationen
stellen die präzise mathematische Fassung derartiger Abstraktionen dar.

4.3.5.2 Ordnungsrelationen

Definition: Unter einer Ordnungsrelation in der Menge X versteht man eine Teilmenge R von
X × X mit den folgenden drei Eigenschaften.

(i) Es ist ( x, x) ∈ R für alle x ∈ X (Reflexivität).


(ii) Aus ( x, y ) ∈ R und ( y, x ) ∈ R folgt x = y (Antisymmetrie).
(iii) Aus ( x, y ) ∈ R und ( y, z) ∈ R folgt ( x, y ) ∈ R (Transitivität).

Anstelle von ( x, y ) schreibt man x ≤ y. Mit dieser Notation gilt:

(a) Es ist x ≤ x für alle x ∈ X (Reflexivität).


(b) Aus x ≤ y und y ≤ x folgt x = y (Antisymmetrie).
(c) Aus x ≤ y und y ≤ z folgt x ≤ z (Transitivität).

Das Symbol x < y bedeutet x ≤ y und x = y.


Eine geordnete Menge X heißt genau dann total geordnet, wenn für alle Elemente x und y
von X die Beziehung x ≤ y oder y ≤ x gilt.
Gegeben sei x ∈ X. Folgt aus x ≤ z stets x = z, dann heißt x ein maximales Element von X. Es
sei M ⊆ X. Gilt y ≤ s für alle y ∈ M und festes s ∈ X, dann heißt s eine obere Schranke von M.
Schließlich heißt u genau dann ein kleinstes Element von M, wenn u ∈ M und u ≤ z für alle
z ∈ M gilt.

Lemma von Zorn: Die geordnete Menge X besitzt ein maximales Element, falls jede total
geordnete Teilmenge von X eine obere Schranke hat.
10
Beispielweise werden in 2.5.1.2 Faktorgruppen betrachtet.
304 4 Grundlagen der Mathematik

Wohlordnung: Eine geordnete Menge heißt genau dann wohlgeordnet, wenn jede ihrer
nichtleeren Teilmengen ein kleinstes Element enthält.

 Beispiel: Die Menge der natürlichen Zahlen ist bezüglich der üblichen Ordnungsrelation
wohlgeordnet.
Dagegen ist die Menge der reellen Zahlen R bezüglich der üblichen Ordnungsrelation nicht
wohlgeordnet, denn die Menge ]0, 1] enthält kein kleinstes Element.

Wohlordnungssatz von Zermelo: Jede Menge kann wohlgeordnet werden.

Das Prinzip der transfiniten Induktion: Es sei M eine Teilmenge einer geordneten Menge X.
Dann ist M = X falls für alle a ∈ X gilt:

Gehört die Menge { x ∈ X | x < a} zu M, dann gehört auch a zu M.

Ordnungstreue Abbildungen: Eine Abbildung ϕ : X −→ Y zwischen zwei geordneten Men-


gen X und Y heißt genau dann ordnungstreu, wenn aus x ≤ y stets ϕ( x ) ≤ ϕ(y ) folgt.
Zwei geordnete Mengen X und Y heißen genau dann gleichgeordnet, wenn es eine bijektive
Abbildung ϕ : X −→ Y gibt, wobei ϕ und ϕ−1 ordnungstreu sind.

4.3.5.3 n-stellige Relationen

Unter einer n-stelligen Relation R auf der Menge X versteht man eine Teilmenge des n-fachen
Produkts X × · · · × X.
Derartige Relationen werden häufig benutzt, um Operationen zu beschreiben.
 Beispiel: Die Menge R bestehe aus allen 3-Tupeln ( a, b, c) reeller Zahlen a, b, c mit ab = c.
Dann entspricht die 3-stellige Relation R ⊆ R × R × R der Multiplikation reeller Zahlen.

4.3.6 Mengensysteme

Unter einem Mengensystem M versteht man eine Menge M von Mengen X. Die Vereinigung

∪M

besteht definitionsgemäß aus genau den Elementen, die zu mindestens einer der Mengen X von
M gehören.
Enthält M mindestens eine Menge, dann besteht der Durchschnitt

∩M

definitionsgemäß aus genau den Elementen, die zu allen Mengen X von M gehören.
Definitionsgemäß ist eine Mengenfamilie ( Xα )α∈ A eine Funktion, die auf der sogenannten
Indexmenge A definiert ist und jedem α ∈ A eine Menge Xα zuordnet.
Unter einem A-Tupel ( xα ) (oder auch ( xα )α∈ A ) verstehen wir eine Funktion auf A die jedem
α ∈ A ein Element xα ∈ Xα zuordnet. Definitionsgemäß besteht das kartesische Produkt

∏ Xα
α∈A
4.4 Mathematische Logik 305

aus genau allen A-Tupeln ( xα ). Man bezeichnet ( xα ) auch als eine Auswahlfunktion. Unter der
Vereinung

*

α∈A

verstehen wir genau alle diejenigen Elemente, die mindestens einer Menge Xα angehören.
Es sei A nicht leer. Der Durchschnitt
+

α∈A

besteht definitionsgemäß aus genau den Elementen, die zu allen Mengen Xα gehören.

4.4 Mathematische Logik

Wahrheit ist Übereinstimmung von Gedanken und Wirklichkeit,


Aristoteles (384–322 v. Chr.)
Die theoretische Logik, auch mathematische oder symbolische Logik genannt, ist
eine Ausdehnung der formalen Methode der Mathematik auf das Gebiet der Logik.
Sie wendet für die Logik eine ähnliche Formelsprache an, wie sie zum Ausdruck
mathematischer Beziehungen schon seit langem gebräuchlich ist.11

David Hilbert und Wilhelm Ackermann (1928)

Die Logik ist die Wissenschaft vom Denken. Die mathematische Logik stellt die präziseste
Form der Logik dar. Dazu wird ein streng formalisierter Kalkül benutzt, der im heutigen
Computerzeitalter die Grundlage der theoretischen Informatik bildet.

4.4.1 Aussagenlogik

Grundzeichen: Wir benutzen die Symbole q1 , q2 , . . . und ( , ) sowie

¬, ∧, ∨, −→, ←→ . (4.19)

Anstelle der Aussagenvariablen q j schreiben wir auch q, p, r. . . .

Ausdrücke: (i) Jede Zeichenreihe, die nur aus einer Aussagenvariablen besteht, heißt ein
Ausdruck.
(ii) Sind A und B Ausdrücke, dann sind auch die Zeichenreihen

¬A , ( A ∧ B) , ( A ∨ B) , ( A −→ B) , ( A ←→ B)

Ausdrücke.
Diese Ausdrücke heißen der Reihe nach Negation, Konjunktion, Alternative, Implikation,
Äquivalenz.
(iii) Eine Zeichenreihe ist nur dann ein Ausdruck, wenn das auf Grund von (i) und (ii) der Fall
ist.
11
Aus dem Vorwort zur ersten Auflage der „Grundzüge der theoretischen Logik“.
306 4 Grundlagen der Mathematik

 Beispiel 1: Ausdrücke sind

( p −→ q) , (( p −→ q) ←→ r ) , (( p ∧ q) −→ r ) , (( p ∧ q) ∨ r ) . (4.20)

Weglassen von Klammern: Für reelle Zahlen a, b, c bindet das Produktzeichen stärker als das
Summenzeichen. Deshalb können wir anstelle von (( ab) + c) kurz ab + c schreiben.
In analoger Weise vereinbaren wir, dass die Bindung der Symbole in (4.19) von links nach
rechts schwächer wird und wir die dadurch überflüssig werdenden Klammern weggelassen.

 Beispiel 2: Anstelle von (4.20) schreiben wir:

p −→ q , p −→ q ←→ r , p ∧ q −→ r , p∧q∨r.

Die Wahrheitsfunktionen: Wir setzen

non(W):=F , non(F):=W . (4.21)

Die Symbole W bzw. F stehen für wahr bzw. falsch. Hinter (4.21) verbirgt sich, dass die Negation
einer wahren (bzw. falschen) Aussage falsch (bzw. wahr) ist.
Ferner erklären wir die Funktionen et, vel, seq, äq durch die Tabelle 4.3.

Tabelle 4.3
X Y et( X, Y ) vel( X, Y ) seq( X, Y ) äq( X, Y )
W W W W W W
W F F W F F
F W F W W F
F F F F W W

Dabei entsprechen et( X, Y ), vel( X, Y ), seq( X, Y ) und äq( X, Y ) der Reihe nach „X und Y“, „X
oder Y“, „aus X folgt Y“, „X ist äquivalent zu Y“. Beispielsweise bedeutet et(W, F) = F, dass für
eine wahre Aussage X und eine falsche Aussage Y die zusammengesetzte Aussage „X und Y“
falsch ist.

Wahrheitswerte von Ausdrücken: Eine Abbildung

b : {q1 , q2 , . . .} −→ {W,F} ,

die jeder Aussagenvariablen q j den Wert W (wahr) oder F (falsch) zuordnet, heißt eine Belegungs-
funktion. Ist b gegeben, dann kann man jedem Ausdruck A, B, . . . den Wert W oder F zuordnen,
indem man die folgenden Regeln benutzt:
(i) Wert (q j ) := b( q j ) .
(ii) Wert (¬ A) := non(Wert( A)) .
(iii) Wert ( A ∧ B) := et(Wert( A),Wert( B)) .
(iv) Wert ( A ∨ B) := vel(Wert( A),Wert( B)) .
(v) Wert ( A −→ B) := seq(Wert( A),Wert( B)) .
(vi) Wert ( A ←→ B) := äq(Wert( A),Wert( B)) .

 Beispiel 1: Für b(q) := W und b( p) := F erhalten wir Wert (¬ p) = non(F) = W und

Wert(q −→ ¬ p) = seq(W,W)=W .
4.4 Mathematische Logik 307

Tautologien: Ein Ausdruck heißt genau dann eine Tautologie, wenn er für jede Belegungs-
funktion den Wert W (wahr) besitzt.
 Beispiel 2: Der Ausdruck

q ∨ ¬q

ist eine Tautologie.


Beweis: Für b( q) = W erhalten wir

Wert(q ∨ ¬ q) = vel(W,F)=W ,

und b(q) = F ergibt

Wert(q ∨ ¬ q) = vel(F,W)=W . 

Äquivalente Ausdrücke: Zwei Ausdrücke A und B heißen genau dann (logisch) äquivalent,
in Zeichen

A∼
= B,

wenn sie für jede Belegungsfunktion den gleichen Wert ergeben.

Satz: Es gilt A ∼
= B genau dann, wenn A ←→ B eine Tautologie ist.
 Beispiel 3:

p −→ q ∼
= ¬p ∨ q .

Somit ist

p −→ q ←→ ¬ p ∨ q

eine Tautologie.
Wichtige Tautologien der klassischen Logik findet man in 4.1.3.

4.4.1.1 Die Axiome

Das Ziel der Aussagenlogik ist es, alle Tautologien zu erfassen. Das geschieht in rein formaler
Weise durch sogenannte Axiome und Ableitungsregeln. Die Axiome lauten:
(A1) p −→ ¬¬ p
(A2) ¬¬ p −→ p
(A3) p −→ (q −→ p)
(A4) (( p −→ q) −→ p) −→ p
(A5) ( p −→ q) −→ ((q −→ r ) −→ ( p −→ r ))
(A6) p ∧ q −→ p
(A7) p ∧ q −→ q
(A8) ( p −→ q) −→ ((q −→ r ) −→ ( p −→ q ∧ r ))
(A9) p −→ p ∨ q
(A10) q −→ p ∨ q
(A11) ( p −→ r ) −→ ((q −→ r ) −→ ( p ∨ q −→ r ))
308 4 Grundlagen der Mathematik

(A12) ( p ←→ q) −→ ( p −→ q )
(A13) ( p ←→ q) −→ (q −→ p )
(A14) ( p −→ q) −→ ((q −→ p ) −→ ( p ←→ q))
(A15) ( p −→ q) −→ (¬q −→ ¬ p ) .

4.4.1.2 Die Ableitungsregeln

Mit A, B, C werden Ausdrücke bezeichnet. Die Herleitungsregeln lauten:


(R1) Jedes Axiom ist ableitbar.
(R2) (Abtrennungsregel – modus ponens). Sind ( A −→ B) und A aus den Axiomen ableitbar,
dann ist auch B aus den Axiomen ableitbar.
(R3) (Einsetzungsregel). Ist A aus den Axiomen ableitbar und entsteht B dadurch, dass man in
A eine Aussagenvariable q j überall durch einen festen Ausdruck C ersetzt, dann ist auch B
aus den Axiomen ableitbar.
(R4) Ein Ausdruck ist nur dann aus den Axiomen ableitbar, wenn er das auf Grund der Regeln
(R1), (R2), (R3) ist.

4.4.1.3 Der Hauptsatz der Aussagenlogik

(i) Vollständigkeit des Axiomensystems: Ein Ausdruck ist genau dann eine Tautologie, wenn er
aus den Axiomen abgeleitet werden kann.
Speziell sind alle Axiome Tautologien.
(ii) Klassische Widerspruchsfreiheit des Axiomensystems: Aus den Axiomen kann man nicht einen
Ausdruck und zugleich seine Negation ableiten.12
(iii) Unabhängigkeit der Axiome: Keines der Axiome kann aus den übrigen Axiomen abgeleitet
werden.
(iv) Entscheidbarkeit: Es gibt einen Algorithmus, der in endlich vielen Schritten entscheiden
kann, ob ein Ausdruck eine Tautologie ist oder nicht.

4.4.2 Prädikatenlogik

Anschaulich gesprochen werden im Prädikatenkalkül Eigenschaften von Individuen und deren


Beziehungen untersucht. Dabei benutzt man die Aussagen „für alle Individuen gilt ...“ und „es
gibt ein Individuum mit ...“.

Individuenbereich: Formal geht man von einer Menge M aus, die man den Individuenbereich
nennt. Die Elemente von M heißen Individuen.

Relationen: Eigenschaften und Beziehungen zwischen Individuen werden durch n-stellige


Relationen auf der Menge M beschrieben. Eine solche Relation R ist eine Teilmenge des n-fachen
kartesischen Produkts M × · · · × M. Das Symbol

( a1 , . . . , a n ) ∈ R

12
Ein Axiomensystem heißt genau dann semantisch widerspruchsfrei, wenn man aus ihm nur Tautologien ableiten kann.
Ferner heißt ein Axiomensystem genau dann syntaktisch widerspruchsfrei, wenn man aus ihm nicht alle Ausdrücke ableiten
kann.
Das Axiomensystem (A1) bis (A15) ist semantisch und syntaktisch widerspruchsfrei.
4.4 Mathematische Logik 309

besagt definitionsgemäß, dass zwischen den Individuen a1 , . . . , an die Beziehung R besteht. Im


Fall n = 1 sagt man auch, dass a1 die Eigenschaft R besitzt.

 Beispiel 1: Der Individuenbereich M sei die Menge R der reellen Zahlen. Ferner sei R gleich
der Menge N der natürlichen Zahlen. Dann besagt

a∈R

dass die reelle Zahl a die Eigenschaft besitzt, eine natürliche Zahl zu sein.
Bezeichnet x eine sogenannte Individuenvariable, dann ist die Aussage

∀ x Rx

wahr, wenn alle Individuen in M zu R gehören (d. h. die „Eigenschaft“ R besitzen). Dagegen ist
diese Aussage falsch, wenn es ein Individuum in M gibt, das nicht zu R gehört. Ferner ist die
Aussage

∃ x Rx

wahr, wenn ein Individuum aus M in R liegt. Dagegen ist diese Aussage falsch, wenn kein
Individuum aus M in R liegt. Analog verfährt man mit 2-stelligen Relationen

∀ x ∀y Rxy usw.

 Beispiel 2: Als Individuenbereich wählen wir die Menge R der reellen Zahlen, und wir
setzen R := {( a, a), | a ∈ R }. Dann ist R eine Teilmenge von R × R. Das Symbol Rab bedeutet
( a, b) ∈ R, und die Formalisierung

∀ a ∀b ( Rab −→ Rba)

bedeutet: Für alle reellen Zahlen a und b folgt aus a = b stets b = a.

Grundzeichen: Im Prädikatenkalkül der ersten Stufe verwendet man folgende Grundzeichen:


(a) Individuenvariable x1 , x2 , . . .;
(k) (k)
(b) Relationsvariable R1 , R2 , . . . mit k = 1, 2, . . .;
(c) aussagenlogische Funktoren ¬, ∧, ∨, −→, ←→;
(d) den Generalisator ∀ und Partikularisator ∃;
(e) Klammern ( , ).
(k ) (k)
Die Relationsvariable Rn wirkt definitionsgemäß auf n Individuenvariable, z. B. R2 x1 x2 .

(k)
Ausdrücke: (i) Jede Zeichenreihe Rn xi1 xi2 · · · xin ist ein Ausdruck (k, n = 1, 2, . . .).
(ii) Sind A, B Ausdrücke, dann sind auch

¬A , ( A ∧ B) , ( A ∨ B) , ( A −→ B) , ( A ←→ B)

Ausdrücke.
(iii) Ist A( x j ) ein Ausdruck, in dem die Individuenvariable x j vollfrei vorkommt13 , dann sind
auch ∀ x j A( x j ) und ∃ x j A( x j ) Ausdrücke.
13
Das heißt, es tritt x j auf, aber weder ∀ x j noch ∃ x j sind Teilzeichenreihen.
310 4 Grundlagen der Mathematik

(iv) Ein Zeichenreihe ist nur dann ein Ausdruck, wenn das auf Grund von (i) bis (iii) der Fall
ist.

Vollständigkeitssatz von Gödel (1930): Im Prädikatenkalkül der ersten Stufe gibt es explizit
angebbare Axiome und explizit angebbare Ableitungsregeln, so dass ein Ausdruck genau dann
eine Tautologie ist, wenn man ihn aus den Axiomen ableiten kann.
Die Situation ist somit analog zum Aussagenkalkül14 in 4.4.1.3.

Satz von Church (1936): Im Unterschied zur Aussagenlogik gibt es im Prädikatenkalkül der
ersten Stufe keinen Algorithmus, der nach endlich vielen Schritten entscheiden kann, ob eine
Aussage eine Tautologie ist oder nicht.

4.4.3 Die Axiome der Mengentheorie

Bei einem streng axiomatischen Aufbau der Mengentheorie nach Zermelo (1908) und Fraenkel
(1925) benutzt man die Grundbegriffe „Menge“ und „Element einer Menge“, die den folgenden
Axiomen genügen sollen.15
(i) Existenzaxiom: Es gibt eine Menge.
(ii) Extensionalitätsaxiom: Zwei Mengen sind genau dann gleich, wenn sie die gleichen Elemente
haben.
(iii) Aussonderungsaxiom: Zu jeder Menge M und jeder Aussage A( x ), gibt es eine Menge A,
deren Elemente genau jene Elemente x von M sind, für die die Aussage A( x ) wahr ist.16

 Beispiel 1: Wir wählen eine Menge M, und A( x ) soll der Bedingung x = x entsprechen. Dann
existiert eine Menge A, die genau alle Elemente x von M mit x = x. enthält. Diese Menge wird
mit ∅ bezeichnet und leere Menge genannt. Nach dem Extensionalitätsaxiom gibt es genau eine
derartige leere Menge.

 Beispiel 2: Es gibt keine Menge aller Mengen.


Beweis: Angenommen, es existiert die Menge M aller Mengen. Nach dem Aussonderungsaxiom
ist dann

A := { x ∈ M | x ∈ x }

eine Menge.
Fall 1: Es gilt A ∈ A. Nach Konstruktion von A folgt daraus A ∈ A.
Fall 2: Es gilt A ∈ A. Nach Konstruktion von A folgt daraus A ∈ A.
In beiden Fällen erhalten wir einen Widerspruch. 
(iv) Paarbildungsaxiom: Sind M und N Mengen, dann gibt es stets eine Menge, die genau M
und N als Elemente enthält.
(v) Vereinigungsmengenaxiom: Zu jedem Mengensystem M gibt es eine Menge, die genau alle
Elemente enthält, die zu mindestens einer Menge von M gehören.
(vi) Potenzmengenaxiom: Zu jeder Menge M existiert ein Mengensystem M das genau alle
Teilmengen von M als Elemente enthält.
14
Die Einzelheiten findet man in [Asser 1975, Bd. 2].
15
Einen Aufbau der Mengentheorie, bei dem auch Unmengen zugelassen sind, findet man in [Klaua, 1964]. Aus stilistischen
Gründen benutzt man anstelle des Begriffs „Menge von Mengen“ das Wort Mengensystem. Das Symbol x ∈ M bedeutet.
dass x ein Element der Menge M ist.
16
Dabei setzen wir in natürlicher Weise voraus, dass x in A(x ) mindestens an einer Stelle nicht durch die Zeichen ∀ oder ∃
gebunden ist, d. h., x ist frei.
4.4 Mathematische Logik 311

Unter dem Nachfolger X + einer Menge X verstehen wir die Menge17


X + := X ∪ { X } .

(vii) Unendlichkeitsaxiom: Es gibt ein Mengensystem M, das die leere Menge und mit einer
Menge zugleich auch deren Nachfolger enthält.
(viii) Auswahlaxiom: Das kartesische Produkt einer nichtleeren Familie von nichtleeren Mengen
ist nicht leer.18
(ix) Ersetzungsaxiom: Es sei A( a, b) eine Aussage, so dass für jedes Element a einer Menge A
die Menge M( a) := {b | A( a, b)} gebildet werden kann.
Dann existiert genau eine Funktion F mit dem Definitionsbereich A, so dass F ( a) = M ( a) für
alle a ∈ A gilt.
Den Aufbau der Mengentheorie aus diesen Axiomen findet man in [Halmos 1974]. Die
Pedanterie bei der Formulierung der Axiome soll die Mengen von den Unmengen abgrenzen, um
Antinomien wie zum Beispiel die Russelsche Antinomie der Menge aller Mengen zu vermeiden.

4.4.4 Cantors Strukturierung des Unendlichen

Bei seinem Aufbau der Mengentheorie führte Cantor transfinite Ordinalzahlen und Kardi-
nalzahlen ein. Ordinalzahlen entsprechen unserer Vorstellung vom „Weiterzählen“, während
Kardinalzahlen „die Anzahl der Elemente“ beschreiben.

4.4.4.1 Ordinalzahlen

Die Menge ω: Wir setzen


0 := ∅ , 1 : = 0+ , 2 : = 1+ , 3 : = 2+ , ...,
wobei x + = x ∪ { x } den Nachfolger von x bezeichnet. Dann gilt19
1 = {0} , 2 = {0, 1} , 3 = {0, 1, 2}, ...
Eine Menge M heißt genau dann eine Nachfolgemenge, wenn sie die leere Menge und mit
einer Menge auch zugleich deren Nachfolger enthält. Es gibt genau eine Nachfolgemenge ω, die
Teilmenge jeder Nachfolgemenge ist.

Definition: Die Elemente von ω heißen natürliche Zahlen.

Rekursionssatz von Dedekind: Gegeben seien eine Funktion ϕ : X −→ X auf der Menge X
und ein festes Element m von X. Dann gibt es genau eine Funktion

R : ω −→ X

mit R(0) = m und R( n+ ) = ϕ( R(n )). Man nennt R eine rekursive Funktion.

 Beispiel 1 (Addition natürlicher Zahlen): Wir wählen X : = ω, und ϕ sei durch ϕ( x ) := x + für
alle x ∈ ω gegeben. Dann existiert zu jeder natürlichen Zahl m genau eine Funktion R : ω −→ ω
mit R(0) = m und R( n+ ) = R(n )+ für alle n ∈ ω. Wir setzen m + n := R( n). Das bedeutet

m+0 = m und m + n+ = (m + n)+

17
Mit { X } bezeichnen wir jene Menge, die genau X als Element enthält.
18
Funktionen, Mengenfamilien und kartesische Produkte werden wie in 4.3 definiert.
19
Man beachte 1 = ∅ ∪ {∅} = {∅} = {0}, 2 = 1 ∪ {1} = {0} ∪ {1} = {0, 1} usw.
312 4 Grundlagen der Mathematik

für alle natürlichen Zahlen n und m. Speziell gilt m + 1 = m+ , denn es ist m + 1 = m + 0+ =


( m + 0) + = m + .
Auf diesem Weg ist es möglich, mit Hilfe der Axiome der Mengentheorie die Menge ω der
natürlichen Zahlen einzuführen20 und darauf eine Addition zu erklären. In analoger Weise ergibt
sich die Multiplikation natürlicher Zahlen. Durch Konstruktion geeigneter Äquivalenzklassen
kann man dann aus ω der Reihe nach die Menge der ganzen, rationalen, reellen und komplexen
Zahlen konstruieren (vgl. [Oberschelp 1968]).

 Beispiel 2 (ganze Zahlen): Die Menge der ganzen Zahlen kann durch folgende Konstruktion
erhalten werden. Wir betrachten alle Paare ( m, n) mit m, n ∈ ω und schreiben

(m, n) ∼ ( a, b) genau dann, wenn m + b = a + n gilt.

Die zugehörigen Äquivalenzklassen [(m, n)] heißen ganze Zahlen.21 Beispielsweise gilt (1, 3) ∼
(2, 4).

Definition: Unter einer Ordinalzahl versteht man eine wohlgeordnete Menge X mit der Eigen-
schaft, dass für alle a ∈ X die Menge

{ x ∈ X : x < a}

gleich a ist.

 Beispiel 3: Die oben definierten Mengen 0, 1, 2 . . . und ω sind Ordinalzahlen. Ferner sind

ω + 1 := ω + , ω + 2 : = ( ω + 1) + , ...

Ordinalzahlen. Sie entsprechen dem Weiterzählen nach ω.


Sind α und β Ordinalzahlen, so schreiben wir genau dann

α < β,

wenn α eine Teilmenge von β ist.

Satz: (i) Für zwei Ordinalzahlen α und β gilt genau eine der drei Beziehungen α < β, α =
β, α > β.
(ii) Jede Menge von Ordinalzahlen ist wohlgeordnet
(iii) Jede wohlgeordnete Menge X ist zu genau einer Ordinalzahl gleichgeordnet, die wir mit
ord X bezeichnen und die Ordinalzahl von X nennen.

Ordinale Summe: Sind A und B zwei disjunkte wohlgeordnete Mengen, dann erklären wir
die ordinale Summe

„A ∪ B “

als die Vereinigungsmenge A ∪ B mit der folgenden natürlichen Ordnung:

a≤b für a∈A und b ∈ B.

Ferner entspricht a ≤ b der Ordnungsrelation auf A (bzw. B) falls a und b beide zu A (bzw. zu
B) gehören.
20
Um den Ordinalzahlcharakter zu betonen, benutzen wir hier (der mengentheoretischen Tradition folgend) das Symbol ω
anstelle von N.
21
Intuitiv entspricht [(m, n )] der Zahl m − n.
4.4 Mathematische Logik 313

Ordinales Produkt: Sind A und B zwei wohlgeordnete Mengen, dann ist das ordinale Produkt

„A × B“

gleich der Produktmenge A × B versehen mit der lexikographischen Ordnung, d. h., es ist
( a, b) < (c, d) genau dann, wenn entweder a < c oder a = c und b < d gilt.

Ordinalzahlarithmetik: Es seien α und β zwei Ordinalzahlen. Dann gibt es genau eine Ordinal-
zahl γ, die zur ordinalen Summe „α ∪ β“ gleichgeordnet ist. Wir erklären die Ordinalzahlsumme
durch

α + β := γ .

 Beispiel 4: Es ist α + 1 = α+ für alle Ordinalzahlen α.


Ferner gibt es genau eine Ordinalzahl δ, die zum ordinalen Produkt „α × β“ gleichgeordnet
ist. Wir erklären das Ordinalzahlprodukt durch

αβ := δ .

 Beispiel 5: Wir betrachten die lexikographisch geordnete Menge ω × ω:

(0, 0) (0, 1) (0, 2) (0, 3) ...


(1, 0) (1, 1) (1, 2) (1, 3) ...
...

(i) Die erste Zeile ist gleichgeordnet mit ω, d. h., die Ordinalzahl der ersten Zeile ist ω.
(ii) Die erste Zeile zusammen mit (1, 0) ist gleichgeordnet zu ω + 1, d. h., die Ordinalzahl
dieser Menge ist ω + 1.
(iii) Die Ordinalzahl der ersten Zeile zusammen mit der zweiten Zeile ist 2ω.
(iv) Versehen wir die erste und zweite Spalte mit der lexikographischen Ordnung (0, 0), (0, 1),
(1, 0), (1, 1), . . ., dann entsteht eine Menge M deren Ordinalzahl ω2 ist. Andererseits ist M
gleichgeordnet zur Menge der natürlichen Zahlen. Somit gilt ω2 = ω, d. h., 2ω = ω2.
(v) Die Ordinalzahl der gesamten Matrix ist ωω, d. h., ord(ω × ω ) = ωω.

Antinomie von Burali-Forti: Die Gesamtheit aller Ordinalzahlen ist keine Menge.

4.4.4.2 Kardinalzahlen

Gegeben sei eine beliebige Menge A. Alle Ordinalzahlen, die zu A gleich mächtig sind, bilden
eine wohlgeordnete Menge. Die kleinste Ordinalzahl dieser Menge heißt die Kardinalzahl card A,
von A.
Die Relation card A ≤ card B entspricht definitionsgemäß der Ordinalzahlordnung.

Satz: (i) Es ist card A = card B genau dann, wenn A gleichmächtig zu B ist.
(ii) Es ist card A < card B genau dann, wenn B mächtiger als A ist.
 Beispiel: Für eine endliche Menge A ist card A gleich der Anzahl der Elemente von A.

Kardinalzahlarithmetik: Sind A und B disjunkte Mengen, dann erklären wir die Kardinalzahl-
summe durch

card A + card B := card( A ∪ B) .


314 4 Grundlagen der Mathematik

Für zwei beliebige Mengen A und B definieren wir das Kardinalzahlprodukt durch

(card A)(card B) := card( A × B) .

Diese Definitionen sind unabhängig von der Wahl der Repräsentanten A und B.

Antinomie von Cantor: Die Gesamtheit aller Kardinalzahlen ist keine Menge.

4.4.4.3 Die Kontinuumshypothese

Die Kardinalzahl card ω der Menge der natürlichen Zahl ω bezeichnet22 man mit ℵ0 . Es gibt
eine kleinste Kardinalzahl ℵ1 , die echt größer als ℵ0 ist. Die folgenden beiden Fälle sind denkbar:
(i) ℵ0 < ℵ1 = card R.
(ii) ℵ0 < ℵ1 < card R.
Man bezeichnet die Kardinalzahl card R der Menge der reellen Zahlen als die Mächtigkeit des
Kontinuums. Cantor versuchte vergeblich, die sogenannte Kontinuumshypothese (i) zu beweisen.
Anschaulich besagt (i), dass es zwischen der Mächtigkeit der Menge der natürlichen Zahlen und
der Mächtigkeit des Kontinuums keine weitere Mächtigkeit gibt.
Im Jahre 1940 bewies Gödel, dass die Kontinuumshypothese (i) mit den übrigen Axiomen der
Mengentheorie verträglich ist; 1963 zeigte Cohen, dass das auch für (ii) gilt.

Satz von Gödel-Cohen: Das Auswahlaxiom und die Kontinuumshypothese sind unabhängig
von den übrigen Axiomen der Mengentheorie.
Genauer bedeutet das: Sind die Axiome der Mengentheorie in 4.4.3 widerspruchsfrei, dann
kann man (i) oder (ii) hinzunehmen, ohne einen Widerspruch zu erhalten. Das gleiche Resultat
bleibt bestehen, wenn man in 4.4.3 das Auswahlaxiom durch seine Negation ersetzt.
Dieses überraschende Ergebnis zeigt, dass es nicht eine Mengentheorie, sondern mehrere
Mengentheorien gibt und dass die sehr einleuchtenden Axiome in 4.4.3 entgegen unseren
Erwartungen die Strukturierung des Unendlichen nicht eindeutig festlegen.
Es ist eine wesentliche Erkenntnis der Physik und Mathematik des 20. Jahrhunderts, dass der
sogenannte „gesunde Menschenverstand“ versagt, sobald wir in Erkenntnisbereiche vorstoßen,
die weit von unserer täglichen Erfahrungswelt entfernt sind. Das betrifft die Quantentheorie (ato-
mare Dimensionen), die Relativitätstheorie (hohe Geschwindigkeiten und kosmische Maßstäbe)
sowie die Mengentheorie (der Begriff des Unendlichen).

4.5 Geschichte der axiomatischen Methode und ihr Verhältnis zur


philosophischen Erkenntnistheorie

Bevor man axiomatisiert, muss mathematische Substanz vorhanden sein.

Hermann Weyl 23 (1885–1955)

In der Geschichte der Mathematik beobachtet man zwei grundlegende Tendenzen:


(i) die Wechselwirkung mit den Naturwissenschaften und
22
Das Symbol ℵ ist der erste Buchstabe aleph des hebräischen Alphabets.
23
Hermann Weyl wurde im Jahre 1930 der Nachfolger von David Hilbert in Göttingen. 1933 emigrierte er in die USA
und arbeitete zusammen mit Albert Einstein am weltberühmten Institute for Advanced Study in Princeton (New
Jersey). Richard Courant, der ebenfalls 1933 emigrierte, gründete in New York das heute nach ihm benannte ebenfalls
weltberühmte Courant-Institut in New York.
4.5 Geschichte der axiomatischen Methode 315

(ii) die Wechselwirkung mit der philosophischen Erkenntnistheorie.


In diesem Abschnitt werden wir uns mit (ii) beschäftigen. Eine ausführliche Diskussion von
(i) findet man in 10.1 im Handbuch. Der Abschnitt 14.9 des Handbuchs ist der faszinierenden
Wechselwirkung zwischen Geometrie und moderner Physik gewidmet (Elementarteilchen und
Kosmologie). Eine Tafel zur Geschichte der Mathematik findet man am Ende dieses Taschenbu-
ches.

Axiome: Die axiomatische Darstellung einer mathematischen Disziplin entspricht dem folgen-
den Schema:
Axiome

Logik (Beweis)

mathematische Sätze
An der Spitze stehen sogenannte Postulate oder Axiome. Das sind Annahmen, die nicht bewie-
sen werden brauchen. Tatsächlich ergeben sich die Axiome nicht in willkürlicher Weise, sondern
sie sind das Ergebnis eines langen mathematischen Erkenntnisprozesses. Aus den Axiomen
gewinnt man mit Hilfe logischer Schlüsse, die man Beweise nennt, sogenannte mathematische
Sätze. Besonders wichtige Sätze heißen Hauptsätze oder Theoreme.24
Definitionen vergeben einen Namen für einen häufig wiederkehrenden Sachverhalt.

Die „Elemente“ des Euklid: Das Vorbild für die axiomatische Darstellung einer mathemati-
schen Disziplin waren 2000 Jahre lang die „Elemente“ des Euklid, die dieser etwa 325 v. Chr. in
Alexandria niedergeschrieben hat. Die „Elemente“ beginnen mit den folgenden Definitionen: 1.
Ein Punkt ist, was keine Teile hat. 2. Eine Linie ist breitenlose Länge. 3 ...
Berühmt geworden ist das sogenannte Parallelenaxiom. Es lautet in einer äquivalenten modernen
Fassung:
(P) Liegt der Punkt P nicht auf der Geraden g, dann gibt es in der von P und g aufgespannten
Ebene genau eine Gerade durch den Punkt P, die die Gerade g nicht schneidet.
Erst im 19. Jahrhundert bewiesen Bolyai, Gauß und Lobatschewski, dass das Parallelenaxiom
unabhängig von den übrigen Axiomen des Euklid ist. Das heißt, es existiert eine Geometrie, in
der (P) gilt, und es gibt Geometrien, in denen (P) nicht gilt (vgl. 3.2.7).

Hilberts Grundlagen der Geometrie: Die moderne axiomatische Methode wurde von Hilbert
mit seinen „Grundlagen der Geometrie“ im Jahre 1899 geschaffen. Hilbert nimmt hier gegenüber
Euklid einen viel radikaleren Standpunkt ein. Er versucht nicht, etwa den Begriff des Punktes zu
definieren, sondern er stellt die Grundbegriffe „Punkt, Gerade, Ebene“ und Wortkombinationen
wie „geht durch“, „kongruent“, „liegt zwischen“ ohne inhaltliche Erläuterungen an die Spitze
und formuliert damit die Axiome. Sein erstes Axiom lautet beispielsweise: Durch zwei verschie-
dene Punkte geht stets eine Gerade. Das eröffnet die Möglichkeit, völlig unterschiedliche Modelle
zu betrachten. Zum Beispiel entspricht im Poincaré-Modell der hyperbolischen Geometrie der
Begriff „Gerade“ einem Kreis mit dem Mittelpunkt auf der x-Achse (vgl. 3.2.8).

Hilberts Beweis der relativen Widerspruchsfreiheit der Geometrie: Unter der Vorausset-
zung, dass gewisse Teile der Algebra und Analysis widerspruchsfrei sind, konnte Hilbert die
Widerspruchsfreiheit der Geometrie nachweisen, indem er kartesische Koordinaten benutzte
und dadurch Aussagen der Geometrie in Aussagen der Algebra und Analysis übersetzte. Zum
24
Zur Strukturierung von Beweisen ist es oft nützlich, Zwischenergebnisse als Hilfssätze zu formulieren. Ein häufig benutzter
Hilfssatz wird auch Lemma genannt.
316 4 Grundlagen der Mathematik

Beispiel entspricht der Satz der ebenen euklidischen Geometrie „zwei nichtparallele Geraden
schneiden sich in genau einem Punkt“ der Tatsache, dass das Gleichungssystem

Ax + By + C = 0 ,
Dx + Ey + F = 0

für gegebene reelle Zahlen A, B, C, D, E, F mit AE − BD = 0 genau ein reelles Lösungspaar ( x, y)


besitzt.

Hilberts Programm eines absoluten Beweises für die Widerspruchsfreiheit der Mathema-
tik: Um 1920 entwickelte Hilbert ein Programm mit dem Ziel, die Widerspruchsfreiheit der
gesamten Mathematik zu beweisen. Das Vorbild für die Hilbertsche Beweistheorie ist der Haupt-
satz der Aussagenlogik in 4.4.1.3. Die wesentliche Idee besteht darin, dass man alle „Sätze
einer Theorie“ als einer festen Zahl von Axiomen durch Anwendung einer festen Zahl von
Ableitungsregeln in rein formaler Weise erhalten kann.

Der Gödelsche Unvollständigkeitssatz: Im Jahre 1932 erschien die grundlegende Arbeit von
Kurt Gödel „Über formal unentscheidbare Sätze der Principia Mathematica und verwandte
Sätze“. Dort wurde gezeigt, dass es in einem hinreichend reichhaltigen Axiomensystem, das
die Theorie der Zahlen umfasst, stets Sätze gibt, die nicht aus den Axiomen abgeleitet werden
können, obwohl diese Sätze (von einer höheren Warte aus betrachtet) wahr sind.
Ferner zeigte Gödel, dass man die Widerspruchsfreiheit eines derartigen Axiomensystems nur
beweisen kann, indem man zu einem umfassenderen System übergeht. Damit erwies sich das
Hilbertsche Programm eines absoluten Beweises für die Widerspruchsfreiheit der Mathematik
als undurchführbar. Mathematik ist nach Gödels Erkenntnissen mehr als ein formales System
von Axiomen und Ableitungsregeln.

Mathematische Logik: Gödels Arbeit stellt einen Höhepunkt der mathematischen Logik dar.
Die formale Logik – als wichtiger Bestandteil der Philosophie – geht bereits auf Aristoteles
(384–322 v. Chr.) zurück.
Das erste Grundprinzip des Denkens stellt nach Aristoteles der Satz vom Widerspruch dar. Er
schreibt: „Man kann nicht akzeptieren, dass ein und dasselbe Ding existiert und nicht existiert“.
Das zweite Grundprinzip des Aristoteles ist der Satz vom ausgeschlossenen Dritten: „Eine
Aussage ist entweder wahr oder falsch“. Alle indirekten Beweise der Mathematik benutzen
dieses Prinzip in der folgenden Form: Ist die Negation einer Aussage falsch, dann muss die
Aussage wahr sein.25
Der Terminus Logik wurde von dem Stoiker Zenon (336–264 v. Chr.) eingeführt. Das griechische
Wort logos steht für Wort, Rede, Denken, Vernunft.
Leibniz (1646–1716) sprach den Gedanken aus, eine mathematische Symbolik in die Logik
einzuführen. Das erste System einer solchen Symbolschrift schuf der englische Mathematiker
George Boole (1815–1869). Mit der 1879 erschienenen „Begriffsschrift“ von Gottlob Frege (1848–
1925) begann die mathematische Logik heutiger Prägung. Das in den Jahren 1910 bis 1913
erschienene monumentale dreibändige Werk „Principia Mathematica“ von Bertrand Russel
(1872–1970) und Alfred Whitehead (1861–1947) enthielt erstmalig die Hilfsmittel, um die gesamte
Mathematik in formaler Symbolschrift darzustellen. Diese Entwicklung fand einen gewissen
Abschluss mit dem Erscheinen der „Grundzüge der theoretischen Logik“ von Hilbert und
Ackermann im Jahre 1928 und dem Erscheinen der zweibändigen „Grundlagen der Mathematik“
von Hilbert und Bernays aus den Jahren 1934 und 1939.
25
Die Anwendung dieses Prinzips wird nicht von allen Mathematikern akzeptiert. Um 1920 begründete Brouwer die
sogenannte intuitionistische Mathematik, die indirekte Beweise strikt ablehnt und nur konstruktive Beweise zulässt.
Literatur zu Kapitel 4 317

Als moderne Einführung in die mathematische Logik empfehlen wir [Manin 1977]. Das
fruchtbare Zusammenspiel zwischen mathematischer Logik und Informatik wird in Kapitel 9
dargestellt.
Unter dem Einfluss der Quantentheorie und den Bedürfnissen der Informatik ist eine mehr-
wertige Logik geschaffen worden, die neben „wahr“ und „falsch“ noch weitere Wahrheitswerte
zulässt (z. B. „möglich“). Die zugehörige Mengentheorie führt auf unscharfe Mengen (fuzzy sets).
Dieser moderne Zweig der theoretischen Informatik wird in 9.10 betrachtet.

Literatur zu Kapitel 4
[Aigner et al. 2009] Aigner, M., Ziegler, G., Hofmann, K.: Das BUCH der Beweise, Springer, Berlin (2009)
[Asser 1975/81] Asser, G.: Einführung in die mathematische Logik. Bd. 1-3. 6., 2., 1. Auflage, Teubner,
Leipzig (1975/81)
[Beckermann 2010] Beckermann, A.: Einführung in die Logik. De Gruyter, Berlin (2010)
[Deiser 2010, 1] Deiser, O.: Einführung in die Mengenlehre. Springer, Berlin (2010)
[Deiser 2010, 2] Deiser, O.: Grundbegriffe der wissenschaftlichen Mathematik. Springer, Berlin (2010)
[Deiser et al. 2011] Deiser, O., Lasser, C., Voigt, E., Werner, D.: 12 × 12 Schlüsselkonzepte zur Mathematik,
Spektrum Akademischer Verlag, Heidelberg (2011)
[Ebbinghaus 2003] Ebbinghaus, H.: Einführung in die Mengenlehre. Spektrum Akademischer Verlag, Hei-
delberg (2003)
[Ebbinghaus et al. 2007] Ebbinghaus, H., Flum, J., Thomas, W.: Einführung in die mathematische Logik.
Spektrum Akademischer Verlag, Heidelberg (2007)
[Ebbinghaus et al. 1992] Ebbinghaus, H., Hirzebruch, F., Koecher, M., Mainzer, K., Neukirch, J., Prestel, A.,
Remmert, R.: Zahlen. Springer, Berlin (1992)
[Euklid 2003] Euklid.: Die Elemente. Band I–V, Harry Deutsch, Frankfurt/Main (2003)
[Halmos 1974] Halmos, P.: Naive Set Theory. Springer, Berlin (1974)
[Hermes 1991] Hermes, H.: Einführung in die mathematische Logik. Klassische Prädikatenlogik, Teubner,
Stuttgart (1991)
[Hilbert und Bernays 1968/70] Hilbert, D., Bernays, P.: Grundlagen der Mathematik. Bd. 1, 2. Springer Berlin
(1968/70)
[Hilbert und Ackermann 1967] Hilbert, D., Ackermann, W.: Grundzüge der theoretischen Logik, Springer,
Berlin (1967)
[Hoffmann 2011] Hoffmann, D., Grenzen der Mathematik. Eine Reise durch die Kerngebiete der mathemati-
schen Logik. Spektrum Akademischer Verlag, Heidelberg (2011)
[Hofstadter 1995] Hofstadter, D.: Gödel, Escher, Bach: Ein endloses geflochtenes Band. 14. Auflage. Klett-
Cotta, Stuttgart (1995)
[Klaua 1964] Allgemeine Mengenlehre, Akademie-Verlag, Berlin (1964)
[Manin 2010] Manin, Yu.: A Course in Mathematical Logic for Mathematicians. Springer, New York (2010)
[Oberschelp 1968] Oberschelp, A.: Aufbau des Zahlensystems, Vandenhoeck & Ruprecht, Göttingen (1969)
[Paech 2010] Paech, F:. Mathematik – anschaulich und unterhaltsam. Zur Vorbereitung und Begleitung des
Studiums. Carl Hanser Verlag, München (2010)
[Potter 1984] Potter, M.: Mengentheorie. Spektrum Akademischer Verlag, Heidelberg (1994)
[Rautenberg 2008] Rautenberg, W.: Einführung in die Mathematische Logik. Vieweg+Teubner, Wiesbaden
(2008)
[Smith 2007] Smith, P.: An Introduction to Gödel’s Theorems. Cambridge University Press, Cambridge,
United Kingdom (2007)
[Tarski 1977] Tarski, A.: Einführung in die mathematische Logik. Vanderhoeck & Ruprecht, Göttingen (1977)
[Wilenkin 1986] Wilenkin, N.: Unterhaltsame Mengenlehre. Teubner, Leipzig (1986)
Index
Abbildung, 297 Multiplizität eines Schnittpunkts, 226
bijektive, 298 rationale, 227, 231
birationale, 227 rationale Abbildung einer, 227
flächentreue, 190 regulärer Punkt, 228
injektive, 298 singulärer Punkt, 228
inverse, 298 algebraische Körpererweiterung, 81
Korrespondenz, 300 algebraische Zahl, 108
längentreue, 190 algebraischer Zahlkörper, 126
ordnungstreue, 304 algebraisches Element, 81
projektive, 169 algebraisches Komplement, 50
rationale, 227 Algorithmus
surjektive, 298 Euklidischer, 19, 25, 26, 232
symplektische, 275 Gaußscher, 14
winkeltreue, 190 allgemeine Lösung (linearer Gleichungssysteme), 13
Abelsche Gruppe, 66 alternierende Gruppe, 68
Abelsche Körpererweiterung, 126 analytische Geometrie, 155
Abelsches Integral, 213, 217, 231 analytische Klassenzahlformel, 125
Ableitung, äußere, 258 analytische Menge, irreduzible, 238
Ableitungsgleichungen, 195 analytische Zahlentheorie, 94
Abstand, 156, 247 Anordnungsaxiom, 148
hyperbolischer, 153 Antinomie von Burali-Forti, 313
abwickelbare Regelfläche, 194 antisymmetrische Bilinearform, 54
Addition, auf einer elliptischen Kurve, 216 antisymmetrischer Tensor, 62
Additionstheorem, für die ℘-Funktion, 215 Approximation von π, 108, 112
additive Gruppe, 72 Approximationsordnung, 110
adjungierter Operator, 245 Approximationssatz
Adjunkte eines Matrixelements, 6 Dirichlet, 108
ähnliche Figuren, 174 Hurwitz, 108
Ähnlichkeitsgeometrie, 173 Liouville, 110
Ähnlichkeitssatz (Matrizen), 37 Roth, 110
äquivalente Wörter, 3 äquivalenter Ausdruck, 307
affiner Unterraum, 48 Äquivalenz, logische, 283
Affinität, 174 Äquivalenzklasse, 302
Ähnlichkeit in der Geometrie, 130 Äquivalenzrelation, 302
Ähnlichkeitssatz, 137 Archimedische Spirale, 202
Ähnlichkeitstransformation, 31 Arithmetica, 88, 236, 237
Akkord, 233 arithmetisch-geometrisches Mittel, 201
Algebra, 54 arithmetische Progression, 94
Fundamentalsatz, 20 Ars Magna, 22, 23
homologische, 126 Assoziativgesetz, 56, 66, 69, 295
innere, 257 im Ring, 72
Lie, 38 Astroide, 199
lineare, 40 Asymptote, 182
äußere, 62, 257 asymptotische Formel, 95, 102
algebraische Funktion, 89 Atiyah-Singer-Indextheorem, 46, 274
Integral, 224 Aufblasen, 239
algebraische Kurve, 225 auflösbare Gruppe, 72
Auflösung der Singularitäten, 229 Ausdruck, 305, 309
duale, 228 Aussage, 281, 305
elliptische, 231 Aussagenlogik, 308
Geschlecht, 230 äußere direkte Summe, 51
Grad, 225 äußeres Produkt, 55, 62
höherer Ordnung, 217 automorphe Funktion, 213, 217, 243
irreduzible, 225 Automorphismus, siehe Bewegung
Klasse, 228, 228 Axiom, 315

E. Zeidler (Hrsg.), Springer-Handbuch der Mathematik II,


DOI 10.1007/978-3-658-00297-8, © Springer Fachmedien Wiesbaden 2013
Index 319

Archimedes, 150 Hilbertraum, 270


Mengentheorie, 310 Minkowskiraum, 258, 265
Pasch, 148 Cliffordmultiplikation, 53
Cliffordnorm, 271
Banachraum, 41 Cramersche Regel, 15
baryzentrische Koordinaten, 175
Basis darstellende Geometrie, 175
duale, 52 de Morgansche Regel, 285, 296
symplektische, 274 de Rhamsche Kohomologie, 40
Basissatz, 123, 247, 253 Dedekindsche Modulfunktion, 102
Bedingung Definitionsbereich, 297
hinreichende, 283 Delisches Problem, 78, 86, 223
notwendige, 283 δ-Ableitung von Hodge, 259
begleitendes Dreibein, 184, 187 Descartes Zeichenregel, 24
Bettische Zahl, 72 Determinante, 5
Bewegung, 129 Differentiation, 7
Gruppe, 130 Entwicklungssatz, 6
Bewegungsgleichung eines geladenen Teilchens, 264 Vandermondsche, 7
Beweis, 283 Determinantensatz, 37
Eindeutigkeit, 287 Diagnoalisierungskriterium, 37
Existenz, 287 Diagonalisierung, 30
falscher, 291 gemeinsame, 36
indirekter, 286 Dielektrizitätskonstante, 263
konstruktiver, 288 Differential- und Integralrechnung, 89
per Induktion, 286 Differentialform, 58
Beweismethoden, 286 auf dem Minkowskiraum, 258
Bewertung, p-adische, 120 Differentialgeometrie, 176
Bewertung eines Körpers, 119 Differentialgleichung, 89
Bewertungstheorie, 126 für Bahnkurve, 264
Bifurkation, 211 Differentialoperator, Symbol, 46
bijektiv, 45, 298 Dimension eines linearen Raums, 42
Bildmenge, 297 diophantische birationale Transformation von Poin-
Bildpunkt, 297 caré, 236
Bilinearform, 54 diophantische Geometrie, 209, 232
antisymmetrische, 54, 243 diophantische Gleichungen, 232
nichtentartete, 54, 253 diophantische Äquivalenz, 236
schiefsymmetrische, 274 Diracgleichung, 64, 267
Signatur, 253 Diracsche Matrizen, 64
symmetrishe, 54 Diracsche Spinoralgebra, 64
Binomialkoeffizient, 2 direkte Summe, 49
binomischer Lehrsatz, 2 äußere, 62
biquadratische Gleichung, 23 Dirichletsche Approximation, 108
birationales Äquivalent, 227 Dirichletsche L-Reihe, 90, 98
Bispinor, 267 Dirichletsches Lokalisierungsprinzip für Primzahlen,
Bogenlänge, 177, 189, 256 98
Boltzmannkonstante, 97 diskretes Denken, 89
Boson, 66, 269 Diskriminante, 21, 26, 124
Buchproblem, 2 Disquisitiones arithmeticae von Gauß, 88, 90, 125
Burali-Forti Paradoxon, 313 Distributivgesetz, 295
im Ring, 72
Cantors Strukturierung des Unendlichen, 311 Divergenz, 259
Cartansche Subalgebra, 250 Division, Polynom-, 18
Cartansches Differentialkalkül, 257 Doppelpunkt, 211, 228
Cassinische Kurve, 201, 222 Drehformel von Hamilton, 272
casus irreducibilis, 22 Drehgruppe, 160
Chaos, 90, 108 Drehimpuls, 268
Charakter (Dirichlet), 98 Drehspiegelung, 159
Charakteristik, Eulersche, 231 Drehung, 30, 159, 261
charakteristische Gleichung, 29 Dreieck, 150
Chiralität, 269 ähnliches, 137
Christoffelsymbol, 195 Flächeninhalt, 157
Cliffordalgebra, 63, 243, 257, 265 fundamentale Gesetze, 131
320 Index

gleichschenkliges, 132 Addition auf, 216


gleichseitiges, 132 Gruppenstruktur, 215
kongruentes, 137 elliptischer Diracoperator, 273
rechtwinkliges, 132 elliptisches Integral, 213, 214
Schwerpunkt, 136 Energie, 89
Seitenhalbierende, 136 Energieoperator, 242
sphärisches, 138, 142 Entwicklungssatz für Determinanten, 6
stumpfwinkliges, 132 epimorphes Bild, 70
Dreiecksberechnung, 135 Epimorphismus, 69
Dreiecksgestalt, 14 Epizyklen, 209
Dreiecksungleichung, 131, 143 Epizykloide, 207
duale Basis, 52 Erlanger Programm, 129
duale Kurve, 228 erste Fundamentalform, 189
dualer Operator, 53 Erweiterungskörper, algebraisch abgeschlossener, 82
dualer Raum, 52 erzeugendes Element, 71
Dualisierungsformel, 259 Euklidische Bewegung, 159
Dualitätsoperator, 257 Euklidische Bewegungsgruppe, 159
Dualitätsprinzip, 168 Euklidische Geometrie, 130, 159, 173
Dualitätssymmetrie der Maxwellschen Gleichungen, Euklidischer Algorithmus, 19, 25, 26, 90, 92, 105, 232
264 Euklidischer Höhensatz, 133
Durchschnittsmenge, 305 Euklidischer Kathetensatz, 133
dynamisches System, 90 Euklidischer Ring, 122
Euklidisches Parallelaxiom, 151
Ebene Eulercharakteristik, 231
hyperbolische, 152 Eulersche ϕ-Funktion, 93
Poincaréische, 152 Eulersche Produktformel, 113
ebene Geometrie, 147 Eulersche Rekursionsformel, 101
ebene Trigonometrie, 131 Evolute, 198
Ebenengleichung, 158 Evolvente, 199
Eichboson, 269 Exponentialfunktion von Matrizen, 38
Eichfeldtheorie, 265
eigentliche Bewegung, 159 Faktorengruppe, 70
Eigenvektor, 28 Faktorenring, 73
Eigenwert, 28 Faktorisierungsproblem, 238
algebraische Vielfachheit, 29, 36 Faktormenge, 302
geometrische Vielfachheit, 36 Faktorraum, 49, 302
Eigenzeit, 257, 262 Familie von Mengen, 304
Eindeutigkeitsbeweis, 287 fast komplexe Struktur, 274, 275
einfache Gruppe, 68 Fehlerabschätzung
Einheit, 121 a posteriori, 290
Einheitsmatrix, 10 a priori, 290
Einheitsnormalenvektor, 158 Fermats letzter Satz, 218
Einhüllende, 198 Fermatsche Gleichung, 234
Einsteinsche Masse-Energieäquivalenzrelation, 265 Fermatsche Vermutung, 89, 237
Einsteinsche Summenkonvention, 57, 59, 188 Fermion, 66, 265, 269
Einsteinsches Relativitätsprinzip, 259 Fieldsmedaille, 89, 237
Einsteinsches Zwillingsparadoxon, 262 flächentreue Abbildung, 190
Elektrodynamik, 263 Fläche, 40, 187
elektromagnetische Wechselwirkung, 269 Abbildung, 190
elektromagnetischer Feldtensor, 263 abwickelbare, 194
Elektron, relativistisches, 267 erste Fundamentalform, 189
Elektronenspin, 268, 269 Hauptkrümmungsrichtung, 192
Element, 292 kanonisches kartesisches Koordinatensystem,
algebraisches, 81 192
transzendentes, 81 konstanter Gaußscher Krümmung, 192
elementarsymmetrische Funktion, 25, 85 Orientierung, 191
Elementarteilchen, 269 quadratische, 33, 163
Standardmodell, 265 Riemannsche, 89, 214, 217, 229
Elementarteiler, 37 zweite Fundamentalform, 191
Elemente, 91, 315 Form
elliptische Funktion, 90 quadratische, 33
elliptische Kurve, 214, 231 positiv definit, 34
Index 321

symplektische, 35 elliptische, 151


Formel Euklidische, 130, 173
binomische, 2 hyperbolische, 152
Cardanosche, 22 nichtarchimedische, 150
Hardy und Ramanunjan, 102 nichteuklidische, 151
Heronische, 132 projektive, 167, 174
Möbiussche Umkehr-, 93 pseudounitäre, 252, 254
Mollweidsche, 132, 144 Riemannsche, 154
Nepersche, 144 sphärische, 141
Formel von Clebsch, 231 Spin, 265
Formel von John Machin, 114 symplektische, 35, 274
Fourierintegral, Operator, 35 unitäre, 246
Fredholmsche Alternative, 16 geometrische Optik, 35
fundamentaler Zerlegungssatz von Dedekind, 124 geordnetes Paar, 296
Fundamentalform Gerade, 147, 155
erste, 189 parallele, 151
zweite, 191 projektive, 168
Fundamentalsatz unendlich ferne, 153, 219
Algebra, 20 Geradengleichung, 155
Arithmetik, 91 Gesamtheit, 292
Euler, 96 Gesamtkrümmung, 197
Logik, 285 Geschlecht einer Riemannschen Fläche, 217
Riemann, 96 gewöhnliche Differentialgleichung, 38
Funktion Gitter, 119
algebraische, 89, 217 Gitterpunktsatz von Minkowski, 119
automorphe, 213, 217 Gittervolumen, 119
elementarsymmetrische, 25, 85 gleichschenkliges Dreieck, 132
Gammafunktion, 2 gleichseitiges Dreieck, 132
Höhe, 122 Gleichung
Klassifikation, 298 biquadratische, 23
logarithmisches Integral, 95 characteristische – einer Matrix, 29
mehrdeutige, 214, 217 diophantische, 232
Möbiussche, 93 kubische, 21
rationale, 27 lineare, 211
rekursive, 311 Mainardi-Codazzi, 195
Riemannsche ζ-Funktion, 96 Pellsche, 234
Wahrheitswert, 306 quadratische, 21, 212
Funktionalanalysis, 211 Gleichungssystem
Funktionalgleichung, 96 homogenes lineares, 14
Funktor, 309 inhomogenes lineares, 14
lineares, 12
Galileitransformation, 260 Gödelscher Unvollstandigkeitssatz, 316
Galoisfeld, 76 Gödelscher Vollständigkeitssatz, 310
ganze Zahl, Kontruktion der Menge, 312 Goldbachsche Vermutung, 99
Garbenbegriff, 241 Goldener Schnitt, 106, 107
Gauß-Algorithmus, 14 Grad einer algebraischen Kurve, 225
Gaußklammer, 100, 105 Graduierung, 51
Gaußsche Krümmung, 192 Graph, 298
Gaußsche Summe, 119 Gravitation, 270
Gaußscher Restklassenring, 74 Gravitino, 270
Generalisator, 282 Graßmannalgebra, 61, 64, 66, 257
Geodäsie, 138 Großkreis, 141
erste Grundaufgabe, 139 Gruppe, 66
sphärische, 141 Abelsche, 66
geodätische Krümmung, 197 additive, 69
Geometrie allgemeine lineare - GL(n, C), 11
affine, 174 allgemeine lineare - GL(n, R), 66
Ahnlichkeit, 130 alternierende, 68
Axiome, 148 Assoziativgesetz, 66
darstellende, 175 auflösbare, 72
diophantische, 209, 232 Automorphismus, 69
ebene, 147, 173 einfache, 68
322 Index

elliptische Kurve, 215 Ideal, 122


Euklidische Bewegungsgruppe, 160 gebrochenes, 125
Homologie, 72 Primär-, 122
Homomorphismus, 69 Produkt, 123
Kern, 70 ideale Teilmenge eines Ringes, 73
innerer Automorphismus, 69 Idealtheorie, 121, 126
inverses Element, 66 idempotent, 122
Isomorphismus, 69 identische Abbildung, 299
Kleinsche Vierer-, 68 Implikation, 282
kommutative, 66 Index, 46
Lie, 38 Individuenbereich, 308
Matrix, 66 Individuenvariable, 309
multiplikative, 66 Induktionsbeweise, 286
neutrales Element, 66 Inertialsystem, 259
orthogonale, 246 infinitesimale Symmetrie, 244
pseudounitäre, 253 injektiv, 45, 298
spezielle lineare, SL(2, C), 265 innere Multiplikation, 63
spezielle pseudounitäre, 253 innerer Automorphismus, 69
sphärisch orthogonale, SO(n ), 265 Integrabilitätsbedingung, 195
Spin( n, X ), 272 Integral
SU (2), 265 Abelsches, 213, 217, 231
symmetrische, 67 einer algebraischen Funktion, 224
symplektische Sp (2n, X ), 275 elliptisches, 213, 214
unitäre, 255 Integralalgorithmus, 95
unitäre U (n ), 252 Integralgleichung, 89, 212
Gruppentheorie, 1 Integraloperator, 46
größter gemeinsamer Teiler (ggT), 92 Fourier, 35
Polynome, 19 Integritätsbereich, 73
intuitionistische Mathematik, 316
Invariantentheorie, 1
harmonischer Oszillator, 40 invarianter Unterraum, 51
Hauptachse einer Matrix, 31 Invarianz, PCT-, 268
Hauptfaserbündel, 265 inverse Abbildunge, 298
Hauptidealringe, 122 inverses Element, 66
Hauptkrümmung, 192 inzident, 147
Hauptkrümmungsradius, 192 Inzidenzaxiom, 148
Hauptsatz über additive Gruppen, 71 Irrationalitätsbeweis für π von Legendre, 115
Hauptsatz über mehrfache Nullstellen, 26 Irrationalitätskriterium, 109
Herleitungsregel, 308 irreduzibles Ringelement, 121
Heronische Formel, 132 Isomorphie, 43
Hilbertraum, 41 Isomorphiesatz, 49
Cliffordalgebra, 270 erster, 70
C( X ), 270 zweiter, 71
Hilbertsche Axiome der Geometrie, 147 Isomorphismus, 54
Hilbertscher Klassenkörper, 126 Isomorphismus eines Ringes, 73
Höhensatz des Euklid, 133 Isospin, 250
holomorphe Funktion, kritische Menge, 239 isotroper Unterraum, 275
homogene Koordinaten, 167 isotroper Vektor, 252, 254
Homologiegruppe, 72 Iterationsverfahren der Gebrüder Borwein, 114
homologische Algebra, 126
Homomorphismus Jacobische Identität, 65
Gruppe, 69 Jacobisches Signaturkriterium, 33
Ring, 73 Jordankästchen, 36
Hopfbifurkation, 211 Jordansche Normalform, 36
hyperbolische Ebene, 152
Bewegungungsgruppe, 154 KAM-Theorie, 108
hyperbolische Geometrie, 152 kanonische Abbildung, 49
hyperbolische Trigonometrie, 153 kanonische Basis, 58
Hyperladung, 250 kanonisches kartesisches Koordinatensystem, 192
Hypotenuse, 133 Kardinalzahl, 313
Hypozykloide, 208 Arithmetik, 314
Höhe, 122 Produkt, 314
Index 323

Summe, 314 korrekt gestelltes Problem, 290


Kardioide, 204, 222 Korrespondenz, 300
kartesische Koordinaten, 155 Kosinussatz, 131, 143
Kartesisches Blatt, 221 kovarianter Tensor, 188
kartesisches Produkt, 48, 297, 304 Kraft
Katastrophentheorie, 182, 211 schwache, 269
Katenoide, 201 starke, 270
Kathete, 133 Kreis, Parameterdarstellung, 212
Kathetensatz des Euklid, 133 Kreisteilungsgleichung, 81, 87
Kaustik, 198 Kreisteilungskörper, 1, 126
Kegel, 188 Kreisumfang, 111
Kegelschnitt, 33, 160, 174, 212 kritische Menge, 229
Normalform, 33 Kroneckersymbol, 31
Kern, 45 Krümmung, 176, 178
eines Gruppenhomormorphismus, 70 geodätische, 197
Kernkraft, 270 Hauptkrümmungsradius, 192
Kettenbruch, 90, 102, 234 konstante negative, 201
allgemeinener, 115 Riemannscher Tensor, 195
endlicher, 103 Krümmungsradius, 178
konvergenter, 104 kubische Gleichung, 21
Konvergenzkriterium, 104 Kurve
regelmäßiger, 104 algebraische, 213
Rekursionsformel, 103 Bogenlänge, 177
unendlicher, 104 Cassinische, 222
Kettenlinie, 200 ebene, 177
Kissoide, 219 ebene algebraische, 225
Klassengruppe, 125 elliptische
Klassenkörper, Hilbertscher, 126 Gruppenstruktur, 215
Klassenzahl, 125 generische Schnittsituation, 226
Kleinsche Vierergruppe, 68 Kardioide, 222
kleinste Lösung der Fermatschen Gleichung, 124 Kartesisches Blatt, 221
Kleinstes gemeinsames Vielfaches (kgV), 91 Kissoide, 219
Kodimension, 43 komplexe projektive, 225
Kohomologie von Gruppen, 126 Konchoide des Nikomedes, 222
Kollineation, 170, 171, 174, 226 kubische Versiera der Maria Agnesi, 219, 228,
Kombinatorik, 1 232
kombintorische Topologie, 72 Lemniskate, 222
kommutativer Ring, 72 Normalenvektor, 177
kommutatives Diagramm, 299 Parameterdarstellung, 177
Kommutativgesetz, 66, 69, 295 Pascalsche Schnecke, 222
Komplexifizierung, 61 Polarengleichung, 227
Konchoide des Nikomedes, 204, 222 singulärer Punkt, 180
konforme Abbildung, 243 Strophoide, 220, 229
kongruent, 147 Tangente an eine, 177, 227
Kongruenz, 116, 149 vierter Ordnung, 222
Kongruenzaxiom, 150 Kähler-Geometrie, 243
Kongruenzsatz, 137 Körper, 75
Konjugation eines Operators, 271 Automorphismus, 75
Konjunktion, 282 der rationalen Funktionen, 77
Konstruktion mit Zirkel und Lineal, 85 starrer, 212
Konstruktion regelmäßiger Vielecke, 87 Körpererweiterung
kontinuierliches Denken, 88 algebraische, 81
Kontinuum, 314 endliche, 79
Kontinuumshypothese, 314 Grad, 79
Konvergenz, quadratische, 290 normale, 82
Konvergenzkriterium für einen Kettenbruch, 104 separable, 82
Konvergenzradius, 38 transzendente, 81
Koordinaten
baryzentrische, 175 Ladungskonjugation, 268
homogene, 167, 170 Lagrangescher Unterraum, 275
kartesische, 223 längentreue Abbildung, 190
pseudokartesische, 253 Laplaceoperator, 273
324 Index

Laplacescher Entwicklungssatz, 6 Länge, 247


leere Menge, 294, 310 Lückensatz, 94
Legendrescher Irrationalitätsbeweis für π, 115
Legendresymbol, 118, 126 Mächtigkeit des Kontinuums, 314
Leibnizsche Reihe, 113, 116 Mannigfaltigkeit, 40, 210
Lemma von Zorn, 303 Masse, relativistische, 264
Lemniskate, 201, 222 Matrix, 8
Levi-Civita-Tensor, 191 adjungierte, 11
lichtartiger Vektor, 256 charakteristische Gleichung, 29
Liealgebra, 38, 64, 244, 249, 250 diagonalisierbare, 30, 38
Cartansche Subalgebra, 250 Elementarteiler, 37
su(3), 250 Exponentialfunktion, 38
su(2), 266 inverse, 11
Liegruppe, 38, 250, 265 invertierbare, 11
allgemeine lineare, 11 Jordansche Normalform, 36
orthogonale, 254, 254, 265 kontragrediente, 12
Poincarégrupppe, 261 linear unabhängige Zeilen, 16
symplektische Sp (2n, X ), 275 Logarithmusfunktion, 39
spezielle orthogonaleSO( n, X ), 254 normale, 29
spezielle unitäre SU (n, X ), 254 Normalform, 30
Spin( n, x ), 273 orthogonale, 34, 252
SU (3), 250 Polarzerlegung, 39
unitäre, 254 Produkt, 9
linear unabhängig, 16, 41 Quadratwurzel, 39
lineare Form, 52 Rang, 16
lineare Hülle, 50 reguläre, 11
lineare Mannigfaltigkeit, 48 Resolvente, 29
linearer Operator, 43 Resolventenmenge, 28
Basiswechsel, 47 schiefadjungierte, 29
Determinante, 48 schiefsymmetrische, 35
Matrix, 47 selbstadjungierte, 29, 253
Spur, 48 skalare Multiplikation, 8
linearer Raum, 41 Spektralradius, 28
affiner Unterraum, 48 Spektrum, 28, 38
äußere direkte Summe, 51, 62 Spur, 12
äußeres Produkt, 62 Summe, 8
Basis, 247, 255 symmetrische, 33
Dimension, 42 definit, 34
direkte Summe, 49 Signatur, 32
dualer, 52 symplektische, 276
fast komplexer, 274 transponierte, 7, 11
Isomorphien, 43 unitäre, 29, 252
kartesisches Produkt, 48 ähnliche, 30
Komplexifizierung, 61 Matrizengleichung, 13
mit indefinitem Skalarprodukt, 255 Matrizengruppe, symplektische, 276
Orthonormalbasis, 31 maximales Element, 303
symplektischer, 274 Maxwellsche Gleichungen, 263
Tensoralgebra, 61 Dualitätssymmetrie, 264
Tensorprodukt, 60 Mechanik, klassische, 35
lineares Funktional, 52 Menge, 293
Linearisierungsprinzip, 40 abzählbare, 301
Linearkombination, 41 analytische, 238
Lissajou-Kurve, 202 Definition, 294
Logarithmusfunktion einer Matrix, 39 Differenz, 295
Logik, 305 disjunkte, 294
logische Gesetze, 284 Durchschnitt, 294, 305
Lokal-Global-Prinzip, 121, 126 durchschnittsfremde, 294
lokale Eichinvarianz, 269 endliche, 301
Lorentzgruppe, 243, 256, 261 Gleichheit, 293
Lorentztransformation, 261 kartesisches Produkt, 297, 304
spezielle, 260 kompakte, 229
Lottoproblem, 2 Komplement, 296
Index 325

kritische, 229, 239 Nullelement, 295


leere, 294, 310 Nullmatrix, 8
maximales Element, 303 Nullstelle
Mächtigkeit, 301 Hauptsatz über mehrfache -n, 26
Nachfolger, 311 Vielfachheit, 20
total geordnete, 303 Nullteiler, 10, 72
unendliche, 301
Urbild, 300 obere Halbebene, 152
Vereinigung, 295, 305 Operator
Mengenfamilie, 304 adjungierter, 245
Mengensystem, 304 Chiralität, 269
Mengentheorie, 292 d (äußere Ableitung), 258
Axiome, 310 Divergenz, 259
metrischer Raum, 120 Drehimpuls-, 268
metrischer Tensor, 190 Hodge δ, 259
Minimalfläche, 192, 201 Hodge, ∗, 257, 259
Minkowskigeometrie, 255 identischer, 45
Minkowskimetrik, 64 inverser, 45
Minkowskiraum, 255 J (fast komplexer), 274
Cliffordalgebra, 258, 265 Konjugation, 271
Differentialform, 258 linearer, 43
duale Basis, 258 pseudounitärer, 253, 254
multilineare Algebra auf, 257 selbstadjungierter, 250
Orientierung, 257 Seltsamkeit, 251
Volumenform, 257 ∗-, 271
Möbiussche Funktion, 93 Optik, geometrische, 35
Möbiussche Umkehrformel, 93 ordinale Summe, 312
Möbiustransformation, 154 ordinales Produkt, 313
modifiziertes Lottoproblem, 2 Ordinalzahl, 312
modifziertes Wortproblem, 2 Ordinalzahlarithmetik, 313
modus ponens, 285, 308 Ordnungsrelation, 303
Mollweidsche Formel, 132, 144 Orientierung, 191, 248
Monomorphismus, 69 orthogonale Gruppe, 246
Monopole, 263 orthogonale Vektoren, 246
Mordellsche Vermutung, 89, 237 orthogonales Komplement, 246
Morseindex, 32, 253 Orthogonalität, 31
multilineare Algebra auf M4 , 257 Orthogonalmatrix, 34
Multilinearform, 54 Orthonormalbasis, 31, 247
antisymmetrische, 55 Orthonormalsystem, 31
symmetrische, 55
multiplikative Gruppe, 66 Parabel, 199
Multiplizität eines Schnittpunkts, 226 semikubische, 211
Möbiustransformation, 243 Parallele, 151
Parallelenaxiom, 315
Nachfolgemenge, 311 Parallelenproblem, 151
natürliche Basis, 58 Parallelepiped, 159
natürliche Zahl, 311 Paritätsverletzung, 269
Nepersche Formel, 144 Partialbruchzerlegung, 27, 224
neutrales Element Partitionsfunktion, 101
additives, 69 Pascalsche Schnecke, 222
einer Gruppe, 66 Pauli-Dirac-Matrizen, 266
im Ring, 72 Paulimatrizen, 64, 266
Newtonsche Regel, 24 PCT-Invarainz, 268
Newtonsche Summenformel, 113 Permutation, 2, 67
nichtentartete Bilinearform, 54, 253 gerade, 4, 67
nichtentartete symplektische Form, 274 ungerade, 4, 67
nichtorientierbare Fläche, 172 Vorzeichen, 4, 67
Noetherscher Ring, 123 zyklische, 67
Norm, 123 Permutationsgruppe, 67, 72
normale Körpererweiterung, 82 Perspektive, 175
Normalform, Kegelschnitt, 33 philosophische Erkenntnistheorie, 314
Normalteiler, 68 Photon, 269
326 Index

Physik, Himmelsmechanik, 90 Proton, Ladung, 251


π, 111 Prädikatenlogik, 308
π, Transzendenz, 86 pseudoorthonormierte Basis, 253, 255
Poincarégruppe, 256, 261 Pseudosphäre, 201
Poincarésche Vermutung, 236 pseudounitäre Geometrie, 252
Poincarétransformation, 261 pseudounitäre Gruppe, 253
Poincaré-Modell, 152 pseudounitärer Operator, 253
Polarengleichung, 227 pseudounitärer Raum, 252
Polarzerlegung, 39 Punkt, 147
Polygon, 78 projektiver, 168, 170
Polynom, 18, 81 rationaler, 235
Diskriminante, 26 regulärer, 210
größter gemeinsamer Teiler (ggT), 19 singulärer, 210
homogenes, 225 unendlich ferner, 168, 170
Homogenisierung, 219
irreduzibles, 82, 122 quadratfreie Zahl, 123
Nullstelle, 20 quadratische Fläche, 33, 163
Produktdarstellung, 20 quadratische Form, 33
Resultante, 26, 226 quadratische Gleichung, 21
Ring, 81 quadratische Konvergenz, 290
seperables, 82 quadratischer Zahlkörper, 123
symmetrisches, 25 Quadratur des Kreises, 115
Zerfällungskörper, 82 Quadrik, 222
Polynomdivision, 18 Quantenfeldtheorie, 90, 97, 256, 270
Polynomring, 73 Quantenmechanik, 242
Postulat, 315 Quantensysteme, 41
Potenzmenge, 300 Quantentheorie, 212
Primelement, 121 Quantisierung, 89
Primkörper, 76 zweite, 270
Primzahl, 91 Quark, 250, 269
Lokalisierungsprinzip von Dirichlet, 98 Quaternion, 63, 76, 265
reguläre, 238 Quaternionen von Hamilton, 271
Primzahlsatz, 94 Quotientenkörper, 77
Primzahlverteilungsfunktion, 94
Primzahlzwillinge, 99 radioaktiver Zerfall, 270
Primärideal, 122 Radkurve, 205
Probleme der Antike Ramanunjans Formel, 114
Delisches (Würfelverdopplung), 78, 86, 223 Rang, 46
Dreiteilung eines beliebigen Winkels, 78 Rangkriterium, 16
Quadratur des Kreises, 78 Rangsatz, 16, 51
Unlösbarkeit, 86 rationale Funktion, 27
Winkeldreiteilung, Unlösbarkeit, 87 Körper, 77
Produkt Partialbruchzerlegung, 27
inneres, 53, 63 rationale Zahl, 108
ordinales, 313 Raum
äußeres, 53, 62 linearer, 41
Produktdarstellung eines Polynoms, 20 lokalkonvexer, 41
Produktformel von metrischer, 120
Euler, 113 pseudounitärer, 252
Jacobi, 102 unitärer, 245
Vieta, 112 raumartiger Vektor, 256
Wallis, 113 Raumkurve, 183
Projektion, 169 rechtwinkliges Dreieck, 132
Projektionsabbildung, 299 regulärer Punkt, 210
projektiv äquivalent, 174 Reihe
projektive Geometrie, 167 Dirichletsche L-Reihe, 98
projektive Gruppe, 171 Leibnizsche, 113, 116
komplexe, 172 Newtonsche, 113
projektiver Raum Vietasche, 112
komplexer, 172 Wallisshe, 113
reeller, 170 Rekursionsformel
Projektivität, 174 Eulersche, 101
Index 327

für Kettenbrüche, 103 Fermat (letzter), 237


Rekursionssatz von Dedekind, 311 Gauß, 109, 119
rekursive Funktion, 311 Gauß (über Konstruktionen), 87
Relation, 302 Gelfond-Schneider, 111
logische, 308 Gödel-Cohen, 314
relativ prim, 92 Hardy, 97
relativistische Masse, 264 Harnack, 231
Relativitätsprinzip, 259 Hermite, 110
Renormierung, 97 Hilbert, 123
Resolvente Hilbert (über reelle Zahlen), 150
kubische, 23 Jacobi, 100
Matrix, 29 Lasker und Noether, 123
Resolventenmenge, 28 Legendre, 95
Resonanz, 108 Lindemann, 110, 115
Restklasse, 73 Lindemann-Weierstraß, 110
Resultante, 26, 226 Minkowski-Hasse, 120
Reziprozitätsgesetz, 89, 126 Mordell, 236
quadratisches, 118 Ostrowski, 120
Riemannsche Fläche, 89, 214, 217, 229 Perron, 30
Geschlecht, 217, 230 Poincaré, 231
Riemannsche Geometrie, 154 Pythagoras, 133, 153
Riemannsche Metrik auf Flächen, 196 Riemann, 96
Riemannsche Vermutung, 88, 93, 97 Schröder-Bernstein, 302
Riemannsche ζ-Funktion, 89, 90, 96 Steinitz (algebraischer Abschluss), 82
Funktionalgleichung, 96 Steinitz (Tausch einer Basis), 42
Riemannscher Krümmungstensor, 195 Sturm, 25
Ring, 8, 72, 121 Thales von Milet, 137, 138
Automorphismus, 73 Vieta, 21, 22, 25
eindeutige Faktorisierung, 122 Weierstraß, 239
eindeutigen Zerlegung, 124 Scheitelpunkt, 178
Euklidischer, 122, 124 Schema, 218, 241
ganzer Zahlen, 124 Schiefkörper, Charakteristik, 75
Hauptideal-, 122 schiefsymmetrische Matrix, 35
Homomorphismus, 73 Schlussfolgerung, 282
Ideal, 122 Schmidtsches Orthogonalisierungsverfahren, 32
ideale Teilmenge, 73 Schranke, obere, 303
irreduzibles Element eines, 121 Schubfachprinzip, 4
kommutativer, 72 Schwarzsche Ungleichung, 247
mit Einselement, 72 Schwerpunkt, 175
Noetherscher, 123 Sekantenmethode des Diophant, 235
Polynom-, 81, 122 selbstadjungierter Operator, 250
Primelement eines, 121 seperables Polynom, 82
Restklasse, 73 Shimura-Taniyama-Weil-Vermutung, 218
Russelsche Antinomie, 293 Sieb des Eratosthenes, 91
Signatur, 32, 253
Satz von Signaturkriterium von Jacobi, 33
Atiyah-Singer, 46, 241 Singularität, 180
Bézout, 226 Auflösung, 213, 229, 239
Bonnet, 197 Doppelpunkt, 211
Brauer und Weyl, 273 Spitze, 211
Cantor, 302 singuläre Flächenpunkte, 188
Church, 310 singulärer Punkt, 210
Desargues, 169 Sinussatz, 131, 143
Diophantus, 235 Skalarprodukt, 245
Dirichlet, 94 indefinites, 255
Euklid, 91 Komponentendarstellung, 255
Euler, 96, 98, 101, 116 Spektralradius, 28, 38
Euler-d’Alembert, 34 Spektralsatz, 30
Euler-Lagrange, 109 Spektraltheorie, 212
Euler-Meusnier, 194 Spektrum, 28, 38
Faltings, 237 spezielle Relativitätstheorie, 252, 259
Fermat, 100, 116 sphärische Geometrie, 141
328 Index

sphärischer Exzess, 143 Teiler, 90


sphärischer Winkel, 142 Teilmenge, 293
sphärisches Dreieck, 138, 142 Temperatur, 97
Berechnung, 145 Tensor, 58
Flächeninhalt, 144 elektromagnetischer Feld-, 263
Spiegelung kovarianter, 188
räumliche, 268 Levi-Civita, 191
zeitliche, 268 metrischer, 190
Spin, 243 Verjüngung, 59
Spinor, 267 Tensoralgebra, 61, 257
Spinoralgebra, 64 Tensorprodukt, 53, 59, 60
Spirale, 203 Universalität, 61
Spitze, 211, 228 theorema egregium, 176, 195
Spur, 123 Theorie
Spur einer Matrix, 12 algebraischer Funktionen, 1
Spursatz, 37 analytische Zahlentheorie, 94
Standardmodell, 97, 243, 265, 269 der quadratischen Formen von Gauß, 212
starrer Körper, 212 Dynamische Systeme, 90
statistische Physik, 90, 97 Epistemologie, 315
Steinitzscher Austauschsatz, 42 Quantenfeldtheorie, 97
Steinitzscher Satz (über den algebraischen Ab- Superstringtheorie, 90
schluss), 82 Topologie, 40
Strahl, 148 algebraische, 212
Strahlensatz, 138 kombinatorische, 72
Strahlkurve, 204 Torsionsgruppe, 72
Strecke, 148 Torus, 214
Stringtheorie, 65, 218 total geordnete Menge, 303
Strophoide, 220, 229 Traktrix, 200
Summe Transformation
direkte, 50 birationale, 227
Gaußsche, 119 diophantisch rationale, 236
ordinale, 312 Drehung, 30
Summenformel Transformationsgruppe, 67
Leibniz, 113 Translation, 159
Newton, 113 Transposition, 67
Superalgebra, superkommutative, 66 transzendent, 110
Superpositionsprinzip, 14, 40 transzendente Körpererweiterung, 81
Superstringtheorie, 90 transzendentes Element, 81
Supersymmetrie (SUSY), 270 Trigonometrie
surjektiv, 45, 298 ebene, 131
Symmetrie, infinitesimale, 244 hyperbolische, 153
symmetrische Bilinearform, 54 sphärische, 141
symplektische Abbildung, 275 trivialer Normalteiler, 68
symplektische Basis, 274 Trochoide, 206
symplektische Form, 35, 274 Trägheitsgesetz von Sylvester, 33
symplektische Geometrie, 35
symplektische Volumenform, 275 unendlich ferne Gerade, 153, 168, 219
symplektischer Raum, isotroper Unterraum, 275 Unendlich, Cantors Strukturierung, 311
System, oszillierendes, 108 Uniformisierung, 213
Uniformisierungssatz von Hironaka, 218, 239, 241
Tangenssatz, 131 unitäre Geometrie, 245, 246
Tangente, 177, 227 unitäre Gruppe, U (n, X ), 246
an eine Kurve, 40 unitärer Operator, infinitesimaler, 248
Tangentenmethode des Diophant, 236 Universalität, Tensorprodukt, 61
Tangentialebene, 40, 188 universelle Überlagerungsgruppe, 273
Tangentialraum, 40 Unmenge, 293
Tautologie, 284, 307 Unterdeterminante, 16
Taylorentwicklung, 40, 177 Haupt-, 33
Teilchen Untergruppe, triviale, 68
geladenes, 264 Unterkörper, 75
Proton, 251 Unterraum, 43
seltsames, 251 invarianter, 51
Index 329

Unterring, 73 zweite Fundamentalform, 191


Urbild, 300 zyklische Gruppe, 71
Zykloide, 206
Variation, Kombinatorik, 2 Zyklus, 67
Variationsrechnung, 89
Varietät, analytische, 238
Vektor
isotroper, 252, 254
lichtartiger, 256
linear unabhängiger, 41
orthogonaler, 31, 246, 254
raumartiger, 256
zeitartiger, 256
Vektoralgebra, 155
Vektorbündel, 40
verallgemeinerte Heronische Flächenformel, 144
Vereinigung von Mengen, 305
Vereinigung, disjunkte, 297
Verkehr (Schiff- und Luftfahrt), 146
Vermutung
Mordell, 89
Primzahlzwillinge, 99
Versiera der Maria Agnesi, 219, 232
Vieleck, regelmäßiges, 87
Virasoroalgebra, 65, 65
Volumen, 248
Parallelepiped, 159
Volumenform, 248
Minkowskiraum, 257
symplektische, 275
Vorbereitungssatz von Weierstraß, 239

Waringsches Problem, 99
Wellenfunktion, 267
Wendepunkt, 178
Wertebereich, 297
Wertevorrat, 297
Winkel, 158, 247
sphärischer, 142
winkeltreue Abbildung, 190
Wohlordnungssatz von Zermelo, 304
Wolf-Preis, 89
Wortproblem, 2
Wörter, äquivalente, 3

Zahl
algebraische, 108
ideale, 121
irrationale, 108
p-adische, 120, 126
π, Transzendenz, 86
Pythagoreische, 233
quadratfreie, 123
transzendente, 109
Zahlentheorie, 212
Zahlentheorie, moderne Strategie, 89
Zahlkörper, 1
quadratischer, 212
zeitartiger Vektor, 256
zentrale Erweiterung, 65
Zerfällungskörper, 82
Zustandssumme, 90, 97

Das könnte Ihnen auch gefallen