Beruflich Dokumente
Kultur Dokumente
Untitled
Untitled
Tilo Arens Rolf Busam Frank Hettlich Christian Karpfinger Hellmuth Stachel
Grundwissen
Mathematikstudium
Analysis und Lineare Algebra mit Querverbindungen
Springer Spektrum
Autoren
Tilo Arens, Karlsruher Institut für Technologie (KIT), tilo.arens@kit.edu
Rolf Busam, Mathematisches Institut, Universität Heidelberg, busam@mathi.uni-heidelberg.de
Frank Hettlich, Karlsruher Institut für Technologie (KIT), frank.hettlich@kit.edu
Christian Karpfinger, Technische Universität München, karpfing@ma.tum.de
Hellmuth Stachel, Technische Universität Wien, stachel@dmg.tuwien.ac.at
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte biblio-
grafische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer Spektrum
© Springer-Verlag Berlin Heidelberg 2013
Teile des Buches basieren auf Arens, Hettlich, Karpfinger, Kockelkorn, Lichtenegger, Stachel „Mathematik“, ISBN:
978-3-8274-2347-4, das für Anwender der Mathematik konzipiert wurde.
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Ur-
heberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen,
Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne be-
sondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-
Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften.
Dr. Rolf Busam ist Co-Autor eines er- Dr. Dr. h.c. Hellmuth Stachel ist seit mehr
folgreichen Lehrbuchs über Funktionen- als 30 Jahren Professor für Geometrie
theorie und von zwei Prüfungstrainern an der Technischen Universität Wien und
(über Analysis bzw. Lineare Algebra). seit 2011 emeritiert.
Während seiner langjährigen Lehrtätig-
keit als Akademischer Direktor an der Fa-
kultät für Mathematik und Informatik der
Universität Heidelberg liegt sein Interes-
senschwerpunkt in der komplexen Ana-
lysis und der Analytischen Zahlentheo-
rie. Ferner ist ihm die Lehreraus- und
-weiterbildung ein besonderes Anliegen.
10 Reihen – Summieren bis zum Letzten . 347 14.8 Die Berechnung einer Jordan-Normalform
10.1 Motivation und Definition . . . . . . . . . . . . . . 348 und Jordan-Basis . . . . . . . . . . . . . . . . . . . . . . 532
10.2 Kriterien für Konvergenz . . . . . . . . . . . . . . . 355 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 544
10.3 Absolute Konvergenz . . . . . . . . . . . . . . . . . . 363 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 546
10.4 Kriterien für absolute Konvergenz . . . . . . . 368
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 376 15 Differenzialrechnung –
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 die Linearisierung von Funktionen . . . 551
11 Potenzreihen – Alleskönner unter den 15.1 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . 552
15.2 Differenziationsregeln . . . . . . . . . . . . . . . . . . 560
Funktionen . . . . . . . . . . . . . . . . . . . . . . . 381
15.3 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . 569
11.1 Definition und Grundlagen . . . . . . . . . . . . . 382
15.4 Verhalten differenzierbarer Funktionen . . . 577
11.2 Die Darstellung von Funktionen durch
15.5 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . 583
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . 389
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 593
11.3 Die Exponentialfunktion . . . . . . . . . . . . . . . . 398
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594
11.4 Trigonometrische Funktionen . . . . . . . . . . . 403
11.5 Der Logarithmus . . . . . . . . . . . . . . . . . . . . . . 409
16 Integrale – von lokal zu global . . . . . . 599
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 413
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 16.1 Integration von Treppenfunktionen . . . . . . 600
16.2 Das Lebesgue-Integral . . . . . . . . . . . . . . . . . 604
12 Lineare Abbildungen und Matrizen – 16.3 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . 613
Brücken zwischen Vektorräumen . . . . . 417 16.4 Integrationstechniken . . . . . . . . . . . . . . . . . . 618
12.1 Definition und Beispiele . . . . . . . . . . . . . . . . 418 16.5 Integration über unbeschränkte Intervalle
12.2 Verknüpfungen von linearen Abbildungen 422 oder Funktionen . . . . . . . . . . . . . . . . . . . . . . 622
12.3 Kern, Bild und die Dimensionsformel . . . . 425 16.6 Parameterabhängige Integrale . . . . . . . . . . 633
12.4 Darstellungsmatrizen . . . . . . . . . . . . . . . . . . 432 16.7 Weitere Integrationsbegriffe . . . . . . . . . . . . 637
12.5 Das Produkt von Matrizen . . . . . . . . . . . . . . 442 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 649
12.6 Das Invertieren von Matrizen . . . . . . . . . . . 446 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650
12.7 Elementarmatrizen . . . . . . . . . . . . . . . . . . . . 451
12.8 Basistransformation . . . . . . . . . . . . . . . . . . . 455 17 Euklidische und unitäre Vektorräume –
12.9 Der Dualraum . . . . . . . . . . . . . . . . . . . . . . . . 458 orthogonales Diagonalisieren . . . . . . . . 655
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 462 17.1 Euklidische Vektorräume . . . . . . . . . . . . . . . 656
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464 17.2 Norm, Abstand, Winkel, Orthogonalität . . 662
17.3 Orthonormalbasen und orthogonale
13 Determinanten – Kenngrößen
Komplemente . . . . . . . . . . . . . . . . . . . . . . . . . 668
von Matrizen . . . . . . . . . . . . . . . . . . . . . . 469
17.4 Unitäre Vektorräume . . . . . . . . . . . . . . . . . . 678
13.1 Die Definition der Determinante . . . . . . . . . 470
17.5 Orthogonale und unitäre Endomorphismen 681
13.2 Determinanten von Endomorphismen . . . . 475
17.6 Selbstadjungierte Endomorphismen . . . . . . 691
13.3 Berechnung der Determinante . . . . . . . . . . 476
17.7 Normale Endomorphismen . . . . . . . . . . . . . 697
13.4 Anwendungen der Determinante . . . . . . . . 483
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 705
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 492
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
In der Mathematik, eine der ältesten Wissenschaften überhaupt, Wir mischen uns in den Streit nicht ein. Wir behaupten nicht,
geht es darum, Aussagen auf ihren Wahrheitsgehalt hin zu dass Mathematik eine Natur- oder eine Geisteswissenschaft
überprüfen und allgemeingültige Aussagen zu beweisen und ist, sondern sehen Mathematik als eine Formalwissenschaft
diese als mathematische Sätze zu formulieren. Mathematik ist an. Zu den Formalwissenschaften gehören genau jene Wis-
eine exakte Wissenschaft, ist ein Satz bewiesen, so gilt dieser senschaften, die sich mit formalen Systemen beschäftigen.
für immer und ewig. Neben der Mathematik sind die Logik oder die theoretische
Informatik Beispiele solcher Formalwissenschaften.
Mit dem vorliegenden Buch wenden wir uns an Mathematik-
studierende der ersten Semester. Wir stellen die Themen des Auf jeden Fall aber ist die Mathematik eine Wissenschaft
ersten Studienjahrs, die in den Vorlesungen üblicherweise bei für sich. Während in den Geisteswissenschaften oder Na-
verschiedenen Dozenten gehört werden, in einer einheitlichen turwissenschaften frühere Erkenntnisse durch einen neuen
Schreibweise dar und zeigen die Zusammenhänge der verschie- Zeitgeist oder durch neue Experimente relativiert werden,
denen Gebiete auf. Dabei liegt das Augenmerk nicht nur auf sind mathematische Erkenntnisse ein für allemal korrekt. Die
einer vollständigen Beweisführung, wir versuchen auch oft Mo- Mathematik ist eine exakte Wissenschaft. Mathematische Er-
tivationen und Alternativen zu den gegebenen Beweisen und kenntnisse sind kulturunabhängig und prinzipiell von jedem
Vorgehensweisen anzugeben. Wir schildern auch stets Zusam- nachvollziehbar.
menhänge zu bereits behandelten und noch zu behandelnden
Ein wesentliches Merkmal der Mathematik ist es, dass ihre
Themen.
Inhalte streng aufeinander aufbauen. Jeder einzelne Schritt
Die Teilgebiete der Mathematik können in reine und ange- ist im Allgemeinen leicht zu verstehen, im Ganzen betrachtet
wandte Mathematik unterschieden werden, wenngleich bei aber ist die Mathematik ein außerordentlich komplexes und
manchen Teilgebieten eine solche Zuordnung sicherlich willkür- großes Gebiet. Es wurde im Laufe der vergangenen ca. 6000
lich erscheinen mag. Aber auf jeden Fall sind die Analysis und die Jahren von vielen Menschen zusammengetragen. Aber dazu
lineare Algebra grundlegend für jedes Teilgebiet. So ist es schon mehr in einem kurzen geschichtlichen Ausflug ab Seite 13.
lange an den verschiedenen Universitäten üblich, dass im ersten
Studienjahr vor allem diese beiden Gebiete den Großteil des
Studiums ausmachen. Die Inhalte dieser beiden, üblicherweise Was ist neu an diesem Lehrbuch?
zwei Semester andauernden Vorlesungen nehmen den meisten
Raum des vorliegenden Buches ein. Mathematiker sind in ihrem Sprachgebrauch oftmals etwas
Im ersten Kapitel sprechen wir über Mathematik und ihre Rolle . . . na ja sonderbar. Wir Autoren, allesamt Mathematiker,
unter den Wissenschaften. Wir geben auch einen Einblick in ihre haben im Interesse der Studierenden – also insbesondere in
rund 6000-jährige Geschichte, und selbstverständlich wollen Ihrem Interesse – versucht, uns von dieser sonst üblichen
wir auch die didaktischen Elemente vorstellen, die dieses Werk etwas kargen und nüchtern zweckorientierten Sprechweise
gegenüber anderen Lehrbüchern auszeichnen. zu distanzieren. Wir haben – so weit wie möglich – Formeln
und abstrakte Dinge in Worte gefasst. Das ist neu; aber nicht
nur das.
ersten Studienjahrs, nämlich Analysis und lineare Algebra, Situation ist in der Tat noch verworrener: Kurt Gödel zeigte,
nacheinander bzw. getrennt voneinander, sondern ineinan- dass die vermutete Widerspruchsfreiheit innerhalb des be-
der verwoben und teils gegenseitig aufeinander aufbauend trachteten Axiomensystems weder bewiesen noch widerlegt
behandeln. Die Zusammenhänge der Gebiete und die Ähn- werden kann.
lichkeit der mathematischen Schlüsse werden so klarer. Und
Man ist in der Mathematik bemüht, Theorien und Strukturen
auf einem solchen Fundament, das Analysis und lineare Al-
auf ein Minimum an notwendigen und jedem einleuchtenden
gebra miteinander verbindet, kann die weitere Mathematik
Axiomen aufzubauen. Das Ersetzen eines einzelnen Axioms
der folgenden Studienjahre sicher aufgebaut werden. Das ist
durch ein anderes wird im Allgemeinen zu einer deutlich
neu, aber es gibt noch mehr.
anderen Theorie führen. Ein berühmtes Beispiel ist das fünfte
Bei den meisten Studierenden der Mathematik geht nach den Postulat, beschrieben auf Seite 4.
ersten Wochen des Studiums der Überblick über den in den
Die Festlegung auf ein bestimmtes Axiomensystem ist nicht
Vorlesungen behandelten Stoff verloren, da das Tempo übli-
absolut zu sehen. Es gibt stets gleichwertige andere Formu-
cherweise enorm ist und für Motivationen und Zielsetzungen
lierungen, und man kann ohne Weiteres auf verschiedenen
in der Vorlesung oft nur wenig Zeit bleibt. Bei den Studieren-
Ebenen in eine mathematische Theorie einsteigen. So wer-
den entwickelt sich schnell ein (evtl. auch durchaus berech-
den wir etwa in diesem Buch in Kapitel 4 die reellen Zahlen
tigtes) Gefühl dafür, dass die Wissenschaft „Mathematik“
axiomatisch einführen, das Induktionsaxiom aus obigem Bei-
unendlich ist. Tatsächlich aber ist der Stoffumfang des ersten
spiel ergibt sich dann als Folgerung aus den Axiomen über
Studienjahrs an den meisten Universitäten sehr ähnlich und
reelle Zahlen. Ebenso kann man aber auch bei einer axio-
im Allgemeinen in Modulkatalogen festgehalten. Wir haben
matischen Definition der natürlichen Zahlen beginnen und
versucht, einen Konsens dieser Themen in einem einzigen
die weiteren Zahlensysteme darauf aufbauen. Dann ist das
Buch zu fixieren. Die Inhalte des vorliegenden Buches soll-
Induktionsaxiom ein notwendiges Axiom.
ten alle Themen, mit denen Sie im ersten Studienjahr kon-
frontiert werden, enthalten. Insofern haben wir für Sie einen Ausgehend von einem Axiomensystem versuchen Mathe-
greifbaren Horizont geschaffen (nämlich die letzte Seite die- matiker weitere Wahrheiten abzuleiten. Eine solche abge-
ses Buches). leitete Wahrheit nennt man in der Mathematik oft Satz oder
Theorem.
Die Mathematik basiert auf Axiomen Die wichtigsten Bausteine und Schritte zum Formulieren ma-
thematischer Sachverhalte lassen sich in drei Typen untertei-
Die Mathematik im Sinne einer Wissenschaft zu beschreiben, len, in Definition, Satz und Beweis. Bevor wir uns in ein
ist gar nicht so einfach, und es gibt auch keine allgemein an- Meer von Begriffen, Aussagen und Beweisen stürzen, bietet
erkannte Definition. Will man es unbedingt in Worte fassen, es sich an, zunächst einige grundlegende logische Aspekte,
so könnte man die Mathematik vielleicht auffassen als eine Sprechweisen und Notationen herauszustellen.
Wissenschaft, die von Grundwahrheiten ausgehend versucht,
weitere Wahrheiten zu ermitteln.
Definitionen liefern den Rahmen
Diese Grundwahrheiten sind die sogenannten Axiome, nach
älterer Sprechweise auch Postulate genannt. Durch Definitionen werden die Begriffe festgelegt, mit de-
nen man später arbeiten kann. Auch Notationen, auf die man
Darunter verstehen wir Aussagen, die nicht beweisbar sind,
sich einigt bzw. die üblich sind, gehören im weiteren Sinne
die wir aber als gültig voraussetzen. Die Gesamtheit der
in diese Kategorie. Definitionen können weder wahr noch
Axiome ist das Axiomensystem.
falsch sein, wohl aber mehr oder weniger sinnvoll. Auf je-
den Fall muss eine Definition wohldefiniert sein, das heißt,
Beispiel Man kann die natürlichen Zahlen durch ein Sy-
die Beschreibung beinhaltet eine eindeutige Festlegung und
stem von Axiomen einführen. Eines davon ist das sogenannte
führt nicht auf Widersprüche. Außerdem sollte bei allen ver-
Induktionsaxiom, welches in einer Formulierung besagt:
wendeten Begriffen klar sein, worauf diese sich beziehen.
Jede nichtleere Menge natürlicher Zahlen besitzt ein kleinstes Bei dem folgenden Beispiel gehen wir davon aus, dass wir
Element. bereits wissen, was eine Funktion ist.
Kaum einer wird das bezweifeln, aber tatsächlich ist diese
Beispiel Wir definieren die Wurzelfunktion f durch: „Die
Aussage nicht beweisbar, wir nehmen sie als allgemeingül-
Wurzelfunktion ist die Funktion, die jeder nicht negativen re-
tiges Gesetz an, also als Axiom.
ellen Zahl x die nicht negative reelle Lösung y der Gleichung
x = y 2 zuordnet.“
Eigentlich haben die Mathematiker im Laufe der Jahre
verschiedene Axiomensysteme entwickelt. Natürlich ist es Würde man auf die Einschränkung positiv verzichten, so ist
wichtig, dass sich diese Vereinbarungen nicht widersprechen. die Beschreibung nicht mehr wohldefiniert. Erlauben wir
Man versuchte, die Widerspruchsfreiheit der gängigen Axio- etwa negative Werte für y, so gibt es zwei Werte, ±y, die
mensysteme zu beweisen. Das ist aber nicht gelungen. Die jedem x zugeordnet werden können. Die Definition würde
4 1 Mathematik – eine Wissenschaft für sich
Etwa um 300 v. Chr. sammelte der griechische Mathe- Im ersten Fall führt die Annahme, dass es keine paral-
matiker Euklid das geometrische Wissen seiner Zeit und lele Gerade gibt, auf die sogenannte elliptische Geometrie.
bewies in seiner Schrift Elemente alle Ergebnisse auf der Diese kann man sich auf einer Kugeloberfläche vorstellen,
Grundlage von fünf Postulaten: wobei „Geraden“ durch Großkreise, also Kreise mit ma-
ximalem Radius, und „Punkte“ durch gegenüberliegende
1. Zwei Punkte lassen sich stets durch eine Strecke ver-
Antipoden gegeben sind.
binden.
2. Eine gerade Linie kann endlos als gerade Linie verlän-
gert werden. Ersetzt man hingegen das fünfte Postulat durch die An-
3. Um jeden Punkt lässt sich ein Kreis mit beliebigem nahme, dass es mehr als eine parallele Gerade gibt, so
Radius ziehen. landet man in der hyperbolischen Geometrie, die man auf
4. Alle rechten Winkel sind einander gleich. einer Sattelfläche illustrieren kann (Abbildung). Die Un-
5. Wenn beim Schnitt einer geraden Linie mit zwei weite- terschiede in diesen Geometrien sind elementar. So ist
ren geraden Linien die Summe der auf derselben Seite etwa im Gegensatz zur euklidischen Geometrie die Win-
liegenden Innenwinkel kleiner als zwei rechte Winkel kelsumme im Dreieck in der elliptischen Geometrie größer
ist, dann schneiden sich die beiden Geraden auf der als 180◦ und in der hyperbolischen kleiner als 180◦ .
Seite, auf der die beiden Winkel liegen.
Nichteuklidische Geometrien sind zumindest formal zur
gewohnten euklidischen Geometrie völlig gleichwertig,
β auch wenn Punkte und Geraden nicht mehr dem entspre-
α chen, was wir anschaulich darunter verstehen. Die mathe-
matischen Minimalanforderungen, um von einer Geome-
g2 trie zu sprechen, sind in allen drei Fällen gewährleistet.
g1
nicht auf eine eindeutige Zuordnung, also nicht auf eine Erst der Beweis macht einen Satz zum Satz
Funktion, führen. Genauso ist die Definition nicht wohlde-
finiert, wenn für x negative Werte zugelassen sind, da die Von jeder Aussage, die als Satz, Lemma oder Korollar infrage
Forderung nach reellen Zahlen für y dazu im Widerspruch kommen soll, muss klar sein, dass sie wahr ist. Sie muss sich
steht. beweisen lassen. Tatsächlich ist das Führen der Beweise zu-
gleich die wichtigste und die anspruchsvollste Tätigkeit in der
Neben diesen Kriterien sollte eine Definition allerdings noch Mathematik – der Kern unserer Wissenschaft. Einige grund-
ein weiteres erfüllen – sie sollte zweckmäßig sein. Also letzt- legende Techniken, Sprech- und Schreibweisen wollen wir
endlich sollte eine Definition die sich anschließenden Über- hier vorstellen. In späteren Kapiteln werden weitere folgen,
legungen und Kalküle sinnvoll stützen und strukturieren. All wie zum Beispiel das Prinzip der vollständigen Induktion.
diese Bedingungen sind nicht trivial. Bei manchen wichtigen Betonen wir zunächst allerdings noch den formalen Rahmen,
Begriffen, etwa den komplexen Zahlen, hat es lange gedau- an den man sich beim Beweisen im Idealfall halten sollte. Da-
ert, bis eine saubere und zweckmäßige Definition gefunden bei werden zunächst einmal die Voraussetzungen festgehal-
war. ten, anschließend wird die Behauptung formuliert, und erst
Wenn wir im vorliegenden Buch einen Begriff definieren, dann beginnt der eigentliche Beweis. Ist der Beweis gelun-
so schreiben wir ihn fett. Manchmal sind zu definierende gen, so lassen sich die Voraussetzungen und die Behauptung
Begriffe sehr suggestiv, wir verwenden ihn dann gelegentlich zur Formulierung eines entsprechenden Satzes zusammen-
schon vor seiner Definition oder auch in den einleitenden stellen. Außerdem ist es meistens angebracht, auch den Be-
Absätzen zu den Kapiteln. In diesem Fall schreiben wir ihn weis nochmal zu überdenken und schlüssig zu formulieren.
dann kursiv. Ist ein Begriff aber erst einmal definiert, so ist Da das Ende eines Beweises für Außenstehende nicht immer
dieser im weiteren Text nicht mehr besonders hervorgehoben. auf den ersten Blick zu erkennen ist, kennzeichnet man es
häufig mit „qed“ (quod erat demonstrandum) oder einfach
mit einem Kästchen „“. Insgesamt haben wir stets folgende
Sätze formulieren zentrale Ergebnisse Struktur, an die Sie sich auch bei Ihren eigenen Beweisfüh-
rungen halten sollten:
Aussagen, die nicht nur wahr sind, sondern auch weitrei- Voraussetzungen: . . .
chende Konsequenzen haben, werden in der Mathematik gern Behauptung: . . .
als Sätze bezeichnet. Beweis: . . .
O. B. d. A. bedeutet
Sätze werden die Werkzeuge sein, mit denen wir ständig um-
gehen. Die Kenntnis zu vermitteln, welche grundlegenden ohne Beschränkung der Allgemeinheit
mathematischen Sätze in der Analysis und der linearen Al-
gebra zur Verfügung stehen, wie sie bewiesen werden können Mathematiker haben manchmal etwas gewöhnungsbedürf-
und wie man sie anwendet, ist ein wesentliches Ziel dieses tige Sprechweisen. Zu diesen gehört auf jeden Fall das, was
Buchs. sich hinter o.B.d.A verbirgt. O.B.d.A steht für „Ohne Be-
schränkung der Allgemeinheit“, manchmal sagt man statt-
Die zentralen Aussagen einer Theorie werden als Satz oder dessen auch o.E.d.A., also „ohne Einschränkung der Allge-
als Theorem bezeichnet. Dient ein Satz aber in erster Linie meinheit“ oder ganz kurz o.E., d. h. „ohne Einschränkung“.
dazu eine oder mehrere folgende und weitreichendere Aussa- Solche Formulierungen benutzt man beim Beweis von Aus-
gen zu beweisen, wird er oft Lemma (Plural Lemmata, grie- sagen. Will man z. B. die Aussage
chisch für Weg) oder schlicht Hilfssatz genannt. Hingegen
bezeichnet man mit Korollar oder Folgerung Konsequen- Jede natürliche Zahl n > 1 wird von einer Primzahl geteilt
zen, die sich aus zentralen Sätzen ergeben. beweisen, so kann man sich auf ungerade Zahlen beschrän-
ken, da im Fall, dass n gerade ist, natürlich die Zahl 2 ein
Teiler von n ist. Mathematiker würden hier also den Beweis
6 1 Mathematik – eine Wissenschaft für sich
mit der folgenden Sprechweise beginnen: O. E. sei n > 1 modernen Mathematik ist. Diese Sichtweise von Mathematik
eine ungerade natürliche Zahl . . . . Kann man dann die Be- ist übrigens noch nicht alt und hat sich erst zu Beginn des
hauptung für jede ungeraden Zahlen zeigen, so hat man die zwanzigsten Jahrhunderts etabliert. Die Logik ist schon seit
Behauptung für jede natürliche Zahl n > 1 gezeigt. der Antike eine philosophische Disziplin, die wir hier nicht
ausführlich behandeln wollen. Wir werden uns nur auf die
Mit diesem o. E., etwas ausführlicher o.B.d.A, schließt man
Aspekte der Logik konzentrieren, die in Hinblick auf das
mögliche Fälle aus, für die die Aussage klar ist. Man kann
Beweisen grundlegend sind.
aber auch Fälle ausschließen, die analog gezeigt werden kön-
nen: Das Grundprinzip der Logik, dass alle verwendeten Aus-
Jede beschränkte monotone Folge (an ) reeller Zahlen kon- drücke eine klare, scharf definierte Bedeutung haben müs-
vergiert. sen, sollte selbstverständlich sein für alle wissenschaftlichen
Betrachtungen. Das Prinzip bekommt aber gerade in der Ma-
Den Beweis dieser Aussage könnte man mit O. E. sei (an ) thematik ein ganz zentrales Gewicht. Daher ist die aus gutem
monoton steigend . . . beginnen. Den zweiten Fall nämlich, Grunde nicht mit Symbolen geizende Sprache der Mathe-
also der Fall, dass (an ) monoton fallend ist, kann man analog matik am Anfang sicher gewöhnungsbedürftig. Sie unter-
behandeln. scheidet sich von der Alltagssprache durch eine sehr genaue
Meistens aber sind es vereinfachende Annahmen, die man Beachtung der Semantik.
mit dem Voranstellen von o. E. trifft. Durch die vereinfachte
Annahme wird der Beweis leichter oder übersichtlicher, der
allgemeine Fall wird aber dennoch mitbehandelt. Abstraktion ist eine Schlüsselfähigkeit
Beispiel Die folgende Aussage können wir unter verein-
In der Mathematik stößt man immer wieder auf das Phäno-
fachten Annahmen beweisen:
men, dass unterschiedlichste Anwendungsprobleme durch
Jedes Polynom a x 3+b x 2+c x+d mit a, b, c, d ∈ R, a = 0, dieselben oder sehr ähnliche mathematische Modelle be-
hat eine Nullstelle in R. schrieben werden. Zum Beispiel beschreibt ein und dieselbe
Differenzialgleichung die Schwingung eines Pendels und
Wir dürfen o. E. voraussetzen, dass a = 1 gilt und begründen
die Vorgänge in einem Stromkreis aus Spule und Konden-
die Aussage für das Polynom
sator.
x3 + b x2 + c x + d . Die Fähigkeit, das Wesentliche eines Problems zu erkennen
und bei unterschiedlichen Problemen, Gemeinsamkeiten aus-
Ist diese Aussage für diese speziellen Polynome vom Grad 3
zumachen, die für die Lösung zentral sind, nennt man die
aber erst einmal begründet, so hat man die Aussage auch für
Fähigkeit zur Abstraktion. Für Mathematiker ist Abstrak-
alle Polynome vom Grad 3 begründet, da man wegen a = 0
tion eine Selbstverständlichkeit, ein Studienanfänger hinge-
a x3 + b x2 + c x + d = a p gen hat, wie wir sehr wohl wissen, anfänglich seine Schwie-
rigkeiten damit. Aber Abstraktion ist nun mal unabdingbarer
mit einem Polynom p vom speziellen Typ, für den die Aus- Bestandteil mathematischen Denkens. Daher haben wir viel
sage bereits bewiesen ist, schreiben kann. Wert darauf gelegt, Ihnen den Zugang zur Abstraktion mit
vielen Beispielen zu erleichtern.
Bei jeder Verwendung von o.B.d.A bzw. o.E. mache man
sich stets klar: Man begründet nur einen Spezialfall der zu Beispiel In der Abbildung 1.1 sehen Sie 16 Kinder. Sie
begründenden Aussage, aber jeder andere Fall wird damit können dieses Bild ausschneiden. Vertauscht man nun die
auch begründet, da jeder andere Fall offenbar gültig oder oberen beiden Teile des Puzzles, so sind wieder Kinder zu
ähnlich zu behandeln ist oder auf den speziellen Fall zurück- sehen. Jetzt sind es aber nur noch 15! Wie kommt das zu
führbar ist; es ist also keine Einschränkung der Allgemeinheit Stande?
gegeben. Als Schreiber oder Lehrender überträgt man beim
Benutzen der Floskel o. E. somit die Aufgabe an den Leser Das Problem ist schwer zu durchschauen, weil die Kinder mit
oder Hörer, sich sorgsam zu vergewissern, dass tatsächlich ihrem komplizierten Erscheinungsbild von den wesentlichen
der allgemeine Fall begründet wird. Aspekten ablenken. Man kann verstehen, was passiert, indem
man das Puzzle selber nachbildet. Zeichnen Sie auf ein Stück
Papier ein identisches Schema von drei Rechtecken. Nun aber
Logische Aussagen strukturieren Mathematik abstrahieren Sie von den Kindern: Statt der komplizierten Fi-
guren zeichnen Sie einfach senkrechte Striche. Nun, in dieser
In den Beschreibungen des Terminus Satz haben wir schon abstrakten Version, kann man viel besser verstehen, wie sich
an einigen Stellen von Aussagen gesprochen. Letztlich sind die unterschiedlichen Teile der Kinder/Striche verteilen und
nahezu alle mathematischen Sachverhalte wahre Aussagen wieso die unterschiedliche Anzahl zustande kommt. Versu-
im Sinne der Aussagenlogik, die somit ein Grundpfeiler der chen Sie, es sich selbst zu erklären.
1.1 Über Mathematik, Mathematiker und dieses Lehrbuch 7
Abbildung 1.1 Kopieren Sie die Seite, schneiden Sie das Puzzle aus und vertauschen Sie die beiden oberen Puzzleteile. Zählen Sie die Kinder. Eines scheint
verschwunden zu sein . . . (mit freundlicher Genehmigung, © Mathematikum Gießen).
Sie haben nun vom Werkzeug der Abstraktion Gebrauch ge- schrieben wird, um dessen Verhalten testen und den Entwurf
macht, um ein schwieriges Problem auf seine wesentliche damit weiter optimieren zu können.
Struktur zu reduzieren und so zu vereinfachen.
Viele Rechenroutinen können heute bequem mit Computer-
Erkennt ein Mathematiker bei unterschiedlichen Problemen algebrasystemen (CAS) erledigt werden. Man kann Rechen-
gleiche Strukturen, so versucht er, diese Strukturen zu isolie- aufgaben aus unterschiedlichen Bereichen der Mathematik
ren und für sich zu beschreiben. Er löst sich dann von dem lösen. Dabei können solche Systeme nicht nur mit Zahlen
eigentlichen Problem und untersucht stattdessen die isolierte umgehen wie etwa auch ein Taschenrechner, ein Computeral-
abstrakte Struktur. Durch diesen Prozess wird es möglich, mit gebrasystem rechnet auch mit Variablen, Funktionen oder
ein und derselben mathematischen Theorie unterschiedliche Matrizen. Solche Systeme können im Allgemeinen
Probleme gleichzeitig zu lösen. lineare Gleichungssysteme lösen,
Heutzutage ist beispielsweise der Begriff des (abstrakten) Zahlen und Polynome faktorisieren,
Vektorraums aus keiner mathematischen Grundvorlesung Funktionen differenzieren und integrieren,
wegzudenken. Trotzdem hat es bis ins 20. Jahrhundert gedau- Stammfunktionen zu Funktionen angeben,
ert, bis die wenigen wichtigen Prinzipien erkannt und isoliert zwei- oder dreidimensionale Graphen zeichnen,
waren, die ihm zugrunde liegen. Das Prinzip der Abstraktion Differenzialgleichungen lösen,
und die damit verbundene Kraft der mathematischen Argu- analytisch nicht lösbare Integrale oder Differenzialglei-
mentation kennenzulernen, erachten wir als ein wesentliches chungen näherungsweise lösen uvm.
Lernziel. Auf der Internetseite www.matheweb.de finden sich Mate-
rialien, die Ihnen beispielhaft zeigen, welche Möglichkeiten
Computeralgebrasysteme bieten. Sie finden zu verschiede-
Computer beeinflussen die Mathematik nen Themen Arbeitsblätter, die erläutern, wie mathematische
Konzepte im Computeralgebrasystem Maple umgesetzt wer-
den.
Die Verbreitung des Computers hat die Bedeutung der Mathe-
matik ungemein vergrößert. Mathematik wirkt heute prak- In der numerischen Mathematik, kurz auch Numerik genannt,
tisch in allen Lebensbereichen, angefangen von der Tele- entwickelt und analysiert man Algorithmen, deren Anwen-
kommunikation, Verkehrsplanung, Meinungsbefragung, bis dungen (näherungsweise) Lösungen von Problemen mithilfe
zur Navigation von Schiffen oder Flugzeugen, dem Auto- von Computern liefern. Oftmals, vor allem in der Praxis, ist es
mobilbau, den neuen bildgebenden Verfahren der Medizin nämlich so, dass man z. B. Gleichungen erhält, die nicht exakt
oder der Weltraumfahrt. Es gibt kaum ein Produkt, das nicht lösbar sind oder deren Lösungen nicht in analytischer Form
vor seinem Entstehen als virtuelles Objekt mathematisch be- angegeben werden können. Hier schafft die numerische Ma-
8 1 Mathematik – eine Wissenschaft für sich
Die Zugehörigkeit der Kapitel zu den verschiedenen Gebie- Achtung: Man achte wieder auf die grundsätzlich ver-
ten erkennen Sie auch an den Kapiteleingangsseiten, den schiedenen Bedeutungen der Additionen, die wir mit ein und
Überschriften oder den Seitenzahlen: Die Kapitelnummern, demselben +-Zeichen versehen. Man unterscheide genau:
Überschriften und Seitenzahlen sind bei den Kapiteln zur f + g bezeichnet die Addition in KM und f (x) + g(x) jene
Analysis grün, bei den Kapiteln zur linearen Algebra blau in K.
und bei den grundlegenden und übergreifenden Kapiteln Abbildung 1.3 Mit einem roten Achtung beginnen Hinweise zu häufig ge-
braun. machten Fehlern.
1.2 Die didaktischen Elemente dieses Buchs 9
Um neue Begriffe, Ergebnisse oder auch Rechenschemata Unter der Lupe: Der Zwischenwertsatz
mit Ihnen einzuüben, haben wir zahlreiche Beispiele im Text Die Funktion f : [a, b] → R soll stetig sein und besitzt daher eine Minimalstelle x − und eine Maximalstelle x + auf [a, b]. Es
gibt dann für jedes y ∈ [f (x − ), f (x + )] eine Zahl x̂ ∈ [a, b] mit
integriert. Diese (kleinen) Beispiele erkennen Sie an der f (x̂) = y.
blauen Überschrift Beispiel, das Ende eines solchen Beispiels Verdeutlichung der Aussage: Die Aussage ist leicht am
Graphen einer stetigen Funktion wie dem in der Abbildung
Da a ∈ A liegt, ist diese Menge garantiert nichtleer. Au-
ßerdem ist die Menge beschränkt, denn offensichtlich ist
markiert ein kleines blaues Dreieck. einzusehen. Die Niveaulinie zu y muss bei einer stetigen
Funktion offensichtlich den Graphen schneiden. Genau an
A ⊆ [a, b]. Somit hat A ein Supremum, das wir mit x̂
bezeichnen.
einer solchen Stelle liegt die gesuchte Stelle x̂.
Was wissen wir über den Funktionswert von f an der Stelle
x̂ ? Wenn wir eine gegen x̂ konvergente Folge (xn ) aus A
Beispiel f (x)
betrachten, so folgt aufgrund der Stetigkeit von f , dass
⎛ En ∈ K
Die Einheitsmatrix n×n ist symmetrisch. f (x + )
⎞ f (x̂) = f ( lim xn ) = lim f (xn ) ≤ y
n→∞ n→∞
√1 2 i y ist.
tige – (große) Beispiele. Diese ausführlich geschilderten Bei- suchen die Stetigkeit von f zu nutzen, um zu beweisen,
dass im Grenzfall gerade der Funktionswert y angenom-
vollständig erledigt. Für den Fall f (x̂) > y können wir
den Graphen von f an der Niveauline f (x) = y spiegeln.
Dies entspricht dem Betrachten von g(x) = y − f (x),
spiele behandeln meist komplexere oder allgemeinere Pro- men wird. Alternativ können wir versuchen, die Stetigkeit
zu nutzen, um eine Teilmenge von [a, b] zu finden, deren x ∈ [a, b]. Im Fall f (a) = y haben wir mit a schon
die Zwischenstelle gefunden. Insgesamt haben wir einen
bleme, deren Lösung mehr Raum einnimmt. Manchmal wird Supremum gerade die gesuchte Stelle ist. In beiden Fällen
besteht ein Beweis aus zwei Teilen. Man muss die Existenz vollständigen Beweis erarbeitet.
von x̂ sicherstellen und sich überlegen, dass f (x̂) = y gilt.
auch eine Mehrzahl prüfungsrelevanter Einzelbeispiele über- Im Haupttext wurde die zweite Möglichkeit für den Be- Bemerkungen:
weis gewählt. Ein erster rigoroser Beweis des Zwischenwertsat-
sichtlich in einem solchen Kasten untergebracht. Ein solcher zes wurde vom Mathematiker Bernard Bolzano
(1781–1848) in einer Arbeit aus dem Jahre 1817 ausge-
Umsetzung der Idee: Wir beschränken uns zunächst auf
Kasten trägt einen Titel, einen blau unterlegten einleiten- den in der Abbildung dargestellten Fall, dass f (a) < y
führt. Unabhängig erschien vier Jahre später ein Beweis
durch Augustin Louis Cauchy (1789–1857).
ist. Anschaulich ist klar, dass es zwischen a und x + min-
den Text, der die Problematik schildert, einen Lösungshin- destens einen Schnittpunkt mit der Niveaulinie f (x) = y
Das Vollständigkeitsaxiom wird nicht nur im Be-
weis verwendet, es ist auch fundamental dafür, dass
gibt. Um diesen zu konstruieren, definieren wir die Menge
weis, in dem das Vorgehen zur Lösung kurz erläutert wird, A durch
die Aussage überhaupt gilt. Konstruieren Sie selbst
ein Gegenbeispiel im Fall einer stetigen Funktion
A = {x ∈ [a, x + ] | f (x) ≤ y} . f : [a, b] ∩ Q → Q.
und schließlich den ausführlichen Lösungsweg (siehe Abbil-
dung 1.5).
Abbildung 1.6 Sätze bzw. deren Beweise, die von großer Bedeutung sind,
betrachten wir in einer sogenannten Unter-der-Lupe-Box genauer.
Beispiel: Betrag und Argument komplexer Zahlen
Gesucht sind die Beträge und die Argumente der Zahlen
z1
z1 , z2 , z1 + z2 ,
√
und
z2 sollten Sie die Frage beantworten können. Nutzen Sie diese
mit z1 = −1 + i und z2 = 1 + 3i.
Fragen als Kontrolle, ob Sie noch am Ball sind. Sollten Sie die
Problemanalyse und Strategie: Zunächst berechnen wir Betrag und Argument von z1 und z2 . Danach nutzen wir
die Rechenregeln, um die weiteren Beträge und Argumente zu bestimmen. Antworten nicht kennen, so empfehlen wir Ihnen, den vor-
Lösung: arg(z1 ) = arctan
−1
1
+π =−
π
4
+π =
3π
4
hergehenden Text ein weiteres Mal durchzuarbeiten. Kurze
Beginnen wir mit den Beträgen der angegebenen Zahlen:
Wir berechnen
und √ Lösungen zu den Selbsttests („Antworten der Selbstfragen“)
√ √ 3 π
|z1 | = (−1)2 + 12 = 2 und |z2 | = 1 + 3 = 2 . arg(z2 ) = arctan = ,
1
√
3 finden Sie am Ende der jeweiligen Kapitel.
Für die Summe folgt weiter 3/2 √
√ wobei die Identität sin(π/3)/ cos(π/3) = 1/2 = 3
|z1 + z2 | = | − 1 + i + 1 + 3i| verwendet wurde. Das Argument der Summe berechnen
√ √
?
wir direkt zu
= (1 + 3)2 = 1 + 3 √ π
arg(z1 + z2 ) = arg((1 + 3)i) = .
2
Den Betrag des Quotienten berechnen wir aus
z1 z1 z2 1 1 1
Für den Quotienten folgt mit den Rechenregeln
Bestimmen Sie die beiden Lösungen der Gleichung z2 = i.
=
z |z |2 = 4 |z1 | |z2 | = 4 |z1 | |z2 | = √ . arg
z1
= arg
z1 z2
2 2 2
z2 |z2 |2
Die Hauptwerte der Argumente von z1 und z2 lassen = arg(z1 z2 )
sich entweder aus einer Skizze der Zahlen in der Zah-
= arg(z1 ) + arg(z2 )
Abbildung 1.7 Selbsttests ermöglichen eine Verständniskontrolle.
lenebene ersehen oder wir berechnen diese mithilfe der
Wertetabelle für die trigonometrischen Funktionen auf 3 1 5
= arg(z1 ) − arg(z2 ) = π− π= π.
Seite 104 4 3 12
Im Allgemeinen werden wir Ihnen im Laufe eines Kapitels
Abbildung 1.5 Größere Beispiele stehen in einem Kasten und behandeln viele Sätze, Eigenschaften, Merkregeln und Rechentechni-
komplexere Probleme. ken vermitteln. Wann immer es sich anbietet, formulieren wir
die zentralen Ergebnisse und Regeln in sogenannten Über-
Manche Sätze bzw. ihre Beweise sind so wichtig, dass wir sie sichten. Neben einem Titel hat jede Übersicht einen einlei-
uns genauer unter die Lupe nehmen. Dazu dienen die Boxen tenden Text. Meist sind die Ergebnisse oder Regeln stich-
Unter der Lupe. Zwar sind diese Sätze mit ihren Bewei- punktartig aufgelistet. Eine Gesamtschau der Übersichten
sen stets auch im Fließtext ausführlich dargestellt, in diesen gibt ein Verzeichnis im Anschluss an das Inhaltsverzeich-
zugehörigen Boxen jedoch geben wir weitere Ideen und An- nis – die Übersichten dienen in diesem Sinne also auch als
regungen, wie man auf diese Aussagen bzw. ihre Beweise eine Art Formelsammlung (siehe Abbildung 1.8).
kommt. Wir geben oft auch weiterführende Informationen
Hintergrund und Ausblick sind oft ganzseitige Kästen, die
zu Beweisalternativen oder mögliche Verallgemeinerungen
eine Thematik behandeln, die weiterführenden Charakter hat.
der Aussagen (siehe Abbildung 1.6).
Meist kann das Thema wegen Platzmangels nur angerissen,
Ein sehr häufig eingesetztes Element ist das des Selbsttests. also keinesfalls erschöpfend behandelt werden. Die Gestal-
Meist enthält dieser Selbsttest eine Frage an Sie. Sie erkennen tung dieser Kästen ist analog zu jener von Übersichten. Die
dieses Merkmal an dem Fragezeichen. Mit dem Gelesenen Themen, die hier angesprochen werden, sind vielleicht nicht
10 1 Mathematik – eine Wissenschaft für sich
an+1 − an =
1 1
− =−
1
≤ 0.
Die erlernten Techniken können Sie an den zahlreichen Auf-
beschränkte Folgen n+1 n n (n + 1)
konvergente
Folgen
(n) gaben zum Ende eines jeden Kapitels erproben. Wir unter-
(−1)n 1 Die Folge ist monoton fallend und gehört damit zur blauen
n
(−1)n
n
monotone Folgen Menge im Diagramm. Das Monotoniekriterium besagt scheiden zwischen Verständnisfragen, Rechenaufgaben und
nun, dass die Schnittmenge der blauen und der gelben
(−1)n n
Menge, also gerade der grüne Bereich im Diagramm, nur Beweisaufgaben – jeweils in drei verschiedenen Schwierig-
aus konvergenten Folgen besteht. Somit ist (an ) konver-
gent. keitsgraden. Versuchen Sie sich zuerst selbstständig an den
Aufgaben. Erst wenn Sie sicher sind, dass Sie es alleine nicht
Abbildung 1.8 In Übersichten werden verschiedene Begriffe oder Rechenregeln
schaffen, sollten Sie die Hinweise am Ende des Buches zurate
zu einem Thema zusammengestellt.
ziehen oder sich an Kommilitonen wenden. Zur Kontrolle
finden Sie hier auch die Resultate. Sollten Sie trotz Hinwei-
unmittelbar grundlegend für das erste Studienjahr, sie sollen sen nicht mit der Aufgabe fertig werden, finden Sie auf der
Ihnen aber die Vielfalt und Tiefe verschiedener mathemati- Website www.matheweb.de die Lösungswege.
scher Fachrichtungen zeigen und auch ein Interesse an diesen
Themen wecken (siehe Abbildung 1.9).
1.3 Ratschläge zum Einstieg in
die Mathematik
Sie als Studienanfänger werden sich bald in der Situation
befinden, in der sich bereits Tausende vor Ihnen befunden
haben und sich auch noch Tausende nach Ihnen befinden
werden: Es ist oftmals gar nicht so schwierig, die Beweise aus
der Vorlesung nachzuvollziehen, es scheint aber manchmal
schier unmöglich, selbstständig einen Beweis zu formulieren.
Aber das Beweisen von Sätzen ist das A und O in der Ma-
thematik. Und da es kein allgemeingültiges Schema gibt, das
Ihnen einen Weg vorgibt, wie Sie beim Beweisen von Aussa-
gen vorzugehen haben, ist es – vor allem zum Studienbeginn –
so schwierig, überhaupt auch nur Ansätze zu finden, die zu
einem Beweis einer Aussage führen können.
Eine Regel aber gilt auf jeden Fall: Die Erfahrung macht den
Meister! Kennt man viele unterschiedliche Beweise, so hat
man ein ganzes Sammelsurium an Ideen, die schon einmal
zu Lösungen geführt haben; und die richtige Idee zu haben,
ist oftmals das Entscheidende zum Beweis eines Satzes.
Abbildung 1.10 In dem Beweis des Satzes zur Primeigenschaft wird auf die Voraussetzungen und auf bekannte Ergebnisse zurückgegriffen.
Mit Kommilitonen und viel Hintergrundwissen unvollständige und/oder falsche Argumente in Beweisen
ist es leichter entdecken,
unvollständige Beweise komplettieren,
Man lernt sehr viel dabei, wenn man sich mit Kommilitonen falsche Beweise korrigieren oder durch Gegenbeispiele
zusammentut und die Beweisführungen zu den verschiede- widerlegen,
nen Aufgaben, die im Laufe des Studiums gestellt werden, anhand von Beweisversuchen unscharfe Hypothesen prä-
miteinander vergleicht. Natürlich hat man als Anfänger zisieren.
12 1 Mathematik – eine Wissenschaft für sich
Beim Lösen von Aufgaben sollten Sie Hintergrundwissen Auswahl sein und ist auch durch die Vorlieben des Verfas-
benutzen, beachten Sie das folgende Beispiel. sers bestimmt. Eine kulturgeschichtliche Zeitreise vermittelt
die Lektüre „6000 Jahre Mathematik“ (Band 1 und Band 2)
Beispiel Wir betrachten erneut den Satz zur Primeigen- von Hans Wußing (Springer-Verlag 2008/2009). Von diesen
schaft und begründen auf eine andere Art und Weise wie beiden Bänden hat der Verfasser dieser „kurzen Geschichte
oben geschehen, dass jede Primzahl p die folgende, soge- der Mathematik“ zahlreiche Anregungen erhalten. Dankens-
nannte Primeigenschaft erfüllt: werterweise konnten auch einige Abbildungen übernommen
werden.
p | a b ⇒ p | a oder p | b, wobei a, b ∈ N .
pc = ab. (1.1)
Zahlen, in allen Kulturen schon in einem frühen Stadium der
Nun denken wir an den Fundamentalsatz der Arithmetik, der Entwicklung zum Zählen, Rechnen und Vergleichen verwen-
hoffentlich vielen aus der Schulzeit bekannt ist. Dieser Satz det, spielen auch in unserem Alltagsleben eine nicht wegzu-
besagt, dass jede natürliche Zahl n > 1, von der Reihen- denkende Rolle. Ob Telefonnummern, Kontostände, Preise,
folge der Faktoren abgesehen, eindeutig als ein Produkt von Zinsen und Zeitangaben, Zahlen sind allgegenwärtig. Man
Primzahlen geschrieben werden kann, d. h.: kann sagen, dass die Geschichte der Mathematik mit der
Erfindung von Symbolen als Stellvertreter für Zahlen be-
ginnt. Ein ca. 25.000 altes Zeugnis hierfür ist der Ishango-
n = p1 · · · pr mit Primzahlen p1 , . . . , pr .
Knochen aus Zaire mit Strichmustern, die stellvertretend für
Zahlen stehen. Jüngeren Datums sind Tontafeln mit Keil-
Damit können wir obige Aussage begründen: Zerlegt man a b
schriftzeichen aus Mesopotamien. Die Babylonier verwende-
in ein Produkt von Primzahlen (was nach dem Fundamental-
ten ihr Zahlensystem, das auf der Basis 60 beruhte, nicht nur
satz der Arithmetik möglich ist), so taucht laut Gleichung
für Handel und zur Buchführung, sondern auch zu astrono-
(1.1) die Primzahl p als ein Faktor in dieser Zerlegung von
mischen Rechnungen. Auf dem berühmten Täfelchen√YBC
a b auf. Damit muss aber die Primzahl p Teiler einer der
7289 findet sich in Keilschrift ein Näherungswert für 2 auf
Faktoren a oder b sein, evtl. sogar von beiden.
sechs Stellen genau (Abb. 1.12).
√
Abbildung 1.12 Täfelchen YBC 7289 mit Näherungswert für 2 auf sechs
Stellen genau (1 + 24/60 + 51/602 + 10/603 ≈ 1.414213).
1.4 Eine kurze Geschichte der Das Positionssystem der Babylonier mit der Grundzahl 60
Mathematik war sehr leistungsfähig und allen Zahlensystemen der Antike
(etwa dem der Griechen und Römer) überlegen.
Die Anfänge der Mathematik reichen weit in die Geschichte Unser geläufiges Stellensystem mit der Basis 10 und den
zurück. Höhlenmalereien aus Südfrankreich, Spanien und Ziffern 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ist indischen Ursprungs und
Nordafrika bereits um 13.000 v. Chr. weisen einen bemer- kam über die Araber nach Europa. Um ca. 500 v. Chr. führten
kenswerten Sinn für Formeln auf. Schon in der älteren Stein- die Inder ein Zeichen für „Nichts“ (auf lateinisch „nullus“)
zeit finden sich Zeugnisse für Vorstufen des Zählens und ein, nämlich „0“. So konnten sie Zahlen wie 25 = 2 · 101 +
Rechnens in Form von Ritzen auf den Höhlenwänden und 5 · 100 und 2050 = 2 · 103 + 0 · 102 + 5 · 101 + 0 · 100
Kanten in Stöcken oder Knochen (30.000 bis 20.000 v. Chr.). unterscheiden. Bis zur endgültigen Klärung des Begriffs der
Die folgende kurze Geschichte der Mathematik kann nur eine „reellen Zahl“ hat es ziemlich lange gedauert. Dieser Prozess
14 1 Mathematik – eine Wissenschaft für sich
war erst gegen Ende des 19. Jahrhunderts (G. Cantor (1883), ten, die Berechnung des Verpflegungsbedarfs für Soldaten
R. Dedekind (1888) ) abgeschlossen. etc. Dass in einem rechtwinkligen Dreieck mit den Katheten
a und b und der Hypotenuse c die Gleichung
a 2 + b2 = c2
Mesopotamien (ab ca. 3300 v. Chr. bis ca.
100 v. Chr.) gilt (sogenannter Satz des Pythagoras) war in Mesopotamien
bekannt. Das spezielle Zahlentripel 3, 4, 5 mit 32 +42 = 52
und ähnliche Zahlentripel waren bekannt. Solche Tripel wur-
Es ist wohl kein Zufall, dass sich die frühen Hochkulturen den von den Harpedonapten (Seilspannern) verwendet, um
um den sogenannten „fruchtbaren Halbmond“ am Nil, an rechte Winkel bei der Vermessung zu erzeugen (denn es gilt
Euphrat und Tigris (Mesopotamien) und den Indus und in auch die Umkehrung des Satzes des Pythagoras!).
China um den Huanghe entwickelten. Aus den Nomaden-
kulturen wurden sesshafte Bauernkulturen. Die Bedeutung Den Babyloniern war die Methode der quadratischen Er-
der Jagd nahm ab, weil es gelang Schafe, Schweine, Ziegen gänzung geläufig, und sie entwickelten Näherungsverfahren
und Rinder zu züchten. So konnten Teile der Bevölkerung zur Bestimmung von Quadratwurzeln aus natürlichen Zah-
von der unmittelbaren Nahrungsproduktion befreit werden. len, falls diese Zahlen keine Quadratzahlen waren. Es sind
Es konnten sich spezialisierte Berufsgruppen in Handwerk, Tabellen mit Quadratzahlen überliefert. Kam eine natürli-
Technik, Verwaltung, Kultur und Militär herausbilden. So che Zahl a, deren Wurzel zu berechnen war, in den Tabellen
entstand ab ca. 3000 v. Chr. in Mesopotamien, dem Zwei- nicht vor, so suchte man eine nächstkleinere Quadratzahl x02
stromland zwischen Euphrat und Tigris (heute politisch zum und rechnete mit ε := a − x02 die Wurzel von a nach der
Irak gehörig), eine blühende Kulturlandschaft, die von ver- Formel
schiedenen Völkerschaften (Sumerer, Akkader, Assyrer) be- √
ε
siedelt wurde. Städte wie Babylon, Ninive, Nippur, Uruk und a = x02 + ε ≈ x0 + .
2x0
Ur sind heute noch ein Begriff. Herrscher wie Hammurapi
√ B. erhält man2 für a = 27 = 25 + 2 den Näherungswert
(1728–1686 v. Chr.) und Nebukadnezar II (605–567 v. Chr.) Z.
sind vielleicht in Erinnerung (letzterer wohl auch durch die 27 ≈ 5 + 2 · 5 = 5.2 . Ob die Babylonier das Verfah-
grausame Behandlung von Gefangenen während seiner Herr- ren iteriert haben ist nicht bekannt, aber wahrscheinlich. Den
schaft). Unter Nebukadnezar begann auch die babylonische Griechen war die obige Näherungsformel ebenfalls bekannt;
Gefangenschaft des jüdischen Volkes. sie wird fälschlicherweise häufig nach dem griechischen
Mathematiker Heron von Alexandria (≈ 62 u. Z.) benannt.
Das Zahlsystem in Mesopotamien hatte in ausgereiftem Zu-
Durch Iteration erhält man einen Spezialfall des Newton-
stand zwei Keilschriftzeichen (den Keil für die Eins und den
Verfahrens.
Winkelhaken für zehn). Es war ein Positionssystem mit der
Basis 60 (Sexagesimalsystem), wegen des Winkelhakens für Auch die Methode der „quadratischen Ergänzung“ zur Lö-
die Zahl zehn hatte es eine dezimale Komponente. So ist etwa sung einer quadratischen Gleichung war den Babyloniern ge-
in Abbildung 1.13 die Zahl 42 = 4 · 10 + 2 in Keilschriftzei- läufig: Um etwa die Gleichung
chen zu sehen.
x 2 + 2x − 8 = 0
x 2 + 2x = 8 .
Die mesopotamische Mathematik ist mit praktischen Proble- und damit x + 1 = ±3, d. h., x1 = −4 und x2 = 2 sind
men verbunden: Berechnung von Dämmen mit meist trapez- die Lösungen der Ausgangsgleichung. Der in der Bibel ge-
förmigem Querschnitt, Berechnung von Tempelfundamen- schilderte Turmbau zu Babel (Genesis 11.1–11.9) fällt auch
1.4 Eine kurze Geschichte der Mathematik 15
in diese Periode. Zusammenfassend kann man sagen, dass in schrittliche Technik ging einher mit Kenntnissen in Mathe-
Mesopotamien, speziell in Babylon, eine auf dem Sexage- matik und Astronomie.
simalsystem basierende leistungsfähige Mathematik (Geo-
Auch die chinesische Mathematik erlebte schon früh eine
metrie und Arithmetik) entwickelt wurde; allerdings fehlten
Blütezeit. Besonders erwähnenswert sind die „Neun Bü-
noch Lehrsätze und Beweise, deshalb kann man noch nicht
cher arithmetischer Technik“ (300–500 v. Chr.), eine Samm-
von Mathematik als Wissenschaft sprechen.
lung von 246 Aufgaben aus den Bereichen Landvermes-
sung, Landwirtschaft, Steuern, Handelserträge, Technik, Lö-
sung von Gleichungen, insbesondere lineare Gleichungen
Die Mathematik im alten Ägypten (die sogenannte Fang-Cheng-Methode zum Lösen von linea-
(ca. 3000 v. Chr. bis ca. 300 v. Chr.) ren Gleichungssystemen entspricht dem Gauß-Algorithmus),
simultane Kongruenzen (chinesischer Restsatz). Die Chine-
Ähnlich wie im Zweistromland hatten auch die ägyptischen sen verwendeten im Wesentlichen ein Dezimalsystem mit
Siedlungen am Flussufer des Nils mit jährlichen Über- Null. Im Übergang vom 7. ins 8. Jahrhundert wurden die indi-
schwemmungen zu kämpfen. Die Überflutungen waren je- schen Ziffern übernommen. Um 300 u. Z. findet sich die recht
doch entscheidend für die Landwirtschaft und damit das gute Näherung 3.14159 für die Kreiszahl π . Das 13. Jahr-
gesamte Leben in Ägypten. Wie der griechische Historiker hundert war ein „Goldenes Zeitalter“ für die chinesische
Herodot in seinem großen Epos über die Perser-Kriege be- Mathematik (Zitat Wußing a. a. O.). Das Pascal’sche Drei-
richtet, wurde „geometria“ von den Ägyptern benutzt, um eck zur Berechnung von Binomialkoeffizienten war ihnen
nach den Überflutungen das Ackerland neu zu vermessen. geläufig, ebenso wie Interpolationsformeln und Summenfor-
Dabei musste man rechte Winkel erzeugen können. Die meln und Berechnungsverfahren für Quadrat- und Kubik-
Ägypter verwendeten die gleiche Methode wie die Mesopo- wurzeln.
tamier. Pythagoräische Zahlentripel waren das wesentliche
Hilfsmittel.
Während aus Mesopotamien zahllose Tontafeln überliefert Die Mathematik der Maya
sind, sprudeln die Informationsquellen zur antiken ägypti-
schen Mathematik nicht so reichlich. Die ersten beiden Ur- Die verblüffenden intellektuellen Leistungen der Maya und
kunden sind Beispielsammlungen von 84 bzw. 25 Aufgaben, Azteken und der Inka in Südamerika bezüglich Bauwesen
die meist praxisorientiert waren und etwa die Verteilung von (Errichtung von Palästen, Gärten etc.) und insbesondere die
Löhnen auf mehrere Arbeiter, die Berechnung des Bedarfs Kalenderrechnung und die langfristige Voraussage von Son-
an Mehl zum Backen einer bestimmten Menge von Broten nenfinsternissen seien hier nur am Rande erwähnt. Die Maya
oder die Berechnung von Raum- und Flächeninhalten betra- verwendeten ein Positionssystem mit der Basis 20 und einer
fen. So konnten sie etwa den Materialbedarf für den Bau ihrer „Null“.
beeindruckenden Pyramiden berechnen. Für die Kreiszahl π,
das Verhältnis von Umfang und Durchmesser eines Kreises,
2
verwendeten sie die brauchbare Näherung 16 ≈ 3.1605. Antike
9
Die Ägypter verwendeten ein etwas umständliches Dezimal- Im Zuge der sogenannten dorischen Wanderung besiedelten
system. Für jede Zehnerpotenz gibt es ein eigenes Zeichen in die Griechen die Inseln der Ägäis und die Westküste Kleinasi-
Gestalt einer Hieroglyphe, das entsprechend häufig wieder- ens. Um 900 v. Chr. beginnt die Entwicklung einer gemeinsa-
holt wird: men eigenständigen Kultur der griechischen Stämme (die ihr
Land Hellas und sich selbst Hellenen nennen). Homer schrieb
die Epen „Ilias“ und „Odyssee“ in der zweiten Hälfte des 8.
vorchristlichen Jahrhunderts. Im Jahr 776 v. Chr. fanden in
Olympia die ersten olympischen Spiele statt. Um diese Zeit
breitete sich die hellenistische Zivilisation und Kultur weit
im Mittelmeerraum aus. Es entstanden Kolonien in Unter-
italien und Sizilien, am Bosporus und am Schwarzen Meer.
Die Griechen hatten im Gegensatz zu den Mesopotamiern
Indische (ca. 1000 v. Chr. bis 1000) und chine- und Ägyptern, für die praktische Anwendungen im Vorder-
sische Mathematik (ca. 1000 v. Chr. bis 1300) grund standen, ein philosophisches Interesse an der Mathe-
matik. Als erster bedeutender Naturphilosoph wird Thales
In Indien entwickelten sich im Industal und in der Ganges- Milet (624–548 v. Chr.) angesehen. Auf häufigen Geschäfts-
ebene ca. 3000 v. Chr. Stadtkulturen (Mohenjo-Daro, Har- reisen kam er nach Ägypten, wo er die ägyptische Geome-
appa, Dehli). Es gab in den Städten rechtwinklig aufgebaute trie kennenlernte und die Bekanntschaft mit Erkenntnissen
Straßen, Häuser mit Badezimmern, wohldurchdachte Ab- der Babylonier machte. Es soll Thales angeblich gelungen
wassersysteme und Zitadellen. Diese vergleichsweise fort- sein, mithilfe babylonischer Tafeln die Sonnenfinsternis am
16 1 Mathematik – eine Wissenschaft für sich
28. Mai 585 v. Chr. vorherzusagen. Damit soll er dem lydi- die ersten „theoretischen Mathematiker“, da Anwendungen
schen König Krösus geholfen haben eine Schlacht zu gewin- für sie nicht im Vordergrund standen.
nen, da seine Feinde – von der Sonnenfinsternis überrascht
Die Begriffe „gerade Zahl und ungerade Zahl“ waren ih-
– erschrocken die Flucht ergriffen. Zahlreiche geometrische
nen geläufig.
Sätze werden Thales zugeschrieben, ob die Beweise von ihm
Sie kannten sogenannte „figurierte Zahlen“ wie Dreiecks-
stammen, ist wegen mangelnder Zeugnisse nicht sicher. Sätze
zahlen, also:
die Thales zugeschrieben werden, sind u. a.:
Jeder Peripheriewinkel über einen Durchmesser eines n(n + 1)
1 + 2 + 3 + ... + n = ,
Kreises ist ein rechter. 2
Der Durchmesser eines Kreises halbiert die Kreisfläche.
Viereckszahlen:
In einem gleichschenkligen Dreieck sind die Basiswinkel
gleich.
1 + 3 + 5 + ... + 2n − 1 = n2
Der Scheitelwinkelsatz: Schneiden sich zwei Geraden, so
sind die Scheitelwinkel gleich.
etc.
Zwei Dreiecke sind kongruent, wenn sie in einer Seite und
Sie kannten Beispiele von vollkommenen Zahlen, z. B.:
anliegenden Winkeln übereinstimmen.
Thales gilt als erster Mathematiker, der für seine Sätze auch 6=1+2+3
Beweise angab. Er war einer der Ersten, der aus der Mathe-
matik heraus neue Fragestellungen und Probleme formuliert oder
hat. Für viele Wissenschaftshistoriker beginnt mit solchen 28 = 1 + 2 + 4 + 7 + 14 .
Fragestellungen die Mathematik als Wissenschaft, während
vorher meist Anwendungen im Mittelpunkt standen. Dabei heißt eine natürliche Zahl n vollkommen, wenn sie
Summe ihrer Teiler ist, die kleiner als n sind.
Sie kannten eine Formel, um sogenannte pythagoräische
Zahlentripel, d. h. natürliche Zahlen x, y, z mit
Von den Pythagoräern bis zu Diophant
x 2 + y 2 = z2
Pythagoras von Samos (≈ 560–480 v. Chr.) gründete nach
Reisen nach Ägypten und einer Gefangenschaft in Babylon zu erzeugen.
im Jahr 529 v. Chr. in Kroton (Unteritalien) eine Art Or- Der sogenannte „Satz des Pythagoras“, dass nämlich in
den, also eine religiöse Gemeinschaft, deren Mitglieder nach einem rechtwinkligen Dreieck mit den Katheten a, b und
strengen Regeln leben mussten. der Hypotenuse c gilt:
a 2 + b2 = c2 ,
a : x = x : (a − x) .
Die Quadratur des Kreises besteht in dem Problem, eine Nach dem Tod von Alexander dem Großen (323 v. Chr.)
Kreisfläche in ein flächengleiches Quadrat zu verwandeln. sank die politische Macht Griechenlands und zugleich seine
Dass dieses Problem mit Zirkel und Lineal nicht zu lösen führende Stellung im Bereich der Wissenschaften. Neues
ist, bewies als erster 1882 F. Lindemann, indem er nachwies, wissenschaftliches Zentrum wurde die von Alexander dem
dass die Kreiszahl π eine transzendente Zahl ist. Es hat jedoch Großen am Nildelta gegründete Stadt Alexandria mit der Uni-
zu allen Zeiten brauchbare Näherungskonstruktionen gege- versität (dem Museion) und der größten Bibliothek der Welt.
ben. Hier wirkte nun 300 v. Chr. Euklid von Alexandria (seine Le-
bensdaten sind nicht genau bekannt, man geht davon aus,
Zu Platons Zeiten soll ein Orakelsprecher die Verdopplung dass er um 340 v. Chr. bis 270 v. Chr. gelebt hat und seine
des würfelförmigen Altars in Deli gefordert haben, damit die Hauptwirkungszeit um 300 v. Chr. lag).
18 1 Mathematik – eine Wissenschaft für sich
In den „Elementen“, die aus 17 Büchern (Kapiteln) bestehen, über schwimmende Körper (er hat das Auftriebsgesetz ent-
ist das mathematische Wissen der Vorgänger zusammenge- deckt), über Hebelgesetze und Schwerpunkte, ferner hat er
fasst, geordnet und gleichzeitg auch erweitert. Im Laufe der sich mit der Konstruktion von Flaschenzügen und Wasser-
Jahrhunderte sind unzählige Ausgaben erschienen. Die Ele- schrauben beschäftigt.
mente sind nach einer strengen Systematik aufgebaut. Sie
Unter weiteren Mathematikern der Alexandrinischen Peri-
enthalten: Definitionen, Postulate, Axiome, Probleme mit
ode ist vielleicht Aristarch von Samos (≈ 310–230 v. Chr.)
Lösungen, Sätze, Hilfssätze und deren Beweise. Das Axio-
zu nennen. Er war der Vertreter eines heliozentrischen Sy-
mensystem hat viele Schwächen und Inkonsistenzen, jedoch
stems, die Erde und die anderen Planten bewegen sich in
hat man es bei den Elementen wohl mit der ersten axiomatisch
Kreisbahnen um die Sonne (eine Vorstellung, die sogar von
aufgebauten Theorie zu tun. Wir wenden unser Augenmerk
Archimedes abgelehnt wurde). Ferner sei Eratosthenes von
auf das 5. Postulat:
Kyrene (≈ 276–195 v. Chr.) erwähnt, der den Erdumfang
5. „Und dass, wenn eine gerade Linie bei einem Schnitt mit durch Bestimmung des Sonnenwinkels in Assuan und Alex-
zwei geraden Linien bewirkt, dass innen auf derselben Seite andria mit ca. 46 000 km bestimmt hat (tatsächlicher Wert ca.
entstehende Winkel kleiner als zwei Rechte werden, dann die 40 075 km). Von Eratosthenes stammt auch das sogenannte
zwei geraden Linien bei Verlängerung ins Unendliche sich Sieb des Eratosthenes, eine Methode, alle Primzahlen bis zu
treffen auf der Seite, auf der die Winkel liegen, die zusammen einer vorgegebenen Schranke zu bestimmen.
kleiner als zwei Rechte sind“.
Als letzten dieser Reihe nennen wir Apollonios von Perge
Aus dem 5. Postulat folgt das berühmte Parallelenaxiom: Zu (265–170 v. Chr.), der sich umfassend mit Kegelschnit-
jeder Geraden g und einem Punkt P existiert (in der durch g ten beschäftigt hat und der auch durch den sogenannten
und P bestimmten Ebene) genau eine Gerade h, die durch P „Apollonios-Kreis“ bekannt ist. Mit Apollonios erlebte die
geht und zur Geraden g parallel ist. griechische Mathematik einen gewissen Abschluss, weil sich
der Machtmittelpunkt nach Rom verlagerte und die Weiter-
Vom Erscheinen der Elemente bis ins 19. Jahrhundert ha-
entwicklung der Wissenschaft kein zentrales Anliegen Roms
ben sich Mathematiker mit der Frage beschäftigt, ob man
war. Bedeutende mathematische Einzelleistungen in den Fol-
das Parallelenaxiom auch ohne Verwendung des 5. Postulats
gezeiten stammen von Hipparch von Nicäa (190–126 v. Chr.),
(das zum Parallelenaxiom gleichwertig ist) aus den übrigen
Heron von Alexandria (≈ 100 u. Z.) sowie Ptolemäus, der in
Axiomen folgern kann. Die Antwort ist „Nein“ und sie er-
seinem „Almagest“ die Lehren und Beobachtungen von sei-
folgte im 19. Jahrhundert unabhängig von
nem ptolemäischen Weltsystem zusammenfasste (Erde im
János Bolyai (1802–1860) und Mittelpunkt des Weltalls, Sonne, Planeten und Mond bewe-
Nikolai Lobatschewksi (1793–1856). gen sich auf Kreisbahnen um die Erde). Einer der bedeu-
tendsten Mathematiker des Altertums war ohne Zweifel Dio-
Sie gelten als Begründer der „nichteuklidischen“ (hyperbo-
phant von Alexandria (≈ 250 u. Z.). Sein Hauptwerk „Ma-
lischen) Geometrie.
thematika“ hatte starke Ausstrahlung auf die Neuzeit („Dio-
Die Beweisform von Euklid, die Aufteilung in Vorausset- phanti’sche Gleichungen“). Als letzten bedeutenden Mathe-
zung, Behauptung, Beweis, ist noch heute üblich. Der Satz matiker der Antike wird Pappus von Alexandria (≈ 320 u. Z.)
20 in Buch IX lautet: „Es gibt mehr Primzahlen als jede vor- betrachtet, dessen Hauptwerk die „mathematische Samm-
gelegte Anzahl von Primzahlen“. In unserer heutigen Ter- lung“ ist. Hypatia von Alexandria (um 400), die erste be-
minologie drücken wir das so aus: „Es gibt unendlich viele kannte Mathematikerin, erlitt ein tragisches Schicksal: Als
Primzahlen“. Nach Einschätzung von Experten sind die „Ele- Mitglied der neuen platonischen Schule geriet sie in Kon-
mente“ das einflussreichste Werk in der gesamten mathema- flikt mit fanatischen Christen und wurde von ihnen grausam
tischen Literatur. ermordet.
Der bedeutendste Mathematiker und das größte naturwissen- 395 (u. Z.) kam es zur Teilung des römischen Reiches in
schaftliche Genie der sogenannten Alexandrinischen Peri- Westreich (Ende 476) und Ostreich (Ende 1455). 529 wurde
ode (bis ≈ 150 n. Chr.) war jedoch Archimedes von Syrakus die platonische Akademie in Athen durch den römischen
287–212 v. Chr.). Er stammte aus Syrakus, studierte vermut- Kaiser Justinian gewaltsam geschlossen. Nachdem die Ma-
lich in Alexandria und wurde 212 in Syrakus von einem rö- thematikschule in Alexandria bereits um 415 erloschen war,
mischen Legionär ermordet. Er berechnete die Fläche von kennzeichnet das Jahr 529 den Untergang der antiken Mathe-
Kreisen, Ellipsen, Parabeln, die Volumina von Zylindern, matik in Griechenland, deren Tradition jedoch bis ca. 1400
Kegeln und Kugeln. Die geometrische Summenformel war in Byzanz gepflegt wurde.
ihm in einem Spezialfall geläufig. Er bewies die Ungleichung
630 zieht Mohammed (570–623) in seine Heimatstadt Mekka
3 10 10
71 < π < 3 70 . ein, seine Lehren begründen den Islam. Um 800 behandelt al-
Bei Archimedes finden sich erste Ansätze von Grenzwerten. Hwârâzmî aus Choraren (Gebiet um den Aralsee) als erster
Er entwickelte für die Armee von Syrakus technische Hilfs- islamischer Autor in seiner „Algebra“ Verfahren zur Auflö-
mittel, sodass Syrakus lange dem kriegerischen Ansturm der sung von Gleichungen (vorzugsweise lineare und quadrati-
Römer standhalten konnte. Archimedes verfasste Schriften sche Gleichungen).
1.4 Eine kurze Geschichte der Mathematik 19
v. Chr.) an. Das Werk von Kopernikus wurde 1616 von der meln beschrieb und sie rational zu erklären versuchte, und
katholischen Kirche auf den Index gesetzt. analog Johannes Kepler (1571–1630) die Himmelsmecha-
nik.
François Viète (1540–1603) (lat. Franciscus Vieta) propa-
gierte im Anschluss an die Cardani’schen Formeln das Rech- In die beschriebene Periode fällt auch die Entwicklung von
nen mit Buchstaben. Bekannt ist der nach ihm bekannte Rechenhilfsmitteln, z. B. die für die Navigation und Astro-
„Wurzelsatz“: Hat die Gleichung x 2 + px + q = 0 die Lö- nomie außerordentlich nützlichen Logarithmen u. a. durch
sungen (Wurzeln) x1 und x2 , dann ist p = −(x1 + x2 ) und John Napier (1550–1617), Michael Stifel (ca. 1487–1567)
q = x1 x2 . Hiervon gibt es Verallgemeinerungen auf Poly- und Henry Briggs (1561–1630).
nome höheren Grades. In die Barockzeit (ca. 1570–1770) fallen auch die Untersu-
Das x in Gleichungen geht auf René Descartes (1596–1650) chungen von Pierre de Fermat (1607–1665) zur Zahlentheo-
zurück. rie. Fermat beschäftigte sich intensiv mit Diophants „Arith-
metica“. Fermat war von Beruf Jurist, aber leidenschaftlicher
Hobby-Mathematiker. Er vermutete, dass Zahlen der Gestalt
n
Fn = 22 + 1, n ∈ N, stets Primzahlen sind. Das trifft für
F0 = 3, F1 = 5, F2 = 17, F3 = 257 und F4 = 65537
tatsächlich zu, aber bis jetzt wurde kein weiteres n gefunden,
für das Fn eine Primzahl ist. Zahlreiche Sätze und Methoden
der „Elementaren Zahlentheorie“ gehen auf Fermat zurück,
z. B. der sogenannte kleine Fermat’sche Satz, dass für eine
ganze Zahl a, die nicht durch die Primzahl p teilbar ist, stets
p ein Teiler von a p−1 − 1 ist. Bekannt für eine größere Öf-
fentlichkeit wurde Fermat, als 1994 von Andrew Wiles sein
„letzter Satz“ bewiesen wurde: Für n ∈ N, n ≥ 3 besitzt die
Gleichung
x n + y n = zn
Abbildung 1.18 René Descartes (1596–1650) nach einem Gemälde von Franz
Hals, 1648. keine Lösungen x, y, z ∈ N. Von der Aufstellung der Ver-
mutung, dass der Satz richtig sein könnte, bis zum Beweis
Er gilt als Begründer der neuzeitlichen Philosophie. Er kom- hat es ca. 350 Jahre gedauert. Fermat gilt neben Blaise Pascal
binierte Algebra mit Geometrie und begründete die „ana- (1623–1663) auch als einer der Begründer der Wahrschein-
lytische Geometrie“. Kartesische Koordinaten haben beson- lichkeitstheorie.
ders angenehme Eigenschaften. Mit seiner Existenzphiloso-
phie stellte er sich in einen krassen Gegensatz zu den Leh-
ren der katholischen Kirche. Er wurde von dieser und später Aufklärung
auch von der evangelischen Kirche massiv befehdet. Auch
seine Übersiedlung in die als liberal geltenden Niederlande Während Galileo Galilei noch im Jahr 1633 durch die Inqui-
(1628/29) stand unter keinem guten Stern. Nachdem Galilei sition verurteilt wurde, war das 17. Jahrhundert geprägt von
durch die katholische Kirche zum Widerruf gezwungen wor- einem fortschreitenden Rationalismus. Der Glaube an kirch-
den war, wurde auch in den Niederlanden Kopernikus’ Schrift liche und staatliche Autoritäten wurde immer stärker hinter-
auf den Index gesetzt und die Verbreitung des kopernikani- fragt. Das heliozentrische Weltbild setzte sich durch. Fort-
schen Weltbildes untersagt. Die Philosophie von Descartes schritte auf dem Gebiet der Mathematik und Physik waren
wurde 1642 von einem Expertengremium verworfen, weil sie dabei wesentlich. Man beachte aber, dass das 17. Jahrhun-
im Gegensatz zur offiziellen Theologie stehen würde. Seine dert ein „dunkles Jahrhundert“ war. Der dreißigjährige Krieg
Schriften wurden 1667 von der katholischen Kirche auf den (1618–1648), den die europäischen Staaten auf deutschem
Index gesetzt. Im Oktober 1649 folgte Descartes einem Ruf Territorium austrugen, die Kriege Ludwigs XIV, die Tür-
der für die Wissenschaften aufgeschlossenen schwedischen kenkriege (1683–1689), der englisch-niederländische Krieg
Königin Christine an den Königshof in Stockholm. Das Pro- (1665–1667) boten nicht gerade ideale Voraussetzungen für
jekt, in Stockholm eine Akademie der Wissenschaften zu die Weiterentwicklung der Mathematik und der Naturwissen-
gründen, konnte er nicht mehr realisieren, da er bereits am schaften. Daher ist es umso erstaunlicher, dass im Zeitraum
11. Februar 1650 verstarb. von 1620/30 bis etwa 1730/40 eine quasi revolutionäre Ent-
wicklung und ein Umschwung stattfand, der sowohl die Ziele
Der mehr als Maler denn als Mathematiker bekannte Albrecht als auch die Methoden betraf.
Dürer (1471–1528) verfasste ein Lehrbuch über die Perspek-
Man kann René Descartes und Pierre de Fermat schon zu die-
tive, in der sich viele Elemente der „projektiven Geometrie“
ser Epoche rechnen, die Hauptleistung war aber zweifelsohne
finden.
die Entstehung und der Ausbau des „Calculus“, des forma-
Galileo Galilei (1564–1642) begründete die Experimental- len Apparats der Differenzial- und Integralrechnung („Infi-
physik, indem er Naturphänomene mit mathematischen For- nitesimalrechnung“). Aufbauend auf schon auf Archimedes
1.4 Eine kurze Geschichte der Mathematik 21
zurückgehende Überlegungen und auf Vorarbeiten von Kep- Lösung einer Differenzialgleichung. Sein berühmtes, für die
ler und Cavalieri (≈ 1598–1647), John Wallis (1616–1703) Physik grundlegendes, Werk „Philosophiae Naturalis Prin-
und Isaac Barrow (1630–1677) schufen unabhängig von- cipia Mathematica“ (London 1687) macht jedoch von der
einander Isaac Newton (1643–1727) und Gottfried Wilhelm Fluenten- und Fluxionsrechnung keinen Gebrauch.
Leibniz (1646–1716) den „Calculus“. Mit der Beherrschung
Um 1685 kam es zwischen Newton und Leibniz zu einem
von Grenzprozessen konnte man eine große Fülle mathe-
heftigen Prioritätenstreit um die Entdeckung der Infinitesi-
matischer, naturwissenschaftlicher und praktischer Probleme
malrechnung. Leibniz kam auf die Integralrechnung bei der
lösen, manchmal auch nur mit Mühen.
Berechnung von Flächeninhalten von ebenen Figuren und
auf die Differenzialrechnung durch das Problem, Tangen-
ten
an gegebene Kurven zu berechnen. Das Integralsymbol
„ “ stammt von Leibniz, es erinnert an ein Summenzeichen.
Experten gehen heute davon aus, dass Newton und Leib-
niz die Infinitesimalrechnung unabhängig voneinander ent-
wickelt haben. Als Aufseher und Direktor der Münze in Lon-
don wurde Newton zum Schrecken der Geldfälscher. 1703
wurde Newton Präsident der berühmten Royal Society. Die-
ses Amt hatte er bis zu seinem Tod im Jahr 1727 inne.
Leibniz gilt als einer der letzten Universalgelehrten. Er war
nicht nur Mathematiker, sondern auch Philosoph, Theologe,
Biologe, Physiker und Techniker. Sein Wahlspruch für die
Mathematik war „Theoria cum Praxi“, sein Wahlspruch für
die Philosophie „Nihil sine Ratione“. Seine Vielseitigkeit be-
Abbildung 1.19 Isaac Newton (1643–1727).
wies er mit der Entwicklung einer Rechenmaschine. Er war
ein Verfechter des Dualsystems (Zahldarstellung mit der Ba-
sis 2) und er konstruierte wichtige produktionsverbessernde
Maschinen für den Bergbau. Auf das Betreiben von G. W.
Leibniz wurde 1700 die „Berliner Societät der Wissenschaf-
ten“ gegründet, aus der die Berliner Akademie der Wis-
senschaften hervorgegangen ist. Seine Beiträge zur Deter-
minantentheorie lernen Studierende der Mathematik im er-
sten Semester kennen (Leibniz’sche Determinantenformel).
Durch persönlichen Kontakt mit dem russischen Zaren Peter I
(1672–1725) hatte Leibniz auch einen wesentlichen Einfluss
auf die Gründung der Akademie der Wissenschaften in St.
Petersburg (1724).
Zum weiteren Ausbau des Calculus trugen die Mitglieder
der Baseler Mathematikerfamilie Bernoulli wesentlich bei,
insbesondere die Brüder Jakob (1655–1705) und Johann
Abbildung 1.20 Gottfried Wilhelm Leibniz (1646–1716).
(1667–1748). Beide lieferten auch wichtige Beiträge zur
Wahrscheinlichkeitsrechnung. Johann Bernoulli war außer-
1665/1666 war der Süden Englands von einer Pestepidemie
dem Lehrer von Leonard Euler (1707–1783), der alle über-
betroffen, allein in London starben fast 50 000 Menschen.
ragende Mathematiker der Blütezeit der Aufklärung. Mit
Newton verbrachte diese Zeit in seinem Geburtsort Woolst-
20 Jahren verließ er seine Heimatstadt Basel, um einen Ruf
horpe nahe der Stadt Grantham an der Ostküste Mitteleng-
an die Akademie in St. Petersburg anzunehmen. Euler war
lands. Während dieser Zeit entdeckte er die binomische
ungemein produktiv, im Jahr soll er etwa 800 Seiten ge-
Reihe, die Grundideen der Differenzialrechnung, das 1/r 2 -
schrieben haben. Von 1741–1764 wirkte Euler an der Ber-
Gesetz der Gravitation und die Spektralzerlegung des Lichts.
liner Akademie, kehrte aber wegen Differenzen mit Fried-
Unter dem Titel „Methodus Fluxionum et Serierum Infinita-
rich II (dem Großen) wieder nach St. Petersburg zurück.
rum“ veröffentlichte er 1671 eine schon relativ ausgefeilte
Durch eine Augenkrankheit erblindete er vollkommen, dik-
Darstellung der Differenzial- und Integralrechnung, in der
tierte aber dann seine Arbeiten einem Schreiber.
er erkannt hat, dass Differenziation und Integration Um-
kehroperationen voneinander sind. Fluenten sind physika- Euler war äußerst vielseitig, er vertiefte fast alle Zweige der
lische Größen, die von der Zeit abhängen, Fluxionen ihre Mathematik, insbesondere aber die Analysis und Zahlen-
Geschwindigkeiten. Die Fluxion einer Fluxion ist also die theorie. Die Basis e ≈ 2.718 281 828 (Euler’sche Zahl) der
Beschleunigung. Das Problem, eine Fluente zu einer gege- natürlichen Logarithmen berechnete er schon bis auf 23 Stel-
ben Fluxion zu bestimmen entspricht der Integration bzw. der len. Er propagierte das Rechnen mit komplexen Zahlen (wenn
22 1 Mathematik – eine Wissenschaft für sich
und verbesserte die Konstruktion von Fernrohren. Auf seinen tionen“ genannt, später wurde die Bezeichnung umgedreht.
bei der Vermessung des Königreichs Hannover entstanden Die Reihendarstellung für die Weierstraß’sche ℘-Funktion
geometrische Überlegungen entwickelte er die Anfänge der findet sich schon 1847 bei G. Eisenstein (1823–1852).
Differenzialgeometrie. C. F. Gauß hat mit seinen „Disquisi-
Die weitere Entwicklung der komplexen Analysis im
tiones Arithmeticae“ die Mathematik des 19. Jahrhunderts,
19. Jahrhundert steht in engem Zusammenhang mit Proble-
insbesondere die Zahlentheorie, in der man auch unentwegt
men der Zahlentheorie. Die von A. M. Legendre und C. F.
versuchte, die Fermat’sche Vermutung aus dem Jahr 1637 zu
Gauß vermutete Formel
beweisen, wesentlich beeinflusst.
π(n)
War bis dato das Lösen von Gleichungen der Hauptgegen- lim n =1
n→∞
stand der Algebra, so entwickelte sich die Algebra zu einem log n
Gebiet, in welchem algebraische Strukturen wie Gruppen,
für die Anzahl π(n) der Primzahlen unterhalb n wurde 1896
Ringe, Körper, Vektorräume und Moduln im Mittelpunkt des
von dem französischen Mathematiker Jacques Hadamard
Interesses standen.
(1865–1963) und dem belgischen Mathematiker Charles De
Wir haben schon darauf hingewiesen, dass Euklids Paralle- la Vallée Poussin (1866–1962) unabhängig voneinander be-
lenaxiom (das fünfte Postulat) nicht aus den vier anderen wiesen. Bernhard Riemann war in seiner berühmten Arbeit
Axiomen abgeleitet werden kann. Der russische Mathemati- „Über die Anzahl der Primzahlen unter einer gegebenen Grö-
ker Nikolai Ivanowitsch Lobatschewski (1793–1856) und der ße“ nahe an einem Beweis. Die von Riemann aufgestellte Ver-
ungarische Mathematiker János Bolyai (1802–1860) stellten mutung, dass die Nullstellen der nach ihm benannten Zeta-
um 1830 Modelle für Geometrien vor, die nicht das fünfte Funktion in der rechten Halbebene alle den Realteil 12 haben,
Postulat erfüllten. Gauß war ein solches Modell vermutlich ist bis heute unbewiesen (siehe auch Millenniumprobleme).
auch geläufig. Bernhard Riemann (1826–1866) entwickelte
Richard Dedekind (1831–1916) war bei der Vorbereitung
die Ideen – aufbauend auf den Ideen von Gauß – weiter und
einer Vorlesung über Infinitesimalrechnung im Herbst 1858
begründete nach der Pionierarbeit von Gauß damit die Diffe-
am damaligen eidgenössischen Polytechnikum Zürich (heute
renzialgeometrie. Felix Klein (1849–1925) verwendete 1872
ETH) aufgefallen, dass eigentlich noch niemand die Existenz
den Gruppenbegriff zur Klassifikation der verschiedenen Ar-
der reellen Zahlen bewiesen hatte. Mit seinen beiden Schrif-
ten von Geometrien. David Hilbert (1862–1943) begründete
ten „Stetigkeit und irrationale Zahlen“ (1872) und „Was sind
die euklidische Geometrie in seinem Buch „Grundlagen der
und was sollen die Zahlen“ (1887) leistete er wesentliche
Geometrie“ (1899) axiomatisch.
Beiträge zur logisch arithmetischen Konstruktion der reellen
Das 19. Jahrhundert war gekennzeichnet durch die Exak- Zahlen (ohne Gebrauch der Intuition). Fast zeitgleich mit De-
tifizierung der Begriffe der Analysis. Bernhard Bolzano dekind lieferten K. Weierstraß, Charles Méray (1835–1911)
(1781–1848) formulierte als erster das heute als Cauchy- und Georg Cantor (1845–1918) entsprechende Konstruktio-
Kriterium bekannte Konvergenzkriterium für die Konvergenz nen der reellen Zahlen. Cantors Arbeit zur Theorie von un-
von (Funktionen-)Folgen. Er formulierte 1817 den nach ihm endlichen Mengen um die Wende vom 19. zum 20. Jahrhun-
benannten Nullstellensatz für stetige Funktionen und gab als dert war auch ein wichtiger Meilenstein für die Analysis.
erster eine auf ganz R definierte stetige Funktion an, die in
Kennzeichnend für die Mathematik des 19. Jahrhunderts war
keinem Punkt differenzierbar ist. Dagegen glaubte der be-
vielleicht auch ihre Anwendungsbezogenheit. Die Theorie
kanntere französische Mathematiker Augustin-Louis Cauchy
der Wärmeausbreitung in Festkörpern wurde von Joseph
(1789–1857) noch, dass jede stetige Funktion auf R auch
Fourier (1768–1830) in seinem „Théorie de la chaleur“ 1807
differenzierbar ist. Seine formalen Definitionen zum Konver-
entwickelt. Fourier schuf die Grundlage der Theorie, die man
genzbegriff für Folgen und Reihen und zum Stetigkeitsbegriff
heute „Fourieranalyse“ nennt. Im Zusammenhang mit Ar-
finden sich in seinem berühmten „Cours d’Analyse“ aus dem
beiten in der Hydrodynamik und Elektrodynamik bewies der
Collège de France um 1820. Ein expliziter ε-δ-Beweis findet
englische Mathematiker und Physiker George Gabriel Stokes
sich lediglich beim Beweis des Mittelwertsatzes der Diffe-
(1819–1903) um 1850 den berühmten Stokes’schen Integral-
renzialrechnung. Cauchy ist jedoch ein Wegbereiter für die
satz.
neue Strenge in der Analysis. Eine exakte arithmetische Be-
gründung für das Rechnen mit Grenzwerten ist der Verdienst Eine Fülle neuer Ideen und mathematischer Methoden ent-
von Karl Weierstraß (1815–1897). wickelte Laplace um 1812. Fehlertheorie, statistische Mecha-
nik und Versicherungsmathematik sind Weiterentwicklungen
Cauchy und Weierstraß gelten als Begründer der „komplexen
der ursprünglich nur auf die Analyse von Glücksspielen kon-
Analysis“, die man im deutschen Sprachraum auch „Funk-
zentrierten Überlegungen von Laplace.
tionentheorie“ nennt. Zu deren Stammvätern ist auch Bern-
hard Riemann (1826–1866) zu zählen, der im Wettstreit mit Der norwegische Mathematiker Sophus Lie (1842–1899) be-
Carl Gustav Jacob Jacobi (1804–1851) auch die Theorie der gründete in seinen Arbeiten über Differenzialgleichungen die
elliptischen Integrale entwickelt hat. Die Umkehrung der el- heute nach ihm benannte Theorie der Lie-Gruppen, die z. B.
liptischen Integrale sind elliptische Funktionen. Historisch bei der Klassifikation von Elementarteilchen von Bedeutung
hat man zuerst die elliptischen Integrale „elliptische Funk- sind.
24 1 Mathematik – eine Wissenschaft für sich
Die Mathematik im 20. Jahrhundert ganz Deutschland wurden Mathematiker und Mathematike-
rinnen mit jüdischen Wurzeln entlassen oder zur vorzeiti-
Auf dem internationalen Mathematikerkongress in Paris im gen Emeritierung gezwungen. Besonders schwer traf es die
Jahr 1900 stellte David Hilbert seine 23 Probleme vor, wel- Universität Göttingen, an der auch David Hilbert seit 1895
che die Entwicklung der Mathematik im 20. Jahrhundert we- ordentlicher Professor war. Emmy Noether, Emil Artin, Her-
sentlich beeinflussen sollten. Nicht alle diese Probleme sind mann Weil, Richard Courant, Paul Bemays, Carl Ludwig Sie-
bis heute gelöst. Der entsprechende Wikipedia-Artikel gibt gel emigrierten ins Ausland, meist in die USA. Der Zahlen-
einen guten Überblick. Ostwalds Klassiker der exakten Wis- theoretiker Edmund Landau wurde seiner Ämter enthoben.
senschaften Band 252 „Die Hilbert’schen Probleme“ ist eine
hervorragende Referenz. Hilberts Traum, die gesamte Mathematik auf logischen Axio-
men aufzubauen, wurde endgültig durch den Unvollständig-
Wir gehen auf einige dieser Probleme etwas näher ein: Die keitssatz von Gödel (1931) und die Ergebnisse von Paul Co-
Fragestellung im 1. Hilbert’schen Problem lautet: Gibt es eine hen (1960/61) zerstört. Sowohl die Kontinuumshypothese als
Teilmenge von R, die überabzählbar ist und deren Mächtig- auch das sogenannte Auswahlaxiom, das in viele mathema-
keit (Kardinalitätszahl) echt kleiner ist als die der reellen tische Konstruktionen und Ergebnisse einfließt, können we-
Zahlen? Dass es eine solche Teilmenge nicht gibt, bezeich- der aus den Axiomen der von S. Zermelo und Paul Fraenkel
net man als Kontinuumshypothese (vergl. die Ausführungen entwickelten Mengenlehre bewiesen noch widerlegt werden.
in Kap. 4). Kurt Gödel hat 1938 gezeigt, dass die Verneinung Das ZF-System (ZF steht für Zermelo-Fraenkel) ist unvoll-
der Kontinuumshypothese nicht aus den üblichen Axiomen ständig und wird durch Hinzunahme des Auswahlaxioms
der Mengenlehre, dem ZFC-Axiomensystem beweisbar ist. zum ZFC-System (C für Axiom of Choice) ergänzt. Hilbert
1963/64 bewies P. Cohen (1934–2007), dass auch die Konti- beschäftigte sich von den philosophischen Grundlagen der
nuumshypothese selbst nicht aus dem ZFC-Axiomensystem Mathematik mit fast allen Fragen der Mathematik und ihren
beweisbar ist. Das Problem hängt unmittelbar zusammen mit Anwendungen, insbesondere in der Physik. Der Begriff des
dem 2. Hilbert’schen Problem: Sind die Axiome der Arith- „Hilbert-Raums“ ist für die Mathematik und ihre Anwendun-
metik widerspruchsfrei? gen von fundamentaler Bedeutung und sein Name sozusagen
Das 6. Problem stellt die Frage: Wie kann die Physik axio- verewigt.
matisiert werden? Gewisse Teilgebiete der Physik, z. B. die
Obwohl der zweite Weltkrieg (1939–1945) unendliches Leid
Quantenmechanik können axiomatisch behandelt werden,
über viele Völker der Welt gebracht hat, trug er auch zum
eine allgemeine axiomatische Darstellung der gesamten Phy-
Fortschritt der Wissenschaften bei. Alan Turing (1912–1954)
sik ist aber in weiter Ferne.
konnte mithilfe der von ihm entwickelten Automaten- und
Das 7. Hilbert’sche Problem stellt die Frage: Ist α β immer Algorithmentheorie universell einsetzbare Automaten (heute
transzendent, wenn α algebraisch (α = 0, α = 1) und β Turingmaschinen) entwickeln. Mit ihrer Hilfe gelang es
irrational und algebraisch ist? Alexander Gelfond (1934) und ihm und anderen Wissenschaftlern, den Verschlüsselungs-
Theodor Schneider
√ (1935 ) beantworteten die Frage mit „ja“, code der deutschen Verschlüsselungsmaschine Enigma ab
so ist z. B. 2 2 eine transzendente Zahl. 1943 zu knacken, der insbesondere auch in der Kommuni-
kation mit U-Booten eingesetzt wurde. Manche Historiker
Das 8. Hilbert’sche Problem enthält die von Bernhard Rie- sind der Meinung, dass die Entschlüsselung des Enigma-
mann (1826–1866) gestellte Frage, ob die Nullstellen der Codes ein wichtigen Beitrag zur Beendigung des zweiten
Riemann’schen ζ -Funktion in der Halbebene Re (s) > 0 alle Weltkriegs war. Nachdem Konrad Zuse (1910–1995) 1936
den Realteil 21 haben. Bekannte Nullstellen in dieser Halb- den ersten mechanischen Computer gebaut hatte, wurden
ebene haben den Realteil 12 . Mit Computereinsatz hat man im Zusammenhang mit dem Bau der ersten Atombombe
auch Zahlen 21 +it, t ∈ R, t < 1012 , getestet und nachgewie- (sog. „Manhattan-Projekt“) auch erste leistungsfähige elek-
sen, dass die Riemann’sche Vermutung für diese Zahlen rich- tronische Röhrenmaschinen entwickelt, mit denen die am
tig ist. Ein allgemeiner Beweis steht aber nach wie vor aus. Manhattan-Projekt beteiligten Mathematiker umfangreiche
Von den 23 Hilbert’schen Problemen hat die Clay-Foundation Simulationsrechnungen durchführen konnten.
die „Riemann’sche Vermutung“ in die sieben Millennium-
Probleme aufgenommen (siehe 21. Jahrhundert). Große Fortschritte während des 20. Jahrhunderts konnten
die klassischen mathematischen Gebiete Algebra, Geometrie
Die Wahrscheinlichkeitstheorie wurde 1933 von dem rus-
und Analysis aufweisen, die sich in viele, manchmal sehr ab-
sischen Mathematiker A. N. Kolmogorov axiomatisiert, was
strakte Richtungen weiterentwickelten. Die theoretische Ma-
bereits von Hilbert angemahnt worden war. Die Modellierung
thematik erhielt u. a. wesentliche Impulse durch die Entwick-
des Zufalls nimmt heute insbesondere in den Anwendungen
lung der Garbentheorie, der Kategorien und Funktoren, der
ein bedeutende Rolle ein.
Theorie der Faserbündel, der homologischen Algebra und der
War bis 1933 die Universität Göttingen ein Weltzentrum der Kohomologietheorie. Die von John von Neumann und Os-
Mathematik – vielleicht sogar das Weltzentrum der Mathe- car Morgenstern entwickelte Spieltheorie fand wichtige An-
matik – so änderte sich die Situation nach der Machtergrei- wendungen, z. B. in der Ökonomie. Die Optimierungstheo-
fung der Nationalsozialisten im Jahr 1933 schlagartig. In rie wurde wesentlich weiterentwickelt. Große Fortschritte
1.4 Eine kurze Geschichte der Mathematik 25
gab es auf dem Gebiet der partiellen Differenzialgleichun- Primzahlen – früher für viele ein exotisches Gebiet der theo-
gen und dynamischen Systeme. Wichtige Fortschritte gab es retischen Mathematik – gewannen an Bedeutung für die Ge-
auch in den Bereichen Wahrscheinlichkeitstheorie und Sta- winnung optimaler Codes und für die Kryptographie.
tistik. Immer wieder fand man auch unbekannte Zusammen-
hänge zwischen abstrakten mathematischen Theorien und
physikalischen Anwendungen, z. B. der abstrakt entwickel-
ten Theorie der Topologie vierdimensionaler Mannigfaltig-
keiten und der Theorie der Elementarteilchen (Quarks, Eich-
Theorien, Yang-Mills-Gleichung). Durch diese Zusammen-
hänge wurde ab 1980 ein reger Austausch zwischen Mathe-
matik und theoretischer Physik eingeleitet.
wohl die Annahme der Fields-Medaille als auch das Millen- wirtschaft, Logistik, Versicherungswirtschaft, Banken und
niumpreisgeld lehnte er allerdings ab. Börsen, Finanzdienstleistungsindustrie). Ungeheure Daten-
mengen können nur mit Computerhilfe analysiert werden. In
Bereits im April 2002 wurde von dem rumänischen Mathe-
dem im Jahr 2008, dem Jahr der Mathematik in Deutsch-
matiker Preda Mihailescu (geb. 1955) die sogenannte Cata-
land, erschienenen Band Mathematik – Motor der Wirtschaft
lan’sche Vermutung bewiesen, die besagt: Die einzige ganz-
(Springer-Verlag) schreibt die Bundesministerin für Bil-
zahlige Lösung der Gleichung x p −y q = 1 mit x, p, y, q > 1
dung und Forschung, Annette Schavan, in einem Grußwort
lautet x = 3, p = 2, y = 2, q = 3.
u. a.:
Zahlreiche weitere Vermutungen, die zum Teil auch leicht
zu verstehen sind, harren noch der Lösung, so z. B. die Gold- „Hightech gibt es nicht ohne Mathematik. ,Mathematik. Al-
bach’sche Vermutung (Goldbach schrieb 1742 in einem Brief les was zählt‘ ist unser Leitsatz für das Wissenschaftsjahr
an Euler: Jede gerade natürliche Zahl n ≥ 4 lässt sich als 2008, das ,Jahr der Mathematik‘. Er unterstreicht, wie wich-
Summe von zwei Primzahlen darstellen). 1985 formulierten tig die Mathematik im Leben ist und wie sie unseren Alltag
Masser und Oesterlé die abc-Vermutung: Sind a, b, c paar- durchdringt.“
weise teilerfremde natürliche Zahlen mit a + b = c (daher Das Jahr der Mathematik hat sicher dazu beigetragen, die
der Name!) und ist rad(abc) < c1−ε für jedes ε > 0, dann Diskrepanz zwischen dem Ansehen der Mathematik in der
gibt es nur endlich viele
solcher Tupel (a, b, c). Dabei ist Öffentlichkeit und ihrer wahren Bedeutung zu verkleinern.
für n ∈ N rad(n) := p | n p das Produkt aller Primzahlen, Vielfach ist einer breiten Öffentlichkeit nicht bewusst, wie
die n teilen. So ist z. B. rad(10) = 2 · 5 = 10, rad(18) = 6 viel Mathematik in der Verkehrsplanung (etwa bei der Deut-
und rad(65 536) = 2. Im August 2012 veröffentlichte Shini- schen Bahn AG), in einem Handy oder Navigationsgerät, in
chi Mochizuki, der 1992 bei Gerd Faltings promoviert hatte, einem Computertomographen, einer Geldkarte oder einem
einen möglichen Beweis der abc-Vermutung, dessen Kor- Scanner an der Kasse eines Supermarkts steckt.
rektheit bis zur Drucklegung dieses Werks noch nicht ab-
schließend geprüft war. Sind die abc-Vermutung und gewisse Auch die Mathematik des 21. Jahrhunderts wird gekenn-
Verallgemeinerungen auf Polynomringe richtig, ergeben sich zeichnet sein durch die Pole „Theorie“ und „Anwendungen“,
wesentlich einfachere Beweise z. B. für die Mordell’sche Ver- gemäß dem Leibniz’schen Wahlspruch „Theoria cum praxi“,
mutung oder Sätze von C. L. Siegel und Th. Schneider über und der Feststellung von C. F. Gauß: „Die Theorie zieht die
diophantische Gleichungen. Der kanadische Mathematiker Praxis an wie der Magnet das Eisen“. Es gibt zahlreiche ma-
Robert P. Langlands entwickelte bereits 1966/67 eine Reihe thematische Herausforderungen sowohl auf theoretischer als
von Vermutungen über tiefliegende Zusammenhänge mathe- auch praktisch anwendbarer Ebene. Die Mathematik ist we-
matischer Theorien, die als „Langlands-Programm“ bezeich- gen ihrer universellen Anwendbarkeit zu einer Schlüsseltech-
net werden und an deren Lösung weltweit gearbeitet wird und nologie geworden. Mit einem Zitat von Eberhard Zeidler zur
das durch die Erfolge von Andrew Wiles und Richard Taylor Bedeutung der Mathematik sollen die Schnappschüsse aus
einen gewaltigen Schub erhalten hat. der Geschichte der Mathematik beendet werden:
Waren bis nicht vor allzu langer Zeit die Naturwissenschaf- „Die Mathematik ist ein wundervolles zusätzliches Erkennt-
ten, die Technik und die Wirtschaftswissenschaften die klas- nisorgan des Menschen, ein geistiges Auge, das ihn etwa
sischen Anwendungsgebiete der Mathematik, so haben in in der modernen Elementarteilchenphysik, der Kosmologie
der Zwischenzeit mathematische Methoden in den Lebens- und der Hochtechnologie in Bereiche vorstoßen lässt, die
wissenschaften (Biologie, Medizin), Sozialwissenschaften ohne Mathematik nicht zu verstehen sind, weil sie von un-
und auch Geisteswissenschaften Eingang gefunden. Auch serer Erfahrungswelt extrem weit entfernt sind.“ (Eberhard
die Industrie bedient sich zunehmend mathematischer Me- Zeidler in Wußing, 6000 Jahre Mathematik, Springer-Verlag
thoden (z. B. Verkehrsplanung, Energiewirtschaft, Material- 2009).
Logik, Mengen,
Abbildungen – die 2
Sprache der Mathematik
Wie führt man einen
Widerspruchsbeweis?
Wie lassen sich Mengen
beschreiben?
Was ist eine Abbildung?
Wodurch ist eine
Äquivalenzrelation
gekennzeichnet?
Mathematik kann man als eine Sprache auffassen. Das Voka- Aussagen lassen sich mittels Junktoren
bular basiert auf der Mengenlehre, und die Logik übernimmt verbinden
die Rolle der Grammatik. Die Begriffe und Symbole der Men-
genlehre und der Logik werden dabei als eine Art Stenografie Meist ist man nicht nur an einzelnen Aussagen interessiert,
verwendet, um Definitionen, Sätze und Beweise prägnant und sondern will diese verknüpfen. Das geschieht wie in der All-
klar formulieren zu können. tagssprache mit Bindewörtern wie nicht, und oder oder. In
der formalen Logik nennt man diese Bindewörter Junktoren.
In diesem einführenden Kapitel stellen wir die für uns wesent-
lichen Begriffe und Symbole der Logik und Mengenlehre zusam- Wir bezeichnen im Folgenden Aussagen mit einzelnen Groß-
men. Da die präzise Einführung dieser Begriffe und Symbole buchstaben, etwa A, B, C. Dann notieren wir die Negation
für die Analysis und lineare Algebra, also im Wesentlichen für (NICHT-Verknüpfung) einer Aussage A durch ¬A. In der
das erste Studienjahr, nebensächlich ist, können wir auf einen Literatur finden sich auch die Notationen ∼A oder A für die
axiomatischen Aufbau verzichten. Wir benutzen einen intuitiven Negation.
Zugang zur Logik und Mengenlehre. Dieses Vorgehen, das auch
Wie man es erwartet, ist die Negation so definiert, dass
bei Anfängervorlesungen in der Mathematik üblich ist, hat sich
¬A dann falsch ist, wenn A wahr ist und umgekehrt. Mit-
bewährt. Man kann somit nach relativ kurzer Einführung schnell
hilfe einer Wahrheitstafel lassen sich derartige Sachverhalte
zu den Inhalten der Analysis und linearen Algebra kommen. Im
übersichtlich darstellen, indem man alle möglichen Kombi-
Laufe seines Studiums aber sollte sich jeder Mathematikstudent
nationen auflistet. WAHR und FALSCH werden wir dabei
mit einigen wenigen Inhalten der axiomatischen Mengenlehre
durch w und f abkürzen. Für die Negation erhalten wir
bzw. der mathematischen Logik vertraut machen.
A ¬A
Zur Mengenlehre gehören Abbildungen zwischen Mengen und
w f
Relationen auf Mengen. Bei der Einführung dieser Begriffe
f w
legen wir ein Augenmerk auf präzise Anwendungen der Be-
griffe und Symbole der Logik und der bis dahin entwickelten
Mengenlehre. Das erscheint einem Neuling in der Mathematik Beispiel Für eine reelle Zahl x ist etwa die Negation der
schnell pedantisch oder unnötig abstrakt. Tatsächlich aber ist Aussage „x < 5“ durch die Aussage „x ≥ 5“ gegeben. Die
das korrekte und genaue Anwenden des Formalismus eine un- Negation ist durch „x ist nicht kleiner 5“ gegeben und da es
abdingbare Notwendigkeit, um den Weg in die Gedankenwelt für reelle Zahlen drei Möglichkeiten gibt, kleiner, gleich oder
der Mathematik zu meistern. größer, bedeutet die Verneinung der Aussage „x ist größer
oder gleich 5“.
?
2.1 Junktoren und Quantoren Geben Sie die Negationen der folgenden Aussagen an:
Die Sonne scheint.
Schwäne sind nicht schwarz.
In der Mathematik geht es darum, Aussagen auf ihren Wahr- 17
Es gibt eine natürliche Zahl, die größer als 8 und kleiner
heitsgehalt hin zu überprüfen. Eine Aussage fassen wir dabei
als 23
8 ist.
als einen feststellenden Satz auf, dem genau einer der Wahr-
heitswerte WAHR oder FALSCH zugeordnet werden kann.
Eine wahre Aussage wird in der Mathematik oft als Satz be- Neben der Negation haben wir noch die Konjunktion zweier
zeichnet. Den Nachweis der Wahrheit dieser Aussage nennt Aussagen, die UND-Verknüpfung, die durch das Symbol ∧
man einen Beweis des Satzes. Bevor wir uns aber an das ausgedrückt wird, und die Disjunktion, die ODER-Verknüp-
Beweisen von Sätzen machen, befassen wir uns mit einigen fung, mit dem Zeichen ∨. Eine Wahrheitstafel liefert uns die
Grundbegriffen der Aussagenlogik, um Aussagen kurz und verschiedenen Werte für die beiden Verknüpfungen:
prägnant formulieren zu können. Dabei betreiben wir eine
naive Logik, in der wir unterschwellig die sprachliche Vor- A B A∧B A∨B
stellung benutzen. Die mathematische Logik funktioniert auf w w w w
einem anderen formalen Niveau. w f f w
f w f w
Junktoren und Quantoren sind sogenannte Operatoren der f f f f
Logik. Mit Junktoren werden Aussagen verbunden, Quanto-
ren hingegen binden Variable; dabei verstehen wir unter einer
Variablen vorläufig ein Zeichen, für das beliebige Ausdrücke Beachten Sie, dass in der Logik die Disjunktion stets ein ein-
einer bestimmten Art eingesetzt werden können. schließendes ODER bezeichnet, im Gegensatz zur Umgangs-
sprache, in der oft nur aus dem Zusammenhang deutlich wird,
ob es sich nicht vielleicht um ein „entweder . . . oder“ han-
delt. Formal können wir mit den gegebenen Symbolen auch
2.1 Junktoren und Quantoren 29
ein ausschließendes ODER beschreiben durch wenn A wahr und B falsch ist. Ist also A von vornherein
falsch, dann ist die Gesamtaussage A ⇒ B immer wahr.
(A ∨ B) ∧ ¬(A ∧ B) .
A B A⇒B
In der Literatur wird für diese Verknüpfung die Bezeichnung w w w
XOR mit der Notation AX B genutzt. w f f
f w w
Ein weiterer Junktor, der neben dem XOR genutzt wird, ist f f w
die Verknüpfung NAND, die als
Zusammenfassend erhalten wir stets, dass, wenn A wahr ist, Gehen wir direkt vor und zeigen unmittelbar, dass, wenn A
auch B wahr ist. Bei falschem A sind beide Wahrheitswerte gilt, auch folgt, dass B richtig ist, so nennen wir den Be-
für B möglich. Für die Implikation A ⇒ B erhalten wir somit weis einen direkten Beweis und können dieses Vorgehen lo-
in allen vier Fällen den Wahrheitswert wahr. Die Situation A gisch durch A ⇒ B angeben. Im Gegensatz dazu können
wahr und B falsch tritt nicht auf. Also ist die Aussage A ⇒ B wir auch indirekt argumentieren. Dann zeigen wir: Wenn
richtig. B nicht gilt, folgt, dass auch A nicht wahr ist. Diesen in-
direkten Beweis können wir formal durch die Implikation
Kommentar: In der Aussagenlogik gilt das Prinzip ex ¬B ⇒ ¬A beschreiben. Eine dritte Möglichkeit der Be-
falso quodlibet, – aus Falschem folgt Beliebiges. Mit einer weisführung, die uns häufiger begegnen wird, ist der Wider-
einzigen falschen Grundannahme kann man, zumindest prin- spruchsbeweis. Bei dieser Argumentation starten wir mit
zipiell, jede beliebige Aussage beweisen. der Annahme, dass A und ¬B wahr sind, und führen diese
Annahme auf einen Widerspruch. Mit den Notationen der
Aussagenlogik heißt dieses Vorgehen, dass wir zeigen, dass
Im Zusammenhang mit der Implikation werden zwei Sprech-
die Aussage ¬(A ∧ ¬B) wahr ist.
weise häufiger genutzt. Hat man eine wahre Implikation
A ⇒ B vorliegen, so sagt man, „A ist hinreichend für B“; Alle drei Varianten, einen Beweis zu führen, sind gleichwer-
denn, wenn die Implikation A ⇒ B wahr ist, so folgt aus tig. Dies machen wir uns anhand einer Wahrheitstafel klar
A wahr, dass auch B wahr ist. Oder die Situation wird aus
anderem Blickwinkel beschrieben durch „B ist notwendig A B (A ⇒ B) ¬B ⇒ ¬A ¬(A ∧ ¬B)
für A“, da wir die wahre Implikation auch so lesen können, w w w w w
dass A nur wahr sein kann, wenn B gilt. w f f f f
f w w w w
Im obigen Beispiel heißt dies, die Bedingung, dass m gerade f f w w w
ist, ist hinreichend dafür, dass m · n gerade ist. Oder eben
anders ausgedrückt, m kann nur gerade sein, wenn auch m · n Wir sehen, dass die Wahrheitswerte der drei Aussagen stets
gerade ist, d. h. die Bedingung „m · n gerade“ ist notwendig, gleich sind. Wir können uns also je nach Situation eine der
damit die Aussage „m ist gerade“ gilt. drei Varianten aussuchen, um einen Beweis zu führen. Im
Beispiel „Unter der Lupe“ auf Seite 31 sind die drei Varianten
der Beweisführung zu einer Aussage gegenübergestellt.
?
Für eine gegebene natürliche Zahl n stellen wir die drei Aus- Beispiel Wir beweisen ein berühmtes Ergebnis, das von
sagen Euklid stammt. Es handelt sich um die Aussage: „Es gibt
A: n ist durch 12 teilbar unendlich viele Primzahlen, also Zahlen, die nur durch eins
B: n ist durch 3 teilbar und sich selbst teilbar sind.“
C: 2 n ist durch 6 teilbar Den Beweis führen wir mittels Widerspruch. Man nimmt an,
gegenüber. Welche „notwendigen“ und „hinreichenden“ Be- es gäbe nur endlich viele Primzahlen. Dann muss es eine
ziehungen bestehen zwischen diesen Aussagen? größte geben, die wir mit p bezeichnen wollen. Nun bildet
man das Produkt aller Primzahlen von zwei bis p und addiert
eins:
Mit der Implikation haben wir die wichtigste logische Ver- r = 2 · 3 · 5 · 7 · 11 · . . . · p + 1
knüpfung von Aussagen für das Beweisen formuliert. Letzt- Diese neue Zahl r ist durch keine der Primzahlen von zwei
endlich sind mathematische Sätze, Lemmata und Folgerun- bis p teilbar, bei der Division bleibt immer ein Rest von eins.
gen meistens in Form von wahren Implikationen formuliert, Es gibt also nur zwei Möglichkeiten: Entweder es gibt eine
und Beweisen heißt, dass man begründet, warum eine Impli- Primzahl, die größer ist als p und durch die r teilbar ist, oder
kation wahr ist. Dabei zerfallen die Beweise üblicherweise in r ist selbst eine Primzahl. In beiden Fällen erhalten wir einen
einzelne kleine Beweisschritte, die für sich genommen wie- Widerspruch zur Annahme, dass p die größte Primzahl ist.
derum wahre Implikationen sein müssen.
Formal wurden in diesem Beweis die beiden Aussagen
A: p ist eine Primzahl
B: Es gibt eine Primzahl p̃ mit p̃ > p
Varianten der Beweisführung – direkt,
betrachtet und die Implikation A ⇒ B durch einen Wider-
indirekt und durch Widerspruch spruch gezeigt.
Damit wir uns die logische Struktur der Argumente deut- Wir können diese Ungleichung etwa mit a multiplizieren:
lich machen können, geben wir zunächst den beiden Teilen
der Behauptung Namen, a2 ≥ a b
in der Wahrheitstafel liefern dieselben Werte. Aussagen, die Die Gesamtaussage A ⇔ B ist wahr, wenn A und B ent-
diese Eigenschaft haben, nennt man äquivalent. Äquivalenz, weder beide wahr oder beide falsch sind. Ist eine der beiden
die GENAU-DANN-WENN-Verknüpfung von Aussagen, ist Aussagen wahr, die andere falsch, so ist auch A ⇔ B falsch.
der logische Gleichheitsbegriff für Aussagen. Sie wird durch
einen Doppelpfeil ⇔ zwischen den Aussagen symbolisiert
und wird gelesen als „es gilt genau dann A, wenn B gilt“.
32 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik
Die zugehörige Wahrheitstabelle lautet: dass ln x > 0 ist, und somit x > 1 gelten muss. Wir haben
C ⇒ A bewiesen und somit die Kette geschlossen. Wegen
A B A⇔B
dieser Beweisstruktur A ⇒ B ⇒ C ⇒ A spricht man auch
w w w von einem Ringschluss.
w f f
f w f
f f w
Symbole müssen inhaltlich gelesen werden
Manchmal wird für die Äquivalenz zweier Aussagen auch
die Formulierung verwendet, dass Aussage A „notwendig Zur Formulierung mathematischer Aussagen werden oft
und hinreichend“ für Aussage B ist. Symbole eingesetzt. Diese ermöglichen, sinnvoll eingesetzt,
Wir haben schon gesehen, dass Äquivalenz zwischen A und eine effiziente und übersichtliche Beschreibung von Sach-
B vorliegt, wenn der Spezialfall eintritt, dass die Implikation verhalten in der Mathematik. Man beachte aber auch, dass
zweier Aussagen in beide Richtungen wahr ist. Genauer be- ein Symbol je nach Zusammenhang für verschiedene Dinge
deutet die Beobachtung, dass die beiden Aussagen A ⇔ B stehen kann.
und ((A ⇒ B) ∧ (A ⇐ B)) äquivalent sind.
Beispiel Das simple Zeichen 0 kann z. B. – je nach Zu-
Im Sinne einer Beweisführung heißt dies, dass wir Äqui-
sammenhang – die Zahl Null, den Nullvektor, eine identisch
valenz von zwei Aussagen zeigen können, indem wir ge-
verschwindende Funktion, die Nullmatrix oder allgemein das
trennt beweisen, dass die beiden Implikationen gelten. Die-
neutrale Element einer additiv geschriebenen Gruppe bedeu-
sen Weg werden wir bei komplizierteren Äquivalenzbewei-
ten, und damit sind die Möglichkeiten bei Weitem noch nicht
sen sehr häufig nutzen. Der Vorteil dabei liegt darin, dass sich
erschöpft.
so unterschiedliche Beweistechniken nutzen lassen, etwa die
eine Richtung durch einen direkten Beweis und die andere In manchen Fällen kann hier eine zusätzliche Kennzeich-
Richtung durch einen Widerspruch. nung, etwa Fettdruck bei Vektoren, ein wenig helfen, aber
auch damit ist das Problem nicht aus der Welt geschafft. Man
? muss sich von Fall zu Fall überlegen, was die Null in diesem
Stellen Sie eine Wahrheitstafel auf, die die Äquivalenz von Zusammenhang bedeuten soll.
A ⇔ B und ((A ⇒ B) ∧ (A ⇐ B)) belegt.
Diese Verwendung von Symbolen steht nicht im Widerspruch
zur oben verlangten Eindeutigkeit der Begriffe. Aber es be-
Beispiel Wir machen uns das Vorgehen bei Äquivalenz- deutet eine gewisse Herausforderung sowohl für Autoren als
beweisen an einem einfachen Beispiel klar. Für eine reelle auch für Leser von mathematischen Texten. Es ist die Auf-
positive Zahl x betrachten wir drei Aussagen gabe desjenigen, der einen mathematischen Text verfasst,
sicherzustellen, dass bei jedem Symbol klar ist, was es in
A : x > 1, B : x 2 > 1, C : ln x 2 > 0 . diesem Kontext bedeutet. Umgekehrt bleibt es Aufgabe des
Lesers mathematischer Texte, nicht nur rein formal zu lesen,
Um die Äquivalenz von A und B zu zeigen, könnten wir fol- sondern die jeweilige Bedeutung der abkürzenden Notatio-
gendermaßen argumentieren. Zunächst zeigen wir A ⇒ B: nen im Hinterkopf zu haben.
Wenn x > 1 gilt, so folgt, indem wir die Ungleichung mit x
multiplizieren, die Ungleichungskette x 2 = x · x > x > 1.
Lesen von Symbolen
Also ergibt sich x 2 > 1. Andererseits gilt B ⇒ A. Dazu
wählen wir einen indirekten Beweis; denn aus der Annahme Bei jedem in einer mathematischen Aussage vorkom-
x ≤ 1 folgt x 2 ≤ x und somit x 2 < 1. Also gilt x 2 > 1 menden Symbol muss man sich bewusst machen, was
impliziert x > 1. dieses Symbol hier bedeutet, um die Aussage verstehen
und verwenden zu können.
Nun könnten wir die Äquivalenz zwischen A und C zeigen.
Damit hätten wir die Äquivalenz aller drei Aussagen bewie-
sen. Häufig bietet sich aber bei mehreren Äquivalenzen eine In diesem Sinne werden wir versuchen, in diesem Werk die
Kette von Implikationen an. Statt die Äquivalenzen separat Verwendung von Symbolen auf ein angenehmes Maß zu be-
zu beweisen, zeigen wir schränken. Zwei häufig in der Literatur genutzte, abkürzende
Notationen im Zusammenhang mit der Formulierung von
A ⇒ B, B⇒C und C ⇒ A. Aussagen müssen wir aber noch ansprechen.
Die erste dieser drei Implikationen haben wir oben gezeigt. Oft will man Aussagen über eine ganze Klasse von Objekten
Wir setzen nun voraus, dass wir bereits wissen, dass ln 1 = 0 machen, etwa „Zu jeder reellen Zahl x gibt es eine natürliche
ist und dass der natürliche Logarithmus monoton steigend Zahl n, die größer ist als x.“
ist. Damit folgt direkt B ⇒ C. Als Letztes ergibt sich aus
In den meisten Fällen werden wir dabei mit den beiden Phra-
0 < ln(x 2 ) = 2 ln x , sen „es gibt“ und „für alle“ völlig auskommen.
2.1 Junktoren und Quantoren 33
Beispiel Wir können die Aussage „Es gibt eine ganzzah- Diese Definition ist so nicht sinnvoll, sprich keine Definition:
lige Lösung der Gleichung x 4 −2x 3 −11x 2 +12x +36 = 0,“ Der zu definierende Begriff Menge wird durch einen unde-
dadurch beweisen, dass wir eine Lösung, nämlich x = 3, an- finierten Begriff Zusammenfassung erklärt. Und tatsächlich
geben. kamen kurz nach Cantors Definition einer Menge die ersten
Beispiele, die Cantors Mengenlehre zum Einsturz brachten
Genauso lässt sich die Aussage „Für alle reellen Zahlen (siehe Seite 35). Aber für unsere Zwecke innerhalb der li-
x gilt x 2 + 23 x + 17
32 ≥ 0, “ dadurch widerlegen, indem nearen Algebra und Analysis, also insbesondere im ersten
man x = − 43 einsetzt. Man erhält dann nämlich den Wert Studienjahr, ist der intuitive Begriff einer Menge im Sinne
2
3
− 23 · 34 + 17 1 einer Zusammenfassung von wohlunterschiedenen Objekten
4 32 = − 32 .
zu einem Ganzen völlig ausreichend. Eine präzise Definition
einer Menge ist möglich. Dies erfordert aber einen erhebli-
chen Aufwand, der üblicherweise in Spezialvorlesungen zur
2.2 Grundbegriffe aus der Mengenlehre betrieben wird. Wir verzichten auf eine sol-
che präzise Definition und beschreiben Mengen durch ihre
Mengenlehre Eigenschaften.
Eine eventuelle Grundmenge, aus der die Elemente x sind, so ist etwa Z einerseits Menge (von ganzen Zahlen), zugleich
wird oft vor dem Strich | festgehalten. aber auch Element (nämlich der Menge M).
Beweis: Die erste Inklusion begründen wir durch einen Achtung: Man beachte, dass die Schreibweise A ⊆ B
Widerspruchsbeweis. Dazu nehmen wir an, es existiert eine nicht falsch ist, falls sogar A B gilt.
Menge M, für die gilt ∅ ⊆ M. Hiernach gibt es in ∅ ein
Element, das nicht in M liegt. Dies ist ein Widerspruch. Somit Beispiel Es gelten die folgenden (echten) Inklusionen
stimmt die Annahme nicht: Es existiert keine Menge M mit bzw. Negationen von Inklusionen:
∅ ⊆ M, anders ausgedrückt: ∅ ⊆ M für jede Menge M. Die
{1} {1, 2} und {1} ⊆ {1, 2} und {1, 2} ⊆ {1, 2}.
Aussage M ⊆ M gilt aufgrund der Tatsache, dass für jedes
{1, 2} ⊆ {1, 3} und {1, 2} ⊆ {11, 4}.
Element m aus M offensichtlich m ∈ M gilt.
N N0 ⊆ Z Q ⊆ R C.
Kommentar: Unsere Definition der Gleichheit von Men- Gilt A ∩ B = ∅, so heißen A und B disjunkt oder auch
gen ist extensional: Zwei Mengen sind gleich, wenn sie die- elementfremd.
selben Elemente enthalten. Der juristische Gleichheitsbegriff
von Vereinen ist nicht extensional; zwei Vereine, die diesel- Für die Durchschnitts- und Vereinigungsbildung gelten Re-
ben Mitglieder haben, sind nicht unbedingt gleich. Der Sän- chengesetze, die von den ganzen Zahlen her bekannt sind.
gerverein Frohsinn und der Schützenverein Ballermann von
Entenhausen sind verschieden, obwohl sie dieselben Mitglie-
Rechengesetze für Durchschnitts- und Vereinigungs-
der haben, der eine Verein ist steuerbegünstigt, der andere
bildung
nicht. Dass zwei gleiche Objekte auch stets gleiche Eigen-
schaften besitzen, sagt das auf Leibniz zurückgehende Er- Für beliebige Mengen A, B und C gelten
setzbarkeitstheorem aus, dessen Gültigkeit wir axiomatisch die Assoziativgesetze:
voraussetzen.
A ∩ (B ∩ C) = (A ∩ B) ∩ C und
A ∪ (B ∪ C) = (A ∪ B) ∪ C ,
und Beweis: Wir zeigen das erste Gesetz, das zweite beweist
man analog. Weil die Komplemente stets bezüglich derselben
A ∩ B = {x | x ∈ A ∧ x ∈ B} großen Menge M gebildet werden, verwenden wir die Kurz-
= {x | x ∈ B ∧ x ∈ A} schreibweise Ac , B c für die Komplemente. Die Gleichheit
der Mengen (A ∪ B)c und Ac ∩ B c ergibt sich aus:
= B ∩ A.
x ∈ (A ∪ B)c ⇔ x ∈ M \ (A ∪ B)
Das Assoziativ- und Kommutativgesetz für die Vereinigung
begründet man analog. Zu begründen sind noch die Distri- ⇔ x ∈ (M \ A) ∩ (M \ B)
butivgesetze. Es gilt: ⇔ x ∈ Ac ∩ B c .
⇔x ∈A∩B ∨ x ∈A∩C
⇔ x ∈ (A ∩ B) ∪ (A ∩ C) . Die Inklusion A ⊆ B lässt sich mit den eingeführten Men-
genoperationen kennzeichnen, offenbar gelten
Somit sind die beiden Mengen A ∩ (B ∪ C) und (A ∩ B) ∪
(A ∩ C) gleich, beachte hierzu die Bemerkung nach der De- (i) mit der Vereinigung:
finition der Gleichheit von Mengen auf Seite 37. Um das
A⊆B ⇔A∪B =B,
zweite Distributivgesetz zu zeigen, geht man analog vor.
(ii) mit dem Durchschnitt:
Ist A eine Teilmenge von B, A ⊆ B, so heißt die Menge A ⊆ B ⇔ A ∩ B = A,
?
Begründen Sie kurz diese Äquivalenzen.
B A
y Die Menge
{(x, 0) ∈ R2 | x ∈ R}
ist die x-Achse und
b p {(0, y) ∈ R2 | y ∈ R}
a x
n
Ai = A1 × · · · × An
Abbildung 2.5 Der Punkt p = (a, b) hat die Koordinaten a und b.
i=1
= {(a1 , . . . , an ) | a1 ∈ A1 , . . . , an ∈ An }
D. h. zwei geordnete Paare sind genau dann gleich, wenn sie
komponentenweise gleich sind. das kartesische Produkt von A1 , . . . , An . Das Element
(a1 , . . . , an ) heißt ein (geordnetes) n-Tupel. Für zwei
Kommentar: Wir sind bei der Einführung der kartesischen n-Tupel (a1 , . . . , an ), (b1 , . . . , bn ) ∈ A1 × · · · × An gilt
Produkts einer intuitiven Auffassung gefolgt und haben eine
Definition des Begriffs geordnetes Paar vermieden. Sind A (a1 , . . . , an ) = (b1 , . . . , bn ) ⇔ a1 = b1 , . . . , an = bn .
und B Mengen, so ist nach K. Kuratowski das geordnete Paar
(a, b) für a ∈ A und b ∈ B (mengentheoretisch) definiert als Falls alle Mengen gleich einer Menge A sind, d. h. A = A1 =
· · · = An , so schreibt man kürzer An für A × · · · × A. Im
(a, b) = {{a}, {a, b}} . Fall A = R und n = 3 erhält man so den (dreidimensionalen)
Anschauungsraum
Es macht keine große Mühe nachzuweisen, dass die obige
Gleichheit für geordnete Paare tatsächlich gilt. R3 = {(a1 , a2 , a3 ) | a1 , a2 , a3 ∈ R} .
Beispiel
{a, b, c}×{1, 2} = {(a, 1), (a, 2), (b, 1)(b, 2), (c, 1), (c, 2)} Die Potenzmenge einer Menge M ist die
Menge aller Teilmengen von M
und
A × ∅ = ∅. Ist M eine Menge, so heißt
Die (Anschauungs-)Ebene kann man als R2 = R × R be-
schreiben. Sind A und B endliche Intervalle in R, so kann P (M) = {A | A ⊆ M}
man die Menge
die Potenzmenge von M. Ihre Elemente sind sämtliche Teil-
A × B = {(a, b) | a ∈ A , b ∈ B} mengen von M; man beachte, dass nach dem Satz auf Seite
35 für jede Menge M die leere Menge ∅ und M Elemente
als rechteckige Fläche zeichnen, siehe Abbildung 2.6. von P (M) sind. Für die Potenzmenge von M ist auch die
Schreibweise 2M gebräuchlich.
∅ ⊆ ∅ und ∅ ∈ {∅} .
Die Potenzmenge der Menge M = {1, 2} ist: Achtung: Einer vorgegebenen Menge ist zuweilen nicht
anzusehen, ob sie endlich ist oder nicht. Es ist bis heute nicht
P (M) = {∅, {1}, {2}, {1, 2}} . bekannt, ob die Mengen
M = {n ∈ N | 2n − 1 ist Primzahl} und
Und schließlich gilt für die Potenzmenge der Menge M =
{1, 2, 3}: F = {n ∈ N | 2n + 1 ist Primzahl}
endlich oder unendlich sind.
P (M) = {∅, {1}, {2}, {3}, {1, 2},
{2, 3}, {1, 3}, {1, 2, 3}} . Wir formulieren einige Aussagen für die Mächtigkeiten end-
licher Mengen:
Man sieht, dass die Anzahl der Elemente der Potenzmenge
Mächtigkeiten und Mengenoperationen
von M mit der Anzahl der Elemente von M zunimmt. Im
nächsten Abschnitt werden wir dies genauer erläutern. Tat- Für endliche Mengen A, B und C gilt:
sächlich enthält die Potenzmenge einer unendlichen Menge (i) |A ∪ B| + |A ∩ B| = |A| + |B|.
M auch mehr Elemente als die bereits (unendliche) Menge (ii) |A × B| = |A| · |B|.
M. Das ist zwar schwer vorstellbar, man kann es aber bewei- (iii) |P (A)| = 2|A| .
sen (siehe Aufgabe 2.18).
Wir verallgemeinern Durchschnitt und Vereinigung auf be- Beweis: (i) Es ist |A| + |B| die Gesamtzahl der Elemente
liebige nichtleere Teilmengen X von P (M). Für ∅ = X ⊆ aus A und B. Elemente, die sowohl in A als auch in B auf-
P (M), d. h. X ist eine nichtleere Menge von Teilmengen von tauchen – das sind genau die Elemente in A ∩ B – werden in
M, ist der Menge A ∪ B aber nur einmal gezählt. Daher ergibt sich
die Formel in (i).
X= A = {x ∈ M | ∀ A ∈ X : x ∈ A}
(ii) Die Anzahl der Möglichkeiten geordnete Paare (a, b) mit
A∈X
a ∈ A und b ∈ B zu bilden ist genau |A| · |B|.
der Durchschnitt von X und (iii) Gilt A = ∅, so erhalten wir P (A) = {∅} und somit die
gewünschte Formel
X= A = {x ∈ M | ∃ A ∈ X : x ∈ A}
A∈X
1 = |P (A)| = 2|A| = 20 .
Wir bestimmen nun im Fall A = ∅, etwa A = {a1 , . . . , an },
die Vereinigung von X. die Anzahl der Möglichkeiten, eine Teilmenge M von A zu
wählen. Das Element a1 kann in M liegen oder eben nicht, das
sind zwei Möglichkeiten, das Element a2 kann ebenfalls in M
Die Mächtigkeit einer Menge M ist die Anzahl liegen oder eben nicht, das sind erneut zwei Möglichkeiten.
der Elemente von M Das setzt man fort bis zum Element an und erhält genau
2n = 2|A| Möglichkeiten, eine Teilmenge M von A wählen
Eine präzise Definition einer endlichen Menge werden wir zu können.
2.3 Abbildungen
Kommentar: Neben |M| sind auch die Schreibweisen
Oftmals wird der Begriff Abbildung von einer Menge X in
card(M) und #M eine Menge Y als eine Vorschrift erklärt, die jedem x in X
genau ein y in Y zuordnet. Wir sind etwas genauer und ver-
für die Mächtigkeit von M üblich. meiden eine Definition durch einen nicht definierten Begriff.
2.3 Abbildungen 41
Eine Abbildung f ist durch Definitionsmenge, Wir werden für die Abbildung f = (X, Y, Gf ) meist deut-
Wertemenge und Graph gegeben licher
f : X → Y, x → f (x)
Man beachte, dass bei der folgenden Definition X = Y und schreiben oder
auch X = ∅ oder Y = ∅ zugelassen sind. X → Y,
f:
x → f (x).
Definition einer Abbildung Man beachte die beiden verschiedenen Pfeile. Jener ohne
Querstrich zeigt von der Definitionsmenge X zur Werte-
Gegeben seien zwei Mengen X und Y . Eine Abbildung
menge Y von f , jener mit Querstrich steht zwischen den
f von X in Y ist ein Tripel
Elementen der Paare (x, f (x)) ∈ Gf .
f = (X, Y, Gf ) , wobei Gf ⊆ X × Y
Achtung: In der Definition einer Abbildung wird verlangt,
die Eigenschaft hat, dass es zu jedem x ∈ X genau ein dass jedes x ∈ X genau ein Bild y ∈ Y besitzt. Es wird nicht
y ∈ Y gibt mit (x, y) ∈ Gf . verlangt, dass jedes y ∈ Y (genau) ein Urbild x ∈ X besitzt
Für das durch x eindeutig bestimmte Element y schrei- (vgl. auch Abbildung 2.7).
ben wir f (x). Anstelle von „f ist eine Abbildung von X in Y “ sagt man
Die Menge X heißt Definitionsmenge von f , Y heißt auch „f ist eine Abbildung von X nach Y “. Wir bevorzugen
Wertemenge von f und Gf der Graph von f . in, da dies deutlicher macht, dass nicht jedes Element in der
Wertemenge auch Bild eines Elements aus der Definitions-
menge zu sein braucht.
Bei der Definitionsmenge spricht man auch vom Definitions-
bereich, und anstelle von Wertemenge sagt man auch Wer-
tebereich. Der Graph Gf ⊆ X × Y ist meist nicht explizit Sind X und Y endliche Mengen, so kann man sich Abbildun-
angegeben, sondern durch die Vorschrift, wie man f (x) aus gen auch mithilfe von Pfeilen veranschaulichen (Abb. 2.7).
x gewinnt.
Wir haben Abbildungen als ein Tripel (X, Y, Gf ) von Men-
gen definiert, weil damit verständlich wird, dass zwei Abbil-
dungen nur dann gleich sind, wenn ihre Definitionsmengen,
ihre Wertemengen und ebenso ihre Graphen übereinstimmen.
So ist zum Beispiel für jede echte Teilmenge X X oder
Y Y
sind, sprechen wir gelegentlich kurz von der Funktion Wir dehnen diese Begriffe auf naheliegende Art und Weise
y = f (x) oder f (x) = x 2 . auf Teilmengen von X bzw. Y aus.
Es ist Ist f : X → Y eine Abbildung, so heißt für jede Teilmenge
P (N) → N0 ∪ {∞}, A ⊆ X und B ⊆ Y die Menge
g:
x → |x|
eine Abbildung von der Potenzmenge von N in N0 ∪ {∞}. f (A) = {f (a) | a ∈ A} ⊆ Y
Daher ist x eine Teilmenge von N und |x| ihre Mächtigkeit.
die Bildmenge von A unter f oder das Bild von A unter f
Eine Abbildung a von der Menge der natürlichen Zahlen und die Menge
N in R
N → R,
a: f −1 (B) = {x ∈ X | f (x) ∈ B} ⊆ X
n → a(n)
nennt man auch eine reelle Folge, anstelle von a(n) die Urbildmenge von B unter f oder das Urbild von B unter
schreibt man an und für die Abbildung a kurz (an )n∈N . f . Im Fall einer einelementigen Menge Y , d. h. Y = {b}, gilt
Folgen spielen eine zentrale Rolle in der Mathematik, wir
haben ihnen das Kapitel 8 gewidmet. f −1 ({b}) = {x ∈ A | f (x) = b} .
Etwas allgemeiner als reelle Folgen sind Familien. Sind I
und X beliebige Mengen, so nennt man jede Abbildung Beispiel Wir betrachten die Abbildung
I → X, P (N) → N0 ∪ {∞},
x: g:
i → xi = x(i) x → |x|.
eine Familie von Elementen aus X. Für die Abbildung x Die Bildmenge von A = {∅, {2}, {56}} ⊆ P (N) ist g(A) =
schreibt man kurz (xi )i∈I – die Definitionsmenge I der {0, 1}, und die Urbildmenge von {2} ⊆ N0 ∪ {∞} ist die
Familie x dient also als Indexmenge. Die Bilder der Indizes Menge aller zweielementigen Teilmengen von N.
i sind die Elemente xi ∈ X. Wir schreiben für die Familie
x auch kurz
Achtung: Bei einer einelementigen Menge B = {b} ⊆ Y
x = {(i, xi ) | i ∈ I } . schreibt man gerne einfacher f −1 (b) anstelle f −1 ({b}),
Im Fall I = N und X = R erhalten wir die reellen Fol-
gen zurück. Sind die Elemente xi von X wiederum Men- f −1 (b) = {x ∈ X | f (x) = b} ⊆ X .
gen, so nennt man die Familie (xi )i∈I auch ein Mengen-
Diese Schreibweise ist aber mit Vorsicht zu genießen. Man-
system.
che Abbildungen f haben eine sogenannte Umkehrabbil-
dung. Für diese Umkehrabbildung ist die Schreibweise f −1
? üblich. Es ist dann f −1 (y) das Bild von y unter der Abbil-
Für die Menge aller Abbildungen f von X in Y ist auch dung f −1 , insbesondere also ein Element der Bildmenge der
die Schreibweise Y X üblich. Zeigen Sie, dass im Falle Abbildung f −1 . Bei obiger Schreibweise ist aber f −1 (y) =
|X|, |Y | ∈ N gilt: f −1 ({y}) eine Teilmenge der Definitionsmenge von f . Wir
werden die etwas umständlichere Schreibweise f −1 ({y}) be-
|Y X | = |Y ||X| . vorzugen, um solche Verwirrungen gar nicht aufkommen zu
lassen.
Sowohl Elemente als auch Teilmengen können Zwei Abbildungen sind gleich, wenn sie die
Bilder und Urbilder haben gleiche Definitions- und Wertemenge haben
und die Bilder jeweils gleich sind
Ist f : X → Y eine Abbildung, so heißt y = f (x) ∈ Y das
Bild von x unter der Abbildung f – es ist y durch f eindeu-
Eine Abbildung ist f dann vollständig definiert, wenn ihre
tig bestimmt. Und das Element x ∈ X heißt ein Urbild des
Definitionsmenge X, ihre Wertemenge Y und ihr Graph
Elements y ∈ Y – das Element x ist durch f und y nicht
notwendig eindeutig bestimmt.
Gf = {(x, f (x)) | x ∈ X} ⊆ X × Y
y = f (x)
angegeben sind. In den folgenden Beispielen wird der Graph
↑ ↑ Gf häufig implizit durch die Abbildungsvorschrift x →
das Bild von x ein Urbild von y f (x) angegeben.
2.3 Abbildungen 43
haben identische Abbildungsvorschriften, nämlich x → x 2 ; natürlich wieder eine Abbildung ist. Im Fall A = X gilt
man schreibt bei der expliziten Angabe der Vorschrift auch f |A = f .
f (x) = x 2 . Aber die Abbildungen haben sehr verschiedene
Beispiel Die Restriktion der Funktion
Eigenschaften:
√ √
y = 2 hat unter f die zwei Urbilder 2 und − 2; R → R,
f:
y = 2 hat unter g kein Urbild. x → x 3
Sind f und g zwei Abbildungen von X nach Y , etwa
auf N, das ist die Abbildung
Gf = {(x, f (x)) | x ∈ X} und Gg = {(x, g(x)) | x ∈ X} ,
N → R,
so folgt unmittelbar aus der Gleichheit von Mengen und jener f |N : ,
n → n3
von geordneten Paaren:
ist die reelle Folge (n3 )n∈N .
Gleichheit von Abbildungen
Für zwei Abbildungen f, g : X → Y gilt:
?
f = g ⇔ f (x) = g(x) ∀x ∈ X. Geben Sie eine Funktion f : A → B an, sodass f |A dasselbe
Bild wie f hat, obwohl A eine echte Teilmenge von A ist.
Beispiel Es seien f und g Abbildungen von N nach N0 ,
wobei
f (x) = kleinster nicht negativer Rest bei ganzzahliger Divi- Kommentar: In der Mathematik steht man oft vor dem
sion von x durch 3. umgekehrten Problem, dem sogenannten Fortsetzungspro-
blem: Gegeben ist eine Abbildung f : A → Y und eine A
g(x) = kleinster nicht negativer Rest bei ganzzahliger Divi- umfassende Menge X, d. h. A ⊆ X. Das Problem lautet: Gibt
sion von x 3 durch 3. es eine Abbildung f˜ : X → Y mit f˜|A = f , die eine gewisse
Die beiden Abbildungsvorschriften sind verschieden, aber es geforderte Eigenschaft besitzt.
gilt:
f (1) = 1 = g(1) , f (2) = 2 = g(2) , f (3) = 0 = g(3) .
Allgemein erhält man f (x) = g(x) für alle x ∈ N. Das liegt Das Auswahlaxiom garantiert die Existenz
daran, dass n3 − n = (n − 1) n (n + 1) ein Vielfaches von 3
einer Auswahlfunktion
ist. Die Abbildungen f und g sind somit gleich.
Etwas Ähnliches hat man bei dem Produkt von Zahlen: Ist im Je zwei verschiedenen Elementen aus X sind auch zwei
Produkt a1 · · · an ein Faktor ai = 0, so ist a1 a2 · · · an = 0. verschiedene Elemente aus Y zugeordnet und
jedes Element aus Y wird einem x zugeordnet,
Was aber passiert, wenn Xi = ∅ ist für alle i ∈ I ? Solange die
Menge I endlich ist, z. B. |I | = n, ist alles unproblematisch: die eine Abbildung haben kann, Namen:
Das kartesische Produkt ist dann nichtleer, da Elemente des
kartesischen Produkts explizit in der Form (x1 , . . . , xn ) mit Definition von Injektivität, Surjektivität und Bijek-
xi ∈ Xi angegeben werden können. Falls I unendlich ist, so tivität
sagt das Auswahlaxiom der Mengenlehre:
Eine Abbildung f : X → Y heißt
injektiv, falls aus f (x1 ) = f (x2 ) für x1 , x2 ∈ X
Das Auswahlaxiom folgt x1 = x2 ,
Ist I = ∅ eine Menge und (Xi )i∈I ein Mengensystem surjektiv, falls zu jedem y ∈ Y ein x ∈ X existiert
nichtleerer
Mengen Xi , so ist auch das kartesische Pro- mit f (x) = y,
dukt i∈I Xi nichtleer, bijektiv, falls f injektiv und surjektiv ist.
Xi = ∅ . Wir können die Definitionen auch anders formulieren, es gilt
i∈I nämlich offenbar:
Eine Abbildung f : X → Y ist genau dann injektiv, wenn
Achtung: Das Auswahlaxiom ist ein Axiom. Die Aussage für x1 = x2 aus X stets f (x1 ) = f (x2 ) folgt.
des Axioms ist nicht beweisbar, wir erkennen sie dennoch als Eine Abbildung f : X → Y ist genau dann injektiv, wenn
gültig an (vgl. Seite 3). Wir werden stets deutlich machen, zu jedem y ∈ Y höchstens ein x ∈ X mit f (x) = y
wann wir von dem Axiom Gebrauch machen. existiert.
Eine Abbildung f : X → Y ist genau dann surjektiv, wenn
Nach dem Auswahlaxiom gibt es eine Auswahlfunktion f (X) = Y gilt.
Eine Abbildung f : X → Y ist genau dann surjektiv, wenn
f:I → Xi mit f (i) ∈ Xi ∀ i ∈ I , zu jedem y ∈ Y mindestens ein x ∈ X mit f (x) = y
i∈I existiert.
d. h. eine Abbildung f , die aus jeder der Mengen Xi genau Eine Abbildung f : X → Y ist genau dann bijektiv, wenn
ein Element, nämlich f (i), auswählt. zu jedem y ∈ Y genau ein x ∈ X mit f (x) = y existiert.
Wir verdeutlichen die Problematik an einem Beispiel. Alle diese Kennzeichnungen sind wichtig, man sollte sich
diese daher gut einprägen. Die bijektiven Abbildungen sind
Beispiel Gegeben seien unendlich viele Paare von Schu- gerade jene Abbildungen, die man umkehren kann, auf diese
hen, das sind unsere unendlich vielen nichtleeren Mengen Kennzeichnung kommen wir bald zu sprechen.
Xi , |I | = ∞, mit |Xi | = 2. Gibt es eine Auswahlvorschrift
Für endliche Mengen kann man sich die Begriffe an einer
(eine Funktion), die (simultan) aus jedem Paar von Schuhen
Skizze veranschaulichen (siehe Abb. 2.8).
genau ein Element, d. h. genau einen Schuh, auswählt? Ja! –
z. B. die folgende: Eine injektive bzw. surjektive bzw. bijektive Abbildung nennt
man oft auch kürzer Injektion bzw. Surjektion bzw. Bijek-
f ordnet jedem Paar von Schuhen den linken Schuh des Paa-
tion.
res zu.
Nun dasselbe für Socken statt Schuhe. Gibt es eine Aus- Beispiel
wahlvorschrift, die aus jedem Sockenpaar genau eine Socke Ist M die Menge aller Menschen und bezeichnet |KH(m)|
auswählt? Wie könnte eine solche Vorschrift lauten? die Anzahl der Kopfhaare von m ∈ M, so ist die Abbil-
dung
Das Auswahlaxiom besagt, dass es eine Auswahlfunktion
M → N0 ,
gibt; das ist eine schwache Existenzaussage. Bei den Schuhen f:
m → |KH(m)|
hatten wir mehr, nämlich die explizite Angabe einer solchen
Auswahlfunktion. weder injektiv noch surjektiv. Es gibt nämlich minde-
stens zwei (verschiedene) Menschen m1 und m2 , die keine
Wir kommen in Kürze erneut auf das Auswahlaxiom zu spre- Kopfhaare haben, d. h. |KH(m1 )| = |KH(m2 )|, sodass f
chen. nicht injektiv ist. Und es gibt sicherlich keinen Menschen,
der 1010 ∈ N Kopfhaare hat. Folglich ist f auch nicht sur-
jektiv.
Injektiv plus surjektiv ist bijektiv Die Abbildung
Bei einer Abbildung f : X → Y ist jedem x ∈ X genau ein N → N,
f:
y ∈ Y zugeordnet. Wir geben den zusätzlichen Eigenschaften n → n + 1
2.3 Abbildungen 45
injektiv, injektiv,
surjektiv nicht surjektiv ?
Ist die Abbildung
N → N0 ,
f:
n → n − 1
f:X→Y
Abbildung 2.8 Illustration der Eigenschaften injektiv und surjektiv. Nur die bijektiv.
Abbildung links oben ist sowohl injektiv als auch surjektiv, also bijektiv.
Die Abbildung f ist nicht surjektiv, da das Element 1 ∈ N Wir werden nun Mengen nach ihrer Größe klassifizieren. Da-
nicht als Bild auftritt: bei werden uns injektive, surjektive und bijektive Abbildun-
gen als Maßstab dienen.
n ∈ N mit f (n) = 1 .
Gleichmächtige Mengen
Da f nicht surjektiv ist, ist f auch nicht bijektiv.
Die Abbildung Zwei Mengen A und B heißen gleichmächtig, wenn es
eine bijektive Abbildung f : A → B gibt. Wir schreiben
N → {±1}, dann
f: A ∼ B oder |A| = |B| .
n → (−1)n
ist surjektiv (f (1) = −1 und f (2) = 1), aber nicht injek- Man schreibt weiterhin
tiv (f (1) = f (3)) und somit auch nicht bijektiv.
Für jede Menge X ist die Abbildung idX : X → X, |A| ≤ |B| ,
idX (x) = x eine Bijektion.
Für die Abbildungen wenn es eine injektive Abbildung von A in B gibt, und
R → R, R≥0 → R, |A| < |B|
f1 : f2 :
x → x 2 , x → x 2 ,
für
R → R≥0 , R≥0 → R≥0 ,
f3 : f4 : |A| ≤ |B| , jedoch |A| = |B| ;
x → x 2 , x → x 2
d. h., es gibt eine injektive Abbildung von A in B, aber keine
gilt: bijektive. In dieser Situation sagt man auch „A hat eine klei-
f1 ist weder surjektiv (−1 ∈ f (R)) noch injektiv nere Mächtigkeit als B“ oder „B hat eine größere Mächtigkeit
(f (−1) = f (1)). als A“.
f2 ist nicht surjektiv (−1 ∈ f (R)) aber injektiv
Im Fall
(f (x) = f (y) ⇒ x = y).
√ |A| = |{1, 2 . . . , n}| ,
f3 ist surjektiv (y ∈ R≥0 ⇒ f ( y) = y) aber nicht
injektiv (f (−1) = f (1)). d. h., es gibt eine Bijektion von A in {1, 2 . . . , n}, setzt man
f4 ist sowohl surjektiv (siehe f3 ) als auch injektiv |A| = n und nennt A endlich, wenn es ein n ∈ N0 gibt mit
(siehe f2 ). |A| = n.
46 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik
Man kann Abbildungen hintereinander Der Fall X = Y = Z ist besonders interessant. Sind f und
ausführen, falls die Bildmenge der einen im g zwei Abbildungen von einer Menge X in sich,
Definitionsbereich der anderen liegt f : X → X und g : X → X ,
Sind f eine Abbildung von X in Y und g eine Abbildung so ist auch g ◦ f eine Abbildung von X in sich. Dadurch ist
von Y in Z, eine Multiplikation auf der Menge aller Abbildungen von
f : X → Y und g : Y → Z , X nach X erklärt. Diese Multiplikation hat ein sogenanntes
Einselement, die identische Abbildung:
so können wir die beiden Abbildungen hintereinander aus-
führen, d. h., wir bilden aus den beiden Abbildungen f und id X ◦f = f und f ◦ idX = f .
g das Produkt g ◦ f :
Man beachte, dass diese Multiplikation nicht kommutativ ist,
Die Komposition von Abbildungen im Allgemeinen gilt:
Es seien f : X → Y und g : Y → Z Abbildungen. Dann f ◦ g = g ◦ f .
ist
X → Z,
g◦f:
x → g(f (x)) Beispiel Gegeben sind die Abbildungen
eine Abbildung von X nach Z. Diese heißt die Kompo-
sition oder Hintereinanderausführung oder Verket- R → R, R → R,
f: und g : .
tung von f und g. x → x 2 x → 2 x + 1
Dann gilt:
Das Bild (g ◦ f )(x) von x unter der Abbildung g ◦ f entsteht
durch Anwenden von g auf das Bild f (x) von x unter f . g(f (x)) = 2 x 2 + 1 und f (g(x)) = 4 x 2 + 4x + 1 .
Achtung: Nicht immer können zwei Abbildungen f und g Folglich gilt g ◦ f = f ◦ g.
zu einer Abbildung g ◦f zusammengesetzt werden. Möglich
ist das genau dann, wenn das Bild von f im Definitionsbe- Aber – und das ist wichtig! – diese Multiplikation ist asso-
reich von g liegt (siehe Abb. 2.9). ziativ:
Wf f3 ◦ (f2 ◦ f1 ) = (f3 ◦ f2 ) ◦ f1 .
g◦f
Abbildung 2.9 Eine Verkettung von Abbildungen ist nur dann möglich, wenn
Beweis: Sowohl f3 ◦ (f2 ◦ f1 ) als auch (f3 ◦ f2 ) ◦ f1 sind
der Bildbereich der ersten im Definitionsbereich der zweiten enthalten ist. Abbildungen von X1 nach X4 . Zu zeigen ist daher nur, dass
für jedes x ∈ X1 beide Abbildungen dasselbe Element in X4
Beispiel Die beiden Abbildungen liefern, und das sieht man ganz einfach durch Auswerten der
Abbildungen für ein (beliebiges) x ∈ X1 :
N → R, R≥0 → R≥0 ,
f: und g : √
n → n1 x → x (f3 ◦ (f2 ◦ f1 ))(x) = f3 ((f2 ◦ f1 )(x)) = f3 (f2 (f1 (x))) ,
können zu ⎧ ((f3 ◦ f2 ) ◦ f1 )(x) = (f3 ◦ f2 )(f1 (x)) = f3 (f2 (f1 (x))) .
⎨N → R≥0 ,
g◦f:
⎩ n → 1 Somit sind die beiden Abbildungen gleich.
n
verkettet werden. Hingegen ist das für Bei dieser Multiplikation von Abbildungen tauchen Ähnlich-
keiten zu Zahlenmengen auf. Wir betrachten die Menge M
N → R, R≥0 → R≥0 ,
f: und g : √ aller Abbildungen f einer Menge X in sich mit der Mul-
n → − n1 x → x
tiplikation ◦ – man schreibt dafür (M, ◦). Wir vergleichen
nicht möglich, weil Quadratwurzeln im Reellen nur für po- diese algebraische Struktur (M, ◦) z. B. mit (Z, +). In bei-
sitive Argumente definiert sind. den Strukturen gilt das Assoziativgesetz und beide enthalten
48 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik
ein Einselement, in (M, ◦) ist das idX , in (Z, +) lautet es Daher können wir zu jedem bijektiven f eine weitere Abbil-
0. Die Verknüpfung ◦ in M ist nicht kommutativ, die Ver- dung g : Y → X definieren: Wir setzen
knüpfung + in Z hingegen schon. Es ist ein wesentlicher
und notwendiger Abstraktionsschritt, sich daran zu gewöh- g(y) = x für das (eindeutige) x mit f (x) = y .
nen, dass man mit Abbildungen rechnen kann als wären es
Zahlen. Die Abbildungen f : X → Y und g : Y → X können wir
hintereinander ausführen, wir können sowohl f ◦ g wie auch
g ◦ f bilden, da die Bildmenge von f bzw. g in der De-
Genau die bijektiven Abbildungen sind finitionsmenge von g bzw. f liegt. Wir werten nun diese
Abbildungen
umkehrbar
g ◦ f : X → X und f ◦ g : Y → Y
Wir zeigen, dass sich die bijektiven Abbildungen umkehren
lassen. Wir stellen diesem wichtigen Satz von der Umkehr- für x ∈ X und y ∈ Y aus:
abbildung ein Lemma voran.
g ◦ f (x) = g(f (x)) = g(y) = x = id X (x) und
Lemma f ◦ g(y) = f (g(y)) = f (x) = y = idY (y) .
Für Abbildungen f : X → Y und g : Y → X gelte:
Mit dem Satz zur Gleichheit von Abbildungen auf Seite 43
f ◦ g = idY . folgt nun g ◦ f = idX und f ◦ g = idY , wir halten fest:
Dann sind f surjektiv und g injektiv.
Satz von der Umkehrabbildung
Beweis: Wir zeigen zuerst, dass f surjektiv ist: Es sei Ist f : X → Y eine bijektive Abbildung, so existiert
y ∈ Y gegeben. Wegen f ◦ g = idY gilt: genau eine Abbildung g : Y → X mit
Somit ist y das Bild des Elements x = g(y) ∈ X unter f . Man nennt g die Umkehrabbildung oder die zu f in-
verse Abbildung. Man bezeichnet sie üblicherweise mit
Nun begründen wir, dass g injektiv ist: Dazu sei g(y1 ) = f −1 . Die Abbildung f −1 ist ebenfalls bijektiv und hat
g(y2 ) für y1 , y2 ∈ Y angenommen. Nun wenden wir die die Umkehrabbildung
Abbildung f an und erhalten
(f −1 )−1 = f .
f (g(y1 )) = f (g(y2 )) .
Wir wollen diese Aussage nun umkehren, d. h., wir erklären f ◦ f −1 = idY und f −1 ◦ f = idX
zu einer bijektiven Abbildung f : X → Y eine neue Abbil-
dung g : Y → X, sodass die beiden Gleichheiten g◦f = idX zeigen wegen der bewiesenen Eindeutigkeit der Umkehrab-
und f ◦ g = idY erfüllt sind. bildung, dass f die Umkehrabbildung von f −1 ist, d. h.
Achtung: Ist f : X → Y bijektiv und B ⊆ Y , so hat das Die Abbildung g ◦ f ist surjektiv: Zu jedem z ∈ Z existiert
Zeichen f −1 (B) nun zwei Bedeutungen: wegen der Surjektivität von g ein y ∈ Y mit g(y) = z. Zu
diesem y ∈ Y wiederum existiert wegen der Surjektivität
A1 = f −1 (B) = {x ∈ X | f (x) ∈ B}
von f ein x ∈ X mit f (x) = y. Insgesamt erhalten wir mit
ist die Urbildmenge von B unter f , und diesen x und y:
ist die Bildmenge von B unter f −1 . Das macht aber nichts, sodass das Element z ∈ Z ein Urbild x ∈ X bezüglich der
es gilt nämlich A1 = A2 . Das sieht man wie folgt: Abbildung g ◦ f hat.
x ∈ A1 ⇔ f (x) = b ∈ B
⇔ x = f −1 (b) ∈ f −1 (B)
⇔ x ∈ A2 .
2.4 Relationen
Man beachte auch die grundverschiedenen Bedeutungen von Wir können aus jeder injektiven Abbildung eine bijektive Ab-
−1 −1 bildung machen. Dazu ist es nur notwendig, die Wertemenge
f (x) und (f (x)) .
einzuschränken, siehe den Kommentar auf Seite 45. Ist es
Das Element (f (x))−1 ist das Inverse von f (x) aber f −1 (x) auch möglich, aus einer surjektiven Abbildung eine bijek-
ist das Bild von x unter der Abbildung f −1 . tive zu machen? Die Antwort ist ja, wir zeigen das in diesem
Abschnitt. Wir werden dazu den Begriff der Gleichheit ver-
Beispiel gröbern. Wir werden Elemente einer Menge als äquivalent
Für jede Menge X ist id−1
X = idX .
bezeichnen, wenn sie gewisse vorgegebene gleiche Eigen-
Die Abbildung schaften haben. Diese zueinander äquivalenten Elemente fas-
sen wir dann in Mengen zusammen und behandeln diese
N → N0 , Mengen wieder als Elemente einer Menge. Das hat eine Ähn-
f:
n → n − 1 lichkeit mit Schubläden – zueinander äquivalente Elemente
ist bijektiv, ihre Umkehrabbildung lautet werden in Schubläden gesteckt, und es wird dann mit den
Schubläden anstelle der Elemente weitergearbeitet.
−1 N0 → N,
f : . Wir betrachten also erneut Mengen, wobei nun Elemente
n → n + 1
einer Menge zueinander in einem Verhältnis stehen. Ein sol-
In der Analysis werden wir den Logarithmus ches Verhältnis, wir werden das als Relation bezeichnen, defi-
nieren wir zuerst sehr allgemein. Wir werden dann Ordnungs-
ln : R>0 → R , y → ln y und Äquivalenzrelationen betrachten.
als die Umkehrabbildung der (bijektiven) Exponentialab-
bildung Eine Relation auf X ist eine Teilmenge von
exp : R → R>0 , x → ex X×X
definieren.
Es seien X und Y beliebige Mengen. Jede Teilmenge ρ ⊆
Die Hintereinanderausführung g ◦ f zweier Abbildungen f X × Y heißt (binäre bzw. zweistellige) Relation auf X × Y .
und g von einer Menge X in sich ist wieder eine Abbildung Wir werden nur binäre Relationen betrachten und sprechen
von X in sich. Sind g und f bijektiv, so ist auch g ◦f bijektiv. von nun an kurz von Relationen. Der Graph Gf einer Ab-
bildung f von X in Y ist eine Relation auf X × Y mit der
Die Komposition von bijektiven Abbildungen ist bi- zusätzlichen Eigenschaft, dass es zu jedem x aus X genau
jektiv ein y aus Y gibt.
Sind f : X → Y und g : Y → Z bijektiv, so ist auch
g ◦ f : X → Z bijektiv.
?
Vornehm ausgedrückt spricht man beim Graph einer Abbil-
dung f von einer linkstotalen und rechtseindeutigen Relation
auf X × Y – warum wohl ?
Beweis: Die Abbildung g ◦ f ist injektiv: Aus
Außerdem nennt man den Graph einer injektiven Abbildung
g(f (x)) = g(f (y)) auch linkseindeutig und den einer surjektiven auch rechtstotal
– warum wohl ?
mit x, y ∈ X folgt wegen der Injektivität von g
f (x) = f (y) .
Im Fall X = Y , das werden wir im weiteren stets vorausset-
Aus der Injektivität von f folgt nun x = y. zen, spricht man auch kurz von einer Relation auf X.
50 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik
Man beachte, dass eine Relation ρ auf X eine Menge von ge- jedes x ∈ R. Wir fassen die für uns wichtigen Eigenschaften,
ordneten Paaren aus X × X ist. Durch die Teilmenge ρ wer- die eine Relation haben kann, zusammen:
den ganz bestimmte Paare aus X ×X ausgezeichnet, nämlich
genau diejenigen, die zueinander in der Relation ρ stehen. Reflexiv, symmetrisch, antisymmetrisch und transitiv
Anstelle von (x, y) ∈ ρ schreibt man auch x ρ y und benutzt Eine Relation ρ auf der Menge X heißt:
die Sprechweise „x steht in Relation zu y“, reflexiv, wenn für alle x ∈ X gilt x ρ x,
symmetrisch, wenn für alle x, y ∈ X mit x ρ y gilt
x ρ y ⇔ (x, y) ∈ ρ . y ρ x,
antisymmetrisch, wenn für alle x, y ∈ X mit x ρ y
und y ρ x gilt x = y,
Beispiel
transitiv, wenn für alle x, y, z ∈ X mit x ρ y und
Auf der Menge N ist die Teilbarkeit | eine Relation. Dabei
y ρ z gilt x ρ z.
sagt man, eine natürliche Zahl a teilt eine natürliche Zahl
b, wenn es ein c ∈ N gibt mit a c = b. Als Schreibweise
verwendet man dafür a | b. Es gilt: Wir sehen uns erneut die letzten Beispiele an und erhalten:
| = {(a, b) ∈ N × N | a | b} . Beispiel
Die Relation | auf N ist reflexiv, antisymmetrisch und tran-
Zum Beispiel gilt (3, 3), (3, 9), (12, 36) ∈ | . sitiv.
Auf der Menge X aller Geraden der Ebene ist die Paral- Die Relation auf der Menge X aller Geraden einer Ebene
lelität eine Relation. Es gilt: ist reflexiv, symmetrisch und transitiv.
Die Relation ≤ auf R ist reflexiv, antisymmetrisch und
= {(g, h) ∈ X × X | g h} . transitiv.
Die Relation ≡ (mod n) auf Z ist reflexiv, symme-
Auf der Menge R der reellen Zahlen ist die Anordnung
trisch und transitiv. Wir weisen die Transitivität nach: Es
≤ eine Relation. Es gilt:
gelte a ≡ b (mod n) und b ≡ c (mod n). Folglich gilt
n | a − b und n | b − c. Hieraus erhalten wir
≤ = {(a, b) ∈ R × R | a ≤ b} .
a−b =rn und b − c = s n
Wir definieren eine Relation ρ auf der Menge Z der ganzen
Zahlen. Es seien n ∈ N und a, b ∈ Z. Wir sagen, a ist für ganze Zahlen r und s. Eine Addition dieser beiden
kongruent zu b modulo n, falls n die Zahl a − b teilt, Gleichungen liefert
kurz: a − c = (a − b) + (b − c) = (r − s) n ,
aρb ⇔ n | a −b.
d. h. n | a − c. Damit ist gezeigt a ≡ c (mod )n.
Für n = 3 gilt z. B. (5, 2), (−2, 1), (4, 4) ∈ ρ. Für Die Gleichheit = auf X ist reflexiv, symmetrisch, anti-
diese Relation ρ schreibt man üblicherweise ≡, genauer symmetrisch und transitiv.
≡ (mod n), d. h., Die Inklusion ⊆ auf P (X) ist reflexiv, antisymmetrisch
und transitiv.
a≡b (mod n) ⇔ n | a − b .
Auf jeder Menge X ist die Gleichheit = eine Relation. Kommentar: Die Relation ist besser auf der Menge der
Auf der Potenzmenge P (X) jeder Menge X ist die Inklu- Gegenstände des täglichen Lebens ist sicherlich als eine tran-
sion ⊆ eine Relation. sitive Relation zu verstehen. Findet man etwa, dass Schoko-
lade besser ist als ein Apfel und dass ein Apfel besser ist
als Spinat, so wird man sicher auch der Meinung sein, dass
Kommentar: Eigentlich ist eine Relation ρ auf X × Y ein Schokolade besser ist als Spinat.
Tripel ρ = (X, Y, Rρ ), wobei Rρ ⊆ X × Y . In diesem Sinne
ist eine Abbildung eine spezielle Relation.
Diese Regeln sind genau die Reflexivität, Antisymmetrie und a ≮ a für alle a ∈ X (Irreflexivität),
Transitivität. aus a < b und b < c folgt a < c (Transitivität).
Eine solche Ordnungsrelation < ist genau dann linear, wenn
Ordnungsrelation, geordnete Menge
für alle a, b ∈ X gilt
Eine Relation ρ auf einer Menge X heißt eine Ord-
nungsrelation auf X, wenn sie reflexiv, antisymme- a < b oder a = b oder b < a (Trichotomie),
trisch und transitiv ist. Man nennt dann (X, ρ) eine aus a < b und b < c folgt a < c (Transitivität).
geordnete Menge. Tatsächlich liefert diese (lineare) Ordnungsrelation nichts
Neues: Ist nämlich ≤ eine (lineare) Ordnungsrelation in un-
Wir erhalten sofort einfache Beispiele: serem Sinne auf X, so liefert die Relation <, die man erhält
durch die Vereinbarung
Beispiel
Da ≤ eine Ordnungsrelation auf der Menge R der reellen a < b :⇔ a ≤ b und a = b ,
Zahlen ist, ist (R, ≤) eine geordnete Menge.
Da die Teilbarkeit | auf N eine Ordnungsrelation ist, ist eine (lineare) Ordnungrelation auf X wie eben geschildert.
(N, | ) eine geordnete Menge. Und es gilt auch die Umkehrung: Ist < eine (lineare) Ord-
Die Potenzmenge jeder Menge X ist mit der Ordnungsre- nungsrelation auf X wie eben geschildert, so ist die Relation
lation ⊆ eine geordnete Menge (P (X), ⊆). ≤, die man erhält durch die Vereinbarung
Man beachte, dass man bei einer Ordnungsrelation nicht ver- a ≤ b :⇔ a < b oder a = b ,
langt, dass jedes x zu jedem y in Relation steht, z. B. kann
eine (lineare) Ordnungsrelation auf X in unserem Sinne.
man die Teilmengen {1, 2} und {3} von X = {1, 2, 3} nicht
miteinander vergleichen, es gilt:
P ({1, 2}) = {∅, {1}, {2}, {1, 2}} . Abbildung 2.10 Die eingezeichneten Pfeile symbolisieren die Inklusion. Es gibt
maximale und minimale Elemente, aber kein größtes und kein kleinstes Element.
Wegen {1} ⊆ {2} und {2} ⊆ {1} sind die Elemente {1} und
{2} nicht miteinander vergleichbar, sodass die Ordnungs- Im Gegensatz zu größten und kleinsten Elementen sind maxi-
relation nicht total ist. male und minimale Elemente im Allgemeinen keineswegs
Das Element {1, 2} ist das größte Element, das Element eindeutig bestimmt. Aber es gilt:
∅ das kleinste.
Nun betrachten wir die folgende Teilmenge X der Potenz- Lemma
menge von M = {1, 2, 3}: Jedes größte Element von (X, ≤) ist ein maximales
X = {{1}, {2}, {3}, {1, 2}, {2, 3}, {1, 3}} , Element.
Jedes kleinste Element von (X, ≤) ist ein minimales
die aus allen ein- und zweielementigen Teilmengen von M Element.
besteht. Die Menge X ist mit der Inklusion ⊆ nicht linear
geordnet. Es gibt weder ein größtes noch ein kleinstes Beweis: Ist a ∈ X ein größtes Element, so folgt aus a ≤ x
Element. für ein x ∈ X sogleich a ≥ x und somit a = x. Analog zeigt
man die Behauptung für das kleinste Element.
Endliche linear geordnete Mengen haben stets ein größtes
und ein kleinstes Element. Das letzte Beispiel zeigt, dass
dies für endliche nicht linear geordnete Mengen nicht richtig Man beachte auch die Abbildung 2.11.
sein muss. Und trotzdem gilt etwa
sodass man doch auch wieder sagen kann, dass {1, 3} größer
ist als {1}, und es gibt in X kein Element, das größer ist als
{1, 3} und auch keines, das kleiner ist als {1}. Dies erfasst {1} {2}
man mit den Begriffen minimales und maximales Element:
Ist ≤ eine Ordnungsrelation auf der Menge X, so sagt man:
Ein Element a ∈ X heißt maximales Element von X, falls
für alle x ∈ X gilt: Aus a ≤ x folgt a = x. ∅
Ein Element a ∈ X heißt minimales Element von X, falls
für alle x ∈ X gilt: Aus x ≤ a folgt x = a. Abbildung 2.11 Die eingezeichneten Pfeile symbolisieren wieder die Inklusion.
Das maximale Element {1, 2} ist das eindeutig bestimmte größte Element.
Ein Element ist also genau dann maximal, wenn es kein Ele-
ment gibt, das noch echt größer ist und minimal, wenn es
kein Element gibt, das noch echt kleiner ist. Wir greifen das
letzte Beispiel noch einmal auf. Das Zorn’sche Lemma garantiert die Existenz
Beispiel Die Menge
maximaler Elemente
X = {{1}, {2}, {3}, {1, 2}, {2, 3}, {1, 3}} Das Zorn’sche Lemma liefert eine ganz wesentliche Beweis-
methode für die Existenz maximaler Elemente. Für eine
versehen mit der Inklusion ⊆ ist geordnet, aber nicht linear
knappe Formulierung dieses Lemmas führen wir einen wei-
geordnet. Jedes der Elemente
teren Begriff ein.
{1}, {2}, {3}
Eine geordnete Menge (M, ≤) heißt induktiv geordnet,
ist ein minimales Element, und jedes der Elemente wenn jede linear geordnete Teilmenge X ⊆ M eine obere
Schranke in (M, ≤) besitzt, d. h., wenn ein s ∈ M existiert
{1, 2}, {2, 3}, {1, 3} mit x ≤ s für alle x ∈ X.
ist ein maximales Element (vgl. Abbildung 2.10). Das Zorn’sche Lemma besagt:
2.4 Relationen 53
x ∼ y ⇔ f (x) = f (y)
wird eine Äquivalenzrelation auf X definiert. Für ein x ∈ X sei [x] ∈ X/∼ die Äquivalenzklasse von x bezüglich ∼ .
Zeigen Sie weiter, dass durch f∗ : X/∼ → f (X), [x] → f (x) eine bijektive Abbildung erklärt wird.
Problemanalyse und Strategie: Wir zeigen, dass die Relation ∼ reflexiv, symmetrisch und transitiv ist. Um zu zeigen,
dass durch f∗ eine Bijektion gegeben ist, ist erst einmal zu begründen, dass f∗ tatsächlich eine Abbildung ist, dann erst
prüfen wir die Abbildung auf Bijektivität.
Lösung: zes) den Wert zuordnet, die die Abbildung f jedem Ele-
Wegen f (x) = f (x) für jedes x ∈ X gilt x ∼ x für jedes ment der Äuivalenzklasse zuordnet:
x ∈ X (Reflexivität).
Es gelte x ∼ y mit x, y ∈ X. Dann gilt f (x) = f (y), X/∼ → f (X),
f∗ :
d. h. f (y) = f (x). Es folgt y ∼ x (Symmetrie). [x] → f (x).
Nun gelte x ∼ y und y ∼ z, x, y, z ∈ X. Dann gilt
Es ist zu erwarten, dass diese Abbildung nun injektiv ist,
f (x) = f (y) und f (y) = f (z), d. h. f (x) = f (z). Es
wir haben ja gerade die Nichtinjektivität beseitigt. Be-
folgt x ∼ z (Transitivität).
vor wir aber dieses f∗ auf Injektivität und Surjektivi-
Damit ist bereits begründet, dass ∼ eine Äquivalenzrela-
tät überprüfen, müssen wir uns überlegen, ob f∗ über-
tion ist.
haupt eine Abbildung von X/∼ in f (X) ist, d. h., ob
In der Äquivalenzklasse
f∗ ⊆ (X/∼) × f (X) mit der Eigenschaft, dass es zu
[x] = {y ∈ X | x ∼ y} = {y ∈ X | f (x) = f (y)} jedem Element [x] genau ein Element aus f (X) gibt.
Weil wir einer Äquivalenzmenge [x] einen Wert zuordnen,
liegen alle Elemente aus X, die unter der Abbildung f den nämlich f (x), der vom Repräsentanten x abhängt, müs-
gleichen Wert in Y annehmen. sen wir sicherstellen, dass dieser Wert unabhängig von
Ist die Abbildung f injektiv, so ist jede Äquivalenzklasse der Wahl des Repräsentanten ist: Würde nämlich für ein
einelementig, da im Falle der Injektivität aus f (x) = f (y) y ∈ X mit [x] = [y] gelten f (x) = f (y), so wäre durch
die Gleichheit x = y folgt. f∗ keine Abbildung gegeben, da einem Element [x] = [y]
Ist die Abbildung f nicht injektiv, so gibt es (mindestens) der Definitionsmenge verschiedene Werte f (x) = f (y)
eine Äquivalenzklasse, die mehr als ein Element enthält. zugeordnet werden würden.
Die folgende Abbildung deutet die Zerlegung von X in die Wir begründen, dass das bei unserer Abbildung f∗ nicht
Äquivalenzklassen an. der Fall ist: Es sei y ∈ X mit [x] = [y] gewählt. Es
gilt dann x ∼ y. Nach der Definition besagt dies aber
f (x) = f (y). Folglich ist f∗ eine Abbildung. Man sagt,
X/∼
dass die Abbildung wohldefiniert ist.
Die Abbildung f∗ ist injektiv: Aus f∗ ([x]) = f∗ ([y])
folgt f (x) = f (y) und damit x ∼ y. Dies besagt gerade
[x] = [y].
Die Abbildung f∗ ist surjektiv: Das Element f (x) ∈
f (X), x ∈ X, ist Bild des Elements [x] ∈ X/∼.
Damit ist gezeigt, dass die Abbildung f∗ bijektiv ist.
X Y
Kommentar: Ist die Abbildung f bereits injektiv, so
Wir vergröbern die Abbildung f nun. Wir unterscheiden bestehen die Äquivalenzklassen [x] aus genau einem Ele-
nicht mehr zwischen zueinander äquivalenten Elementen, ment, [x] = {x}. Die Quotientenmenge X/∼ = {[x] |
sondern fassen diese zu einem Element zusammen, d. h., x ∈ X} ist dann eine Menge von einelementigen Teilmen-
wir betrachten eine Abbildung, die auf den Äquivalenz- gen von X. Strenggenommen muss man also schon noch
klassen definiert ist und jeder Äquivalenzklasse (als Gan- zwischen f und f∗ unterscheiden.
X/∼ als eine Vergröberung der Gleichheit auf X betrach- In dem ausführlichen Beispiel auf dieser Seite vergröbern wir
ten – zueinander äquivalente Elemente in X werden in X/∼ den Definitionsbereich X einer Abbildung f zu X/∼. Die
nicht mehr unterschieden. Abbildung f∗ , die auf dieser gröberen Menge X/∼ erklärt
werden kann, ist dann injektiv.
2.4 Relationen 55
Relation g ⊆ X × X Relation f ⊆ X × Y
..
Aquivalenzrelation Ordnungsrelation Bijektion
linear
lineare Ordnungsrelation
Nun sei x ∼ y vorausgesetzt. Wir wählen ein u ∈ [x]∼ . Jedes Paar {a, b} mit einem weiblichen a ∈ M und männ-
Wegen x ∼ u und x ∼ y folgt mit der Symmetrie und Tran- lichen b ∈ M ist ein Repräsentantensystem dieser Äqui-
sitivität y ∼ u, d. h. u ∈ [y]∼ bzw. [x]∼ ⊆ [y]∼ . Analog valenzrelation ∼.
zeigt man [y]∼ ⊆ [x]∼ , sodass [x]∼ = [y]∼ . Wir betrachten die Potenzmenge P (N). Nennt man zwei
Elemente A, B ∈ P (N) äquivalent, in Zeichen A ∼ B,
Es gelte nun [x]∼ = [y]∼ . Wenn die Klassen gleich sind, ist
wenn sie gleich viele Elemente enthalten, so ist ∼ offenbar
ihr Durchschnitt natürlich nichtleer.
eine Äquivalenzrelation. Die Äquivalenzklassen enthalten
Damit sind die drei Äquivalenzen in (c) bewiesen. jene Teilmengen von N mit je gleich vielen Elementen,
z. B.:
[∅]∼ = {∅}.
Nach diesem Satz liefern die Äquivalenzklassen von X eine
[{1}]∼ = {{1}, {2}, . . .} – die einelementigen Teilmen-
Partition der Menge X, d. h., X ist disjunkte Vereinigung
gen von N.
nichtleerer Teilmengen, nämlich ihrer Äquivalenzklassen.
[{1, 2}]∼ = {{1, 2}, {2, 3}, . . .} – die zweielementigen
Anstelle von einer Partition spricht man auch von einer Zer-
Teilmengen von N.
legung.
[N]∼ – die unendlichen Teilmengen von N (z. B. N, 2N,
2N + 1).
Kommentar: Tatsächlich sind die Existenz und Eindeu- Die Restklassen modulo n
tigkeit der Zahlen q und r zu beweisen. Wir tun das auf
Für jedes n ∈ N sind
Seite 129.
0 + n Z , 1 + n Z , . . . , (n − 1) + n Z
Nun können wir die Kongruenz modulo n mithilfe der Divi-
sion mit Rest charakterisieren: sämtliche verschiedene Restklassen modulo n. Es ist so-
mit R = {0, 1, . . . , n − 1} ein Repräsentantensystem
Charakterisierungen der Kongruenz modulo n
– dabei haben wir aus jeder Restklasse den kleinsten
Es sei n eine natürliche Zahl. Für zwei ganze Zahlen a positiven Repräsentanten gewählt.
und b sind äquivalent:
a ≡ b (mod n).
n | a − b. Anstelle von a + n Z schreibt man oft auch kurz a; manch-
a + n Z = b + n Z. mal lässt man selbst den Querstrich weg und identifiziert die
a und b haben bei Division mit Rest durch n den Restklasse a mit seinem Repräsentanten a.
gleichen Rest.
Beispiel
Im Fall n = 1 gibt es genau eine Restklasse
Beweis: Dass die ersten drei Aussagen gleichwertig sind,
wurde bereits gezeigt. Wir zeigen die Gleichwertigkeit der
0 = 0 + 1Z = Z.
dritten und vierten Aussage. Dazu teilen wir zwei ganze Zah-
len a und b mit Rest durch n:
Es sind je zwei ganze Zahlen äquivalent, da die Differenz
a = q1 n + r1 , b = q2 n + r2 mit 0 ≤ r1 , r2 < n . beliebiger Zahlen stets von 1 geteilt wird.
Im Fall n = 2 gibt es genau zwei Restklassen
Man beachte:
r1 − r2 ∈ {−(n − 1), . . . , −1, 0, 1, . . . , n − 1} . 0 = 0 + 2 Z = {0, ±2, ±4, . . .} ,
a + n Z = b + n Z ⇔ a − b = n c für ein c ∈ Z Die Menge Z wird aufgeteilt in die geraden und ungeraden
⇔ (q1 − q2 ) n + (r1 − r2 ) = n c, c ∈ Z ganzen Zahlen.
Im Fall n = 6 gibt es genau sechs Restklassen
⇔ r1 − r2 = n d für ein d ∈ Z
⇔ r 1 = r2 , 0 = 0 + 6 Z = {. . . , −12, −6, 0, 6, 12, . . .} ,
da wegen der obigen Größeneinschränkung von r1 − r2 nur 1 = 1 + 6 Z = {. . . , −11, −5, 1, 7, 13, . . .} ,
der Fall d = 0 möglich ist. Die zwei Zahlen a, b sind somit
2 = 2 + 6 Z = {. . . , −10, −4, 2, 8, 14, . . .} ,
genau dann kongruent mod n, wenn sie denselben Rest bei
Division durch n haben. 3 = 3 + 6 Z = {. . . , −9, −3, 3, 9, 15, . . .} ,
4 = 4 + 6 Z = {. . . , −8, −2, 4, 10, 16, . . .} ,
Wegen der Charakterisierung der Kongruenz mit den Resten
nennt man die Äquivalenzklassen der Kongruenz modulo n 5 = 5 + 6 Z = {. . . , −7, −1, 5, 11, 17, . . .} .
auch Restklassen modulo n.
Es ist Z = 0 ∪ 1 ∪ 2 ∪ 3 ∪ 4 ∪ 5, und es ist R =
Wir erhalten nun eine sehr einfache Beschreibung der Rest-
{0, 1, 2, 3, 4, 5} ein Repräsentantensystem. Ebenso gut
klassen modulo n. Für jedes a ∈ Z gilt
können wir natürlich auch R = {12, −5, 8, −9, 16, 5}
[a]≡ = a + n Z = r + n Z , als Repräsentantensystem wählen.
Zusammenfassung
Die Grundlagen der Mathematik sind die Logik und die Definition einer Abbildung
Mengenlehre. Es ist zu Beginn des Mathematikstudiums üb-
Gegeben seien zwei Mengen X und Y . Eine Abbildung
lich, Logik und Mengenlehre nicht axiomatisch, sondern naiv
f von X in Y ist ein Tripel
zu betreiben. Wir betrachten Aussagen, Variable, Junktoren
und Quantoren als das, was man sich darunter vorstellt und f = (X, Y, Gf ) , wobei Gf ⊆ X × Y
verzichten gelegentlich auf präzise Definitionen, die uns zu
lange davon abhalten würden, grundlegende mathematische die Eigenschaft hat, dass es zu jedem x ∈ X genau ein
Sachverhalte aus der linearen Algebra und Analysis zu disku- y ∈ Y gibt mit (x, y) ∈ Gf .
tieren. Mithilfe der Junktoren UND, ODER, NICHT, WENN-
Für das durch x eindeutig bestimmte Element y schrei-
DANN und GENAU-DANN-WENN und Variablen und den
ben wir f (x).
Quantoren ∃ und ∀ bilden wir aus einfachen Aussagen kom-
plexe Aussagen, die wir auf ihren Wahrheitsgehalt hin unter- Die Menge X heißt Definitionsmenge von f , Y heißt
suchen. Wertemenge von f und Gf der Graph von f .
Der naive Umgang mit dem Begriff der Menge als eine
Wir schreiben für die Abbildung f = (X, Y, Gf ) oft ein-
Zusammenfassung wohlunterschiedener Objekte führt zu
facher
Widersprüchen in der Mathematik, man vergleiche etwa die
f : X → Y, x → f (x) .
Russell’sche Antinomie. Solange man aber mit kleinen Men-
gen hantiert, ist diese nicht präzise definierte Vorstellung Abbildungen ordnen jedem Element der Definitionsmenge
einer Menge durchaus sinnvoll. Im ersten Studienjahr kom- ein Element der Wertemenge zu. Eine Abbildung heißt in-
men wir zumindest mit der Vorstellung aus, dass Mengen jektiv, falls je zwei verschiedene Elemente der Definitions-
durch die Angabe ihrer Elemente gegeben sind. menge auch zwei verschiedene Bilder haben und surjektiv,
falls jedes Element der Wertemenge Bild eines Elements der
Wir werden nicht nur im ersten Studienjahr sehr oft vor dem
Definitionsmenge ist. Eine Abbildung, die injektiv und sur-
Problem stehen, dass wir von zwei Mengen zeigen müssen,
jektiv ist, nennt man bijektiv. Bei einer bijektiven Abbildung
dass sie gleich sind, das tut man, indem man zeigt, dass die
gehört zu jedem Element x der Definitionsmenge genau ein
beiden Mengen ineinander enthalten sind:
Element f (x) der Wertemenge. Daher ist es sinnvoll, zwei
Mengen als gleichmächtig zu bezeichnen, wenn es eine Bi-
Gleichheit von Mengen jektion zwischen diesen Mengen gibt.
Die Mengen A und B sind gleich, in Zeichen A = B,
Ist f eine Abbildung von X nach Y und g eine solche von
wenn jedes Element von A ein Element von B ist und
Y nach Z, so kann man die Abbildungen hintereinander aus-
jedes Element von B eines von A ist, kurz:
führen und erhält die Komposition
A = B ⇔ ((A ⊆ B) ∧ (B ⊆ A)) .
X → Z,
g◦f: .
x → g(f (x))
Die üblichen Operationen mit Mengen sind teils aus der
Schule bekannt: Man kann Mengen vereinigen, A∪B, schnei- Es ist sehr wichtig zu wissen, dass diese Komposition ◦ von
den, A ∩ B, man kennt die Mengendifferenz A \ B, das Kom- Abbildungen eine assoziative Verknüpfung ist, d. h., es gilt
plement CB (A) einer Menge in einer Obermenge und das
kartesische Produkt A × B von Mengen. Und natürlich kennt h ◦ (g ◦ f ) = (h ◦ g) ◦ f
man auch die Mächtigkeit einer Menge |A|, das ist (wieder
für Abbildungen f, g, h mit passenden Definitions- und
etwas naiv gesprochen) die Anzahl der Elemente der Menge.
Wertemengen. In der linearen Algebra etwa werden wir die
Naiv deswegen, da man von der Anzahl ja eigentlich nur dann
Assoziativität der Matrizenmultiplikation mithilfe der Asso-
sprechen kann, wenn diese endlich ist. Eine präzisere Defini-
ziativität dieser Komposition begründen.
tion der Mächtigkeit ist mit einem anderen Begriff möglich,
und zwar mit dem Begriff der Abbildung. Ist X eine Menge, so nennt man die Abbildung idX von X
in sich, die jedem x sich selbst zuordnet, die Identität von X,
Der Begriff der Abbildung ist zentral in der Mathematik. In
idX (x) = x für alle x ∈ X. Nun kann es natürlich sein, dass
der Analysis geht es vor allem darum, Abbildungen von Men-
für zwei Abbildungen f : X → Y und g : Y → X gilt
gen von reellen oder komplexen Zahlen (später auch von kar-
tesischen Produkten reeller oder komplexer Zahlen) in eben- g ◦ f = idX und f ◦ g = idY .
solche Mengen zu untersuchen, man spricht in der Analysis
auch von Funktionen; in der linearen Algebra sind die soge- Dann nennt man f bzw. g umkehrbar oder invertierbar und g
nannten linearen Abbildungen Kern der Untersuchungen. bzw. f die Umkehrabbildung oder das Inverse zu f bzw. g.
Zusammenfassung 59
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
Verständnisfragen Unter der Annahme, dass die Unschuldigen die Wahrheit ge-
sagt haben, finde man den Täter bzw. die Täterin.
2.1 • Welche der folgenden Aussagen sind richtig?
Für alle x ∈ R gilt:
2.7 •• Es seien A eine Menge und F eine Menge von
(a) „x > 1 ist hinreichend für x 2 > 1.“
Teilmengen von A. Beweisen Sie die folgenden (allgemeine-
(b) „x > 1 ist notwendig für x 2 > 1.“
ren) Regeln von De Morgan:
(c) „x ≥ 1 ist hinreichend für x 2 > 1.“
(d) „x ≥ 1 ist notwendig für x 2 > 1.“
A\ B = (A\B) und
2.2 •• Wie viele unterschiedliche binäre, also zwei Aus- B∈F B∈F
sagen verknüpfende Junktoren gibt es?
A\ B = (A\B) .
Rechenaufgaben B∈F B∈F
2.6 •• Geheimrat Gelb, Frau Blau, Herr Grün und 2.10 •• Es seien A, B, C Mengen und f : A → B,
Oberst Schwarz werden eines Mordes verdächtigt. Genau g : B → C Abbildungen.
einer bzw. eine von ihnen hat den Mord begangen. Beim (a) Zeigen Sie: Ist g ◦ f injektiv, so ist auch f injektiv.
Verhör sagen sie Folgendes aus: (b) Zeigen Sie: Ist g ◦ f surjektiv, so ist auch g surjektiv.
Geheimrat Gelb: Ich war es nicht. Der Mord ist im Salon (c) Geben Sie ein Beispiel an, in dem g ◦ f bijektiv, aber
passiert. weder g injektiv noch f surjektiv ist.
Frau Blau: Ich war es nicht. Ich war zur Tatzeit mit Oberst 2.11 •• Es seien A, B Mengen und f : A → B eine
Schwarz zusammen in einem Raum. Abbildung. Die Potenzmengen von A bzw. B seien A bzw. B.
Herr Grün: Ich war es nicht. Frau Blau, Geheimrat Gelb und Wir betrachten die Abbildung g : B → A, B → f −1 (B ).
ich waren zur Tatzeit nicht im Salon. Zeigen Sie:
Oberst Schwarz: Ich war es nicht. Aber Geheimrat Gelb war (a) Es ist f genau dann injektiv, wenn g surjektiv ist.
zur Tatzeit im Salon. (b) Es ist f genau dann surjektiv, wenn g injektiv ist.
Antworten der Selbstfragen 61
2.12 •• Begründen Sie die Bijektivität der auf Seite 46 2.16 •• Auf einer Menge A seien zwei Äquivalenzrela-
angegebenen Abbildung tionen ∼ und ≈ gegeben. Dann heißt ∼ eine Vergröberung
⎧ von ≈, wenn für alle x, y ∈ A mit x ≈ y auch x ∼ y gilt.
⎨(−1, 1) → R,
(a) Es sei ∼ eine Vergröberung von ≈. Geben Sie eine sur-
f: x
⎩ x → . jektive Abbildung
1 − x2 f : A/≈ → A/∼
an.
2.13 •• Geben Sie für die folgenden Relationen auf Z (b) Für m, n ∈ N sind durch
jeweils an, ob sie reflexiv, symmetrisch oder transitiv sind. x ∼ y ⇔ m | (x − y)
Welche der Relationen sind Äquivalenzrelationen? und
x ≈ y ⇔ n | (x − y)
(a) ρ1 = {(m, n) ∈ Z × Z | m ≥ n}, Äquivalenzrelationen auf Z definiert.
(b) ρ2 = {(m, n) ∈ Z × Z | m · n > 0} ∪ {(0, 0)},
Bestimmen Sie zu n ∈ N die Menge aller m ∈ N, sodass
(c) ρ3 = {(m, n) ∈ Z × Z | m = 2n},
∼ eine Vergröberung von ≈ ist.
(d) ρ4 = {(m, n) ∈ Z × Z | m ≤ n + 1},
(e) ρ5 = {(m, n) ∈ Z × Z | m · n ≥ −1}, (c) Geben Sie die Abbildung f aus Teil (a) für m = 3 und
(f) ρ6 = {(m, n) ∈ Z × Z | m = 2}. n = 6 explizit an, indem Sie für sämtliche Elemente von
Z/≈ das Bild unter f angeben.
2.14 •• Wo steckt der Fehler in der folgenden Argumen-
2.17 •• Es sei ρ eine reflexive und transitive Relation
tation?
auf einer Menge A. Zeigen Sie:
Ist ∼ eine symmetrische und transitive Relation auf einer (a) Durch
Menge M, so folgt für a, b ∈ M mit a ∼ b wegen der Sym- x ∼ y ⇔ ((x, y) ∈ ρ und (y, x) ∈ ρ)
metrie auch b ∼ a. Wegen der Transitivität folgt aus a ∼ b
wird eine Äquivalenzrelation auf A definiert.
und b ∼ a auch a ∼ a. Die Relation ∼ ist also eine Äquiva-
(b) Für x ∈ A sei [x] ∈ A/∼ die Äquivalenzklasse von x
lenzrelation.
bezüglich ∼ . Durch
[x] [y] ⇔ (x, y) ∈ ρ
2.15 •• Zeigen Sie, dass die folgenden Relationen
wird eine Ordnungsrelation auf A/∼ definiert.
Äquivalenzrelationen auf A sind. Bestimmen Sie jeweils die
Äquivalenzklassen von (2, 2) und (2, −2). 2.18 •• Es seien A eine Menge und P (A) die Potenz-
(a) A = (a, b) ∼ (c, d) ⇔
R2 , =
a2 + b2 c2 + d2. menge von A. Zeigen Sie:
(b) A = R2 , (a, b) ∼ (c, d) ⇔ a · b = c · d. (a) Es gibt eine injektive Abbildung A → P (A).
(c) A = R2 \{(0, 0)}, (a, b) ∼ (c, d) ⇔ a · d = b · c. (b) Es gibt keine surjektive Abbildung A → P (A).
S. 28 S. 30
Die Negationen lauten: Offensichtlich ist A hinreichend für B; denn, wenn die Zahl
Die Sonne scheint nicht. durch 12 teilbar ist, ist sie sicher auch durch 3 teilbar. Also
Es gibt mindestens einen schwarzen Schwan. ist die Implikation A ⇒ B wahr. Das bedeutet gleichzeitig,
Alle natürlichen Zahlen sind entweder kleiner oder gleich dass B eine notwendige Bedingung für A ist.
17 23
8 oder größer oder gleich 8 . Genauso ist A hinreichend für C und somit C notwendig für
A. Bei der Beziehung zwischen B und C beobachten wir,
S. 29 dass B sowohl notwendig als auch hinreichend für C ist.
Die Wahrheitstabelle ist Diese Beziehung zwischen Aussagen wird äquivalent ge-
nannt, wie wir noch sehen werden.
A B A ↑ B AX B
w w f f S. 32
w f w w
A B A ⇔ B A ⇒ B B ⇒ A (A ⇒ B)
f w w w
∧(B ⇒ A)
f f w f
w w w w w w
Die NAND-Verknüpfung können wir etwa so beschreiben: w f f f w f
A ↑ B ist genau dann falsch, wenn die Aussagen A und B f w f w f f
beide wahr sind. f f w w w w
62 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik
S. 36 S. 45
Es gilt Aus f (n) = f (m) folgt n − 1 = m − 1 und somit n = m.
A ⊆ B ⇔ ∀ x ∈ A: x ∈ B Damit ist f injektiv. Ist n ∈ N beliebig, so gilt mit n + 1 ∈ N
und offenbar f (n+1) = n. Damit ist f auch surjektiv. Schließlich
ist f bijektiv.
A B ⇔ (∀ x ∈ A : x ∈ B) ∧ (∃ y ∈ B : y ∈ A) .
S. 49
S. 38 Der Graph Gf einer Abbildung f ist eine linkstotale Rela-
Es sind jeweils die zwei Implikationen ⇒ und ⇐ zu zei- tion, da es zu jedem x ∈ X ein y ∈ Y mit (x, y) ∈ Gf gibt
gen. Beim Nachweis von ⇒ wird die Aussage links davon – das x steht links. Der Graph ist rechtseindeutig, da es zu
vorausgesetzt und die Aussage rechts davon begründet, bei jedem x ∈ X genau ein y ∈ Y mit (x, y) ∈ f gibt – das y
Nachweis von ⇐ ist es genau umgekehrt: steht rechts.
(i) ⇒: A ∪ B = {x | x ∈ A ∨ x ∈ B} = {x | x ∈ B} = B. Bei einer injektiven Abbildung f ist für jedes y ∈ Y das
⇐: x ∈ A ⇒ x ∈ B. x ∈ X mit (x, y) ∈ Gf eindeutig bestimmt – das x steht
links. Bei einer surjektiven Abbildung f gibt es zu jedem
(ii) ⇒: A ∩ B = {x | x ∈ A ∧ x ∈ B} = {x | x ∈ A} = A. y ∈ Y ein x ∈ X mit (x, y) ∈ Gf – das y steht rechts.
⇐: x ∈ A ⇒ x ∈ B.
S. 51
(iii) ⇒: A \ B = {x | x ∈ A ∧ x ∈ B} = ∅. Nein, z. B. sind die beiden natürlichen Zahlen 3 und 7 nicht
⇐: x ∈ A ⇒ x ∈ B. miteinander vergleichbar, es gilt weder 3 | 7 noch 7 | 3.
S. 42 S. 53
Ist X = {x1 , . . . , xn }, so gilt für jedes f ∈ Y X Jeder Mensch hat genauso viele Kopfhaare wie er selbst, d. h.,
m ∼ m für jedes m ∈ M. Und wenn m1 genauso viele Kopf-
f = {(x1 , f (x1 )) . . . , (xn , f (xn ))} . haare wie m2 hat, so hat m2 genauso viele wie m1 , d. h.
m1 ∼ m2 ⇒ m2 ∼ m1 . Analog begründet man m1 ∼ m2
Für jedes f (xi ) hat man |Y | viele Möglichkeiten, damit gibt und m2 ∼ m3 impliziert m1 ∼ m3 . In der Äquivalenz-
es genau |Y |n verschiedene Abbildungen f von X in Y . klasse
[m]∼ = {n ∈ M | m ∼ n}
S. 43
Z. B. f : R → R, f (x) = x 2 . Die Restriktion f |R≥0 der liegen all jene Menschen, die gleich viele Kopfhaare haben
Funktion f auf die nichtnegativen reellen Zahlen hat dasselbe wie m.
Bild wie f .
Algebraische Strukturen
– ein Blick hinter die 3
Rechenregeln
Was bedeuten Gruppen, Ringe
und Körper in der Mathematik?
Was versteht man unter der
Symmetriegruppe eines
Ornaments?
Was ist der euklidische
Algorithmus?
3.1 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2 Homomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.3 Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.4 Ringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Die Tätigkeit, die umgangssprachlich mit „Rechnen“ bezeichnet Ausdrücke an und erhalten einen eindeutigen Ausdruck der-
wird, ist ein zielorientiertes Hantieren mit Symbolen und mit selben Art wie die Ausgangswerte. Im Sinne von Kapitel 2
Regeln, die man einfach weiß, ohne sie immer extra aufzulisten. liegt eine Abbildung von Elementepaaren auf ein einzelnes
Im Rahmen der Schulmathematik sind die Symbole Zahlen, Element vor. Das vierte Beispiel schieben wir vorerst bei-
Unbestimmte, aber auch Mengen oder Funktionen. Auch die seite, denn das „Ergebnis“ ist schließlich ein Bruch, also von
Rechenoperationen wie Addition, Subtraktion, Multiplikation, anderer Art als die Eingangselemente.
Vereinigung, Durchschnitt, Differenziation und Integration wer-
Wir verallgemeinern: Weil das Operationssymbol alles mög-
den durch Symbole ausgedrückt.
liche bedeuten kann, schreiben wir dafür ∗, ohne zu erklären,
In diesem Kapitel wollen wir genauer klären, was man eigentlich was damit gemeint ist. Wir legen uns auch nicht fest, worauf
klarstellen sollte, bevor man mit dem „Rechnen“ beginnt. Ganz wir die Operation anwenden; wir sprechen in der folgenden
im Sinne des Bestrebens der Mathematik, das Gemeinsame Definition lediglich von den Elementen a, b einer Menge.
bei verschiedenartigen Problemstellungen aufzudecken und da- Bei dieser Allgemeinheit können wir natürlich nichts über
mit zu abstrahieren, werden wir gewisse Grundeigenschaften das Ergebnis der Operation sagen. Wir wissen nur, dass es
von Rechenoperationen kennenlernen. Dabei unterscheiden wir eindeutig ist und bezeichnen es mit dem Symbol a ∗ b.
diese nicht nach den Objekten, auf welche diese Operationen
anzuwenden sind, sondern einzig nach den Regeln, welche für Definition einer Verknüpfung
diese Operationen gelten. Nur so ist der Blick auf das Wesent- Ist M eine nichtleere Menge, so heißt eine Abbildung
liche möglich.
M × M → M,
Zudem werden wir einzelne, häufig auftretende Grundtypen ∗:
algebraischer Strukturen kennenlernen, in welchen gewisse (a, b) → a ∗ b
Regeln gleichzeitig erfüllt sein müssen. Dazu gehören jedenfalls
Verknüpfung auf M.
die Gruppen, Ringe und Körper, aber noch viele andere, die in
diesem Rahmen außer Acht bleiben.
Beispiel
Wir bauen im Folgenden auf einfachen Kenntnissen der Schul- Die Addition zweier ganzer Zahlen a, b zu a + b sowie
mathematik auf und nutzen die Grundbegriffe und logischen deren Multiplikation zu a · b, aber auch die Subtraktion
Schlussweisen aus Kapitel 2. Bei den reellen und komplexen zu a − b sind Verknüpfungen auf Z.
Zahlen legen wir unser Hauptaugenmerk auf deren algebraische Ebenso stellen die Addition zweier reeller Zahlentripel
Eigenschaften; die Ordnungseigenschaften folgen im nächsten gemäß
Kapitel. Wir werden aber nicht nur mit Zahlen „rechnen“, (a1 , a2 , a3 ) + (b1 , b2 , b3 ) =
sondern auch Mengen oder Abbildungen miteinander „multipli- (a1 + b1 , a2 + b2 , a3 + b3 )
zieren“. Diese Stufe der Abstraktion stellt für Studienanfänger oder auch die Bildung des Vektorprodukts
eine klare Hürde dar, ist aber unumgänglich für ein tieferes
(a1 , a2 , a3 ) × (b1 , b2 , b3 ) =
mathematisches Verständnis.
(a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 )
Verknüpfungen auf R3 dar.
3.1 Gruppen Für je zwei Mengen M1 , M2 sind die Mengen M1 ∩ M2 ,
M1 ∪ M2 und M1 \ M2 wohldefiniert. Handelt es sich
Werden zwei Geldbeträge addiert, so ist das Ergebnis wohl- bei M1 und M2 um Teilmengen einer Menge G, so sind
bestimmt und wieder ein Geldbetrag. Dasselbe gilt, wenn wir auch M1 ∩ M2 , M1 ∪ M2 und M1 \ M2 Teilmengen von
von dem ersten Geldbetrag den zweiten subtrahieren, doch G. Somit bedeuten ∩, ∪ und \ Verknüpfungen auf der
erwarten wir dabei ein anderes Ergebnis. Wir können ande- Potenzmenge P (G) (siehe Kapitel 2, Seite 37)
rerseits (a +b) mit (a −b) multiplizieren und für das Produkt
Das Ergebnis einer Verknüpfung ∗ auf M ist wiederum ein
(a 2 − b2 ) schreiben. Dagegen steht uns für das Ergebnis der
Element von M. Die Verknüpfung führt also nicht aus der
Division (a + b) : (a − b) kein neuer Ausdruck zur Ver-
Menge heraus. Wir sagen: M ist abgeschlossen gegenüber
fügung; wir können das Ergebnis höchstens noch als Bruch
a+b der Verknüpfung ∗ .
a−b darstellen; aber „ausgerechnet“ haben wir dabei eigent-
lich nichts. ?
Welche der folgenden Operationen stellt eine Verknüpfung
Was ist das Gemeinsame dieser verschiedenen Operationen?
auf der Menge N der natürlichen Zahlen dar: Addition, Sub-
traktion, Multiplikation, Division?
Addition und Subtraktion sind Beispiele einer
Verknüpfung In der obigen Definition einer Verknüpfung wird nicht ver-
langt, dass das Ergebnis a ∗ b von der Reihenfolge unab-
Bei den ersten drei Beispielen wenden wir eine Rechenopera- hängig ist – im Gegenteil, M × M ist ja die Menge der ge-
tion, die Addition, Subtraktion oder Multiplikation, auf zwei ordneten Paare und daher (a, b) = (b, a), sofern a = b
3.1 Gruppen 65
ist. Die Subtraktion ganzer Zahlen ist offensichtlich ein Bei- Element mit dieser Eigenschaft. Das zu a linksinverse Ele-
spiel einer Verknüpfung, bei der die Reihenfolge wesentlich ment ist −a, denn (−a) + a = 0. (N, +) und (N0 , +) sind
ist. Wir werden dies als Normalfall betrachten und verstehen keine Gruppen, denn es fehlen die inversen Elemente.
a ∗ b = b ∗ a als Zusatzbedingung. (Q, ·) ist keine Gruppe. Zwar gibt es das linksneutrale
Element 1, und etwa zu 2 gibt es das Linksinverse 12 , denn
Ist ∗ eine Verknüpfung auf der Menge M, so gilt für a, b, 1
c ∈ M: 2 · 2 = 1. Aber es gibt kein linksinverses Element zu
0, also keine rationale Zahl a mit a · 0 = 1. Jedoch ist
a =b ⇒ a∗c =b∗c und c∗a = c∗b. (3.1) (Q \ {0}, ·) eine Gruppe, und ebenso ist (R \ {0}, ·) eine
kommutative Gruppe.
Beweis: a ∗ c bezeichnet das Bild des Paares (a, c) unter der In den bisher vorgestellten Beispielen war das neutrale Ele-
Abbildung ∗ : (M ×M) → M. Im Falle der Gleichheit a = b ment eindeutig. Auch waren die Gruppen kommutativ, und
gilt (a, c) = (b, c); also müssen auch deren Bilder überein- natürlich ist dann ein linksneutrales Element zugleich rechts-
stimmen. Aus demselben Grund hat a = b die Gleichheit der neutral, d. h., a ∗ e = a, und das linksinverse Element a zu
Paare (c, a) = (c, b) zur Folge und weiter c ∗ a = c ∗ b . a ist auch rechtsinvers, d. h., a ∗ a = e. Der folgende Satz
Wir können (3.1) auf folgende Weise in Worte fassen: Die wird zeigen, dass dies nicht nur auf kommutative Gruppen
in einer Gleichung ausgedrückte Übereinstimmung zwischen beschränkt bleibt, sondern allgemein der Fall ist.
der linken und der rechten Seite bleibt bestehen, wenn man Man hätte demnach so wie in manchen Lehrbüchern im
beide Seiten von rechts mit demselben Element verknüpft. Axiom (G2) gleich die Existenz eines einzigen neutralen Ele-
Dasselbe gilt für eine Verknüpfung von links. mentes fordern können sowie in (G3) zu jedem Element a
die Existenz eines links- und gleichzeitig rechtsinversen Ele-
ments. Es ist aber das Bestreben in der Mathematik, in den
Gruppen sind durch drei Axiome Definitionen möglichst wenig zu fordern. Deshalb wird hier
gekennzeichnet der Mehraufwand in Form des folgenden Satzes samt zuge-
hörigem Beweis in Kauf genommen.
Je nach Art der Regeln, die für eine Menge M mit einer
Verknüpfung ∗ gelten, lassen sich verschiedene Begriffe de- Satz vom neutralen und vom inversen Element
finieren. Wir beginnen mit einem, der in unterschiedlchsten In jeder Gruppe (G, ∗) gibt es genau ein neutrales Ele-
Bereichen der Mathematik auftritt und dessen Rechenregeln ment e mit e ∗ x = x ∗ e = x für alle x ∈ G.
uns vom Rechnen mit Zahlen sehr vertraut sind.
Ferner gibt es zu jedem a ∈ G genau ein inverses Ele-
ment a −1 mit der Eigenschaft
Definition einer Gruppe
Die Menge G mit der Verknüpfung ∗ heißt Gruppe, a ∗ a −1 = a −1 ∗ a = e .
wenn die folgenden Eigenschaften erfüllt sind:
(G1) Für alle a, b, c ∈ G gilt: (a ∗ b) ∗ c = a ∗ (b ∗ c), Das inverse Element a −1 ist somit gleichzeitig links-
d. h., die Verknüpfung ∗ ist assoziativ. und rechtsinvers.
(G2) Es existiert ein linksneutrales Element e ∈ G mit
e ∗ a = a für alle a ∈ G. Beweis: Wir zeigen dies in vier Schritten, indem wir je-
(G3) Zu jedem a ∈ G existiert ein hinsichtlich e links- weils ein wichtiges Zwischenergebnis formulieren und dann
inverses Element a ∈ G mit a ∗ a = e. begründen:
Wir sprechen kurz von der Gruppe (G, ∗).
Gilt stets a ∗ b = b ∗ a, so heißt die Gruppe kommutativ (i) In einer Gruppe ist das hinsichtlich e zu a linksinverse
oder abelsch – nach dem norwegischen Mathematiker Element a zugleich rechtsinvers. Somit gilt auch a ∗ a = e .
Niels H. Abel (1802–1829). Beweis: Nach der Definition einer Gruppe gibt es zu a ein
a mit a ∗ a = e und ferner zu a ein a mit a ∗ a = e.
Folglich gilt nach den einzelnen Punkten der Gruppendefini-
? tion
Wir betrachten auf der Menge P (M) aller Teilmengen von
M = {1, 2, 3} die Verknüpfungen ∩, ∪ und \. Welche sind e
(G3) (G2) (G3)
= a ∗ a = a ∗ (e ∗ a ) = a ∗ (a ∗ a) ∗ a
assoziativ? Für welche existiert ein linksneutrales Element? (G1) (G3) (G2)
Gibt es linksinverse Elemente? = (a ∗ a ) ∗ (a ∗ a ) = e ∗ (a ∗ a ) = a ∗ a .
(ii) Das linksneutrale Element e ist zugleich rechtsneutral,
daher stets auch a ∗ e = a.
Beispiel Beweis: Es ist
Offensichtlich ist (Z, +) eine kommutative Gruppe. Da-
a ∗ e = a ∗ (a ∗ a) = (a ∗ a ) ∗ a = e ∗ a = a.
(G3) (G1) (i) (G2)
bei ist 0 linksneutral, denn 0 +a = a, und 0 ist das einzige
66 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Nun fehlt noch der Nachweis der Eindeutigkeit sowohl von bei der Verknüpfung nicht ohne Weiteres vertauschen. Dies
e als auch von a −1 . gilt z. B. auch bei der folgenden, in allen Gruppen gültigen
Formel:
(iii) In einer Gruppe ist das neutrale Element e eindeutig be-
(a ∗ b)−1 = b−1 ∗ a −1 . (3.3)
stimmt. Der Hinweis „hinsichtlich e“ bei den inversen Ele-
menten kann somit entfallen.
?
Beweis: Angenommen, e ist ebenfalls ein neutrales Element. Wie kann (3.3) bewiesen werden?
Dann gilt:
e = e ∗ e = e .
(ii) (G2)
Gruppen sind in vielen Bereichen der Mathematik anzutref-
Somit ist e eindeutig bestimmt. fen. Wir beginnen mit den geläufigen Beispielen:
und g ◦ f ist wieder bijektiv (Seite 49). Wir zeigen, dass aus den Kürzungsregeln (3.2) folgt
(G, ◦) eine Gruppe ist, die Permutationsgruppe von M.
(a ◦ c = b ◦ c oder c ◦ a = c ◦ b) ⇒ a = b.
Die Verknüpfung ◦ ist assoziativ, denn bei f, g, h ∈ G ist
Dass die Permuationsgruppe (G, ◦) von M nicht kommutativ
g ◦ f : x → g(f (x)), h ◦ (g ◦ f ) : x → h (g(f (x))) , ist, zeigt ein Vergleich der Produkte
h ◦ g : x → h(g(x)), (h ◦ g) ◦ f : x → h (g(f (x))) . g ◦ i : 1 → 2, 2 → 1, 3 → 3, g ◦ i = h,
also
i ◦ g : 1 → 1, 2 → 3, 3 → 2, i ◦ g = f.
Dies gilt nicht nur für Bijektionen, sondern für alle hinter-
einander ausführbaren Abbildungen, wie bereits in Kapi- Somit gilt:
tel 2 festgestellt worden ist. g ◦ i = i ◦ g.
Neutrales Element ist die identische Abbildung Die Bijektion i rückt jede Zahl zyklisch um 1 weiter; zyklisch
idM : x → x für alle x ∈ M. heißt 1 → 2 → 3 → 1. Damit wird klar, warum i −1 = j ist,
Zu jeder Bijektion f von M existiert nach Kapitel 2 denn j macht dasselbe in der entgegengesetzten Richtung.
(Seite 48) die Umkehrabbildung f −1 ∈ G mit f −1 ◦ f =
idM . Die Gruppe der Permutationen einer Menge von n Elementen
heißt symmetrische Gruppe und wird üblicherweise mit Sn
bezeichnet. Demnach behandeln wir in diesem Beispiel die
Satz von der Permutationsgruppe
symmetrische Gruppe S3 .
Die bijektiven Abbildungen einer nichtleeren Menge M
auf sich bilden hinsichtlich der Hintereinanderausfüh- ?
rung ◦ eine Gruppe, die Permutationsgruppe von M. Ergänzen Sie in der obigen Gruppentafel die fehlenden Ele-
mente.
Nun sei M = {1, 2, 3}: Dann umfasst die Permutations-
gruppe G von M die folgenden Bijektionen: Bei einer genaueren Analyse der obigen Gruppentafel kann
man feststellen, dass die Teilmenge {i, j, e} abgeschlossen
e: 1 → 1, 2 → 2, 3 → 3,
ist unter ◦, denn die Produkte i ◦ i = j , i ◦ j = j ◦ i = e
f: 1 → 1, 2 → 3, 3 → 2,
und j ◦ j = i wie auch alle jene mit e haben als Ergebnis
g: 1 → 3, 2 → 2, 3 → 1,
wieder ein Element aus dieser Teilmenge. Diese Teilmenge
h: 1 → 2, 2 → 1, 3 → 3,
von nur 3 Permutationen bildet für sich eine Gruppe. Dafür
i: 1 → 2, 2 → 3, 3 → 1,
gibt es ein Fachwort:
j: 1 → 3, 2 → 1, 3 → 2.
Wie die durch Hintereinanderausführung entstehenden Pro- Ist (G, ∗) eine Gruppe, und hat eine Teilmenge H von G die
dukte aussehen, zeigt in übersichtlicher Form die folgende Eigenschaft, hinsichtlich der von G stammenden Verknüp-
Tabelle. Offensichtlich könnten die oberste Zeile und die fung eine Gruppe zu sein, so heißt H Untergruppe von G.
Spalte links vom Doppelstrich auch weggelassen werden,
Wir verwenden für die Verknüpfung auf H einfachheitshal-
nachdem die dort aufgelisteten Faktoren bei Multiplikation
ber dasselbe Symbol ∗ wie in G, sprechen also von der
mit dem neutralen Element e erneut als Produkte auftreten.
Gruppe (H, ∗), obwohl mit der „von G stammenden Ver-
Der verbleibende und hier gelb schattierte Teil der Tabelle
knüpfung“ eigentlich die Einschränkung ∗|H ×H von ∗ : G ×
rechts vom vertikalen und unter dem horizontalen Doppel-
G → G auf H × H gemeint ist.
strich heißt Gruppentafel von G.
Hat man festzustellen, ob eine gegebene Teilmenge H eine
◦ e f g h i j Untergruppe der Gruppe (G, ∗) ist, so müssen nicht alle
e◦ e f g h i j Gruppenaxiome überprüft werden. Das folgende Kriterium
f◦ f e zeigt, dass es ausreicht, in H die Abgeschlossenheit gegen-
g◦ g e h über ∗ und die Existenz der inversen Elemente nachzuweisen.
h◦ h e
i◦ i f j e Untergruppenkriterium
j◦ j e i Sind (G, ∗) eine Gruppe und H eine Teilmenge von G,
so ist H dann und nur dann eine Untergruppe von G,
Absichtlich sind in dieser Gruppentafel noch einige Felder wenn gilt:
frei gelassen worden, um Sie zu aktiver Mitarbeit anzuregen: (U1) H ist nicht die leere Menge.
(U2) Für alle x ∈ H ist zugleich x −1 ∈ H .
Jedes der 6 Elemente e, . . . , j muss in jeder Spalte und in (U3) Aus x, y ∈ H folgt stets (x ∗ y) ∈ H .
jeder Zeile der Gruppentafel genau einmal vorkommen, denn
68 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Beweis: Die Formulierung „dann und nur dann“ erfordert, Beweis mithilfe des Untergruppenkriteriums:
dass wir zweierlei zeigen müssen: Zu (U1): H ist nichtleer, weil die identische Abbildung
(i) Ist H eine Untergruppe, so gelten die im Untergruppen- idM jedenfalls N fix lässt, also zu H gehört.
kriterium geforderten Aussagen (U1), (U2) und (U3).
Zu (U2): Bildet die Bijektion f ∈ G die Teilmenge N auf
(ii) Treffen umgekehrt diese drei Aussagen zu, so ist H eine
sich ab, so trifft dasselbe auf die Umkehrabbildung f −1
Untergruppe von G, also (H, ∗) eine Gruppe.
zu. Also liegt auch f −1 in H .
Zu (i): Nach (G2) muss H ein neutrales Element enthalten; Zu (U3): Wenn schließlich neben f auch g die Teilmenge
also ist H nichtleer und damit (U1) bestätigt. N auf sich abbildet, so tut dies auch g ◦ f .
So können wir z. B. für den Sonderfall M = {1, 2, 3}
Als Gruppe enthält H gemäß (G3) mit jedem Element a auch
mit der Gruppentafel von Seite 67 sofort erkennen, dass
das Inverse a −1 . Somit ist auch (U2) erfüllt.
{e, f } eine Untergruppe von (G, ◦) ist, denn e und f sind
Nachdem (H, ∗) eine Gruppe ist, muss nach der Definition die einzigen Permutationen von M, die das Element 1 fix
einer Verknüpfung auf Seite 65 mit x, y ∈ H auch stets x ∗ y lassen. Ebenso sind {e, g} und {e, h} Untergruppen.
in H liegen. Also gilt (U3).
Weitere Beispiele von Untergruppen werden in dem Essay
Zu (ii): Wegen (U3) ist H bezüglich der von G stammenden auf Seite 70 vorgeführt. Dort geht es um bijektive Selbstab-
Verknüpfung ∗ abgeschlossen. Also liegt eine Verknüpfung bildungen unendlicher Punktmengen.
auf H vor.
Wir zeigen im Folgenden, dass jede Untergruppe H von
Die Verknüpfung ∗ auf H ist assoziativ, denn dies ist in ganz (G, ∗) Anlass für eine Äquivalenzrelation ∼H auf der Menge
G garantiert. G ist. Wir definieren
Wegen der Forderung H = ∅ in (U1) gibt es mindestens ein
g2 ∼H g1 ⇐⇒ g1−1 ∗ g2 ∈ H.
Element a ∈ H . Nach (U2) liegt das Inverse a −1 in H und
wegen (U3) auch das Produkt a ∗ a −1 = e. Also gibt es in Offensichtlich ist g2 genau dann hinsichtlich ∼H äquivalent
H ein neutrales Element. zu g1 , wenn g1−1 ∗ g2 = h, also g2 = g1 ∗ h ist mit einem
Das letzte Gruppenaxiom (G3) ist schließlich mit der Forde- h ∈ H . Die Menge der zu g1 äquivalenten Elemente lautet
rung (U2) identisch. also
g1 ∗ H = {(g1 ∗ h) | h ∈ H }.
Eine ausführliche Diskussion des Untergruppenkriteriums Dass die Relation ∼H auf G tatsächlich reflexiv, symmetrisch
wird in der Box auf Seite 69 präsentiert. und transitiv ist, ergibt sich nun einfach aus den Untergrup-
peneigenschaften von H . Damit sind die Mengen g ∗ H für
Nun wenden wir uns einigen Beispielen von Untergruppen g ∈ G Äquivalenzklassen. Wir nennen sie Linksnebenklas-
zu: sen von H . Auch H = e ∗ H gehört dazu.
Beispiel Alle Linksnebenklassen sind gleich mächtig, denn die Ab-
Jede Gruppe (G, ∗) mit neutralem Element e enthält die bildung
Untergruppen {e} und G. Man nennt diese Untergruppen H → g ∗ H mit h → g ∗ h
die trivialen Untergruppen von G. Wenn wir von einer
echten Untergruppe H sprechen, so meinen wir damit, ist eine Bijektion. Nachdem die Linksnebenklassen als
dass H keine triviale Untergruppe von G ist. Damit ist H Äquivalenzklassen zu einer Partition von G führen (siehe
sicherlich eine echte Teilmenge von G. Seite 55), also jedes Element von G in genau einer Linksne-
Offensichtlich ist in der Folge der Gruppen (Z, +), (Q, +), benklasse vorkommt, erhalten wir im Falle endlicher Grup-
(R, +) und (C, +) jede eine echte Untergruppe der folgen- pen die Anzahl |G| der Elemente von G, wenn wir |H | mit
den. Dasselbe trifft auf die Folge (Q \ {0}, ·), (R \ {0}, ·) der Anzahl der Linksnebenklassen von H in G multiplizie-
und (C \ {0}, ·) zu. Da das Produkt zweier positiver Zah- ren. Damit haben wir das folgende Resultat hergeleitet.
len und auch der Kehrwert einer positiven Zahl stets wie-
der positiv sind, ist (R>0 , ·) eine echte Untergruppe von Satz von Lagrange:
(R \ {0}, ·). Ist H Untergruppe der endlichen Gruppe G, so ist die
Wie im Beispiel auf Seite 66 sei (G, ◦) die Gruppe der Anzahl |H | der Elemente von H ein Teiler von |G|.
Permutationen einer Menge M, und es sei N ⊆ M eine
Teilmenge von M. Mit H sei die Menge derjenigen Bijek-
Wenn wir unsere Relation abwandeln zu
tionen f ∈ G bezeichnet, die die Teilmenge N von M auf
sich abbilden und damit N als Ganzes fix lassen. Damit ist g2 ∼H g1 ⇔ g2 ∗ g1−1 ∈ H,
gemeint, dass jedes f ∈ H die Forderung f (x) ∈ N er-
füllt für alle x ∈ N , was wir kurz als f (N ) ⊆ N schreiben so entsteht erneut eine Äquivalenzrelation. Diesmal fungie-
können. Dann ist H eine Untergruppe von G. ren die Rechtsnebenklassen H ∗ g als Äquivalenzklassen.
3.1 Gruppen 69
Gruppen lassen sich oft aus gewissen Operationen r und s anwenden. Es wird sich herausstellen,
Grundelementen erzeugen dass lediglich 6 verschiedene Werte als Ergebnisse auftreten:
Durch Anwendung von r entsteht aus 3 der Kehrwert
Am Ende dieses Abschnitts wenden wir uns einem Beispiel r(3) = 13 ; durch s geht 3 in s(3) = 1 − 3 = −2 über.
zu, das deshalb etwas schwerer zu erfassen ist, weil die Ele- Wenn wir auf die neuen Werte wiederum r oder s anwen-
mente der Gruppe Bijektionen einer unendlichen Menge sind. den, so entstehen 1 − 13 = 23 und − 12 , oder wir kehren zum
Das Beispiel ist aber recht instruktiv, denn es bereitet künftige
Ausgangswert 3 zurück. Ferner ist r( 23 ) = 23 , und ebenso ist
Begriffe wie Erzeugendensystem und Isomorphie vor.
s(− 12 ) = 23 . Weder r, noch s führen 32 in Werte über, die bis-
her noch nicht aufgetreten sind. Also bleibt es bei der Menge
Beispiel Ausgangspunkt ist die Gruppe (G, ◦) mit G als
der Bilder:
Menge der Bijektionen von R \ {0, 1} auf sich. Allerdings
1 2 1 3
beschränken wir uns auf diejenigen Bijektionen, welche aus 3, , −2, , − , .
den folgenden zwei Abbildungen zusammensetzbar sind: 3 3 2 2
Wir werden erkennen, dass es auch für andere x ∈ R nie
1
r : x → und s : x → 1 − x; mehr als sechs verschiedene Bilder gibt. Hinter diesem Phä-
x nomen steckt nämlich eine nur sechs Elemente umfassende
r bedeutet den Übergang zum Reziprokwert; hier muss x = 0 Untergruppe H , welche trotzdem alle möglichen Produkte
ausgeschlossen werden. s kann als Spiegelung an x = 12 der Bijektionen r und s enthält.
bezeichnet werden; hier muss x = 1 ausgeschlossen werden,
weil dessen Bild x = 0 fehlt. Nach (U3) enthält H neben r und s auch
Mit jeder deckungsgleichen Position ist eine Abbildung diesem Fall nur mehr Drehungen. Wir sagen, die Quadrat-
der Punkte des Originals F auf die jeweils darüberliegen- mitte ist ein vierzähliges Drehzentrum.
den Punkte der Kopie verbunden. Wenn wir die Kopie
als mit dem Original identisch auffassen und deren Trä-
gerebene als R2 interpretieren, so liegt jeweils eine bijek-
tive Punktabbildung R2 → R2 vor, und diese nennen wir
eine Deckbewegung des Ornaments F . Die vorhin als Bei-
spiel erwähnte Verschiebung nach rechts ist eine derartige
Deckbewegung.
Alle Deckbewegungen bilden eine Gruppe, die Symme-
triegruppe von F , denn offensichtlich sind alle drei An-
forderungen aus dem Untergruppenkriterium erfüllt. Nun kehren wir zurück zu dem kompletten Ornament F .
Bei allen Überlegungen müssen wir voraussetzen, dass der Offensichtlich bringen die Drehungen durch ganzzahlige
gezeigte Ausschnitt soweit typisch ist für das unbegrenzte Vielfache von 90◦ um die Quadratmitten nicht nur die
Ornament F , dass eine Übereinstimmung der Kopie mit Teilfigur F1 mit sich zur Deckung, sondern das ganze Or-
dem Original innerhalb des Ausschnitts auch eine Über- nament. Dazu kommen nun noch alle Translationen, also
einstimmung außerhalb garantiert. Parallelverschiebungen, welche ein Quadratzentrum in ein
anderes überführen. Alle diese vierzähligen Zentren sind
im Gesamtbild links durch kleine rote Quadrate markiert.
Die Symmetriegruppe von F wird damit unendlich groß.
Sie umfasst auch die Drehungen durch ganzzahlige Viel-
fache von 90◦ um die zwischen den Quadratzentren lie-
genden Kreuzungspunkte, die in der Abbildung links blau
markiert sind. Schließlich gehören auch noch weitere Dre-
hungen durch 180◦ dazu. Deren Zentren heißen zweizäh-
lig, und sie sind links durch grüne Rauten gekennzeichnet.
also r ◦ r = e mit e als identischer Abbildung, und ebenso lich nicht von der gleichfalls 6 Elemente umfassenden sym-
metrischen Gruppe S3 aus dem Beispiel von Seite 67 unter-
s s
s ◦ s : x → 1 − x → 1 − (1 − x) = x. scheidet.
(r ◦ s ◦ r)−1 = r −1 ◦ s −1 ◦ r −1 = r ◦ s ◦ r.
Hier sind die Elemente f und g involutorisch, denn f ◦ f =
g ◦ g = e. Aber auch h hat diese Eigenschaft.
Verknüpft man r ◦ s ◦ r = s ◦ r ◦ s rechts mit r oder s, so ist
die neue Abbildung gleich r ◦ s oder s ◦ r. Die folgende Bijektion ψ : H → S3 bildet die Elemente von
H auf jene von S3 ab:
Ebenso ist ein Produkt von mehr als vier r- und s-Abbil-
dungen auf eines von höchstens 3 Abbildungen reduzierbar: ψ : e → e, r → f, s → g, r ◦ s → i,
Wann immer nämlich in diesem Produkt zwei gleiche Abbil-
s ◦ r → j, r ◦ s ◦ r → h.
dungen aufeinanderfolgen, kann man diese weglassen. Hier-
auf kann man die Tripel r ◦ s ◦ r und s ◦ r ◦ s wegen de-
Dabei hat ψ eine besondere Eigenschaft, die sich erst bei
ren Gleichheit gegeneinander austauschen, wodurch an den
genauem Hinsehen offenbart. Es ist z. B.
Anschlussstellen wiederum zwei gleiche aufeinanderfolgen
können, die dann wegzulassen sind. Dies geht so lange, bis
ψ(r ◦ s) = i = f ◦ g = ψ(r) ◦ ψ(s),
nur mehr ein Produkt von höchstens 3 Abbildungen vorliegt.
ψ(s ◦ r) = j = g ◦ f = ψ(s) ◦ ψ(r)
Dies beweist: Führt man endlich oft die Bijektionen r oder
s hintereinander aus, so entstehen keine neuen Abbildungen und
gegenüber den bisherigen sechs. Die Menge
ψ(r ◦ s ◦ r) = h = f ◦ g ◦ f = ψ(r) ◦ ψ(s) ◦ ψ(r).
H = {e, r, s, r ◦ s, s ◦ r, r ◦ s ◦ r}
Tatsächlich bekommt man in allen Fällen das ψ-Bild eines in
ist abgeschlossen unter ◦, und zudem ist zu jeder Abbildung H gelegenen Produkts von r- und s-Abbildungen, indem man
auch die Inverse enthalten. Nach dem Untergruppenkriterium zunächst jeden einzelnen Faktor mittels ψ abbildet und dann
ist H eine Untergruppe von G. Weil jedes Element aus H ein die Multiplikation nach der obigen Gruppentafel vornimmt.
Produkt von endlich vielen r- und s-Abbildungen ist, sagen
wir, diese Untergruppe wird von r und s erzeugt, oder r und In diesem Abschnitt widmen wir uns generell derartigen ver-
s bilden ein Erzeugendensystem von H . knüpfungstreuen Abbildungen, denn sie ermöglichen es, bei
verschiedenen Gruppen gemeinsame Strukturen zu erken-
Wir werden im nächsten Abschnitt erkennen, dass sich diese nen. Dabei beschränken wir uns aber nicht nur auf bijektive
Gruppe (H, ◦) trotz ihrer etwas mühsamen Herleitung eigent- Abbildungen.
72 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Bei einem Homomorphismus ist das Bild eines Die zu Beginn dieses Abschnitts gezeigte Bijektion zwi-
Produkts stets gleich dem Produkt der Bilder schen der Gruppe H aus dem Beispiel von Seite 69 und
der Permutationsgruppe S3 zeigt, dass (H, ◦) isomorph ist
zur symmetrischen Gruppe S3 .
Definition eines Homomorphismus
Eine Abbildung ψ : G → G der Gruppe (G, ∗) in die Das Beispiel in der Box auf Seite 73 zeigt mithilfe eines Ho-
Gruppe (G , ∗ ) heißt Homomorphismus, wenn für alle momorphismus, dass man zwischen geraden und ungeraden
a, b ∈ G die Eigenschaft Permutationen unterscheiden kann.
Die Abbildung
Der folgende Satz, welcher Arthur Cayley (1821–1895) zu-
ψ : Z → Q >0 , x → 2 ,x geschrieben wird, unterstreicht die Wichtigkeit der Permuta-
tionsgruppen für die Theorie endlicher Gruppen.
also z. B. 0 → 1, 1 → 2, 2 → 4, −1 → 12 , −2 → 14 ,
ist ein injektiver Homomorphismus (Z, +) → (Q >0 , · ), Der Satz von Cayley
denn
Jede Gruppe (G, ∗) mit n Elementen ist isomorph zu
x+y x y einer Untergruppe der symmetrischen Gruppe Sn .
ψ(x + y) = 2 = 2 · 2 = ψ(x) · ψ(y).
Problemanalyse und Strategie: Im Beweis verwenden wir für das Signum der Permutation σ die Formel
σ (j ) − σ (i)
sgn σ = . (∗)
j −i
i<j
Dabei ist das Symbol für ein Produkt. Im konkreten Fall wird über alle möglichen Paare (i, j ) aus {1, . . . , n} mit
i < j multipliziert. Diese Formel ergibt etwa für das obige Beispiel, nämlich für σ ∈ S5 , den Ausdruck
(2 − 3)(4 − 3)(4 − 2)(5 − 3)(5 − 2)(5 − 4)(1 − 3)(1 − 2)(1 − 4)(1 − 5)
sgn σ = = −1.
(2 − 1)(3 − 1)(3 − 2)(4 − 1)(4 − 2)(4 − 3)(5 − 1)(5 − 2)(5 − 3)(5 − 4)
Wir
erweitern nun Zähler und Nenner mit dem Produkt und sgn ist als surjektiver Homomorphismus bestätigt.
Für die Permutation ψ(gi ) gilt also e = g1 → gi = gi ∗ e, Sind zwei Gruppen isomorph, so ist man geneigt zu sagen, es
g2 → gi ∗ g2 , . . . , gn → gi ∗ gn , somit kurz: handele sich um „dieselbe“ Gruppe, denn in beiden Gruppen
bestehen dieselben Relationen zwischen den einzelnen Ele-
ψ(gi ) : gk → gi ∗ gk für k = 1, . . . , n. menten. Wie die Gruppenelemente aussehen, ist aus struk-
tureller Sicht nebensächlich. Üblicherweise sagt man auch
ψ ist injektiv, denn ψ(gi ) = ψ(gj ) bedeutet zu zwei isomorphen Gruppen, dass sie bis auf Isomorphie
gleich sind.
(gi , gi ∗ g2 , . . . , gi ∗ gn ) = (gj , gj ∗ g2 , . . . , gj ∗ gn ),
(ii) −1
Die Abbildung 3.1 zeigt als Beispiel zu dem Satz von Cay- ψ(a −1 ) = [ψ(a)]−1 = e = e ,
ley, dass die symmetrische Gruppe S3 mit der Gruppentafel
auf Seite 71 isomorph ist zu einer Untergruppe von S6 . Da- also a −1 ∈ ker ψ. Mithilfe des Untergruppenkriteriums ist
bei sind die zu permutierenden sechs Elemente diesmal als somit ker ψ als eine Untergruppe von G nachgewiesen.
Ecken eines regulären Sechsecks dargestellt, und die Pfeile
zeigen, wie diese Ecken durch die Permutationen transfor- Beispiel Wir betrachten nochmals die obigen Beispiele
miert werden. von Homomorphismen und bestimmen die jeweiligen Kerne.
3.2 Homomorphismen 75
Bei dem auf der Seite 72 vorgestellten Homomorphismus Beweis: Die Aussage ψ(a) = ψ(b) ist äquivalent zu
ψ von R \ {0} auf {1, −1} enthält der Kern genau alle [ψ(a)]−1 ∗ ψ(b) = e , also nach der Homomorphieeigen-
positiven reellen Zahlen, also ker ψ = R>0 . schaft (ii) ψ a −1 ∗ b = e , und genau dann ist x = a −1 ∗ b
Bei dem injektiven Homomorphismus ψ : x → 2x von im Kern enthalten und b = a ∗ x. Dafür schreiben wir kurz
Seite 72 ist ker ψ = {0}, denn 0 ist neutrales Element von
(Z, +). b ∈ (a ∗ ker ψ) = {a ∗ x | x ∈ ker ψ}.
Das Beispiel auf Seite 72 behandelt den Isomorphismus Auf analoge Weise lässt sich die Äquivalenz zwischen (1) und
von H auf die symmetrische Gruppe S3 . Auch hier ent- (3) begründen: Die Aussage ψ(a) = ψ(b) ist auch äquivalent
hält ker ψ nur das neutrale Element, also die identische zu ψ(b) ∗ [ψ(a)]−1 = e , und dies gilt genau dann, wenn
Abbildung aus H . b = y ∗ a mit y ∈ ker ψ, also b ∈ ker ψ ∗ a.
In dem Beispiel auf Seite 73, der homomorphen Abbil-
dung der Permutationen σ ∈ Sn auf deren Signum, um-
fasst der Kern genau die geraden Permutationen von Sn ,
also jene mit sign (σ ) = 1. Diese bilden nach obigem Satz Jeder Homomorphismus von G nach G
eine Untergruppe von (Sn , ◦), die alternierende Gruppe bestimmt eine Zerlegung von G in Klassen
An vom Grad n. So ist z. B. die auf Seite 67 vorge-
von Elementen mit jeweils gleichem Bild
stellte Untergruppe {e, i, j } der S3 gleich der alternierende
Gruppe A3 , denn die Permutationen e, i und j sind gerade,
Die Fasern des Homomorphismus ψ haben die Form
wie die Abzählung ihrer Fehlstände zeigt.
Bereits im Beispiel auf Seite 53 wurde darauf hingewiesen, a ∗ ker ψ = ker ψ ∗ a. (3.4)
dass jede Abbildung ϕ : M → N in der Definitionsmenge Man nennt sie Nebenklassen von ker ψ. Nach Seite 68 sind
M eine Äquivalenzrelation festlegt, wenn Elemente mit dem- sie gleichzeitig Links- und Rechtsnebenklassen des Kerns
selben Bild als zueinander äquivalent definiert werden. Die ker ψ.
zugehörigen Äquivalenzklassen sind die Fasern der Abbil-
dung ϕ. Die Gleichung a ∗ ker ψ = ker ψ ∗ a bedeutet nicht, dass
G kommutativ ist, sondern nur, dass zu jedem u ∈ ker ψ ein
x3 u ∈ ker ψ existiert mit a ∗ u = u ∗ a sowie ein u ∈ ker ψ mit
eine Faser von ϕ
u ∗ a = a ∗ u. Der Kern ist damit eine Untergruppe von G
mit der besonderen Eigenschaft, dass jede Linksnebenklasse
gleichzeitig eine Rechtsnebenklasse ist. Eine derartige Un-
tergruppe U von G heißt Normalteiler von G: In diesem Fall
R3 gilt für alle a ∈ G
x a ∗ U = U ∗ a.
ϕ
Folgerung (D)
er Kern ker ψ des Homomorphismus ψ : G → G ist
ϕ (R 3) ein Normalteiler von G.
x2
x1 ϕ (x )
Man kann übrigens beweisen, dass sich diese Folgerung auch
umkehren lässt: Zu jedem Normalteiler U von G gibt es einen
Abbildung 3.2 Die Fasern der Abbildung ϕ : R3 → R3 mit (x1 , x2 , x3 ) →
Homomorphismus ψ mit ker ψ = U .
(x1 , x2 , 0) sind Geraden parallel zur x3 -Achse.
?
Dies gilt insbesondere für Homomorphismen ψ : G → G . Wir haben festgestellt, dass zu jedem u ∈ ker ψ ein u ∈ ker ψ
Eine spezielle Faser ist dabei der Kern ker ψ als Menge existiert mit u ∗ a = a ∗ u.
der Urbilder des neutralen Elements e ∈ G . Das folgende
Lemma führt auf eine einheitliche Darstellung aller Fasern. (1) Warum ist für ein fest gewähltes a ∈ G die Abbildung
ψa : G → G, u → u = a −1 ∗ u ∗ a
Lemma
Ist ψ : G → G ein Homomorphismus, so sind die folgen- ein Isomorphismus von (G, ∗) auf sich, also nach Seite 72
den Aussagen zueinander äquivalent: ein Automorphismus? Man nennt ψa einen inneren Automor-
phismus von G.
(1) Die Elemente a, b ∈ G haben dasselbe Bild ψ(a) =
ψ(b); (2) Warum bildet ψa jeden Normalteiler U von G auf sich
(2) Es gibt ein x ∈ ker ψ mit b = a ∗x, also b ∈ (a ∗ker ψ); ab?
(3) Es gibt ein y ∈ ker ψ mit b = y ∗a, also b ∈ (ker ψ ∗a).
76 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Beispiel Wir bestimmen für zwei Homomorphismen die Als Fasern des Homomorphismus ψ sind die Nebenklassen
Nebenklassen des Kerns. von ker ψ gleichzeitig Äquivalenzklassen. Daher ermögli-
chen sie eine Partition von G. Jedes Element von G gehört
Bei dem Homomorphismus ψ von (R \ {0}, · ) auf
genau einer Nebenklasse an. Die folgende Tabelle zeigt in der
({1, −1}, · ) aus dem ersten Beispiel auf Seite 72 ist
linken Spalte die Menge der Nebenklassen, die mit G/ ker ψ
ker ψ = R>0 . Die zweite Nebenklasse, das Urbild von
bezeichnet wird, und rechts die jeweiligen Bildelemente.
−1, lautet im Sinne von (3.4):
G/ ker ψ ψ(G)
R<0 = (−1) · R>0 = R>0 · (−1).
ker ψ e
a ∗ ker ψ = ker ψ ∗ a ψ(a)
Bei der homomorphen Abbildung sgn der Permutationen b ∗ ker ψ = ker ψ ∗ b ψ(b)
auf deren Signum (Seite 73) umfasst ker sgn = An die ge- .. ..
raden Permutationen von Sn . Nachdem das Produkt einer . .
geraden und einer ungeraden Permutation ungerade ist,
kann die zweite Nebenklasse, die Menge aller ungeraden Wir können uns die Nebenklassen als „Ablagefächer“ vor-
Permutationen, mithilfe einer beliebigen ungeraden Per- stellen, in die wir alle Elemente von G je nach Bild einsortiert
mutation σ im Sinne von (3.4) als σ ◦ An oder auch als haben. Dann ist es weniger überraschend, wenn wir dem-
An ◦ σ geschrieben werden. nächst auf der Menge der Nebenklassen eine Verknüpfung
definieren. Dann rechnen wir statt mit Zahlen oder Abbil-
dungen eben mit den Fächern, indem wir je zwei Fächern ein
? „Produktfach“ zuordnen.
Warum ist die Menge der ungeraden Permutationen keine
Untergruppe von (Sn , ◦)?
Wir können die Verknüpfung " aber auch wie folgt be-
Beweis: Ist ψ injektiv, so wird nach (i) lediglich das neu- schreiben: Um das Produkt zweier Nebenklassen zu be-
trale Element e ∈ G auf das neutrale Element e von G kommen, wählen wir aus beiden Klassen ein Element aus,
abgebildet. Ist umgekehrt ker ψ = {e}, so umfassen alle Ne- also einen Repräsentanten a bzw. b. Anschließend verknüp-
benklassen jeweils nur ein Element. Dies bedeutet, zu jedem fen wir die beiden und erklären diejenige Nebenklasse zur
Bildelement in ψ(G) gibt es nur ein Urbild in G; also ist ψ Produkt-Nebenklasse, in welcher a ∗ b liegt.
injektiv.
Ist der Homomorphismus nicht injektiv, so ist der Reprä-
sentant einer Nebenklasse nicht eindeutig. Wir müssen da-
Ein Beispiel für einen injektiven Homomorphismus ist her noch zeigen, dass " tatsächlich eine Verknüpfung auf
ψ : (Z, +) → (Q >0 , · ) mit x → 2x von Seite 72. Wir ha- G/ ker ψ ist. Dies erfordert den Nachweis, dass die Produkt-
ben bereits festgestellt, dass hier der Kern nur ein Element Nebenklasse unabhängig ist von der Wahl der Repräsentan-
enthält, nämlich ker ψ = {0}. ten. Also ersetzen wir a durch a ∈ (a ∗ ker ψ) und b durch
3.2 Homomorphismen 77
..
···
.
ψ(b)
G
Nun wissen wir wegen der Normalteiler-Eigenschaft des
Kerns, dass zu u ∈ ker ψ ein u ∈ ker ψ existiert mit ϕ
u ∗ b = b ∗ u. Daher folgt:
b∗ker ψ
a ∗ b = a ∗ (b ∗ u) ∗ v = (a ∗ b) ∗ (u ∗ v),
. G/ ker ψ
.
.
ker ψ
a ∗ker ψ
und dieses liegt in (a ∗ b) ∗ ker ψ, denn mit u, v ∈ ker ψ
gehört wegen der Untergruppeneigenschaft auch u ∗ v dem
Abbildung 3.3 Illustration zum Homomorphiesatz: Der Homomorphismus
Kern an. ψ : G → G induziert einen Isomorphismus ϕ zwischen der Faktorgruppe
G/ ker ψ (unten) und der Bildmenge ψ(G) (rechts oben).
Diese kurze Rechnung hat bestätigt: Die Produkt-Neben-
klasse ist tatsächlich unabhängig von der Auswahl der Re-
präsentanten. Kommentar: (a) Die zwei Abbildungen im Homomor-
phiesatz sind streng auseinanderzuhalten: ψ ist die Abbil-
Die Faktorgruppe G/ ker ψ dung der Elemente von G in G , während ϕ jene der Neben-
klassen, also der Elemente von G/ ker ψ, auf die Bildmenge
Ist ψ : G → G ein Homomorphismus, so ist
ψ(G) ⊆ G ist.
(G/ ker ψ, ") eine Gruppe. Man nennt (G/ ker ψ, ")
die Faktorgruppe von G nach dem Kern von ψ. (b) Ist ψ nicht surjektiv, so ist ψ(G) eine echte Untergruppe
von G . Stattzu sagen, die Faktorgruppe (G/ ker ψ, ") ist
isomorph zu ψ(G), ∗ , hätten wir auch sagen können, die
Beweis: Das oben definierte Produkt " ist bereits als Ver- Abbildung G/ ker ψ → G mit a ∗ ker ψ → ψ(a) ist ein
knüpfung auf G/ ker ψ nachgewiesen worden. Die Assozia- injektiver Homomorphismus.
tivität ist gesichert, denn
Beweis: des Homomorphiesatzes: Die Abbildung ϕ ist
(a ∗ ker ψ " b ∗ ker ψ) " c ∗ ker ψ = (a ∗ b ∗ c) ∗ ker ψ injektiv, weil der Kern von ϕ, also die Urbildmenge von e ∈
= a ∗ ker ψ " (b ∗ ker ψ " c ∗ ker ψ). G , lediglich die Nebenklasse e ∗ ker ψ = ker ψ umfasst.
Die Verknüpfungstreue von ϕ folgt direkt aus der Definition
Die Nebenklasse ker ψ = e ∗ ker ψ ist neutrales Element für von ", denn
diese Multiplikation, denn
ϕ : (a ∗ ker ψ) " (b ∗ ker ψ) → ψ(a) ∗ ψ(b),
(e ∗ ker ψ) " (a ∗ ker ψ) = a ∗ ker ψ. wobei
Schließlich ist (a −1 ∗ ker ψ) invers zu (a ∗ ker ψ), denn ψ(a) = ϕ(a ∗ ker ψ) und ψ(b) = ϕ(b ∗ ker ψ).
die Klasse derjenigen ganzen Zahlen, die den Rest 1 haben. Gruppe (Z5 , ⊕) ist genau die Faktorgruppe (Z/{0}, ⊕). Der
Wir können diese Zahlen auch als z = 1 + 5 k mit k ∈ Z im Homomorphiesatz auftretende Isomorphismus ϕ ist die
darstellen. Deshalb ist 1 = 1 + 5 · Z. identische Abbildung.
Nachdem der Rest 0, 1, 2, 3 oder 4 sein kann, gibt es insgesamt In ähnlicher Weise können wir auch eine Multiplikation "
die Klassen von Restklassen erklären: Wir ordnen zwei Restklassen die-
jenige Klasse als Produkt zu, in welcher das Produkt der
0 = 5 · Z, 1 = 1 + 5 · Z, . . . , 4 = 5 · Z + 4. Repräsentanten liegt. Wieder zeigt sich die Unabhängigkeit
von der Wahl der Repräsentanten, denn
Wir nennen sie die Restklassen modulo 5 und bezeichnen
ihre Menge mit Z5 . Also ist Z5 = {0, 1, 2, 3, 4}. (r + 5k) · (s + 5l) = r · s + 5(5kl + rl + ks).
Auf der Menge dieser Klassen erklären wir nun die Verknüp-
fung ⊕ ganz ähnlich wie vorhin die Multiplikation " von Ne- Auch hier hängt die Produkt-Restklasse nur von den Resten
benklassen in der Faktorgruppe: Wir ordnen zwei Restklassen r, s der zwei gegebenen Restklassen ab. Dies ergibt nach Aus-
diejenige Klasse als Summe zu, in welcher die Summe der schluss von 0 die folgende Produkttafel:
Repräsentanten liegt. Wieder zeigt sich die Unabhängigkeit
von der Wahl der Repräsentanten, denn " 1 2 3 4
1" 1 2 3 4
(r + 5k) + (s + 5l) = (r + s) + 5(k + l).
2" 2 4 1 3
Die Summen-Restklasse hängt also nur von den Resten r, s 3" 3 1 4 2
der zwei gegebenen Restklassen ab. Dies ergibt die folgende 4" 4 3 2 1
Verknüpfungstafel:
So ist z. B. 3 " 4 = 2, also 3 · 4 = 2 mod 5.
⊕ 0 1 2 3 4
(Z5 \ {0}, ") ist eine Gruppe, denn in jeder Zeile und jeder
0⊕ 0 1 2 3 4
Spalte der Produkt-Gruppentafel kommt das neutrale Ele-
1⊕ 1 2 3 4 0 ment 1 genau einmal vor.
2⊕ 2 3 4 0 1
3⊕ 3 4 0 1 2 Die Abbildung der ganzen Zahlen auf die jeweilige Rest-
klasse, genauer
4⊕ 4 0 1 2 3
ψ· : Z \ 0 → Z5 \ {0}, z = r + 5k → r, 1 ≤ r < 5,
So ist etwa 2 ⊕ 4 = 1, was zumeist in der Form
Diese Addition von Restklassen ist kommutativ und asso- und (Z5 \ {0}, ") ist genau die Faktorgruppe dieses Homo-
ziativ, weil dies auch auf die Addition ganzer Zahlen zutrifft. morphismus.
(Z5 , ⊕) ist eine Gruppe, denn 0 ist das neutrale Element, und
in jeder Spalte der obigen Verknüpfungstafel kommt jede der ?
5 Restklassen genau einmal vor. Also gibt es zu jedem rech- −1 −1
ten Summanden genau einen linken Summanden derart, dass Wie lauten 2 und 3 in der multiplikativen Gruppe der
deren Summe 0 ist. Restklassen modulo 5?
Gruppen Räume
Der Gruppenbegriff ist einer der weitreichendsten inner- Liegt in einer kommutativen Gruppe zusätzlich eine ska-
halb der Mathematik. Nachstehend eine kleine Auswahl lare Multiplikation vor, anschaulich die Möglichkeit,
von Beispielen mit verschiedenartigen Objekten. Elemente zu strecken oder zu stauchen, so ergibt sich
eine erheblich stärkere algebraische Struktur, der Vektor-
a) Gruppen von Zahlen: raum.
In (Z, +), (R3 , +), (Q \ {0}, · ) oder (C \ {0}, · ) sind
die Gruppenelemente Zahlen oder Zahlentripel. Die Ad- a) Der Anschauungsraum:
dition und Multiplikation modulo einer Primzahl p führt Der Anschauungsraum, die Idealisierung unseres physika-
zu Gruppen (Zp , +) und (Zp \ {0}, ·). Auch hier werden lischen Raumes, enthält Punkte als Grundobjekte. Daraus
„nur“ Zahlen miteinander verknüpft. entwickeln wir im Kapitel 7 den dreidimensionalen Vek-
torraum R3 , dessen Grundobjekte als Äquivalenzklassen
b) Mengen als Gruppenelemente: geordneter Punktepaare oder auch als Pfeile mit einem ge-
Wenn wir die Elemente 0, . . . , 4 von Z5 als Restklas- meinsamen Anfangspunkt aufzufassen sind. Der R3 wird
sen auffassen, also 0 = {. . . , −10, −5, 0, 5, 10, . . . }, im Kapitel 12 zum Begriff des K-Vektorraums verallge-
1 = {. . . , −9, −4, 1, 6, 11, . . . } usw., dann sind die meinert, und dessen Elemente heißen Vektoren.
Gruppenelemente Mengen, sogar unendliche Mengen. So-
bald aber jede einzelne Menge durch ein Symbol gekenn- b) Funktionen als Vektoren:
zeichnet ist, ist man wieder zurück beim Rechnen mit In Kapitel 19 lernen wir Banach- und Hilbert-Räume ken-
Symbolen. nen. Dabei werden Funktionen mit bestimmten Eigen-
Liegt ein Homomorphismus ψ : G → G vor, so sind der schaften wie Stetigkeit, Differenzierbarkeit oder Integrier-
Kern und dessen Nebenklassen die Elemente der Faktor- barkeit zu Vektorräumen zusammengefasst, so dass die al-
gruppe G/ ker ψ . Auch in dieser Gruppe wird mit Men- gebraische Struktur eines linearen Raums erhalten bleibt
gen „gerechnet“. Dabei sind Verknüpfungen von Mengen und Resultate aus dem Anschauungsraum ihre Entspre-
nicht ungewöhnlich, denn die Vereinigung oder der Durch- chung finden.
schnitt von Mengen führen ja wieder zu Mengen; nur ist
dabei keine Rede von Gruppeneigenschaften. c) Vektorraumhomomorphismen und Funktionale:
Wir werden erkennen, dass auch die linearen Abbildun-
c) Gruppen von Abbildungen: gen zwischen zwei K-Vektorräumen V und V einen
In der so wichtigen Gruppe (Sn , ◦) der Permutationen der Vektorraum Hom(V , V ) bilden. Die Vektoren sind also
n-elementigen Menge M sind die Gruppenelemente bi- in diesem Fall Vektorraumhomomorphismen. Der Dual-
jektive Selbstabbildungen von M, und die Verknüpfung raum V ∗ zu V ist der Raum Hom(V , K); dessen Vektoren
ist die Hintereinanderausführung. Bei den Symmetrieope- sind Linearformen. Die Linearformen, die mit einem
rationen eines Ornamentes handelt es sich um bijektive Abstandsbegriff im Vektorraum verträglich sind, heißen
Selbstabbildungen einer unendlichen Menge, nämlich der Funktionale bzw. allgemeiner Operatoren. Auch auf dieser
Ebene, wobei zudem Längen und Winkelmaße unverän- Abstraktionsstufe spielen die Vektorraumeigenschaften
dert bleiben. Derartige Abbildungen gehören zur Gruppe eine wesentlicher Rolle.
der ebenen Bewegungen.
80 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
In Körpern gibt es zwei Verknüpfungen und es Wir erkennen, dass (Z5 , ⊕, ") ein Körper ist, denn
gelten drei Axiome (Z5 , ⊕) ist eine Gruppe und es gelten (K2) und (K3) mit 0
als Nullelement und 1 als Einselement. (Z5 , ⊕, ") heißt
Restklassenkörper modulo 5 .
Definition eines Körpers
Wir werden demnächst erfahren, dass es nicht nur zu 5,
Eine Menge K mit den zwei Verknüpfungen,
sondern zu jeder Primzahl p einen Restklassenkörper Zp
der Addition
gibt. Hingegen liefert z. B. Z4 = {0, 1, 2, 3} keinen Kör-
−1
+ : K × K → K, (x, y) → x + y per. In Z4 fehlt nämlich ein 2 , denn für jedes ganz-
zahlige k ist das Produkt 2 · k geradzahlig; es kann dem-
und der Multiplikation nach niemals bei ganzzahliger Division durch 4 den Rest
1 haben.
· : K × K → K, (x, y) → x · y,
Wir wollen uns nun schrittweise einige Aussagen über Kör-
heißt Körper (K, +, · ), wenn die folgenden Eigenschaf- per erarbeiten, die ähnlich wie bei den Gruppen zum Teil
ten erfüllt sind: bereits in die Definition übernommen hätten werden können
(K1) (K, +) ist eine Gruppe. Das neutrale Element 0 – wie etwa die anschließend bewiesene Kommutativität der
heißt Nullelement; das zu a ∈ K inverse Element Addition (iii). Aber wir bleiben dabei, in die Definitionen nur
wird mit −a bezeichnet. das unbedingt Notwendige aufzunehmen.
(K2) Die Teilmenge K = K \ {0} ist bezüglich der Ein-
(i) Wegen 1 ∈ K = K \ {0} gilt 1 = 0.
schränkung · von · auf K × K eine kommutative
Gruppe mit dem Einselement 1 als neutralem Ele- Ein Körper K enthält also mindestens zwei Elemente. Wir
ment. werden tatsächlich einen Körper mit nur zwei Elementen
(K3) Es gilt das Distributivgesetz: kennenlernen.
Beispiel ?
1. Offensichtlich sind (Q, +, · ) und (R, +, · ) Körper. Da- Warum muss das Nullelement bei der multiplikativen Gruppe
gegen ist (Z, +, · ) kein Körper, denn in Z gibt es z. B. von K ausgeschlossen werden?
kein Element 2−1 mit 2 · 2−1 = 1.
2. In Abschnitt 3.2 haben wir uns bereits mit den Restklassen
modulo 5 befasst, also mit Aus (ii) kann man folgern, dass die von Q und R her ver-
trauten Vorzeichenregeln in allen Körpern K gelten. So ist
Z5 = {0, 1, 2, 3, 4}, wobei z. B.
Mithilfe der Kürzungsregel (3.2) bezüglich der Addition er- bei 1 < r, s < p nicht unbedingt in einer der Restklassen
gibt sich daraus die folgende Aussage. 1, . . . , p − 1 vorkommen muss. Sobald nämlich p = rs ist
mit r, s > 1, liegt das Produkt in 0; r und s wären Nullteiler
(iii) Für alle a, b ∈ K gilt b + a = a + b, d. h. die Addition
dieser Multiplikation.
in Körpern ist stets kommutativ.
Angenommen, es gelten gleichzeitig a · b = 0 und a = 0. Ist hingegen p eine Primzahl, besitzt p also nur 1 und p als
Dann existiert a −1 , und es ist Teiler, so kann rs kein ganzzahliges Vielfaches von p sein,
weil r und s kleiner als p und daher nicht durch p teilbar sind.
b = (a −1 · a) · b = a −1 · (a · b) = a −1 · 0 = 0. Also ist " eine Verknüpfung auf Zp \ {0}. Sie ist assoziativ
und kommutativ; es gibt das neutrale Element 1.
Das bedeutet:
Wir zeigen, dass zur Restklasse r bei 1 < r < p ein x mit
(iv) In einem Körper folgt aus a · b = 0 stets a = 0 oder 1 < x < p existieren muss mit r " x = 1. Dabei verwenden
b = 0. wir die Abbildung
Man kann auch sagen: In Körpern gibt es keine Nullteiler,
also keine Elemente x, y ∈ K \ {0} mit x · y = 0. Dies folgt Zp \ {0} → Zp \ {0},
λr :
schon deshalb, weil „·“ eine Verknüpfung in K = K \ {0} x → r " x,
ist, also wegen der Abgeschlossenheit bei x, y ∈ K auch
x · y ∈ K sein muss. bei welcher jede Klasse links mit r multipliziert wird. Diese
Abbildung ist injektiv, denn bei r " a = r " b unterscheiden
Wir fassen die eben hergeleiteten Aussagen noch einmal zu- sich ra und rb durch ein Vielfaches von p, d. h., p teilt r(a −
sammen: b). Wegen 1 < r < p muss p ein Teiler von a − b sein und
daher a = b.
Körpereigenschaften
Ein Körper enthält mindestens die zwei verschiedenen Also durchlaufen die p−1 Produkte r"1, r"2, . . . , r"p − 1
Elemente 0 und 1. In einem Körper ist die Addition stets alle p − 1 Restklassen aus Zp \ {0}. Darunter muss unbedingt
kommutativ. Ein Körper ist frei von Nullteilern. auch 1 vorkommen.
Die notwendige Bedingung, dass p eine Primzahl ist, erweist
Man könnte meinen, dass ebenso wie die Kommutativität der sich somit als hinreichend. Sie garantiert, dass (Zp \ {0}, ")
Addition auch jene der Multiplikation bereits aus den übri- eine Gruppe ist. Nachdem auch die distributiven Gesetze gel-
gen Körpereigenschaften hergeleitet werden kann. Dass dies ten, weil sie ja in Z erfüllt sind und durch den Homomorphis-
nicht möglich ist, beweist das auf Seite 83 gezeigte Beispiel mus (r + kp) → r nicht zerstört werden, ist die folgende
eines Schiefkörpers. Aussage bewiesen:
Vorerst folgen aber noch zwei weitere Beispiele von Körpern.
Satz vom Restklassenkörper
Ist p eine Primzahl, so ist
Zu jeder Primzahl p > 1 gibt es einen
Restklassenkörper Zp = {0, 1, . . . , p − 1}, ⊕, "
Oben haben wir den Restklassenkörper modulo 5 betrachtet. ein Körper, der Restklassenkörper modulo p.
Wie sieht es aus, wenn wir 5 durch eine andere natürliche
Zahl p > 1 ersetzen, also die Menge der Restklassen
Der kleinste Körper ist Z2 = {0, 1}. In ihm ist 0 + 1 = 1 und
Zp = {0, 1, . . . , p − 1} 1 + 1 = 0. Das „kleine Einmaleins“ besteht überhaupt nur
aus der trivialen Regel 1 · 1 = 1.
betrachten? Führen die Addition und Multiplikation von
Restklassen aus Zp ebenfalls zu Gruppen? In Zukunft werden wir auch in Restklassenkörpern die Ad-
dition und Multiplikation wie gewohnt mit + und · be-
Die Summe
zeichnen statt mit ⊕ und ", und auch die Querstriche zur
(r + kp) + (s + lp) = (r + s) + (k + l)p, 0 ≤ r, s < p, Kennzeichnung der Restklassen lassen wir meist weg. Statt
(a ⊕ b) " c = d schreiben wir einfach (a + b)c = d.
liegt bei r + s < p in der Restklasse r + s, andernfalls in
r + s − p. Das Ergebnis hängt also nur von den Klassen r
und s ab. Somit ist ⊕ eine Verknüpfung auf Zp , und wie bei ?
Z5 lässt sich begründen, dass (Zp , ⊕) eine Gruppe ist. Berechnen Sie im Restklassenkörper modulo 7 den Wert
4−6
Bei der Multiplikation ist zu beachten, dass x = (4 − 6) · (1 − 6)−1 , den man auch als Bruch
1−6
schreiben könnte.
(r + kp) · (s + lp) = rs + (klp + ks + rl)p
82 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Die Restklassenkörper sind an sich interessant, weil sie end- Folgerung (D)
liche Körper sind. Darüber hinaus spielen sie in der Zahlen- ie Menge
theorie, in der Kryptographie und in der Codierungstheorie
eine wichtige Rolle. Letztlich gäbe es ohne den kleinsten C = {z = a + i b | (a, b) ∈ R2 }
Körper Z2 keine Digitalisierung und keine Computer.
bildet einen Körper (C, +, · ) mit 0 = 0 + i 0 als Nullelement
und 1 = 1+i 0 als Einselement, den Körper der komplexen
Der Körper der komplexen Zahlen ist Zahlen.
eine echte Erweiterung des Körpers
der reellen Zahlen Wir widmen uns den algebraischen Eigenschaften von C.
Auf Seite 64 wurde die elementeweise Addition von reellen
Zahlentripeln eingeführt und im Anschluss daran gezeigt, Die Konjugation ist ein Automorphismus
dass (R3 , +) eine Gruppe ist. Dasselbe ist natürlich auch Die Abbildung
mit Zahlenpaaren (a, b) ∈ R2 möglich. Man kann aber auch
eine Multiplikation von Zahlenpaaren erklären, sodass nach C → C,
:
Ausschluss von (0, 0) eine Gruppe entsteht. z = a + i b → z = a − i b
Das ist zunächst überraschend, wird aber nach den folgen- ist bijektiv und heißt Konjugation. Sie ist additiv und
den Betrachtungen gleich klar: Wir notieren das Zahlenpaar multiplikativ, d. h., es gilt:
(a, b) in der Form
z = a +ib z1 + z2 = z1 + z2 und z1 · z2 = z1 · z2 .
und nennen jedes solche z eine komplexe Zahl (in Kapitel 4
werden die komplexen Zahlen ausführlich behandelt). Dabei
ist i die imaginäre Einheit, welche der Regel i2 = −1 ge- Beweis: Es seien z1 = a1 + i b1 und z2 = a2 + i b2
nügt. Die reelle Zahl a heißt Realteil Re z und die reelle Zahl komplexe Zahlen mit a1 , a2 , b1 , b2 ∈ R. Dann gilt:
b Imaginärteil Im z. Statt z = a + i b schreiben wir auch
z1 + z2 = (a1 + a2 ) + i(b1 + b2 ) = (a1 + a2 )−i(b1 + b2 )
z = a + b i. Wir nennen die komplexen Zahlen mit Im z = 0
reell, jene mit Re z = 0 rein imaginär. = z1 + z2 .
Wie bereits betont, wird die Summe der beiden komplexen und
Zahlen z1 = a1 + i b1 und z2 = a2 + i b2 elementeweise
gebildet, z1 · z2 = (a1 a2 − b1 b2 ) + i (b1 a2 + b2 a1 )
z1 + z2 = (a1 + a2 ) + i(b1 + b2 ). = (a1 a2 − b1 b2 ) − i (b1 a2 + b2 a1 )
Es werden also die Realteile addiert und ebenso die Imagi- = (a1 − i b1 ) (a2 − i b2 ) = z1 · z2 .
Ist (K, +, · ) ein Körper und L eine Teilmenge von K, wobei ist definiert als
(L, +, · ) hinsichtlich der von K stammenden Verknüpfun-
gen ebenfalls ein Körper ist, so heißt L Unterkörper oder q1 + q2 = (a1 + a2 ) + i(b1 + b2 ) + j(c1 + c2 ) + k(d1 + d2 ).
Teilkörper von K.
Damit ist (H, +) eine kommutative Gruppe mit dem Nullele-
Offensichtlich ist (Q, +, · ) ein Unterkörper von (R, +, · ) ment 0 = 0 + i 0 + j 0 + k 0. Offensichtlich ist die additive
und dieser Unterkörper von (C, +, · ) und weiter vom Schief- Gruppe (H, +) isomorph zu (R4 , +) (vergleiche das Beispiel
körper (H, +, · ), der gleich genauer vorgestellt wird. auf Seite 64).
Bei den bisherigen Beispielen war die Multiplikation stets Bei dem Produkt der beiden Quaternionen q1 , q2 gehen wir
kommutativ, d. h., es galt: analog zu C vor: Jeder Summand von q1 wird mit jedem
Summanden von q2 multipliziert, wobei für die Produkte der
a b = b a für alle a, b ∈ K .
Quaternioneneinheiten die folgenden Regeln gelten:
Das folgende Beispiel beweist, dass es auch Schiefkörper
i · i = j · j = k · k = −1
gibt. Der folgende Körper spielt auch in der analytischen
Geometrie eine Rolle, wie das Kapitel 7 zeigen wird.
und
i · j = k , j · k = i , k · i = j,
j · i = −k , k · j = −i , i · k = −j .
Die Quaternionen bilden einen Schiefkörper
Die erste Zeile zeigt, dass die Quadrate der Quaternionen-
Jede komplexe Zahl ist eine Zusammenfassung zweier reeller einheiten übereinstimmen mit dem Quadrat der imaginären
Zahlen mithilfe der imaginären Einheit i. Bei den Quater- Einheit. Die Formeln für die gemischten Produkte von i, j
nionen sind es vier reelle Zahlen, und es gibt drei Quater- oder k lassen sich wie folgt zusammenfassen:
nioneneinheiten i, j, k. Die Quaternionen wurden 1843 von
Hamilton entdeckt (siehe Abbildung 3.4). Die Menge der j
Hamilton’schen Quaternionen lautet:
k
H = { q = a + i b + j c + k d | (a, b, c, d) ∈ R4 }.
(a1 + i b1 + j c1 + k d1 ) · (a2 + i b2 + j c2 + k d2 )
= (a1 a2 − b1 b2 − c1 c2 − d1 d2 )
+ i (a1 b2 + b1 a2 + c1 d2 − d1 c2 )
+ j (a1 c2 − b1 d2 + c1 a2 + d1 b2 )
+ k (a1 d2 + b1 c2 − c1 b2 + d1 a2 ).
q1 = a1 + i b1 + j c1 + k d1 , q2 = a2 + i b2 + j c2 + k d2 mit q · q −1 = (q · q)/(q · q) = 1.
84 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Alle Produkte von je drei Quaternioneneinheiten sind as- Ein wichtiges Beispiel ist dazu R; wir können ja die Grö-
soziativ, wie man durch einzelnes Nachrechnen bestätigen ßen von je zwei reelle Zahlen vergleichen. In der folgenden
kann, z. B. Definition werden gewisse Anordnungseigenschaften von R
als Axiome verwendet. Die Eigenschaften dieser Anordnung
(i · j) · k = k · k = −1 = i · (j · k). von R werden in Kapitel 4 ausführlich behandelt.
Damit ist aber auch die Multiplikation von Quaternionen as-
Ein Körper K heißt angeordnet, wenn er einen Positivitäts-
soziativ.
bereich enthält, das ist eine Teilmenge P von K mit folgen-
Die Multiplikation ist allerdings nicht kommutativ, denn z. B. den Eigenschaften:
i · j = −j · i. Aber es gelten die beiden Distributivgesetze,
1. P ∪ (−P ) = K,
woraus folgt:
2. P ∩ (−P ) = {0},
3. P + P ⊆ P,
Quaternionenschiefkörper 4. P · P ⊆ P.
(H, +, · ) ist ein Schiefkörper.
Dabei bedeuten −P = {−x ∈ K | x ∈ P } und P + P ⊆ P
bzw. P · P ⊆ P , dass mit x, y ∈ P stets auch die Summe
Nun folgen noch einige Begriffe, die beim Umgang mit Kör-
x + y bzw. das Produkt x · y in P liegen.
pern eine Rolle spielen.
Man nennt die Elemente aus P \{0} positiv und jene aus
−P \{0} negativ.
Die Charakteristik eines Körpers ist null oder
eine Primzahl Ist K ein angeordneter Körper mit dem Positivitätsbereich
P \{0}, so wird durch die Definition
Werden in einem Körper K der Reihe nach die Summen 1,
1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . . gebildet, so sind we- x ≤ y ⇐⇒ y − x ∈ P
gen x + 1 = x (Kürzungsregel) aufeinanderfolgende Werte
stets verschieden. Es ist aber möglich, dass in der Folge der eine lineare Ordnungsrelation auf der Menge K erklärt.
Summen Wiederholungen auftreten, dass also etwa
?
y + (1 + 1 + · · · + 1) = y Begründen Sie das.
ist, woraus (1 + 1 + · · · + 1) = 0 folgt. In einem endlichen
Körper muss das so sein, denn es stehen ja nur endlich viele
Ist x ∈ K positiv, d. h. x ∈ P \{0}, so ist wegen x 2 = x·x ∈ P
Werte als Summen zur Verfügung. Die kleinste Anzahl n > 0
auch x 2 positiv. Und ist x negativ, d. h. x ∈ −P \{0}, so ist
mit der Eigenschaft, dass die Summe von n Einsen null ergibt,
wegen −x ∈ P das Element −x positiv und damit wegen
heißt Charakteristik char K des Körpers K. Gibt es hingegen
x 2 = (−x) · (−x) ∈ P auch x 2 positiv. Da K = P ∪ (−P )
kein derartiges n, so wird char K = 0 definiert.
gilt, haben wir damit gezeigt, dass jedes von O 2 verschiedene
So ist z. B. die Charakteristik von Z2 = {0, 1} gleich 2, denn Quadrat in einem angeordneten Körper positiv ist. Insbeson-
1 + 1 = 2 ∈ 0. Analog ist char Zp = p. Aber Zp ist nicht dere ist 1 = 1 · 1 positiv, 1 ∈ P , und damit ist −1 ∈ −P
der einzige Körper mit dieser Charakteristik. Andererseits ist negativ.
char Q = char R = char C = 0.
Der Körper R hat den Positivitätsbereich
Wir werden der Körpercharakteristik später vor allem dann
begegnen, wenn bei Aussagen gewisse Werte der Charakte- P = R≥0 = {x ∈ R | x ≥ 0}
ristik ausgeschlossen werden müssen. So muss z. B. immer
dann, wenn in einem Körper durch 2 dividiert wird, der Fall und ist damit ein angeordneter Körper. Der Körper C hinge-
char K = 2 ausgeschlossen werden, weil dort 2 = 0, d. h. gen nicht, denn dann wäre das Quadrat −1 = i · i positiv,
−1 = 1 ist und eine Division durch 0 wegen des Fehlens von daher 1 = −(−1) negativ – im Widerspruch zur vorhin be-
0−1 nicht möglich ist. wiesenen Aussage.
?
In manchen Körper kann man die Elemente in Begründen Sie, dass ein angeordneter Körper die Charakte-
ihrer Größe unterscheiden ristik null hat.
3.4 Ringe erfüllen. So gewinnt man die reellen Nullstellen der Funk-
tion f . Betrachten wir konkret das Polynom
Die von Körpern geforderten Bedingungen lassen sich auf f (x) = x 2 + 1 .
verschiedene Weise abschwächen. So kann man ja auch
ganze Zahlen addieren und multiplizieren; (Z, +) ist eine Das Polynom hat in R keine Nullstellen, da die Gleichung
kommutative Gruppe und es gibt 0 und 1. Aber es fehlen x 2 + 1 = 0 in R nicht lösbar ist, in R sind Quadrate stets po-
inverse Elemente. sitiv. Analytisch ist man fertig, die Funktion f hat in ihrem
Definitionsbereich keine Nullstelle. Aber algebraisch ist die
Definition eines Ringes Auflösung der Gleichung noch längst nicht erledigt: Es trifft
Eine Menge R mit zwei Verknüpfungen + und · heißt zwar zu, dass es keine reellen Nullstellen gibt, aber kann es
Ring, wenn gilt: nicht sein, dass es einen R umfassenden Körper gibt, in dem
1. (R, +) ist eine kommutative Gruppe. eine Nullstelle von f liegt? Und tatsächlich liegt in C R
2. Die Multiplikation · ist assoziativ. die komplexe Zahl i mit i2 = −1; damit sind i und −i zwei
3. Es gelten die Distributivgesetze (a + b) · c = (a · c) verschiedene Nullstellen von f , die für die analytische Dis-
+ (b · c) und a · (b + c) = (a · b) + (a · c). kussion der Funktion f : R → R ohne Belange sind, für
algebraische Zwecke aber zur Auflösung der Gleichung füh-
Hat ein Ring (R, +, ·) die zusätzlichen Eigenschaften: ren.
die Multiplikation ist kommutativ, Es hat sich für die Algebra als sehr zweckmäßig erwiesen,
es existiert ein neutrales Element 1 = 0 bezüglich der Polynome in einem anderen Licht darzustellen, als dies in
Multiplikation, der Analysis üblich ist. Wir betrachten in der Algebra das x
in R gibt es keine Nullteiler nicht als eine reelle Zahl, wir fassen es als eine Unbestimmte
auf, in die wir z. B. Zahlen einsetzen können. Man verwen-
so nennt man den Ring R einen Integritätsbereich. det in der Algebra sogar gerne ein anderes Symbol für die
Unbestimmte als in der Analysis – wir werden X schreiben
Beispiel – und verwenden eigentlich genauer die Bezeichnungen
Jeder kommutative Körper ist ein Integritätsbereich.
(Z, +, ·) ist ein Integritätsbereich. Es gibt nämlich keine Polynom in der Algebra und
Nullteiler. Polynomfunktion in der Analysis.
Die Menge der Restklassen modulo 12 Diese Bezeichnungen werden aber keineswegs konsequent
Z12 = {0, 1, . . . , 11} benutzt. Auch wir werden in der Analysis oftmals wieder
von Polynomen sprechen, obwohl wir Polynomfunktionen
ergibt einen Ring (Z12 , ⊕, "). Dieser ist nicht nullteiler- meinen.
frei, denn wegen 3 · 4 = 12 ist 3 " 4 = 0, obwohl 3, 4 = 0
Wir beginnen nun bei „Adam und Eva“ und erklären, was ein
gilt.
Polynom ist. Man tut gut daran, vorläufig zu vergessen, was
es mit den oben erwähnten Polynomfunktionen auf sich hat.
Wir vertiefen die Ringtheorie nicht weiter und behandeln
Wir kommen auf diese nach der Einführung der Polynome
nur ausführlich ein für uns wichtiges Beispiel eines Rings,
wieder zurück.
nämlich den Polynomring.
Weil wir in der Mathematik darauf achten, dass Definitionen
Die klassische Algebra ist die Lehre von der Auflösung von
sinnvoll sind, müssen wir erklären, was eine Unbestimmte
Gleichungen der Form
ist. Das ist gar nicht so einfach, es sind dazu einige Vorbe-
an x n + · · · + a1 x + a0 = 0 trachtungen nötig.
Wir haben hierbei ai anstelle von a(i) geschrieben. Die Ab- wählen wir ab jetzt einen beliebigen kommutativen Ring R
bildung a wiederum können wir durch die endlichen vie- mit 1. Man gewinnt dadurch viel; und man kann sich für R
len von null verschiedenen Bilder eindeutig festlegen, man stets einen der vertrauten Ringe Z oder R denken.
schreibt
Vielleicht ist es auch sinnvoll, an dieser Stelle darauf hin-
a = (a0 , a1 , . . . , an , 0, . . .)
zuweisen, dass, egal wie abstrakt das Folgende erschei-
und nennt die Abbildung a auch eine Folge mit den Folgen- nen mag, wir doch wieder bei der vertrauten Darstellung
gliedern ai (in Kapitel 8 werden wir Folgen ausführlich dis- a0 + a1 X + · · · an X n für Polynome landen werden. Dann
kutieren). Von den endlichen vielen möglichen Ausnahmen wird aber X ein wohldefiniertes Objekt sein, an dem nichts
a0 , . . . , an abgesehen sind alle Folgenglieder null. Man be- „Unbestimmtes“ haften wird.
achte, dass es auch zugelassen ist, dass manche oder alle der
endlichen vielen Zahlen a0 , . . . , an ebenfalls null sind. Weil
die Anzahl der endlich vielen Elemente a0 , . . . , an mehr
Der Polynomring R[X] besteht aus allen
oder weniger nichts ist im Vergleich zu der Anzahl der Ele-
mente von N, hat sich die folgende Sprechweise eingebürgert: Folgen mit der Eigenschaft, dass fast alle
Man sagt Folgenglieder null sind
ai = 0 für fast alle i ∈ N0 Wir betrachten nun die Gesamtheit aller Abbildungen von N0
und meint damit, dass ai = 0 für nur endlich viele i ∈ N0 . nach R, die die Eigenschaft haben, dass fast alle Bilder den
Wert null haben. Wir bezeichnen diese Gesamtheit mit dem
? Symbol R[X]:
Können Sie eine Abbildung g : N0 → R angeben, die nicht
für fast alle i ∈ N0 und dennoch unendlich oft den Wert 0
Die Polynome über R
hat?
Wir nennen jede Abbildung a : N0 → R mit a(i) = 0
für fast alle i ∈ N0 ein Polynom. Die Menge
Wir erklären nun Polynome als Folgen, die fast überall den
Wert 0 haben. Dabei wollen und müssen wir uns keineswegs R[X] = {a : N0 → R | a(i) = 0 für fast alle i ∈ N0 }
auf reelle Folgen festlegen. Wir lassen als Wertemenge sol- ist die Menge aller Polynome über R.
cher Abbildungen einen Ring zu. Anstelle des Körpers R
3.4 Ringe 87
Ein Polynom ist eine Folge in R, die nur an endlichen vielen cr = 0 für alle r > max{m, n},
Stellen aus N0 einen von null verschiedenen Wert annimmt. ds = 0 für alle s > m + n.
Die Addition ist also komponentenweise erklärt, die Multi- Es seien a = (a0 , a1 , a2 , . . .), b = (b0 , b1 , b2 , . . .) und
plikation sieht etwas ungewohnt aus, wir geben explizit die c = (c0 , c1 , c2 , . . .) Polynome aus R[X].
ersten Folgenglieder an: (i) Dass + eine Verknüpfung auf R[X] ist, haben wir schon
festgestellt. Die Addition ist auch assoziativ, da die Addition
(a0 , a1 , a2 , a3 , . . .) + (b0 , b1 , b2 , b3 , . . .)
in R assoziativ ist:
= (a0 + b0 , a1 + b1 , a2 + b2 , a3 + b3 , . . .)
(a + b) + c = (a0 + b0 + c0 , a1 + b1 + c1 ,
=c0 =c1 =c2 =c3
a2 + b2 + c2 , . . .)
und
= a + (b + c) .
(a0 , a1 , a2 , a3 , . . .) · (b0 , b1 , b2 , b3 , . . .)
Die Verknüpfung ist wegen
= (a0 b0 , a0 b1 + b0 a1 , a0 b2 + a1 b1 + a2 b0 ,
a + b = (a0 + b0 , a1 + b1 , a2 + b2 , . . .)
=d0 =d1 =d2
= (b0 + a0 , b1 + a1 , b2 + a2 , . . .) = b + a
a b + a1 b2 + a2 b1 + a3 b0 , . . .) .
0 3
=d3 auch kommutativ. Das neutrale Element ist die Nullfolge
0 = (0, 0, . . .) ∈ R[X], es gilt nämlich
Bei der Multiplikation beachte man, dass die Summe der
Indizes der Summanden des k-ten Folgenglieds stets k ergibt. 0 + a = (0 + a0 , 0 + a1 , 0 + a2 , . . .) = a .
Offenbar sind Summe und Produkt zweier Folgen, bei de- Und schließlich gibt es zu jedem Element ein Inverses in
nen fast alle Folgenglieder null sind, erneut solche Folgen. R[X], denn für −a = (−a0 , −a1 , −a2 , . . .) ∈ R[X] gilt
Genauer kann man sagen: offenbar a + (−a) = 0. Somit ist (i) gezeigt.
Es seien a = (a0 , a1 , a2 , . . .) und b = (b0 , b1 , b2 , . . .) (ii) Wir zeigen, dass das Assoziativgesetz der Multiplikation
Polynome aus R[X] mit ak = 0 für alle natürlichen k > n gilt:
und bl = 0 für alle natürlichen l > m, d. h.,
(a b) c = (d0 , d1 , d2 , . . .) mit
⎛ ⎞
a = (a0 , . . . , an , 0, . . .), b = (b0 , . . . , bm , 0, . . .) . ! ! !
dl = ⎝ ai bj ⎠ ck = (ai bj ) ck .
Dann gilt für die Folgenglieder cr der Summe a + b und für
r+k=l i+j =r i,j,k∈N0
die Folgenglieder ds des Produkts a b: (i+j )+k=l
88 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Nun klammern wir anders: Der Ring R ist ein Teilring von R[X]
a (b c) = (d0 , d1 , d2 , . . .) mit
⎛ ⎞ Völlig analog zu einem Teilkörper erklärt man den Begriff
! ! ! Teilring: Eine Teilmenge S eines Rings R heißt ein Teilring
dl = ai ⎝ bj ck ⎠ = ai (bj ck ) .
von R, wenn S mit den von R induzierten Verknüpfungen
i+s=l j +k=s i,j,k∈N0
i+(j +k)=l selbst wieder einen Ring bildet. Die sogenannten trivialen
Da beide Male dasselbe Element herauskommt, in R gilt näm- Teilringe sind der Nullring {0} und der ganze Ring R. Wir
lich das Assoziativgesetz, gilt das Assoziativgesetz auch in zeigen nun, dass wir den Ring R stets als Teilring des Poly-
R[X]. nomrings R[X] auffassen können. Hierbei ist eine Feinheit
zu berücksichtigen: Natürlich ist der Ring R selbst niemals
(iii) Die Multiplikation ist kommutativ, da sie in R kommu- Teilmenge von R[X] – die Menge R[X] ist eine Menge von
tativ ist: ⎛ ⎞ Folgen, deren Folgenglieder aus R sind; und die Elemente
! ! ! aus R sind nicht von dieser Form, daher gilt:
ab = ⎝ ai bj , ai bj , ai bj , . . .⎠
i+j =0 i+j =1 i+j =2 R R[X],
⎛ ⎞
! ! !
=⎝ bj ai , bj ai , bj ai , . . .⎠ und es hat eigentlich keinen Sinn bei R von einem Teilring
j +i=0 j +i=1 j +i=2 von R[X] zu sprechen. Aber wir betten nun den Ring R in
den Polynomring R[X] ein. Dabei meint man, dass man eine
= ba.
injektive, additive und multiplikative Abbildung angibt, die
den Ring R in den Polynomring R[X] einbettet. Eine additive
(iv) Das Einselement ist die Folge 1 = (1, 0, 0, . . .) ∈
und multiplikative Abbildung zwischen Ringen bezeichnet
R[X], es gilt nämlich für jedes a ∈ R[X]:
man auch als Ringhomomorphismus:
1 a = (1, 0, . . .) (a0 , a1 , a2 , . . .) = (a0 , a1 , a2 , . . .) = a .
Folglich ist ι ein Ringhomomorphismus. wobei a an (n + 1)-ter Stelle steht. Für ein beliebiges
P = (a0 , a1 , a2 , . . . , an , 0, 0, . . .) ∈ R[X] finden wir
Die Abbildung ι ist zudem injektiv: Es gelte ι(r) = ι(s) für
mit unserer Definition der Addition in R[X];
r, s ∈ R, d. h.,
(r, 0, 0, . . .) = (s, 0, 0, . . .) . P = a0 X 0 + a1 X + a2 X2 + · · · + an X n .
eine Bijektion. D. h., wir können die Elemente (r, 0, . . .) ∈ Der Koeffizientenvergleich
R[X] mit den Elementen r ∈ R identifizieren. Hierbei ersetzt Zwei Polynome i∈N0 ai Xi und i∈N0 bi Xi sind ge-
man gewissermaßen die Elemente (r, 0, . . .) in R[X] durch nau dann gleich, wenn sie die gleichen Koeffizienten
die entsprechenden Elemente r aus R – daher auch der Begriff haben, d. h.:
einer Einbettung. Übrigens bezeichnet man Einbettungen oft
! !
mit dem griechischen Buchstaben ι (wie Injektion). ai X i = bi X i ⇔ ai = bi für alle i ∈ N0 .
Wir unterscheiden von nun ab die Bilder ι(r) ∈ R[X] und i∈N0 i∈N0
r ∈ R nicht mehr und fassen R als einen Teilring von R[X]
auf. Wir nennen die Elemente r ∈ R auch die Konstanten
von R[X].
?
Wieso ist die folgende Aussage nicht ganz korrekt?
Wir führen nun eine neue Schreibweise ein und erhalten da-
durch für die Elemente aus R[X] die bekannte Darstellung !
n !
m
ai X i = bi Xi ⇔ n = m und ai = bi für alle i .
als Polynome in der Form ni=0 ai X i in einer Unbestimmten
i=0 i=0
X, wobei X ein Element von R[X] ist.
Das Polynom (0, 1, 0, . . .) ist die Addition und Multiplikation lauten mit dieser Schreibweise
wie folgt:
Unbestimmte X
⎛ ⎞ ⎛ ⎞
! ! !
Unter der Vielzahl von Polynomen in R[X] wählen wir nun ⎝ ai X i ⎠ + ⎝ bi X i ⎠ = (ai + bi ) X i ,
ein ganz bestimmtes Polynom aus und geben diesem den i∈N0 i∈N0 i∈N0
Namen X. Die Abbildung ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
⎧ ! ! ! !
⎝ ai X i ⎠ · ⎝ bj X j ⎠ = ⎝ ai bj ⎠ X k .
⎨N0 → R,
X: 1, falls i = 1, i∈N0 j ∈N0 k∈N0 i+j =k
⎩ i →
0, falls i = 1
Wir wiederholen das Beispiel von Seite 87 mit dieser neuen
liegt in R[X], es ist X(k) = 0 für alle k ≥ 2. Ausgeschrieben
Schreibweise für Polynome:
lautet das Element X ∈ R[X]
Mit den erklärten Verknüpfungen + und · in R[X] haben wir die bekannten Polynomfunktionen zurück. Aber die (alge-
die Polynome in ihrer vertrauten Form und mit vertrauten braischen) Polynome sind universeller: In späteren Kapiteln
Rechenregeln gewonnen: werden wir in Polynome noch ganz andere Dinge einsetzen,
z. B. kann man Polynome oder Abbildungen oder Matrizen
für X einsetzen.
Darstellungssatz für Polynome
Es ist
⎧ ⎫ Das Einsetzen in Polynome
⎨! ⎬ Es sei R ein kommutativer Teilring des Rings S. Für ein
R[X] = ai X i | ai ∈ R, ai = 0 für fast alle i ∈ N0 Polynom P ∈ R[X],
⎩ ⎭
i∈N0
!
n
ein kommutativer Ring mit Einselement 1. Für das Null- P = ai X i = a0 + a1 X + · · · + an X n
polynom 0 gilt ai = 0 für alle i ∈ N0 . i=0
P + Q = 1 + 3 X + 5 X2 ,
Achtung: Man beachte die grundverschiedenen Bedeu-
P · Q = X + 4 X2 + 7 X3 + 6 X4 .
tungen der Addition und Multiplikation: Bei
Im Fall R = Z6 :
ai · Xi + ai+1 · Xi+1
P + Q = (1 + 2 X + 3 X 2 ) + (X + 2 X2 )
sind + und · die Addition und Multiplikation von Polynomen
= 1 + (2 + 1) X + (3 + 2) X 2 aus R[X]. Bei
= 1 + 3 X + 5 X2 , ai · ci + ai+1 · ci+1
2 2
P · Q = (1 + 2 X + 3 X ) · (X + 2 X )
sind + und · die Addition und Multiplikation von Ringele-
= X + (2 + 2) X 2 + (2 · 2 + 3 · 1) X 3 + 3 · 2 X4 menten aus S.
= X + 4 X2 + X3 .
Nun können wir alle möglichen Elemente von Ringen, die R
umfassen, in Polynome über R einsetzen:
Das Einsetzen in Polynome ist ein
Homomorphismus Beispiel
Wir können in das Polynom P = 1 + X 2 ∈ R[X] die
Wir haben Polynome als Folgen mit nur endlich vielen komplexe Zahl i ∈ C ⊇ R einsetzen:
von null verschiedenen Folgengliedern eingeführt. Durch die
Festlegung X = (0, 1, 0, . . .) haben wir mithilfe der erklär- P (i) = 1 + i2 = 0 ∈ C .
ten Addition und Multiplikation von Polynomen die vertraute
Gestalt,
In C hat das reelle Polynom eine Nullstelle, in R hingegen
!
n nicht.
ai Xi = a0 + a1 X + · · · + an X n Da der Polynomring R[X] den Ring R umfasst, können
i=0 wir Polynome in Polynome einsetzen. Für P = 1+X und
Q = X + X2 aus R[X] gilt:
zurückgewonnen. Aber immer noch sind die so gewonnenen
Polynome für den Anfänger etwas Ungewohntes – sie wirken P (Q) = 1 + X + X 2 ∈ R[X] .
abstrakt und haben scheinbar kaum etwas mit den wohlbe-
kannten Polynomfunktionen gemein. Dass dem ganz und gar
nicht so ist, wollen wir als Nächstes begründen. Wir werden Wir betrachten nun den Fall R = S. Hält man ein Polynom
jetzt in Polynome einsetzen, genauer: Wir werden in die Un- P ∈ R[X] fest und setzt in dieses Polynom alle Elemente
bestimmte X z. B. Zahlen einsetzen. So gewinnen wir dann x ∈ R ein, so erhält man eine Abbildung von R nach R:
3.4 Ringe 91
⎛ ⎞
Die Polynomfunktion ! !
c ⎝ ai X + i
bi X i⎠
Für jedes P ∈ R[X] nennt man die Abbildung i∈N0 i∈N0
⎛ ⎞
R → R !
P̃ : =c ⎝ (ai + bi ) X i ⎠
x → P (x)
i∈N0
die zu P gehörige Polynomfunktion. Ein Ele- ! ! !
= (ai + bi ) ci = ai ci + bi c i
ment c ∈ R heißt Nullstelle von P , falls
i∈N0 i∈N0 i∈N0
P (c) = 0. ⎛ ⎞ ⎛ ⎞
! !
=c ⎝ ai X i⎠
+ c ⎝ bi X i⎠
.
Beispiel i∈N0 i∈N0
i∈N0 k+l=i
Z2 → Z2 , ⎛ ⎞
P̃ : ! !
x → x 2 + x ⎝
= ak bl ⎠ ci
i∈N0 k+l=i
wegen P (0) = 0 = P (1) die Nullfunktion, obwohl P
nicht das Nullpolynom ist. und
Für P = X2 − 1 ∈ Z8 [X] hat die Polynomfunktion ⎛ ⎞ ⎛ ⎞
! !
c ⎝ ai X i⎠
c ⎝ bi X i⎠
Z8 → Z8 , i∈N0 i∈N0
P̃ : ⎛ ⎞⎛ ⎞
x → x 2 − 1
! !
=⎝ ai ci ⎠ ⎝ bi ci ⎠
wegen P (1) = P (3) = P (5) = P (7) = 0 die vier Null- i∈N0 i∈N0
stellen 1, 3, 5 und 7. ⎛ ⎞
! !
= ⎝ ak bl ⎠ ci .
Der Beweis ist konstruktiv, wir geben auf Seite 93 ein aus-
Beispiel Im Fall R = Z6 gilt für die Polynome P = führliches Beispiel an.
2 X 2 + 1 und Q = 3 X + 1:
insbesondere also deg(P Q) < deg(P ) + deg(Q). Nach dem Satz zur Division mit Rest können wir jedes Po-
lynom P ∈ R[X] durch das Polynom Q = X − a mit a ∈ R
vom Grad 1 mit Rest teilen. Es existieren gemäß dem Satz
? zu P ∈ R[X] und a ∈ R Polynome S, T ∈ R[X] mit
Warum definiert man deg 0 = −∞?
P = (X − a) S + T und deg T < deg(X − a) = 1,
Auf Seite 56 haben wir die Division mit Rest angegeben. Im Ist nun a eine Nullstelle von P , d. h., P (a) = 0, so folgt
Ring Z lässt sich diese Division mit Rest wie folgt formulie- T = 0. Damit ist gezeigt:
ren: Zu je zwei ganzen Zahlen a, b ∈ Z mit b = 0 existieren
ganze Zahlen q, r mit Folgerung (H)
at ein Polynom P ∈ R[X] eine Nullstelle a ∈ R, so
a = q b + r und 0 ≤ r < |b| . existiert ein S ∈ R[X] mit P = (X − a) S.
3.4 Ringe 93
mit Rest.
Problemanalyse und Strategie: Wir benutzen die Methode aus dem Beweis des Satzes zur Division mit Rest.
Lösung:
Die Anfangsterme der Polynome P und 4 X 3 ·Q stimmen überein, den Rest müssen wir korrigieren; man erhält sukzessive:
(4 X5 + 6 X3 + X + 2) = (X2 + X + 1) (4 X3 − 4) X2 + 6 X − 2
−(4 X 3 X 2 + 4 X 3 X + 4 X 3 1)
− 4 X4 + 2 X3 + X + 2
− (−4 X2 X2 − 4 X 2 X − 4 X2 1)
6 X3 + 4 X2 + X + 2
− (6 X3 + 6 X2 + 6 X)
− 2 X2 − 5 X + 2
− (−2 X 2 − 2 X − 2)
− 3X + 4
Damit ist
4 X 5 + 6 X 3 + X + 2 = (4 X3 − 4 X 2 + 6 X − 2) (X2 + X + 1) − 3 X + 4 .
In der Rechnung entspricht das Polynom in der zweiten Zeile dem Polynom b−1 a Xn−k Q und das Polynom unter dem
ersten Strich entspricht P0 . Das Weitere ist eine Wiederholung des Verfahrens.
Nun zum zweiten Beispiel:
(X5 + X4 − 4 X 3 + X 2 − X − 2) = (X2 − X − 1) (X 3 + 2 X2 − X + 2)
−(X5 − X4 − X 3 )
2 X4 − 3 X3 + X2
− (2 X 4 − 2 X3 − 2 X2 )
− X3 + 3 X 2 − X
− (−X 3 + X2 + X)
2 X2 − 2 X − 2
− (2 X 2 − 2 X − 2)
0
Damit ist
X5 + X 4 − 4 X 3 + X 2 − X − 2 = (X 2 − X − 1) (X 3 + 2 X2 − X + 2) .
94 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
P = (X − a1 )ν1 · · · (X − ar )νr Q
X 4 − 6 X 3 + 11 X2 − 6 X = X (X − 1) (X − 2) (X − 3)
mit einem Polynom Q, das in R keine Nullstelle mehr hat.
die vier verschiedenen Nullstellen 0, 1, 2, 3. Liegen sämtliche Nullstellen von P in R, dann ist Q ∈ R eine
Das Polynom P = X5 − 2 X 4 + 2 X 3 − 2 X 2 + X ∈ R[X] Konstante; in diesem Fall sagt man, das Polynom P zerfällt
hat wegen in Linearfaktoren, es ist dann nämlich ein Produkt einer
Konstanten mit linearen Polynomen, d. h. von Polynomen
X5 − 2 X 4 + 2 X3 − 2 X 2 + X = X (X − 1)2 (X2 + 1) vom Grad 1. Außerdem gilt in diesem Fall:
Zusammenfassung
Wir betrachten Mengen M mit einer Verknüpfung, also einer Definition eines Homomorphismus
Abbildung ∗ : M × M → M, (a, b) → a ∗ b.
Eine Abbildung ψ : G → G der Gruppe (G, ∗) in die
Gruppe (G , ∗ ) heißt Homomorphismus, wenn für alle
Definition einer Gruppe a, b ∈ G
(G, ∗) ist eine Gruppe, wenn die Verknüpfung ∗ asso- ψ(a ∗ b) = ψ(a) ∗ ψ(b)
ziativ ist, wenn es ein neutrales Element e ∈ G gibt mit
e ∗ a = a für alle a ∈ G und wenn zu jedem a ∈ G ein ist. Ist ψ bijektiv, so spricht man von einem Isomorphis-
inverses Element a −1 ∈ G existiert mit a −1 ∗ a = e. mus und insbesondere bei G = G von einem Auto-
morphismus.
In jeder Gruppe (G, ∗) ist das neutrale Element e eindeutig
mit e ∗ x = x ∗ e = x, und zu jedem a ∈ G gibt es genau ein
inverses Element a −1 mit a ∗ a −1 = a −1 ∗ a = e.
ψ : G → G ein Homomorphismus,
Ist so ist das Bild
Ein wichtiges Beispiel einer Gruppe ist die Menge der bijek- ψ(G), ∗ eine Untergruppe von (G , ∗ ). Eine wichtige
tiven Abbildungen einer nichtleeren Menge M auf sich mit Rolle spielt der Kern ker ψ, die Menge der Urbilder des neu-
der Hintereinanderausführung ◦ als Verknüpfung, die Per- tralen Elements von G . Der Kern ist eine Untergruppe von
mutationsgruppe von M. G, und genau bei ker ψ = {e} mit e als neutralem Element
von G ist der Homomorphismus ψ injektiv.
Sind (G, ∗) eine Gruppe und H eine Teilmenge von G, so
heißt H Untergruppe von G, wenn auch H hinsichtlich der Die Fasern des Homomorphismus ψ : G → G , also die
Verknüpfung ∗ eine Gruppe ist. Kennzeichnend dafür ist, Mengen der Urbilder der Elemente ψ(a) ∈ G , sind gleich-
dass H nichtleer ist, mit jedem x zugleich x −1 enthält und zeitig Links- und Rechtsnebenklassen des Kerns, nämlich
x, y ∈ H stets (x ∗ y) ∈ H zur Folge hat. gleich den Mengen a ∗ ker ψ = ker ψ ∗ a.
Ist G endlich und (H, ∗) eine Untergruppe von (G, ∗), so ist Auf der Menge G/ ker ψ aller Nebenklassen von ψ ist durch
nach dem Satz von Lagrange die Anzahl |H | der Elemente (a ∗ ker ψ) " (b ∗ ker ψ) = (a ∗ b) ∗ ker ψ eine Verknüpfung
von H ein Teiler von |G|. definierbar.
96 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln
Wichtiges Beispiel eines Rings ist der Polynomring R[X] deg(P + Q) ≤ max{deg(P ), deg(Q)},
in der Unbestimmten X über dem kommutativen Ring R mit deg(P · Q) ≤ deg(P ) + deg(Q).
Einselement. Die folgende Definition der Polynome kommt
ohne den Begriff einer Unbestimmten aus. Ist R ein Integritätsbereich, so gilt deg(P · Q) = deg(P ) +
deg(Q).
Die Polynome über R
Wir nennen jede Abbildung a : N0 → R mit a(i) = 0 für Division mit Rest
fast alle i ∈ N0 ein Polynom. Die Menge aller Polynome Es seien P , Q ∈ R[X], Q = 0. Wenn der höchste Koef-
über R wird mit R[X] bezeichnet. fizient von Q invertierbar in R ist, existieren Polynome
S, T ∈ R[X] mit
Polynome werden komponentenweise addiert; die Multipli- P = Q S + T und deg T < deg Q.
kation erfolgt durch Summation über die Produkte mit glei-
cher Indexsumme. Daraus können wir folgern, dass wir bei einem Polynom P =
0 über einem Integritätsbereich R und mit den Nullstellen
Satz vom Polynomring a1 . . . , ak ∈ R Linearfaktoren abspalten können, es gilt
Für jeden kommutativen Ring R mit 1 ist (R[X], +, · ) somit
ein kommutativer Ring mit 1.
P = (X − a1 ) · · · (X − ak ) Q für ein Q ∈ R[X] .
Nachträglich können wir die Elemente r aus R mit den Poly- Insbesondere hat ein Polynom über einem Integritätsbereich
nomen a mit a(0) = r und a(i) = 0 für i > 0 identifizieren. vom Grad n ≥ 0 höchstens n Nullstellen.
Aufgaben 97
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
3.2 • Zeigen Sie: In einer Gruppe sind die Gleichungen Zeigen Sie, dass die Menge F = {f1 , f2 , f3 , f4 , f5 , f6 }
x ∗ a = b und a ∗ y = b eindeutig nach x bzw. y auflösbar. mit der inneren Verknüpfung ◦ : (fi , fj ) → fi ◦ fj , wobei
fi ◦ fj (x) = fi (fj (x)), eine Gruppe ist. Stellen Sie eine
3.3 •• Es sei K = {0, 1, a, b} eine Menge mit 4 veschie- Verknüpfungstafel für (F, ◦) auf.
denen Elementen. Füllen Sie die folgenden Tabellen unter der
Annahme aus, dass (K, +, ·) ein Schiefkörper (mit dem neu- 3.9 •• Bestimmen Sie alle Untergruppen von (Z, +).
tralen Element 0 bezüglich + und dem neutralen Element 1
bezüglich ·) ist. Begründen Sie Ihre Wahl.
3.10 •• Verifizieren Sie, dass G = {e, a, b, c} zusam-
+ 0 1 a b · 0 1 a b men mit der durch die Tabelle
0 0 · e a b c
1 1 e e a b c
a a a a e c b
b b b b c e a
c c b a e
3.4 • Kann ein Polynomring K[X] ein Körper sein?
definierten Verknüpfung · : G × G → G eine abelsche
3.5 • In welchen Ringen gilt 1 = 0? Gruppe ist, und geben Sie alle Untergruppen von G an.
S. 64 des Axioms (G1) lässt sich (b−1 ∗ a −1 ) als eine Lösung der
Addition und Multiplikation ja, denn Summe und Produkt Gleichung x ∗ (a ∗ b) = e bestätigen.
zweier natürlicher Zahlen liegen wieder in N. Hingegen sind
S. 67
Subtraktion und Division keine Verknüpfungen auf N, denn ◦ e f g h i j
z. B. die Differenz 2−3 und der Quotient 2/3 sind keine natür-
e◦ e f g h i j
lichen Zahlen mehr. Die Subtraktion wäre eine Verknüpfung
auf Z, die Division eine auf Q \ {0}. f◦ f e i j g h
g◦ g j e i h f
S. 65 h◦ h i j e f g
∩ und ∪ sind assoziativ, \ nicht, wie das Beispiel
i◦ i h f g j e
({1, 2} \ {1}) \ {2} = ∅, {1, 2} \ ({1} \ {2}) = {2} j◦ j g h f e i
(2) Wegen a ∗ U = U ∗ a gibt es für alle u ∈ U ein u ∈ U reflexiv, da für jedes x ∈ K wegen x − x = 0 ∈ P folgt
mit x ≤ x,
ψa (u) = a −1 ∗ u ∗ a = a −1 ∗ a ∗ u = u, antisymmetrisch, da aus x ≤ y und y ≤ x sogleich
y − x, x − y ∈ P folgt, und wegen x − y = −(y − x)
und u → u ist eine Bijektion U → U . Somit ist ψa (U ) = U . bedeutet dies y − x ∈ P ∩ (−P ) = {0}, d. h., x = y,
reflexiv, da aus x ≤ y und y ≤ z zum einen y − x ∈ P
S. 76 und zum anderen z − y ∈ P folgt; wegen P + P ⊆ P
Diese Menge ist nicht abgeschlossen gegenüber ◦, denn das folgt nun (y − x) + (z − y) = z − x ∈ P , d. h., x ≤ z,
Produkt zweier ungerader Permutationen ist gerade. Oder linear, da für alle x, y ∈ K wegen K = P ∪ (−P ) die
noch kürzer: Diese Menge enthält kein neutrales Element. Differenz y − x in P oder in −P liegt, d. h., es gilt x ≤ y
oder y ≤ x.
S. 76
Es gibt die inverse Abbildung f −1 : a ∗ ker ψ → ker ψ mit S. 84
a ∗ x = y → a −1 ∗ y = a −1 ∗ a ∗ x = x. Die Summe 1+1+· · ·+1 kann in einem angeordneten Körper
niemals null werden, da Summen von positiven Elementen
stets positiv sind.
S. 78
−1
2 = 3, denn 2 " 3 = 1 oder einfach 2 · 3 ≡ 1 mod 5.
−1 S. 86
Damit ist umgekehrt 3 = 2, also 2 · 3 ≡ 1 mod 5. Die Abbildung g, die jeder geraden natürlichen Zahl die 0
und jeder ungeraden natürlichen Zahl die 1 zuordnet.
S. 80
Es gibt hinsichtlich der Multiplikation in K kein inverses S. 89
Element zu 0, also kein x ∈ K mit x · 0 = 1, denn nach (ii) Man betrachte etwa die zwei Polynome 1 + X und
ist dieses Produkt stets 0. 1 + X + 0 X 2 . Diese Polynome sind gleich, obwohl m = n.
S. 81 S. 92
Wir rechnen modulo 7. Es ist Weil dann die Gradformel für alle Polynome stimmt.
8 03 284 1027019 7 7
1 6 6 607 26 02491 75
97 48
7 7 0 93 0 3 8 109465 4434 2 8 8 1 2 2 0
2 7 4 5 3 7 8 6 7 0 3 1 6 527 85 8
Warum ist eigentlich
5 3 9 30 3 6 0 0 1 1 3 3 0 5 4 1 2 6
58 3
8 0
4 4 9 486 1 17153 2664 09 3
1 8 2 3 2 4 5 8 7605 2 1636 0 6 3 1 1 2 2
0 844609550 2
3 9 1 1 5
93 534211 383
30 2 + 3 = 6?
643 8 7
81932611
2 5 1 1 7938 3 3 6 7 3 3 6 2 47 9 3 1 5
59
4 7 46
6 9 2 56 5 7 5 9759 93 8119 5 3 0 9 7 8 1
7 8 2 5 4 8 0 74 4 6 237 69 8
6 1 2 3 176 7523846 406
6 2
3 0
238462643
8 2 9
9 9 4 5 1 14 3 0 8 6904 20 5113 9 4 9 4 9 9 5
0974944
74
8
392 1 8
7 87 2 1468
6 2 6 3 7119 6 0 8 6 4 0 3 4 44 4 0 9 8
0 6 66
2 0 3 9 1 2 27705 301 1
2 0 9 4 7 1 3 4 2270 51 9797 8 9 6 0 7 1 4
5 8 4 62 4 9 5 394737 4071 4 6 5 4 0 5 9
2
6 7
561 9 7
1 1 2 1 3 6 2 53 4 6 9 7 1 30 9 5 6
9 3 95
8 8 9 27 2 9 7 8101 48 8919 5 1 0 5 2 1 7
38 752886
1 7 1 3 7283 5 3 7 8 7 5 9 3 75 8 7 5 0
0 8 45
1 1
8
5 8 3 6 1 9 3 8 73 1 1 7 1 0 1 97 2
5 4 4 5 0 8 3 8 1747 28 0056 1 7 1 7 2 6 6
3 8 8 5 2 5 7 2 0 1 0 65 4 51 9
9 9
9 5 2 5 5 4 6 92 1 6 4 5 95 6 00 3
2 2 85
3 09 8 91 2 49 721 85
3 87 9 5 9 0 8 9 9 5 7 2 0 1 9 2 8 0
3 7 7 87 8 8 6 5195 31 56515 3 3 8 1 2 6
8 4 1 38 3 8 1 7 5 4 6 3 7 47 7 5 2 8
3
2 1 1 5 2 9 6 1 72 7 8 7 3 6 2 8 9 6
5 3 2 7 9 1 3 5 0 6 0 4 7 48 5 1 8 2
9 9 64
558 2 3
10 18 1942
5 0 1 0 4970 6 9 4 9 1 2 9 3 39 5 5 5 9
6 4 25
0 3 1 1 5 8 3 6 146604 6325 6 3 7 0 9 0 9
8 93 1 9 89 4 6 71 65 2718 3 7 44 77 4
0 2 5 76 4 0 2 4 7 4 9 6 4 1 3 6
8 5
3 9
08 7 7
3 1 989 04 9 0
4 8
1
73
1 4 0 4 9 3 5 11 26 54 31 23 82 4 3 66 6
3028618
5 5 3 1 5409 8 7 2 0 2 75 5299 7 4 5 2
9 7 0 21 4 1 9 9 2837 82 6 0 4 2 6 2 1 4
04 6
6 8
0 1 7 2 1 1 99 0 8
7 9 7 4 9 50 5 9 6
6 3 4 4 6 7 2 8 9 0 9 7 77 6 02
5 9 3 49 7 5 0 9 38602259 5 5 3 2 2 4 5 3
6 5 7 0 0 6 65 46 4979 11 9 8 8 45 2
5 57
0
72
3 6
0 7 52 7 51 1 8
6 1157 35 2
5 4 8 0 8 1 06 0 1 8
7 1 61535 6 2 09 9 21 9 255 2 1 7
1 6 5 45 0 1 4 16 8 6 259 7 3 5 6 8 4 6
3 6 3 8 0 75 7 4 1 28 54 49 4 6 8 43 1 61 3
8 8
0 2 4 4 1 81 1
22
18 8 1
8 3 8 2 7 96
9 4 7 84836 2 69 45 60 47297 6 6 1
9 34 72 55 0 953 82 56 88 85 4
7 7 7 8 8 6 2 9 8 4 17 8 3 5 4
3 2 10 0 83 7 2
2 2 62 7 232 79 9 8 5
5 848
4 4 9 1 7 3 9 37 1 3 7 6 0 8 6 0 6
3 7 1 9 1 7 2 8 74 6 41 9
8 4 5 5 02 2 2 1 0 6 6 1 1 6 3 7
8
64
86 4 8
77
4 4
63
81 52 8 57 57 3 96 2
0
09 2
6 6
96 1
5
6
4
2 89
0 1 12
3 41
5 7
0 50 4
78 6
86 6
3
4
49 67
0 8
3 8 53
0 9 4 4 278 039 1
9
52
3 1 7 95 0 68 0 6062 24 22 51 2 66 8
49 9
00 7 2
0 1
1 8 86
5 2 3 2 3094 9 4 6 0 1 6 5 3 43 3 4 5 7
75 4
14
2 7
4 4 0 7 3 9 4 1 43
8 7 9 9 1 9 2 1 73 2 1 7 2 0 7 4
32 7 4
27 5 8 6797 5 3 5 6 6 3 6 9 892 7 2 0
92 2
1 6
08 9 8
2 9 2 69 9 569 0 36
8 0 5 6 7 8 2 35 4 78 1 6 38 1
6 7 54
1 6 2 5 5639 6 6 0 2 4 0 5 8 08 4 7 1 0
1
32 6 6
7
7 9 77 4 72 6 24
7 4 8 37 0
2 7
30 9
7 4 5 4111 3 9 0 0 9 8 4 8 88 2 9 5 3
2
6 96 5 06 95 950 35
5 3
9 8 0 8 2 3 0 3 0 1 95 2 0 7 66
6
84 5 0
5 3 09
00 3
2 14 66 13 0 01 9278 9 04
0 5 2 7303 5982534 850
5 3 5 1 8273 0 8 2 5 3 3 4 4 69 9 9 9
14 5
92 07211349
0 4
2
7 68 710 81
5 2 50792279 27
2 22 71452635608 798
7
8
1 7 4 47 371907021 527
5 3
8 1 9 4 195516 7 3 5 1 8 835370 5 7 22 8 0
3 9
5
19 748 16094
6 2
96
1 1 0 9 1 48 1 5 2 0 9 2606 9 2 3 48 9
1
2 0 56485 4
3 9 5 1 4 8505 5 9 6 4 4 6 2 2 93 0 6 6
9 86513282 028
939 8419716
Zahlen stellen eine wichtige Grundlage der gesamten Mathe- Geläufig sind die Darstellungen reeller Zahlen durch Dezi-
matik, speziell aber der Analysis dar. malzahlen,
Man kann den Standpunkt von R. Dedekind und L. Kronecker 1/2 = 0.500000000000000000 . . .
einnehmen und die reellen Zahlen ausgehend von den na- 1/7 = 0.142857142857142857 . . .
türlichen Zahlen über die ganzen und die rationalen Zahlen √
2 = 1.414213562373095049 . . .
konstruieren. Doch stellt sich gleich die Frage: „Was ist eine
natürliche Zahl?“. Nach dem Vorbild von G. Peano (1889) und π = 3.141592653589793238 . . .
R. Dedekind (1888) lassen sich die natürlichen Zahlen mittels e = 2.718281828459045235 . . .
der sogenannten Peano-Axiome charakterisieren. Aus diesen
Dabei steht π für die Kreiszahl und e für die Euler’sche Zahl.
Grundannahmen leiten sich alle Aussagen über das Rechnen
Man könnte die Menge der reellen Zahlen als die Menge
mit natürlichen Zahlen ab, so wie man es aus der Schule ge-
aller Dezimalzahlen definieren, stößt dabei aber offenkundig
wohnt ist. Mit relativ einfachen algebraischen Mitteln lassen
sofort auf Probleme. Während im Falle von 1/7 die Bedeu-
sich aus den natürlichen Zahlen die ganzen Zahlen und die ra-
tung der Punkte „. . .“ noch erkennbar ist, bleibt unklar, was
tionalen Zahlen konstruieren. Der Übergang von den rationalen
die Punkte bei π und e bedeuten. Bei der Dezimaldarstellung
Zahlen zu den reellen Zahlen erfordert jedoch kompliziertere
von π + e und π · e treten weitere Schwierigkeiten auf.
Begriffsbildungen aus der Analysis bzw. der Algebra.
Die Grundzahl 10 des Dezimalsystems ist zwar kulturhisto-
Wir werden daher hier nicht so vorgehen, sondern den Stand- risch bedeutsam. Aus mathematischer Sicht ist sie jedoch
punkt einnehmen, dass jeder intuitiv weiß, was reelle Zahlen durch keine besondere Eigenschaft ausgezeichnet. Man kann
sind, und die reellen Zahlen axiomatisch einführen. Die natür- jede natürliche Zahl g, die größer oder gleich 2 ist, als Grund-
lichen, die ganzen und die rationalen Zahlen werden wir als zahl für die g-al-Entwicklung reeller Zahlen wählen. Für die
Teilmengen der reelle Zahlen definieren. In dem Vertiefungsab- Darstellung reeller Zahlen im Computer sind besonders die
schnitt 4.7 gehen wir auf den oben skizzierten konstruktiven Grundzahlen g = 2 und g = 16 praktisch. Nach der Beschäf-
Aufbau der reellen Zahlen ausgehend von den Peano-Axiomen tigung mit Reihen gehen wir auf die Darstellung reeller Zah-
für die natürlichen Zahlen ein. len durch g-al-Entwicklungen ein (siehe auch Kapitel 10).
Zwei Jahre vorher hatte L. Kronecker auf der Berliner Na- Wir machen dabei die folgende Grundannahme:
turforscherversammlung den Standpunkt vertreten:
Es gibt eine Menge R, die den obigen Axiomen genügt. Wir
„Die ganzen Zahlen hat der liebe Gott gemacht, alles nennen R die Menge der reellen Zahlen. Was das im Ein-
andere ist Menschenwerk.“ zelnen bedeutet, wird im Folgenden erklärt.
4.1 Der Körper der reellen Zahlen 103
Kommentar: Die Frage nach der Existenz bleibt zunächst Genauso verfährt man für die Gleichung a · x = b, wenn
offen! Auch ist an dieser Stelle noch nicht klar, ob es nur eine a = 0 ist. Man ersetzt einfach das Pluszeichen durch ein
Menge gibt, die den obigen Axiomen genügt. Malzeichen und das Inverse der Addition −a durch das In-
verse der Multiplikation a −1 , das wegen der Voraussetzung
Statt „a ist eine reelle Zahl‘‘ schreiben wir „a ∈ R“ und a = 0 existiert. Auch wird das neutrale Element der Addition
sagen „a ist Element von R‘‘. 0 durch das neutrale Element der Multiplikation 1 ersetzt.
(A3) Es gibt eine Zahl 0 ∈ R, sodass a + 0 = a für alle a ∈ R gilt. Existenz eines neutralen
Elements bezüglich „+“
(A4) Zu jedem a ∈ R gibt es eine Zahl (−a) ∈ R mit a + (−a) = 0. Existenz eines inversen
Elements bezüglich „+“
(M3) Es gibt eine Zahl 1 ∈ R (1 = 0), sodass a · 1 = a für alle a ∈ R gilt. Existenz eines neutralen
Elements bezüglich „·“
(M4) Zu jedem a ∈ R (a = 0) gibt es ein a −1 ∈ R, für das a · (a −1 ) = 1 gilt. Existenz eines inversen
Elementes bezüglich „·“
Die Axiome (A1) bis (A4) besagen, dass die reellen Zah- bestimmt. Geläufige Rechenregeln, wie (−a)(−b) = ab,
len R bezüglich der Addition eine abelsche Gruppe (mit speziell (−1)(−1) = 1 oder (a − b)(a + b) = a 2 − b2
dem neutralen Element 0) bilden. Mit (M1) bis (M4) sind lassen sich aus den obigen Axiomen ableiten. Zur Ver-
die von Null verschiedenen Elemente aus R eine abelsche einfachung der Schreibweise notieren wir statt a · b oft
Gruppe (mit dem neutralen Element 1 = 0) bezüglich der einfach ab und halten uns an die Regel Punktrechnung
Multiplikation. Beide Verknüpfungen sind über das Dis- geht vor Strichrechnung. Diese Vorfahrtsregel erspart uns
tributivgesetz (D) miteinander verbunden. Die neutralen viele Klammern. Das Distributivgesetz schreibt sich dann
Elemente 0 bzw. 1 sowie die inversen Elemente (−a) bzw. so:
a−1 sind wie in jeder abelschen Gruppe jeweils eindeutig a(b + c) = ab + ac .
Beweis: Wie auf Seite 81 bereits gesehen, folgt mit b = 0 Algebraische Strukturen, in denen der Nullteilersatz nicht
aus gilt, wurden in Kapitel 3 angesprochen. Ein Beispiel ist der
a · 0 = a · (0 + 0) = a · 0 + a · 0 Restklassenring Z6 , in dem 2 · 3 = 6 = 0 gilt, wobei aber
und der eindeutigen Lösbarkeit der Gleichung a·0+x = a·0, 2 = 0 und 3 = 0 sind. Wir werden weitere wichtige Bei-
dass a · 0 = 0 ist. Genauso gilt für a = 0 die Gleichung spiele, wie den Ring der stetigen Funktionen auf R (siehe
0 · b = 0. Kap. 9) oder der Ring der n × n-Matrizen für n ≥ 2 (siehe
Seite 445 in Kap. 12) kennenlernen, für welche das Pro-
Sei umgekehrt a · b = 0. Dann ist zu zeigen: a = 0 oder dukt von zwei vom Nullelement verschiedenen Elementen
b = 0. Wäre b = 0, dann braucht nichts bewiesen werden. das Nullelement ergibt.
Also nehmen wir b = 0 an. Nach Axiom M4 existiert das
Inverse b−1 , und es folgt:
0 = (a · b) · b−1 = a(b · b−1 ) = a · 1 = a.
4.1 Der Körper der reellen Zahlen 105
? ?
Beweisen Sie Beweisen Sie noch den zweiten Teil der ersten Aussage, dass
(−1)(−1) = 1, für jedes x ∈ R mit x = 0 und a, b ∈ R, b = 0 die Gleichung
indem Sie von 1 + (−1) = 0 ausgehen. Können Sie das a ax
Ergebnis auf =
b bx
(−a)(−b) = ab
gilt.
für a, b ∈ R verallgemeinern?
Ein weiteres Beispiel für die Anwendung der Axiome ist die Folgerung
für das Rechnen mit Zahlen grundlegende Bruchrechnung. Für alle a, b ∈ R gilt die binomische Formel
Additions- und Multiplikationstabelle dieses Körpers Z2 : Ordnungsrelationen auf den reellen Zahlen
Ungleichungen sind in der Analysis Beweis: Man muss nur die Definition einsetzen:
mindestens so wichtig, wie Gleichungen
a < b bedeutet b − a ∈ R>0 ,
in der Algebra a = b bedeutet b − a = 0,
a > b bedeutet a − b = −(b − a) ∈ R>0 .
Im dritten Kapitel auf Seite 84 wurde der Begriff des an-
geordneten Körpers eingeführt. Die reellen Zahlen bilden Nach (AO1 ) tritt für die reelle Zahl b − a genau eine dieser
einen angeordneten Körper, d. h., in R ist eine Teilmenge Fälle ein.
Statt „a ∈ R>0 “ sagen wir auch, dass a positiv ist und ver-
wenden dafür die Abkürzung a > 0. Ist −a ∈ R>0 , dann Gleichsinnige Ungleichungen darf man
heißt a negativ . Wir schreiben kurz a < 0.
addieren
Eine reelle Zahl ist nach (AO1 ) entweder positiv oder negativ
oder gleich null. Durch Auszeichnung der positiven reellen Natürlich sollten sich die Anordnungsaxiome mit denen der
Zahlen kann man nun zwei reelle Zahlen der Größe nach Addition und der Multiplikation vertragen. Dies wird im Fol-
vergleichen. genden nachgewiesen. Wir beginnen mit der Addition.
4.2 Die Anordnungsaxiome für die reellen Zahlen 107
Folgerung (Translationsinvarianz) Die fünfte Aussage folgt durch zweimaliges Anwenden der
Für a, b, c, d ∈ R gilt, dass aus a < b und c ≤ d ersten Aussage. Man setzt zuerst c = a −1 = a1 und erhält
die Ungleichung a + c < b + d folgt: a · a1 < b · a1 bzw. 1 < ab . Nun wendet man mit c = b−1 = b1
Insbesondere ergibt sich aus a < b für c ∈ R: die erste Aussage erneut an und erhält 1 · b1 < ab · 1b . Diese
Ungleichung ist identisch mit b1 < a1 .
a+c <b+c
(b + c) − (a + c) = (b − a) + (c − c) = (b − a) + 0 Folgerung
1 1
Ist ab > 0, so gilt a < b genau dann, wenn < ist.
= b − a ∈ R>0 . b a
Beweis: Für die erste Aussage sei c > 0. Dann ist zu In Kapitel 9 werden wir hierfür sagen, dass die Funk-
zeigen, dass aus a < b die Ungleichung ac < bc bzw. tion f : R>0 → R mit f (x) = x1 streng monoton fällt,
bc − ac ∈ R>0 folgt. da für wachsendes x die Kehrwerte immer kleiner werden
(Abb. 4.1).
Setzen wir a < b, d. h. b − a ∈ R>0 voraus. Mit (AO3 ) folgt
für c > 0 auch (b − a)c ∈ R>0 . Der Ausdruck (b − a)c ist f (x)
nach (D) identisch zu bc − ac. Also gilt bc − ac ∈ R>0 , d. h.
ac < bc. 7
Kommentar: Wegen 1 = 0 und 1 = 12 gilt stets 1 + 1 + Sind a, b ≥ 0, so können wir hierfür unter der Verwendung
. . . + 1 > 0. R hat deswegen die Charakteristik null (siehe der Existenz von Quadratwurzeln aus nicht negativen Zahlen
Abschnitt 3.3). (vgl. Existenzsatz für Quadratwurzeln auf Seite 115) auch
√ a+b
Gelegentlich werden wir auch Ungleichungen verketten. G(a, b) = ab ≤ = A(a, b)
2
Statt a ≤ b ∧ b ≤ c schreiben wir kurz a ≤ b ≤ c. Glei-
ches gilt für die <-Relation; wir notieren beispielsweise für schreiben und erhalten eine Abschätzung zwischen dem geo-
0 < x ∧ x < 1 einfach 0 < x < 1. metrischem Mittel, G(a, b), und dem arithmetischem Mittel
A(a, b).
a+b 1 1 − x2 1 x2
a< <b. y0 − y = 1 − x − = − =−
2 1+x 1+x 1+x 1+x
y0 − y ≤ 0 .
Beweis: Aus a < b folgt a + a < a + b und a + b < b + b
also auch Für alle x ∈ R mit − 10
1
≤x≤ 1
10 gilt:
a +a < a +b < b+b.
1
100 1
Damit ist 0 ≥ y0 − y ≥ − 1
=− .
a(1 + 1) < a + b < b(1 + 1) 1− 10
90
bzw. mit 2 = 1 + 1 > 0 Der relative Fehler bezogen auf den wahren Wert y ist für
alle x ∈ R
a+b y0 − y
a< < b. = −x 2 ≤ 0 ,
2 y
1 1
und für alle x ∈ R mit − 10 ≤x≤ 10 gilt:
Eine weitere wichtige Ungleichung für a, b ∈ R ergibt sich
aus y0 − y 1
≥− .
y 100
0 ≤ (a − b)2 = a 2 − 2ab + b2 bzw. 2ab ≤ a 2 + b2
?
Mithilfe der Anordnung der reellen Zahlen lassen sich wich- Warum ist die Vereinigung von zwei Intervallen i.A. kein
tige Teilmengen von R definieren, die Intervalle. Die meisten Intervall?
reellen Funktionen, die wir später betrachten werden, haben
Intervalle als Definitionsbereich, oder die Definitionsberei-
che setzen sich aus Intervallen zusammen.
Abgeschlossene Intervalle
Der Betrag einer reellen Zahl
1. Für a, b ∈ R mit a < b sei [a, b] = {x ∈ R | a ≤ x ≤ Ist a ∈ R, so heißt die Zahl
b}.
⎧
2. Für a = b sei [a, a] = {a}. ⎨ a, falls a > 0 ,
|a| = 0, falls a = 0 ,
Offene Intervalle ⎩
−a, falls a < 0
3. (a, b) = {x ∈ R | a < x < b} (mit a < b)
der Betrag von a.
4. Im Fall a = b ist (a, a) = ∅, wir fassen die leere Menge
also auch als Intervall auf.
Ordnet man jeder reellen Zahl x ihren Betrag |x| zu, erhält
Halboffene Intervalle
man eine Funktion | | : R → R≥0 mit x → |x|, deren
5. [a, b) = {x ∈ R | a ≤ x < b} Graph in der Abbildung 4.3 gezeigt ist.
6. (a, b] = {x ∈ R | a < x ≤ b}
Abgeschlossene Halbstrahlen
f (x)
7. [a, ∞) = {x ∈ R | x ≥ a}
8. (−∞, b] = {x ∈ R | x ≤ b} 2
? Der Betrag einer Zahl ist nach den ersten beiden Regeln nie
Zeigen Sie, dass für alle a ∈ R die Gleichheit |a| = | − a| negativ und genau dann gleich null, wenn a = 0 ist. Die dritte
gilt. Regel besagt, dass der Betrag eines Produkts gleich dem Pro-
dukt der Beträge ist. Definiert man als Abstand von a, b ∈ R
die Zahl d(a, b) = |a − b|, dann besagt die Dreiecksunglei-
Der Betrag ignoriert das Vorzeichen einer reellen Zahl, das chung für Abschätzungen nach unten, dass der Abstand von a
man durch die Signumfunktion, und b mindestens so groß ist, wie der Abstand ihrer Beträge.
Diese Aussage sowie die eigentliche Dreiecksungleichung
⎧
⎨ 1, falls a > 0, werden wir häufig verwenden.
sign (a) = 0, falls a = 0,
⎩
−1 falls a < 0
Beweis:
erhält. Die ersten beiden Regeln ergeben sich aus der Definition
des Betrags.
? Die zweite Regel gilt, denn wegen |ab| ≥ 0 und |a| |b| ≥ 0
Drücken sie die Betragsfunktion mithilfe der Signumfunk- gilt stets |ab| = ±ab = |a| |b|.
a
tion sign (a) aus. Die vierte Regel folgt mit · b = a aus der Multiplikati-
b
vität.
Aus −|a| ≤ a ≤ |a| und −|b| ≤ b ≤ |b| folgt −(|a| + |b|)
Im Zusammenhang mit dem Betrag ist eine schlichte Aussage ≤ a + b ≤ |a| + |b|, und mit unserem Hilfssatz ergibt sich
wichtig. |a + b| ≤ |a| + |b|.
Ersetzt man b durch −b in |a + b| ≤ |a| + |b|, so erhalten
Lemma wir |a − b| ≤ |a| + | − b| = |a| + |b|.
Für ε, x ∈ R, ε > 0, ist |x| < ε gleichbedeutend Die letzte Regel lässt sich mit der eben bewiesenen Drei-
−ε < x < ε. ecksungleichung zeigen: Es gilt |a| = |(a − b) + b| ≤
|a − b| + |b|, daher ist |a| − |b| ≤ |a − b|. Vertauscht man
Beweis: Für x = 0 ist |x| = 0, und 0 < ε ist nach die Rollen von a und b, so folgt |b|−|a| ≤ |b−a| = |a−b|
Voraussetzung erfüllt. und daher: ) )
) )
Es folgt der Beweis der Hinrichtung, „⇒“: )|a| − |b|) ≤ |a − b|.
) )
Sei |x| < ε. Wir müssen zwei Fälle unterscheiden. Denn ist
x > 0, so ist |x| = x, also −ε < 0 < x = |x| < ε. Gilt Ersetzt man b durch −b, so folgt auch:
andererseits x < 0, so ist |x| = −x, also −ε < −|x| =
x < 0 < ε. ) ) )) )
)
) ) )
)|a| − |b|) =)|a| − | − b|)) ≤ |a − (−b)| = |a + b|.
kein Maximum und die Intervalle Beweis: Wir nehmen an, es gäbe eine obere Schranke s
von M mit s < 1. Wir betrachten dann das arithmetische
(a, b), (a, b], (a, ∞), (−∞, b], (−∞, b) Mittel x von s und 1:
und (−∞, ∞)
s+1
x= .
kein Minimum haben. 2
4.2 Die Anordnungsaxiome für die reellen Zahlen 113
Ferner sollen M, N und P möglichst einfach mithilfe von Intervallen dargestellt werden.
Problemanalyse und Strategie: Möchte man Gleichungen oder Ungleichungen lösen, in denen Beträge vorkommen,
dann arbeitet man meistens mit Fallunterscheidungen, wodurch man auf die Beträge verzichten kann.
Lösung: fallen die Betragsstriche einfach weg und auch für den
Wir beginnen mit der Menge M. Es gelten folgende Äqui- umgekehrten Fall, nämlich 4−3x < 0 kann man sie durch
valenzen für x ∈ R, x = 0: eine Minusklammer ersetzen. Der Vorzeichenwechsel fin-
) ) ) ) det bei x = 43 statt. Wir unterscheiden daher die Fälle
)5 ) ) 5 + x2 ) |5 + x 2 |
) ) ) ) x < 43 , x > 43 bzw. x = 43 . Für x < 43 gilt:
x ∈ M ⇔ ) + x) < 6 ⇔ ) ) < 6⇔ < 6.
x ) x ) |x|
6
Hierbei haben wir die beiden Zahlen im Betrag auf ihren 2x + 10 < 4 − 3x ⇔ 5x < −6 ⇔ x < − = −1.2.
5
Hauptnenner x gebracht und danach den Bruch aufgespal-
ten. Jetzt multiplizieren wir mit |x| durch und erhalten: Ist x also kleiner als der Bruch b = 43 , so ist die Gleichung
für x < − 65 erfüllt. Untersuchen wir nun x > 43 :
|5 + x 2 | < 6|x| ⇔ 5 + x 2 < 6|x| ⇔ x 2 − 6|x| + 5 < 0.
2x + 10 < −(4 − 3x) ⇔ 2x + 10 < 3x − 4 ⇐⇒ x > 14.
Nun bereiten wir eine quadratische Ergänzung vor, indem
wir auf beiden Seiten 4 addieren:
Die Bedingung x > 43 ist mit x > 14 schon erfüllt. Wir
) )
|x|2 − 6|x| + 9 < 4 ⇔ (|x| − 3)2 < 22 ⇔ ) |x| − 3 ) < 2. haben noch nicht x = 43 betrachtet. Auch dieser Fall ist
möglich, doch löst er nicht unsere Ungleichung:
Schließlich lösen wir den Betrag auf:
4
2· + 10 < 0
−2 < |x|−3 < 2 ⇔ 1 < |x| < 5 ⇔ x ∈ (−5, −1) ∪ (1, 5). 3
M ist also die Vereinigung der (offenen) Intervalle ist offensichtlich nicht erfüllt. Die Zahlen x < −1.2 sowie
(−5, −1) und (1, 5), siehe Abbildung. die Zahlen x > 14 bilden zusammen die Menge N , die
sich als (−∞, −1.2) ∪ (14, ∞) schreiben lässt.
f (x)
10
Zuletzt untersuchen wir die Menge P . Hier wird die gerade
8 f1 (x) = 5
x +x benutzte Fallunterscheidung für 2x − 10 wieder hilfreich
f2 (x) = 6 sein. Ist x > 5, so gilt:
6
4
2 x ≥ |2x − 10| ⇔ x ≥ 2x − 10 ⇔ 10 ≥ x,
Es gilt s < x < 1, also ist x ∈ M, aber x > s, was ein Deswegen genügt es eigentlich, den folgenden Zusammen-
Widerspruch zur Voraussetzung, dass s obere Schranke von hang nur für Maximum und Supremum zu formulieren.
M ist, darstellt.
Das Vollständigkeitsaxiom garantiert die eine obere Schranke von M mit s < x. Dies ist ersichtlich
Existenz von Quadratwurzeln aus
2
2 x2 − a
Wir zeigen als Anwendung des Vollständigkeitsaxioms, dass s = x−
2x
es zu jeder nicht negativen reellen Zahl a eine eindeutig be-
2
stimmte nicht negative reelle Zahl x gibt, für die x 2 = a x2 − a x2 − a
2
gilt. = x − 2x +
2x 2x
>0
Existenzsatz für Quadratwurzeln
x2 − a
Zu jeder reellen Zahl a mit a ≥ 0 existiert eine eindeutig > x 2 − 2x
2x
bestimmte nicht negative reelle Zahl x mit x 2 = a. Die
√ = x 2 − (x 2 − a) = a.
Zahl x heißt die Quadratwurzel aus a und wird mit a
bezeichnet.
Es folgt für jedes y ∈ M die Ungleichung:
y2 ≤ a < s2
Beweis: Den Beweis unterteilen wir in zwei Abschnitte.
Zunächst betrachten wir den einfachen speziellen Fall a = 0 und hieraus, da y ≥ 0 und s > 0:
und danach den allgemeineren Fall a > 0.
y < s.
Sei a = 0. Die Gleichung x 2 = 0 hat nach der Nullteilerregel
nur die Lösung x = 0. Damit ist Diese Aussage, dass s auch eine obere Schranke für M dar-
stellt, widerspricht der Voraussetzung, dass x die kleinste
√ obere Schranke von M ist. Wir haben damit x 2 > a ausge-
0 = 0.
schlossen, und es gilt bereits x 2 ≤ a.
Als Nächstes nehmen wir x 2 < a an und zeigen, dass x keine
Nun untersuchten wir den Fall a > 0. Zuerst beweisen wir
√ obere Schranke von M ist. Wäre nämlich x 2 < a, dann ist
die Existenz der Quadratwurzel a und anschließend ihre
Eindeutigkeit. a − x2
δ = min 1 , > 0,
2x + 1
Wir betrachten die folgende Menge:
da der Bruch positiv ist. Weiter gilt:
M = { y ∈ R | y ≥ 0; y 2 ≤ a }. (x + δ)2 = x 2 + 2xδ + δ 2
≤ x 2 + 2xδ + δ (wegen δ ≤ 1)
Wegen 02 = 0 < a ist 0 ∈ M, also ist M = ∅. Außerdem gilt
für y > a+1 die Abschätzung y 2 > (a+1)2 = a 2 +2a+1 > = x 2 + (2x + 1)δ
a, d. h., a +1 ist eine obere Schranke von M. Mit y ∈ M folgt
a − x2
somit y ≤ a + 1. Die Menge M ist beschränkt und besitzt ≤ x 2 + (2x + 1)
nach dem Vollständigkeitsaxiom ein Supremum: 2x + 1
= x 2 + (a − x 2 )
x = sup M. = a.
In Übungsaufgabe 4.2 sollen diese Rechenregeln bewiesen Abbildung 4.6 Der Nebenzweig
√ der Quadratwurzel wird durch die Abbildung
f : R≥0 → R≤0 , f (x) = − x vermittelt.
werden.
Wir formulieren zunächst noch einmal die Behauptung. Dabei ist wegen x k > a > 0 insbesondere x k = 0. Also
Zu jeder nicht negativen reellen Zahl a gibt es genau eine ist a > x k − (x k − a) = a, damit a > a. Dieser Wi-
nicht negative reelle Zahl x mit x k = a für k ∈ N. Die derspruch zeigt, dass die Annahme x k > a falsch ist. Es
√ muss also x k ≤ a gelten. Im nächsten Schritt schließen
Zahl x heißt k-te Wurzel aus a und wird mit x = k a
notiert. wir x k < a aus und folgern so die Existenz von x mit
x k = a.
Da der Fall k = 1 evident ist, setzen wir k ≥ 2 voraus.
Angenommen, es gilt x k < a. Für jedes reelle λ mit
Wir geben einen Beweis an, der einen alternativen Be- k
weis für den Fall k = 2 enthält. Es müssen sowohl die x
0 < λ < 1 ist x < 1−λ x
und deshalb 1−λ > x k oder
Existenz als auch die Eindeutigkeit der gesuchten Zahl x x k > a(1−λ)k . Mithilfe der Bernoulli’schen Ungleichung
gezeigt werden. Für den Existenzbeweis müssen wir die folgt:
Menge M = {y ∈ R≥0 | y k < a} genauer untersuchen.
Die Eindeutigkeit ergibt sich aus der Tatsache, dass aus x k > a(1 − kλ) = a − kaλ.
0 < x1 < x2 stets x1k < x2k folgt. k
Wählt man speziell die positive Zahl λ = a−x
ka < 1, dann
Ist a = 0, so wählen wir x = 0. Wir setzen also im Fol-
folgt der Widerspruch x k > a − (a − x k ) = x k .
genden a > 0 voraus.
Wir betrachten die Menge M. Wegen 0 ∈ M ist M = Es ist also tatsächlich x k = a. Man notiert für a üblicher-
√ √
∅. M ist nach oben beschränkt durch 1 + a, denn für weise a = k x. Im Fall k = 1 ist a = 1 x = x und
√
y > 1 + a folgt nach der Bernoulli’schen Ungleichung für k = 2 notiert man nicht a = 2 x, sondern einfach
√
y k > (1 + a)k ≥ 1 + ka > ka > a. Für y ∈ M ist a = x. Damit haben wir die Existenz der k-ten Wurzeln
daher y ≤ 1 + a, also ist M nach oben beschränkt. Wir von nicht negativen reellen Zahlen bewiesen.
definieren x = sup M und behaupten x k = a. Beweisen
werden wir dies, indem wir x k < a bzw. x k > a zu einem Für die k-te Wurzel gelten in Analogie zur Quadratwurzel
Widerspruch führen. die folgenden Rechenregeln:
Wir nehmen zuerst an, dass x k > a gilt. Für jedes re- √ √ √
für alle a, b ∈ R≥0 gilt k
ab = k k
a b,
elle λ mit 0 < λ < 1 ist 0 ≤ x(1 − λ) < x und daher √
k
a
(x(1 − λ))k < a. Mit der Bernoulli’schen Ungleichung für alle a ≥ 0 und b > 0 gilt k
= √
a
b k ,
√ b
√ l
folgt a > x k (1 − λ)k ≥ x k (1 − kλ) = x k − kx k λ. k
für alle a ≥ 0 und l ∈ N, l ≥ 2 gilt a l = k a .
Speziell gilt diese Überlegung für die nach Voraussetzung Der Beweis erfolgt vollkommen analog zu Aufgabe 4.2.
positive Zahl Einen weiteren eleganten Beweis für die Existenz k-ter
xk − a xk 1 1 Wurzeln erhält man mithilfe des Zwischenwertsatzes, den
λ= k
< k
= ≤ < 1. wir später in Kapitel 9 betrachten werden.
kx kx k 2
sen der Logik und der Mengenlehre in sich konsistent sind. 3 := 2 + 1, 4 := 3 + 1, usw. und die so erhaltenen Zah-
Bei diesem konstruktiven Aufbau startet man üblicherweise len als natürliche Zahlen in K zu bezeichnen. Das Beispiel
mit den Peano-Axiomen für die natürlichen Zahlen und er- Z/2Z des endlichen Körpers mit zwei Elementen zeigt je-
weitert diese über die ganzen und rationalen Zahlen schließ- doch, dass dieses Verfahren nicht unseren Vorstellungen ent-
lich zu den reellen Zahlen (siehe Vertiefung ab Seite 144). spricht, denn in Z/2Z ist 2 := 1 + 1 = 0. Aufgrund der
Diesen Weg beschreiten wir an dieser Stelle nicht. Wir ge- Anordnungsaxiome in R können jedoch in dem angeordne-
ben stattdessen eine präzise Charakterisierung der natürli- ten Körper R solche „Pathologien“ nicht auftreten. Dies gilt
chen Zahlen als Teilmenge von R. für jeden angeordneten Körper K.
Wir skizzieren im Folgenden, wie man die natürlichen Zah-
len als Teilmenge von R definieren kann. R setzen wir, wie
4.4 Natürliche Zahlen und bereits erwähnt, als gegeben voraus. Als Nebenprodukt er-
vollständige Induktion halten wir das Beweisprinzip der vollständigen Induktion.
Dieses Prinzip ist dann ein beweisbarer Satz und kein Axiom
wie bei anderen Zugängen.
Ein beliebiger Körper K enthält nach Definition die Ele-
mente 0 und 1. Um weitere „Zahlen“ zu definieren, liegt es Unsere Vorstellung von den natürlichen Zahlen ist, dass man
nahe, einfach sukzessive die 1 zu addieren, also 2 := 1 + 1, einen „Anfang des Zählens“ hat, nämlich die 1. Durch Ad-
118 4 Zahlbereiche – Basis der gesamten Mathematik
dition der 1 können wir irgendeine noch so große natürliche Definition von Zählmengen
Zahl, sagen wir N konstruiert haben. Es gibt dann immer
Eine Teilmenge Z ⊆ R heißt Zählmenge, induktive
eine größere Zahl, z. B. (N + 1). Die natürlichen Zahlen
Menge oder Nachfolgermenge, falls gilt:
werden „größer und größer‘‘, und die Menge der natürlichen
1 ∈ Z,
Zahlen hat sicher kein Maximum. Aber sind die natürlichen
für alle x ∈ Z ist auch stets (x + 1) ∈ Z.
Zahlen vielleicht doch durch eine reelle Zahl nach oben be-
schränkt?
?
Relativ klar ist auch, dass es unendlich viele natürliche Begründen Sie jeweils die folgenden Aussagen:
Zahlen gibt. Aber was heißt das genau? Wir präzisieren
R selbst ist Zählmenge.
den Begriff der Unendlichkeit in der Vertiefungsbox auf
R≥0 = { x ∈ R | x ≥ 0 } ist eine Zählmenge.
Seite 122.
R\{2} = { x ∈ R | x = 2 } ist keine Zählmenge.
Wir behaupten, dass die Eigenschaft (DED): Wegen M = ∅ gilt auch A = ∅, und da M nach oben
sind A,B nichtleere Teilmengen von R, und gilt für beschränkt ist, zusätzlich B = ∅. Da jedes b ∈ B obere
alle a ∈ A und alle b ∈ B die Ungleichung a ≤ b, Schranke von M ist, gilt a ≤ b für alle a ∈ M. Damit ist
dann gibt es eine reelle Zahl t mit a ≤ t ≤ b für alle a ≤ b für alle a ∈ A und alle b ∈ B.
a ∈ A und b ∈ B, Die Voraussetzungen von (DED) sind also gegeben und
zum angegebenen Vollständigkeitsaxiom (V) äquivalent es existiert ein t ∈ R, sodass für alle a ∈ A und für alle
ist. Eine geometrische Interpretation dieser Eigenschaft b ∈ B a ≤ t ≤ b gilt. Wenn wir s = t setzen, so besagt die
ist die „Lückenlosigkeit“ von R, denn zwischen je zwei linke Ungleichung, dass s obere Schranke von M ist. Der
nichtleeren Mengen A, B ⊆ R mit der obigen Eigenschaft rechte Teil der Ungleichung sichert, dass s kleinste obere
kann man, wo A und B zusammenstoßen, stets eine reelle Schranke von M ist. Damit ist s aber gerade das gesuchte
Zahl t finden. Supremum, dessen Existenz hiermit bewiesen ist. Insge-
samt haben wir die Äquivalenz der beiden Eigenschaften
Um die Äquivalenz zu zeigen beginnen wir mit
gezeigt
(V)⇒(DED), d. h., wir müssen aus (V) die Eigenschaft
(DED) folgern. Seien dazu A und B nichtleere Teilmen- Neben diesen beiden Varianten des Vollständigkeits-
gen von R mit der Eigenschaft, dass für alle a ∈ A und axioms gibt es viele weitere, die hier nur erwähnt werden.
für alle b ∈ B die Ungleichung a ≤ b gilt. Dazu kürzen wir die archimedische Eigenschaft (siehe
Wir müssen zeigen, dass es ein t ∈ R gibt mit a ≤ t ≤ b Seite 123) mit (AE) ab.
für alle a ∈ A bzw. b ∈ B. Wegen a ≤ b für alle a ∈ A (AE) und das Intervallschachtelungsprinzip, das be-
ist jedes b ∈ B obere Schranke für A. Dabei ist zu beach- sagt, dass eine Intervallschachtelung (siehe Auf-
ten, dass B = ∅ vorausgesetzt ist. A ist also eine nichtleere gabe 8.21) genau eine reelle Zahl enthält, die in allen
nach oben beschränkte Teilmenge von R und besitzt damit Intervallen enthalten ist.
nach Voraussetzung ein Supremum. Wir setzen t = sup A.
Dann gilt a ≤ t für alle a ∈ A. Jedes b ∈ B ist aber obere (AE) und die Eigenschaft, dass jede Cauchy-Folge
Schranke von A und wegen der Supremumseigenschaft konvergiert.
gilt t ≤ b für alle b ∈ B. Insgesamt gilt für alle a ∈ A und
b ∈ B die Behauptung a ≤ t ≤ b. Das Monotonieprinzip. Es besagt, dass jede monoton
Nun zeigen wir die Umkehrung (DED)⇒(V). Dazu sei wachsende nach oben beschränkte reelle Folge konver-
M ⊆ R eine nichtleere nach oben beschränkte Teil- giert.
menge. Wir wollen aus (DED) folgern, dass ein Supre-
mum s = sup M existiert. Um die Voraussetzungen von Die Bolzano-Weierstraß-Eigenschaft. Sie besagt, dass
(DED) anwenden zu können, setzen wir A = M und jede beschränkte Folge reeller Zahlen eine konvergente
Teilfolge besitzt.
B = SM = {x ∈ R | x ist obere Schranke von M}.
Zunächst halten wir fest, dass N selbst Zählmenge ist. Damit kann man N als die bezüglich ⊆ kleinste Zählmenge
von R charakterisieren, denn nach Definition ist N in jeder
Folgerung Zählmenge enthalten. Mengentheoretisch bedeutet dies:
Die Menge N der natürlichen Zahlen ist eine Zählmenge.
N= {Z ⊆ R | Z Zählmenge}.
Beweis: Diese Menge enthält damit alle uns vom Zählen her bekann-
Es ist 1 ∈ N erfüllt, da 1 ∈ Z für jede Zählmenge Z gilt, ten natürlichen Zahlen 1, 2, 3, . . . .
und die 1 auch im Schnitt all dieser Mengen enthalten ist.
Ist x eine beliebige reelle Zahl, die in N liegt, so muss
?
Wieso gibt es keine natürliche Zahl n mit 1 < n < 2?
auch (x + 1) in N liegen. Da x ∈ N liegt, muss x in jeder
Zählmenge Z liegen. Da für jede Zählmenge gilt, dass
der Nachfolger (x + 1) vorhanden ist, liegt x + 1 in allen Als beweisbaren Satz erhalten wir nun den wichtigen Induk-
Zählmengen vor, und so gilt auch (x + 1) ∈ N. tionssatz.
120 4 Zahlbereiche – Basis der gesamten Mathematik
Eigenschaften von N
Abbildung 4.7 In der Abbildung wird der „Dominoeffekt“ der vollständigen Für jede natürliche Zahl n gilt n ≥ 1.
Induktion gezeigt. Ist nachgewiesen, dass aus der Vorgängeraussage stets die
Nachfolgeraussage folgt, werden alle wahr, die nach der ersten nachgewiesen
Summe und Produkt natürlicher Zahlen sind wieder
richtigen Aussage folgen. Bei Dominosteinen entspricht das dem korrekten natürliche Zahlen.
Aufstellen der Steine und dem dann folgenden Umstoßen eines der Steine, Falls für zwei natürliche Zahlen n, m ∈ N die Unglei-
meistens des ersten.
chung n > m gilt, so ist die Differenz n − m wieder
eine natürliche Zahl.
Beweisprinzip der vollständigen Induktion Ist n eine beliebige natürliche Zahl, dann gibt es keine
Für jede natürliche Zahl n sei A(n) eine Aussage bzw. natürliche Zahl z mit n < z < n + 1. Zwischen n und
Behauptung. Diese kann wahr oder falsch sein. n + 1 existiert keine weitere natürliche Zahl.
Die Aussagen A(n) gelten für alle n ∈ N, wenn man Ist An = { x ∈ N | x ≤ n } = {1, 2, . . . , n}, dann ist
Folgendes zeigen kann: An+1 = An ∪ {n + 1} = { 1, . . . , n, n + 1 }.
(IA) A(1) ist wahr und
(IS) für jedes n ∈ N gilt A(n) ⇒ A(n + 1). Wohlordnungssatz: Jede nichtleere Teilmenge
Der erste Schritt (IA) heißt Induktionsanfang oder B ⊆ N besitzt ein Minimum.
Induktionsverankerung, und die Implikation A(n) ⇒
A(n + 1) nennt man den Induktionsschritt .
Beweis: Wir beweisen hier nur den Wohlordnungssatz und
Zum Beweis braucht man nur zu beachten, dass die Menge überlassen dem Leser die weiteren Aussagen zur Übung.
M = {n ∈ N | A(n) ist wahr} ⊆ N eine Zählmenge ist und Wir nehmen an, es gebe eine nichtleere Teilmenge B ⊆ N,
daher mit N identisch sein muss. die kein Minimum besitzt und betrachten die folgende Menge
Auf Beispiele für das Beweisprinzip der vollständigen In- von natürlichen Zahlen:
duktion gehen wir in einem späteren Abschnitt ausführlich M = {n ∈ N | für alle k ∈ B ist n ≤ k}.
ein. Zunächst sei angemerkt, dass man aus der Definition der
natürlichen Zahlen die folgenden fünf Peano-Eigenschaften M besteht aus den natürlichen Zahlen, die untere Schranken
der natürlichen Zahlen ableiten kann. von B sind. Es gilt entweder M = ∅ oder 1 ∈ M, denn jede
natürliche Zahl k ist größer oder gleich 1. Da M nichtleer ist,
ist 1 ∈ M.
Ist weiter n ∈ M, dann enthält B nur Zahlen ≥ n. Wäre n in
B enthalten, so wäre n die kleinste Zahl in B. Die Menge B
4.4 Natürliche Zahlen und vollständige Induktion 121
hat aber nach Voraussetzung kein Minimum. Daher enthält M = {m1 , m2 , . . . , mn } gilt. Jedes m ∈ M kommt in dieser
B nur Zahlen größergleich n + 1, was n + 1 ∈ M bedeutet. Liste vor, da ϕ surjektiv ist, und verschiedene Elemente aus
Damit ist M eine induktive Teilmenge von N und nach dem M erhalten verschiedene Nummern. Denn mit der Injektivität
Induktionssatz gilt M = N. Dann muss B aber leer sein, denn von ϕ folgt aus j = k für 1 ≤ j, k ≤ n auch mj = mk . Mit
mit n ∈ B ist n + 1 ∈/ M = N. Dies steht im Widerspruch einer Induktion nach n lässt sich zeigen, dass n eindeutig
zur Voraussetzung B = ∅. bestimmt ist. Man nennt die Elementanzahl |M| = n die
die Kardinalzahl oder die Mächtigkeit von M. Statt |M|
? findet sich in der Literatur auch #M oder cardM. Eine nicht
Zeigen Sie, dass aus dem Wohlordnungssatz der Induktions- endliche Menge nennen wir unendlich.
satz abgeleitet werden kann.
?
Zeigen Sie, dass N unendlich ist.
Die Mengen An = {1, 2, . . . , n} sind Prototypen endlicher
Mengen mit genau n Elementen.
Definition endlicher Mengen Die Menge der natürlichen Zahlen ist nicht
Wir nennen eine Menge endlich, wenn M = ∅ ist oder nach oben beschränkt
wenn es ein n ∈ N und eine bijektive Abbildung ϕ :
{1, 2, . . . , n} → M gibt. Für jede natürliche Zahl n ist n + 1 eine größere natürli-
che Zahl und so kann es keine größte natürliche Zahl geben.
Man kann die Elemente einer endlichen Menge M so mit Eine natürliche Zahl kann daher nicht obere Schranke für die
den natürlichen Zahlen 1, 2, . . . , n durchnummerieren, dass Menge N der natürlichen Zahlen sein. Es könnte jedoch eine
122 4 Zahlbereiche – Basis der gesamten Mathematik
Hintergrund und Ausblick: Darf’s ein bisschen mehr sein – abzählbar unendliche Mengen
Was haben die Woche und die Weltwunder gemeinsam? Es gibt 7 Wochentage und 7 Weltwunder. Das Gemeinsame ist,
mathematisch ausgedrückt, die Elementanzahl 7 der jeweiligen Menge. Die betrachteten Beispiele sind endliche Mengen,
wobei dieser Begriff intuitiv klar ist. Was haben die natürlichen Zahlen ohne Null mit denen mit der Null gemeinsam? Auch sie
haben gleich viele Elemente und das mag überraschen. Im folgenden Text geben wir eine kurze Übersicht über den Begriff der
Abzählbarkeit in der Mathematik, und Sie werden sehen, dass es gleich viele natürliche wie rationale Zahlen gibt.
Grundsätzlich stellt sich die Frage, ob es überhaupt über- Menge der so erhaltenen Dezimalbrüche überabzählbar ist
abzählbare Mengen gibt. und da diese Menge eine Teilmenge der reellen Zahlen ist,
ist R selbst überabzählbar.
Seien M = ∅ und N = {0, 1} und F = Abb(M, N ), also
die Menge aller Abbildungen von M nach N. Die Bilder Was wir nebenbei gezeigt haben, ist, dass für jede Menge
der Elemente aus M sind entweder die Zahlen 0 oder 1. M die Potenzmenge P (M) eine größere Mächtigkeit als
M besitzt. Denn definiert man für eine Teilmenge A ⊆ M
Ordnet man jedem m ∈ M die Abbildung fm : M → N
die charakteristische Funktion
zu, die für x = m durch fm (x) = 1 und für x = m als
fm (x) = 0 definiert ist, so sind M und die Teilmenge 1, falls x ∈ A,
{fm | m ∈ M} gleichmächtig. M ist jedoch nicht zur χA (x) =
0, falls x ∈
/ A,
ganzen Menge F gleichmächtig; denn definiert man die
Abbildung dann ist die Abbildung A → χA eine Bijektion von der
1, falls fm (m) = 0, Menge aller Teilmengen von M, also der Potenzmenge auf
f (m) =
0, falls fm (m) = 1, die Menge Abb(M, {0, 1}) = F . Die Überabzählbarkeit
dann liegt f in F , stimmt aber mit keinem fm überein. von F haben wir bereits mit dem Cantor’schen Diagonal-
Diese Idee ist bekannt als 2. Cantor’sches Diagonalver- verfahren gezeigt.
fahren. Damit ist gezeigt, dass die Menge M und die Aus der Überabzählbarkeit von R folgt auch die Überab-
Menge F nicht gleichmächtig sein können und F eine zählbarkeit der Menge R\Q der irrationalen Zahlen wegen
größere Mächtigkeit als M besitzt. Nimmt man nun für R = Q ∪ (R\Q). Es gibt „viel mehr“ irrationale Zahlen
M = N0 , so ist F die Menge aller Folgen, welche nur die als rationale Zahlen. Für die Mächtigkeit von R wird üb-
Werte 0 oder 1 annehmen. Hier einige Beispiele aus dieser licherweise das Symbol c verwendet.
Menge:
01001000100001000001 . . . Allerdings bleibt die Frage offen, ob für eine unend-
liche Teilmenge M ⊆ R notwendigerweise entweder
01010101010101010101 . . .
|M| = ℵ0 = |N0 | oder |M| = c gilt. Dies ist die Konti-
01011011101111011111 . . . nuumshypothese, welche D. Hilbert 1900 als erstes Pro-
01101101101101101101 . . . blem in seiner Liste von zentralen Fragen der Mathematik
10101010101010101010 . . . aufgenommen hat. K. Gödel hat 1938 gezeigt, dass die
Verneinung der Kontinuumshypothese mit dem üblichen
Diese Menge ist damit überabzählbar. Axiomensystem der Mengenlehre nicht beweisbar ist, und
P. Cohen hat 1963 bewiesen, dass die Kontinuumshypo-
Für die Analysis ist die Überabzählbarkeit der Menge
these selbst nicht beweisbar ist. Dies ist überraschend:
der reellen Zahlen entscheidend. Diese Überabzählbarkeit
wird schon deutlich, wenn man sich auf das Intervall [0, 1) Mit den üblichen Axiomen der Mengenlehre lässt
beschränkt. sich die Kontinuumshypothese grundsätzlich weder
beweisen noch widerlegen.
Ist f = (fn ) ∈ F = Abb(N0 , {0, 1}), dann kann man
diesem f in eindeutiger Weise eine reelle Zahl aus [0, 1) Wie man zeigen kann, haben alle echten Intervalle eben-
zuordnen (Reihen werden in Kap. 10 behandelt): falls die Mächtigkeit von R. Das Cantor’sche Diskonti-
∞
! fk nuum C (siehe Kapitel 9) und erstaunlicherweise alle Rn
f → xf = . mit n ∈ N sind gleichmächtig zu R. Auch die Menge
10k+1
k=0 C (R, R) der stetigen Funktionen f : R → R hat die Mäch-
Die Zahl xf ist ein Dezimalbruch und stellt eine reelle tigkeit von R. Aber die Menge Abb(R, R) aller Abbildun-
Zahl im Intervall [0, 1) dar. Die Zuordnung zeigt, dass die gen von R nach R hat eine größere Mächtigkeit als R.
reelle Zahl aus R \ N geben, die obere Schranke von N ist. Eine alternative Formulierung besagt, dass es zu jeder reellen
Dass das nicht der Fall ist, ergibt sich als wichtige Konse- Zahl x eine natürliche Zahl n gibt mit n > x.
quenz aus dem Vollständigkeitsaxiom.
Die archimedische Eigenschaft von R Beweis: Wenn N nach oben beschränkt wäre, müs-
ste N nach dem Vollständigkeitsaxiom eine kleinste obere
Die Menge der natürlichen Zahlen ist nicht nach oben
Schranke s0 besitzen. Für jedes n ∈ N müsste also n ≤ s0
beschränkt.
gelten.
124 4 Zahlbereiche – Basis der gesamten Mathematik
Andererseits muss es eine natürliche Zahl N mit N > s0 − 1 wollen wir eine exakte Notation einführen. Wir definieren
geben, da sonst s0 − 1 obere Schranke von N wäre, also s0 das Summenzeichen:
nicht die kleinste obere Schranke von N sein könnte.
!
n
Die natürlichen Zahlen treten häufig als Index beim Durch- 2s = (n + 1) + (n + 1) · · · + . . . (n + 1) = n(n + 1),
nummerieren von Elementen der Form aj auf, etwa Koor- n mal
dinaten von Vektoren oder beim Aufsummieren von Zahlen.
Für die dabei genutzte „Pünktchenschreibweise“, wie in bzw. nach Auflösen nach s:
n(n + 1)
s= .
12 + 22 + . . . + 1002 , 2
4.4 Natürliche Zahlen und vollständige Induktion 125
ϕ : {1, 2, . . . , n} → M mit j → mj
gibt (Seite 121). Die Zahl n ist dann eindeutig bestimmt und heißt Elementanzahl (Kardinalzahl, Mächtigkeit) von M (Abschnitt
4.5). Eine nichtendliche Menge haben wir unendlich genannt. Ein Prototyp für eine unendliche Menge ist die Menge N0 der
natürlichen Zahlen (mit Null). Es gibt noch eine weitere Definition des Unendlichkeitsbegriffs, der auf Dedekind zurückgeht. In
dieser Box werden Sie feststellen, dass dieser zu unserem Unendlichkeitsbegriff äquivalent ist.
Dass N0 eine nach unserer bisherigen Definition unendli- Durch Negation erhält man eine rein mengentheoretische
che Menge ist, ergibt sich z. B. aus folgendem Satz: Definition von endlichen Mengen, die keinen Gebrauch
von den natürlichen Zahlen macht. Das ist die Dede-
Sind A und B Mengen mit B ⊆ A, B = A, und gilt
kind’sche Endlichkeitsdefinition:
|B| = |A|, dann ist A unendlich.
Eine Menge ist genau dann endlich, wenn sie sich nicht
Denn setzt man A = N0 und B = N = N − {0}, dann
bijektiv auf eine echte Teilmenge abbilden lässt.
findet sich mit der Nachfolgefunktion
Wir müssen lediglich zeigen, dass das Dedekind’sche Un-
ν : N0 → N; n → ν(n) = n + 1 endlichkeitskriterium auch notwendig für die Unendlich-
keit einer Menge ist:
eine Bijektion. Damit haben beide Mengen gleich viele
Elemente und der vorhergehende Satz ist anwendbar. Beweis: Sei A eine unendliche Menge. Wir definie-
N0 ist also zur (eigenen) echten Teilmenge N gleichmäch- ren eine Abbildung g : N0 → A darüber, dass wir g(0)
tig. Wir erinnern dazu an das Galilei-Paradoxon: Schon mit einem beliebig gewählten (Anfangs-)Element aus A
Galilei hatte 1638 festgehalten, dass N0 und die geraden gleichsetzen und für g(n + 1) ein beliebiges Element aus
natürlichen Zahlen 2N0 die gleiche Mächtigkeit haben, der Menge B = A − {g(0), g(1), . . . g(n)} auswählen. Da
denn die Abbildung ϕ : N0 → 2N0 ; n → 2n ist bijektiv. A unendlich ist, ist dieses Komplement A nichtleer. g ist
injektiv (wir verzichten mangels Platz auf einen Beweis),
Weil wir wissen, dass jede Teilmenge einer endlichen und für die Bildmenge gilt |N0 | = |g(N0 )| ⊆ A.
Menge wieder endlich ist, folgt ein Umkehrschluss:
Durch die folgende Umkehrabbildung von g
Ist B unendlich und B ⊆ A, dann ist auch A unendlich.
Da N0 unendlich ist, ergibt sich mit diesem Satz, dass die x, falls x ∈ B,
f (x) =
Zahlbereiche Z, Q, R und C unendlich sind. g(g −1 (x) + 1), falls x ∈ g(N0 )
Das Unendlichkeitskriterium des eingangs formulierten wird insgesamt eine Bijektion definiert, und es gilt
Satzes ist – wie Dedekind gezeigt hat – auch hinreichend |A| = |B|. A ist zur echten Teilmenge B gleichmächtig.
für die Unendlichkeit einer Menge; der Satz gilt also in
Mit dem Summenzeichen können wir diesen Gedanken durch Man definiert rekursiv das Produktzeichen durch
eine einfache Umnummerierung mit Index k = n + 1 − k ⎛ ⎞
wie folgt beschreiben:
n+1
n
aj = ⎝ aj ⎠ an+1
!
n !
n !
n
j =1 j =1
k= (n + 1 − k ) = n(n + 1) − k.
k=1 k =1 k =1
0
und legt weiterhin j =1 aj = 1 fest.
Also folgt die Identität, da in der letzten Summe der Index k
durch den Buchstaben k ersetzt werden kann.
Durch obiges Beispiel motiviert liegt folgende Vermutung alle qj (1 ≤ j ≤ s) größer als p1 sein, sonst wäre n nicht
nahe: Ist n > 1 eine natürliche Zahl, dann ist die kleinste minimal gewesen. Betrachtet man
Zahl t = 1, die n teilt (kurz schreiben wir t|n), eine Prim-
zahl. Für n = 60 gilt t = 2, denn 60 = 2 · 30. Beweisen
s
n = n − p 1 · qj ,
kann man diese Vermutung, wenn man die Menge T aller
j =2
Teiler t von n, die von 1 verschieden sind, untersucht. T
ist nichtleer, da n ∈ T gilt, und besitzt nach dem Wohl- so gilt auch:
ordnungssatz ein kleinstes Element p. Diese Zahl p muss
prim sein, sonst gäbe es ja noch eine kleinere Zahl als p
s
in T . n = (q1 − p1 ) · qj .
j =2
Betrachten wir nochmals n = 60 und die Zerlegung
60 = 2 · 30. Für die Zahl 30 finden wir 30 = 3 · 10 und mit Die Zahl n ist wegen der Minimalität von n eindeutig
10 = 2·5 insgesamt 60 = 22 ·3·5. Durch mehrfaches An- in ein Produkt aus Primzahlen zerlegbar, welches nach
wenden unserer Vermutung haben wir 60 in Primzahlen der ersten Formel durch p1 teilbar ist. Wegen der zweiten
zerlegt. Diese Verfahren lässt sich verallgemeinern, und Darstellung von n muss (q1 − p1 ) durch p1 teilbar sein,
so gibt es zu jeder natürlichen Zahl n ≥ 2 Primzahlen denn das hintere Produkt enthält p1 nach Voraussetzung
p1 , . . . , pr , mit denen sich n wie folgt darstellen lässt: gerade nicht. Ist (q1 − p1 ) durch p1 teilbar, so gilt p1
teilt (q1 − p1 ) + p1 . Dies führt auf den Widerspruch, dass
r
p1 die Zahl q1 teilt. Also war unsere Annahme, es gäbe
n = p1 · . . . · pr = pj .
natürliche Zahlen n ≥ 2 mit nicht eindeutiger Primzahl-
j =1
zerlegung, falsch.
Die Existenz einer Primzahlzerlegung sowie deren Ein- Der Begriff der Primzahl sowie der Existenzsatz über die
deutigkeit, bis auf ihre Reihenfolge, sind im Hauptsatz Primzahlzerlegung findet sich bereits in den Elementen
der elementaren Zahlentheorie oder auch Fundamental- von Euklid (Buch VII und IX). Die Eindeutigkeit wird bei
satz der Arithmetik zusammengefasst: Euklid nicht thematisiert, obwohl eine Kombination eini-
ger von Euklid aufgestellter Propositionen diese ergeben
Jede natürliche Zahl n ≥ 2 besitzt eine Zerlegung in
hätten. Bei Euklid findet sich (Prop. VII.30) diese Aus-
Primzahlen. Diese Zerlegung ist bis auf die Reihen-
sage: Teilt eine Primzahl p ein Produkt ab von natürlichen
folge der Faktoren eindeutig bestimmt.
Zahlen a, b, dann teilt p mindestens einen der Faktoren a
Ein Beweis dieses Satzes findet sich zuerst bei C. F. Gauß bzw. b. Diese Eigenschaft nennt man heute die Primele-
in seinen Disquisitiones Arithmeticae aus dem Jahre 1801. menteigenschaft. Bei Euklid wird sie mithilfe des euklidi-
schen Algorithmus bewiesen. Nach unseren Existenz- und
Zum Beweis dieser Aussage ist lediglich noch zu zeigen,
Eindeutigkeitsbeweisen folgt die Primelementeigenschaft
dass jede natürliche Zahl n ≥ 2 höchstens eine Primfaktor-
aus der Eindeutigkeit der Primzahlzerlegung von ab. Ins-
zerlegung besitzt. Wir geben hier einen indirekten Beweis
gesamt gilt das Primzahlkriterium: Eine natürliche Zahl
an. Angenommen, es gäbe natürliche Zahlen mit nicht
p > 1 ist genau dann prim, wenn für beliebige a, b ∈ N
eindeutigen Primfaktorzerlegungen. Nach dem Wohlord-
aus p|ab stets p|a oder p|b folgt. Die Unzerlegbarkeit und
nungssatz gibt es eine kleinste Zahl n mit dieser Eigen-
die Primelementeigenschaft sind also äquivalent.
schaft. Nach dem Existenzsatz einer Primzahlzerlegung
lässt sich n schreiben als n = p1 · . . . · pr , wobei p1 der Dass die Eindeutigkeit der Primzahlzerlegung nicht selbst-
kleinste Primteiler von n sei. Nach Voraussetzung besitzt verständlich ist, zeigt Übungsaufgabe 4.21. Mehr zu Prim-
n nun aber noch mindestens eine weitere von der obigen zahlen und Teilbarkeit finden Sie in Kapitel 25 „Elemente
verschiedene Zerlegung n = q1 · . . . · qs . Dabei müssen der Zahlentheorie“.
4.5 Ganze Zahlen und rationale Zahlen 127
4.5 Ganze Zahlen und rationale Achtung: Man beachte, dass die Darstellung einer ratio-
nalen Zahl in der Form x = m n , m, n ∈ Z, n = 0, nicht
Zahlen eindeutig ist. Nach den Regeln der Bruchrechnung gilt für
m m
m , n ∈ Z mit n = 0 die Identität = genau dann,
Die natürlichen Zahlen haben eine dürftige algebraische n n
wenn mn = nm ist.
Struktur. Zwar ist mit je zwei natürlichen Zahlen m und n
auch m + n und m · n eine natürliche Zahl und für die natür-
liche Zahl 1 gilt 1 · n = n für alle n ∈ N, aber N besitzt kein Diese Tatsache ist ein Beispiel für eine Äquivalenzrelation
neutrales Element bezüglich der Addition, und für n ∈ N ist in Z × Z\{0}, wie sie in Kapitel 2 eingeführt wurde.
(−n) ∈/ N.
?
Daher erweitert man N zunächst durch Hinzunahme der Null Prüfen Sie für obige Paare
zu
(m, n) ∼ (m , n )
N0 = N ∪ {0} = {0, 1, 2, 3, . . . }.
die Eigenschaften einer Äquivalenzrelation nach.
Jetzt ist zwar Null ein neutrales Element bezüglich der Ad-
dition in N0 , aber die Gleichung 2 + x = 0 besitzt immer
noch keine Lösung x ∈ N0 . Um diesem Mangel abzuhelfen,
erweitern wir N0 noch einmal. Kommentar: Die Unterteilung von R in die rationalen
bzw. die irrationalen Zahlen ist nicht die einzige Möglichkeit,
Definition der ganzen Zahlen
die reellen Zahlen sinnvoll aufzuteilen. In Übungsaufgabe 4.7
werden Sie sehen, dass man die reellen Zahlen auch in die
Eine reelle Zahl x heißt ganz, falls x ∈ N oder x = 0 Menge der algebraischen bzw. der transzendenten Zahlen
oder −x ∈ N gilt. Z = {x ∈ R | x ganz} heißt Menge unterteilen kann. Diese Unterteilung ist insbesondere für die
der ganzen Zahlen. Zahlentheorie von großer Bedeutung.
von natürlichen Zahlen immer ein kleinstes Element enthält Durch den eben eingeführten Satz sind die folgenden bei-
(sehen Sie hierzu den Wohlordnungssatz auf Seite 120). den Treppenfunktionen motiviert: Die Funktion [ ] : R →
√ Z, x → [x] weist x die größte ganze Zahl kleiner oder
Nun setzen wir n√= 2m∗ − m∗ . Auch diese Zahl n muss
gleich x zu. Man verwendet anstelle von p = [x] auch &x'
natürlich sein, da √2m∗ wie auch m∗ natürlich sind, und weil
bzw. floor(x). Sie wird häufig als Gauß-Klammer oder auch
√ wissen, dass 2 > 1 ist. Multiplizieren wir nun n mit
wir
Abrundungsfunktion bezeichnet. Ihr Gegenstück, die Auf-
2, so ergibt sich folgendes Produkt
√ √ √ √ rundungsfunktion, wird mit q = (x) = ceil(x) bezeichnet.
n · 2 = ( 2m∗ − m∗ ) · 2 = 2m∗ − 2m∗ . Diese Funktion weist x die kleinste ganze Zahl größer oder
gleich x zu.
Dieses Produkt
√ ∗ist offensichtlich natürlich, denn sowohl
√ 2m∗
wie auch 2m sind natürlich und es gilt 2 > 2. Damit Beispiel
haben wir einen neuen minimalen Kandidaten
√ m = n ge-
funden, der unsere Grundgleichung 2 · m ∈ N erfüllt. Wir [π] = 3 , [−π] = −4
√ √
stellen aber fest, dass n = ( 2−1)m∗ < m∗ , da 2−1 < 1 (π) = 4 , (−π) = −3 ,
∗
ist und dies widerspricht unserer√ Annahme, m = m wäre dabei ist π = 3,14159265 . . . .
die kleinste natürliche Zahl, die √2 · m ∈ N erfüllt. Damit ist
√ sich die Annahme, 2 ist rational, nicht halten
gezeigt, dass
Mit diesen beiden Rundungsfunktionen ist eine weitere Cha-
lässt und 2 irrational sein muss.
rakterisierung der ganzen Zahlen möglich:
√
eine irrationale Zahl mit r1 < xk < r2 , weil sonst 2 rational Ziffern 0 und 1 zur Verfügung, denn 0 ≤ zj < g. Es gilt:
wäre.
42 = 32 + 8 + 2
Zwischen je zwei rationalen Zahlen liegen also unend- = 1 · 25 + 0 · 24 + 1 · 23 + 0 · 22 + 1 · 21 + 0 · 20
lich viele irrationale Zahlen, insbesondere liegen wegen
= (101010)2 .
[r1 , r2 ] ⊆ (a, b) unendlich viele irrationale Zahlen im In-
tervall (a, b).
Die notierte Zerlegung lässt sich übrigens elegant mit-
hilfe des sogenannten euklidischen Algorithmus (siehe Ab-
Wir sind also in der Lage, jede reelle Zahl x eindeutig in der schnitt 25.2) bestimmen. Man nennt dies auch „fortgesetzte
Form Division mit Rest“:
42 = 21 · 2 + 0
x = [x] + ρ , [x] ∈ Z und ρ ∈ R , 0 ≤ ρ < 1
21 = 10 · 2 + 1
darzustellen. Hieraus ergibt sich ein einfacher Beweis eines 10 = 5·2 + 0
wichtigen Satzes der elementaren Zahlentheorie: 5 = 2·2 + 1
2 = 1·2 + 0
Division mit Rest 1 = 0·2 + 1
Zu einer ganzen Zahl n und einer positiven ganzen Zahl
g gibt es eindeutig bestimmte ganze Zahlen q, r mit
Liest man die Reste von unten nach oben, so ergibt sich ge-
n = q · g + r, 0 ≤ r < g. rade die Darstellung (101010)2 .
was der gewohnten Kurznotation 42 entspricht. Zur Basis 2 = (1 − q)(1 + · · · + q n ) + (1 − q)q n+1
sieht die Zahl 42 etwas anders aus. Hier haben wir nur die = 1 − q n+1 + q n+1 − q n+2 = 1 − q n+2 .
130 4 Zahlbereiche – Basis der gesamten Mathematik
!
n !
n !
n ' (2 '!
n (2
n(n + 1) n(n + 1)
k= , (2k − 1) = n2 , k3 = = k .
2 2
k=1 k=1 k=1 k=1
Problemanalyse und Strategie: In allen drei Beispielen ist zunächst mit n = 1 der Induktionsanfang zu prüfen.
Die Induktionsschritte ergeben sich relativ direkt durch Anwenden der Induktionsannahme nach Abspalten des letzten
Summanden, wenn die jeweilige Summe bis n + 1 betrachtet wird.
Für die geometrische Summenformel bietet sich auch ein Auch die binomische Formel folgt mittels
direkter Beweis ohne Induktion an, denn es gilt: Induktion
(1 − q)(1 + q + · · · + q n ) Der Name Binomialkoeffizient ergibt sich aus der allgemei-
= 1 + q + q 2 + · · · + q n − q − q 2 − · · · − q n − q n+1 nen binomischen Formel, wenn α = n ∈ N eine natürliche
Zahl ist.
= 1 − q n+1 .
Hier heben sich alle Summanden bis auf den ersten und den Binomischer Lehrsatz und binomische Formel
letzten, −q n+1 , weg. Man kann sich dies wie das Zusam- Für a, b ∈ R und n ∈ N gilt:
menschieben eines Teleskops veranschaulichen, daher nennt
n ' (
!
man eine solche Summe auch Teleskopsumme. n
(a + b)n = a n−k bk .
k
k=0
Als letzte Summenformel beweisen wir den wichtigen bino-
mischen Lehrsatz. Dazu sind jedoch einige Vorbereitungen n n
erforderlich. Es sei daran erinnert, dass a 0 = b0 = 0 = n = 1 ist für
a, b ∈ R und n ∈ N.
Definition des Binomialkoeffizienten
Beweis: Wir beweisen diesen Satz wieder induktiv nach
' (α, k ∈ N0 definiert man den Binomialkoeffizienten
Für n. Die Aussage (a + b)1 = a + b für n = 1 ist wahr. Es ist
α
über weiter n ≥ 1, und es gilt A(n), also die Aussage:
k
' ( ' ( ' (
⎧ n n n 0 n n−1 1 n 0 n
' ( ⎨1 für k = 0, (a + b) = a b + a b + ··· + a b .
α 0 1 n
= α(α − 1) . . . (α − k + 1)
k ⎩ für k ≥ 1.
1 · 2 · ... · k Multipliziert man diese Gleichung mit (a +b) und verwendet
das Distributivgesetz, dann folgt:
Diese Definition kann auch auf reelle oder gar komplexe Zah-
(a + b)n+1 = (a + b)(a + b)n = a(a + b)n + b(a + b)n .
len erweitert werden. Es gilt dabei eine für uns nützliche re-
kursive Identität. Wir setzen die Aussage A(n) in beide Summanden ein und
erhalten:
Satz (Additionsformel für Binomialkoeffizienten)
Für alle α, k ∈ N0 gilt: (a + b)n+1
' ( ' ( ' (
' ( ' ( ' ( n n+1 n n n
α+1 α α = a + a b + ··· + abn
= + . 0 1 n
k+1 k k+1 ' ( ' ( ' (
n n n n n n+1
+ a b + ··· + ab + b .
0 n−1 n
α α α+1
Beweis: Für k = 0 gilt 0 + 1 = 1+α = α+1 = 0+1 .
Wir wenden nun die Additionsformel an und fassen Sum-
manden
n+1 gleicher
n+1 Potenzen zusammen. Zudem ersetzen wir
Für k ≥ 1 ist =
0 n+1 durch 1. Der obige Ausdruck wird dann zu:
' (
α α(α − 1) . . . (α − 1 − k + 1)(α − k) ' ( ' (
= n+1 n n+1
k+1 1 · 2 · · · · · k · (k + 1) a n+1 + a b + ··· + abn + bn+1 ,
' ( 1 n
α α−k
= · . =(n0)+(n1) n
=(n−1 )+(nn)
k k+1
1 Mit der eben gewonnenen Schreibweise lässt sich nk schrei-
ben als:
' (
n n(n − 1) · · · (n − k + 1)
1 1 =
k 1 · 2···k
n(n − 1) · · · (n − k + 1) (n − k) · · · 1
=
1 2 1 1 · 2···k (n − k) · · · 1
n! n!
= =
k!(n − k)! (n − k)!k!
1 3 3 1 ' (
n! n
= = .
(n − k)!(n − (n − k))! n−k
1 4 6 4 1
Es gibt eine wichtige kombinatorische Interpretation von nk .
+ Der Ausdruck lässt sich interpretieren als die Anzahl der ver-
1 5 10 10 5 1 schiedenen Teilmengen mit k Elementen in einer Menge mit
n Elementen.
?
? Zeigen Sie folgende weitere Folgerung aus der binomischen
Beweisen Sie für n ∈ N0 die rekursive Definition Formel:
! n ' (
n
= 2n
(n + 1)! = (n + 1)n! k
k=0
1
Wir betrachten ein weiteres Beispiel zur Anwendung der (b) Setzt man g1 = g, dann ist g1 > 1, und nach Aussage
vollständigen Induktion, die folgende nach Jacob Bernoulli (a) gibt es zu C = 1
ein n ∈ N mit g1n > 1
ε ε. Hieraus
(1655–1705) benannte, aber schon vorher bekannte Unglei- folgt aber sofort:
chung. g n < ε.
Bernoulli-Ungleichung
Beispiel Als letztes Beispiel stellen wir uns die Frage, für
Ist h ∈ R und h ≥ −1, dann gilt für alle n ∈ N: welche n ∈ N die Ungleichung 2n > n2 gilt.
(1 + h)n ≥ 1 + nh. Wir nähern uns einer Lösung über eine erste Überprüfung von
A(n) für kleine natürlichen Zahlen. Siehe dazu diese Tabelle:
Für h > −1, h = 0 und n ≥ 2 gilt sogar die strikte
Ungleichung n 1 2 3 4 5 6 7 8
n2 1 4 9 16 25 36 49 64
(1 + h)n > 1 + nh.
2n 2 4 8 16 32 64 128 256
Beweis: Auch diese Aussagen lassen sich mit Induktion Offensichtlich stimmt die Ungleichung für einige n ∈ N,
nach n beweisen. Die erste Aussage der Bernoulli’schen Un- speziell für n = 5. Wir stellen die Vermutung auf, dass die
gleichung ist für n = 1 offensichtlich wegen (1 + h)1 = Ungleichung für alle n ≥ 5 gilt, denn 25 = 32 > 25 = 52 .
1 + 1 · h korrekt. Mit anderen Worten müssen wir zeigen, dass für alle n ≥ 5
gilt:
Für den Induktionsschritt gelte für beliebiges n ∈ N die Un- A(n) ⇒ A(n + 1)
gleichung
Durch Multiplikation der Ungleichung 2n > n2 mit 2 folgt:
(1 + h)n ≥ 1 + nh.
Dann folgt durch Multiplikation mit der nicht negativen Zahl 2n+1 = 2 · 2n > 2n2 = n2 + n · n.
1 + h:
Wegen n ≥ 5 ist n · n ≥ 5n > 2n + 1 oder zusammengefasst:
(1 + h)n+1 ≥ (1 + nh)(1 + h) = 1 + (n + 1)h + nh2 .
2n+1 > n2 + 2n + 1 = (n + 1)2 .
Da n und h2 nicht negativ sind, gilt:
Damit ist die Implikation A(n) → A(n + 1) bewiesen.
2
1 + (n + 1)h + nh ≥ 1 + (n + 1)h. Statt mit der Ungleichungskette n2 ≥ 5n > 2n + 1 zu ar-
gumentieren, kann man mit einer erneuten Induktion direkt
Und damit ist die erste Ungleichung für alle natürlichen Zah-
n2 > 2n + 1 nachweisen. Da eine solche „Induktion in der
len bewiesen.
Induktion“ häufig vorkommt, zeigen wir diesen alternativen
Weg.
? Wir prüfen A(n) : n2 > 2n + 1 für n = 1 (stimmt nicht
Überlegen Sie sich, wann in der ersten Ungleichung das wegen 1 < 3), für n = 2 (stimmt nicht wegen 4 < 5) und für
Gleichheitszeichen gilt, und führen Sie den Beweis der strik- n = 3 (stimmt wegen 9 > 7). Damit können wir versuchen,
ten Bernoulli-Ungleichung aus. A(n) für n ≥ 3 nachzuweisen. Wir setzen A(n) als wahr
voraus und betrachten A(n + 1) : (n + 1)2 > 2(n + 1) + 1.
Die linke Seite der Ungleichung schätzen wir mit A(n) wie
Folgerung folgt ab:
Sei 0 < g ∈ R.
(n + 1)2 = n2 + 2n + 1 > (2n + 1) + 2n + 1 = 2n + 2 + 2n.
(a) Ist g > 1, dann gibt es zu jedem C ∈ R ein n ∈ N mit
g n > C. Die rechte Seite der Ungleichung von A(n + 1) lässt sich als
(b) Ist 0 < g < 1, dann gibt es zu jedem 0 < ε ∈ R ein 2n + 2 + 1 notieren. A(n + 1) ist somit richtig, wenn 2n > 1
n ∈ N mit g n < ε. gilt, und da n ≥ 3 gilt, ist die Ungleichung n2 > 2n + 1 für
n ≥ 3 bewiesen. Im eigentlichen Beweis gilt n ≥ 5 > 3, und
wir können diese Ungleichung für den eigentlichen Beweis
Beweis: nutzen.
(a) Sei h = g − 1, dann ist nach Voraussetzung h > 0 und
die Bernoulli’sche Ungleichung liefert g n = (1 + h)n ≥ Abschließend sei noch einmal festgehalten, dass die Induk-
1 + nh. tionsverankerung ein wesentlicher Bestandteil des Beweis-
Nach der archimedischen Eigenschaft von N gibt es ein prinzips der vollständigen Induktion ist. Die Implikation
n ∈ N mit nh > C − 1. Für dieses n ist dann g n > C. A(n) ⇒ A(n + 1) kann für alle n ∈ N richtig sein, aber
134 4 Zahlbereiche – Basis der gesamten Mathematik
die Aussage A(n) gilt für kein einziges n ∈ N, wenn es keine Hier tauchen „Quadratwurzeln aus negativen Zahlen“ auf.
Induktionsverankerung gibt! Solche „Zahlen“ können aber wie bereits gesagt keine reellen
Zahlen sein. Die Frage ist, ob sie sinnvolle Größen darstellen.
Beispiel Hierzu betrachten wir für n ∈ N die Aussage
Beispiel Ein Beispiel einer solchen Lösungsformel ist
!
n
n(n + 1)
A(n) : k= + 2012. die pq-Formel, die normierte quadratische Gleichungen
der
2 p p 2
k=1 Form x + px + q = 0 zu x1,2 = − 2 ±
2
2 −q
Aus einem früheren Beispiel wissen wir bereits, dass die Aus- löst. Auch unnormierte quadratische Gleichungen der Gestalt
sage falsch ist, obwohl die Implikation ax 2 + bx + c = 0 mit reellen Zahlen a, b, c ∈ R (a = 0)
lassen sich nach Teilen durch a mit der Substitution p = ab
A(n) → A(n + 1) bzw. q = ac in die normierte Gestalt überführen. Diese Lö-
sungsformel gewinnt man direkt mithilfe der sogenannten
für alle n ∈ N richtig ist. Dass die Implikation korrekt ist,
quadratischen Ergänzung, einem Verfahren, das schon den
sieht man wie folgt:
Babyloniern vor über 5000 Jahren bekannt war. Wir wollen
n(n+1)
Gilt nämlich 1 + 2 + · · · + n = 2 + 2012, dann folgt: es für die Gleichung x 2 − 2x + 3 = 0 direkt vorführen:
n(n + 1) x 2 − 2x + 3 = 0 ⇐⇒ x 2 − 2x + 3 + 0 = 0 + 0.
1 + 2 + · · · + n + (n + 1) = + 2012 + (n + 1)
2
n(n + 1) (n + 1)(n + 2) Man addiert auf beiden Seiten der Gleichung eine Null, die
= + n + 1 + 2012 = + 2012, man auf der linken Seite jedoch kompliziert notiert:
2 2
was gerade der Aussage A(n + 1) entspricht. Der Indukti- x 2 − 2x + 3 + (1 − 1) = 0 + 0
onsbeweis versagt hier, weil die Induktionsverankerung A(1)
nicht gilt. ⇐⇒ x 2 − 2x + 1 + (3 − 1) = 0.
ergibt, und auch hier treten wieder Wurzeln aus negativen Wenn es überhaupt einen Körper gibt, der die reellen Zahlen
Zahlen auf. Tatsächlich ist x1 + x2 = 10 und x1 · x2 = 40, R als Teilkörper enthält und in welchem es ein Element i mit
wenn man wie mit reellen Zahlen rechnet. i2 = −1 gibt, dann gibt es bezüglich der Teilmengenrela-
tion ⊆ auch einen kleinsten solcher Körper, und diese Er-
Auch bei der Lösung kubischer Gleichungen stießen Car-
weiterung von R ist bis auf Isomorphie eindeutig bestimmt.
dano und seine Zeitgenossen auf Quadratwurzeln aus nega-
Die Operationen der Addition und der Multiplikation und die
tiven Zahlen. Man vergleiche hierzu den historischen Exkurs
Existenz von Inversen von Elementen z = 0 sind durch die
über die Entstehungsgeschichte der komplexen Zahlen auf
folgenden, oben motivierten Formeln
Seite 144.
Um die Konstruktion des Körpers der komplexen Zahlen zu z + w = (a + c) + (b + d)i
motivieren, machen wir die folgende Annahme: Es gibt einen zw = (ac − bd) + (ad + bc)i
Körper K, der den Körper R als Teilkörper enthält und der 1 a −b
ein Element i enthält, für das i2 = −1 gilt. Wie hat man in = 2 + 2 i =& a +&
bi für z = 0
z a +b 2 a + b2
einem solchen Körper zu rechnen?
mit den Operationen auf R verknüpft. Offen geblieben in un-
Als erstes halten wir fest, dass i ∈
/ R gilt. Aufgrund der
serer heuristischen Betrachtung ist die entscheidende Frage.
Körperaxiome enthält K alle „Zahlen“ der Gestalt z = a +bi
mit a, b ∈ R, und die Darstellung von z ∈ K in dieser Form
ist eindeutig. Was ist i?
? Aber die Darstellung z = a + bi mit a, b ∈ R legt nahe,
Weisen Sie diese zwei Aussagen anhand der Körperaxiome
dass als wesentliches Bestimmungsstück der zu definieren-
nach.
den komplexen Zahlen die reellen Zahlen a und b anzusehen
sind, also das Paar (a, b) ∈ R × R. Das folgende Modell
Betrachtet man jetzt die Menge für die komplexen Zahlen geht auf Sir William Hamilton
(1805–1865) zurück, der diese 1831 so eingeführt hat. Al-
C = {a + bi ∈ K | a, b ∈ R}, ternative Einführungen sind möglich und finden sich in der
Box auf Seite 144f. Wir führen die komplexe Zahlen über
so stellt man fest, dass bereits C ein Körper bezüglich der das Standardmodell C = R2 ein.
auf K erklärten Addition und Multiplikation ist. Wir ge-
ben einen unvollständigen Beweis, da wir nicht alle Körpe- Komplexe Zahlen als Paare reeller Zahlen
raxiome nachprüfen. Eine komplexe Zahl ist ein Element aus der Menge
C = {(a, b) | a ∈ R, b ∈ R} = R × R,
Beweis: Wir zeigen: Für z, w ∈ C gilt auch z ± w ∈ C
sowie zw ∈ C, und für z = 0 ist auch z−1 ∈ C enthalten.
also ein geordnetes Zahlenpaar.
Dafür seien z = a + bi und w = c + di mit a, b, c, d ∈ R.
Wir beginnen mit der ersten Aussage:
Definiert man auf C für (a, b) ∈ C und (c, d) ∈ C durch:
z ± w = (a + bi) ± (c + di) = (a + c) ± (b + d)i.
(a, b) + (c, d) = (a + c, b + d)
Und da auch a + c bzw. b + d reelle Zahlen sind, folgt die
Behauptung. Analoges gilt für die zweite Aussage: eine Addition und durch
zw = (a + bi)(c + di) = ac + bic + adi + bdi2 . (a, b) · (c, d) = (ac − bd, ad + bc)
Da i2 = −1 gilt, folgt sofort zw = (ac − bd) + (ad + eine Multiplikation, dann lässt sich folgender Satz formu-
bc)i, und somit liegt auch das Produkt zweier Elemente der lieren:
Menge C wieder in C. Zuletzt betrachten wir das Inverse Eigenschaften von C
eines Elements z aus C mit z = 0. Aus z = a + bi = 0 folgt:
(a) (C, +, ·) ist ein Körper, den wir den Körper der
1 a − bi a − bi komplexen Zahlen nennen.
= = 2 , (b) Die Teilmenge
a + bi (a + bi)(a − bi) a + b2
also: CR = {(a, 0) | a ∈ R} ⊆ C
1 a −b
= 2 + 2 a +&
i =& bi
z a + b2 a + b2 ist ein zu R isomorpher Teilkörper von C. Wir iden-
tifizieren daher (a, 0) mit a.
a, &
mit reellen Zahlen & b. Damit gilt 1/z ∈ C.
136 4 Zahlbereiche – Basis der gesamten Mathematik
Analoges ergibt sich für das Produkt (z2 z3 ); für die Wei-
(c) Für das Element i = (0, 1) ∈ C gilt:
terführung der Rechnung siehe Aufgabe 4.34.
i2 = (0, 1)2 = (−1, 0). Das noch fehlende Distributivgesetz folgt direkt aus dem
Distributivgesetz für R.
Wir nennen i die imaginäre Einheit. (b) Dem Beweis für die zweite Aussage widmen wir den fol-
(d) Jedes z = (a, b) ∈ C ist darstellbar durch genden Abschnitt, dem wir hier nicht vorgreifen wollen.
(c) Wir rechnen direkt nach: (0, 1)2 = (0, 1)(0, 1) = (0 ·
z = (a, b) = (a, 0) + (b, 0)(0, 1) = a + bi. 0 − 1 · 1, 0 · 1 + 1 · 0) = (−1, 0).
(d) Man sieht sofort, dass (a, 0) + (0, b) = (a, b) gilt. Au-
Identifiziert man CR mit R, also speziell (−1, 0) mit −1, so ßerdem gilt offensichtlich a(1, 0) = (a, 0) für reelles
besitzt jede komplexe Zahl z die eindeutige Standarddar- a bzw. b(0, 1) = (0, b) für reelles b. Dann ist aber
stellung z = (a, b) = (a, 0) + (0, b) = a(1, 0) + b(0, 1) und
z = a + bi, a, b ∈ R. somit stimmt Aussage (d).
In C gelten alle in R abgeleiteten Rechen- w = 0 ist. Bei komponentenweiser Multiplikation wäre aber
regeln, bei denen nur die Körper- z. B. (1, 0) ∗ (0, 1) = (1 · 0, 0 · 1) = (0, 0).
eigenschaften benutzt wurden
?
Beispiel Es gilt für alle n ∈ N0 und alle a, b ∈ C die Wieso gibt es außer z = ±i keine weiteren Lösungen der
allgemeine binomische Formel: Gleichung z2 + 1 = 0?
' ( ' (
n n−1 n
(a + b)n = a n + a b + ··· + abn−1 + bn .
1 n−1
Wir haben diese Formel bereits anhand der Körperaxiome in Im Gegensatz zu R lässt C sich nicht anordnen
den reellen Zahlen gezeigt.
Obwohl C mit R die Körpereigenschaften gemeinsam hat,
Die Formel für die Multiplikation komplexer Zahlen muss gibt es einen Hauptunterschied:
man sich nicht merken, wie man am folgenden Beispiel sehen
kann. Achtung: C lässt sich nicht anordnen!
Beispiel Ist etwa z = 2−6i und w = 1+i, so rechnet man In C gibt es keine Teilmenge P , sodass für P die Axiome
zw mithilfe des Distributivgesetzes und unter Verwendung (AO1 ), (AO2 ) und (AO3 ) gelten (Seite 106). Denn in einem
von i2 = −1 aus und erhält: angeordneten Körper gilt für ein Element z = 0 stets z2 ∈ P .
Insbesondere ist 1 = 12 ∈ P , also −1 ∈ / P . In C gilt aber
zw = (2 − 6i)(1 + i) = 2 · 1 + 2 · i − 6i · 1 − 6i · i
i2 = −1. Wenn sich C anordnen ließe, müsste einerseits
= 2 + 2i − 6i − 6i2 = 2 + 2i − 6i − 6(−1) = 8 − 4i. wegen i = 0 auch i2 ∈ P gelten, andererseits ist i2 = −1 ∈ P .
Wir können uns an dieser Stelle zunächst nur mit wenigen
elementaren geometrischen und algebraischen Eigenschaf-
Die Standarddarstellung für einen Quotienten wie z. B. 2+5i ten von C beschäftigen. Außer der angeführten Motivation,
3−4i den Körper der reellen Zahlen nochmals zu erweitern, gibt es
lässt sich durch Erweiterung mit 3 + 4i, d. h. allgemein mit
dem Komplex-Konjugierten des Nenners, berechnen: zahlreiche weitere innermathematische Gründe. Auch für die
moderne Quantenmechanik sind die komplexen Zahlen un-
2 + 5i (2 + 5i)(3 + 4i) 6 + 15i + 8i − 20 verzichtbar geworden, wenn man an das Vertauschungsaxiom
= =
3 − 4i (3 − 4i)(3 + 4i) 9 + 16 für Orts- und Impuls-Operator, die Schrödinger-Gleichung
−14 + 23i 14 23 oder den Hamilton-Operator denkt. Die komplexe Analysis,
= = − + i. die systematisch auf C aufbaut, heißt im deutschen Sprach-
25 25 25
4 raum Funktionentheorie.
Gilt es, die Standarddarstellung von z = 8−i
5+i zu bestim-
men, so berechnet man zunächst
Die komplexen Zahlen lassen sich in der
8−i (8 − i)(5 − i) 39 13 3 1 1 Gauß’schen Zahlenebene visualisieren
= = − i = − i = (3 − i)
5+i (5 + i)(5 − i) 26 26 2 2 2
und verwendet dann die binomische Formel: Die komplexen Zahlen sind als Menge die Menge R × R.
Genauso, wie man reelle Zahlen als Punkte einer Zahlen-
1 1 4
z = (3 − i)4 = 3 − 4 · 33 i + 6 · 32 i2 − 4 · 3i3 + i4 geraden visualisieren kann, kann man komplexe Zahlen als
16 16 Punkte oder Vektoren der Ebene R2 = R × R auffassen.
1 28 − 96i 7 Diese Auffassung wurde von J. Argand (1768–1822) bereits
= (81 − 108i − 54 + 12i + 1) = = − 6i.
16 16 4 vor C.F. Gauß propagiert. Man spricht von der Gauß’schen
Zahlenebene, d. h., man fasst C = R2 = R × R als R-
Die Definition der Multiplikation komplexer Zahlen mag ge- Vektorraum mit der Basis 1 = (1, 0) und i = (0, 1) auf.
künstelt erscheinen, ist aber durch unsere Vorüberlegungen Dass man im Prinzip dieselbe Struktur erhält, wenn man in
motiviert. allen Rechnungen mit komplexen Zahlen i durch −i ersetzt,
wird sich im Folgenden ergeben.
Kommentar: Die komponentenweise Multiplikation
R∼
= R × {0} nennt man die reelle Achse und iR = {0} × R
(a, b) ∗ (c, d) = (ac, bd) die imaginäre Achse. Die Summe z+w von zwei komplexen
Zahlen z und w ist, wie in Abbildung 4.11 zu sehen ist, der
als multiplikative Verknüpfung zu versuchen, scheitert des- vierte Eckpunkt eines Parallelogramms. z+w kann man auch
halb, weil in jedem Körper K die Nullteilerregel gilt, d. h. als den Punkt beschreiben, der durch Translation um w aus
für z, w ∈ K gilt zw = 0 genau dann, wenn z = 0 oder z oder durch Translation um z aus w entsteht.
138 4 Zahlbereiche – Basis der gesamten Mathematik
?
−z = −x + iy z = x + iy Zeigen Sie, dass zz ∈ R≥0 gilt.
y
%
Wegen |z| = x 2 + y 2 und nach dem Satz des Pythagoras
ist |z| der Abstand von z zum Nullpunkt (0, 0) (Abb. 4.12).
−x 0 x Re Man sieht sogleich, dass für reelles z, also für y = 0, die neue
Definition mit der Betragsdefinition auf R übereinstimmt.
−y Im
−z = −x − iy z = x − iy z = x + yi = (x, y)
|z| y
Abbildung 4.10 Die komplexen Zahlen z = x+iy, z = x−iy, −z = −x−iy
und −z = −x + iy sind hier in der Gauß’schen Zahlenebene dargestellt. Man
erkennt die hohe Symmetrie der Zahlen, die paarweise durch Spiegelungen
erzeugt werden können.
0 x Re
%
Im Abbildung 4.12 Die Abbildung visualisiert den Betrag |z| = x 2 + y 2 einer
z+w komplexen Zahl z = x + iy.
z
Eigenschaften des Betrags komplexer Zahlen
Für alle z, w ∈ C gilt:
|z| ≥ 0; |z| = 0 ⇔ z = 0. ) ) |z|
0 |zw| = |z| · |w|. Ist w = 0, dann ist ) wz ) = |w| .
Re
|Re z| ≤ |z| und |Im z| ≤ |z|.
Abbildung 4.11 Die Summe z + w von zwei komplexen Zahlen z und w ist der Es gelten diese beiden Dreiecksungleichungen:
vierte Eckpunkt des durch 0, z und w bestimmten Parallelogramms (falls diese
(a) |z + w| ≤ |z| + |w| (für Abschätzungen nach
Punkte nicht alle drei auf einer Geraden liegen und somit kollinear sind).
oben).
(b) |z − w| ≥ ||z| − |w|| (für Abschätzungen nach
Eine geometrische Deutung für das Produkt zw zweier kom- unten).
plexer Zahlen geben wir weiter unten. Die Gleichberechti-
gung von i und −i begründet die Wichtigkeit der Abbildung Beweis: Den Beweis der ersten und dritten Eigenschaft
überlassen wir dem Leser und beweisen hier zuerst den zwei-
−
: C → C, z = x + yi → x − yi. ten Punkt (zu zw = z w siehe Abschnitt 3.3):
z1 + z2 = (a + ib) + (c + id) %
|z| = a 2 + b2
= (a + c) + i(b + d)
|z| = |z|
z1 − z2 = (a + ib) − (c + id)
|z|2 = z z
= (a − c) + i(b − d)
|z1 z2 | = |z1 | |z2 |
Konjugiert komplexe Zahlen |z1 ± z2 |2 = |z1 |2 + |z2 |2 ± 2 Re(z1 z2 )
z = a − ib |z1 + z2 | ≤ |z1 | + |z2 | (Dreiecksungleichung)
z = z (d. h. involutorisch) |z1 − z2 | ≥ |z1 | − |z2 |
z1 + z2 = z1 + z2
z1 z2 = z1 z2
1 Polarkoordinatendarstellung
Re(z) = (z + z)
2
1 z = r(cos ϕ + i sin ϕ)
Im(z) = (z − z)
2i
mit
z = z gilt genau dann, wenn z = a ∈ R ⊆ C
z = −z gilt genau dann, wenn z = ib ∈ iR ⊆ C r = |z| ≥ 0 , ϕ = arg(z) ∈ (−π, π]
Multiplikation und
z1 z2 = (a + ib) (c + id) Re(z) = r cos ϕ , Im(z) = r sin ϕ
= (ac − bd) + i(ad + bc) Für zj = rj (cos ϕj + i sin ϕj ), j = 1, 2 ist
Division
z1 z2 = r1 r2 cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 )
a + ib z1 z1 z2 z1 z2
c + id
= = = z1 r1
z2 z2 z2 |z2 |2 = cos(ϕ1 − ϕ2 ) + i sin(ϕ1 − ϕ2 )
z2 r2
Insbesondere gilt für z = x + iy ∈ C \ {0}
z1 = r1n cos(nϕ1 ) + i sin(nϕ1 )
n
z x − yi x −y
z−1 = = 2 = 2 + 2 i (Moivre’sche Formel)
|z| 2 x +y 2 x +y 2 x + y2
Die Dreiecksungleichung für Abschätzungen nach unten be- Re (wz) = Re (wz) = Re (wz) = Re (zw)
weist man wie im reellen Fall.
verwendet.
ist die Cauchy-Schwarz’sche Ungleichung für C = R2 . Der Abstand d in C hat die folgenden vier Eigenschaften
Schreibt man nämlich z = x + yi und w = u + vi für (z1 , z2 , z3 ∈ C beliebig):
u, v, x, y ∈ R, dann ist
d(z1 , z2 ) > 0 ⇔ z1 = z2 ,
Re (zw) = Re (zw) = xu + yv, d(z1 , z2 ) = 0 ⇔ z1 = z2 ,
d(z1 , z2 ) = d(z2 , z1 ) (Symmetrie),
und das ist das Standard-Skalarprodukt der Vektoren z = d(z1 , z3 ) ≤ d(z1 , z2 ) + d(z2 , z3 ) (Dreiecksungleichung).
(x, y) und w = (u, v) im R2 (siehe Kap. 7).
?
? Beweisen Sie die ersten drei Eigenschaften für den Ab-
Es gilt folgende Identität: stand d.
' (−1
1+i 1−i
√ = √ . C ist mit der zu d zugehörigen Abstandsfunktion ein soge-
2 2
nannter metrischer Raum. Dieser ist über die eben benann-
Begründen Sie dies anhand der Eigenschaften der komplexen ten vier Eigenschaften definiert. Metrische Räume werden in
Konjugation aus der Übersicht auf Seite 139, und rechnen Sie Kapitel 19 eingehender untersucht.
noch einmal auf herkömmlichem Wege nach.
Insbesondere gilt d(z, 0) = |z|, was sich mit der geometri- die Einheitskreislinie gegeben. Die Einheitskreislinie hat die
schen Interpretation deckt. bemerkenswerte Eigenschaft, dass sie bezüglich der Mul-
tiplikation eine Gruppe ist: Sind z, w ∈ S 1 , so gilt auch
Folgerung (Dreiecksungleichung) zw ∈ S 1 und wz ∈ S 1 . Ferner ist z−1 = z ebenfalls Element
Es gilt für beliebige z1 , z2 , z3 ∈ C die Ungleichung in S 1 .
d(z1 , z3 ) ≤ d(z1 , z2 ) + d(z2 , z3 ) Die Einheitskreislinie ist ein Spezialfall des allgemeineren
Begriffs einer zweidimensionalen Sphäre,
und der Name Dreiecksungleichung wird jetzt geometrisch
verständlich (Abb. 4.13). Sε (z0 ) = {z ∈ C | |z − z0 | = ε}
Abbildung 4.13 Die Abbildung verdeutlicht die Dreiecksungleichung für drei Uε (z0 ) = {z ∈ C | |z − z0 | < ε}
Punkte der Ebene, die wir mit komplexen Zahlen beschreiben: Der direkte Weg
von z1 zu z3 ist immer kürzer oder höchstens gleich lang wie der Weg über einen
weiteren Punkt z2 .
die offene Kreisscheibe mit Mittelpunkt z0 und Radius
ε oder auch ε-Umgebung von z0 und
Uε (z0 ) = {z ∈ C | |z − z0 | ≤ ε}
Beweis: Wir wählen die spezielle Dreiecksungleichung
für das Dreieck mit den Ecken 0, z und w. Wegen z1 − z3 = die abgeschlossene Kreisscheibe mit Mittelpunkt z0
(z1 − z2 ) + (z2 − z3 ) folgt: und Radius ε.
|z1 − z3 | ≤ |z1 − z2 | + |z2 − z3 |,
Begründungen für die Bezeichnungen offen bzw. abgeschlos-
und dies ist gerade die Folgerung. sen ergeben sich später in Kapitel 9 und 19.
4.6 Komplexe Zahlen 141
Im
S1 U1 (0) U1 (0) z
0 0 0
z
Abbildung 4.14 Zu sehen sind die im Text definierte Einheitskreislinie S1, die
offene Einheitskreisscheibe U1 (0) und die abgeschlossene Einheitskreisscheibe 0 1
U1 (0) als Spezialfälle von Sphäre und Kreisscheibe. Re
1
z
Definition von Spiegelpunkten wobei z, z , c ∈ C sind. In der Sprache der linearen Algebra
bedeutet dies, dass μl eine C-lineare Abbildung von C =
Sind z , z ∈ C\{0}, so heißen z und z Spiegelpunkte
R2 → C = R2 ist.
bezüglich der Einheitskreislinie S 1 , wenn gilt:
(a) z = az mit einem a ∈ R, a > 0 und Wir zerlegen diese Abbildung in zwei Teile: In die Streckung
(b) |z | |z| = 1.
μ|| : C → C, w → || · w
Aussage (a) bedeutet, dass z und z auf demselben von 0 mit dem Zentrum 0 und dem Streckungsfaktor ||. Es ist
ausgehenden Halbstrahl liegen. Setzt man die Gleichung z =
μ = μ|| ◦ μd .
az in (b) ein, so folgt:
Dabei liegt d = || auf der Einheitskreislinie, denn es ist
|z | |z| = |az| |z| = |a| |z|2 = azz = 1. |d| = 1. Die Abbildung μd ist definiert durch:
Also gilt a = 1
zz und damit z = 1
zz z. μd : C → C, z → dz.
Wegen 1z = zz 1
z = z erhält man daher 1/z, indem man
den Punkt z an der reellen Achse spiegelt. Man erhält 1/z In dem kommutativen Diagramm 4.16 sind die drei Funktio-
also durch zwei Spiegelungen: Durch Spiegelung am Ein- nen μ , μ|| und μd dargestellt:
heitskreis, dies liefert z , und dann durch Spiegelung an der Die Abbildung μd ist längentreu bzw. abstandstreu, denn es
reellen Achse. Zum gleichen Resultat kommt man, indem gilt:
man zuerst an der reellen Achse und dann am Einheitskreis
spiegelt. Den Punkt z kann man geometrisch mit verschiede- |μd (z1 ) − μd (z2 )| = |dz1 − dz2 | = |d(z1 − z2 )|
nen Methoden konstruieren, in Abbildung 4.15 ist eine solche = |d| |z1 − z2 | = |z1 − z2 |,
Konstruktion angedeutet.
wegen |d| = 1. Ferner ist die Abbildung μd auch C-linear
und bijektiv. Die Abbildungen z → dz und w → d1 w kehren
Die Multiplikation in C lässt sich geometrisch sich gegenseitig um.
interpretieren ?
Zeigen Sie, dass die beiden Abbildungen
Die geometrische Interpretation der Multiplikation komple-
1
xer Zahlen erfordert etwas mehr Aufwand als die der Ad- z → dz bzw. w → w
dition. Ist = a + bi ∈ C, a, b ∈ R, und = 0, dann d
betrachten wir die Abbildung mit z, w, d ∈ C und |d| = 1 zueinander Umkehrabbildungen
darstellen.
μ : C → C, mit μ (z) = z,
142 4 Zahlbereiche – Basis der gesamten Mathematik
z - lz Im
C - C
z @ |l|w
@
@ @
@ z
@
@ @
@ @
@ R
@ r = |z|
@ C
R
@
l w
|l| z
ϕ
Abbildung 4.16 In diesem kommutativen Diagramm wird die Abbildung
μl : z → lz zuerst durch die Drehung μd : z → |l|l z =: w und dann 0 Re
durch die Streckung μ|| : w → |l|w vermittelt.
Abbildung 4.18 Man kann eine komplexe Zahl z = a + bi = 0 auch durch
Angabe eines Polarwinkels ϕ ∈ (−π; π] und durch Angabe ihres Abstands vom
Die Abbildung μd führt die Basisvektoren 1 und i in d · 1 Ursprung 0 < |z| ∈ R eindeutig bestimmen.
und d · i über:
Re (d · 1) = Re d, Im (d · 1) = Im (d),
Polarkoordinaten in C = R2
Re (d · i) = −Im d, Im (d · i) = Re (d). Jedes z ∈ C kann in der Form
μd ist also eine längentreue, orientierungserhaltende lineare z = r(cos ϕ + i sin ϕ)
Abbildung von C = R2 . Eine solche heißt Drehung um den
mit r, ϕ ∈ R, r ≥ 0, dargestellt werden.
Nullpunkt.
r und ϕ nennt man Polarkoordinaten von z.
Zusammengefasst lässt sich sagen, wenn man etwa w = ∈
C\{0} fest wählt, dass die Abbildung
Dabei ist r = |z| eindeutig bestimmt und ϕ für z = 0 ein-
μ : C → C, mit z → z deutig bis auf Addition ganzzahliger Vielfacher von 2π. Für
z = 0 ist ϕ beliebig. Die Zahl ϕ ist der im Bogenmaß gemes-
eine Drehstreckung ist, die sich aus einer Drehung um den
sene orientierte Winkel zwischen der positiven reellen Achse
Nullpunkt mit dem Drehwinkel ϕ und einer Streckung mit
und dem Ortsvektor von z( = 0). Dabei gilt für jedes ϕ ∈ R
dem Streckungsfaktor |l| zusammensetzt (Abb. 4.17).
die Eigenschaft cos ϕ + i sin ϕ ∈ S 1 . ϕ ist die Länge des
Bogens vom Punkt (1, 0) zum Punkt (a, b) ∈ S 1 und wird
Im Bogenmaß genannt.
wz = |w|z Zum Beweis der Polarkoordinatendarstellung benötigt man
Eigenschaften der Funktionen cos und sin, die wir in Ab-
schnitt 11.4 herleiten werden und hier nur kurz zusammen-
w z stellen.
z = |w|
Additionstheoreme: Für beliebiges ϕ, ψ ∈ R gelten:
sin (ϕ + ψ) = sin ϕ cos ψ + cos ϕ sin ψ,
z cos (ϕ + ψ) = cos ϕ cos ψ − sin ϕ sin ψ.
Die Funktionen sin und cos sind periodisch mit der Peri-
ode 2π, d. h., für beliebiges ϕ ∈ R ist sin(ϕ +2π) = sin ϕ
bzw. cos(ϕ + 2π) = cos ϕ.
α
w Zu jedem Punkt (a, b) ∈ R2 mit a 2 +b2 = 1, d. h. a +bi ∈
S 1 , gibt es ein ϕ ∈ R mit a = cos ϕ und b = sin ϕ.
α
Es gilt für ϕ, ϕ ∈ R die Äquivalenz:
0 Re
(cos ϕ, sin ϕ) = (cos ϕ , sin ϕ ) ⇔ ϕ−ϕ = 2πk, k ∈ Z.
Abbildung 4.17 Die Multiplikation zweier komplexer Zahlen z, w lässt sich
geometrisch als eine Drehstreckung interpretieren.
Wählt man z. B. ϕ im Intervall [0, 2π) oder im Intervall
Verständlicher wird diese geometrische Interpretation, wenn (−π, π], dann ist ϕ wegen der letzten Eigenschaft eindeutig
man die Multiplikation komplexer Zahlen unter Verwendung bestimmt. Mit diesen Vorbemerkungen zeigen wir nun die
von Polarkoordinaten schreibt. Existenz von Polarkoordinaten von komplexen Zahlen.
4.6 Komplexe Zahlen 143
z
Beweis: Ist z ∈ C, z = 0, dann liegt |z| auf der Kreislinie wann komplexe Abbildungen betrachten. Dann gibt es für
S 1 , und so gibt es ein ϕ ∈ R mit z
= cos ϕ + i sin ϕ. Daher ϕ ∈ [0, 2π) Probleme, wie sie beim komplexen Logarith-
|z|
ist mus offenkundig werden. Wählt man nämlich ϕ ∈ [0, 2π),
z = |z|(cos ϕ + i sin ϕ) = |z|E (ϕ) dann ist der komplexe Logarithmus auf der positiven reellen
Achse nicht stetig.
mit der Abkürzung E(ϕ) = cos ϕ +i sin ϕ. Damit hat man die
Existenz einer Polarkoordinatenstellung für komplexe Zah-
len.
Ist außerdem auch z = r (cos ϕ + i sin ϕ ) mit r > 0 und
Komplexe Zahlen werden multipliziert, indem
ϕ ∈ R, dann folgt:
man ihre Beträge multipliziert und ihre
|z| = r (cos ϕ )2 + (sin ϕ )2 = r , Argumente addiert.
Hintergrund und Ausblick: Eine kurze Geschichte der komplexen Zahlen (erster Teil)
Schon in der babylonischen
% Mathematik (2500 bis 100 v. Chr.) wurden Näherungsverfahren zur Berechnung von Quadratwurzeln
√
in der Gestalt a 2 + r ≈ a + 2a r
(a, r ∈ R>0 ) benutzt. Für 27 erhält man mit a = 5, r = 2 eine brauchbare Näherung:
√ √ 2
27 = 25 + 2 ≈ 5 + 10 = 5.2. Vermutlich wurde dieses Verfahren sogar iteriert und stellt somit eine Vorstufe des
Newton-Verfahrens (s. Kapitel 15.3) dar. Wann zuerst Quadratwurzeln aus negativen reellen Zahlen aufgetreten sind, ist
schwer festzustellen. Der indische Mathematiker Mahavira hat um 580 n. Chr. folgende Schwierigkeit erkannt: „Es liegt in der
Natur der Dinge, dass eine negative Größe nicht eine quadratische Größe ist und deshalb keine Quadratwurzel besitzt.“
Erst die italienischen Mathematiker der Renaissance, Auf dem Umweg über eigentlich nicht existierende Qua-
u. a. Scipio del Ferro (1465–1526), Nicolo Tartarglia dratwurzeln aus negativen Zahlen hat auch Bombelli rich-
(1499–1557), Girolamo Cardano (1501–1576) und Rafael tige Resultate in seinen Rechnungen erhalten. Obwohl
Bombelli (1526–1572), sind wieder auf das Problem von Bombelli systematische Regeln für den Umgang mit Wur-
Quadratwurzeln aus negativen Zahlen gestoßen. Mit sol- zeln aus negativen Zahlen aufgestellt hatte – eine ent-
chen Zahlen gerechnet hat wohl√als erster Cardano. Das
√ Er- spricht der Regel ii = i2 = −1 – stellte 1585 der nie-
staunliche war, dass x1 = 5 + −15 und x2 = 5 − −15 derländische Mathematiker Simon Stevin fest: „Die Sa-
die beiden Forderungen x1 +x2 = 10 und x1 x2 = 40 erfül- che ist noch nicht gemeistert.“ Der flämische Mathema-
len konnten. Cardano rechnete dabei nach für reelle Zahlen tiker Albert Girard (1595–1632) formulierte wohl als er-
gängigen Regeln. Auf Quadratwurzeln aus negativen Zah- ster den sogenannten Fundamentalsatz der Algebra: „Jede
len stießen Cardano und seine Zeitgenossen bei den Lö- algebraische Gleichung hat genauso viele Lösungen wie
sungen kubischer Gleichungen der Form x 3 + px + q = 0 ihr Grad angibt.“ Einen Beweis gibt er nicht, er erläu-
mit p, q ∈ R. Cardano gab 1545 die Cardano’schen For- tert den Satz allerdings an Beispielen. Ferner gibt Gi-
meln für die drei Lösungen dieses Gleichungstyps an: rard den Rat: „Man unterlasse es nicht, die Lösungen
. . zu entwickeln, die unmöglich existieren können.“ Für
q √ q √
√ x − 4x + √ 3 = 0 gibt er als Lösungen
das Beispiel 4
x1 = − + D + 3 − − D ,
3
2 2 1, 1, −1 + −2, −1 − −2 an.
. . Das Wort „imaginär“ (eingebildet) wurde zuerst von René
q √ 2 3 q
√
x2 = − + D + − − D ,
3
Descartes (1596–1650) gebraucht: „Die Wurzeln einer
2 2
Gleichung sind nicht immer reell, sondern manchmal ein-
. .
2 3 q
√ q √ gebildet.“ Descartes schrieb weiter: „Man kann sich bei
x3 = − + D + 3 − − D , jeder Gleichung soviele Lösungen vorstellen wie ihr Grad
2 2
√ angibt, aber manchmal gibt es keine Größe, die dem ent-
mit D = ( q2 )2 + ( p3 )3 und = exp( 2πi 1 3
3 ) = − 2 + 2 i,
spricht, was man sich vorstellt!“
wobei = 1 ist. Bei der Angabe dieser Ausdrücke wurde
3
Im Jahr 1702 führte Johann Bernoulli (1667–1748) Lo-
unsere heutige Bezeichnungsweise verwendet. garithmen aus negativen Zahlen in der Integralrechnung
Nach seinen Formeln ergibt sich für die% Gleichung x 3 − ein, und er lieferte sich mit Gottfried Wilhelm Leibniz
3 √ (1646–1716) zwischen 1700 und 1716 eine denkwürdige
15x
% − 4 = 0 eine Lösung zu x1 = 2 + −121 +
3 √ Kontroverse, ob Logarithmen aus negativen reellen Zahlen
2 − −121, was nur einer komplizierten Darstellung
existieren und ob diese reell oder imaginär sind. Der Streit
der reellen Zahl 4 entspricht, die tatsächlich eine Lösung
wurde 1749 von Leonard Euler (1707–1783) zu Gunsten
der obigen Gleichung ist. Um dies einzusehen, braucht
von Leibniz entschieden.
man die von Bombelli verwendete Gleichung
√ √ √ Euler rechnete meisterhaft mit Wurzeln aus negativen Zah-
(2 ± −1)3 = 2 ± 11 −1 = 2 ± −121 . len, auch wenn ihm dabei einige Fehler unterlaufen sind.
Er bewies 1748/49 die de Moivre’schen Formeln für na-
Hiermit lässt sich die dritte Wurzel in x1 einfach angeben: türliches n:
√ √
√ √
3
2 ± −121 = 2 ± −1 (cos ϕ + −1 sin ϕ)n = cos(nϕ) + −1 sin(nϕ).
und deshalb ist schließlich Bei Euler finden sich auch die Formeln
√ √ 1 √−1ϕ √
x1 = (2 + −1) + (2 − −1) = 4. cos ϕ = (e − e− −1ϕ )
2
4.6 Komplexe Zahlen 145
Hintergrund und Ausblick: Eine kurze Geschichte der komplexen Zahlen (zweiter Teil)
und äquivalent hierzu tiert.“ Das ist nichts anderes als die Darstellung komple-
√
−1ϕ
√ xer Zahlen durch Paare reeller Zahlen. Den Fachausdruck
e = cos ϕ + −1 sin ϕ. „komplexe Zahl“ hat Gauß erst 1831 genutzt.
Euler kannte bereits 1728 die Beziehung i log i = − 12 π.
Eine strenge arithmetische Begründung der komplexen
Es bereitete Euler allerdings erhebliche Schwierigkeiten,
Zahlen durch geordnete Paare reeller Zahlen und die
zu erklären, was „imaginäre Zahlen“ sind, was sein De-
Definition der Addition und der Multiplikation solcher
finitionsversuch offenbart: „Eine Größe heißt imaginär,
Zahlenpaare stammt von Sir William Rowan Hamilton
wenn sie weder größer als null ist, noch kleiner null und
(1805–1865) aus dem Jahre 1835.
noch
√ gleich null ist. Das ist etwas
√ Unmögliches wie z. B.
−1 oder allgemeiner a + b −1.“ Euler führte √schließ- Im Jahr 1847 wird von Augustin Louis Cauchy (1789–
lich 1777 die heute geläufige Abkürzung i = −1 ein. 1857) eine algebraische Konstruktion der komplexen Zah-
In der Elektrotechnik wird nach DIN 1302 das Symbol j len als Restklassenring des Polynomrings R[x] nach dem
verwendet. Ideal (X2 + 1) gegeben. Man dividiert ein Polynom P ∈
R[x] mit Rest durch X 2 + 1, sodass die Reste a + bX
Anfänge einer geometrischen Interpretation der komple-
(a, b ∈ R) genau den komplexen Zahlen entsprechen.
xen Zahlen finden sich bei John Wallis (1616–1703). Die
erste Darstellung von Punkten der Ebene durch kom- Dass sich die komplexen Zahlen dann sehr rasch in der ge-
plexe Zahlen stammt aus dem Jahre 1798 von dem Nor- samten Mathematik und deren Anwendungen etabliert ha-
weger Caspar Wessel (1745–1818). Carl Friedrich Gauß ben, ist sicherlich der wissenschaftlichen Autorität von C.
(1777–1855) benutzte diese Darstellung in seinem ersten F. Gauß zu verdanken. Auch in physikalischen Anwendun-
Beweis des Fundamentalsatzes der Algebra im Jahre 1799. gen werden komplexe Zahlen mit Erfolg verwendet wie
Im Jahr 1811 schreibt er in einem Brief an Bessel: „So wie beim harmonischen Oszillator, der Fourier-Analyse oder
man sich das ganze Reich der reellen Größen durch eine in der Quantenmechanik. Komplexe Zahlen und die auf
unendliche gerade Linie denken kann, so kann man das ihr aufbauende Komplexe Analysis (Funktionentheorie)
ganze Reich aller Größen durch eine unendliche Ebene ist zu einem unentbehrlichen Routinewerkzeug für viele
sinnlich machen, worin jeder Punkt, durch Abszisse a und Bereiche der Mathematik, der Naturwissenschaften und
Ordinate b bestimmt, die Größe a+bi gleichsam repräsen- der Technik geworden.
Beweis: Für n ∈ N0 ergibt sich der Beweis durch Induk- Fundamentalsatz der Algebra
tion nach n, und mit der Definition
Jedes nicht konstante komplexe Polynom besitzt in C
1
z−n = n , n ∈ N, mindestens eine Nullstelle, d. h., sind a0 , . . . , an ∈ C,
z an = 0, n ∈ N, beliebig vorgegebene Zahlen, dann
ergibt sich die Formel für beliebige n ∈ Z.
besitzt die Gleichung
an zn + an−1 zn−1 + · · · + a0 = 0
Auch die Inversion erhält nun eine einfache Interpretation:
Ist z = rE(ϕ), r > 0, ϕ ∈ R, dann gilt für den Spiegelpunkt mindestens eine Lösung z ∈ C.
z bezüglich der Einheitskreislinie S 1 :
Obwohl der Satz „Fundamentalsatz der Algebra“ heißt, muss
1
z = ρE(ϕ) mit rρ = 1 und z = = ρE(−ϕ). man bei den Beweisen auf Hilfsmittel der Analysis zurück-
z greifen. Ein relativ einfacher Beweis findet sich in Kapitel 9.
? Ein Spezialfall des Fundamentalsatzes ist der folgende Satz
Zeigen Sie, dass cos(4ϕ), ϕ ∈ R, sich als Polynom in cos(ϕ) über die Existenz von n-ten Wurzeln, der sich mithilfe der
mit ganzzahligen Koeffizienten darstellen lässt. Formel von Euler-de-Moivre elementar beweisen lässt.
Hieraus folgt nach Durchmultiplizieren der Gleichung mit n Im Kosinus-Satz ist im Spezialfall ϑ = π2 , d. h. cos ϑ = 0,
und entsprechendem Kürzen (ν − ν ) = mn. der Satz des Pythagoras enthalten. Aber wie ist eigentlich
Wegen 0 ≤ ν, ν ≤ n − 1 kann (ν − ν ) = mn nur für m = 0 ein Winkel zwischen zwei Vektoren zu definieren und zu
gelten, und damit gilt ν = ν .
messen? Bevor man einen Winkel messen kann, muss man
ihn erst einmal definieren! Dazu werden wir uns eingehend
mit Skalarprodukten beschäftigen (siehe Kapitel 7). Im Falle
des Standardvektorraums Rn werden wir dann auch „Winkel
zwischen Vektoren‘‘ definieren können, α = ψ − φ.
Da sich die komplexen Zahlen mit den Punkten des R2 iden-
tifizieren lassen, kann man zahlreiche Probleme der analy-
tischen Geometrie der Ebene komplex formulieren und so
elegant lösen. Wir behandeln als typische Beispiel die Dar-
Abbildung 4.19 Zu sehen sind die n-ten Einheitswurzeln für die Fälle n = 3, stellungen von Geraden und Kreislinien in komplexer Form,
n = 4 bzw. n = 5. Es entstehen regelmäßige n-Ecke, die immer die Zahl z = 1 sodass deren enge Verwandschaft deutlich wird (siehe Bei-
als Eckpunkt enthalten. spielbox auf Seite 147).
Eine weitere interessante Feststellung ist, dass die Inversion
Wegen ζν = ζ1ν mit ζ1 = E( 2π n ) nennt man ζ1 auch eine Kreislinien und Geraden auf Kreislinien und Geraden abbil-
primitive n-te Einheitswurzel. Ihre Potenzen ergeben sämt-
det.
liche n-te Einheitswurzeln.
4.6 Komplexe Zahlen 147
A|z|2 + Bz + Bz + C = 0
mit A, C ∈ R, B ∈ C und AC < |B|2 darstellen lässt. Auch ist umgekehrt die Lösungsmenge L einer solchen Gleichung
eine Kreislinie oder eine Gerade.
Problemanalyse und Strategie: Da als Menge C = R2 ist, lassen sich Probleme der analytischen Geometrie in der
Ebene mithilfe komplexer Zahlen häufig relativ einfach formulieren. Einsetzen von x = (z + z)/2 und y = (z − z)/(2i)
für z = x + iy ∈ C in die Darstellungen im R2 führt auf entsprechende komplexe Beschreibungen.
A|z|2 + Bz + Bz + C = 0 mit einem beliebigen Wert von A ∈ R lässt sich sofort auf
die Fälle A = 0 oder A = 1 reduzieren.
setzen wir formal A = 0. Die geforderte Ungleichung
AC < |B|2 ist erfüllt, da AC = 0 und B = 0 (wegen a, b Ist nämlich A = 0, so können wir in
nicht beide null) gelten.
Azz + Bz + Bz + C = 0
Nun untersuchen wir die Kreislinien. Diese werden in R2
durch (x − a)2 + (y − b)2 = r 2 (a, b, r ∈ R mit r > 0) durch A teilen, um
dargestellt. Dies können wir umformen:
(x 2 + y 2 ) − 2(ax + by) + (a 2 + b2 − r 2 ) = 0. zz + B z + B z + C = 0
Wegen z = x + iy ∈ C finden wir folgende Ausdrücke: mit A = A/A = 1, B = B/A, C = C/A, zu erhalten.
z+w
?
Im Welcher Kreislinie entspricht nach Inversion die Gerade, die
|z| durch Re z = 12 definiert wird?
w |w|
Es sei erwähnt, dass man, wenn man auf die Kommutativität
der Multiplikation verzichtet, zu den hyperkomplexen Zahlen
|z + w|
sowie zu den Quaternionen gelangt. Näheres hierzu findet
ϑ α sich in Abschnitt 3.3. Also ist mit den komplexen Zahlen der
z Aufbau der Zahlbereiche noch nicht beendet.
Dedekind hatte bereits gezeigt, dass ein Axiomensystem für Häufige Verwendung findet der Rekursionssatz von R. De-
die natürlichen Zahlen kategorisch ist, d. h. verschiedene Mo- dekind:
delle sind isomorph.
Im Gegensatz zum Rest des Buchs wollen wir im Folgenden Rekursionssatz
die Zahl Null, 0, zu den natürlichen Zahlen rechnen. Sei A eine beliebige Menge mit einem Element a ∈ A
und einer Selbstabbildung g : A → A gegeben.
Am 7. Dezember 1873 bewies Georg Cantor, dass die Dann gibt es genau eine Abbildung f : N0 → A mit
Menge R nicht abzählbar ist, sich also nicht in der Form f (0) = a und f ◦ ν = g ◦ f , d. h., also f (ν(n)) =
{r0 , r1 , r2 , . . .} schreiben lässt. Dieser Tag gilt daher für viele g(f (n)) für alle n ∈ N0 .
Mathematiker als die Geburtsstunde der Mengenlehre, die
aber noch einige Geburtswehen und Krisen durchzustehen
hatte. Der ganze Apparat der Mengenlehre, so wie wir ihn Beweis: Die Eindeutigkeit von f folgt mittels Induktion
heute kennen, stand Dedekind und Peano noch nicht zur Ver- nach n.
fügung.
Auch die Existenz von f kann man mittels Induktion zei-
Heutzutage kann man aber mit den Axiomen der Mengen- gen: Durch f (0) = a ist f (0) festgelegt. Wegen f (ν(n)) =
lehre den folgenden Satz zeigen. g(f (n)) gilt f (1) = g(f (0)) = g(a) und mit 2 := ν(1) gilt
f (2) = f (ν(1)) = g(f (1)) = g(g(0)) etc.
Addition und Multiplikation auf N0 Wir machen zu den Beweisen der einzelnen Aussagen aus
Platzgründen lediglich einige Anmerkungen.
Auf der Menge N0 der natürlichen Zahlen lassen sich in
eindeutiger Weise zwei Verknüpfungen „+“ (Addition) Zur Definition der Addition ist zu sagen, dass für m, n ∈ N0
und „·“ (Multiplikation) definieren: die Addition rekursiv definiert wird:
„+“: N0 × N0 → N0 mit (m, n) → m + n und
m + 0 := m und m + ν(n) = ν(m + n).
„·“: N0 × N0 → N0 mit (m, n) → m · n,
wobei Folgendes gilt: Man wendet also den Rekursionssatz an mit A = N0 ,
(N0 , +) ist eine kommutative Halbgruppe mit dem a := m, g := ν und f (n) := m + n. Insbesondere gilt
neutralen Element 0, d. h., es gelten alle Grup- also 1 := ν(0) und m + 1 = ν(m). Der Nachfolger von m ist
penaxiome mit Ausnahme der Existenz eines addi- also m + 1.
tiven Inversen für alle n ∈ N0 .
Die durch die obigen Gleichungen rekursiv definierte Zahl
Die Multiplikation „·“: N0 × N0 → N0 mit (m, n) →
m + n heißt die Summe von m und n.
m · n ist assoziativ, kommutativ, und 1 := ν(0) ist
neutrales Element bezüglich „·“. Beachtet man die folgende Überlegung:
Ferner ist die Multiplikation distributiv bezüglich der
m + 1 = m + ν(0) = ν(m + 0) = ν(m),
Addition, d. h., für alle l, m, n ∈ N0 gilt:
m + 2 = m + ν(1) = ν(m + 1) = ν(ν(m)) =: ν 2 (m),
(l + m) · n = (l · n) + (m · n). ..
.
0 · n = n · 0 = 0 für alle n ∈ N0 , und ν(n) = n + 1 m + n = m + ν n (0) =: ν n (m),
für alle n ∈ N0 .
so kann man ablesen, dass m + n der n-te Nachfolger von m
Für m, n ∈ N0 gilt m · n = 0 ⇔ m = 0 oder n = 0.
ist.
Neben diesen Rechenregeln sollen die natürlichen Zahlen Zur Multiplikation ist zu sagen, dass man für m, n ∈ N0
über eine Ordnung verfügen, die es erlaubt, natürliche Zahlen m·0 := 0 und m·ν(n) := m·n+m definiert. Man mache sich
der Größe nach zu vergleichen. Bezüglich dieser Ordnung ist klar, dass dies wieder eine Anwendung des Rekursionssatzes
N0 sogar wohlgeordnet, d. h., jede nichtleere Teilmenge von ist.
N0 besitzt ein kleinstes Element. Aus den beiden Definitionen oben folgt 0 · n = 0 und ν(m) ·
n = n + m · n. Nach der ersten Definition gilt 0 + 0 = 0
Ordnung der natürlichen Zahlen und 0 · ν(n) = 0 · n + 0 = 0 + 0 = 0. Das war ein Induk-
In N0 wird durch R = {(m, n) ∈ N0 × N0 | ∃k ∈ tionsbeweis!
N0 mit m+k = n} ⊆ N0 × N0 eine Ordnungsrelation Weiter ist ν(m) · 0 = 0 + 0 = 0 + m · 0 = 0.
definiert. Wir schreiben m ≤ n für (m, n) ∈ R und
m < n, falls m ≤ n und m = n gilt. Die Relation m < Ferner ist ν(m) · ν(n) = ν(m) · n + ν(m) wegen m · ν(n) =
n ist äquivalent dazu, dass es ein k ∈ N = N0 \{0} mit m · n + m, und nach Induktionsvoraussetzung gilt n + m ·
m + k = n gibt. Durch „≤“ ist N0 total geordnet, und n+ν(m), was nach Definition der Addition ν(n)+m · n+m
es gilt 0 = min(N0 ). entspricht. Schließlich findet man mit der Definition der Mul-
tiplikation ν(n) + m · ν(n).
4.7 Vertiefung: Konstruktiver Aufbau der reellen Zahlen 151
Als weitere Eigenschaft beweisen wir exemplarisch das Dis- Möglichkeiten dargestellt. Wir werden auf eine Wiederho-
tributivgesetz. Es lautet: Für alle k, m, n ∈ N0 gilt: lung verzichten.
(k + m) · n = (k · n) + (m · n). Wir werden bei diesen Schritten in natürlicher Weise weitere
algebraische Begriffsbildungen einführen, z. B.:
Zur Vereinfachung der Schreibweise lassen wir bei der Multi-
plikation den Malpunkt weg und vereinbaren die „Vorfahrts- beim Übergang von N0 zu den ganzen Zahlen Z die Ein-
regel“; dass die Multiplikation stärker bindet als die Addition. bettung einer regulären Halbgruppe in eine Gruppe;
Dann lautet das Distributivgesetz einfach beim Übergang von Z zu den rationalen Zahlen Q die
Konstruktion eines Quotientenkörpers;
(k + m)n = kn + km (k, m, n ∈ N0 ). beim Übergang von Q zu den reellen Zahlen nach dem
Vorbild von G. Cantor einen weiteren Restklassenring.
Beweis: Wir führen den Beweis mittels Induktion nach n:
Es ist (k + m)0 = 0 = 0 + 0 = k · 0 + m · 0, und der Durch Erweiterung von N0 erhält man die
Induktionsanfang ist gesichert.
ganzen und die rationalen Zahlen
Unter der Voraussetzung, dass das Distributivgesetz für ein
beliebiges n ∈ N0 gilt, zeigen wir seine Gültigkeit für Wir wollen die Erweiterung von N0 nach Z so konstruieren,
ν(n) = n + 1. Es ist nach Definition dass sich jede ganze Zahl z als Differenz zweier natürlicher
Zahlen m, n darstellen lässt: z := m−n. Algebraisch gespro-
(k + m)ν(n) = (k + m)n + k + m,
chen wollen wir (N, +) zu einer abelschen Gruppe erweitern
was nach Induktionsvoraussetzung kn + mn + k + m ent- und stellen zunächst folgende heuristische Vorbetrachtung
spricht. Wegen der Kommutativität ist dies gleichbedeutend an:
mit kn + k + mn + m, was nach Definition aber gerade
Gilt sowohl z = m − n als auch z = m − n , dann ist
k(n + 1) + m(n + 1) entspricht.
m − n = m − n äquivalent zu m + n = m + n.
Dass in N0 jede nichtleere Teilmenge ein kleinstes Element Wir definieren daher auf N0 × N0 die folgende Relation:
besitzt, kann man wie im Abschnitt 4.4 vorne beweisen. Wir
R = {((m, n), (m , n )) | m + n = m + n}.
geben hier einen einfachen Beweis an, der lediglich benutzt,
dass jede von 0 verschiedene Zahl n ∈ N0 einen Vorgänger Diese Definition ist eine Äquivalenzrelation auf N0 × N0 . Die
hat, d. h., zu n = 0 gibt es ein n ∈ N0 mit ν(n ) = n. Reflexivität und Symmetrie ist offensichtlich. Die Transiti-
Seien dazu V ⊆ N0 eine nichtleere Teilmenge und m ∈ V vität folgt aus der Kürzungsregel für die natürlichen Zahlen.
ein beliebiges Element, das wir mit m0 := m fixieren. Gibt
es kein m ∈ V mit ν(m ) = m0 , dann ist m0 das kleinste
]
]
N0
4)
3)
2)
1)
0)
0)
0)
Element von V . Gibt es aber ein m ∈ V mit ν(m ) = m0 ,
0,
0,
0,
0,
0,
1,
2,
[(
[(
[(
[(
[(
[(
[(
so definieren wir neu m0 := m . Diesen Prozess iterieren 4
wir, wenn nötig. Nach höchstens m0 Schritten muss dieser
Prozess abbrechen, da wir dann bei der Zahl 0 angekommen 3
sind, und 0 besitzt keinen Vorgänger. Ist 0 ∈
/ V , so bricht der
2
Prozess vorher ab.
1
Erinnern Sie sich (Seite 120), dass der Wohlordnungssatz
und das Beweisprinzip der vollständigen Induktion äquiva-
-4 -3 -2 -1 0 1 2 3 4 5 6 N0
lent sind!
Abbildung 4.21 Veranschaulichung der Äquivalenzrelation R. Es gilt z. B.
Ausführliche Beweise der Eigenschaften von N0 , die wir auf-
[(0, 2)] = {(0, 2), (1, 3), (2, 4), . . . }.
gelistet haben, finden sich in dem schon zitierten Werk von
E. Landau „Grundlagen der Analysis“. Die Lektüre dieses Für ((m, n), (m , n )) ∈ R schreiben wir auch (m, n) ∼
Klassikers sei jedem empfohlen. Dort findet sich im Vorwort (m , n ). Sei [(m, n)] die Äquivalenzklasse von (m, n), d. h.,
von 1929 der folgende bemerkenswerte Satz: [(m, n)] = {(x, y) ∈ Z × Z | (x, y) ∼ (m, n)}, so definieren
„Bitte vergiss alles, was Du auf der Schule gelernt hast; denn wir:
Du hast es nicht gelernt.“
Z = N0 × N0 /R = {[m, n]} mit m, n ∈ N0 .
Der Schritt von den natürlichen Zahlen zu den ganzen Zah-
len ist einfach, genauso wie der folgende Schritt von den In N0 × N0 kann man komponentenweise addieren:
ganzen Zahlen hin zu den rationalen Zahlen. Der Schritt von (m, n) + (m , n ) = (m + m , n + n ).
den rationalen Zahlen zu den reellen Zahlen ist der schwie-
rigste. Der Übergang von R zu den komplexen Zahlen C ist Dabei gelten das Kommutativgesetz und das Assoziativge-
wieder relativ einfach. Im Haupttext wurden hierfür mehrere setz, und (0, 0) ist das neutrale Element.
152 4 Zahlbereiche – Basis der gesamten Mathematik
Diese Addition ist mit der Relation R verträglich, d. h., aus Für [(m, n)] ∈ Z und [(k, l)] ∈ Z sei
(m, n) ∼ (m , n ) und (k, l) ∼ (k , l ) folgt (m, n) + (k, l) ∼
(m , n ) + (k , l ) für m, n, k, l, m , n , k , l ∈ N0 . In Z defi- [(m, n)] · [(k, l)] = [(mk + nl, ml + nk)].
niert man nun eine Addition wie folgt: Seien a, b ∈ Z, dann
wählen wir m, n, k, l ∈ N0 mit a = [(m, n)] und b = [(k, l)] Man weist nach, dass die Multiplikation · : Z × Z → Z ver-
und definieren a + b = [(m, n) + (k, l)]. treterunabhängig ist und dass die Abbildung zudem
assoziativ,
Wir verzichten auf den Nachweis, dass diese Addition nicht
kommutativ und
von der speziellen Vertreterwahl m, n, k, l ∈ N0 abhängt.
distributiv bezüglich „+“ ist.
Folgerung Zudem ist [(1, 0)] =: 1 das neutrale Element bezüglich „·“.
(Z, +) ist eine abelsche Gruppe mit dem neutralen Ele-
Zusammenfassend erhält man als Ergebnis: (Z, +, ·) ist ein
ment 0 = [(0, 0)].
Integritätsring; dies ist ein kommutativer, nullteilerfreier
Ring mit Einselement, der N0 ∼ = ι(N0 ) als Teilmenge ent-
Beweis: Das Assoziativ- wie auch das Kommutativgesetz hält.
übertragen sich von N0 auf N0 × N0 und weiter auf Z. Das
Element 0 ist neutral in N0 , (0, 0) neutral in N0 × N0 , und Z ist der kleinste Ring bezüglich „⊆“, der N0 enthält. Ge-
[(0, 0)] ist neutral in Z. nauer gilt, dass es zu jedem Integritätsring R und zu jedem
injektiven Homomorphismus ϕ : N → R genau einen in-
Inverses Element zu [(m, n)] bezüglich der Addition ist jektiven Homomorphismus : Z → R mit der Eigenschaft
[(n,m)], da [(m, n)]+[(n, m)] = [(m+n, m+n)] = [(0, 0)] ◦ ι = ϕ gibt.
gilt.
ϕ
N0 -
Das zu α ∈ Z eindeutig bestimmte inverse Element bezüglich R
der Addition bezeichnen wir mit −α. @
@
Durch α − β = α + (−β) (α, β ∈ Z) wird auf Z die Sub- @
traktion eingeführt.
ι
@
@
@
R
@
Wir behaupten, dass die Abbildung
Z
ι : N0 → Z; m → [(m, 0)] Abbildung 4.22 In diesem kommutativen Diagramm wird die Beziehung
◦ ι = ϕ für die natürlichen und ganzen Zahlen dargestellt.
injektiv und mit der Addition verträglich ist. Das bedeutet,
dass In Z gilt die Kürzungsregel für die Multiplikation: Aus
mk = nk und k = 0 folgt m = n.
ι(m + n) = [(m + n, 0)] = [(m, 0)] + [(n, 0)] = ι(m) + ι(n)
Beweis: Aus mk = nk folgt (m − n)k = 0, und wegen
erfüllt ist. k = 0 folgt m − n = 0, also m = n.
Aus ι(m) = ι(n) folgt [(m, 0)] = [(n, 0)] ⇒ 0 = m = n = Wir definieren nun eine Anordnung in Z, welche die Ordnung
0 ⇒ m = n. in N0 fortsetzt. Diese Ordnung für m, n ∈ Z lautet wie folgt:
Wir vereinbaren daher, m mit ι(m) für alle m ∈ N0 zu identi- m ≤ n ⇒ n − m ∈ N0 .
fizieren und können jetzt N0 als Teilmenge von Z auffassen:
Damit ist Z linear total geordnet. Für alle m, n ∈ Z mit m ≤ n
(Z, +) ist eine Erweiterung von (N0 , +) zu einer abelschen gilt m + k ≤ n + k, und falls k > 0, gilt mk ≤ nk.
Gruppe. Jedes Element aus Z hat mit m, n ∈ N0 die Gestalt
In N0 wird die früher definierte Ordnung induziert, denn
[(m, n)] = [(m, 0)] + [(0, n)] = [(m, 0)] + [(−n, 0)] n − m ∈ N0 ist äquivalent mit: Es gibt ein k ∈ N0 mit
= ι(m) − ι(n) = m − n. m + k = n.
(m − n)(k − l) = (mk + nl) − (ml + nk) Mit Z haben wir einen Ring gefunden, der N0 bei passen-
der Identifizierung enthält und der in einem gewissen Sinne
gelten für m, n, k, l ∈ N0 . So gelangt man zu folgender De- minimal ist. Aber es hat z. B. die Gleichung 2x = 1 keine
finition der Multiplikation auf Z: Lösung x ∈ Z.
4.7 Vertiefung: Konstruktiver Aufbau der reellen Zahlen 153
ϕ
Um einen Zahlbereich zu konstruieren, der Z enthält und in Z - R
dem Gleichungen wie oben eine eindeutige Lösung besitzen, @
betrachtet man &Q = {(a, b) ∈ Z × Z\{0}} und definiert für @
& und a , b ∈ &
a, b ∈ Q Q: @
ι
@
(a, b) ∼ (a , b ) ⇔ ab = a b. @
@
R
@
Man überzeuge sich, dass hierdurch eine Äquivalenzrela-
& definiert wird, und wir definieren Q = & Q
tion auf Q Q/∼ als
die Menge der Äquivalenzklassen. Für die Klasse von (a, b) Abbildung 4.23 In diesem kommutativen Diagramm wird die Beziehung
◦ ι = ϕ für die ganzen und rationalen Zahlen dargestellt.
schreiben wir ab .
Die Elemente von Q heißen rationale Zahlen. Man beachte,
dass eine rationale Zahl in verschiedener Weise in der Form Ausgangspunkt ist der archimedisch angeordnete Körper Q
a der rationalen Zahlen. In Q existieren Folgen von rationalen
b dargestellt werden kann. Es ist etwa
Zahlen, die Cauchy-Folgen in Q, die in R konvergieren, deren
2 4 6 Grenzwert aber keine rationale Zahl ist.
= = = ...
5 10 15
und die Zahlenpaare (2, 5), (4, 10), (6, 15) usw. repräsentie- Beispiel Ein Beispiel ist die rekursiv definierte Folge
ren alle dieselbe rationale Zahl. Die obige Äquivalenzrelation (xn+1 ) von rationalen Zahlen mit
' (
erlaubt das „Kürzen“ und „Erweitern“ von Brüchen. 1 2
x0 = 2, xn+1 = xn + .
Auf dieser Menge definieren wir erneut eine Addition und 2 xn
eine Multiplikation: √
Sie konvergiert in R gegen 2 und ist√damit eine Cauchy-
Seien ab , dc ∈ Q, dann seien Folge in R und damit auch in Q, aber 2 ist keine rationale
Zahl, wie wir gezeigt haben (Seite 127).
a c ad + bc
(A): + = und
b d bd Die Konstruktion nach Cantor verläuft wie folgt:
a c ac
(M): · = . Zuerst betrachtet man die Menge aller Cauchy-Folgen von
b d bd
rationalen Zahlen R = {(xn ) | (xn ) ist Cauchy-Folge in Q}.
m
Mit der Abbildung ι : Z → Q, definiert durch m → 1, gilt Dabei ist der Begriff der Cauchy-Folge in Q wie der der
dann der folgende Satz: Cauchy-Folge in R erklärt, da die betreffenden ε > 0 immer
rational sind. In der Menge R erklärt man eine Relation wie
Die Menge der rationalen Zahlen ist ein Körper folgt:
Die Menge Q der rationalen Zahlen ist mit der wohlde- (xn ) und (yn ) aus R heißen äquivalent, in Zeichen (xn ) ∼
finierten Addition (A) und der wohldefinierten Multipli- (yn ), genau dann, wenn limn→∞ |xn −yn | = 0 gilt; die Folge
kation (M) ein Körper. der Differenzen ist also eine Nullfolge in Q.
Man prüft leicht nach, dass dies eine Äquivalenzrelation auf
Zu ab ist − ab das additive Inverse und falls a = 0 ist b
a das R ist und definiert
multiplikative Inverse.
/
R = {ξ = (xn ) | (xn ) ∈ R}
Die Konstruktion von Q aus Z ist ein wichtiges Beispiel für
die Konstruktion eines Quotientenkörpers: Q ist die Menge als die Menge der entsprechenden Äquivalenzklassen. Damit
aller Quotienten ab mit ganzen Zahlen a, b und b = 0. hat man R zunächst als Menge, die man mit einer Addition
und einer Multiplikation versehen muss. Eine Addition bzw.
Q besitzt die folgende universelle Eigenschaft: Zu jedem in- eine Multiplikation in R definiert man über (xn ) + (yn ) =
jektiven Ringhomomorphismus von Z in einen beliebigen (xn + yn ) bzw. (xn ) · (yn ) = (xn · yn ). Dabei muss man
Körper R gibt es eine eindeutig bestimmte injektive Abbil- streng genommen zwei verschiedene „+“- bzw. „·“-Zeichen
dung mit ◦ ι = ϕ. verwenden, da die Addition bzw. die Multiplikation in R
jeweils erst durch die rechten Seiten definiert werden.
Cantors Weg von Q zu den reellen Zahlen Auf der Menge R der entsprechenden Restklassen wird dann
führt über Cauchy-Folgen durch
/
(x /
n ) + (y
/
n ) = (xn + yn ) bzw. (x /
n ) · (x
n ) = (xn · yn )
Zum Schluss skizzieren wir eine Konstruktion der reellen
Zahlen, die von Georg Cantor 1883 publiziert wurde. Wir eine Addition bzw. eine Multiplikation induziert, die unab-
verwenden dabei die Begriffe der konvergenten Folge und hängig von der Auswahl der Restklassenrepräsentanten sind.
der Cauchy-Folge in Vorgriff auf das Kapitel 8 „Folgen“. So wird eine Körperstruktur auf R definiert. Wir verzichten
154 4 Zahlbereiche – Basis der gesamten Mathematik
hier auf die Verifikation der meisten Körperaxiome, da diese x < y ⇔ ϕ(x) < ϕ(y),
leicht nachzuweisen sind. Etwas schwieriger nachzuweisen wobei wir die Kleinerrelation in den beiden Körpern gleich
ist, dass jedes von 0 verschiedene Element (x / n ) ∈ R ein bezeichnet haben.
Inverses besitzt.
Wir behaupten also, dass je zwei archimedisch angeordnete
Zuletzt definiert man noch die Menge der positiven Elemente Körper, in denen jede Cauchy-Folge konvergiert, isomorph
P in R über sind:
P = {(x0n ) ∈ R | ∃ r ∈ Q>0 und ∃N ∈ N mit xn > r ∀n ≥ N }
Satz
Für diese Menge P weist man nach, dass R = P ∪{0}∪(−P ) Je zwei archimedisch angeordnete Körper, in denen jede
gilt, eine disjunkte Vereinigung. Cauchy-Folge konvergiert, sind isomorph.
R ist also ein angeordneter Körper mit P als Menge der posi-
tiven Elemente von R. So kann man Q in R wiederfinden: Für Beweis: Wir geben nur eine Beweisskizze. Es genügt zu
r ∈ Q sei ι(r) die Äquivalenzklasse der konstanten Cauchy- zeigen, dass jeder archimedisch angeordnete Körper K, der
Folgen (r) ∈ R. Die Abbildung ι : Q → R, die mit Summen- vollständig ist, zum oben nach Cantor konstruierten Körper
und Produktbildung verträglich ist, respektiert diese Anord- R isomorph ist.
nung. Da K ein angeordneter Körper ist mit Einselement 1, gilt für
Deshalb macht man keinen Unterschied zwischen r und ι(r). die n-fache Summe:
Nach Definition von P gibt es zu jedem ξ ∈ P ein r ∈ Q mit n=1+1+
. . . + 1
0 < r < ξ.
n Summanden
Weiter zeigt man, dass R archimedisch geordnet ist. Man stets n + 1 > n. Insbesondere ist n = 0. Man kann daher die
führt einen Widerspruchsbeweis und nimmt dazu an, dass Menge {0, 1, 1 + 1, . . .} mit der Menge N0 = {0, 1, 2, . . .}
etwa α ∈ R eine obere Schranke von N sei. Nach unserer der natürlichen Zahlen identifizieren und damit als Teilmenge
letzten Überlegung gibt es ein r ∈ Q mit 0 < r < α1 . Mit von K auffassen. Genauso fasst man Z und Q als Teilmengen
1/r = a/b mit 0 = b, a ∈ N erhält man den Widerspruch von K auf. Aus der archimedischen Eigenschaft von K ergibt
α < 1/r = a/b ≤ a ∈ N. sich, dass Q dicht in K ist.
Als nächstes weist man nach, dass ι(Q) dicht in R liegt. Seien Zu jedem x ∈ K gibt es also eine Folge (xn ), xn ∈ Q, mit
dazu ξ = (x/ n ) ∈ R und 0 < ε ∈ Q gegeben. Da (xn ) eine
limn→∞ xn = x.
rationale Cauchy-Folge ist, gibt es zu diesem ε ein N ∈ N Dann ist (xn ) eine Cauchy-Folge in Q, und man definiert:
mit |xn − xm | < ε für alle n, m ∈ N mit n, m > N. Für
/
ϕ : K → R; x → (xn)
m ≥ N bedeutet das aber |ξ − ι(xm )| < ε.
und verifiziert die Unabhängigkeit von der Repräsentanten-
Das bedeutet speziell, dass ι(Q) dicht in R ist. Nun folgt ein
wahl.
Nachweis der Vollständigkeit von R.
ϕ ist auch mit der Summen- und der Produktbildung sowie
mit der Anordnung verträglich. Ist y ∈ K und yn eine Folge
Jede Cauchy-Folge reeller Zahlen konvergiert mit yn ∈ Q und gilt lim n→∞ yn = y, so folgt aus x = y
in R unmittelbar:
lim (xn − yn ) = 0
n→∞
Sei (ξj ) eine Cauchy-Folge von R. Nach der vorangegangen
und ϕ(x) = ϕ(y). ϕ ist also injektiv. ϕ ist aber auch surjektiv:
Überlegung gibt es ein rj mit |ξj − rj | < j1 . Damit ist rj also
/ Denn ist ξ = (x/ n ) ∈ R ein beliebig vorgegebenes Element,
eine Cauchy-Folge in Q, und man definiert ξ = (r j ) ∈ R.
so existiert wegen der Vollständigkeit von K der Grenzwert
Es gilt wegen der Dreiecksungleichung |ξ − ξj | ≤ |ξ − rj | + limn→∞ xn =: x ∈ K. Daher ist ϕ(x) = ξ . ϕ ist also bijektiv
|rj − ξ |, und daher folgt lim j →∞ |ξ − ξj | = 0. und damit ein Isomorphismus
Zusammenfassung
Wir haben das Kapitel mit der axiomatischen Einführung der Die Existenz natürlicher Zahlen garantiert dann ein wichtiges
reellen Zahlen R begonnen: Beweisprinzip in der Mathematik.
Ferner sind Addition und Multiplikation über das Distribu- Auch die ganzen Zahlen lassen sich in R entdecken.
tivgesetz miteinander gekoppelt.
Die Anordnungsaxiome erlauben es, reelle Zahlen der Größe Definition der ganzen Zahlen
nach zu vergleichen. Sie bilden die Grundlage für Abschät- Eine reelle Zahl x heißt ganz, falls x ∈ N oder x = 0
zungen und das Rechnen mit Ungleichungen. oder −x ∈ N gilt. Z = {x ∈ R | x ganz} heißt Menge
Insbesondere das Vollständigkeitsaxiom (V) ist von großer der ganzen Zahlen.
Bedeutung, sodass wir es hier noch einmal anführen.
Zu guter Letzt findet man mit folgender Definition die ratio-
Ein Vollständigkeitsaxiom nalen Zahlen in R.
Jede nichtleere nach oben beschränkte Menge M reeller
Zahlen besitzt eine kleinste obere Schranke, d. h., es gibt Definition rationaler und irrationaler Zahlen
ein s0 ∈ R mit folgenden Eigenschaften:
Die Menge
Für alle x ∈ M ist x ≤ s0 (s0 ist obere Schranke).
Für jede obere Schranke s von M gilt s0 ≤ s.
m
Q = x ∈ R | Es gibt m, n ∈ Z, n = 0, mit x =
n
Das Vollständigkeitsaxiom unterscheidet R von Q. heißt Menge der rationalen Zahlen. Eine reelle Zahl,
Es garantiert nicht nur z. B. die Existenz von Quadratwur- die nicht rational ist, heißt irrational.
zeln aus nicht negativen reellen Zahlen, sondern ist auch we-
sentlich für den Isomorphiesatz, der besagt, dass ein ange- Die rationalen Zahlen unterscheiden sich von den reellen
ordneter Körper mit Vollständigkeitsaxiom zum Körper der Zahlen wesentlich dadurch, dass in diesem Zahlbereich das
reellen Zahlen isomorph ist. Vollständigkeitsaxiom nicht gilt.
In den so definierten reellen Zahlen lassen sich die natürli- Eine erstaunliche Tatsache ist diese:
chen Zahlen wiederfinden.
Trotz der Existenz von k-ten Wurzeln aus nicht negativen Ein Hauptunterschied zwischen R und C besteht darin, dass
Zahlen gibt es einfache algebraische Gleichungen, die keine sich der Körper der komplexen Zahlen nicht anordnen lässt.
reellen Lösungen besitzen. Das klassische und einfachste Nichts desto trotz sind die Beträge komplexer Zahlen nicht
Beispiel ist x 2 + 1 = 0. negative reelle Zahlen, und diese lassen sich der Größe nach
vergleichen.
Um diesen Mangel zu beheben, definiert man die komplexen
Zahlen. Hier noch einmal deren Eigenschaften. Eine insbesondere für Anwendungen, z. B. die Existenz von
Eigenwerten, wichtige Eigenschaft ist im Fundamentalsatz
Eigenschaften von C der Algebra enthalten.
(a) (C, +, ·) ist ein Körper, den wir den Körper der
komplexen Zahlen nennen.
Fundamentalsatz der Algebra
(b) Die Teilmenge
Jedes nicht konstante komplexe Polynom besitzt in C
CR = {(a, 0) | a ∈ R} ⊆ C mindestens eine Nullstelle:
Sind a0 , . . . , an ∈ C; an = 0, n ∈ N, beliebig vorgege-
ist ein zu R isomorpher Teilkörper von C. Wir iden- bene Zahlen, dann besitzt die Gleichung
tifizieren daher (a, 0) mit a.
(c) Für das Element i = (0, 1) ∈ C gilt: an zn + an−1 zn−1 + · · · + a0 = 0
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
4.3 ••• Eine Teilmenge M ⊆ R heißt konvex genau der einzige Körperautomorphismus von C ist mit σ (x) = x
dann, wenn für alle x, y ∈ M, x ≤ y stets [x, y] ⊆ M für alle x ∈ R, der von der Identität idC : z → z verschieden
gilt. Zeigen Sie: M ⊆ R ist genau dann konvex, wenn M ein ist.
Intervall ist.
4.10 •• Zeigen Sie, dass es keine Abbildung
4.4 • Beweisen Sie die folgenden drei Aussagen:
f : C \ {0} → C \ {0}
(a) Sind M eine endliche Menge und N eine Teilmenge von
M (N ⊆ M), dann ist auch N endlich, und es gilt |N | ≤ gibt mit
|M|.
(b) Sind M und N disjunkte endliche Mengen (M ∩N = ∅), (1) f (zw) = f (z)f (w) für alle z, w ∈ C \ {0}.
dann ist auch M ∪ N endlich, und es gilt |M ∪ N | = (2) (f (z))2 = z für alle z ∈ C \ {0}.
|M| + |N|. Mit anderen Worten: es gibt keinen Homomorphismus f :
(c) Sind M und N endliche Mengen, dann ist auch M × N C \ {0} → C \ {0} mit (f (z))2 = z für alle z ∈ C \ {0}.
endlich, und es gilt |M × N | = |M| · |N |.
4.11 •• Zeigen Sie der Reihe nach:
4.5 • Zeigen Sie, dass je zwei abgeschlossene Inter-
valle [α, β] und [a, b] mit α, β ∈ R und α < β bzw. a, b ∈ R (a) M = {1} ∪ {x ∈ R | x ≥ 2} ist induktiv, also N ⊆ M
und a < b gleichmächtig sind. Wieso gilt diese Aussage auch und damit M = N.
für offene Intervalle? (b) Es gibt kein m ∈ N mit 1 < m < 2.
(c) S = {n ∈ N | n − 1 ∈ N0 } ist induktiv, also ist S = N.
4.6 • Seien a, b ∈ R, a < b. Geben Sie eine bijektive (d) T = {n ∈ N | es gibt kein m ∈ N mit n < m < n + 1}
Abbildung ϕ : (−1, 1) → R an und folgern Sie, dass alle ist induktiv, also ist T = N.
offenen Intervalle (a, b) mit a < b die Mächtigkeit von R (e) Sind m, n ∈ N, und gilt m < n, dann ist m + 1 ≤ n.
haben.
4.12 •• Zeigen Sie, dass die Teilmenge
4.7 •• Eine reelle oder komplexe Zahl α heißt algebra- √ √
isch, falls es ein Polynom P = 0 mit P (α) = 0 gibt. Dabei Q( 2) = {a + b 2 | a, b ∈ Q}
seien die Koeffizienten des Polynoms alle ganz. Existiert für
eine Zahl α kein solches Polynom, nennen wir diese Zahl von R bezüglich der auf R erklärten Addition√ und Multipli-
√
transzendent. kation ein Körper ist. Liegt die reelle Zahl 3 in Q( 2)?
n , m ∈ Z, n ∈
(a) Zeigen Sie, dass jede rationale Zahl α = m 4.13 •• Sei Q(i) := {a+bi | a, b ∈ Q}. Zeigen Sie, dass
Z \ {0} algebraisch ist.√ Q(i) bezüglich der in C gültigen Addition und Multiplikation
(b) Zeigen Sie, dass α = 2 algebraisch ist. ein Körper ist.
(c) Zeigen Sie, dass α = i algebraisch ist.
(d) Zeigen Sie, dass A = {α ∈ C | α ist algebraisch} ab- 4.14 •• Ein Seeräuber hinterließ bei seinem unerwar-
zählbar ist. teten Ableben im Alter von 107 Jahren unter anderem eine
(e) Zeigen Sie, dass T = {α ∈ C | α ist nicht algebraisch} Schatzkarte mit eingezeichneter Schatzinsel und folgender
überabzählbar ist. Ein α ∈ T heißt transzendent. Beschreibung:
4.8 • Zur Festigung der Begriffe „rational“ und „irra- Geh’ direkt vom Galgen zur Palme, dann gleich viele
tional“ beantworten Sie folgende Fragen: Schritte unter rechtem Winkel nach rechts – steck’ die erste
Fahne!
(a) Wenn a rational und b irrational sind, ist a + b dann
notwendig irrational? Geh’ vom Galgen zum Hinkelstein, genauso weit unter
(b) Wenn a und b irrational sind, ist a + b dann notwendig rechtem Winkel nach links – steck’ die zweite Fahne!
irrational? Der Schatz steckt in der Mitte zwischen den beiden Fahnen!
(c) Wenn a rational und b irrational sind, ist a · b dann not-
wendig irrational? Die Erben starteten sofort eine Expedition zu der kleinen
(d) Gibt es eine reelle Zahl a, sodass a 2 irrational und a 4 Schatzinsel.
rational sind?
Die Palme und der Hinkelstein waren sofort zu identifizieren.
(e) Gibt es zwei irrationale Zahlen a und b, deren Summe
Vom Galgen war keine Spur mehr zu finden. Dennoch stieß
und Produkt rational sind?
man beim ersten Spatenstich auf die Schatztruhe, obwohl
man die Schritte von einer (zufälligen und sehr wahrschein-
4.9 ••• Zeigen Sie, dass lich) falschen Stelle aus gezählt hatte.
σ : C → C : z → z Wie war das möglich? Wo lag der Schatz?
158 4 Zahlbereiche – Basis der gesamten Mathematik
4.15 ••• Hieronymus B. Einbahn, nach dem in Deutsch- Zeigen Sie ferner, dass d(a, b) ≥ 0 aus den anderen Eigen-
land viele Straßen benannt sind, entdeckte im Jahr 1789 die schaften gefolgert werden kann.
Einbahninsel Sun-Tse mit n Orten (n ∈ N) und genau einem
Weg zwischen zwei Orten. Er wollte eine Route finden, auf 4.20 •• Wie viele Paare (x, y) ∈ Z × Z gibt es, die
der jeder Ort genau einmal vorkommt. Die Wege waren je- x 2 + y 2 = 13 erfüllen? Warum gibt es kein Paar (x, y) ∈
doch so schmal, dass nur in einer Richtung gefahren werden Z × Z mit x 2 + y 2 = 3?
konnte. Daher hat Krao-Se, der Herrscher der Einbahninsel,
nur eine Fahrtrichtung für jede Strecke zwischen zwei Orten
zugelassen. Unter Beachtung dieser Regel gelang es Hierony- 4.21 •• Wir betrachten das auf D. Hilbert zurückge-
mus B. Einbahn jedoch, eine entsprechende Route zu finden. hende Beispiel der Teilmenge H = {3k + 1 | k ∈ N} der
Wie war das möglich? War dies ein Zufall? natürlichen Zahlen. Wir wollen eine Zahl n = 1 aus H H -
Primzahl nennen, wenn 1 und n die einzigen in H gelegenen
4.16 •• Sei 2 := {n ∈ N0 | es gibt x, y ∈ Z mit n = Teiler von n sind.
x + y }. Zeigen Sie, dass 0, 1 und 2 in 2 enthalten sind und
2 2
(a) Weisen Sie nach, dass diese Menge bezüglich der Mul-
dass mit n, m ∈ 2 auch nm ∈ 2 folgt. Zeigen Sie ferner, tiplikation abgeschlossen ist.
dass 5, 401 und 2005 in 2 liegen. Finden Sie eine konkrete (b) Geben Sie die ersten 8 Folgeglieder der H -Primzahlen
Darstellung von 2005 als Summe von zwei Quadraten ganzer an und weisen Sie nach, dass 100 ∈ H gilt.
Zahlen. (c) Weisen Sie nach, dass sich jede H -Zahl n als ein Produkt
von H -Primzahlen darstellen lässt.
(d) Finden Sie alle in H liegenden Zerlegungen von 100
Rechenaufgaben (Tipp: Es gibt derer zwei) und zeigen Sie damit, dass die
4.17 • Seien a und b positive reelle Zahlen. Man be- Zerlegung nicht eindeutig ist.
zeichnet mit (e) Weisen Sie jetzt nach, dass die Zahl 10 das Produkt aus 4
und 25 teilt, ohne eine der beiden Faktoren zu teilen. Be-
a+b sitzen die H -Primzahlen die Primelementeigenschaft?
A(a, b) := das arithmetische, mit
2
√
G(a, b) := ab das geometrische, mit 4.22 • Seien c0 , c1 , ..., cn−1 reelle Zahlen (n ∈ N).
2 Zeigen Sie: Gilt für z ∈ C die Gleichung
H (a, b) := 1 1
das harmonische, mit
+
a b zn + cn−1 zn−1 + ... + c1 z + c0 = 0,
1
a 2 + b2
Q(a, b) := das quadratische Mittel. dann gilt sie auch für z. Dies kann man auch so ausdrücken:
2
Wenn z0 ∈ C Lösung einer Polynomgleichung mit reellen
Beweisen Sie die folgende Ungleichungskette für den Fall Koeffizienten ist, so ist auch z0 Lösung derselben Gleichung.
a ≤ b:
a ≤ H (a, b) ≤ G(a, b) ≤ A(a, b) ≤ Q(a, b) ≤ b 4.23 • Zeigen Sie, dass für beliebige reelle Zahlen a, b
gilt:
Wann gilt das Gleichheitszeichen? (a + b)3 = a 3 + 3a 2 b + 3ab2 + b3 ,
4.18 • Bestimmen Sie explizit die folgenden Mengen: dabei ist 3 := 2 + 1, x 3 := xxx für x ∈ R.
(a) L1 := {x ∈ R | |3 − 2x| < 5}
(b) L2 := {x ∈ R | x = 2 und x+4
x−2 < x} 4.24 • Zeigen Sie: Sind a1 , . . . , an reelle Zahlen, dann
(c) L3 := {x ∈ R | x(2 − x) ≥ 1 + |x|} gilt:
und stellen Sie (wenn möglich) L1 , L2 und L3 mithilfe von
Intervallen dar. a12 + a22 + a32 + . . . + an2 = 0 ⇔ aj = 0 für 1 ≤ j ≤ n.
4.26 •• Zeigen Sie mit vollständiger Induktion: Sind p 4.33 • Zeigen Sie, dass für z, w ∈ C gilt:
Primzahl und a ∈ N0 , dann ist p ein Teiler von a p − a.
(a) |z − w|2 = |z|2 − 2Re (zw) + |w|2
Dieser Satz wird kleiner Fermat’scher Satz genannt. Seine
(b) |z + w|2 + |z − w|2 = 2(|z|2 + |w|2 )
klassische Formulierung ist a p−1 ≡ 1 mod p, die gültig ist,
wenn a kein Vielfaches von p ist. Warum nennt man die zweite Gleichung Parallelogramm-
identität?
4.27 •• Seien
4.34 • Zeigen Sie, dass das Assoziativgesetz der Mul-
f1 = 1, f2 = 1, fn+2 = fn+1 + fn für alle n ∈ N. tiplikation in C erfüllt ist. Vervollständigen Sie dazu die be-
reits geführte Rechnung, indem Sie (ac − bd, ad + bc)(e, f )
(a) Zeigen Sie, dass für alle n ∈ N gilt: mit (a, b)(ce − df, cf + de) vergleichen! Verwenden Sie
2 dazu nur die Definition der Multiplikation (a, b)(c, d) :=
√ n √ n 3
1 1+ 5 1− 5 (ac − bd, ad + bc)!
fn = √ − .
5 2 2
4.35 • Schreiben Sie die folgenden komplexen Zahlen
(b) Die in dieser Aufgabe definierte Folge fn heißt in der Normalform a + bi, a, b ∈ R und berechnen Sie ihre
Fibonacci-Folge. Welchen Größenordnung haben f100 Beträge:
und ff100
101
√ 3 '
(
?
' (
1 1+i 2 1 3 1+i n
, , − + i , √ mit n ∈ N0 .
4.28 •• Versuchen Sie, für die folgenden Summen einen 3 + 7i 1−i 2 2 2
geschlossenen Ausdruck – also eine Summenformel – zu fin-
den und bestätigen Sie diese induktiv oder benutzen Sie ge-
eignete Umformungen bzw. schon bekannte Formeln: 4.36 •• Sei c eine komplexe Zahl ungleich null. Zeigen
1 1 1 Sie durch Zerlegung in Real- und Imaginärteil, dass für z ∈ C
(a) 1·2 + 2·3 + ... +
n·(n+1) die Gleichung
(b) 1 − 4 + 9 − ... + (−1)n+1 n2 z2 = c
(c) 1 · 2 + 2 · 3 + ... + n · (n + 1)
(d) 1 · 2 · 3 + 2 · 3 · 4 + ... + n · (n + 1) · (n + 2) genau zwei Lösungen hat. Für eine der Lösungen gilt:
. .
Für alle Formeln sei n ∈ N. |c| + Re (c) |c| − Re (c)
Re (z) = , Im (z) = .
2 2
4.29 •• Z[i] = {a + bi | a, b ∈ Z} ist ein kommutativer
Ring (Ring der ganzen Gauß’schen Zahlen) bezüglich der in Dabei ist
C definierten Addition und Multiplikation. Welche Elemente
α ∈ Z[i] besitzen ein multiplikatives Inverses in Z[i]? +1, falls Im c ≥ 0,
:=
−1, falls Im c < 0.
4.30 •• Zeigen Sie: Die in der vorherigen Aufgabe de-
finierte Menge Z[i] ist mit der durch N (α) = N (a + bi) = Die andere Lösung ist das Negative hiervon.
a 2 + b2 (α ∈ Z[i]) definierten Norm ein euklidischer Ring,
d. h., zu α, β ∈ Z[i], β = 0, gibt es γ , δ ∈ Z[i] für die 4.37 • Bestimmen Sie alle Quadratwurzeln von
α = γβ + δ und N (δ) < N (β) sind.
i , 8 − 6i , 5 + 12i .
4.31 • Stellen Sie für z = 1 + 2i, w = 3 + 4i die
folgenden komplexen Zahlen in der Form a + bi, a, b ∈ R,
explizit dar: 4.38 • Bestimmen Sie beide Lösungen z1 = x1 +
y1 i, z2 = x2 + y2 i aus C mit x1 , y1 , x2 , y2 ∈ R für die
w + z 1 − iz Gleichung
3z + 4w, 2z2 − zw, , .
w − z 1 + iz z2 + (3 − i)z − 2 − 2i = 0.
genau dann, wenn die folgende Bedingung erfüllt ist: 4.47 •• Satz 20 in Buch IX von Euklids „Elementen“
lautet „Es gibt mehr Primzahlen als jede vorgelegte Anzahl
Zu jedem > 0 gibt es ein a ∈ A und ein b ∈ B, von Primzahlen.“ Beweisen Sie diesen Satz und folgern Sie
daraus, dass es unendlich viele Primzahlen geben muss.
(a) 3n > n3
n n 4.49 •• Zeigen Sie, dass die Summe
(b) 32 < 23
(c) 1 · 2 · 33 · ... · nn < nn(n+1)/2
1 2 √ √
3
(d) 3( n3 )n ≤ n! ≤ 2( n2 )n 2+ 2
Für
dienletzte Ungleichung dürfen Sie die Ungleichung irrational ist.
1 + n1 ≤ 3 ohne Beweis verwenden!
√
4.50 • Die goldene Zahl g = 1+2 5 ≈ 1.618 genügt
4.41 • Für n ∈ N sei An := {1, 2, 3, ..., n}. Zeigen der Gleichung g 2 − g − 1 = 0. Folgern Sie hieraus, dass g
Sie, dass es für alle n > m ∈ N und für jede Abbildung irrational ist.
: An → Am zwei verschiedene Zahlen n1 , n2 ∈ An gibt,
für welche gilt:
4.51 ••• Wir betrachten den Körper R(x) der rationalen
(n1 ) = (n2 ). Funktionen in einer Variablen mit reellen Koeffizienten
wobei die Koeffizienten cj (0 ≤ j < n) aus Z sind, dann gilt Man definiert nun:
sogar x ∈ Z.
P := {r(x) ∈ R(x) | an bm > 0}
4.45 •• Es gibt einen weit √ verbreiteten Widerspruchs-
beweis für die Aussage, dass 2 nicht rational ist. Kennen und vergewissert sich, dass entweder r ∈ P oder −r ∈ P gilt,
Sie diesen und können Sie ihn führen? wenn r nicht das Nullpolynom ist, was wir aber mit an = 0
ausgeschlossen haben.
√
4.46 •• Sei N ∈√N und N keine natürliche Zahl. Fol- Zeigen Sie, dass dieser angeordnete Körper nicht archime-
gern Sie, dass dann N irrational ist. disch angeordnet ist!
Antworten der Selbstfragen 161
S. 105 S. 111
Ausgehend von 1 + (−1) = 0 folgt (−1) · (1 + (−1)) = Der Beweis ergibt sich, indem wir im vorangegangenen Be-
(−1) · 0 = 0. Durch Anwendung des Distributivgesetzes weis „<“ durch „≤“ bzw. „>“ durch „≥“ ersetzen und
erhält man (−1) · 1 + (−1)(−1) = 0. ε = |x| betrachten.
Da die Gleichung (−1) + x = 0 die eindeutig bestimmte S. 112
Lösung x = 1 besitzt, muss (−1)(−1) = 1 gelten. Gilt s < s , so gilt auch die Ungleichung x < s < s bzw.
Eine Verallgemeinerung ist möglich, indem man (−a) = verkürzt x < s für alle x ∈ M und somit ist auch s obere
(−1)·a und (−b) = (−1)·b benutzt und die neue Gleichung Schranke von M.
(−1)a · (−1)b = ab zu (−1)(−1) · ab = ab umsortiert und
dann die beiden Faktoren (−1) · (−1) zu 1 zusammenfasst. S. 114
Existieren min M bzw. inf M, und gilt inf M ∈ M, dann ist
min M = inf M. Den Beweis führt man analog zum eben
S. 105
gegebenen Beweis.
Setzt man c = ax und d = bx für x = 0, so ist die zu be-
weisende Formel ein Spezialfall der Rückrichtung der ersten
S. 118
Formel.
R enthält die 1 und ist abgeschlossen gegenüber der Addi-
tion, insbesondere also auch gegenüber der Addition mit
S. 108
1.
Seien a > 0 und b > 0. Wir beginnen mit a < b und a 2 , für
Gleiches gilt für die nicht negativen reellen Zahlen. Auch
das mit der Transitivität die Ungleichung a 2 = aa < ab <
sie enthalten die 1 als Element, und auch sie sind gegen-
b2 gilt, womit die eine Richtung der Aussage gezeigt ist.
über der Addition abgeschlossen.
Umgekehrt sei a 2 < b2 . Man kann beide Seiten durch a 2 In dieser Menge ist wieder die Zahl 1 enthalten. Nach der
teilen, da a = 0 nach Voraussetzung gilt. Man erhält so zweiten Eigenschaft einer Zählmenge muss auch 1+1 = 2
2
1 < ab2 = ab · ab . Diese Gleichung wird duch b > a bzw. in R\{2} enthalten sein. Dies ist aber nicht so, und daher
stellt diese Menge keine Zählmenge dar.
a < b erfüllt, denn 1 < ab · ab ⇔ ab < ab . Der Bruch ab ist mit
b < a aber kleiner als aa , und man findet ab < aa < ab .
S. 119
Die Menge M = {1} ∪ {x ∈ R | x ≥ 2} ist induktiv. Daher
S. 108 gilt N ⊆ M und damit ist n = 1 oder n ≥ 2.
Wir müssen zeigen, dass aus a ≤ b und b ≤ a die Gleichung
a = b folgt. a ≤ b bedeutet a = b oder a < b und b ≤ a S. 120
heißt b = a oder b < a. Wegen der Trichotomie können
Ohne (P1 ) gäbe es keinen Startpunkt.
a < b und b < a nicht gleichzeitig gelten, also muss a = b
„Weiterzählen“: Durch (P2 ) werden die Dominosteine in
sein.
einer Reihe aufgestellt. So ist sichergestellt, dass ein Do-
minostein nicht zwei Dominosteine gleichzeitig umstößt.
S. 110 Keine „Schleifen“: Durch (P3 ) wird sichergestellt, dass
Nehmen wir zum Beispiel [0, 1] und [2, 3]. Dann ist die Ver- man nicht zu einem bereits gefallenen Stein zurückkehrt.
einigung von keinem der obigen elf Typen und somit kein Kein „Ring“: Vor dem ersten Stein, 1, steht überhaupt kein
Intervall mehr. Stein.
„Umstoßen“: Die fünfte Eigenschaft bringt uns dazu, den
S. 111 ersten Stein, also die 1, umzustoßen. Fällt dieser erste Do-
Für | − a| gelten nach der Definition drei Fälle: minostein, so fallen auch alle weiteren um. Man erreicht
jede natürliche Zahl.
| − a| = −a für −a > 0,
| − a| = 0 für −a = 0 und S. 121
| − a| = −(−a) = a für −a < 0. Aus dem Wohlordnungssatz ergibt sich die folgende Variante
Vergleichen wir dies mit der Definition zu |a|, so folgt Gleich- des Induktionsprinzips: Ist M ⊆ N mit den zwei Eigenschaf-
heit in allen drei Fällen. ten 1 ∈ M und aus {1, 2, . . . , n} ⊆ M folgt n + 1 ∈ M, dann
ist M = N.
S. 111 Zum Beweis betrachtet man das Komplement A = N\M.
Es gilt der Zusammenhang |a| = a sign(a). Wäre A = ∅, dann hätte A ein kleinstes Element k = min A.
162 4 Zahlbereiche – Basis der gesamten Mathematik
S. 132
S. 121
Wenn man vom binomischen Lehrsatz (a + b)n ausgeht und
N ist eine Zählmenge. Nehmen wir an, dass N endlich ist, so
dort a = b = 1 setzt, ergeben sich beide Seiten der Gleichung
gibt es ein Element n, welches größtes Element ist. Dies wi-
direkt: Offensichtlich ist (1 + 1)n = 2n , und da alle Potenzen
derspricht jedoch der zweiten Eigenschaft einer Zählmenge,
von a bzw. b zu 1 werden, steht auch die linke Seite der
mit n auch n + 1 zu enthalten. Damit kann N nicht endlich
Gleichung da.
sein.
S. 133
S. 127
Das Gleichheitszeichen gilt genau in den beiden Fällen n = 1
Zu zeigen sind die Reflexivität:
und h beliebig bzw. n > 1 und h = 0.
(m, n) ∼ (m, n), Der Beweis sieht identisch aus, nur dass man nicht bei n = 1
verankert, sondern bei n = 2. Für n = 1 ist die Aussage ja
die Symmetrie:
falsch, sie gilt laut Satz erst ab n = 2. Für letzteren Fall muss
(m, n) ∼ (m , n ) ⇔ (m , n ) ∼ (m, n) also (1 + h)2 > 1 + 2h gelten. Auf der linken Seite steht
1 + 2h + h2 , was wegen dem zusätzlichen h2 wirklich größer
und die Transivität: als 1 + 2h ist. Hier muss allerdings h = 0 gelten, was aber
vorgegeben ist.
(m, n) ∼ (m , n ) und (m , n ) ∼ (m , n )
S. 134
⇒ (m, n) ∼ (m , n ). Wenn man diese beiden Graphen skizziert, so erkennt man,
dass sie beide oberhalb der x-Achse liegen. Insbesondere ha-
Die Reflexivität ist offensichtlich. Die Symmetrie folgt direkt ben sie beide keinen Schnittpunkt mit der x-Achse gemein,
aus der Vertauschbarkeit von Faktoren eines Produkts. Es gilt und so existieren auch keine Nullstellen für die Funktions-
zum einen mn = nm , zum anderen soll m n = n m gelten. terme.
Beide Gleichungen sind identisch.
Die Transitivität ist schwieriger zu zeigen. Wir benötigen S. 134
(m, n), (m , n ) und (m , n ). Die Relation (m, n) ∼ (m , n ) Wir addieren wieder null auf beiden Seiten:
ist äquivalent zu mn = nm , und (m , n ) ∼ (m , n ) ist
äquivalent zu m n = n m . Zu zeigen ist (m, n) ∼ (m , n ) x 2 + px + q + 0 = 0 + 0
' (
bzw. die Gleichung mn = nm . p 2 p 2
⇐⇒ x 2 + px + q + − = 0.
Wir multiplizieren die beiden Ausgangsgleichungen mitein- 2 2
ander und erhalten: Nun sortieren wir wieder die Summanden um und erhalten:
(mn )(m n ) = (nm )(n m ), p 2 ' p 2 (
x 2 + px + + q− = 0.
2 2
was wegen der Kommutativität der Faktoren äquivalent ist
zu: Diese Gleichung ist aber äquivalent zu:
(mn )(m n ) = (m n)(m n ).
p 2
' p 2 ( p 2
Da n, n und n alle ungleich null sind, muss man nur m = 0 x+ =− q− = − q,
2 2 2
voraussetzen und erhält die Behauptung. Mit m = 0 wären
wegen der Ausgangsgleichungen auch m = 0 bzw. m = 0, und man kann direkt die beiden Lösungen angeben:
was (m, n) = (0, n) bzw. (m , n ) = (0, n ) impliziert und . .
direkt auf (m, n) ∼ (m , n ) führt.
x1 = − +
p p 2
− q bzw. − −
p p 2
− q.
2 2 2 2
S. 128 Dabei geht man genauso vor wie im Beispiel mit den kon-
Man definiere q = min{k ∈ Z | k ≥ x}. kreten Zahlen.
S. 128 S. 135
Für x ∈ Z ist max{k ∈ Z | k ≤ x} = min{k ∈ Z | k ≥ x}. Zum Beweis der zweiten Aussage nehmen wir an, dass es
Antworten der Selbstfragen 163
S. 140 z+z 1
x= = Re (z) = n.V.
Die erste sowie die zweite Aussage überprüft man, indem 2 2
man zuerst die linke Seite voraussetzt und die rechte Seite
Damit muss z + z = 1 sein, und es folgt z = 12 .
folgert. Danach setzt man die rechte Seite voraus und wendet
die Definition des Betrags auf die linke Seite der Gleichung Für die Kreislinie fehlt streng genommen die Zahl z = 0.
an. Die Symmetrie zeigt man durch simples Nachrechnen. Dies sieht man ein, wenn man z = 1 in sich selbst und das
Auch die Dreiecksungleichung wird nachgerechnet. Dabei „Unendliche“ in z = 0 überführt, und dies dann doch nicht
findet man die Gleichheit für z2 = z1 oder für z2 = z3 . tut.
Lineare Gleichungs-
systeme – ein Tor zur 5
linearen Algebra
Worin unterscheiden sich
homogene und inhomogene
Gleichungssysteme?
Was versteht man unter einer
algorithmischen Bestimmung
der Lösung?
Warum kann unmittelbar nach
einer Wahl angegeben werden,
welche Wählerwanderung
stattgefunden hat?
In fast allen Bereichen der linearen Algebra stößt man auf Die unbekannten Größen werden mit x1 , x2 , . . . , xn bezeich-
Aufgaben, die auf lineare Gleichungssysteme zurückführbar net, und ihre Koeffizienten werden immer links davor gesetzt.
sind. Bereits einfache Fragestellungen nach Schnittpunkten von Da nützen wir die Kommutativität aus. Auch schreiben wir
Geraden in der Ebene liefern solche Systeme. Kompliziertere die linearen Gleichungen immer so auf, dass auf der linken
Aufgabenstellungen, wie etwa Eigenwertprobleme oder Fragen Seite der Gleichung genau diejenigen Summanden stehen,
aus der linearen Optimierung, können in riesige Gleichungs- welche Unbekannte enthalten. Damit bleibt rechts jeweils
systeme ausufern. Derartige Systeme spielen auch in vielen nur eine Zahl, das Absolutglied der linearen Gleichung.
anderen Teilgebieten der Mathematik sowie in anderen Wis-
Das System
senschaften eine Rolle, etwa in der numerischen Mathematik,
Statistik, Physik, Statik oder Elektrotechnik. x1 + x2 = 2
Weil es für die meisten Themenkreise der linearen Algebra un- x1 − x2 = 0
umgänglich ist, das Lösen von linearen Gleichungssystemen zu ist ein reelles lineares Gleichungssystem. Die beiden folgen-
beherrschen und über die Struktur von Lösungsmengen Bescheid den Gleichungen
zu wissen, behandeln wir diese Systeme gleich hier in dem ersten
derjenigen Buchkapitel, welche vorwiegend der linearen Alge- sin(x1 ) + x2 = 2
bra gewidmet sind. Zur Bestimmung der Lösungsmenge ent- x1 − x22 = 0
wickeln wir ein systematisches Verfahren, welches auch den
meisten Computeralgebrasystemen zugrunde liegt. In diesem beschreiben hingegen kein lineares Gleichungssystem mehr;
nach Gauß und Jordan benannten Verfahren wird in einer ers- man spricht von einem nichtlinearen Gleichungssystem.
ten Phase geklärt, ob ein gegebenes lineares Gleichungssystem Unter einer Lösung eines reellen Gleichungssystems mit n
überhaupt lösbar ist. Im Fall der Lösbarkeit wird dann in einer Unbekannten verstehen wir n reelle Zahlen l1 , l2 , . . . , ln , die,
weiteren Phase die Lösungsmenge auf eine effiziente Art und anstelle der Unbekannten x1 , x2 , . . . , xn eingesetzt, alle Glei-
Weise bestimmt. chungen des Systems erfüllen. Das Gleichungssystem zu lö-
sen heißt, sämtliche Lösungen, also die Lösungsmenge L des
Dabei bieten sich in natürlicher Weise gewisse Schreib- und Be-
Systems zu bestimmen.
zeichnungsweisen an, die uns mit Matrizen und Vektoren, also
mit Grundbegriffe der linearen Algebra vertraut machen. Die
linearen Gleichungssysteme sind andererseits ein erstes Beispiel Achtung: Die reellen Zahlen l1 , l2 , . . . , ln bilden nicht n
dafür, dass die Lösung eines mathematischen Problems nicht Lösungen, sie bilden eine Lösung des Gleichungssystems.
unbedingt aus einzelnen Formeln bestehen muss. Hier betrach- Daher ist die Schreibweise (l1 , l2 , . . . , ln ) für diese eine Lö-
ten wir das Problem als gelöst, wenn es ein exakt beschriebenes sung besser, und wir werden von nun an Lösungen linearer
Verfahren, einen Algorithmus, gibt, der ausnahmslos funktio- Gleichungssysteme stets in dieser Art angeben.
niert – und mag die Anzahl der gegebenen Gleichungen und
Unbekannten auch noch so groß sein.
Im Übrigen ist es durchaus interessant, lineare Gleichungs-
systeme allgemeiner über Integritätsbereiche oder Ringe
(Kapitel 3, Seite 85) zu betrachten. So kann man z. B. nur die
ganzzahligen Lösungen eines linearen Gleichungssystems
5.1 Erste Lösungsversuche mit lauter ganzzahligen Koeffizienten suchen. Derartige
Gleichungen oder Gleichungssysteme heißen diophantisch.
Wir beginnen dieses Kapitel mit der Behandlung reeller li- Dies erfordert allerdings ganz andere Lösungsmethoden, und
nearer Gleichungssysteme und begnügen uns vorerst mit deshalb beschränken wir uns doch auf den Fall, in dem die
einer etwas lockeren Beschreibung dessen, was man darunter Koeffizienten der linearen Gleichungen und die l1 , . . . , ln
versteht. Die exakte Definition derartiger Systeme folgt im einem kommutativen Körper angehören.
Abschnitt 5.2.
Es ist nicht Aufgabe dieses Kapitels zu erklären, wie man
Der Begriff Gleichungssystem besagt, dass es sich um meh- auf ein lineares Gleichungssystem kommt, sondern wie man
rere Gleichungen in mehreren Unbekannten handelt. Die dessen Lösungsmenge bestimmt. Zwischendurch wollen wir
Linearität eines solchen Systems bedeutet, dass die Unbe- aber doch demonstrieren, welche Probleme auf ein lineares
kannten in den Gleichungen des Systems nur in erster Potenz Gleichungssystem führen und auf diese Weise gelöst wer-
auftreten und nicht etwa in trigonometrischen Funktionen den können. So folgt anschließend eine einfache geometri-
eingebunden sind. Reell weist darauf hin, dass die Koeffi- sche Frage, die man vielleicht sogar im Kopf lösen könnte.
zienten der Unbekannten in den Gleichungen reelle Zahlen Eine umfangreichere Anwendungsaufgabe zu linearen Glei-
sind, und wir auch die Lösungen unter den reellen Zahlen chungssystemen ist auf Seite 183 zu finden.
suchen. Es wird aber bald klar werden, dass all die Manipu-
lationen, die wir an den reellen linearen Gleichungssystemen Beispiel Hier geht es um ein geometrisches Problem: Ab-
vornehmen, um die Lösung zu finden, auch bei beliebigen bildung 5.1 zeigt, wie sich die Ebene mit kongruenten fünf-
kommutativen Körpern funktionieren. eckigen Bausteinen, welche die Form einer stilisierten Krone
5.1 Erste Lösungsversuche 167
haben, lückenlos ausfüllen lässt. Man kann nämlich mit die- Ein reelles lineares Gleichungssystem hat
sen Fünfecken zunächst ein einzelnes Sechseck füllen und entweder keine, genau eine oder unendlich
dann mit Kopien dieses gefüllten Sechsecks die ganze Ebene viele Lösungen
pflastern.
Lineare Gleichungssysteme müssen nicht immer eine Lösung
besitzen. Betrachten wir etwa das System der zwei Gleichun-
x2 gen
x1 − x2 = 1
x1 x1 − x2 = 0
die zum 5-Fachen der dritten Gleichung des Systems im Reelle Gleichungssysteme mit zwei oder drei
Widerspruch steht, denn Unbekannten lassen sich geometrisch
interpretieren
10 x1 + 5 x2 − 10 x3 = 30 = 0 .
Eine geometrische Veranschaulichung der Gleichungssys-
Also gilt auch in diesem Fall L = ∅ .
teme wird die Ursache der in den bisherigen Beispielen auf-
Wenn wir diesem Gleichungssystem mit lauter ganzzah- getretenen Phänomene verdeutlichen.
ligen Koeffizienten anstelle des Körpers R den Körper
Z5 der Restklassen modulo 5 zugrunde legen, dann ist es Wir interpretieren die Zahlenpaare (l1 , l2 ) bzw. Zahlentripel
überraschenderweise doch lösbar. (l1 , l2 , l3 ) als Koordinaten von Punkten in der Ebene bzw.
im Raum. Dann stellen die Lösungen einer einzelnen linearen
Um den Wechsel zu Z5 zu verdeutlichen, verwenden wir Gleichung
nicht die Bezeichnungen 0, . . . , 4 der Elemente von Z5 , a1 x1 + a2 x2 = b
sondern wir schreiben jede Gleichung als Kongruenzglei-
chung modulo 5 : mit reellen a1 , a2 , b die Punkte einer Geraden in der Ebene
dar, sofern nicht beide Koeffizienten a1 und a2 null sind. Ana-
x1 + 2 x2 − 2 x3 ≡ 0 (mod 5) log bilden die Lösungen (l1 , l2 , l3 ) einer linearen Gleichung
6 x1 − 3 x2 − 2 x3 ≡ 0 (mod 5) der Form
a1 x1 + a2 x2 + a3 x = b
2 x1 + x2 − 2 x3 ≡ 6 (mod 5)
mit reellen a1 , a2 , a3 , b die Punkte einer Ebene im Raum.
Offensichtlich ist in Z5 die zweite Gleichung identisch mit Auch hier dürfen nicht alle Koeffizienten a1 , a2 , a3 gleich-
der ersten, denn 6 ≡ 1 (mod 5) und 2 ≡ −3 (mod 5) . zeitig null sein.
Damit bleiben nur zwei Kongruenzgleichungen übrig,
nämlich ?
Was sind die Lösungsmengen, wenn die Koeffizienten a1 , a2
x1 + 2 x2 − 2 x3 ≡ 0 (mod 5) bzw. a1 , a2 , a3 alle zugleich null sind?
2 x1 + x2 − 2 x3 ≡ 6 (mod 5)
Die Differenz der beiden ergibt Ein System von reellen linearen Gleichungen in zwei bzw.
drei Unbekannten zu lösen bedeutet demnach bei dieser geo-
x1 − x2 ≡ 1 (mod 5) . metrischen Interpretation, den mengenmäßigen Durchschnitt
der zugehörigen Geraden bzw. Ebenen zu bestimmen.
Wir können deshalb x1 ≡ x2 + 1 (mod 5) setzen und Die zwei Gleichungen des Systems
damit aus einer der Gleichungen das x3 ermitteln:
x1 + x2 = 1 (⇔ x2 = −x1 + 1)
2 x 3 ≡ x 1 + 2 x2 ≡ 3 x 2 + 1 (mod 5) . 2 x1 − x2 = 5 (⇔ x2 = 2 x1 − 5)
Wegen 2−1 ≡ 3 (mod 5) (siehe Kapitel 3, Seite 81) folgt ergeben zwei einander schneidende Geraden (Abb. 5.2). Die
x3 ≡ 3+4 x2 (mod 5), wobei x2 beliebig aus Z5 wählbar Lösung entspricht dem Schnittpunkt.
ist. Wir können somit die Lösungsmenge darstellen als
x2
L = {(1 + t, t, 3 − t) | t ∈ Z5 }.
g1
Dieses Beispiel zeigt, wie wichtig es ist, bei der Frage g2
nach der Lösungsmenge immer auch anzugeben, welcher
Körper zugrunde gelegt wird.
Systeme von Kongruenzgleichungen, in denen der Rest- x1
klassenkörper von Gleichung zu Gleichung variiert, gelten L
nicht als lineare Gleichungssysteme, denn sie erfordern
ganz andere Lösungsmethoden.
Abbildung 5.2 Die einzige Lösung entspricht dem Schnittpunkt der beiden
? Geraden.
1) Hat ein reelles System mit mehr Unbekannten als Glei-
chungen stets unendlich viele Lösungen in R ? Im Beispiel
2) Ist ein System mit mehr Gleichungen als Unbekannten
x1 + x2 = 1 (⇔ x2 = −x1 + 1)
immer unlösbar?
2 x1 + 2 x2 = 5 (⇔ x2 = −x1 + 5/2)
170 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra
liegen zwei parallele Geraden vor (Abb. 5.3). Daher ist die x3
Lösungsmenge leer.
x2
g2
3
1
x1 2
g1
x2
Abbildung 5.3 Sind die beiden Geraden parallel und verschieden, so ist die x1
Lösungsmenge leer.
Die dritte Gleichung des Systems Abbildung 5.5 Die Lösungsmenge ist leer; die Schnittgeraden zwischen je zwei
der drei Ebenen 1 , 2 , 3 sind parallel.
x1 + x2 = 1 (⇔ x2 = −x1 + 1)
2 x1 − x2 = 5 (⇔ x2 = 2 x1 − 5) oder überhaupt die Lösbarkeit festzustellen. Und dann ist
vielleicht nicht immer klar, welche Gleichung heranzuzie-
−x1 − 4 x2 = 2 (⇔ x2 = − 41 x1 − 1
2) hen ist.
ist eine Folgegleichung der ersten beiden Gleichungen und Ähnlich ist es beim Verfahren des Gleichsetzens, wenn man
stellt daher eine weitere Gerade durch den Schnittpunkt der aus zwei Gleichungen dieselbe Unbekannte ausrechnet und
ersten beiden Geraden dar (Abb. 5.4). diese Ausdrücke gleichsetzt. Letztlich bedeuten Substituie-
rung und Gleichsetzen die Elimination einer Unbekannten,
x2 zunächst einmal aus zwei Gleichungen. Wie geht man vor,
g2 wenn noch weitere Gleichungen vorliegen?
g1
Wir wollen nun ein systematisches Vorgehen beschreiben, ein
Verfahren, das uns auf sicherem Wege zeigt, ob ein gegebenes
lineares Gleichungssystem lösbar ist, und uns im Fall der
Lösbarkeit dann auch gleich die Lösungsmenge liefert. Um
g3 x1 unser Vorgehen zu motivieren, betrachten wir die folgenden
L speziellen linearen Gleichungssysteme.
Die gegebenen Gleichungen des Systems Gewisse Bauformen linearer Gleichungssysteme machen das
Auffinden der Lösungen besonders einfach, wie die beiden
x1 + 2 x2 − x3 = 0 folgenden Beispiele beweisen. Dabei spielt keine Rolle, ob
6 x1 − 3 x2 − x3 = 0 wir in R oder in einem anderen Körper K rechnen.
2 x1 + x2 − x3 = 6
Beispiel
Das Gleichungssystem
bestimmen drei Ebenen ohne gemeinsamen Punkt, denn die
Schnittgerade der ersten beiden Ebenen verläuft parallel zur x1 + x2 − x3 = 0
dritten Ebene. Die Abbildung 5.5 illustriert dies.
2 x2 − x 3 = 1
Das bisher benutzte Substitutionsverfahren, das natürlich x3 = 3
auch bei mehr als zwei Unbekannten schrittweise einge-
setzt werden kann, erweist sich nicht immer als sinnvoll: hat Stufenform . Die Anzahl der auftretenden Unbekann-
Der Ablauf des Rechenverfahrens ist nicht klar genug ge- ten wird von Gleichung zu Gleichung kleiner.
regelt; manchmal muss man am Ende wieder zu früheren Wir lösen dieses System durch Rückwärtseinsetzen, d. h.,
Gleichungen zurückkehren, um zu einer Lösung zu kommen wir setzen den durch die letzte Gleichung bestimmten
5.1 Erste Lösungsversuche 171
Hintergrund und Ausblick: Näherungslösung für ein nicht lösbares lineares Gleichungssystem
Die Lösungsmenge des linearen Gleichungssystems
x1 + x2 = 1
2 x1 − x2 = 5
3 x1 + x2 = 4
ist leer (siehe Beispiele auf Seite 168). Angenommen, die Absolutwerte auf der rechten Seite sind die Ergebnisse von
Messungen und daher fehlerbehaftet. Dann könnte man aus dem Blickpunkt eines Anwenders fragen: Wenn es keine exakte
Lösung gibt, gibt es dann vielleicht doch eine, welche alle Gleichungen wenigstens annähernd erfüllt? Gibt es eine, bei
welcher die Abweichungen von den auf den rechten Seiten vorgegebenen Werten insgesamt minimal sind? Dass sich diese
Minimalitätsforderung mathematisch klar formulieren lässt, wird später in den Kapiteln 17 und 18 gezeigt.
Wert 3 von x3 in der vorletzten Gleichung ein und erhalten a11 x1 + a12 x2 + · · · + a1n xn = b1
für x2 a21 x1 + a22 x2 + · · · + a2n xn = b2
.. .. .. ..
2 x2 − 3 = 1 ⇒ x2 = 2 . . . .
am1 x1 + am2 x2 + · · · + amn xn = bm
und schließlich aus der ersten Gleichung für x1
Dabei sind die Koeffizienten aij und die Absolutglieder
x1 + 2 − 3 = 0 ⇒ x1 = 1 . bi für 1 ≤ i ≤ m und 1 ≤ j ≤ n Elemente des Kör-
pers K.
Damit lautet die Lösungsmenge L = {(1, 2, 3)}.
Ein n-Tupel (l1 , l2 , . . . , ln ) ∈ Kn heißt eine Lösung
Noch einfacher wird das Auffinden der Lösung bei einem
dieses Systems, wenn alle Gleichungen durch Einsetzen
System in reduzierter Stufenform. Hier treten die ersten
von l1 , . . . , ln anstelle von x1 , . . . , xn befriedigt wer-
Unbekannten jeweils in nur einer Gleichung auf, im fol-
den. Die Menge L aller Lösungen des Systems heißt
genden Beispiel sogar mit dem Koeffizienten 1 :
Lösungsmenge . Ist L leer, so heißt das Gleichungs-
system unlösbar.
x1 + x4 − x5 = 4
x2 − 2 x4 + 3 x5 = 6
x3 + 3 x4 − 2 x5 = 3 Wir werden im Folgenden stets die Kommutativität von K
voraussetzen, ohne dies noch extra zu erwähnen.
Wir können x1 , x2 und x3 unmittelbar durch x4 und x5
ausdrücken und damit alle Gleichungen befriedigen, egal
was für x4 und x5 eingesetzt wird. Daher können wir zur Mit elementaren Zeilenoperationen bringt
Beschreibung der Lösungsmenge die Unbekannten x4 und
man ein lineares Gleichungssystem auf
x5 durch Zahlen t1 bzw. t2 aus dem zugrunde liegenden
Körper K ersetzen. Dies führt auf eine Parameterdarstel-
Stufenform
lung der diesmal zweidimensionalen Lösungsmenge
Nun lernen wir eine Methode kennen, die auch vielen com-
L = {(4 − t1 + t2 , 6 + 2 t1 − 3 t2 , 3 − 3 t1 + 2 t2 , t1 , t2 ) putergestützten Verfahren zugrunde liegt und auf übersicht-
| t1 , t2 ∈ K}. liche und effiziente Weise zur Lösungsmenge eines linearen
Gleichungssystems führt.
Wegen dieses recht einfachen Vorgehens beim Lösen von Die Strategie lässt sich wie folgt kurz beschreiben: Es
Gleichungssystemen in Stufen- bzw. reduzierter Stufenform wird wiederholt jeweils eine Gleichung des Systems durch
ist es naheliegend, bei beliebigen linearen Gleichungssyste- eine Folgegleichung ersetzt, bis schließlich das Gleichungs-
men die folgende Strategie zu verfolgen: system Stufenform annimmt. Spätestens an der Stufenform
kann die Frage nach der Lösbarkeit beantwortet werden. Ist
Wir bringen das System zunächst durch Umformungen auf das System lösbar, so lässt sich die Lösungsmenge durch
Stufen- bzw. reduzierte Stufenform und lesen dann die Lö- Rückwärtseinsetzen bestimmen (Eliminationsverfahren von
sung fast unmittelbar ab. Wir müssen allerdings darauf ach- Gauß) oder nach einer weiteren Umformung des Systems di-
ten, dass bei den einzelnen Umformungen die Lösungsmenge rekt von der reduzierten Stufenform ablesen (Eliminations-
nicht verändert wird. Daher beschränken wir uns strikt auf die verfahren von Gauß und Jordan).
sogenannten elementaren Zeilenumformungen. Details dazu
folgen im nächsten Abschnitt. Der Ersatz einer Gleichung durch eine Folgegleichung des
bisherigen Systems muss allerdings wohlüberlegt erfolgen:
Die Lösungsmenge muss unverändert bleiben, es darf keine
5.2 Das Lösungsverfahren von Information verloren gehen. Wir erreichen dieses Ziel, indem
wir die Umformungen, die zu Folgegleichungen führen, stark
Gauß und Jordan einschränken.
Wir haben schon einige reelle lineare Gleichungssysteme an- Definition der elementaren Zeilenumformungen
gegeben und auch gelöst. Dabei haben wir noch gar nicht ge-
Die folgenden, auf die einzelnen Gleichungen eines
klärt, was wir eigentlich genau unter einem solchen System
linearen Gleichungssystems anwendbaren Operationen
verstehen. Wir wollen dies nun nachholen:
heißen elementare Zeilenumformungen:
1. Zwei Gleichungen werden vertauscht.
Definition linearer Gleichungssysteme 2. Eine Gleichung wird mit einem Faktor λ ∈ K \ {0}
Ein lineares Gleichungssystem über dem kommutati- multipliziert, also vervielfacht.
ven Körper K mit m Gleichungen in n Unbekannten 3. Zu einer Gleichung wird das λ-Fache einer anderen
x1 , . . . , xn lässt sich in folgender Form schreiben: Gleichung addiert, wobei λ ∈ K.
5.2 Das Lösungsverfahren von Gauß und Jordan 173
Kommentar: Bei der Vervielfachung in Typ 2 ist λ = 0 zur ausgewählten Gleichung addiert worden, so muss umge-
ausgeschlossen, denn sonst entstünde eine Nullzeile, d. h. kehrt vom Ergebnis das λ-Fache der inzwischen unverändert
eine Zeile, in welcher alle Koeffizienten und das Absolut- gebliebenen anderen Gleichung wieder subtrahiert werden,
glied null sind. Da jedes n-Tupel aus Kn eine Nullzeile befrie- um zur Ausgangsgleichung zurückzukehren.
digt, würde diese Vervielfachung die Lösungsmenge einer & gleich (siehe
Somit sind die beiden Lösungsmengen L und L
ursprünglich von der Nullzeile verschiedenen Gleichung ver-
Mengengleichheit in Kapitel 2).
ändern. Hingegen ist λ = 0 bei Typ 3 zugelassen, aber das
System bleibt dann unverändert.
Achtung: Das folgende Vorgehen ist nicht zulässig: Ad-
Die Zeilenvertauschung im Umformungstyp 1 ist auch durch
diere zur ersten Zeile die zweite Zeile und zur zweiten Zeile
geschicktes Anwenden der Typen 2 und 3 erreichbar. Wir
die erste Zeile. Und addiere dann zur neuen zweiten Zeile
haben dies als Übungsaufgabe gestellt. Demnach könnte man
das (−1)-Fache der neuen ersten Zeile. Damit entsteht eine
in der Definition bereits mit nur zwei Typen auskommen.
Nullzeile, d. h. eine Zeile mit lauter Nullen.
Mithilfe dieser elementaren Zeilenumformungen gelingt es Wenn z1 , . . . , zm die einzelnen Gleichungen des Systems
nun, lineare Gleichungssysteme zu vereinfachen, indem ein- bezeichnen und 0 eine Nullzeile bedeutet, so könnte diese
zelne Koeffizienten null werden, ohne dass sich die Lösungs- „verbotene“ Zeilenumformung folgendermaßen dargestellt
menge des Systems ändert. Zwei Gleichungssysteme mit der- werden:
selben Lösungsmenge heißen übrigens zueinander äquiva- ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
z1 z1 + z2 z1 + z 2
lent. ⎜z2 ⎟ 1. Schritt ⎜z2 + z1 ⎟ 2. Schritt ⎜ 0 ⎟
⎝ ⎠ −→ ⎝ ⎠ −→ ⎝ ⎠
.. .. ..
. . .
Elementare Zeilenumformungen ändern die
Lösungsmenge nicht Offensichtlich ist bei diesen zwei Schritten Information ver-
loren gegangen. Anstelle der früher zwei Gleichungen z1
Wir formulieren sogleich das zentrale Ergebnis dieses Ab- und z2 gibt es jetzt nur mehr eine, und zwar die Summe
schnitts. z1 + z2 .
Somit ist die Lösungsmenge L des gegebenen Gleichungs- waren nur die Koeffizienten in den Gleichungen ausschlag-
& des umgeform-
systems eine Teilmenge der Lösungsmenge L gebend. Die xi dienten nur als Platzanweiser. Fehlt in einer
ten Systems. Gleichung das xi , so ist der zugehörige Koeffizient von xi
& ⊂ L, d. h., jede Lösung natürlich null.
Es gilt aber auch die Umkehrung L
des umgeformten Systems löst auch das ursprüngliche. Als Wir sparen Schreibarbeit, wenn wir das angegebene lineare
Begründung genügt es zu erkennen, dass die Umkehrope- Gleichungssystem in folgender Art und Weise notieren:
ration einer elementaren Zeilenumformung wiederum eine ⎛ ⎞
von derselben Art ist: (1) Bei der Zeilenvertauschung ist das 0 0 1 3 3 2
trivial. (2) Anstelle der Multiplikation einer Gleichung mit ⎜1 2 1 4 3 3⎟
⎜ ⎟
λ = 0 ist bei der Umkehrung mit 1/λ zu multiplizieren. (3) ⎝1 2 2 7 6 5⎠
Ist schließlich vorher das λ-Fache einer anderen Gleichung 2 4 1 5 3 4
174 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra
Problemanalyse und Strategie: Wir kümmern uns zuerst um x1 : Mit elementaren Zeilenumformungen sorgen wir
dafür, dass x1 nur noch in einer, und zwar der dann ersten Zeile auftaucht. Dies gelingt folgendermaßen:
(1) Vertausche die erste mit der zweiten Zeile.
(2) Addiere zur dritten Zeile das (−1)-Fache der neuen ersten Zeile.
(3) Addiere zur vierten Zeile das (−2)-Fache der neuen ersten Zeile.
So verfahren wir nach und nach mit allen Variablen, um am Ende die gewünschte reduzierte Stufenform zu erreichen.
Lösung: Damit endet bereits das Verfahren, denn wir haben die
Zu x1 : reduzierte Stufenform erreicht.
x3 + 3 x4 + 3 x5 = 2 Die letzten beiden Zeilen mit den Nullen auf der linken
x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3 Seite sind besonders wichtig für die Entscheidung, ob un-
→ ser Gleichungssystem lösbar ist oder nicht:
x1 + 2 x2 + 2 x3 + 7 x4 + 6 x5 = 5
2 x1 + 4 x2 + x3 + 5 x4 + 3 x5 = 4
Fall (a) Sind auch die jeweiligen Absolutglieder so wie hier
x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3 gleich null, so können diese restlichen Gleichungen weg-
x3 + 3 x4 + 3 x5 = 2 gelassen werden, denn sie schränken die Lösungsmenge
x3 + 3 x4 + 3 x5 = 2 in keiner Weise ein.
− x3 − 3 x4 − 3 x5 = −2
Zu x2 : Wir stellen fest, dass hier nichts weiter zu erledigen Fall (b) Verbliebe hingegen in einer derartigen Zeile rechts
ist, da x2 nur in der ersten Zeile auftaucht. noch ein Absolutglied = 0, so bestünde ein Widerspruch,
Zu x3 : (1) Zur ersten Zeile addieren wir das (−1)-Fache der nicht beseitigbar wäre, was auch immer für x1 , . . . , x5
der zweiten Zeile; also, wir subtrahieren die zweite Zeile eingesetzt würde. Das Gleichungssystem wäre unlösbar.
von der ersten. (2) Wir ziehen die zweite Zeile auch von
der dritten Zeile ab. (3) Schließlich addieren wir die zweite Das zum Ausgangssystem äquivalente Gleichungssystem
Zeile zur vierten Zeile: in reduzierter Stufenform lautet somit:
x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3
x3 + 3 x4 + 3 x5 = 2 x1 + 2 x2 + x4 = 1
→
x3 + 3 x4 + 3 x5 = 2 x3 + 3 x4 + 3 x5 = 2
− x3 − 3 x4 − 3 x5 = −2
x1 + 2 x2 + x4 = 1 Es ist lösbar. Zu jeder Wahl von x2 , x4 und x5 kön-
x3 + 3 x4 + 3 x5 = 2 nen wir x1 und x3 derart angeben, dass beide Gleichun-
0 = 0 gen erfüllt sind. Die Lösungsmenge lautet also: L =
0 = 0 {(1−2 t1 −t2 , t1 , 2−3 t2 −3 t3 , t2 , t3 ) | t1 , t2 , t3 ∈ R}.
Am Schnittpunkt der i-ten Zeile, i ∈ {1, . . . , m}, und j -ten soll uns an die dort befindlichen Gleichheitszeichen erinnern.
Spalte, j ∈ {1, . . . , n}, steht der Koeffizient aij von xj in Rechts davon stehen nur mehr die Absolutglieder des Sys-
der i-ten Gleichung. Diesen Schnittpunkt der (horizontalen) tems. Nun ist auch klar, warum wir schon bisher anstelle von
i-ten Zeile und der (vertikalen) j -ten Spalte nennen wir auch Gleichungen auch von Zeilen und insbesondere von Nullzei-
die Stelle (i, j ). Der vertikale Strich vor der letzten Spalte len gesprochen haben.
5.2 Das Lösungsverfahren von Gauß und Jordan 175
Mit dieser Schreibweise lauten die im Beispiel auf Seite 174 a11 x1 + a12 x2 + · · · + a1n xn = b1
durchgeführten Umformungen wie folgt: a21 x1 + a22 x2 + · · · + a2n xn = b2
.. .. .. ..
⎛ ⎞ . . . .
0 0 1 3 3 2
⎜ 1 am1 x1 + am2 x2 + · · · + amn xn = bm
⎜ 2 1 4 3 3 ⎟
⎟ Typ 1 bzw. 3
⎝ 1 −→
2 2 7 6 5 ⎠ z 1 ↔ z2 mit aij und bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Wir sagen:
2 4 1 5 3 4 z 3 → z3 − z 2 Zu diesem linearen Gleichungssystem gehören die Koeffi-
z 4 → z 4 − 2 z2
⎛ ⎞ zientenmatrix
1 2 1 4 3 3 ⎛ ⎞
a11 a12 · · · a1n
⎜ 0 0 1 3 3 2 ⎟
⎜ ⎟ Typ 3
−→ ⎜ a21 a22 · · · a2n ⎟
⎝ 0 2 ⎠ ⎜ ⎟
0 1 3 3 z 1 → z1 − z 2 A=⎜ . .. . ⎟
0 0 −1 −3 −3 −2 z 3 → z3 − z 2 ⎝ .. . · · · .. ⎠
z4 → z4 + z2
⎛ ⎞ am1 am2 · · · amn
1 2 0 1 0 1
⎜ 0 0 1 3 3 2 ⎟ und die erweiterte Koeffizientenmatrix
⎜ ⎟ ⎛ ⎞
⎝ 0 0 0 0 0 0 ⎠ a11 a12 · · · a1n b1
0 0 0 0 0 0 ⎜ a21 a22 · · · a2n b2 ⎟
⎜ ⎟
(A | b) = ⎜ . .. . .. ⎟
⎝ .. . · · · .. . ⎠
Wenn wir das letzte Schema nach Weglassung der beiden
am1 am2 · · · amn bm
Nullzeilen wieder in Gleichungsform ausdrücken, so erhalten
wir genau das letzte Gleichungssystem aus der Beispielbox Aus der erweiterten Koeffizientenmatrix erhalten wir eindeu-
von Seite 174: tig das zugehörige Gleichungssystem wieder zurück. Also ist
jede Information über das Gleichungssystem in der zugehö-
x1 + 2 x2 + x4 = 1 rigen erweiterten Koeffizientenmatrix enthalten.
x3 + 3 x4 + 3 x5 = 2
Allgemein heißt jedes rechteckige Schema von Zahlen aus
Wir erläutern das prinzipielle Vorgehen noch einmal in Wor- einem Körper K eine Matrix. Umfasst diese ebenso wie die
ten: obige Koeffizientenmatrix m ≥ 1 Zeilen und n ≥ 1 Spalten,
so sprechen wir von einer m × n -Matrix. Die Menge aller
1. Schritt: Wir wählen aus der ersten Spalte die rot gedruckte 1 m × n -Matrizen über K wird mit Km×n bezeichnet. In die-
aus und tauschen die zugehörige Gleichung in die erste Zeile. sem Sinn gehört die erweiterte Koeffizientenmatrix (A | b) zu
Mithilfe dieser rot gedruckten 1 werden alle anderen, von Km×(n+1) . Die Elemente einer Matrix heißen auch Einträge.
null verschiedenen Zahlen der ersten Spalte zu null gemacht.
Die nur eine Zeile oder eine Spalte umfassenden Matrizen
Da diese Zahlen Koeffizienten von Unbekannten sind, die
werden auch Zeilen- bzw. Spaltenvektoren genannt. Ob-
dann wegfallen, können wir auch sagen, wir eliminieren diese
wohl erst im Kapitel 6 anhand der Vektorraumaxiome genau
Unbekannten mittels elementarer Zeilenumformungen.
erklärt wird, was ein Vektor ist, wollen wir diese Sprechweise
2. Schritt: Nachdem in der zweiten Spalte ab Zeile 2 kein von doch schon jetzt benutzen und eine Lösung (l1 , . . . , ln ) unse-
null verschiedener Eintrag vorkommt, gehen wir zur dritten res Gleichungssystems auch einen Lösungsvektor nennen.
Spalte weiter. Wir wählen die rot gedruckte 1 an der Stelle Wir verwenden dafür das fettgedruckte l als Symbol. Ebenso
(2, 3) aus und eliminieren damit alle anderen Einträge in die- können wir x als Vektor der Unbekannten (x1 , . . . , xn ) ein-
ser dritten Spalte durch elementare Zeilenumformungen. An führen und das gegebene lineare Gleichungssystem in der
den ersten beiden Spalten hat sich durch diese Zeilenumfor- Kurzform A x = b schreiben.
mungen nichts mehr geändert.
Hier sollte man sich allerdings x als Spaltenvektor vorstel-
len, denn hinter dieser Kurzschreibweise verbirgt sich ein
? Sonderfall der im Kapitel 12 ausführlich erklärten Matrizen-
Was hätten wir tun können, wenn wir an der Stelle (2, 3) multiplikation:
keine 1 zur Verfügung gehabt hätten? ⎛ ⎞
⎛ ⎞ x
a11 a12 · · · a1n ⎜ 1 ⎟
⎜ a21 a22 · · · a2n ⎟ ⎜ x2 ⎟
⎜ ⎟⎜ ⎟
Ax = ⎜ . .. .. ⎟ ⎜ .. ⎟
⎝ .. . ··· . ⎠⎜ ⎟
⎝ . ⎠
Die erweiterte Koeffizientenmatrix ist eine am1 am2 · · · amn
xn
komfortable Darstellung des linearen ⎛ ⎞
a11 x1 + a12 x2 + · · · + a1n xn
Gleichungssystems ⎜ a21 x1 + a22 x2 + · · · + a2n xn ⎟
⎜ ⎟
=⎜ ⎜ .. ⎟
⎟
Wir betrachten wieder ein allgemeines lineares Gleichungs- ⎝ . ⎠
system: am1 x1 + am2 x2 + · · · + amn xn
176 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra
Wenn wir zwei gleichartige Matrizen A und C genau dann der Zeilenvektoren von A. Egal, auf welchem Weg wir zur
als gleich erklären, wenn an jeder Stelle (i, j ) die jeweiligen Zeilenstufenform der Matrix A gelangen, es bleiben stets
Einträge aij und cij übereinstimmen, so fasst unsere Matri- rg A Nichtnullzeilen übrig. Diese Eindeutigkeit setzen wir
zengleichung im Folgenden bereits voraus.
Ax = b
genau die m linearen Gleichungen in den n Unbekannten
zusammen: Der m-zeilige Vektor der Summen auf den linken Das Verfahren von Gauß und Jordan ist ein
Seiten des linearen Gleichungssystems wird dem Vektor b der zuverlässiger Weg zur Lösung
Absolutglieder gleichgesetzt.
Wir unterscheiden zwei Eliminationsverfahren zur Lösung
Gemäß unserer Lösungsstrategie wenden wir uns der Auf- linearer Gleichungssysteme: Das Verfahren von Gauß und
gabe zu nachzuweisen, dass sich jede nicht nur aus Nullen das Verfahren von Gauß und Jordan. Tatsächlich waren diese
bestehende Koeffizientenmatrix A mithilfe elementarer Zei- Verfahren schon lange Zeit vor Gauß und Jordan bekannt,
lenumformungen auf Stufenform bringen lässt, genauer auf aber diese Bezeichnung haben sich etabliert, und auch wir
Zeilenstufenform: wollen davon nicht abrücken.
⎛ ⎞ ⎫ Beim Verfahren von Gauß wird die erweiterte Koeffizienten-
f1 ⎪
⎜ f2 ∗ ∗ ⎟ ⎪
⎪ matrix auf Zeilenstufenform gebracht, also auf die Form
⎜ ⎟ ⎪
⎪
⎜ ⎪
⎪
⎜ f3 ∗ ⎟
⎟ ⎬ ⎛ ⎞
⎜ ⎟ r f1
⎜ ⎟ ⎪ ⎜ f2 ∗ ∗ ⎟
⎜ .. ⎟ ⎪
⎪ ⎜ ⎟
⎜ ⎟ ⎪
⎪ ⎜
⎜ 0 . ⎟ ⎪
⎪ ⎜ f3 ∗ ⎟
⎟
⎜ fr ⎟ ⎭ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎝ 0 ⎠ ⎜ .. ⎟
⎜ 0 . ⎟
⎜ ⎟
⎜ fr ⎟
⎜ ⎟
⎝ 0 ⎠
Dabei bezeichnen f1 , . . . , fr die in den Zeilen jeweils ersten,
von 0 verschiedenen Einträge, die führenden Einträge oder
Pivotelemente. Kennzeichnend für die Zeilenstufenform ist, Die führenden Einträge f1 , . . . , fr sind von Null verschie-
dass beim Durchlaufen der Zeilen von oben nach unten nach den; davor und darunter gibt es nur Nullen. Darüber stehen
jeder Zeile der führende Eintrag um mindestens eine Spalte beliebige Einträge; diese sind durch ∗ markiert. Nullspalten
nach rechts rückt. Gibt es Nullzeilen, so stehen diese ganz sind bereits weggelassen worden.
unten.
Liegt fi+1 um k Spalten rechts von fi bei k ≥ 1, so bildet Eliminationsverfahren von Gauß
fi zusammen mit den k − 1 rechts anschließenden Einträ-
Dieses Eliminationsverfahren zur Lösung des linearen
gen eine Stufe der Länge k. Die verstreuten Nullen in der
Gleichungssystems (A | b) besteht aus
obigen Matrix sollen andeuten, dass unter den Stufen, also
1. der Umformung auf Zeilenstufenform,
unter der markierten Linie, nur Nullen auftreten. Die durch
2. der Lösbarkeitsentscheidung und
∗ markierten Einträge sind beliebig.
3. dem Rückwärtseinsetzen zur Bestimmung der Lö-
Wir haben eventuell vorhandene Nullspalten bereits wegge- sungsmenge des Systems.
lassen. Sie bedeuten, dass eine Unbekannte xj überhaupt
nicht in den Gleichungen erscheint und daher in der Lösungs- Beim Verfahren von Gauß und Jordan wird die erweiterte Ko-
menge das xj einen frei wählbaren Parameter darstellt. effizientenmatrix auf reduzierte Zeilenstufenform gebracht,
also auf die Form
? ⎛ ⎞
Wodurch unterscheidet sich die Zeilenstufenform zu dem f1 0
Gleichungssystem auf Seite 174 von jener auf Seite 172 ? ⎜ f2 ∗ 0 ⎟
⎜ ⎟
Wie könnte eine „Spaltenstufenform“ aussehen? ⎜ f 0 ⎟
⎜ 3 ⎟
⎜ ⎟
⎜ ⎟
⎜ . ⎟
⎜ 0 . . ⎟
Unterhalb der Stufen gibt es nur Nullzeilen. Wir nennen die ⎜ ⎟
Anzahl r der Stufen, also die Anzahl der Nichtnullzeilen der
⎜
⎜ fr ⎟
⎟
⎝ 0 ⎠
Matrix in Zeilenstufenform, den Rang von A und verwenden
dafür das Zeichen rg A.
Im Kapitel 6 werden wir erkennen, dass diese Zahl r durch Wie vorhin sind für i = 1, . . . , r die führenden fi = 0 , und
A eindeutig bestimmt ist, nämlich als Dimension der Hülle davor und darunter gibt es nur Nullen. Diesmal werden aber
5.2 Das Lösungsverfahren von Gauß und Jordan 177
auch über den Stufen mittels elementarer Zeilenumformun- Wir geben wieder das zugehörige, zu (5.1) äquivalente
gen möglichst viele Nullen erzeugt, auf jeden Fall über den Gleichungssystem explizit an:
fi . Durch geeignete Multiplikation der Zeilen könnte auch
f1 = · · · = fr = 1 erreicht werden. x1 = 18/7
x2 = −1/7
Eliminationsverfahren von Gauß und Jordan Bei dieser reduzierten Zeilenstufenform ist die Lösung
Dieses Eliminationsverfahren zur Lösung des linearen direkt ablesbar.
Gleichungssystem (A | b) besteht aus
1. der Umformung auf Zeilenstufenform, Kommentar:
2. der Lösbarkeitsentscheidung und – Natürlich führen beide Eliminationsverfahren zur glei-
3. der Reduktion mittels weiterer elementarer Zeilen- chen Lösung. Tatsächlich aber schleichen sich umso
umformungen auf reduzierte Zeilenstufenform und mehr Rechenfehler ein, je mehr elementare Zeilenum-
dem Ablesen der Lösung. formungen durchgeführt werden. Die Erfahrung zeigt,
dass man am besten das Eliminationsverfahren von
Bevor wir die uneingeschränkte Wirksamkeit dieser Verfah- Gauß anwendet und dann von Fall zu Fall entscheidet,
ren beweisen, üben wir sie an einigen einfachen Beispielen ob man oberhalb der Stufen noch die eine oder andere
ein. Null erzeugt. Meistens lohnt es sich nicht, das Verfahren
von Gauß und Jordan bis zum Ende durchzuexerzieren,
Beispiel denn die Lösung ist oftmals viel früher zu erkennen.
Wir bestimmen die Lösungsmenge des folgenden reellen – Für den Anfänger ist es nützlich, nach Durchführung
linearen Gleichungssystems: des Verfahrens von Gauß das zugehörige äquivalente
Gleichungssystem noch einmal explizit anzuschreiben.
x1 + 4 x2 = 2 Wir haben das bisher ebenfalls gemacht. In Zukunft
(5.1)
3 x1 + 5 x2 = 7 werden wir das mehr und mehr meiden, weil ja in der er-
Die erweiterte Koeffizientenmatrix ist weiterten Koeffizientenmatrix alle wesentlichen Infor-
' ( mationen über das zugehörige Gleichungssystem ent-
1 4 2 halten sind.
3 5 7
Wir wählen in der ersten Spalte die 1 an der Stelle (1, 1) Wir bestimmen die Lösungsmenge des folgenden reellen
und beginnen mit linearen Gleichungssystems:
' ( ' (
1 4 2 1 4 2 2 x1 + 4 x2 = 2
−→ 3 x1 + 6 x2 = 3
3 5 7 z2 → z2 −3 z1 0 −7 1
5 x1 + 10 x2 = 5
Die Matrix hat bereits Zeilenstufenform, der Rang der Ma-
trix ist also 2 . Wir geben das zugehörige, zu (5.1) äquiva- Die erweiterte Koeffizientenmatrix ist
lente Gleichungssystem explizit an: ⎛ ⎞
2 4 2
x1 + 4 x2 = 2 ⎝3 6 3⎠
− 7 x2 = 1 5 10 5
Beim Verfahren von Gauß berechnet man nun die Lösung Wir multiplizieren die erste Zeile mit 1/2 und wählen die
durch Rückwärtseinsetzen. Wir erhalten für x2 den Wert an der Stelle (1, 1) entstehende 1, um mit dem Verfahren
−1/7 und dann durch Einsetzen in die erste Gleichung von Gauß zu beginnen:
x1 + 4 (−1/7) = 2 ⇒ x1 = 18/7 . ⎛ ⎞ ⎛ ⎞
1 2 1 1 2 1
z2 → z2 −3 z1
⎝3 6 3⎠ −→ ⎝0 0 0⎠
Also ist (l1 , l2 ) = (18/7, −1/7) die einzige Lösung. z3 → z3 −5 z1
5 10 5 0 0 0
Beim Verfahren von Gauß und Jordan werden an der Ma-
trix ' ( Die Matrix hat Zeilenstufenform, ihr Rang ist 1 . Die bei-
1 4 2 den Eliminationsverfahren sind hier identisch, die entstan-
0 −7 1 dene Matrix hat bereits reduzierte Zeilenstufenform. Das
in Zeilenstufenform noch zwei weitere Umformungen zugehörige Gleichungssystem lautet
durchgeführt: Die zweite Zeile wird mit −1/7 multipli-
ziert und dann zur ersten Zeile das (−4)-Fache der neuen x 1 + 2 x2 = 1 .
zweiten Zeile addiert, kurz:
' ( ' ( Für jedes reelle t, das wir für x2 einsetzen, nimmt x1 den
1 4 2 1 0 18/7 Wert 1 − 2 t an. Also ist L = {(1 − 2 t, t) | t ∈ R} die
−→
0 −7 1 z1 → z1 + 4/7 z2 0 1 −1/7 Lösungsmenge.
178 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra
Wir bestimmen für alle a ∈ R die Lösungsmenge des Wir diskutieren kurz den Fall einer erweiterten Koeffizien-
folgenden linearen Gleichungssystems: tenmatrix, deren erste Spalte keine 1 aufweist. Dann sind
entweder alle Elemente der ersten Spalte null, oder es gibt
x1 + a · x2 − x3 = 0 ein ai1 = 0 . Im ersten Fall braucht man der ersten Spalte
2 x1 + x2 = 0 keine weitere Beachtung zu schenken; die Unbestimmte x1
x2 + x3 = 0 unterliegt keinerlei Einschränkung, man setze x1 = t ∈ R.
−1
Im zweiten Fall multiplizieren wir die i-te Zeile mit ai1
und erreichen damit eine 1 an der Stelle (i, 1), mit welcher
Kommentar: Hier ist a zwar anfangs nicht bekannt,
die anderen Zahlen der ersten Spalte eliminiert werden kön-
aber keine Unbestimmte, sondern ein Parameter. Das
nen. Dies führt aber häufig zu unhandlichen Brüchen in den
Gleichungssystem wäre andernfalls nicht mehr linear.
weiteren Zahlen dieser Zeile und schließlich in der ganzen
Matrix. Dies lässt sich vermeiden, wenn man die neuen Zei-
Die erweiterte Koeffizientenmatrix lautet len wieder derart erweitert, dass die Nenner wegfallen. Bei
⎛ ⎞ der folgenden Elimination erfolgen diese beide elementaren
1 a −1 0
⎝2 1 0 0⎠ Zeilenumformungen gleichzeitig:
' ( ' (
0 1 1 0 3 2 3 4 3 2 3 4
−→
2 5 6 10 z2 → 3 z2 −2 z1 0 11 12 28
Wir wählen in der ersten Spalte die 1 an der Stelle (1, 1)
Es wird nämlich vom 3-Fachen der zweiten Zeile das 2-Fache
und beginnen mit dem Verfahren von Gauß:
der ersten Zeile subtrahiert.
⎛ ⎞ ⎛ ⎞
1 a −1 0 1 a −1 0
Beispiel Als ausführlicheres Beispiel betrachten wir ein
⎝ 2 1 0 0 ⎠ → ⎝ 0 (1 − 2 a) 2 0 ⎠ →
komplexes lineares Gleichungssystem, also mit K = C :
0 1 1 0 0 1 1 0
2 x1 + i x3 = i
⎛ ⎞ ⎛ ⎞ x1 − 3 x2 − i x3 = 2 i
1 0 (−1 − a) 0 1 0 (−1 − a) 0
⎝ 0 0 (1 + 2 a) 0 ⎠ → ⎝ 0 1 1 0⎠ i x1 + x2 + x3 = 1 + i
0 1 1 0 0 0 (1 + 2 a) 0 Die erweiterte Koeffizientenmatrix ist
⎛ ⎞
Die Matrix hat damit Zeilenstufenform. 2 0 i i
⎝ 1 −3 −i 2i ⎠
Der Rang der Matrix hängt nun von der reellen Zahl a
i 1 1 1+i
ab. Ist a = −1/2, so ist der Rang 2 , im Fall a = −1/2
jedoch 3 . Wir wählen eine 1 und beginnen:
⎛ ⎞ ⎛ ⎞
2 0 i i 1 −3 −i 2 i
? ⎝ 1 −3 −i 2i ⎠ → ⎝ 0 6 3 i −3 i ⎠
Geben Sie das zugehörige lineare Gleichungssystem an. i 1 1 1+i 0 1 + 3i 0 3 + i
Nun könnten wir die zweite Zeile durch 2 dividieren. Dies
1. Fall: a = −1/2 . führt aber zu unbequemen Brüchen. Wir vermeiden Brüche,
Wegen 1 + 2 a = 0 ist die dritte Gleichung nur für x3 = 0 wenn wir von der dritten Zeile das (1+3 i)-Fache der zweiten
erfüllbar. Für x2 erhalten wir aus der zweiten Gleichung Zeile subtrahieren
durch Einsetzen von x3 = 0 ebenfalls den Wert 0 und ⎛ ⎞
1 −3 −i 2i
schließlich aus der ersten Gleichung x1 = 0 . Also ist ⎝0 2 i −i ⎠ →
(0, 0, 0) die eindeutig bestimmte Lösung des Systems 0 2 + 6i 0 6 + 2i
und L = {(0, 0, 0)} die Lösungsmenge. ⎛ ⎞
1 −3 −i 2i
2. Fall: a = −1/2. ⎝0 2 i −i ⎠
Die erweiterte Koeffizientenmatrix hat in diesem Fall die 0 0 3 − i 3 + 3i
Gestalt ⎛ ⎞ Es gibt also eine eindeutige Lösung, und zwar
1 0 −1/2 0
⎝0 1 1 0⎠ 3 + 3i 1
x3 = = 10 (3 + 3 i) (3 + i) = 35 + 65 i
0 0 0 0 3−i
−i − i x3
Für jedes reelle t, das wir für x3 einsetzen, hat x2 den Wert x2 = = 35 − 45 i
2
−t, wie wir aus der zweiten Gleichung erkennen, und x1
den Wert 1/2 t ; das besagt die erste Gleichung. x1 = 2 i + 3 x2 + i x3 = 35 + 15 i
: 1 1 1
;
Damit ist L = {(1/2 t, −t, t) | t ∈ R} die Lösungs- d. h., L = 5 (3 + i), 5 (3 − 4 i), 5 (3 + 6 i) ist die
menge. Lösungsmenge.
5.2 Das Lösungsverfahren von Gauß und Jordan 179
Problemanalyse und Strategie: Wir notieren die erweiterte Koeffizientenmatrix (A | b) und bringen diese mit ele-
mentaren Zeilenumformungen auf Stufenform. Dabei achten wir darauf, dass wir Fallunterscheidungen so lange wie
möglich hinausschieben, also nicht durch a oder einen anderen unbestimmten Ausdruck dividieren.
mit der ersten Zeile. Alle Zeilenumformungen sind an der die darüber stehenden Einträge zu eliminieren. Über den an-
erweiterten Koeffizientenmatrix (A | b) vorzunehmen. deren Elementen derselben Stufe können durchaus von null
verschiedene Zahlen stehen bleiben.
Gibt es hingegen nur Nullen in der ersten Spalte, so gehen wir
die Spalten der Reihe nach durch. Finden wir erstmals in der
k-ten Spalte von A, 1 < k ≤ n, ein von null verschiedenes
Element aik , so verfahren wir mit der k-ten Spalte so wie 5.3 Das Lösungskriterium und
vorhin mit der ersten.
die Struktur der Lösung
Gibt es überhaupt nur Nullen in A, so sind wir bereits fertig
mit der Elimination. Bringt man eine Koeffizientenmatrix A bzw. eine erweiterte
2. Schritt: Die Matrix hat nun zu Beginn der ersten Zeile Koeffizientenmatrix (A | b) mithilfe von elementaren Zeilen-
entweder ein ai1 = 0 oder lauter Nullen und erstmals an umformungen auf Zeilenstufenform, so heißt die Anzahl der
der Stelle (1, k), k > 1, ein aik = 0 . Wir fassen beide Zeilen, in denen nicht nur Nullen als Einträge erscheinen, der
Möglichkeiten zusammen, indem wir k ≥ 1 zulassen. Rang rg A bzw. rg(A | b) (Seite 176). Dieser Begriff spielt
eine wesentliche Rolle bei der Lösbarkeitsentscheidung.
Dann lassen wir im Weiteren die erste Zeile und die ersten k
Spalten der Koeffizientenmatrix A außer Acht und wenden
uns der verbleibenden (m − 1) × (n − k)-Matrix A1 zu: Mithilfe des Ranges lässt sich die Lösbarkeit
⎛ ⎞ eines linearen Gleichungssystems entscheiden
0 aik ∗ ∗ ∗
⎜0 0 ⎟
⎝ ⎠ Wir formulieren gleich das wesentliche Ergebnis.
.. .. A1
. .
Das Lösbarkeitskriterium
Es ist zu beachten, dass die Restmatrix A1 ebenso wie A keine Ein lineares Gleichungssystem mit der Koeffizientenma-
Absolutglieder enthält. Nur bei den Zeilenumformungen sind trix A und der erweiterten Koeffizientenmatrix (A | b) ist
auch die Absolutglieder mit zu berücksichtigen. genau dann lösbar, wenn
Diesmal durchsuchen wir in A1 die Spalten von vorne weg,
rg A = rg(A | b) .
um ein Element aj l = 0 zu entdecken. Gibt es keines, so
sind wir fertig. Finden wir hingegen in der Restmatrix A1 an
der Stelle (j, l), j ≥ 1, l ≥ 1, ein von null verschiedenes Kommentar: Dieses Kriterium wird den im 19. Jahrhun-
Element a1+j k+l , so eliminieren wir damit wie im ersten dert wirkenden Mathematikern Leopold Kronecker und Al-
Schritt die Einträge der l-ten Spalte in A1 und tauschen dann fredo Capelli zugeschrieben und deshalb oft Kriterium von
die j -te Zeile mit der ersten von A1 . Kronecker und Capelli genannt.
Wieder werden die Zeilenumformungen an der gesamten Beweis: Gilt rg A = rg(A | b), so existiert ein zu (A | b)
erweiterten Koeffizientenmatrix vorgenommen. Die ersten äquivalentes lineares Gleichungssystem in Zeilenstufenform,
Spalten bleiben davon sowieso unberührt. Nach diesen Um- bei welchem rechts von den Nullzeilen von A nur Nullen
formungen steht der erste, von null verschiedene Eintrag der stehen. Deshalb ist die Lösungsmenge nichtleer.
zweiten Zeile – bezogen auf die Gesamtmatrix – an der Stelle
Ist rg A = rg(A | b), so bleibt nur rg A < rg(A | b), da die
(2, k + l):
Zeilen in (A | b) jeweils ein Element mehr aufweisen als jene
⎛ ⎞ in A. Dann enthält ein zu (A | b) äquivalentes lineares Glei-
0 aik ∗ ∗ ∗ ∗
⎜ 0 · · · 0 a1+j k+l ∗ ∗ ⎟ chungssystem in Zeilenstufenform eine Zeile der Art
⎜ ⎟
⎜ 0 ··· 0 0 ⎟
⎝ ⎠ (0 0 . . . 0 | b) mit b = 0 .
.. .. .. A2
. . . Dies besagt aber, dass das gegebene Gleichungssystem nicht
lösbar ist.
Von nun an lassen wir die erste Zeile und die ersten l Spalten
von A1 außer Acht und wiederholen das Verfahren für die Nicht lösbar sind also z. B.
verbleibende Matrix A2 , die nur mehr (m − 2) Zeilen und ⎛ ⎞ ⎛ ⎞
n−k−l Spalten aufweist; und so weiter. Gleichartige Schritte 2 b −1 0 1 1 −2 3 −2
⎝ 0 1 0 4 ⎠ und ⎝ 0 0 0 0 −1 ⎠
sind so lange zu wiederholen, bis alle Zeilen durchlaufen sind
oder die Restmatrix nur mehr Nullen enthält. Nachdem die 0 0 0 2 0 0 0 1 1
Größe der Restmatrix Schritt für Schritt abnimmt, ist nach Hingegen sind lösbar
spätestens m Schritten die Zeilenstufenform hergestellt. ⎛ ⎞ ⎛ ⎞
2 b −1 0 1 1 −2 3 −2
Will man schließlich die reduzierte Zeilenstufenform errei- ⎝ 0 1 0 4 ⎠ und ⎝ 0 0 1 1 1 ⎠
chen, so verwendet man die führenden Einträge pro Zeile, um 0 0 0 0 0 0 0 1 5
5.3 Das Lösungskriterium und die Struktur der Lösung 181
in Abhängigkeit der beiden Parameter a, b ∈ R auf Lösbarkeit bzw. eindeutige Lösbarkeit und stellen die entsprechenden
Bereiche für (a, b) ∈ R2 grafisch dar.
Problemanalyse und Strategie: Wir wenden die bekannten elementaren Zeilenumformungen an, beachten aber
jeweils, unter welchen Voraussetzungen an a und b diese zulässig sind.
Wir bezeichnen den unbekannten Anteil jener ursprüngli- algebrasystems ist hier bereits angebracht. Die Lösung
chen A-Wähler, die nun B gewählt haben, mit pAB . Das lautet:
heißt, dass von den 2 040 früheren A-Wählern in der Stadt
I nun 2 040·pAB ihre Stimme der Partei B gegeben haben. pAB = 0.111 1 , pAC = 0.175 8 ⇒ pAA = 0.713 1 ,
Das ergibt insgesamt neun Unbekannte: pBA = 0.140 9 , pBC = 0.120 3 ⇒ pBB = 0.738 9 ,
pCA = 0.007 , pCB = 0.158 7 ⇒ pCC = 0.840 6 .
pAA , pAB , pAC , pBA , pBB , pBC , pCA , pCB , pCC .
Wenn wir gleich auch noch die Matrizengleichung unseres Lösungsmenge eines inhomogenen Systems
Systems verwenden und vorwegnehmen, dass die Matrizen-
Sind (s1 , . . . , sn ) eine spezielle Lösung eines linea-
multiplikation distributiv ist, was in voller Allgemeinheit erst
ren Gleichungssystems über K in n Unbekannten und
im Kapitel 12 erklärt wird, so können wir den obigen Beweis
(l1 , . . . , ln ) eine Lösung des zugehörigen homogenen
ganz kurz wie folgt führen:
Systems, dann ist auch die Summe (s1 + l1 , . . . , sn + ln )
A l = A m = 0 ⇒ A(l + m) = A l + A m = 0 + 0 = 0. eine Lösung des inhomogenen Systems. Umgekehrt ist
jede Lösung des inhomogenen Systems als eine derartige
In Kapitel 6 werden wir eine Menge U von Vektoren einen Summe darstellbar.
Unterraum nennen, wenn dieser mit l und m auch l + m
sowie λ l für alle λ ∈ K enthält.
184 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra
Beweis: Wir verwenden hier gleich von Anfang an die also ausgeschrieben, ohne Nullspalten und nach bereits er-
Matrizengleichung A x = b des gegebenen Systems. folgter Umnummerierung der Unbekannten:
Die erste Behauptung ergibt sich durch Einsetzen: x1 + c1 r+1 xr+1 + · · · + c1n xn = s1
.. .. .. ..
A s = b und A l = 0 ⇒ A(s +l) = A s +A l = b +0 = b. . . . .
xr + cr r+1 xr+1 + · · · + crn xn = sr
Ist m so wie s eine Lösung des inhomogenen Systems, so
Nun ersetzen wir die letzten Unbekannten xr+1 , . . . , xn
gilt:
durch frei wählbare Parameter t1 , . . . , tn−r ∈ K und brau-
A m = A s = b ⇒ A(m − s) = A m − A s = b − b = 0. chen die Lösung nur noch abzuschreiben:
x1 = s1 − c1 r+1 t1 − · · · − c1n tn−r
Also löst der Differenzenvektor l = m − s das homogene .. .. .. ..
System, oder anders ausgedrückt: m = s + l . . . . .
xr = sr − cr r+1 t1 − · · · − crn tn−r
xr+1 = t1
Sind L die Lösungsmenge unseres inhomogenen Systems .. ..
und L0 jene des zugehörigen homogenen Systems, so besagt . .
das zweite Ergebnis xn = tn−r
Dies ergibt für die neue Reihenfolge der Unbekannten als Kommentar: In der Sprache der Vektorräume, wie sie
Parameterdarstellung der Lösungsmenge im nächsten Kapitel entwickelt wird, können wir sagen: Die
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ Lösungsmenge eines homogenen Systems über K in n Unbe-
x1 1 −2 −1 0 ⎛ ⎞ kannten und vom Rang r ist ein (n−r)-dimensionaler Unter-
⎜ x3 ⎟ ⎜ 2 ⎟ ⎜ 0 −3 −3 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ t1 raum von Kn . Die Lösungsmenge eines lösbaren inhomoge-
⎜ x2 ⎟=⎜ 0 ⎟+⎜ 1 0 0 ⎟ ⎝ ⎠
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ t2 nen Systems vom Rang r ist ein (n−r)-dimensionaler affiner
⎝ x4 ⎠ ⎝ 0 ⎠ ⎝ 0 1 0 ⎠ t3 Raum.
x5 0 0 0 1
Zusammenfassung
a11 x1 + a12 x2 + · · · + a1n xn = b1 Das Verfahren von Gauß und Jordan ist ein
a21 x1 + a22 x2 + · · · + a2n xn = b2 zuverlässiger Weg zur Lösung
.. .. .. ..
. . . .
am1 x1 + am2 x2 + · · · + amn xn = bm Eliminationsverfahren von Gauß
Dieses Eliminationsverfahren zur Lösung des linearen
Dabei sind die Koeffizienten aij und die Absolutglieder
Gleichungssystems (A | b) besteht aus
bi für 1 ≤ i ≤ m und 1 ≤ j ≤ n Elemente des Kör-
1. der Umformung auf Zeilenstufenform,
pers K.
2. der Lösbarkeitsentscheidung und
Ein n-Tupel (l1 , l2 , . . . , ln ) ∈ Kn heißt eine Lösung 3. dem Rückwärtseinsetzen zur Bestimmung der Lö-
dieses Systems, wenn alle Gleichungen durch Einsetzen sungsmenge des Systems.
von l1 , . . . , ln anstelle von x1 , . . . , xn befriedigt wer-
den. Die Menge L aller Lösungen des Systems heißt Lö-
sungsmenge. Ist L leer, so heißt das Gleichungssystem Eliminationsverfahren von Gauß und Jordan
unlösbar. Dieses Eliminationsverfahren zur Lösung des linearen
Gleichungssystem (A | b) besteht aus
1. der Umformung auf Zeilenstufenform,
2. der Lösbarkeitsentscheidung und
Mit elementaren Zeilenoperationen bringt 3. der Reduktion mittels weiterer elementarer Zeilen-
man ein lineares Gleichungssystem auf umformungen auf reduzierte Zeilenstufenform und
Stufenform dem Ablesen der Lösung.
Mithilfe des Ranges lässt sich die Lösbarkeit Lösungsmenge eines inhomogenen Systems
eines linearen Gleichungssystems entscheiden Sind (s1 , . . . , sn ) eine spezielle Lösung eines linea-
ren Gleichungssystems über K in n Unbekannten und
Das Lösbarkeitskriterium (l1 , . . . , ln ) eine Lösung des zugehörigen homogenen
Ein lineares Gleichungssystem mit der Koeffizientenma- Systems, dann ist auch die Summe (s1 + l1 , . . . , sn + ln )
trix A und der erweiterten Koeffizientenmatrix (A | b) ist eine Lösung des inhomogenen Systems. Umgekehrt ist
genau dann lösbar, wenn jede Lösung des inhomogenen Systems als eine derartige
rg A = rg(A | b) . Summe darstellbar.
Die Lösungsmengen von homogenen und Nach einer Umreihung der Unbekannten wird
inhomogenen linearen Gleichungssystemen das Rückwärtseinsetzen besonders
haben eine gewisse Struktur übersichtlich
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
Rechenaufgaben x1 − x2 + x3 − 2 x4 = −2
−2 x1 + 3 x2 + a x3 = 4
5.8 • Bestimmen Sie die Lösungsmengen L der fol- −x1 + x2 − x3 + a x4 = a
genden reellen linearen Gleichungssysteme und untersuchen a x2 + b2 x3 − 4 a x4 = 1
Sie deren geometrische Interpretationen:
in Abhängigkeit der beiden Parameter a, b ∈ R auf Lösbar-
2 x 1 + 3 x2 = 5 keit bzw. eindeutige Lösbarkeit und stellen Sie die entspre-
x 1 + x2 = 2 chenden Bereiche für (a, b) ∈ R2 grafisch dar.
3x1 + x2 = 1
5.13 •• Im Ursprung 0 = (0, 0, 0) des R3 laufen die
2x1 − x2 + 2x3 =1
drei Stäbe eines Stabwerks zusammen, die von den Punkten
x1 − 2x2 + 3x3 =1
6x1 + 3x2 − 2x3 =1 a = (−2, 1, 5), b = (2, −2, −4), c = (1, 2, −3)
x1 − 5x2 + 7x3 =2
ausgehen.
0
5.9 ••• Für welche a ∈ R hat das reelle lineare Glei-
chungssystem
(a + 1) x1 + (−a 2 + 6 a − 9) x2 + (a − 2) x3 = 1
(a − 2 a − 3) x1 + (a 2 − 6 a + 9) x2 +
2 3 x3 = a − 3
(a + 1) x1 + (−a 2 + 6 a − 9) x2 + (a + 1) x3 = 1
keine, genau eine bzw. mehr als eine Lösung? Für a = 0 und ↓F c
a = 2 berechne man alle Lösungen. c ↓
↓F b F
5.10 •• Berechnen Sie die Lösungsmenge der komple-
xen linearen Gleichungssysteme:
b
↓F a
a) x 1 + i x2 + x3 = 1 + 4 i a
x1 − x2 + i x3 = 1
i x1 − x2 − x3 = −1 − 2 i Abbildung 5.6 Die Gewichtskraft F verteilt sich auf die Stäbe.
Eigentlich sollte man für die Addition von Elementen aus Wir prüfen dies für den Fall K = C und n = 1 explizit nach:
dem R2 und die Multiplikation von Elementen aus dem R2 Es gilt hier V = C: V liefert die Vektoren, C die Skalare. Die
mit reellen Zahlen neue Symbole, etwa ⊕ und ", einfüh- Addition in V ist hier die Addition in C und die Multiplikation
ren. Wir tun das nicht, da die Schreibweise dadurch kom- mit Skalaren ist die Multiplikation in C; Skalare stehen links,
pliziert wird, und halten uns immer vor Augen, dass es sich Vektoren rechts. Die Menge V = C ist mit der Addition +
um verschiedene Additionen bzw. Multiplikationen handelt: eine abelsche Gruppe, und C ist ein Körper. Die Axiome
2-Tupel werden addiert (Addition in R2 ), indem man ihre (V1)–(V3) sind das Distributiv- und das Assoziativgesetz in
Koordinaten addiert (Addition in R). Ein 2-Tupel wird mit C, diese sind natürlich erfüllt, und (V4) gilt ebenfalls in C.
einem λ ∈ R multipliziert (äußere Multiplikation), indem Also ist C ein C-Vektorraum.
man jede seiner Koordinaten mit diesem Skalar multipliziert Dieselbe Überlegung zeigt, dass jeder Körper über jedem
(Multiplikation in R). seiner Teilkörper ein Vektorraum ist, also ist R ein R- und
Ähnliche Additionen und Multiplikationen haben wir übri- Q-Vektorraum, C ein C-, R- und Q-Vektorraum.
gens bereits auf Seite 172 mit den Lösungen linearer Glei- Wir betrachten den Vektorraum Z32 über dem Körper Z2 mit
chungssysteme eingeführt. zwei Elementen 0 und 1. Die Elemente von Z32 können ex-
plizit angegeben werden:
Lemma
⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
Die abelsche Gruppe R2 bildet mit der wie eben erklärten ⎨ 0 1 0 0 1 0 1 1 ⎬
komponentenweisen Multiplikation · einen R-Vektorraum. Z2 = ⎝0⎠, ⎝0⎠, ⎝1⎠, ⎝0⎠, ⎝1⎠, ⎝1⎠, ⎝0⎠, ⎝1⎠ .
3
⎩ ⎭
0 0 0 1 0 1 1 1
Beweis: Die Vektorraumaxiome verifiziert
' ( man durch
' (Nach- Da man für jede Komponente eines Vektors v ∈ Z32 die zwei
v1 w1
rechnen. Wir wählen Elemente v = ,w = ∈ R2 Wahlmöglichkeiten 0 und 1 hat, gibt es genau 23 Elemente
v2 w2
und λ, μ ∈ R: in Z32 .
192 6 Vektorräume – von Basen und Dimensionen
(1) In K = C und V = C2 bezeichne + die komponen- Das gemischte Assoziativgesetz (V3) gilt hier nicht.
tenweise Addition; als skalare
' Multiplikation
( definie- Z. B. ist
v1
ren wir für λ ∈ C und v = ∈ V:
v2 (i2 ) · v = (−1) · v = Re (−1) v = −v ,
⎧
⎪
⎪ λ v aber
' ( ⎪
1
⎪
⎨ , falls v2 = 0,
v1 λ v2 i · (i · v) = Re (i) Re (i) v = 0 ,
λ· =
v2 ⎪
⎪ λ v1
⎪
⎩ 0 , falls v2 = 0.
⎪
d. h. (i2 ) · v = i · (i · v), sofern v = 0. Die anderen
Vektorraumaxiome sind erfüllt. Exemplarisch zeigen
' ( ' (
1 1 wir, dass (V2) erfüllt ist. Für alle λ, μ ∈ C und v ∈ V
Wir wählen λ = i ∈ C, v = ,w= ∈V
1 −1 gilt:
und rechnen nach,
'' ( ' (( ' ( ' ( (λ + μ) · v = Re (λ + μ) · v = (Re λ + Re μ) v
1 1 2 −2 i
λ·(v +w) = i· + = i· = = Re λ v + Re μ v = λ · v + μ · v .
1 −1 0 0
(2) In K = R und V = R bezeichne + die übliche Ad- also gilt hier das Axiom (V4) nicht. Alle anderen
dition komplexer Zahlen; als skalare Multiplikation Axiome gelten. Exemplarisch
' ( weisen'wir ((V1) nach.
definieren wir für λ ∈ R und v ∈ V v w1
Für alle λ ∈ R und v = 1 , w = ∈ V gilt:
v2 w2
λ · v = λ2 v .
' ( ' ( ' (
λ (v1 + w1 ) λ v1 λ w1
Das Axiom (V2) (λ + μ) · v = λ · v + μ · v ist verletzt. λ · (v + w) = = +
0 0 0
Z. B. ist
= λ·v +λ·w.
(1 + 1) · v = 2 · v = 4 v = 2 v = v + v = 1 · v + 1 · v ,
sofern v = 0. Es sind jedoch alle anderen Vektor- Kommentar: Wir haben für jedes der vier Vektorraum-
raumaxiome erfüllt. Exemplarisch zeigen wir, dass axiome eine algebraische Struktur angegeben, in der die-
(V3) erfüllt ist: Für alle λ, μ ∈ R und v ∈ V gilt: ses Axiom verletzt und alle anderen Vektorraumaxiome
erfüllt sind. Demnach folgt keines der vier Axiome der
(λ μ) · v = (λ μ)2 · v = λ2 (μ2 · v) = λ · (μ · v) .
Skalarmultiplikation aus den übrigen Axiomen. Man sagt:
(3) In K = C und V = C bezeichne + die übliche Ad- „Die Axiome der Skalarmultiplikation sind voneinander
dition komplexer Zahlen; als skalare Multiplikation unabhängig“. Dies ist nicht so bei der Kommutativität der
definieren wir für λ ∈ C und v ∈ V Addition. Die Kommutativität der Addition folgt tatsäch-
lich aus den anderen Vektorraumaxiomen. Wir stellen die-
λ · v = (Re λ) v . sen Nachweis als Übungsaufgabe 6.16.
6.2 Beispiele von Vektorräumen 193
Kommentar: Wir lassen von nun an den Punkt · für die über einem Körper K, die Polynome über einem Körper K
Multiplikation mit Skalaren weg, wir schreiben also kurz λ v und die Abbildungen von einer Menge in einen Körper K.
anstelle von λ · v.
Diesen drei Klassen von Beispielen werden wir in den weite-
ren Kapiteln immer wieder begegnen. Oft wird der jeweilige
Vektoren gehorchen Rechenregeln, die man Grundkörper K der Körper der reellen Zahlen sein. Wir erhal-
von Zahlen her kennt ten aber eine Vielfalt von Beispielen, wenn wir nur K anstelle
von R schreiben, K kann dann einfach jeder mögliche Körper
Vektoren, also Elemente von Vektorräumen, können ganz un- sein.
terschiedlicher Art sein. Es können Lösungen von linearen
Gleichungssystemen oder Polynome oder auch allgemeiner
Abbildungen oder auch Matrizen sein. Wir werden diese Bei- Matrizen über einem Körper bilden einen
spiele im Abschnitt 6.2 behandeln. Hier geben wir an, wel- Vektorraum
chen Regeln sie gehorchen – egal, ob es sich dabei um Lö-
sungen von Differenzialgleichungen oder um Punkte des R2 Auf Seite 175 zu den linearen Gleichungssystemen haben wir
handelt. bereits mit Matrizen gearbeitet. Wir wollen uns nun überle-
gen, ob die Menge aller Matrizen mit m Zeilen und n Spalten,
Rechenregeln für Vektoren deren Einträge einem Körper K angehören, mit geeignet defi-
In einem K-Vektorraum V gelten für alle v, w, x ∈ V nierten Verknüpfungen + und · einen K-Vektorraum bilden.
und λ ∈ K: Es seien m und n natürliche Zahlen. Eine m × n -Matrix A
(i) v + x = w ⇔ x = w − v über dem Körper K ist eine Abbildung
(ii) λ v = 0 ⇔ λ = 0 oder v = 0
(iii) (−λ) v = −(λ v) {1, . . . , m} × {1, . . . , n} → K,
A:
(iv) −(v + w) = −v − w (i, j ) → aij .
Wir notieren eine solche Matrix A übersichtlich durch An-
Diese Regeln erscheinen einem ganz natürlich und selbst- gabe aller Bilder a11 , . . . , amn in der Form
verständlich. Das sollte nicht darüber hinwegtäuschen, dass ⎛ ⎞
diese Aussagen zu beweisen sind. a11 a12 · · · a1n
⎜ a21 a22 · · · a2n ⎟
⎜ ⎟
A=⎜ . .. . ⎟
Beweis: (i) gilt, da (V , +) eine Gruppe ist (Seite 66). ⎝ .. . · · · .. ⎠
(ii) Aus λ = 0 folgt 0 v = (0 + 0) v = 0 v + 0 v; folglich am1 am2 · · · amn
gilt 0 v = 0 nach (i). Und ist v = 0, so folgt analog aus
Wir werden eine Matrix A oft auch kurz mit (aij )m,n oder
λ 0 = λ (0 + 0) = λ 0 + λ 0 mit (i) λ 0 = 0.
– wenn m, n feststehen – mit (aij ) bezeichnen; hierbei ist
Gilt umgekehrt λ v = 0 und λ = 0, so können wir die Glei- i der Zeilenindex und j der Spaltenindex. Die Körperele-
chung λ v = 0 mit dem Skalar λ−1 multiplizieren und erhal- mente aij ∈ K, i = 1, . . . , m, j = 1, . . . , n nennt man
ten nach dem ersten Teil dieses Beweises v = λ−1 0 = 0. die Komponenten oder die Einträge der Matrix A. Im Fall
Folglich gilt λ = 0 oder v = 0. K = R bzw. K = C bezeichnet man A auch als reelle Matrix
bzw. komplexe Matrix. Unter der Stelle (r, s) einer Matrix
(iii) Aufgrund des Vektorraumaxioms (V2) und (ii) gilt λ v +
A = (aij )m,n versteht man den Schnittpunkt der r-ten Zeile
(−λ) v = (λ + (−λ)) v = 0 v = 0. Folglich ist (−λ) v das
mit der s-ten Spalte im obigen Schema – hierbei sind r und
zu λ v entgegengesetzte Element, d. h. (−λ) v = −(λ v).
s natürliche Zahlen mit r ≤ m und s ≤ n.
(iv) Nach dem Vektorraumaxiom (V1) gilt mit λ = −1:
?
(−1) (v + w) = (−1) v + (−1) w . Wann sind zwei Matrizen gleich?
Nun wenden wir (iii) an, danach dürfen wir (−1) durch
ein einfaches Minuszeichen ersetzen. Es folgt die Behaup- Die Menge aller m × n-Matrizen über K bezeichnen wir mit
tung.
Km×n , also
⎧⎛ ⎞ ⎫
⎨ a11 · · · a1n
⎪ ⎪
⎬
Wir werden diese Regeln im Folgenden oftmals ohne Hin- ⎜ . .. ⎟ | a ∈ K ∀ i, j .
Km×n = ⎝ .. . ⎠ ij
weis benutzen. ⎪
⎩ ⎪
⎭
am1 · · · amn
⎛ ⎞
6.2 Beispiele von Vektorräumen 0 ··· 0
⎜ .. ⎟ ∈ Km×n , deren Komponenten
Die Matrix 0 = ⎝ ... .⎠
Wir behandeln in diesem Abschnitt drei wichtige Klassen 0 ··· 0
von Beispielen für Vektorräume. Es sind dies die Matrizen alle 0 sind, heißt Nullmatrix.
194 6 Vektorräume – von Basen und Dimensionen
Wir führen nun in Km×n eine Addition + und eine Multipli- Neben A = (aij ) und B = (bij ) aus Km×n seien nun auch
kation · mit Skalaren komponentenweise ein durch: λ, μ ∈ K gegeben.
⎛ ⎞ ⎛ ⎞
a11 · · · a1n b11 · · · b1n (V1) λ (A + B) = λ ((aij ) + (bij )) = (λ (aij + bij )) =
⎜ .. .. ⎟ + ⎜ .. .. ⎟ (λ aij + λ bij ) = (λ aij ) + (λ bij ) = λ A + λ B.
⎝ . . ⎠ ⎝ . . ⎠
am1 · · · amn bm1 · · · bmn (V2) (λ+μ) A = ((λ+μ) aij ) = (λ aij +μ aij ) = (λ aij )+
⎛ ⎞ (μ aij ) = λ A + μ B.
a11 + b11 · · · a1n + b1n
⎜ .. .. ⎟ (V3) (λ μ) A = (λ μ aij ) = λ (μ aij ) = λ (μ A).
=⎝ . . ⎠
am1 + bm1 · · · amn + bmn (V4) 1 A = 1 (aij ) = (1 aij ) = (aij ) = A.
und Also bildet Km×n mit den angegebenen Verknüpfungen einen
⎛ ⎞ ⎛ ⎞ K-Vektorraum.
a11 · · · a1n λ a11 · · · λ a1n
⎜ .. . ⎟ ⎜
.. ⎠ = ⎝ ... .. ⎟ .
λ·⎝ . . ⎠ Jeder andere Nachweis dafür, dass eine Menge V mit Ver-
am1 · · · amn λ am1 · · · λ amn knüpfungen + und · einen Vektorraum bildet, verläuft prin-
zipiell nach demselben Verfahren.
Mit der oben eingeführten Kurzschreibweise können wir das
auch notieren als Kommentar: Die Voraussetzung, dass K ein Körper ist,
(aij ) + (bij ) = (aij + bij ) und λ · (aij ) = (λ aij ) . benötigten wir nur für den Begriff „K-Vektorraum“ – wir ha-
ben Vektorräume nämlich nur über Körper erklärt. Aber Ma-
trizen kann man analog über Ringe (R, +, ·) mit 1 erklären.
Kommentar: Eigentlich müsste man auch hier neue Zei- Auch die obige Addition + von Matrizen und die Multipli-
chen für die Addition + und Multiplikation mit Skalaren · kation · mit Elementen aus R kann definiert werden – diese
einführen. Um aber die Rechnung nicht mit Symbolen zu Verknüpfungen + und · werden auf die entsprechenden Ver-
überladen und unübersichtlich zu gestalten, verwenden wir knüpfungen + und · des Rings R zurückgeführt. Gelten die
nur ein +-Zeichen, und das Multiplikationszeichen · für die Axiome eines Vektorraums für eine Gruppe V , wobei nur
Multiplikation mit Skalaren lassen wir, wie bereits verein- anstelle eines Körpers K ein Ring R mit 1 zugrunde liegt,
bart, weg. so spricht man von einem R-Modul V . Folglich ist für jeden
Ring R mit 1 die Menge R m×n aller m × n-Matrizen ein
Km×n ist ein K-Vektorraum R-Modul.
Die Menge Km×n aller m × n-Matrizen über K bil-
Matrizen können also durchaus auch Vektoren sein. Nun ist
det mit komponentenweiser Addition und Multiplikation
es nicht mehr verwunderlich, dass noch wesentlich abstrak-
mit Skalaren einen K-Vektorraum.
tere mathematische Objekte als Vektoren aufgefasst werden
können.
Beweis: Wir zeigen, dass Km×n mit der erklärten Addition
eine abelsche Gruppe ist. Gegeben sind A = (aij ), B = (bij ),
Polynome über einem Körper bilden einen
C = (cij ) ∈ Km×n .
Vektorraum
Die Verknüpfung + ist abgeschlossen: A+B = (aij )+(bij )
= (aij + bij ) ∈ Km×n . Polynome haben wir in Abschnitt 3.4 eingeführt. Ein Poly-
Die Verknüpfung + ist assoziativ: (A+B)+C = (aij +bij ) nom p über dem Körper K in der Unbestimmten X ist eine
+ (cij ) = (aij + bij + cij ) = (aij ) + (bij + cij ) = Summe
A + (B + C). p = a0 + a1 X + · · · + an X n ,
Die Nullmatrix ist ein neutrales Element: A + 0 = (aij + 0) dabei ist n ∈ N0 , und die Koeffizienten a0 , . . . , an liegen
= (aij ) = A. in K. Ist p nicht das Nullpolynom 0, so ist der Index n des
höchsten von null verschiedenen Koeffizienten an der Grad
Jede Matrix hat ein Inverses: Es ist (−aij ) ∈ Km×n , und es von p. Dem Nullpolynom ordnet man den Grad −∞ zu,
gilt (aij ) + (−aij ) = 0. dabei gilt −∞ < n für alle n ∈ N0 .
Die Verknüpfung + ist kommutativ: A + B = (aij + bij )
= (bij + aij ) = B + A. Beispiel Die Menge aller Polynome über Z2 vom Grad
kleiner oder gleich 2 bilden die acht Polynome
Damit ist bereits gezeigt, dass (Km×n , +) eine abelsche
Gruppe ist. Die erklärte Multiplikation mit Skalaren ist we- p0 = 0, p1 = 1,
gen λ (aij ) = (λ aij ) ∈ Km×n eine Abbildung von K ×Km×n p2 = X, p3 = 1+X,
in Km×n . Es sind also nur noch die vier Vektorraumaxiome p4 = X2 , p5 = 1 + X2 ,
nachzuweisen. p6 = X + X2 , p7 = 1 + X + X2 .
6.2 Beispiele von Vektorräumen 195
Die Menge aller Polynome über einem Körper K ist beliebige Menge M. Dann können wir für jeden Körper K
n die Menge KM aller Abbildungen f : M → K erklären:
!
i
K[X] = ai X | n ∈ N0 , a0 , . . . , an ∈ K . KM = {f | f : M → K ist eine Abbildung} .
i=0
Diese Menge bildet mit sinnvoll gewählter Addition und
Diese Menge bildet mit der koeffizientenweisen Addition Multiplikation mit Skalaren einen K-Vektorraum. Wir de-
eine abelsche Gruppe (siehe Seite 90). Die Möglichkeit, finieren für f, g ∈ KM und λ ∈ K:
Polynome auch miteinander zu multiplizieren, lassen wir
M → K,
nun außer Acht und betrachten nur die Addition. f + g: und
x → f (x) + g(x)
Beispiel Mit den Bezeichnungen aus dem obigen Beispiel M → K,
λf :
gilt etwa x → λ f (x) .
p5 + p6 = 1 + X2 + X + X2 Die Summe f + g und das skalare Vielfache λ f liegen
wieder in KM . Die Summe ordnet jedem x ∈ M die Summe
= 1 + X + (1 + 1) X 2
f (x) + g(x) der Bilder von x unter f und g zu. Und das
=1+X Bild von x unter λ f ist das λ-Fache des Bildes von x unter
= p3 f . Wir halten fest:
und
p i + p i = 0 für jedes i = 0, . . . , 7 . Der Vektorraum aller Abbildungen von einer Menge
in einen Körper
Wir führen nun in naheliegender Weise auf der Menge K[X] Für jede Menge M und jeden Körper K ist die Menge KM
eine äußere Multiplikation von Polynomen mit Elementen aller Abbildungen von M in K mit den Verknüpfungen
aus K ein. + und · ein K-Vektorraum.
Wir multiplizieren ein Polynom p = ni=0 ai X i aus K[X]
mit einem Element λ aus K, indem wir alle Koeffizienten von Beweis: Die Addition ist offenbar assoziativ und kommu-
p mit λ multiplizieren: tativ. Das neutrale Element ist die Abbildung 0, die jedem
Element x ∈ M das Nullelement 0 ∈ K zuordnet, und das
!
n
λp = (λ ai ) X i . dem Vektor f entgegengesetzte Element ist die Abbildung
i=0 −f : x → −f (x). Somit ist (KM , +) eine abelsche Gruppe.
Wegen λ f ∈ KM für jedes λ ∈ K und f ∈ KM ist die
Beispiel Für p = 2 X3 +X 2 −3 X, q = X 3 + 21 X 2 +X+1 Multiplikation eine Abbildung von K × KM in KM . Da die
aus R[X] gilt: Vektorraumaxiome (V1)–(V4) offenbar gelten, ist KM ein
K-Vektorraum.
p − (2 q) = −5 X − 2 .
Der Beweis der folgenden Aussage verläuft analog zu dem Achtung: Man achte wieder auf die grundsätzlich ver-
Beweis für den Vektorraum der m × n-Matrizen. schiedenen Bedeutungen der Additionen, die wir mit ein und
demselben +-Zeichen versehen. Man unterscheide genau:
f + g bezeichnet die Addition in KM und f (x) + g(x) jene
K[X] ist ein K-Vektorraum
in K.
Die Menge K[X] aller Polynome über K mit koeffizien-
tenweiser Addition und obiger Multiplikation mit Ska-
laren bildet einen K-Vektorraum.
?
Was ist im Fall M = ∅ ?
Die Abbildungen von einer Menge in einen Beispiel Wir betrachten den Fall M = N0 . Im Kapitel 8
Körper bilden einen Vektorraum werden Folgen über C definiert, es sind dies die Abbildungen
von N0 nach C. Also bildet die Menge CN0 der (komplexen)
Bei einem Polynom p = a0 + a1 X + · · · + an X n ∈ K[X] Folgen einen komplexen Vektorraum. Etwas allgemeiner er-
kann man in die Unbestimmte X zum Beispiel Elemente aus halten wir:
K einsetzen. Dadurch erhält man eine Abbildung, nämlich
Die Menge aller Folgen über einem Körper K
die Polynomfunktion (siehe Seite 91):
KN0 = {(an )n∈N0 | an ∈ K}
K → K
p̃ : .
x → p(x) ist ein K-Vektorraum.
Die Abbildung p̃ ist ein Element aus KK ,
d. h. eine Abbil- Und der Sonderfall M = R und K = R führt uns zum reellen
dung von K in K.Wir betrachten nun etwas allgemeiner eine Vektorraum RR aller reellwertigen Funktionen.
196 6 Vektorräume – von Basen und Dimensionen
x3
Sind K und M endlich, so ist die Menge KM aller Abbildun-
gen von M in K ebenfalls endlich. Wir betrachten ein Beispiel
eines solchen endlichen Vektorraums mit acht Elementen:
Abbildung 6.2 Die begrenzte schattierte Fläche ist kein Untervektorraum des
R2 , da die Summe von v und w nicht in ihr enthalten ist. Das gilt für jede
6.3 Untervektorräume begrenzte Fläche im R2 .
in U . Eine Teilmenge U eines K-Vektorraums V , die den Untervektorräume von Vektorräumen sind wieder Vektor-
Nullvektor 0 ∈ V nicht enthält, kann somit kein Untervek- räume. Mit diesem Ergebnis gelingt für zahlreiche Mengen
torraum von V sein. ein sehr einfacher Nachweis dafür, dass sie einen Vektorraum
bilden. Hat man nämlich eine Menge U , von der man nach-
Jeder Untervektorraum U eines K-Vektorraums V enthält
prüfen will, dass sie ein K-Vektorraum ist, so suche man nach
also zumindest den Nullvektor. Nach dem Untergruppen-
einem großen K-Vektorraum V , der die gegebene Menge U
kriterium von Seite 67 ist ein Untervektorraum U mit der
umfasst und verifiziere für die Teilmenge U von V die im
Addition von V eine Untergruppe von V und als solche
Allgemeinen leicht nachprüfbaren drei Bedingungen:
eine Gruppe. Wegen (U2) ist U bezüglich der Multiplikation
mit Skalaren aus K abgeschlossen. Die Vektorraumaxiome U = ∅,
(V1)–(V4) gelten für alle λ, μ ∈ K und u, v ∈ V . Insbe- v, w ∈ U ⇒ v + w ∈ U ,
sondere gelten diese Axiome auch für alle λ, μ ∈ K und λ ∈ K, u ∈ U ⇒ λ u ∈ U .
v, u ∈ U . Damit haben wir begründet:
Es ist dann U ein Untervektorraum von V und somit ein
K-Vektorraum. Es müssen also nicht alle Axiome eines K-
Lemma
Vektorraums nachgeprüft werden. Man muss hierbei aber auf
Ein Untervektorraum U eines K-Vektorraums V ist
eines aufpassen: Die Vektoraddition und die Multiplikation
wieder ein K-Vektorraum.
mit Skalaren in U muss dabei die Einschränkung der Addi-
Jeder Vektorraum V hat zwei Untervektorräume, nämlich V tion und Multiplikation in V sein.
selbst und die einelementige Menge {0}. Diese Untervek- Wir nutzen diesen kleinen Trick gleich an zwei Beispielen
torräume nennt man die trivialen Untervektorräume eines aus.
Vektorraums. Im Fall V = {0} sind die trivialen Untervek-
torräume voneinander verschieden.
Lösungsmengen homogener linearer
Beispiel Wir überlegen uns, welche Untervektorräume der Gleichungssysteme und Polynome bis zu
R2 mit komponentenweiser Addition und Multiplikation mit
einem festen Grad bilden Vektorräume
Skalaren besitzt.
Neben den trivialen Untervektorräumen R2 und {0} ist für Wir greifen einige Begriffe aus dem Abschnitt 5.3 zu den
jeden Vektor v ∈ R2 die (nichtleere) Menge U = R v = linearen Gleichungssystemen wieder auf. Ein lineares Glei-
{λ v | λ ∈ R} ein Untervektorraum (Abb. 6.3). chungssystem über K in n Unbekannten und m Gleichungen
lässt sich schreiben als
x2
a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2
v .. .. .. ..
. . . .
am1 x1 + am2 x2 + · · · + amn xn = bm
Als weitere Klasse von Beispielen betrachten wir Untervek- vektorraum von V , und umgekehrt ist jeder Untervektorraum
torräume von K[X]. von V das Erzeugnis einer Teilmenge von V . Wir suchen
letztlich minimale Teilmengen von V , die den ganzen Vek-
Polynome vom Grad kleiner gleich n bilden einen torraum V erzeugen – dieser ist ja auch ein Untervektorraum
Vektorraum von V . Solche minimalen Erzeugendensysteme von V wer-
Für jede natürliche Zahl n sowie für n = 0 und n = −∞ den wir Basen nennen. Die Dimension eines Vektorraums ist
bildet die Menge die Anzahl der Elemente einer Basis.
!
K[X]n = p = ai X i ∈ K[X] | deg(p) ≤ n Vektoren erzeugen durch Bildung von
i∈N0 Linearkombinationen Untervektorräume
aller Polynome mit einem Grad kleiner gleich n einen
Vektorraum. Wir betrachten eine nichtleere Teilmenge X von Vektoren
eines K-Vektorraums V – man beachte, dass X durchaus auch
unendlich sein kann. Für beliebige, endlich viele Vektoren
Beweis: Das Nullpolynom liegt wegen deg(0) = −∞ ≤ n v 1 , . . . , v n ∈ X und λ1 , . . . , λn ∈ K heißt
in K[X]n , sodass K[X]n für keines der zu betrachtenden n
!
n
leer ist. Für Polynome p = ri=0 ai X i und q = si=0 bi X i λ i v i = λ 1 v 1 + · · · + λn v n
max{r, s}
aus K[X]n , d. h. r, s ≤ n, ist auch p + q = i=0 i=1
(ai + bi ) Xi ∈ K[X]n . Und für jedes λ ∈ K ist auch
eine Linearkombination von X oder von v 1 , . . . , v n . Wir
λ p = ri=0 λ ai X i in K[X]n .
nehmen stets v i = v j für i = j an.
Für die Menge aller möglichen Linearkombinationen von X
Auf Seite 210 erklären wir in einem ausführlichen Bei-
schreiben wir -X., d. h.
spiel einen weiteren, vielleicht etwas ungewöhnlichen Vek-
n
torraum. Diese vorgestellte Vielfalt von Vektorräumen zeigt, !
wie allgemein dieser Begriff eines Vektorraums ist. Um so -X. = λi v i | n ∈ N, λi ∈ K, v i ∈ X, i = 1, . . . , n ,
ungewöhnlicher ist es, dass man alle Vektorräume, die es gibt, i=1
allein durch Angabe des Grundkörpers K und einer zwei-
und sagen, -X. ist das Erzeugnis oder die Hülle von X oder
ten Größe, nämlich der Dimension, bis auf die Bezeichnung
-X. werde durch X erzeugt. Ist X = {v 1 , . . . , v n } eine end-
der Elemente charakterisieren kann. Wir werden dieses Er-
liche Menge, so schreiben wir einfacher
gebnis in dieser Allgemeinheit nicht herleiten können, aber
wenigstens den endlichdimensionalen Fall können wir im -v 1 , . . . , v r . anstelle von -{v 1 , . . . , v n }.
Kapitel 12 behandeln. Zunächst führen wir den Begriff der
Dimension ein. und erhalten für ein solches endliches X = {v 1 , . . . , v n }:
-X. = {λ1 v 1 + · · · + λn v n | λ1 , . . . , λn ∈ K}
Kommentar: Ein K-Vektorraum hat eine Vektoraddition
+ und eine Multiplikation · mit Skalaren. Bei vielen Vektor- = K v1 + · · · + K vn .
räumen kann man zusätzlich eine Multiplikation von Vek-
toren erklären, wobei das Ergebnis wieder ein Vektor ist. Achtung: Oftmals wird der Fehler gemacht, die Menge K
Beispiele sind etwa das bekannte Vektorprodukt × im Vek- in dieser letzten Darstellung auszuklammern. Aber beispiels-
torraum R3 oder die Multiplikation von Polynomen in K[X]. weise gilt
Falls nun in einem K-Vektorraum V eine solche Multiplika- ' ( ' ( '' ( ' (( ' (
1 0 1 0 1
tion " von Vektoren gegeben ist, mit der Eigenschaft, dass R +R = R + =R .
0 1 0 1 1
für alle λ ∈ K und v, w ∈ V die Verträglichkeitsgesetze
λ (v " w) = (λ v) " w = v " (λ w)
Kommentar: Für -X. ist auch die Bezeichnung spanX
gelten, so nennt man V eine K-Algebra. Der R3 mit dem
üblich. Anstelle von der von X erzeugten Menge spricht man
Vektorprodukt und K[X] mit der Multiplikation von Poly-
auch von der von X aufgespannten Menge.
nomen sind somit K-Algebren.
Problemanalyse und Strategie: Es ist zu zeigen, dass die Menge aller magischen Quadrate nichtleer ist. Sodann sind
(U1) und (U2) nachzuprüfen.
⎛ c c c ⎞
Lösung: 3 3 3
Für c ∈ R bezeichne Mc die Menge aller reellen 3 × 3- A=⎝ c c c ⎠
3 3 3
c c c
Matrizen ⎛ ⎞ 3 3 3
a11 a12 a13
A = ⎝ a21 a22 a23 ⎠ in Mc ; somit ist Mc also für kein c ∈ R die leere Menge.
a31 a32 a33 Doch folgt aus A, B ∈ Mc bei c = 0 stets A + B ∈ Mc .
mit der Eigenschaft, dass alle Zeilensummen, Spaltensum- Lediglich M0 ist ein Untervektorraum, da 0 ∈ M0 , und
men und Diagonalsummen von A gleich c sind. mit A, B ∈ M0 und λ ∈ R auch A + B, λ A ∈ M0 gilt.
Dann ist M = c∈R Mc die Menge aller magischen 3×3- Kommentar:
Quadrate. Nun zeigen wir, dass M ein Untervektorraum Analog kann man die hier gemachten Behauptungen
des reellen Vektorraums R3×3 ist. auch für magische n × n-Quadrate mit n ≥ 2 begrün-
Es ist M = c∈R Mc nichtleer, weil 0 ∈ M0 ⊆ M. Sind den.
A, B ∈ M, so gibt es c, c ∈ R mit A ∈ Mc und B ∈ Mc . Oftmals fordert man bei magischen n × n-Quadraten,
Dann ist A + B ∈ Mc+c ⊆ M. Und mit A ∈ Mc und dass alle Ziffern von 1 bis n2 als Einträge im Quadrat
λ ∈ R ist λ A ∈ Mλ c ⊂ M. Somit ist M ein Untervektor- vorkommen.
raum von R3×3 und damit ein reeller Vektorraum.
?
Wir erwähnen, dass Mc für c ∈ R im Allgemeinen kein Können Sie magische 2 × 2-Quadrate angeben?
Untervektorraum von M ist: Zwar liegt für jedes c ∈ R
x2 x2
- 01 , 01 . = R 01 + R 01
1
- 01 . = R 01
e1 x1
1 x1
-X. ist der kleinste Untervektorraum, der X umfasst So ist zum Beispiel der R-Vektorraum R2 endlich erzeugt, es
gilt nämlich: <' ( ' (=
Für jede Menge X eines K-Vektorraums V gilt:
1 0
(a) -X. ist ein Untervektorraum von V , R2 = , .
0 1
(b) X ⊆ -X.,
(c) -X. ist der Durchschnitt all derjenigen Untervektor- Wir verallgemeinern dies und kehren zu unseren ersten Bei-
räume von V , welche X umfassen. spielen von Vektorräumen zurück.
p = X m+1 nicht als Linearkombination von E darstellen, Definition der linearen Unabhängigkeit
da ja jedes Polynom aus E einen Grad kleiner oder gleich m
Verschiedene Vektoren v 1 , . . . , v r ∈ V heißen linear
hat. Und das ist ein Widerspruch. Somit kann es kein end-
unabhängig, wenn für jede echte Teilmenge T von
liches Erzeugendensystem für K[X] geben, d. h., K[X] ist
{v 1 , . . . , v r } gilt -T . -v 1 , . . . , v r ..
nicht endlich erzeugt.
Eine Menge X ⊆ V heißt linear unabhängig, wenn je
? endlich viele verschiedene Elemente aus X linear unab-
hängig sind.
Besitzt jeder Vektorraum ein Erzeugendensystem?
Eine nicht linear unabhängige Menge heißt linear ab-
hängig.
Gerade bei den Aufgaben trifft man oft auf die Frage, ob ein
gegebener Vektor v im Erzeugnis einer Teilmenge X eines
K-Vektorraums V liegt, d. h., ob v ∈ -X. gilt. Diese Frage-
stellung führt meistens auf das Lösen eines linearen Glei-
?
Sind Teilmengen linear unabhängiger Mengen linear unab-
chungssystems. Wir behandeln diese Problematik für den hängig?
Fall von Spaltenvektoren in einem ausführlichen Beispiel auf
Seite 202.
Linear unabhängige Mengen sind also unverkürzbare Men-
Lineare Unabhängigkeit bedeutet: Mit gen; weniger Vektoren erzeugen auch weniger Raum.
weniger klappt es nicht! Hingegen enthält eine linear abhängige Menge einen Vek-
' ( ' ( tor, der in der Hülle der anderen Vektoren liegt und daher
2 1 weggelassen werden kann, ohne die Hülle zu verkleinern.
Im R2 seien die drei Vektoren u = ,v = und
' ( 0 2
−1
w= gegeben. Beispiel
2
Für jedes v ∈ V ist ∅ die einzige echte Teilmenge von {v}.
x2 Im Fall v = 0 gilt: Der Nullvektor 0 ist linear abhängig,
da ∅ {0} und -∅. = {0} = -0. gilt. Für v = 0 jedoch
w 2 v gilt: -∅. -v., sodass v linear unabhängig ist.
Wir betrachten die drei Vektoren
' ( ' ( ' (
1 1 −3 1
v1 = , v2 = , v3 = ∈ R2 .
2 −1 −3
u
−1 1 2 x1 Die Menge {v 1 , v 2 , v 3 } ist linear abhängig. Aus v 3 =
−2 v 1 − v 2 folgt nämlich -v 1 , v 2 . = -v 1 , v 2 , v 3 ., und
−1 es gilt {v 1 , v 2 } {v 1 , v 2 , v 3 }.
Abbildung 6.6 Die drei Vektoren u, v, w im R2 .
Dafür ist die Menge {v 1 , v 2 } linear unabhängig, weil jede
Wir betrachten nun echte Teilmenge dieser Menge, also ∅ oder {v 1 } oder
{v 2 }, jeweils auch einen echt kleineren Vektorraum er-
U = -u, v, w. = R u + R v + R w . zeugt (Abb. 6.7).
Durch Lösen eines linearen Gleichungssystems (oder durch
Probieren) erhalten wir x2
u = v − w, v = u + w, w = −u + v .
v1
Wir können also jeden der drei Vektoren mithilfe der jeweils
anderen beiden linear kombinieren, d. h. darstellen, sodass
also
U = -u, v, w. = -u, v. = -u, w. = -v, w. x1
−2 2
Falls dies so ist, gebe man eine Darstellung von v als Linearkombination von X an.
(∗) λ1 v 1 + · · · + λ4 v 4 = v ,
wobei wir kurzerhand die vier Vektoren aus X (der Reihe nach) mit v 1 , . . . , v 4 bezeichnen. Wir fassen λ1 , . . . , λ4 als
Unbekannte auf und überprüfen das (dann reelle) lineare Gleichungssystem (∗) für die beiden Fälle (1) und (2) auf
Lösbarkeit. Die Lösbarkeit von (∗) bedeutet, dass v als Linearkombination von X darstellbar ist. Den Vektor v als
Linearkombination von X darzustellen, bedeutet dabei, eine Lösung (λ1 , . . . , λ4 ) anzugeben.
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
Da die Definition der linearen Unabhängigkeit etwas unhand- 0 0 0
lich ist, wenn man die lineare Unabhängigkeit einer gege- Es sind v 1 = ⎝1⎠ , v 2 = ⎝1⎠ , v 3 = ⎝0⎠ ∈ R3 linear
benen Menge von Vektoren nachweisen will, wäre es sehr 0 1 1
nützlich, wenn wir ein leicht nachprüfbares Kriterium für abhängig, denn
die lineare Unabhängigkeit zur Hand hätten. Und ein solches (−1) v 1 + 1 v 2 + (−1) v 3 = 0 .
gibt es auch, wir leiten es nun her.
Ein linear unabhängiges Erzeugendensystem Im Vektorraum K[X] der Polynome über einem Körper K
nennt man Basis bildet die Menge {X k | k ∈ N0 } eine Basis, die Standard-
basis oder kanonische Basis von K[X].
⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
Wir reduzieren Vektorräume auf Basen, weil wir Vektor- ⎨ 0 0 0 ⎬
räume möglichst ökonomisch schreiben wollen – kennt man Die Menge ⎝1⎠ , ⎝1⎠ , ⎝0⎠ ist keine Basis des R3 ,
⎩ ⎭
die Basis, dann kennt man den Vektorraum. 0 1 1
' ( da sie linear abhängig ist.
v ⎧⎛ ⎞ ⎛ ⎞⎫
Jeder Vektor 1 des R2 lässt sich als Linearkombination
v2 ' ( ' ( ⎨ 0 0 ⎬
der beiden Vektoren v =
2
und w =
1 Die Menge B = ⎝1⎠ , ⎝1⎠ ist eine Basis von -B.,
0 2
darstellen, da ⎩ ⎭
0 1
das lineare Gleichungssystem aber nicht des R3 .
' ( Für einen Körper K und Zahlen r ∈ {1, . . . , m} und
2 1 v1
0 2 v2 s ∈ {1, . . . , n} definieren wir die m · n sogenannten
Standard-Einheitsmatrizen aus Km×n ,
für alle v1 , v2 ∈ R (eindeutig) lösbar ist.
Ers = (aij ) mit ars = 1 und aij = 0 sonst.
Zudem sind v und w linear unabhängig, da das lineare Glei-
chungssystem Dann ist die Menge
' (
2 1 0
B = {Ers | r ∈ {1, . . . , m}, s ∈ {1, . . . , n}}
0 2 0
nur die triviale Lösung (0, 0) hat. eine Basis des Km×n , da für eine beliebige Matrix A =
(aij )i,j ∈ Km×n gilt:
Es ist also {v, w} ein linear unabhängiges Erzeugenden-
system des R2 . !
m !
n
A = (aij )i,j = λij Eij ,
i=1 j =1
Definition einer Basis
Eine Teilmenge B eines K-Vektorraums V heißt Basis sodass B ein Erzeugendensystem von Km×n ist. Zudem
von V , wenn gilt: folgt aus
-B. = V , ⎛ ⎞
λ11 · · · λ1n
B ist linear unabhängig. !!
m n
⎜ .. ⎟ = 0
λij Eij = ⎝ ... . ⎠
i=1 j =1 λm1 · · · λmn
Basen sind somit linear unabhängige Erzeugendensysteme
(siehe Abb. 6.8).
sofort λij = 0 für alle i und j , und damit, dass B linear un-
abhängig ist. Also ist B tatsächlich eine Basis von Km×n .
Teilmengen von V Auch diese nennt man Standardbasis oder kanonische
Basis des Km×n .
In dem Beispiel auf Seite 202 haben wir gezeigt, dass ein
Abbildung 6.8 Basen sind linear unabhängige Erzeugendensysteme.
Vektor v im Allgemeinen durch viele verschiedene Linear-
kombinationen einer Menge X gebildet werden kann. Ist aber
X eine Basis, so ist die Linearkombination eindeutig, das be-
? sagt der Satz:
Kann es sein, dass ein Vektorraum genau eine Basis besitzt?
En = {e1 , . . . , en } v = λ 1 b 1 + · · · + λn b n
der Standard-Einheitsvektoren eine Basis des die so- Kn , mit λ1 , . . . , λn ∈ K und b1 , . . . , bn ∈ B darstellen.
genannte Standardbasis oder kanonische Basis des Kn .
6.4 Basis und Dimension 205
Beweis: Weil eine Basis B von V insbesondere ein Er- ein Erzeugendensystem von V ist, aber jede echte Teil-
zeugendensystem von V ist, existieren zu jedem v ∈ V Vek- menge von B den Vektorraum V nicht mehr erzeugt,
toren b1 , . . . , br ∈ B und von null verschiedene λ1 , . . . , λr
so ist B bereits eine Basis, das besagt der folgende Satz. Bevor
∈ K \ {0} mit
wir den Satz formulieren, wiederholen wir eine Sprechweise
v = λ1 b1 + · · · + λr br . (6.3) aus Kapitel 2: Die Potenzmenge
Es sei P (V ) = {X | X ⊆ V } ,
v = λ1 b1 + · · · + λs bs (6.4)
das ist die Menge aller Teilmengen von V , ist nach den
eine weitere Linearkombination mit b1 , . . . , bs ∈ B und Beispielen auf Seite 51 mit der Inklusion ⊆ eine geordnete
λ1 , . . . , λs ∈ K \ {0}. Menge. Das gilt analog für jede Teilmenge M ⊆ P (V ), d. h.
Angenommen, es gibt ein j ∈ {1, . . . , s} mit bj = bi für alle für jede Menge M von Teilmengen von V . Ein Element B
i ∈ {1, . . . , r}. Dann gilt für die Differenz der Gleichungen von M ist bezüglich der Ordnung ⊆ ein
in (6.3) und (6.4): maximales Element, falls es in M kein Element C gibt mit
C B, und ein
!
r !
s
0= λi b i − λi bi minimales Element, falls es in M kein Element C gibt mit
i=1 i=1 C B.
!
r !
s
Man vergleiche hierzu die Ausführungen auf Seite 51. Mit-
= λi b i − λi bi − λj bj .
hilfe dieser Begriffe können wir nun die oben angedeuteten
i=1 i=1
i=j Kennzeichnungen von Basen knapp formulieren.
Basen sind maximale linear unabhängige Durch Umstellen erhalten wir hieraus
Mengen und minimale Erzeugendensysteme !
n
λi v i + (−1) v = 0 .
Will man zeigen, dass eine Teilmenge B eines K-Vektor- i=1
raums V eine Basis ist, so ist zu begründen, dass B ein linear
Dies besagt aber, dass v 1 , . . . , v n , v linear abhängig sind.
unabhängiges Erzeugendensystem ist.
Somit ist auch B ∪ {v} linear abhängig.
Unter gewissen Voraussetzungen reicht es aus, eine dieser
(ii) ⇒ (iii): Es sei B eine maximale linear unabhängige Teil-
beiden Eigenschaften nachzuweisen. Kann man nämlich be-
menge von V .
gründen, dass eine Teilmenge B
1. B ist ein Erzeugendensystem von V , d. h. V = -B.: Dazu
linear unabhängig ist, aber jede andere, B echt umfassende
ist nur V ⊆ -B. zu zeigen. Wir wählen ein v ∈ V beliebig.
Teilmenge von V linear abhängig ist
Im Fall v ∈ B erhalten wir wie gewünscht v ∈ -B.. Daher
oder nehmen wir nun an v ∈ B. Nach Voraussetzung ist dann
206 6 Vektorräume – von Basen und Dimensionen
B ∪ {v} linear abhängig. Somit gibt es v 1 , . . . , v n ∈ B und und zum anderen es keine kleinere Teilmenge von V gibt, die
λ, λ1 , . . . , λn ∈ K, die nicht alle gleich null sind, mit dies möglich macht, da B ein minimales Erzeugendensystem
ist.
!
n
λv + λi v i = 0 . Daher wäre es sehr wünschenswert, wenn jeder Vektorraum
i=1 auch eine Basis enthalten würde. Dass dem wirklich so ist,
Da die Vektoren v1 , . . . , v n linear unabhängig sind, muss folgern wir aus dem folgenden allgemeinen Satz.
λ = 0 gelten. Nun stellen wir um:
Basisergänzungssatz
!
n
−1
v=− (λ λi )v i ∈ -B. . Es sei V ein K-Vektorraum. Weiter seien S ⊆ V ein
i=1 Erzeugendensystem und A ⊆ S eine linear unabhängige
Teilmenge,
Da dies für alle v ∈ V gilt, folgt V = -B..
A⊆S⊆V.
2. B ist ein minimales Erzeugendensystem von V : Wir wäh-
Dann gibt es eine Basis B von V mit A ⊆ B ⊆ S.
len ein v ∈ B und zeigen, dass -B \ {v}. kein Erzeugen-
densystem von V ist. Dazu zeigen wir, dass bereits der Vek- Man sagt: „Die linear unabhängige Menge A wird durch
tor v ∈ V nicht in -B \ {v}. liegt. Angenommen, es gilt Elemente des Erzeugendensystems S zu einer Basis B
v ∈ -B \ {v}.. Dann existieren v 1 , . . . , v n ∈ B \ {v} und von V ergänzt.“
λ1 , . . . , λn ∈ K mit
!
n
Beweis: Wir zeigen die Behauptung mit dem Zorn’schen
v= λi v i .
Lemma (Seite 52).
i=1
Dazu betrachten wir die Menge
Durch Umstellen erhalten wir hieraus
!
n M = {X | X ist linear unabhängig und A ⊆ X ⊆ S} ,
λi v i + (−1) v = 0 .
i=1 die bezüglich der Inklusion geordnet ist. Wir zeigen, dass
(M, ⊆) eine nichtleere, induktiv geordnete Menge ist. Das
Da bei dieser Linearkombination des Nullvektors nicht alle
Zorn’sche Lemma garantiert in diesem Fall die Existenz eines
Koeffizienten null sind, sind die Vektoren v, v 1 , . . . , v n
maximalen Elements.
linear abhängig. Das ist aber ein Widerspruch zur linearen
Unabhängigkeit der Menge B. Dieser Widerspruch belegt, Da die linear unabhängige Menge A natürlich A ⊆ A erfüllt,
dass v ∈ -B \ {v}. liegt. Somit ist B ein minimales Erzeu- gilt A ∈ M, sodass M nichtleer ist. Es sei C ⊆ M eine
gendensystem von V . nichtleere linear geordnete Teilmenge von M. Wir betrachten
(iii) ⇒ (i): Es sei B ein minimales Erzeugendensystem. Dann die Vereinigung der Elemente aus C:
ist B insbesondere ein Erzeugendensystem. Da B per Defi-
nition linear unabhängig ist (siehe Seite 201), folgt die Be- Y = X. (6.5)
X∈C
hauptung.
Die Menge B ∪ {v} ist wegen der Maximalität von B linear V , so ist für λ1 , . . . , λn ∈ K \ {0} auch B = {λ1 v 1 , . . . ,
abhängig. Also existieren v 1 , . . . , v n ∈ B und λ, λ1 , . . . , λn λn v n } eine Basis. Aber es wichtig, dass die Elementzahl einer
∈ K, die nicht alle gleich null sind, mit Basis eindeutig bestimmt ist.
!
n
λv + λi v i = 0 .
Die Dimension ist die Mächtigkeit einer und
i=1
damit jeder Basis
Da die Menge B linear unabhängig ist, muss λ = 0 gelten,
wir erhalten ' ( ' (
2 1
!n Im R2 gilt für die drei Vektoren u = ,v = und
v = −λ−1 λi v i . ' ( 0 2
−1
i=1 w=
2
Folglich gilt S ⊆ -B..
Da wir zeigen wollen, dass in V eine Basis B mit A ⊆ Wir betrachten die Vereinigung all dieser Teilmengen,
B ⊆ S existiert, haben wir nach der Kennzeichnung von
Basen auf Seite 209 im Wesentlichen drei Möglichkeiten. (∗) Y = X,
Wir zeigen, dass es in V ein X∈C
linear unabhängiges Erzeugendensystem oder und begründen, dass Y eine obere Schranke von C ist und
eine maximale linear unabhängige Teilmenge oder Y ∈ M gilt. Die erste Behauptung ist klar: Es gilt offenbar
ein minimales Erzeugendensystem X ⊆ Y für alle X ∈ C. Nun zeigen wir, dass Y ∈ M gilt.
mit A ⊆ B ⊆ S gibt. Da wir in einem beliebigen Vek- Dazu ist zu begründen, dass zum einen A ⊆ Y ⊆ S und
torraum V keine Möglichkeit haben, Erzeugendensys- zum anderen Y linear unabhängig ist.
teme anzugeben, um sie auf lineare Unabhängigkeit oder (iii.a) Es gilt A ⊆ Y , da C nichtleer und A ⊆ X für jedes
Minimalität hin zu überprüfen, fallen die erste und die X ∈ C ist. Außerdem gilt Y ⊆ S, da Y eine Vereinigung
dritte Möglichkeiten weg. Da wir aber andererseits das von Teilmengen von S ist. Somit gilt A ⊆ Y ⊆ S.
Zorn’schne Lemma kennen (Seite 52), das die Existenz (iii.b) Die Menge Y ist linear unabhängig: Es seien dazu
maximaler Elemente garantiert, ist es nur naheliegend, v 1 , . . . , v n ∈ Y gewählt. Weil Y Vereinigung von Teil-
dass wir es damit versuchen. mengen X ∈ C ist (siehe (∗)), gibt es Teilmengen
Wir zeigen, dass eine maximale linear unabhängige Teil- X1 , . . . , Xn ∈ C mit v i ∈ Xi . Nun beachten wir, dass
menge B von S existiert, die A enthält. Wir können dann die Menge C total geordnet ist. Hiernach gibt es unter den
zwar nicht die Kennzeichnungen von Basen auf Seite 209 endlich vielen X1 , . . . , Xn ein bezüglich der Inklusion ⊆
anwenden, da wir nur eine maximale linear unabhängige größtes Element Xj , j ∈ {1, . . . , n}, d. h. X1 , . . . , Xn ⊆
Teilmenge von S und noch nicht notwendig von V haben, Xj . Es liegen damit alle Vektoren v 1 ∈ X1 , . . . , v n ∈ Xn
aber wir werden zeigen, dass diese Menge B aufgrund ih- in diesem Xj . Da Xj ein Element aus M ist, ist die Menge
rer Maximalität die Eigenschaft -B. = -S. hat. Wegen Xj linear unabhängig, wonach also auch die Vektoren
-S. = V erhalten wir das gewünschte Ergebnis: B ist eine v 1 , . . . , v n ∈ Xj linear unabhängig sind.
Basis von V . Wie schon angekündigt, betrachten wir die In (iii.a) und (iii.b) haben wir gezeigt, dass Y ∈ M gilt. So-
Menge mit ist (M, ⊆) induktiv geordnet. Nach dem Zorn’schen
Lemma besitzt (M, ⊆) ein maximales Element, das wir
M = {X | X ist linear unabhängig und A ⊆ X ⊆ S}
mit B bezeichnen. Da diese Teilmenge B von V in M
und ordnen diese mit der Inklusion, es ist (M, ⊆) eine ge- liegt, ist B linear unabhängig. Um zu zeigen, dass B eine
ordnete Menge. Gesucht ist nun ein maximales Element Basis ist, reicht es aus zu begründen, dass B den Vektor-
in M bezüglich ⊆. raum V erzeugt, -B. = V .
Falls M endlich ist, existiert ein solches maximales Ele- Die Inklusion -B. ⊆ V gilt wegen B ⊆ V . Wir begrün-
ment B, denn aus der Annahme, ein maximales Element den die Inklusion V ⊆ -B.. Wegen V = -S. folgt die
würde nicht existieren, könnten wir folgern, dass wir gewünschte Inklusion aus der Inklusion S ⊆ -B., da in
in M eine nicht abbrechende Inklusionskette der Form diesem Fall -S. ⊆ -B. folgt.
B1 B2 · · · mit Elementen Bi ∈ M bilden könnten. Es sei v ∈ S. Im Fall v ∈ B gilt natürlich v ∈ -B.. Daher
Das wäre ein Widerspruch zur Endlichkeit von M. können wir annehmen, dass v ∈ B gilt. Dann erhalten wir
Die Schwierigkeit besteht im Fall eines unendlichen M.
Für diesen Fall setzen wir das Zorn’sche Lemma ein. Das A ⊆ B B ∪ {v} ⊆ S .
Zorn’sche Lemma garantiert die Existenz von maximalen Die Menge B ∪ {v} muss linear abhängig sein. Wäre sie
Elementen in nichtleeren, induktiv geordneten Mengen. es nicht, so läge B ∪ {v} in M – das wäre ein Widerspruch
Wir müssen also nur begründen, dass (M, ⊆) nichtleer zur Maximalität von B in (M, ⊆).
und induktiv geordnet ist. Das zeigen wir in mehreren Da B ∪ {v} linear abhängig ist, existieren v 1 , . . . , v n ∈ B
Schritten. und λ, λ1 , . . . , λn ∈ K, die nicht alle gleich null sind, mit
(i) Da die linear unabhängige Menge A natürlich A ⊆ A
erfüllt, gilt A ∈ M, sodass M nichtleer ist. !
n
λv + λi v i = 0 .
(ii) Nach den Beispielen auf Seite 51 ist (M, ⊆) eine ge-
i=1
ordnete Menge.
(iii) Jede linear geordnete Teilmenge von M hat eine obere Da die Menge B linear unabhängig ist, muss λ = 0 gelten,
Schranke in (M, ⊆): wir erhalten
!n
Es sei C ⊆ M eine linear geordnete Teilmenge von M. v = −λ−1 λi v i .
Man beachte, dass die Elemente von C nun Teilmengen i=1
von V sind, die A umfassen und in S liegen. Folglich gilt S ⊆ -B.. Damit ist alles gezeigt.
6.4 Basis und Dimension 209
Nun setzen wir S = (S \ {v 1 }) ∪ {v} und erhalten v 1 ∈ -S .. Für jeden Körper K gilt dim(K[X]) = ∞, da {X k |
Es folgt S ⊆ -S .. Somit ist auch S ein Erzeugendensystem k ∈ N0 } eine nicht endliche Basis bildet.
von V , d. h. -S . = V . Die Dimension des R-Vektorraums C ist 2, da {1, i} eine
Basis bildet. Weiter ist {1} eine Basis von C über C, sodass
Für das Erzeugendensystem S gilt wegen v ∈ S und
C als C-Vektorraum eindimensional ist.
v ∈ A \ S und v 1 ∈ S \ A:
Die Lösungsmenge L eines homogenen linearen Glei-
|S \ A| = |S \ A| − 1 = n . chungssystems A x = 0 mit einer Matrix A ∈ Km×n ist,
wie wir bereits in einem Lemma auf Seite 197 formuliert
Wegen der Induktionsvoraussetzung gilt |A| ≤ |S |. Aber es haben, ein Untervektorraum des Kn . Die Dimension die-
gilt auch |S | = |S|. Somit ist die Behauptung |A| ≤ |S| ses Untervektorraums L ist die Anzahl der frei wählbaren
nachgewiesen. Variablen, also
dim L = n − rg A .
Nun können wir das angekündigte Ergebnis folgern:
Man beachte den Satz auf Seite 184.
Folgerung (F)
alls der K-Vektorraum V ein endliches Erzeugenden-
system hat, so sind alle Basen endlich und haben gleich
viele Elemente. Wie findet man Basen?
Beweis: Sind B1 und B2 zwei Basen von V , so liefert der Eine Basis ist ein linear unabhängiges Erzeugendensystem.
obige Satz zuerst |B1 |, |B2 | ∈ N0 , und dann mit B1 in der Zum Nachweis dieser beiden Eigenschaften sind die folgen-
Rolle von A und B2 in der Rolle von S: den Aussagen nützlich:
|B1 | ≤ |B2 | .
Kennzeichnungen endlicher Basen
Nun vertauschen wir die Rollen von B1 und B2 und erhalten Es sei V ein K-Vektorraum der endlichen Dimension
n ∈ N0 .
|B2 | ≤ |B1 | .
(i) Je n linear unabhängige Vektoren bilden eine Basis.
Insgesamt ist damit |B1 | = |B2 | gezeigt.
(ii) Jedes Erzeugendensystem mit n Elementen bildet
eine Basis.
(iii) Für jeden Untervektorraum U ⊆ V gilt dim(U ) ≤
Da je zwei Basen endlich erzeugter Vektorräume gleich viele dim(V ).
Elemente haben, ist die folgende Definition sinnvoll: (iv) Für einen Untervektorraum U ⊆ V mit dim(U ) =
dim(V ) gilt U = V .
Die Dimension eines Vektorraums (v) Mehr als n Vektoren sind stets linear abhängig.
Ist B eine Basis eines endlich erzeugten Vektorraums (vi) Weniger als n Vektoren bilden kein Erzeugenden-
V , so nennt man die Elementzahl einer und damit jeder system.
Basis von V die Dimension von V . Wir schreiben dafür
dim(V ) = |B| . Beweis: (i) Nach dem Austauschsatz von Steinitz ist jede
Menge {v1 , . . . , v n } linear unabhängiger Vektoren von V
Ist V nicht endlich erzeugt, so setzen wir eine maximale linear unabhängige Teilmenge von V und so-
mit eine Basis.
dim(V ) = ∞ .
(ii) Nach dem Austauschsatz von Steinitz ist jedes Erzeu-
Im ersten Fall nennt man V endlichdimensional, im gendensystem {v 1 , . . . , v n } mit n Elementen ein minimales
zweiten Fall unendlichdimensional. Erzeugendensystem von V und somit eine Basis.
(iii) Es sei BU eine Basis von U . Nach dem Basisergänzungs-
Beispiel satz existiert eine Basis BV von V mit BU ⊆ BV . Hieraus
Es gilt dim({0}) = 0, da ∅ eine Basis von {0} ist und folgt |BU | ≤ |BV |.
|∅| = 0 gilt.
Für jeden Körper K und jede natürliche Zahl n gilt (iv) Dies folgt aus dem Beweis von (iii), da unter der Voraus-
dim(Kn ) = n, da En = {e1 , . . . , en } eine Basis ist und setzung dim(U ) = dim(V ) sogleich BU = BV und somit
|En | = n gilt. U = V folgt.
Für jeden Körper K und alle natürlichen Zahlen m, n gilt
(v) Das folgt aus (iii).
dim(Km×n ) = m · n, da B = {Er,s | r ∈ {1, . . . , m},
s ∈ {1, . . . , n}} eine Basis ist und |B| = m n gilt. (vi) Das folgt aus (iv).
210 6 Vektorräume – von Basen und Dimensionen
Beispiel: Der Vektorraum aller Abbildungen mit endlich vielen von null verschiedenen Werten
Für einen Körper K und eine nichtleere Menge M definieren wir
Es ist V also eine Teilmenge von KM , dem Vektorraum aller Abbildungen von M nach K (Seite 195). Wir zeigen:
(a) V ist ein K-Vektorraum.
(b) Für jedes y ∈ M betrachten wir die Abbildung δy : M → K mit
1 , falls x = y,
δy (x) =
0 , sonst
Problemanalyse und Strategie: Für den Teil (a) zeigen wir, dass V ein Untervektorraum von KM ist. Bei Teil
(b) müssen wir beachten, dass die Menge B durchaus unendlich sein kann. Somit ist es hier notwendig, die lineare
Unabhängigkeit von B dadurch zu beweisen, dass man die lineare Unabhängigkeit jeder endlichen Teilmenge von B
beweist.
Insbesondere ist nun auch klar, dass die Untervektorräume für alle x ∈ Q. Nun setzen wir x = 1, x = −1 und x = 2 ein.
der Dimension 1 bzw. 2 des R3 die Form R a mit a = 0 Das liefert ein lineares Gleichungssystem für die a1 , a2 , a3 :
bzw. R a + R b mit a, b = 0 und R a = R b, also mit li-
near unabhängigen Vektoren a, b, haben. Außer diesen und a1 1 + a2 1 + a3 1 = 0
den trivialen Untervektorräumen {0} und R3 existieren keine a1 (−1) + a2 1 + a3 (−1) = 0
weiteren Untervektorräume im R3 .
a1 2 + a2 4 + a3 8 = 0
? Die Koeffizientenmatrix dieses homogenen linearen Glei-
Welche reellen Zahlen bilden eine Basis des reellen Vektor-
raums R ? chungssystems lautet
⎛ ⎞
1 1 1
⎝ −1 1 −1 ⎠
Beispiel Wir betrachten den K-Vektorraum KK aller Ab- 2 4 8
bildungen von K nach K. Für i ∈ N0 sei p i ∈ KK die Poly-
nomfunktion Mit dem Gauß-Algorithmus sieht man, dass dieses Sys-
K → K, tem nur die Lösung (0, 0, 0) besitzt. Also ist {p0 , p1 ,
pi :
x → x i . p 2 , p 3 } linear unabhängig, also eine Basis und somit
Wir bestimmen jeweils die Dimension des von {p0 , p1 , dim(U ) = 4.
p2 , p 3 } aufgespannten Untervektorraums von KK für die
Fälle
p1 = p2 = p3 ,
(b) K = Z3 : Analog zu K = Z2 sieht man, dass {p0 , p1 , p2 } und nennt U + W die Summe der Untervektorräume U
eine Basis von U ist, also dim(U ) = 3. und W .
(c) K = Q: Wir zeigen, dass {p 0 , p 1 , p2 , p3 } linear unab- Offenbar ist U + W wieder ein Untervektorraum von V .
hängig ist, sodass {p 0 , p 1 , p2 , p3 } eine Basis von U ist.
Es seien a0 , a1 , a2 , a3 ∈ Q mit ?
Wieso ist U + W ein Untervektorraum?
(∗) a0 p 0 + a1 p1 + a2 p2 + a3 p 3 = 0 ∈ KK
sodass a0 = 0 gilt. Wir setzen a0 = 0 in (∗) ein und erhalten Gegeben seien u ∈ U und w ∈ W . Da -MU . aus allen
Linearkombinationen von Elementen aus MU besteht, exis-
a1 p 1 (x) + a2 p 2 (x) + a3 p 3 (x) = 0 tieren r ∈ N0 , u1 , . . . , ur ∈ MU und λ1 , . . . , λr ∈ K mit
212 6 Vektorräume – von Basen und Dimensionen
Problemanalyse und Strategie: Bei (1) entferne man so lange Vektoren aus dem Erzeugendensystem E, bis ein linear
unabhängiges Erzeugendensystem verbleibt.
Bei (2) füge man zu der linear unabhängigen Menge E so lange weitere, zu den Vektoren aus E linear unabhängige
Elemente von V hinzu, bis ein linear unabhängiges Erzeugendensystem entsteht. Dabei muss man sich nach jedem
Hinzufügen eines Vektors vergewissern, dass die dann größere Menge nach wie vor linear unabhängig ist.
Die Nachrichtenquelle gibt eine Folge von Bits 0 oder 1 in den Kanal ein. Der Kanal ist gestört, d. h. hin und wieder wird ein Bit
als das entgegengesetzte Bit vom Kanal an den Empfänger weitergereicht. Um diese Störung zu bekämpfen, schalten wir vor
bzw. hinter den Kanal einen Codierer bzw. Decodierer. Der Codierer fasst je k (zum Beispiel k = 4) von der Nachrichtenquelle
ausgegebene Bits zu einem Informationsblock zusammen. Dann berechnet er in Abhängigkeit vom Informationsblock r
(im Beispiel r = 4) Kontrollbits, fasst diese zu einem Kontrollblock zusammen und sendet das Codewort, das ist das
Paar (Informationsblock, Kontrollblock), an den Kanal. Die Zuordnung Informationsblock → Codewort heißt Codierung. Der
Kanal gibt nach Eingabe des Codewortes ein Kanalwort der Länge k + r aus. Als Kanalwort kann prinzipiell jedes der
2k+r möglichen Bit-Wörter der Länge k + r auftreten (im Beispiel also jedes der 256 Bytes). Die Kanalstörungen können ja
jedes Bit verfälschen; wir gehen aber davon aus, dass die Bit-Störungen selten und unabhängig voneinander auftreten. Der
Decodierer versucht, aus der Kenntnis des Kanalwortes das ursprünglich gesendete Codewort zu rekonstruieren; die ersten
k Bits des geschätzten Codewortes reicht der Decodierer als seine Mutmaßung des tatsächlich von der Nachrichtenquelle
ausgegebenen Informationsblocks an den Empfänger weiter. Der Bauer-Code ist ein sogenannter 1-fehlerkorrigierender Code,
d. h., ein geeigneter Decodierer kann die von höchstens einem Bit-Fehler betroffenen Codewörter richtig schätzen.
Ein (binärer) linearer Code der Länge n ist ein Unter- 00000000 10101010 10110100
vektorraum C von Zn2 mit |C| ≥ 2, wobei Z2 = {0, 1} 10000111 10011001 11010010
der Körper mit 2 Elementen ist. Es sei nun C ein sol- 01001011 01100110 11100001
cher linearer Code der Länge n. Für die Elemente x = 00101101 01010101 11111111
(x1 , . . . , xn ) ∈ C schreiben wir kürzer x = x1 . . . xn . 00011110 00110011
Der Hamming-Abstand d(x, y) zweier Codewörter x, 11001100 01111000
y ∈ C ist die Anzahl der Positionen, in denen sich x und
y unterscheiden, d. h. Zum Beweis der Tatsache, dass B ein Z2 -Vektorraum ist,
nutzen wir aus, dass eine Teilmenge C ⊆ Zn2 genau dann
d(x, y) = |{j | 1 ≤ j ≤ n und xj = yj }|. ein linearer Code ist, wenn 0 ∈ C und aus x, y ∈ C stets
x + y ∈ C folgt.
Das Hamming-Gewicht w(x) von x ∈ C ist die An-
zahl der Einsen in x, also w(x) = d(x, 0), wobei Wir schreiben die Elemente aus B in der Form (a, a ∗ ) mit
0 = 00 . . . 0 ∈ Zn2 das Nullwort ist. Für jeden Code a ∈ Z42 und
C ⊆ Zn2 mit |C| ≥ 2 heißen die Zahlen
∗ a, falls w(a) ∈ 2 N0 ,
d(C) = min{d(x, y) | x, y ∈ C, x = y} bzw. a =
a + 1, falls w(a) ∈ 2 N0 ,
w(C) = min{w(x) | x ∈ C, x = 0}
wobei wir zur Abkürzung 1 = 11 . . . 1 geschrieben ha-
der Minimalabstand bzw. das Minimalgewicht.
ben. Es gilt (a, a ∗ ) + (b, b∗ ) = (a + b, a ∗ + b∗ ).
Für x, y ∈ C ist stets auch x + y ∈ C, und x + y = 0 im- Das
einzige Codewort,
das hierfür in Frage kommt, ist
pliziert x = −y = y. Somit gilt d(x, y) = |{i | xi = yi }| a + b, (a + b)∗ . Also ist B genau dann ein linearer
= |{i | xi + yi = 0}| = w(x + y) und schließlich Code, wenn (a + b)∗ = a ∗ + b∗ für alle a, b ∈ Z42 .
d(C) = min{d(x, y) | x, y ∈ C, x = y} Unter Beachtung von 1 + 1 = 0 in Z2 bestätigt man die
= min{w(x + y) | x, y ∈ C, x = y} Formel: w(a + b) ∈ 2 N0 ⇔ w(a) + w(b) ∈ 2 N0 .
Hiermit erhalten wir die Tabelle (für ein c ∈ Z42 schreiben
= min{w(z) | z ∈ C, z = 0} = w(C) . > = 0 im Fall w(c) ∈ 2 N0 und w(c) > = 1 im Fall
wir w(c)
Der Bauer-Code B besteht aus allen Elementen x = w(c) ∈ 2 N0 + 1):
x1 x2 x3 x4 x5 x6 x7 x8 ∈ Z82 , die der folgenden Bedingung w(a)
w(b) w(a + b) a ∗ b∗ (a + b)∗
genügen: 0 0 0 a b a+b
1 0 1 a+1 b a+b+1
a b+1 a+b+1
x5 x6 x7 x8 = 0 1 1
a+1 b+1 a+b
1 1 0
x1 x2 x3 x4 , falls w(x1 x2 x3 x4 ) ∈ 2 N0 , Mit 1 + 1 = 0 erhalten wir in allen Fällen (a + b)∗ =
=
x1 x2 x3 x4 + 1111, falls w(x1 x2 x3 x4 ) ∈ 2 N0 + 1 . a ∗ + b∗ . Der Bauer-Code B ist also ein linearer Code. Da-
mit können wir d(B) bestimmen. Wir erhalten d(B) =
Da x1 x2 x3 x4 ∈ Z42 beliebig gewählt werden kann, gilt w(B) = 4, denn außer 00 . . . 0, 11 . . . 1 haben ja alle
|B| = 16, damit erhalten wir als Elemente von B: Codewörter aus B das Hamming-Gewicht 4.
214 6 Vektorräume – von Basen und Dimensionen
Problemanalyse und Strategie: Wir bestimmen in einem ersten Schritt für k ≤ n die Anzahl der linear unabhängigen
k-Tupel (a 1 , . . . , a k ). In einem zweiten Schritt überlegen wir uns, wie viele verschiedene solche Tupel den gleichen
Vektorraum erzeugen.
Problemanalyse und Strategie: Dazu begründen wir, dass ein magisches Quadrat mit der magischen Zahl c durch
seine erste Zeile festgelegt ist.
Für i = 1, 2, 3 sei Zi die Summe der i-ten Zeile und Es ist dann A ein magisches Quadrat mit der magischen
Si die Summe der i-ten Spalte von A. Es seien ferner Zahl c, d. h., die restlichen Einträge der Matrix A = (aij )
D1 := x11 + x22 + x33 und D2 := x13 + x22 + x31 die stimmen dann automatisch. Es ist etwa a33 = −1/3 x11 +
Diagonalsummen von A. Dann ist 2/3 x12 + 2/3 x13 , also wegen c = x11 + x12 + x13 weiter
D1 + D2 + Z2 + S2 = Z1 + Z2 + Z3 + 3x22 , a33 = −1/3 x11 + 2/3 (c − x11 ) = 2/3 c − x11 .
Wir wollen die Basis noch etwas verschönern. Durch Pro-
also 4 c = 3 c + 3 x22 und somit c = 3 x22 . Damit haben bieren findet man
wir x22 = c/3 bestimmt. Für c = 0 gilt also etwa x22 = 0. ⎛ ⎞
Nun überlegen wir uns, dass das magische Quadrat A 1 −1 0
durch die erste Zeile, d. h. durch die Zerlegung von c in die B 1 = A1 − A2 = ⎝ −1 0 1 ⎠
Summe c = x11 + x12 + x13 bereits eindeutig festgelegt 0 1 −1
⎛ ⎞
ist. Die erste Zeile von A ∈ Mc sei (x11 , x12 , x13 ). Dann 0 1 −1
folgt B 2 = A2 − A3 = ⎝ −1 0 1 ⎠
⎛ ⎞
x11 x12 x13 1 −1 0
A = ⎝ 3 − x11 + x13 c ⎠ ⎛ ⎞
3 + x11 − x13
c c
3 1 1 1
2 2 2
3 c − x13 3 c − x12 3 c − x 11 B 3 = A1 + A2 + A3 = ⎝ 1 1 1 ⎠
Der Eintrag an der Stelle (2, 2) ergibt sich unmittelbar 1 1 1
aus obigem; die Einträge in der letzten Zeile ergeben sich
Die magischen Quadrate B 1 , B 2 , B 3 haben nun eine
dann aus den Bedingungen D1 = c, D2 = c und S2 = c;
schöne Gestalt. Nun müssen wir uns aber natürlich noch
weiter ergeben sich die beiden noch fehlenden Einträge in
davon überzeugen, dass sie eine Basis bilden. Es ist näm-
der mittleren Zeile von A aus den Bedingungen S1 = c
lich keineswegs so, dass beliebige drei Linearkombinatio-
und S3 = c.
nen dreier Basisvektoren wieder drei Basisvektoren bil-
Nun können wir wegen c = x11 + x12 + x13 einfach
den. So folgt etwa schon bei nur zwei Basisvektoren a 1
eine Basis von M angeben, da jedes magische Quadrat
und a 2 aus b1 = a 1 + a 2 und b2 = 2 a 1 + 2 a 2 die Glei-
durch seine erste Zeile eindeutig bestimmt ist: Es ist
chung b1 = b2 .
{A1 , A2 , A3 } mit
⎛ ⎞ Wir müssen uns aber nur davon überzeugen, dass
1 0 0
4 ⎠ B 1 , B 2 , B 3 linear unabhängig sind. Wir machen den üb-
A1 = ⎝ −2 3
1
3 3 , lichen Ansatz. Für λ1 , λ2 , λ3 ∈ R gelte
2 2 −1
3 3 3
⎛ ⎞
0 1 0 λ1 B 1 + λ2 B 2 + λ3 B 3 = 0 ∈ R3×3 .
A2 = ⎝ 1
3
1
3
1
3
⎠,
2 −1 2 Aus dem Eintrag an der Stelle (2, 2) folgt λ3 = 0. Nun
⎛
3 3 3
⎞ betrachten wir die Stelle (1, 1). Es ist dann auch λ2 = 0.
0 0 1 Und schließlich folgt aus dem Eintrag an der Stelle (1, 3)
−2
A3 = ⎝ 4
3
1
3 3
⎠ in der letzten Zeile λ2 = 0.
−1 2 2
3 3 3 Damit ist gezeigt, dass B 1 , B 2 , B 3 linear unabhängig sind.
eine Basis von M: Jedes magische Quadrat ist eine Linear- Es ist also {B 1 , B 2 , B 3 } eine Basis von M.
kombination der magischen Quadrate A1 , A2 , A3 , und Wir merken noch an, dass M ein 3-dimensionaler Unter-
offenbar sind A1 , A2 , A3 linear unabhängig. vektorraum des 9-dimensionalen R-Vektorraums R3×3 ist.
216 6 Vektorräume – von Basen und Dimensionen
r s
u = i=1 λi ui . Ebenso ist w = i=1 μi w i mit einem 0 mit λ1 , λ2 , λ3 ∈ R führt zu einem linearen Gleichungs-
s ∈ N0 , wi ∈ MW und μi ∈ K für 1 ≤ i ≤ s. Folglich ist system mit der erweiterten Koeffizientenmatrix
⎛ ⎞
!
r !
s 1 0 1 0
u+w = λi ui + μi w i ⎜ −1 1 1 0 ⎟
⎜ ⎟
⎜ 0 −1 0 0 ⎟ ,
i=1 i=1 ⎜ ⎟
⎝ 0 0 0 0⎠
eine Linearkombination von u1 , . . . , ur , w1 , . . . , ws ∈
0 0 −2 0
MU ∪ MW . Es gilt also U + W ⊆ -MU ∪ MW ..
dessen einzige Lösung offenbar (0, 0, 0) ist. Demnach ist
Nun sei umgekehrt v = ti=1 λi v i eine Linearkombination
{u1 , u2 , u3 } ein linear unabhängiges Erzeugendensystem,
von Elementen v i ∈ MU ∪ MW . Wir setzen
also eine Basis von U .
I = {i ∈ {1, 2, . . . , t} | v i ∈ MU } und J = {1, 2, . . . , t}\I . Nun untersuchen wir die Vektoren w 1 , w 2 , w 3 auf lineare
Unabhängigkeit. Offenbar sind w 1 , w2 linear unabhängig,
Für i ∈ J gilt v i ∈
/ MU , d. h. v i ∈ MW . Folglich ist denn aus λ1 w 1 + λ2 w 2 = 0 mit z. B. λ2 = 0 folgt w2 =
(−λ1 /λ2 ) w1 , d. h., w2 wäre skalares Vielfaches von w 1 , was
!
t ! !
v= λi v i = λi v i + λi v i ∈ U + W. offensichtlich nicht der Fall ist. Wir müssen dann prüfen,
i=1 i∈I i∈J ob w 3 ∈ -w1 , w2 ., d. h. w 3 = λ1 w 1 + λ2 w 2 lösbar ist.
Ausgeschrieben liefert dies das lineare Gleichungssystem mit
∈-MU . ∈-MW .
der erweiterten Koeffizientenmatrix
⎛ ⎞
Damit ist gezeigt: 2 −2 1
⎜ 1 1 −1 ⎟
⎜ ⎟
⎜ −1 3 −2 ⎟
Lemma ⎜ ⎟
⎝ −2 6 −4 ⎠
Sind U1 , . . . , Un Untervektorräume eines K-Vektorraums V
mit den Erzeugendensystemen MU1 , . . . , MUn , so gilt 0 −8 6
Dieses Gleichungssystem ist lösbar mit Lösung λ1 = −1/4,
U1 + · · · + Un = {u1 + · · · + un | u1 ∈ U1 , . . . , un ∈ Un } λ2 = −3/4. Es folgt W = -w1 , w 2 ., und {w 1 , w 2 } ist als
= -MU1 ∪ · · · ∪ MUn . . linear unabhängiges Erzeugendensystem eine Basis von W .
Insbesondere ist die Summe U1 + · · · + Un ein Untervektor- Nun wissen wir, dass U + W = -u1 , u2 , u3 , w 1 , w 2 ..
raum von V . Der Vektor w1 kann nicht Linearkombination von v 1 , v 2 , v 3
sein – man beachte die vierten Komponenten. Also sind
u1 , u2 , u3 , w 1 linear unabhängig. Wegen w2 = 4 u3 −3 w1
? gilt U + W = -u1 , u2 , u3 , w1 ., d. h., {u1 , u2 , u3 , w 1 } ist
Wenn MU und MW sogar Basen von U und W sind, ist dann
eine Basis von U + W .
MU ∪ MW eine Basis von U + W ?
linear unabhängig sind. Die Gleichung λ1 v 1 +λ2 v 2 +λ3 v 3 = wieder ein Untervektorraum von V .
6.5 Summe und Durchschnitt von Untervektorräumen 217
Achtung: Ist MU ein Erzeugendensystem von U und MW Also gilt L = {(λ, λ, λ, λ) | λ ∈ R} und somit
eines von W , so gilt im Allgemeinen ⎧ ⎛ ⎞ ⎛ ⎞ ⎫
⎨ 1 0 ⎬
U ∩ W = -MU . ∩ -MW . = -MU ∩ MW . . U ∩ W = λ ⎝0⎠ + λ ⎝ 1 ⎠ | λ ∈ R
⎩ ⎭
1 −1
⎧ ⎛ ⎞ ⎫
Man wähle etwa MU = {1} und MW = {2} im eindimensio- ⎨ 1 ⎬
nalen R-Vektorraum R. = λ ⎝1⎠ | λ ∈ R ;
⎩ ⎭
0
Beispiel Im R-Vektorraum V = R3 seien zwei Untervek-
?⎛1⎞@
also
torräume U und W gegeben durch
U ∩ W = ⎝1⎠ .
?⎛1⎞ ⎛ 0 ⎞@ ?⎛ 1 ⎞ ⎛0⎞@
0
U = ⎝0⎠ , ⎝ 1 ⎠ und W = ⎝ 0 ⎠ , ⎝1⎠ .
1 −1 −1 1
Achtung: Die Vereinigung von Untervektorräumen ist im
Wir bestimmen U ∩ W . Allgemeinen kein Untervektorraum. Als Beispiel wähle man
etwa zwei verschiedene eindimensionale Untervektorräume
x3 des R2 (siehe Abb. 6.10).
x2
U2
∈ U1 ∪ U2
x1
U1
x1 x2
Abbildung 6.10 Die Summe der zwei Vektoren aus U1 ∪ U2 ist nicht Element
von U1 ∪ U2 , also ist U1 ∪ U2 kein Vektorraum.
⎛ ⎞ ⎛ ⎞
1 0 Die Summe der Dimensionen von U und W ist
Für v = λ1 ⎝0⎠ +λ2 ⎝ 1 ⎠ mit λ1 , λ2 ∈ R gilt v ∈ U ∩W
gleich der Summe der Dimensionen von
1 −1
genau dann, wenn es μ1 , μ2 ∈ R gibt, sodass U ∩ W und U + W
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ Die Summe U + W von Untervektorräumen U und W eines
1 0 1 0
λ1 ⎝0⎠ + λ2 ⎝ 1 ⎠ = μ1 ⎝ 0 ⎠ + μ2 ⎝1⎠ K-Vektorraums V ist erneut ein Untervektorraum von V .
1 −1 −1 1 Doch welche Dimension hat der Vektorraum U + W ? Die
naheliegende Formel dim(U + W ) = dim U + dim W ist
gilt. Wir bestimmen daher die Lösungsmenge L des homo- falsch, wie das Beispiel U = W = -e1 . ⊆ R2 zeigt, hier
genen linearen Gleichungssystems über R mit der folgenden gilt:
erweiterten Koeffizientenmatrix:
dim U + dim W = 2 = 1 = dim(U + W ) .
⎛ ⎞
1 0 −1 0 0
⎝ 0 1 0 −1 0 ⎠ Korrekt hingegen ist die folgende Dimensionsformel:
1 −1 1 −1 0
Die Dimensionsformel für Untervektorräume
Mittels elementarer Zeilenumformungen wird diese Matrix Sind U und W endlichdimensionale Untervektorräume
überführt in ⎛ ⎞ des K-Vektorraums V , so gilt:
1 0 0 −1 0
⎝ 0 1 0 −1 0 ⎠
dim(U ∩ W ) + dim(U + W ) = dim U + dim W .
0 0 1 −1 0
218 6 Vektorräume – von Basen und Dimensionen
Man beachte die Ähnlichkeit zu der folgenden Formel aus Der triviale Durchschnitt kennzeichnet direkte
der elementaren Mengenlehre (siehe Seite 40): Summen
|A ∩ B| + |A ∪ B| = |A| + |B| .
Ein K-Vektorraum V heißt direkte Summe der Untervek-
torräume U und W , in Zeichen
Beweis: Es sei B = {b 1 , . . . , br } eine Basis des Vektor-
raums U ∩ W ⊆ U, W . Wir ergänzen B zu einer Basis BU V =U ⊕W ,
von U und zu einer Basis BW von W , falls
BU = {b1 , . . . , br , u1 , . . . , us } , (i) V = U + W ,
BW = {b1 , . . . , br , w1 , . . . , wt } . (ii) U ∩ W = {0}.
Nun begründen wir, warum Der Vektorraum V ist somit die Summe von U und W , wobei
U und W einen trivialen Durchschnitt haben.
BU ∪ BW = {b1 , . . . , br , u1 , . . . , us , w 1 , . . . , wt }
Beispiel Der R3 ist die direkte Summe einer Ebene und
eine Basis von U + W ist.
einer Geraden:
(i) BU ∪ BW erzeugt U + W , da nach dem Lemma auf ?⎛1⎞ ⎛0⎞@ ?⎛0⎞@
Seite 216 gilt: R3 = ⎝1⎠ , ⎝1⎠ ⊕ ⎝0⎠ .
-BU ∪ BW . = U + W . 0 1 1
(ii) BU ∪ BW ist linear unabhängig: Sind λ1 , . . . , λr , Ist V = U + W , so kann man jeden Vektor v ∈ V als
μ1 , . . . , μs und ν1 , . . . , νt aus K gegeben, und gilt eine Summe v = u + w schreiben. Eine solche Darstellung
!
r !
s !
t ist aber im Allgemeinen nicht eindeutig, wie das einfache
(∗) λi b i + μi u i + νi w i = 0 , Beispiel v = e 1 im Fall U = -e1 . = W zeigt. Im Fall einer
i=1 i=1 i=1 direkten Summe ist die Situation anders:
so erhalten wir: Lemma
!
r !
s !
t Ist V die direkte Summe zweier Untervektorräume U
λi b i + μi u i = − νi w i . und W , so existiert zu jedem v ∈ V genau eine Darstellung
i=1 i=1 i=1 der Form
v =u+w
Der Vektor links vom Gleichheitszeichen liegt in U , der Vek-
tor rechts davon in W , sodass mit u ∈ U und w ∈ W .
!
r !
s
Beweis: Aus
λi bi + μi ui ∈ U ∩ W = -B. .
i=1 i=1 u + w = v = u + w
Es folgt μ1 = · · · μs = 0. Da BW linear unabhängig ist, mit u, u ∈ U und w, w ∈ W folgt:
erhalten wir nun aus (∗) weiterhin
u = w
u − − w .
λ1 = · · · λr = 0 = ν1 = · · · νt . ∈U ∈W
Beweis: Es sei BU eine Basis von U . Nach dem Basis- Die Äquivalenzklassen haben somit die Form
ergänzungssatz von Seite 207 können wir die linear unab-
hängige Menge BU mittels einer linear unabhängigen Menge
BU zu einer Basis BU ∪ BU von V ergänzen. Die Menge BU [v]∼ = v + U .
erzeugt einen Unterrvektorraum W = -BU .. Wir begründen,
dass W ein Komplement von U in V ist. Wegen
Für die Quotientenmenge V / ∼, das ist die Menge aller Äqui-
U + W = -BU ∪ BU . = V valenzklassen, ist die Schreibweise V /U üblich,
Wegen der linearen Unabhängigkeit von BU ∪ BU folgt Die Äquivalenzklassen bilden eine Zerlegung der Menge V in
hieraus λi = 0 = μj für alle vorkommenden i und j . Dies disjunkte, nichtleere Teilmengen (man beachte den Abschnitt
zeigt v = 0, d. h., U ∩ W = {0}. Also ist W ein Komplement auf Seite 55 f.).
von U in V .
?
K × V /U → V /U,
Warum ist ∼ eine Äquivalenzrelation? ·:
(λ, v + U ) → (λ v) + U
Problemanalyse und Strategie: Wir zeigen, dass Kn×n die direkte Summe der Untervektorräume S(n, K) und
A(n, K) ist und bestimmen Basen dieser Untervektorräume.
Beweis: Die Addition ist wohldefiniert: Es seien v, v , = λ1 (b1 + U ) + · · · + λn−r (bn−r + U ) ∈ -B. .
w, w ∈ V mit
Es ist B linear unabhängig: Es gelte
v + U = v + U und w + U = w + U λ1 (b1 + U ) + · · · + λn−r (bn−r + U ) = 0 = U (6.6)
v + U = v + U
Beispiel Wir betrachten den Untervektorraum U = -e1 .
gegeben. Es folgt v − v ∈ U . Daher gilt des R3 . Da -e2 , e3 . ein Komplement zu U in R3 ist, erhalten
wir
λ v − λ v = λ (v − v) ∈ U .
R3 /U = -e2 + U, e3 + U .
(λ v ) + U = (λ v) + U .
Kommentar: Das Prinzip der Konstruktion des Vektor-
raums V /U aus V und U findet sich in der Algebra immer
Dass V /U mit dieser Addition eine abelsche Gruppe ist,
wieder. Z. B. wird aus einer Gruppe G mit einem Normal-
wurde im Wesentlichen auf Seite 77 gezeigt. Das neutrale
teiler U die Faktorgruppe G/U gebildet, und aus einem Ring
Element bezüglich dieser Addition ist die Nebenklasse
R kann man mit einem Ideal I den Faktorring R/I konstru-
ieren. Das Ziel einer solchen Konstruktion ist es oftmals, aus
0+U =U.
Gruppen, Ringen oder Vektorräumen neue Strukturen zu ge-
winnen, die vorgegebene Eigenschaften erfüllen.
Die Gültigkeit der Vektorraumaxiome (V1)–(V4) ist offen-
sichtlich, da diese Axiome ja in V erfüllt sind. Es bleibt also Aber nicht nur in der Algebra, auch in allen weiteren Gebieten
nur noch die Formel zur Dimension nachzuweisen. Dazu set- der Mathematik werden ähnliche Konstruktionen durchge-
zen wir nun voraus, dass V die Dimension n ∈ N0 hat. Der führt, die aus einer gegebenen Struktur mithilfe von Äquiva-
Untervektorraum U habe die Dimension r ≤ n. Wir wählen lenzrelationen eine neue Struktur schaffen. Wir werden zum
ein Komplement W ⊆ V zu U , V = W ⊕ U . Die Dimension Beispiel im Kapitel 19 auf ähnliche Weise die reellen Zahlen
von W ist n − r. Es sei {b1 , . . . , bn−r } eine Basis von W . aus den rationalen Zahlen gewinnen.
222 6 Vektorräume – von Basen und Dimensionen
Zusammenfassung
Die lineare Algebra kann auch als Theorie der Vektorräume so gilt für den Durchschnitt -X. aller Untervektorräume U
bezeichnet werden, ein Vektorraum ist dabei wie folgt defi- von V mit X ⊆ U
niert. n
!
-X. = λi v i | n ∈ N, λi ∈ K, v i ∈ X, i = 1, . . . , n
Definition eines K-Vektorraums i=1
Es seien K ein Körper, (V , +) eine abelsche Gruppe und – man spricht vom Erzeugnis von X. Es kann durchaus sein,
dass eine echte Teilmenge T X denselben Untervektor-
K×V → V
·: raum erzeugt, -T . = -X.. Falls dies aber für keine echte
(λ, v) → λ · v
Teilmenge von X möglich ist, so nennt man X linear unab-
eine Abbildung. Falls für alle u, v, w ∈ V und λ, μ ∈ hängig, genauer:
K die Eigenschaften
(V1) λ · (v + w) = λ · v + λ · w, Definition der linearen Unabhängigkeit
(V2) (λ + μ) · v = λ · v + μ · v, Verschiedene Vektoren v 1 , . . . , v r ∈ V heißen linear
(V3) (λ μ) · v = λ · (μ · v), unabhängig, wenn für jede echte Teilmenge T von
(V4) 1 · v = v {v 1 , . . . , v r } gilt -T . -v 1 , . . . , v r ..
gelten, nennt man V einen Vektorraum über K oder
Eine Menge X ⊆ V heißt linear unabhängig, wenn je
kurz einen K-Vektorraum.
endlich viele verschiedene Elemente aus X linear unab-
hängig sind.
Viele Strukturen in der Mathematik bilden Vektorräume,
wichtige Beispiele von Vektorräumen sind Ein einfacher Test auf lineare Unabhängigkeit funktioniert
wie folgt:
der Kn , die Spaltenvektoren mit Komponenten aus K,
der Km×n , die Matrizen mit Komponenten aus K, Falls für verschiedene Vektoren v 1 , . . . , v r ∈ V und Skalare
der K[X], die Polynome mit Koeffizienten aus K, λ1 , . . . , λr gilt:
der KK , die Abbildungen von K nach K.
r
Aus λi v i = 0 folgt λ1 = λ2 = · · · = λr = 0 ,
In der Analysis lernen wir viele weitere Beispiele kennen, i=1
etwa den Vektorraum aller auf einem Intervall [a, b] ⊆ R
so sind v 1 , . . . , v r linear unabhängig.
stetigen oder integrierbaren Funktionen. Eine Theorie der
Vektorräume bringt diese vielfältigen mathematischen Struk- Ein linear unabhängiges Erzeugendensystem eines Vektor-
turen unter einen Hut. raums V nennt man eine Basis von V . Man kann eine Basis
von V auch anderes beschreiben: Eine Basis ist ein mini-
Wie immer in der Algebra untersucht man bei einer Struktur
males Erzeugendensystem von V oder eine maximale linear
die Unterstrukturen, im vorliegenden Fall von Vektorräumen
unabhängige Teilmenge von V .
also Untervektorräume. Das sind Teilmengen von Vektorräu-
men, die für sich genommen wieder Vektorräume sind. Um Da eine Basis B eines K-Vektorraums V insbesondere ein
nachzuweisen, dass eine Teilmenge eines Vektorraumes wie- Erzeugendensystem von V ist, kann jeder Vektor von V be-
der ein Vektorraum ist, ist nicht viel Aufwand nötig, es gilt züglich B als Linearkombination dargestellt werden,
nämlich:
v = λ 1 b 1 + · · · + λn b n
Eine nichtleere Teilmenge U eines K-Vektorraums V ist ein
Untervektorraum von V , wenn gilt: mit λ1 , . . . , λn ∈ K und b1 , . . . , bn ∈ B. Tatsächlich gelingt
dies bei einer Basis B sogar eindeutig. Das ist wesentlich, es
(U1) u, w ∈ U ⇒ u + w ∈ U , gelingt uns nämlich so, jeden Vektor v ∈ V im Fall einer
(U2) λ ∈ K, u ∈ U ⇒ λ u ∈ U . endlichen Basis, |B| = n, mit dem Tupel von Koeffizien-
ten (λ1 , . . . , λn ) ∈ Kn zu identifizieren, wir zeigen das in
Hiermit ist es leicht zu zeigen, dass Lösungsmengen homoge- Kapitel 12.
ner linearer Gleichungssysteme und Polynome bis zu einem
festen Grad Vektorräume bilden. Jeder Vektorraum V besitzt eine Basis. Dieser prägnante Satz
ist eine der Kernaussagen der linearen Algebra. Tatsächlich
Es ist sehr einfach, einen kleinsten Untervektorraum anzu- beweist man etwas mehr. Man zeigt, dass jede linear unab-
geben, der vorgegebene Vektoren enthält. Ist nämlich X eine hängige Menge A eines Erzeugendensystems S von V durch
solche Menge vorgegebener Vektoren eines Vektorraumes V , Elemente von S zu einer Basis B von V ergänzt werden
Aufgaben 223
kann – das ist der Inhalt des Basisergänzungssatzes. Der Be- Ein Sonderfall ist von besonderem Interesse, nämlich der
weis dieses Satzes ist in dieser allgemeinen Form alles andere Fall U ∩ W = {0} und U + W = V . Man nennt V in dieser
als einfach. Er erfordert das Zorn’sche Lemma, ein Axiom der Situation die direkte Summe von U und W und schreibt dafür
Mengenlehre.
V =U ⊕W .
Ein Vektorraum hat im Allgemeinen viele verschiedene Ba-
sen. Aber je zwei Basen B und C eines Vektorraums V ist Die Dimensionsformel lautet in diesem Fall
eines gemeinsam, es gilt nämlich |B| = |C|. Daher ist es
dim V = dim U + dim W .
sinnvoll, die Mächtigkeit |B| einer Basis B von V die Dimen-
sion dim V von V zu nennen, die Definition ist unabhängig Den Untervektorraum U bzw. W nennt man ein Komplement
von der Wahl der Basis. von W bzw. U in V , solche Komplemente existieren stets:
Für die Dimensionen von Schnitt und Summe endlichdimen-
sionaler Untervektorräume U und W eines K-Vektorraums Satz über die Existenz von Komplementen
V gilt die Dimensionsformel Ist U ein Untervektorraum eines K-Vektorraums V , so
besitzt U ein Komplement in V .
dim(U ∩ W ) + dim(U + W ) = dim U + dim W .
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
⎧⎛ ⎞ ⎫
Verständnisfragen ⎨ v1 ⎬
6.1 • Gelten in einem Vektorraum V die folgenden (a) U1 = ⎝v2 ⎠ ∈ R3 | v1 + v2 = 2
⎩ ⎭
Aussagen? v
⎧⎛ 3 ⎞ ⎫
(a) Ist eine Basis von V unendlich, so sind alle Basen von ⎨ v1 ⎬
V unendlich. (b) U2 = ⎝v2 ⎠ ∈ R3 | v1 + v2 = v3
⎩ ⎭
(b) Ist eine Basis von V endlich, so sind alle Basen von V v
⎧⎛ 3 ⎞ ⎫
endlich. ⎨ v1 ⎬
(c) Hat V ein unendliches Erzeugendensystem, so sind alle (c) U3 = ⎝v2 ⎠ ∈ R3 | v1 v2 = v3
⎩ ⎭
Basen von V unendlich. v
⎧⎛ 3 ⎞ ⎫
(d) Ist eine linear unabhängige Menge von V endlich, so ist ⎨ v1 ⎬
es jede. (d) U4 = ⎝v2 ⎠ ∈ R3 | v1 = v2 oder v1 = v3
⎩ ⎭
6.2 • Gegeben sind ein Untervektorraum U eines K- v3
Vektorraums V und Elemente u, w ∈ V . Welche der folgen-
den Aussagen sind richtig? 6.6 •• Welche der folgenden Teilmengen des R-
(a) Sind u und w nicht in U , so ist auch u + w nicht in U . Vektorraums RR sind Untervektorräume? Begründen Sie Ihre
(b) Sind u und w nicht in U , so ist u + w in U . Aussagen.
(c) Ist u in U , nicht aber w, so ist u + w nicht in U . (a) U1 = {f ∈ RR | f (1) = 0}
6.3 • Folgt aus der linearen Unabhängigkeit von u und (b) U2 = {f ∈ RR | f (0) = 1}
v eines K-Vektorraums auch jene von u − v und u + v? (c) U3 = {f ∈ RR | f hat höchstens endlich viele
Nullstellen}
6.4 • Folgt aus der linearen Unabhängigkeit der drei (d) U4 = {f ∈ RR | für höchstens endlich viele x ∈ R ist
Vektoren u, v, w eines K-Vektorraums auch die lineare Un- f (x) = 0}
abhängigkeit der drei Vektoren u + v + w, u + v, v + w? (e) U5 = {f ∈ RR | f ist monoton wachsend}
6.5 • Geben Sie zu folgenden Teilmengen des R- (f) U6 = {f ∈ RR | die Abbildung g ∈ RR mit g(x) =
Vektorraums R3 an, ob sie Untervektorräume sind, und be- f (x) − f (x − 1) liegt in U }, wobei U ⊆ RR ein vorge-
gründen Sie dies: gebener Untervektorraum ist.
224 6 Vektorräume – von Basen und Dimensionen
6.7 •• Gibt es für jede natürliche Zahl n eine Menge 6.13 •• Begründen Sie, dass für jedes n ∈ N die Menge
A mit n + 1 verschiedenen Vektoren v 1 , . . . , v n+1 ∈ Rn , ⎧ ⎛ ⎞ ⎫
sodass je n Elemente von A linear unabhängig sind? Geben ⎪
⎨ u1 ⎪
⎬
⎜ ⎟
Sie eventuell für ein festes n eine solche an. U = u = ⎝ ... ⎠ ∈ Rn | u1 + · · · + un = 0
⎪
⎩ ⎪
⎭
un
6.8 •• Da dim(U + V ) = dim U + dim V − dim(U ∩
V ) gilt, gilt doch sicher auch analog zu Mengen dim(U +V + einen R-Vektorraum bildet, und bestimmen Sie eine Basis
W ) = dim U + dim V + dim W − dim(U ∩ V ) − dim(U ∩ und die Dimension von U .
W ) − dim(V ∩ W ) + dim(U ∩ V ∩ W )? Beweisen oder
widerlegen Sie die Formel für dim(U + V + W )! 6.14 •• Bestimmen Sie die Dimension des Vektorraums
A=⎝ 3 1 2⎠ ∈ R3×3 Ui = V .
1 −3 2 i=1
(Anders formuliert: Ist |K| = ∞, so lässt sich V nicht als
als Summe einer symmetrischen und einer schiefsymmetri- Vereinigung endlich vieler echter Untervektorräume schrei-
schen Matrix. ben.)
Antworten der Selbstfragen 225
S. 190 S. 204
Vgl. die Definition auf Seite 65: Für alle u, v, w aus V gilt: Der Nullvektorraum {0} besitzt die einzige Basis ∅ und der
Z2 -Vektorraum Z2 besitzt die einzige Basis {1}. Jeder K-
(AG1) (u + v) + w = u + (v + w) (Assoziativität).
Vektorraum besitzt im Fall K = Z2 mehr als eine Basis,
(AG2) Es gibt ein Element 0 ∈ V mit v + 0 = v (Existenz da man einen Basisvektor b nämlich stets durch λ b mit
eines neutralen Elements). λ ∈ K \ {0} ersetzen kann, man erhält so wieder eine
Basis.
(AG3) Es gibt ein v ∈ V mit v + v = 0 (Existenz eines
entgegengesetzten Elements).
S. 204
(AG4) v + w = w + v (Kommutativität).
1. Nein, der R2 ist keine Basis von -R2 . = R2 .
S. 193 2. Ja, jede linear unabhängige Menge X ist Basis von -X..
Da Matrizen Abbildungen sind, sind diese genau dann gleich,
wenn sie dieselbe Definitions- und Wertemenge und die- S. 205
selben Bilder haben: Zwei m × n -Matrizen A = (aij ) Ja! Dass B ein Erzeugendensystem von V ist, folgt aus der
und B = (bij ) über K sind also genau dann gleich, wenn Tatsache, dass sich jeder Vektor als Linearkombination von
aij = bij für alle i, j gilt. B darstellen lässt. Zu überlegen bleibt also nur, ob B linear
unabhängig ist. Es seien v 1 , . . . , v n beliebige Vektoren aus
S. 195 B. Aus der Gleichung
Natürlich ist auch für jeden Körper K die Menge K∅ ein
K-Vektorraum, obiger Beweis gilt für jede Menge M. Die λ1 v 1 + · · · + λn v n = 0
Menge K∅ besteht aber nur aus einem Element, nämlich
der leeren Menge – es ist ∅ die einzige existierende Abbil- mit λ1 , . . . , λn ∈ K folgt wegen der eindeutigen Darstell-
dung von ∅ in K (beachte die Definition einer Abbildung auf barkeit des Nullvektors sogleich λ1 = · · · = λn = 0, da
Seite 58). Der Vektorraum K∅ ist somit der triviale Vektor- natürlich der Nullvektor trivial dargestellt werden kann,
raum {∅}, das einzige Element ∅ ist der Nullvektor.
0 v1 + · · · + 0 vn = 0 .
S. 197
Neben den trivialen Untervektorräumen sind für alle v =
0 = w und w ∈ R v die Mengen R v und R v + R w = S. 211
{λ v + μ w | λ, μ ∈ R} Untervektorräume. Tatsächlich gibt Der R-Vektorraum R hat die Dimension 1, und jede von null
es keine weiteren Untervektorräume im R3 . verschiedene Zahl ist als Basisvektor wählbar.
sofort a = b = c = d.
S. 216
Nein, man wähle etwa zwei verschiedene Basen MU und MW
S. 200
eines Vektorraums U = W .
Die Menge M aller Untervektorräume von V , die X enthalten
ist bezüglich der Inklusion ⊆ geordnet. Wir haben gezeigt,
dass -X. bezüglich dieser Ordnung tatsächlich das kleinste S. 219
Element ist, siehe den Abschnitt auf Seite 51. (i) Wegen v − v = 0 ∈ U für alle v ∈ V gilt v ∼ v für alle
v ∈ V.
S. 201 (ii) Da mit jedem Element u ∈ U auch −u in U liegt, folgt
Ja. Der Vektorraum V selbst ist stets ein Erzeugendensystem, aus v ∼ w, d. h., v − w ∈ U , auch w − v ∈ U , d. h., w ∼ v.
es gilt V = -V ..
(iii) Da mit je zwei Elementen aus U auch deren Summe in
S. 201 U liegt, folgt aus u ∼ v und v ∼ w, d. h., u − v, v − w ∈ U ,
Ja, dies folgt aus der Definition. sogleich u − w ∈ U , d. h., u ∼ w.
Analytische Geometrie –
Rechnen statt Zeichnen 7
Was bedeutet die
Koordinateninvarianz des
Vektorprodukts und des
Spatprodukts?
Was versteht man unter der
Hesse’schen Normalform einer
Ebene?
Wie erfolgt die Umrechnung
zwischen einem geozentrischen
und einem heliozentrischen
Koordinatensystem?
Historisch gesehen hat sich die Geometrie aus einer Idealisierung 7.1 Punkte und Vektoren im
unserer physikalischen Welt entwickelt. Zunächst war allein die
Zeichnung die Grundlage für geometrische Fragestellungen, für Anschauungsraum
deren Analyse und deren Lösung. Es bedeutete zweifellos einen
besonderen Durchbruch, als man begann, geometrische Ele- Wir haben uns schon in den Kapiteln 5 und 6 mit dem An-
mente durch Zahlen zu beschreiben und damit die zeichnerische schauungsraum befasst. Damit meinen wir den R3 als die
Lösung eines Problems durch eine rechnerische zu ersetzen. geometrische Idealisierung des uns umgebenden physikali-
Dieser für die moderne Wissenschaft so bedeutende Schritt ist schen Raums. Nach Einführung eines Koordinatensystems
vor allem René Descartes (1596–1650), siehe Abbildung 1.17, im Anschauungsraum sind die Punkte a mit den Koordinaten-
⎛ ⎞
und Pierre de Fermat (1607/08–1665) zu verdanken und führte a1
zur Entwicklung der analytischen Geometrie. Ohne diese gäbe tripeln ⎝a2 ⎠ zu identifizieren und als Vektoren des Vektor-
es keine Computergrafik, keine Robotik und keine Raumfahrt, a3
um nur einige wenige unserer heute so selbstverständlichen raums R3 aufzufassen. Somit stehen als Verknüpfungen die
Errungenschaften zu nennen. Addition von Punkten und die skalare Multiplikation von a
mit λ ∈ R zu λa zur Verfügung.
Das Verhältnis zwischen Zeichnung und Rechnung hat sich
neuerdings geradezu umgekehrt: Wenn heute jemand auf dem Im Folgenden wird gezeigt, dass Vektoren im Anschauungs-
Computer mit Geometrie-Software, also mit „virtuellen Zeichen- raum noch eine andere Bedeutung haben.
instrumenten“ konstruiert, so läuft im Hintergrund die Rechnung
ab. Nicht die Rechnung ersetzt die Zeichnung, sondern jetzt dient
die Zeichnung auf dem Bildschirm der benutzerfreundlichen Ein- Vektoren im Anschauungsraum können
gabe von Daten und Ausgabe von errechneten Resultaten. sowohl Punkte als auch Pfeile bedeuten
In diesem Kapitel konzentrieren wir uns auf die analytische
In Kapitel 6 wurde die Summe der Vektoren a, c ∈ R3 defi-
Geometrie des R3 , genauer des dreidimensionalen euklidischen
niert als
Raums. Dies deshalb, weil der R3 unseren physikalischen Raum ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
idealisiert und wir uns die notwendigen Begriffe geometrisch a1 c1 a1 + c1
veranschaulichen können. Die ebene Geometrie ist dabei selbst- a + c = ⎝a2 ⎠ + ⎝c2 ⎠ = ⎝ a2 + c2 ⎠.
verständlich enthalten. Mit der Kenntnis der zwei- und dreidi- a3 c3 a3 + c3
mensionalen Geometrie fällt es uns auch leichter, so manche
Dies bedeutet geometrisch, dass im Anschauungsraum je
n-dimensionale Fragestellung oder allgemeine mathematische
zwei Punkten a, c ein Summenpunkt b = a + c zugeord-
Prinzipien zu verstehen.
net werden kann. Und zwar ergänzt dieser die drei Punkte a,
Im R3 gibt es neben der im vorhergehenden Kapitel behandel- 0 und c zu einem Parallelogramm (Abb. 7.1).
ten Vektorraumstruktur noch andere Verknüpfungen, die eine
geometrische Bedeutung haben. Wir werden uns nach einer x3 b =a+c
Analyse der Begriffe Punkt und Vektor vor allem auf diese
zusätzlichen Produkte konzentrieren und deren geometrische
Bedeutung hervorkehren. Mit den zugehörigen Formeln schaf- a
fen wir uns das Werkzeug, um auch die vorstellungsmäßig
oft recht anspruchsvollen Umrechnungen zwischen räumlichen
Koordinatensystemen übersichtlich zu gestalten. x2 c
q
a Der Vektor v = b − a des Anschauungsraums wird also
durch einen Pfeil mit Anfangspunkt a und Spitze b repräsen-
v p tiert, doch kann dieser Pfeil im Raum noch beliebig paral-
x2
lel verschoben werden, ohne dabei den Vektor zu verändern
(Abb. 7.3).
x1
0 Nun sind im Anschauungsraum sowohl die Punkte, als auch
die durch Pfeile repräsentierten Vektoren jeweils durch drei
Abbildung 7.2 Der Vektor v ist sowohl gleich b − a als auch gleich q − p. Koordinaten festgelegt. Punkte wie Vektoren werden daher
auch auf dieselbe Weise durch fett gedruckte Symbole be-
zeichnet. Dies kann manchmal verwirren.
v ∈ R3 alle möglichen Pfeile, deren jeweiliger Anfangs-
punkt a und Endpunkt b der Bedingung v = b − a genügen. In der Regel ist aus dem Zusammenhang klar, was gemeint
Alle diese Pfeile sind gleich lang und gleich gerichtet. Kennt ist: Wenn wir z. B. eine Gerade darstellen als
man einen, so kennt man alle.
G = {x = a + t u | t ∈ R},
Dahinter steht eine Äquivalenzrelation: Wir nennen zwei
Paare (p, q), (a, b) ∈ (R3 × R3 ) äquivalent, wenn so sind a und x Punkte, während u ein Vektor ist (Abb. 7.5
auf Seite 230).
q −p =b−a
Zur besseren sprachlichen Unterscheidung werden wir die
gilt. Diese Relation auf R3 × R3 ist offensichtlich reflexiv, durch Pfeile repräsentierten Vektoren auch Richtungsvekto-
symmetrisch und transitiv. Die Äquivalenzklassen heißen ren nennen. Und den „Punkt p“ nennen wir gelegentlich auch
Vektoren des Anschauungsraums. Natürlich ist jeder Vektor v den „Punkt mit dem Ortsvektor p“. Dabei verstehen wir un-
bereits durch einen Repräsentanten eindeutig bestimmt, und ter dem Ortsvektor des Punkts p die Differenz p − 0, die re-
so schreiben wir kurz v = b − a ∈ R3 . präsentiert wird durch den vom Koordinatenursprung 0 zum
Punkt p weisenden Pfeil. Zudem werden wir die Symbole a,
b, p, q, x zumeist für Punkte reservieren und u, v, w und n
für Richtungsvektoren.
x3
u v
u+v
v
u−v
u
0 p
x2
x1
Abbildung 7.4 Summe u + v und Differenz u − v von Richtungsvektoren.
Abbildung 7.3 Eine Äquivalenzklasse gleich langer und gleich orientierter
Pfeile ist ein Vektor. Wenn wir auch die Ortsvektoren p, q zweier Punkte durch
Pfeile darstellen, so lässt sich die Bildung der Vektorsumme
p + q auch ohne das Parallelogramm in Abbildung 7.1 geo-
Kommentar: Der Anschauungsraum ist ein affiner Raum metrisch beschreiben. Wir können nämlich einheitlich for-
und wird zunächst als Menge von Punkten verstanden. Jede mulieren:
Äquivalenzklasse von Punktepaaren mit derselben Differenz
Zwei Vektoren werden addiert, indem zugehörige Pfeile
ist ein Vektor, und diese bilden den zum affinen Raum gehö-
aneinandergehängt werden. Zur Bestimmung der Differenz
rigen Vektorraum.
zweier Vektoren wählen wir zwei repräsentierende Pfeile mit
Umgekehrt legt jeder Vektorraum V einen affinen Raum fest demselben Anfangspunkt und legen dann den Differenzvek-
als Menge aller affinen Teilräume a +U mit a ∈ V und U als tor als Pfeil nach der Regel „Endpunkt minus Anfangspunkt“
Untervektorraum von V (siehe auch Kapitel 6, Seite 197). Die fest (Abb. 7.4).
230 7 Analytische Geometrie – Rechnen statt Zeichnen
Beispiel Gegeben sind die drei Punkte Ist b ein weiterer Punkt von G neben a, so können wir sagen,
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ G wird von den Punkten a und b aufgespannt, was man gele-
1 4 3 gentlich mit dem Symbol G = span{a, b} ausdrückt. Wählen
a = ⎝ −2 ⎠, b = ⎝ 3 ⎠, c = ⎝ 4 ⎠. wir nun u = b − a als Richtungsvektor von G, so können
1 3 2
wir die Punkte x von G auch darstellen als
Gesucht ist derjenige Punkt d, welcher die drei Punkte a, b, c
x = a + λ(b − a) = (1 − λ)a + λb mit λ ∈ R.
zu einem Parallelogramm abcd ergänzt.
Damit diese vier Punkte in der angegebenen Reihenfolge ein x ist eine sogenannte Affinkombination von a und b, also
Parallelogramm bilden, müssen die Pfeile von a nach b so- eine Linearkombination, für welche die Summe der verwen-
wie von d nach c gleich lang und gleich gerichtet sein. Dies deten Skalare (1 − λ) + λ genau 1 ergibt.
bedeutet
b − a = c − d, x3
also
d = a − b + c. G
? Beispiel Nach dem Beispiel auf Seite 230 bilden die vier
Beweisen Sie, dass eine Affinkombination von Affinkom- Punkte
binationen wieder eine Affinkombination ist und dass die ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 4 3 0
analoge Eigenschaft für Konvexkombinationen gilt. a = ⎝ −2 ⎠, b = ⎝ 3 ⎠, c = ⎝ 4 ⎠, d = ⎝ −1 ⎠
1 3 2 0
Welche Punktmenge ist nun durch die Menge aller Kon- ein Parallelogramm. Berechnen Sie dessen Mittelpunkt m.
vexkombinationen von a, b und c beschrieben, wenn diese
Der Mittelpunkt m der Diagonale ac hat die Eigenschaft
Punkte nach wie vor nicht auf einer Geraden liegen? Wir
m − a = c − m, also 2m = a + c. Wir erhalten daraus
untersuchen also
die spezielle Konvexkombinationen
= {y = λ a + μ b + ν c | λ, μ, ν ≥ 0
und λ + μ + ν = 1}. m = 21 (a + c) = 12 (b + d),
ist jedenfalls eine Teilmenge von E = span{a, b, c}. Bei nachdem a + c = b + d kennzeichnend ist für das Paral-
ν = 0 ist λ + μ = 1 und daher y ein Punkt der abgeschlosse- lelogramm abcd. Durch Einsetzen der obigen Koordinaten
nen Strecke ab. Bei ν > 0 liegt y = a + μ(b − a) + ν(c − a) folgt: ⎛ ⎞ ⎛ ⎞
innerhalb E auf derjenigen Seite der Geraden ab, welcher 4 2
auch c angehört. Analog folgt aus μ ≥ 0, dass y in E entwe- m = 12 ⎝ 2 ⎠ = ⎝ 1 ⎠.
3
3
der der abgeschlossenen Strecke ac angehört oder auf der- 2
x3
?
Gegeben sind drei Punkte a, b, c. Deren arithmetisches Mit-
tel s = 13 (a + b + c) ist der Schwerpunkt des Punktetripels.
Angenommen, die drei Punkte a, b, c bilden ein Dreieck.
Warum liegt s stets im Inneren dieses Dreiecks?
c Zeigen Sie, dass s auf der Verbindungsgeraden von c mit
v E
dem Mittelpunkt von a und b liegt.
a
u
b
Im Anschauungsraum ist zwischen Rechts- und
x2
Linkssystemen zu unterscheiden
b3 es, dass ein und derselbe Punkt oder Vektor je nach Wahl des
Koordinatensystems verschiedene Koordinaten hat.
Bei dieser Gelegenheit erinnern wir an Kapitel 6: Ist B eine
geordnete Basis des n-dimensionalen K-Vektorraums V , so
b2 ist jeder Vektor v ∈ V eindeutig als Linearkombination
v = v1 b1 + · · · + vn bn
o +90◦
von B darstellbar. Wir nennen das n-Tupel (v1 , . . . , vn ) der
b1 verwendeten Skalare die B-Koordinaten von v und schrei-
ben diese als Spaltenvektor. Für diesen Koordinatenvektor
Abbildung 7.7 Ein orthonormiertes Rechtskoordinatensystem. aus Kn benutzen wir gelegentlich das Symbol B v, wenn aus-
drücklich auch die zugrunde liegende Basis hervorgehoben
werden soll.
spricht dann auch von einem kartesischen Rechtssystem.
Häufig werden wir uns den dritten Basisvektor und damit die Im Fall des Anschauungsraums V = R3 können wir B =
dritte Koordinatenachse lotrecht, und zwar nach oben wei- (b1 , b2 , b3 ) setzen. Dann lautet der Vektor B u der B-Koor-
send vorstellen. Dann liegen b1 und b2 horizontal. Von oben dinaten des Vektors u ∈ R3 :
gesehen erfolgt die Drehung von b1 nach b2 durch 90◦ im ⎛ ⎞
u1
mathematisch positiven Sinn (Abb. 7.7).
B u = ⎝ u2 ⎠ ⇐⇒ u = u1 b1 + u2 b2 + u3 b3 . (7.1)
Spiegelbilder von Rechtssystemen sind Linkssysteme. Hier u3
folgen die drei Basisvektoren aufeinander wie Daumen, Zei-
gefinger und Mittelfinger der linken Hand (Abb. 7.8). Wenn wir von einem Koordinatensystem (o; B) für Punkte
sprechen, so spielt auch die Wahl des Ursprungs o eine Rolle.
Wir schreiben daher (o;B) x, wenn wir ausdrücklich die Ko-
b1
b1 ordinaten des Punkts x bezüglich des genannten Koordina-
tensystems meinen, und diese sind wie folgt definiert:
b2
b2 ⎛ ⎞
b3
x1
(o;B) x = ⎝x2 ⎠ ⇐⇒ x = o+x1 b1 +x2 b2 +x3 b3 . (7.2)
b3
x3
Abbildung 7.8 Merkregel für die Anordnung der Basisvektoren: b1 = Daumen, 7.2 Das Skalarprodukt im
b2 = Zeigefinger, b3 = Mittelfinger, wie wenn man mit den Fingern „1,2,3“
zählt. Die rechte Hand bestimmt ein Rechtssystem, die linke ein Linkssystem. Anschauungsraum
Wir werden die Bezeichnung Rechtssystem später auch aus-
Neben der Addition und skalaren Multiplikation gibt es im
dehnen auf drei Vektoren, die nicht paarweise orthogonal
Anschauungsraum noch weitere nützliche Verknüpfungen.
sind, die aber trotzdem der Rechten-Hand-Regel folgen. Da-
Das im Folgenden behandelte Skalarprodukt kann auf be-
bei dürfen wir voraussetzen, dass die von zwei Fingern ein-
liebige Dimensionen verallgemeinert werden (siehe Kapi-
geschlossenen Winkel zwischen 0◦ und 180◦ liegen.
tel 17). Zunächst aber interessiert uns vor allem seine geo-
? metrische Bedeutung.
Angenommen, wir stellen ein Rechtssystem „auf den Kopf“,
d. h., wir verdrehen es derart, dass der dritte Basisvektor nach
unten weist. Wird das Rechtssystem dadurch zu einem Links- Definition des Skalarprodukts und der Norm
system? im Anschauungsraum
fest, welche jedem Paar von Vektoren aus R3 eine reelle Zahl Beispiel Als kleines Zahlenbeispiel zwischendurch be-
in Form des Skalarprodukts zuweist. rechnen wir für die Vektoren
⎛ ⎞ ⎛ ⎞
Das Skalarprodukt u · v lässt sich auch als Matrizenprodukt 2 −1
auffassen, so wie es uns bereits bei den Gleichungssystemen u = ⎝ −1 ⎠ und v = ⎝ 5 ⎠
auf Seite 175 begegnet ist. Dazu müssen die Koordinaten des 2 3
ersten Vektors u als Zeile und jene des zweiten Vektors v als
deren Skalarprodukt
Spalte geschrieben werden:
⎛ ⎞ u · v = 2 · (−1) + (−1) · 5 + 2 · 3 = −2 − 5 + 6 = −1
v1
u · v = (u u u ) ⎝v2 ⎠ = u0 v. (7.3)
1 2 3
sowie die Norm von u:
Skalarprodukt v3 Matrizenprodukt √ √
von Vektoren
u = 22 + (−1)2 + 22 = 4 + 1 + 4 = 9 = 3.
Aus Gründen der Einfachheit verwenden wir die Symbole
u und v links für Vektoren und ebenso rechts für Matrizen Nachdem das Quadrat der Norm eines Vektors gleich der
mit drei Zeilen und einer Spalte. Das hochgestellte 0 bei Quadratsumme seiner Koordinaten ist, gilt:
u bedeutet die Transponierung, wodurch Zeilen mit Spalten
vertauscht werden. Deshalb bezeichnet u0 eine 1×3 -Matrix. u = 0 ⇐⇒ u = 0. (7.4)
Diese Doppelverwendung der Symbole u und v sollte aber
Eine weitere wichtige Formel zur Norm lautet:
kaum zu Schwierigkeiten führen. Der Punkt kennzeichnet je-
denfalls das Skalarprodukt von zwei Vektoren. Bei der Auf- λu = |λ| u. (7.5)
fassung als Matrizenprodukt wird kein Verknüpfungssymbol
verwendet.
Beweis: Es ist λu2 = (λu) · (λu) = λ2 (u · u).
x3
Normieren von Vektoren
Jeder Vektor u = 0 lässt sich durch skalare Multiplika-
b tion gemäß
1
u= u
b3 − a3 u
in einen Vektor mit der Norm 1, also in einen Einheits-
a
vektor u transformieren. Wir sagen dazu, wir normie-
x2 ren den Vektor u.
x1 b2 −
a2 |b1 −
a
1|
Beweis: Mit (7.5) ist
) )
) 1 )
u = ))
) u = 1 u = 1.
u )
Abbildung 7.9 Die Distanz der Punkte a und b ist a − b =
% u
(a1 − b1 )2 + (a2 − b2 )2 + (a3 − b3 )2 , was sich auch aus dem Satz des
Pythagoras ergibt.
u behält die Richtung von u = 0 bei.
Wir haben das Skalarprodukt mithilfe eines Koordinaten- Wir werden diese wichtige Gleichung noch mehrfach ver-
systems berechnet, doch ist letzteres natürlich willkürlich wenden. Sie gilt insbesondere für die Standardbasis oder
festsetzbar. Ein Wechsel des Koordinatensystems bewirkt kanonische Basis E des R3 bestehend aus
eine Änderung der Koordinaten von u und v. Dass trotzdem ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
der Wert u1 v1 +u2 v2 +u3 v3 unverändert bleibt, folgt aus der 1 0 0
e1 = ⎝ 0 ⎠, e2 = ⎝ 1 ⎠, e3 = ⎝ 0 ⎠.
obigen geometrischen Deutung. Das Skalarprodukt u · v ist
0 0 1
also eine geometrische Invariante, d. h. unabhängig von der
Wahl des kartesischen Koordinatensystems, und dies beweist
letztlich erst die Sinnhaftigkeit der obigen Definition. Ein weiterer Sonderfall der geometrischen Deutung des
Skalarprodukts verdient hervorgehoben zu werden:
Aus unserer geometrischen Interpretation des Skalarprodukts
folgt als Formel für die Berechnung des Winkels ϕ zwischen
Folgerung
je zwei vom Nullvektor verschiedenen Vektoren u und v:
Bei v = 1 gibt u · v = u cos ϕ die vorzeichen-
u·v behaftete Länge des orthogonal auf v projizierten Vektors u
cos ϕ = .
u v an (Abb. 7.13).
236 7 Analytische Geometrie – Rechnen statt Zeichnen
Zudem gilt:
u b1 · b2 = b1 · b3 = b2 · b3 = 0.
für j = 1, 2, 3.
x
Beispiel Zeigen Sie, dass die durch ihre kartesischen Ko- x−o
ordinaten gegebenen Vektoren u b2
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 1 1 2 1 −2 o
b1 = ⎝ 2 ⎠, b 2 = ⎝ 1 ⎠, b3 = ⎝ 2⎠
3 −2 3 2 3 1
Kommentar: In Kapitel 12 wird gezeigt, dass bei endlich- Beweis: Diese Ungleichung ist trivialerweise richtig bei
dimensionalen Vektorräumen die Abbildung der Vektoren v u = 0 oder bei v = 0. Bei u, v = 0 gilt für den von u und v
auf deren i-te B-Koordinate linear ist, und zwar ein Element eingeschlossenen Winkel ϕ:
b∗i der zur Basis B dualen Basis B ∗ . Im Sonderfall einer
orthonormierten Basis B gilt b∗i : v → (bi · v). u · v = u v cos ϕ,
also:
Analog zur Berechnung der Vektorkoordinaten sind auch |u · v| = u v | cos ϕ| ≤ u v.
die Koordinaten eines Punkts x bezüglich eines kartesischen Damit besteht Gleichheit genau bei | cos ϕ| = 1, also ϕ = 0◦
Koordinatensystems mit dem Ursprung o und den Basisvek- oder ϕ = 180◦ .
toren b1 , b2 , b3 als Skalarprodukte auszudrücken, nämlich:
Wir werden feststellen, dass diese Ungleichung auch noch
unter viel allgemeineren Bedingungen gilt. Deshalb wird für
Kartesische Punktkoordinaten als Skalarprodukte
v = 0 noch eine zweite Beweismöglichkeit gezeigt:
Ist (o; B) ein kartesisches Koordinatensystem, so gilt für
die zugehörigen Koordinaten des Punkts x: Für alle Linearkombinationen λu + μv von u und v gilt:
⎛ ⎞
x1
xi = (x − o) · bi λu + μv2 = λ2 u2 + 2λμ(u · v) + μ2 v2 ≥ 0.
(o;B) x = ⎝x2 ⎠ ⇐⇒
für i = 1, 2, 3.
x3 Wir betrachten diejenige Linearkombination, welche nach
der Frage auf Seite 235 den Fußpunkt f der aus dem Ur-
Dass die kartesischen Koordinaten von Punkten und Vek- sprung auf die Gerade G = u + R v legbaren Normalen
toren als Skalarprodukte berechenbar sind, wird auch aus ergibt, also den Fall
Abbildung 7.14 klar. Zur Begründung muss man sich nur u·v
λ = 1 und μ = − .
daran erinnern, dass mit Abbildung 7.13 das Skalarprodukt v·v
mit einem Einheitsvektor genau die Länge des auf diesen Dann folgt für f = λu + μv:
Einheitsvektor orthogonal projizierten Vektors angibt.
u·v (u · v)2
f 2 = u2 − 2 (u · v) + (v · v)
v·v (v · v)2
Kommentar: Dem aufmerksamen Leser wird nicht ent- (u · v)2
= u2 − ≥ 0,
v2
gangen sein, dass wir noch vor der Definition des Skalar-
produkts die Orthogonalität und Längenmessung als bekannt also u2 v2 ≥ (u · v)2 und damit weiter die Cauchy-
vorausgesetzt haben, um damit ein kartesisches Koordinaten- Schwarz’sche Ungleichung. Nur bei f = 0 besteht Gleich-
system zu erklären. Und jetzt verwenden wir das Skalarpro- heit. Genau dann geht die Gerade G durch den Ursprung,
dukt zur Erklärung der Längen- und Winkelmessung. Diese und die beiden Vektoren u, v sind linear abhängig, denn eine
logisch höchst bedenkliche Vorgehensweise kommt daher, nicht triviale Linearkombination λu + μv ergibt den Null-
weil wir in diesem Abschnitt ein mathematisches Modell vektor.
für unsere physikalische Umwelt entwickeln und von intuitiv
vorhandenen Begriffen ausgehen.
Von der Cauchy-Schwarz’schen Ungleichung können wir auf
Später in Kapitel 17 vermeiden wir derartige Zirkelschlüsse:
die folgende wichtige Ungleichung schließen.
Wir werden in allgemeinen Vektorräumen ein Skalarprodukt
definieren, indem wir dessen wichtigste Eigenschaften per
Definition fordern. Und darauf bauen wir dann erst eine Dreiecksungleichung
Längen- und Winkelmessung auf.
u + v ≤ u + v.
Beweis: Aus
Die Dreiecksungleichung und andere wichtige
Formeln u + v2 = (u + v) · (u + v) = u2 + v2 + 2(u · v)
u · v ≤ |u · v| ≤ u v
Cauchy-Schwarz’sche Ungleichung
folgt:
|u · v| ≤ u v.
Dabei gilt Gleichheit genau dann, wenn die Vektoren u u + v2 ≤ u2 + v2 + 2u v = (u + v)2 ,
und v linear abhängig sind.
und das ergibt die Dreiecksungleichung.
238 7 Analytische Geometrie – Rechnen statt Zeichnen
Hintergrund und Ausblick: Die Geometrie hinter dem Global Positioning System (GPS)
Das Global Positioning System (GPS) hat die Aufgabe, jedem Benutzer, der über ein Empfangsgerät verfügt, dessen genaue
Position auf der Erde mitzuteilen, wo auch immer er sich befindet. In der gegenwärtigen Form beruht das GPS auf 29 Satelliten,
welche die Erde ständig umkreisen und derart verteilt sind, dass mit Ausnahme der polnahen Gebiete für jeden Punkt der Erde
stets mindestens vier Satelliten über dem Horizont liegen. Jeder Satellit Si , i ∈ {1, 2, . . . }, kennt zu jedem Zeitpunkt seine
genaue Raumposition s i und teilt diese laufend den Empfängern per Funk mit.
Andererseits kann das Empfangsgerät die scheinbare Distanz di zwischen seiner Position x und der augenblicklichen
Satellitenposition s i messen – und zwar erstaunlicherweise anhand der Dauer, welche das Funksignal vom Satelliten zum
Empfänger braucht. Das ist vereinfacht so zu sehen: Der Satellit in der Position s i funkt die Zeitansage 8:00 Uhr, und diese
trifft beim Empfänger x gemäß dessen Uhr mit einer gewissen Zeitverzögerung ti ein, woraus durch Multiplikation mit der
Lichtgeschwindigkeit c die Distanz s i − x = di = c ti folgt. Dabei ist allerdings eine wesentliche Fehlerquelle zu beachten:
Während die Atomuhren in den Satelliten sehr genau synchronisiert sind, ist dies bei den Empfängeruhren technisch nicht
möglich. Geht etwa die Empfängeruhr um t0 vor, so erscheinen alle Distanzen um dasselbe d0 = c t0 vergrößert. Deshalb
lautet die wahre Distanz s i − x = di − d0 .
Es gibt vier Unbekannte, nämlich die drei Koordinaten für j = 2, 3, 4. Dies sind drei lineare Gleichungen. Wenn
x1 , x2 , x3 von x und den durch die mangelnde Synchro- für eine Lösung dieses linearen Systems neben
nisation der Empfängeruhr entstehenden Distanzfehler
d0 0. Stehen vier Satellitenpositionen s i , i = 1, . . . , 4, q1 (x, d0 ) = q2 (x, d0 ) = q3 (x, d0 ) = q4 (x, d0 )
samt zugehörigen scheinbaren Distanzen di = s i − x auch noch q1 (x, d0 ) = 0 gilt, so sind alle vier quadrati-
zur Verfügung, so müssen die vier Unbekannten die vier schen Gleichungen aus (∗) erfüllt.
quadratische Gleichungen
Sind die drei linearen Gleichungen in (∗∗) linear unab-
qi (x, d0 ) = (s i − x)2 − (di − d0 )2 = 0
hängig, so gibt es nach Seite 184 eine einparametrige Lö-
oder ausführlich sungsmenge, die wir mithilfe eines Parameters t darstellen
x · x − 2(s i · x) + s i · s i − d02 + 2di d0 − di2 = 0 (∗) können in der Form
' ( ' ( ' (
x &
x u
erfüllen. Wir zeigen, dass sich dieses nichtlineare Glei- = & +t bei t ∈ R.
chungssystem über R auf drei lineare und eine einzige d0 d0 v
quadratische Gleichung zurückführen lässt: Dabei schreiben wir abkürzend ein Vektorsymbol anstelle
des Koordinatentripels.
Wir setzen diese Lösung in die quadratische Gleichung
s2 q1 (x, d0 ) = 0 ein und erhalten als Bedingung für t
s3
&
x 2 + 2(& x · u)t + u2 t 2 − 2(s 1 · & x ) − 2(s 1 · u)t
+ s 1 2 = d&02 + 2d&0 vt + v 2 t 2 − 2d1 d&0 − 2d1 vt + d12 .
über Eigenschaften der Matrix gibt und gewisse Forderungen Die drei Koordinaten des Vektors (u × v) sind mit geeigne-
erfüllt. So sind etwa die n Spaltenvektoren von A genau dann ten Vorzeichen versehene Determinanten. Die zugehörigen
linear unabhängig, wenn det A von null verschieden ist, und zweireihigen Matrizen entstehen durch Streichung je einer
die Determinante ändert ihr Vorzeichen, wenn zwei Spalten Zeile aus der 3 × 2 -Matrix
oder auch zwei Zeilen vertauscht werden. ⎛ ⎞
u1 v1
Unser Ausgangspunkt für die Definition der Determinante im ⎝ u2 v2 ⎠
Sonderfall n = 2 ist das folgende Kriterium für die lineare u3 v3
Abhängigkeit zweier Vektoren:
welche von den Koordinatenspalten der beteiligten Vektoren
Lemma ' ( ' (
u und v gebildet wird.
Die Vektoren u = uu1 und v = vv1 aus K2 sind Nachdem die Vertauschung der beiden Spalten das Vorzei-
2 2
genau dann linear abhängig, wenn D = u1 v2 − u2 v1 = 0 chen aller drei Determinanten ändert, ist das Vektorprodukt
ist. nicht symmetrisch, sondern schiefsymmetrisch oder alternie-
rend, d. h. es gilt:
Beweis: Sind u und v linear abhängig, so ist u = 0 oder
v ein Vielfaches von u, also vi = λ ui für i = 1, 2. In beiden v × u = −u × v.
Fällen gilt D = 0.
Ist umgekehrt D = 0, so unterscheiden wir drei Fälle: Beispiel
Als erstes Zahlenbeispiel berechnen wir für die Vektoren
Bei u1 u2 = 0 können wir durch u1 u2 dividieren. Wir
v v ⎛ ⎞ ⎛ ⎞
erhalten 1 = 2 . Also ist v ist ein Vielfaches von u. 2 −1
u1 u2
Bei u1 = 0 und u2 = 0 muss auch v1 = 0 sein und daher u = ⎝ −1 ⎠ und v = ⎝ 5 ⎠
ebenfalls v = λ u gelten. 2 3
Bei u = 0 folgt keinerlei Bedingung für v.
das Vektorprodukt. Es ist
In allen drei Fällen sind jedenfalls u und v linear abhän- ⎛ ⎞ ⎛ ⎞
gig.
2 −1
u × v = ⎝ −1 ⎠ × ⎝ 5 ⎠
' ( 2 3
a11 a12 ⎛ ⎞ ⎛ ⎞
Um festzustellen, ob die Matrix ∈ K2×2 linear (−1) · 3 − 2 · 5 −13
a21 a22
= ⎝ 2 · (−1) − 2 · 3 ⎠ = ⎝ −8 ⎠.
abhängige Spaltenvektoren hat, muss man also nur über- 2 · 5 − (−1) · (−1) 9
prüfen, ob a11 a22 −a12 a21 = 0 ist. Dabei hat der Ausdruck
auf der linken Seite die zusätzliche Eigenschaft, bei einer Ver-
Für die Vektoren der Standardbasis des R3 , also für
tauschung der beiden Spalten das Vorzeichen zu wechseln.
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
All dies sind Gründe für die folgende Definition. 1 0 0
e1 = ⎝ 0 ⎠, e2 = ⎝ 1 ⎠ und e3 = ⎝ 0 ⎠,
0 0 1
Determinante
' ( 2 × 2 -Matrix
einer
a11 a12 gilt:
Ist A = a21 a22
∈ K2×2 , so nennen wir
Sind demnach u und v linear abhängig, d. h., u = 0 oder metrischen dreireihigen Matrizen S u ∈ R3×3 . Dies ist aber
v = λ u, so trifft dies auch auf die durch Weglassung einer wirklich nur im Dreidimensionalen möglich, denn eine
Koordinate entstehenden Vektoren zu, und es verschwinden schiefsymmetrische n-reihige Matrix enthält n(n − 1)/2 un-
alle drei Determinanten. abhängige Einträge, während Vektoren des Rn n Koordinaten
umfassen.
Verschwinden umgekehrt die drei Determinanten, so müssen
wir unterscheiden:
Bei u = 0 besteht jedenfalls die behauptete lineare Ab- Bei linear abhängigen Vektoren u und v ist deren Vektorpro-
hängigkeit. dukt gleich dem Nullvektor. Bei linearer Unabhängigkeit ist
Bei u = 0 ist mindestens eine Koordinate von u von null der Vektor u × v durch die folgenden Eigenschaften gekenn-
verschieden. Angenommen, es ist u1 = 0: Dann gilt für zeichnet.
v
λ = 1 wegen u1 v2 − u2 v1 = 0 zugleich v2 = λu2
u1
und wegen u3 v1 − u1 v3 = 0 auch v3 = λu3 und daher Geometrische Deutung des Vektorprodukts
v = λ u. 1) Sind die Vektoren u und v linear unabhängig, so ist
Ist bei u = 0 zwar u1 = 0, aber dafür u2 = 0 oder u3 = 0, der Vektor u × v orthogonal zu der von u und v auf-
v v
so gehen wir analog vor mit λ = 2 bzw. λ = 3 . Wieder gespannten Ebene.
u2 u3
folgt v = λ u. 2) Es gilt:
u × v = 0 hat somit stets die lineare Abhängigkeit von u und u × v = u v sin ϕ. (7.10)
v zur Folge.
Dabei ist ϕ der von u und v eingeschlossene Winkel
mit 0◦ ≤ ϕ ≤ 180◦ .
Eine Eigenschaft des Vektorprodukts wurde bereits in Kapi- u × v ist somit gleich dem Flächeninhalt des von
tel 3 besprochen: Das Vektorprodukt ist nicht assoziativ, d. h. u und v aufgespannten Parallelogramms.
von Sonderfällen abgesehen gilt:
3) Die drei Vektoren (u, v, (u × v)) bilden in dieser
(u × v) × w = u × (v × w). Reihenfolge ein Rechtssystem.
Als Begründung genügt ein einziges Beispiel, etwa
(e1 × e2 ) × e2 = e3 × e2 = −e1 , hingegen Beweis: 1) Wir erkennen durch Ausrechnen, dass
e1 × (e2 × e2 ) = e1 × 0 = 0.
u · (u × v) = u1 (u2 v3 − u3 v2 )
+ u2 (u3 v1 − u1 v3 ) + u3 (u1 v2 − u2 v1 ) = 0.
Das Vektorprodukt hat eine geometrische
Bedeutung Damit ist das vom Nullvektor verschieden vorausgesetzte
Vektorprodukt u × v zu u orthogonal.
Das Vektorprodukt ist linear in jedem Anteil, denn Nach Vertauschung von u mit v folgt:
(u1 + u2 ) × v = (u1 × v) + (u2 × v),
(λu) × v = λ(u × v). v · (v × u) = −v · (u × v) = 0.
Mit einiger Mühe lässt sich auch das Vektorprodukt u × v Also ist das Vektorprodukt u × v auch orthogonal zu v und
als ein Matrizenprodukt schreiben. Dazu muss allerdings der wegen der Bilinearität sogar orthogonal zu jeder Linearkom-
erste Vektor u zu einer alternierenden oder schiefsymmetri- bination von u und v, also zu allen Vektoren der von u und
schen Matrix S u umgeformt werden, also zu einer quadrati- v aufgespannten Ebene.
schen Matrix, bei der sich die bezüglich der Hauptdiagonale
symmetrischen Einträge aik und aki genau durch das Vorzei- Sucht man umgekehrt einen Vektor x, der zu u×v orthogonal
chen unterscheiden. Für die Einträge auf der Hauptdiagonale, ist, so müssen dessen 3 Koordinaten eine lineare homogene
also mit k = i, bedeutet dies aii = −aii und somit aii = 0. Gleichungen lösen, deren Koeffizienten nicht alle null sind.
Nach den Ergebnissen von Kapitel 5 (siehe Seite 184) gibt
Nach den Regeln für die Bildung des Matrizenprodukts ist es eine zweiparametrige Lösungsmenge. Nachdem u und v
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ bereits zwei linear unabhängige Lösungen sind, ist x eine
u1 v1 u2 v3 − u3 v2
u × v = ⎝u2 ⎠ × ⎝v2 ⎠ = ⎝ u3 v1 − u1 v3 ⎠ Linearkombination von u und v. Somit ist ein verschwin-
u3 v3 u1 v2 − u2 v1 dendes Skalarprodukt mit u × v äquivalent zur linearen Ab-
⎛ ⎞⎛ ⎞ (7.9) hängigkeit von u und v.
0 −u3 u2 v1
= ⎝ u3 0 −u1 ⎠ ⎝v2 ⎠ = S u v.
−u2 u1 0 v3
?
Beweisen Sie die Aussage: Der Punkt x gehört genau dann
der von u und v aufgespannten Ebene E durch den Punkt p
Kommentar: Es besteht offensichtlich eine bijektive an (Abb. 7.16), wenn (x − p) · (u × v) = 0 ist.
Abbildung zwischen Vektoren u ∈ R3 und den schiefsym-
242 7 Analytische Geometrie – Rechnen statt Zeichnen
und somit ⎛ ⎞
E b2
0
u × v = ⎝ 0 ⎠.
b1 u1 v2
3) Aufgrund der bisher nachgewiesenen geometrischen in der von den Basisvektoren b1 und b2 aufgespannten Ebene
Eigenschaften des Vektorprodukts u × v bleibt nur mehr of- gibt die zweireihige Determinante
fen, nach welcher Seite der Vektor zeigt. ⎞⎛
' ( 0
u1 v1
Um dies zu klären, denken wir uns das von u und v aufge- D = det mit u × v = ⎝ 0 ⎠
u2 v2
spannte Parallelogramm als Kartonscheibe (Abb. 7.16). Nun D
verlagern wir diese im Raum. Und zwar verlegen wir u in die
Richtung des ersten Vektors b 1 unserer kartesischen Basis. den vorzeichenbehafteten Flächeninhalt des von u und v auf-
Hingegen soll v derart in die von b1 und b2 aufgespannte gespannten Parallelogramms an. Dabei ist dieser Inhalt ge-
Ebene gelegt werden, dass die zweite Koordinate von v po- nau dann positiv, wenn u, v und der dritte Basisvektor b3 ein
sitiv ausfällt. Rechtssystem bilden. Jetzt erkennen wir „im Hinsehen“, was
in dem Lemma auf Seite 240 behauptet wurde, dass nämlich
Bei dieser anschaulich vorzustellenden Verlagerung ändern D = 0 die lineare Abhängigkeit der zwei Vektoren kenn-
sich die Koordinaten von u und v stetig. Daher ändern sich zeichnet.
7.3 Weitere Produkte von Vektoren im Anschauungsraum 243
Das Spatprodukt dreier Vektoren liefert das Geometrische Deutung des Spatprodukts
Volumen des aufgespannten Parallelepipeds Der Absolutbetrag | det(u, v, w)| des Spatprodukts ist
gleich dem Volumen des von den Vektoren u, v und w
Wir kehren zurück zu den Produkten von Vektoren. aufgespannten Parallelepipeds.
Verschwindendes Spatprodukt
Genau dann ist det(u, v, w) = 0, wenn die drei Vektoren
u, v und w linear abhängig sind, also komplanar liegen.
u×v
w
ϕ h
Wir haben D als u · (v × w) eingeführt. Dies zeigt, dass eine
v
Vertauschung von v mit w das Vorzeichen von D ändert.
Andererseits bleibt die Determinante bei zyklischen Vertau-
schungen der Spaltenvektoren erhalten. Somit verhält sich p
u
das Spatprodukt bei Änderungen der Reihenfolge gemäß
Das Spatprodukt als gemischtes Produkt Wir berechnen das Volumen des Parallelepipeds nach der
Das Spatprodukt lässt sich auch als Skalarprodukt mit Formel „Grundfläche mal Höhe“. Dabei wählen wir das von
einem Vektorprodukt ausdrücken: u und v aufgespannte Parallelogramm als Grundfläche des
genannten Parallelepipeds. Der Inhalt der Grundfläche be-
det(u, v, w) = u · (v × w) = w · (u × v) (7.11) trägt demnach
F# = u × v.
Wie die bisherigen Produkte ist auch das Spatprodukt linear
Die Höhe des Parallelepipeds ist gleich dem Wert h =
in jedem Anteil, also z. B.
w cos ϕ, wenn ϕ den Winkel zwischen w und einer zur
det ((u1 + u2 ), v, w) = det(u1 , v, w) + det(u2 , v, w). Grundfläche orthogonalen Geraden angibt. Nach unseren
bisherigen Ergebnissen gilt nun offensichtlich:
Dass das Spatprodukt eine vom Koordinatensystem unab-
hängige Bedeutung hat, folgt einerseits aus der Darstellung | det(u, v, w)| = |(u × v) · w|
als Skalarprodukt mit einem Vektorprodukt und der bereits = u × v w cos ϕ = F# · h,
bewiesenen Invarianz dieser beiden Produkte. Aber das Spat-
produkt hat auch eine einfache geometrische Deutung. wie behauptet wurde.
7.3 Weitere Produkte von Vektoren im Anschauungsraum 245
? Beispiel
Für die Vektoren e1 , e2 , e3 der Standardbasis gilt:
Welche der oben angeführten Eigenschaften des Spat-
⎛⎞
produkts sind aufgrund dieser geometrischen Deutung un- 1 0 0
mittelbar ersichtlich? det(e1 , e2 , e3 ) = det ⎝ 0 1 0 ⎠ = 1.
0 0 1
Dies legt nahe, das Spatprodukt det(u, v, w) ohne Betrags- Zu dessen Berechnung wählen wir etwa das Dreieck
a 1 a 2 a 3 als Grundfläche und berechnen das Pyramidenvo-
zeichen als orientiertes Volumen des von u, v und w auf-
lumen nach der Formel 13 Grundfläche mal Höhe. Wenn
gespannten Parallelepipeds zu definieren. Dessen Absolut-
wir die Grundfläche zu dem Parallelogramm a 1 a 2 p a 3
betrag ist, wie eben gezeigt, gleich dem elementaren Vo- ergänzen bei p = a 2 + (a 3 − a 1 ), so verdoppeln wir
lumen. Das orientierte Volumen ist positiv oder negativ je deren Flächeninhalt. Dann aber stellt das Produkt Grund-
nachdem, ob die linear unabhängigen Vektoren in der ange- fläche ×Höhe den Inhalt des von den Differenzvektoren
gebenen Reihenfolge ein Rechtssystem oder ein Linkssystem a 2 − a 1 , a 3 − a 1 und a 4 − a 1 aufgespannten Parallelepi-
bilden. peds dar. Somit gilt für das Tetraedervolumen:
V = 1
|det [(a 2 − a 1 ), (a 3 − a 1 ), (a 4 − a 1 )]|
6
) ⎛ ⎞)
) −4 −2 −2 )
Kommentar: Wenn wir ein Rechtssystem mithilfe der De- ) )
= 1 )det ⎝ 0 2 −2 ⎠)
terminante definieren, die selbst ja über Koordinaten berech- 6 ) √ √ )
) 0 −2 2 −2 2 )
net wird, so genügt es nur dann der Rechten-Hand-Regel, √
) √ √ )) 16 2
wenn auch die den Koordinaten zugrunde liegende kartesi- )
= 1
6 )(−4)(−4 2 − 4 2)) = .
sche Basis der Rechten-Hand-Regel genügt. 3
246 7 Analytische Geometrie – Rechnen statt Zeichnen
Alternativ dazu zeigt die Formel auf Seite 491, wie das Mithilfe der Grassmann-Identität lassen sich die folgenden
Volumen einer dreiseitigen Pyramide aus deren sechs Kan- Formeln für weitere gemischte Produkte herleiten:
tenlängen berechenbar ist, nämlich mithilfe der Cayley-
Menger’schen Determinante. 1. Jacobi-Identität
[u × (v × w)] + [v × (w × u)] + [w × (u × v)] = 0.
In der Box auf Seite 247 wird anhand eines Beispiels de-
monstriert, wie der Grundaufgabe der analytischen Geome-
trie entsprechend jede geometrische Aussage äquivalent ist 2. Lagrange-Identität
zu einer in Koordinaten formulierbaren mathematischen Aus-
sage. (u × v) · (w × x) = (u · w)(v · x) − (u · x)(v · w).
Einige nützliche Formeln für gemischte Beweis: Die erste Gleichung folgt aus der Grassmann-
Produkte Identität durch zyklische Vertauschung, also den Ersatz
(u, v, w) → (v, w, u) → (w, u, v), und durch anschlie-
Wir stellen in der Folge einige Formeln zusammen, die beim ßende Addition.
Rechnen mit Vektoren im R3 hilfreich sind, und beginnen
mit der Grassmann-Identität:
Die Langrange-Identität ergibt sich aus (7.11) wie folgt:
(u × v) × w = (u · w)v − (v · w)u.
(u × v) · (w × x) = det ((u × v), w, x)
= [(u × v) × w] · x
Beweis: Wir bestätigen die Richtigkeit, indem wir die = [(u · w)v − (v · w)u] · x.
Koordinaten ausrechnen: Setzen wir vorübergehend x =
u × v, so lautet die erste Koordinate des gesuchten Vektors Die Formel u × v = u v sin ϕ aus (7.10) ist wegen
y = (u×v) × w = x × w: (7.6) ein Sonderfall der Lagrange-Identität. Dasselbe trifft
auf die Gleichung (u · v)2 + (u × v)2 = u2 v2 von
y1 = x2 w3 − x3 w2 Seite 243 zu.
= (u3 v1 − u1 v3 )w3 − (u1 v2 − u2 v1 )w2
= v1 (u3 w3 + u2 v2 ) − u1 (v3 w3 + v2 w2 ).
Schließlich folgt aus der Grassmann-Identität
Wir geben auf der rechten Seite u1 v1 w1 − u1 v1 w1 = 0 dazu
und erhalten: (u × v) × (w × x) = (u · (w × x)) v − (v · (w × x)) u
= det(u, w, x) v − det(v, w, x) u,
y1 = v1 (u3 w3 +u2 v2 +u1 w1 ) − u1 (v3 w3 +v2 w2 +v1 w1 )
= (u · w)v1 − (v · w)u1 . womit auch die letzte Gleichung gezeigt ist.
u × (v × w) = (u · w)v − (u · v)w. Eine K-Algebra, in welcher die Jacobi-Identität gilt und fer-
ner a ∗ a = 0 für alle a ∈ V , heißt übrigens Lie-Algebra.
7.4 Abstände zwischen Punkten, Geraden und Ebenen 247
Problemanalyse und Strategie: Liegen diese Geraden auf einem Drehkegel, so enden die von x längs dieser Geraden
abgetragenen Einheitsvektoren in vier Punkten p 1 , . . . , p 4 eines Kreises auf diesem Drehkegel (siehe Abbildung unten)
und damit in einer Ebene. Liegen umgekehrt diese vier Punkte im Abstand 1 von x in einer Ebene, so gehören sie dem
Schnitt dieser Ebene mit der in x zentrierten Einheitskugel an, also einem Kreis. Dessen Verbindungsgeraden mit der
Kugelmitte bilden einen Drehkegel oder, falls die Ebene durch die Kugelmitte geht, eine Ebene, also den Grenzfall eines
Drehkegels mit 180◦ Öffnungswinkel.
Lösung: Diese liegen genau dann in einer Ebene, wenn die Diffe-
renzvektoren je zweier v j −
v 1 für j = 2, 3, 4 komplanar,
also linear abhängig sind. Dies kann mithilfe des Spatpro-
s4
dukts ausgedrückt werden:
v4 v2 −
det ( v3 −
v 1 ), ( v4 −
v 1 ), ( v 1 ) = 0. (∗)
7.4 Abstände zwischen Punkten, herausstellen; es gibt dann nämlich stets Punkte a ∈ M und
b ∈ N mit dist(M, N) = a − b.
Geraden und Ebenen
In diesem Abschnitt zeigen wir, wie mithilfe der im Anschau- Abstände eines Punkts von Geraden oder
ungsraum verfügbaren Produkte von Vektoren Abstände zwi- Ebenen sind mittels Vektorprodukt zu
schen Punkten, Geraden und Ebenen oder auch zwischen berechnen
zwei Geraden berechenbar sind. Dabei gehen wir von fol-
gender Definition aus: Angenommen, es sind die Gerade G = p + Ru und der
Punkt a außerhalb von G gegeben (Abb. 7.19). Der Punkt
Sind M und N zwei nichtleere Punktmengen des R3 , so heißt
b ∈ G sei der Fußpunkt der aus p an G legbaren Normalen.
Dann bildet jeder Punkt x ∈ G \ {b} zusammen mit a und
dist(M, N) = inf { x − y | x ∈ M und y ∈ N }
b ein rechtwinkliges Dreieck, und dessen Hypotenuse ax ist
stets länger als die Kathete ab. Also ist die Kathetenlänge
Abstand oder Distanz der Punktmengen M und N.
Wegen x − y ≥ 0 ist die Menge der Distanzen x − y a − b = min{ a − x | x ∈ G} = dist(a, G).
durch 0 nach unten beschränkt; also gibt es stets dieses Infi-
mum. Dieses braucht allerdings kein Minimum zu sein, wie Zur Berechnung des Abstands dist(a, G) bestimmen wir zu-
wir aus Kapitel 4 wissen. Sind die Mengen M und N af- erst einen Normalvektor der Verbindungsebene aG, nämlich
fine Teilräume des R3 , also Punkte, Geraden oder Ebenen, (Abb. 7.19):
so werden sich die gegenseitigen Abstände doch als Minima n = (a − p) × u.
248 7 Analytische Geometrie – Rechnen statt Zeichnen
Das Skalarprodukt u · v der Vektoren u, v ∈ R3 – Bei linear unabhängigen u, v steht u × v auf der
mit kartesischen Koordinaten (u1 , u2 , u3 )0 bzw. von u und v aufgespannten Ebene normal; die Norm
(v1 , v2 , v3 )0 lautet: u × v ist gleich dem Flächeninhalt u v sin ϕ
des von u und v aufgespannten Parallelogramms; der
u · v = u1 v1 + u2 v2 + u3 v3 . Vektor u × v bildet mit u und v ein Rechtssystem,
sofern sich die Koordinaten auf ein Rechtskoordina-
√ tensystem beziehen.
– Es ist u = u · u die Norm oder Länge des Vek-
tors u und a − b die Distanz der Punkte a und b. Das Spatprodukt det(u, v, w) ist eine reelle Zahl und
– Jeder Vektor u = 0 lässt sich durch skalare Multi- zwar die Determinante derjenigen 3 × 3 -Matrix, wel-
u = u1 u auf einen Einheitsvektor
plikation gemäß che die kartesischen Koordinaten von u, v und w der
normieren. Reihe nach als Spaltenvektoren besitzt.
– Das Skalarprodukt u·v ist symmetrisch, v ·u = u·v, – Das Spatprodukt ist linear in jedem Anteil, also
und in jedem Anteil linear, also (u1 +u2 )·v = (u1 ·v) det(u1 + u2 , v, w) = det(u1 , v, w) + det(u2 , v, w)
+ (u2 · v) und (λu) · v = λ(u · v). und det(λu, v, w) = λ det(u, v, w).
– Das Produkt u · v ist vom verwendeten kartesi- – Die Vertauschung zweier Vektoren ändert das Vor-
schen Koordinatensystem unabhängig, denn es gilt zeichen; es ist det(u, v, w) = det(v, w, u) =
u · v = u v cos ϕ mit ϕ als dem von u und v − det(v, u, w).
eingeschlossenen Winkel bei 0 ≤ ϕ ≤ π . – Das Spatprodukt det(u, v, w) gibt das orientierte
– Eine orthonormierte Basis (b1 , b2 , b3 ) des R3 ist Volumen des von den drei Vektoren aufgespannten
durch bi · bj = δij gekennzeichnet. Parallelepipeds an und ist somit unabhängig von dem
– Es gelten die Cauchy-Schwarz’sche Ungleichung zugrunde liegenden Rechtskoordinatensystem.
|u · v| ≤ u v und die Dreiecksungleichung – Genau bei det(u, v, w) > 0 bilden die drei Vektoren
u + v ≤ u + v. in dieser Reihenfolge ein Rechtssystem.
Das Vektorprodukt oder Kreuzprodukt u × v ist ein – Ein verschwindendes Spatprodukt kennzeichnet li-
Vektor und aus den kartesischen Koordinaten von u und neare Abhängigkeit.
v nach der Formel – Es ist det(u, v, w) = u · (v × w) = w · (u × v).
Dann ist n gleich dem Inhalt des von u und a − p auf- Bei der Bestimmung des Abstand des Punkts a von der Ebene
gespannten Parallelogramms. Die Höhe dieses Parallelo- E = p + R u + R v gehen wir analog vor: Wir legen durch a
gramms gegenüber u ist gleich der gesuchten Distanz. die Normale N = a+ R(u×v) zur Ebene E und suchen deren
Schnittpunkt b mit E (siehe Abbildung 7.22 auf Seite 252).
Folgerung Jeder von b verschiedene Punkt x ∈ E bildet mit b und
Für den Abstand des Punkts a von der Geraden G = p + Ru a ein rechtwinkliges Dreieck, denn (x − b) · (u × v) =
gilt: det(x − b, u, v) = 0 wegen der linearen Abhängigkeit der
(a − p) × u beteiligten Vektoren. Die Hypotenuse ax ist natürlich länger
dist(a, G) = .
u als die Kathete ab. Somit ist dist(a, E) = b − a.
Der Fußpunkt b der Normalen aus dem Punkt a an die Gerade Der Normalenfußpunkt b ∈ (E ∩ N) hat die beiden Darstel-
G = p + Ru lautet: lungen
(a − p) · u b = p + λ u + μ v und b = a + ν (u × v)
b=p+ u,
u·u
wie schon auf Seite 235 festgestellt worden ist. mit gewissen λ, μ, ν ∈ R. Das Skalarprodukt beider Darstel-
7.4 Abstände zwischen Punkten, Geraden und Ebenen 249
Folgerung Lemma
Für den Abstand des Punkts a von der Ebene E = p + Sind die zwei Geraden G und H nicht parallel, so
Ru + Rv gilt: gibt es ein eindeutiges Gemeinlot N . Für die Schnittpunkte
a, b von N mit G bzw. H gilt:
| det(p − a, u, v)|
dist(a, E) = . dist(G, H ) = b − a.
u × v
Dann ist dist(G, H ) = ν n = |ν| n, wobei die Vektor- (Abb. 7.21). Genau dann verschwindet deren Spatprodukt,
gleichung b − a = ν n, also d. h.:
zu erfüllen ist. In Koordinaten ausgeschrieben sind dies drei oder mit n = u × v als Normalvektor zu E:
lineare Gleichungen in den drei Unbekannten λ, μ und ν.
n · x = n · p = k = konst.
Durch Bildung von Skalarprodukten lassen sich die Unbe-
kannten sogar explizit angeben: Dies bedeutet ausführlich:
Wir multiplizieren die auf der linken und rechten Seite der
n1 x1 + n2 x2 + n3 x3 = k.
Gleichung (∗) stehenden Vektoren skalar mit n und erhalten:
Der Mittelpunkt der Gemeinlotstrecke ab ist gleichzeitig nach L. O. Hesse (1811–1874) Hesse’sche Normalform
eine optimale Näherung für den „Schnittpunkt“ zweier ein- der Ebene E.
ander „beinahe“ schneidenden Geraden, wie das Beispiel auf
Seite 251 zeigt. Dabei gibt |k| = |n · p| nach der geometrischen Deu-
tung des Skalarprodukts (siehe Abbildung 7.13) den Ab-
stand des Koordinatenursprungs o von der Ebene E an, also
Die Hesse’sche Normalform ist mehr als nur dist(o, E) = |k|.
die Gleichung einer Ebene Setzen wir einen beliebigen Raumpunkt a in die Ebenenglei-
chung ein, so ist bei x ∈ E (Abb. 7.22)
Der Punkt x liegt genau dann in der Ebene E = p+ Ru+ Rv,
wenn die Vektoren (x − p), u und v linear abhängig sind l(a) = n · a − k = n · a − n · x = n · (a − x).
7.4 Abstände zwischen Punkten, Geraden und Ebenen 251
5
6 5
6
4 3
3 4
8 11 1 8
9 11
1
9
7 12 7
12
2
13 2 13
10 10
14
14
Ein Problem der Computer-Vision: Die Rekonstruktion zweier Fotos mithilfe von 14 Passpunkten.
Problemanalyse und Strategie: Nachdem die zi und x i durch Messungen und numerische Berechnungen ermittelt
worden sind, kann man nicht erwarten, dass die beiden Projektionsgeraden einander wirklich schneiden. Man muss also
die bestmögliche Näherung für den Schnittpunkt ausrechnen.
Somit gibt l(a) die vorzeichenbehaftete Länge der Projektion Die Werte l(x) durchlaufen wegen 0 ≤ λ ≤ 1 das abge-
des Vektors a − x auf n an. Dies eröffnet die Möglichkeit, schlossene Intervall [ l(a), l(b) ] in R. Haben l(a) und l(b)
den Abstand dist(a, E) zusätzlich mit einem Vorzeichen zu gleiche Vorzeichen, so haben auch alle Zwischenwerte l(x)
versehen. dieses Vorzeichen. Deshalb sind die offenen Halbräume kon-
vex. Sind l(a) und l(b) nicht negativ bzw. nicht positiv, so gilt
jeweils dasselbe für alle Zwischenwerte. Damit ist auch die
Konvexität der abgeschlossenen Halbräume bewiesen.
N
a Beispiel Die vier Punkte
n
⎛ ⎞ ⎞ ⎛
a−x ±2 0
a 1,2 = ⎝ √0 ⎠, ±2 ⎠
a 3,4 = ⎝ √
2 − 2
l(a ) b
n123 = (a 2 − a 1 ) × (a 3 − a 1 )
Eigenschaften der Hesse’schen Normalform ⎛ ⎞
⎛ ⎞ ⎛ ⎞
−4 −2 0√
Ist l(x) = 0 die Hesse’sche Normalform der Ebene E, = ⎝ 0 ⎠×⎝ 2√ ⎠ = ⎝−8 2 ⎠.
so gibt l(a) den orientierten Abstand des Punkts a von 0 −2 2 −8
E an. Dabei ist dieser Abstand l(a) genau dann posi-
tiv, wenn a auf jener Seite von E liegt, auf welche der Wir normieren zu
Normalvektor n zeigt. ⎛ ⎞
1 √0
n123 = √ ⎝ 2 ⎠
3 1
Die Ebene E zerlegt den Raum R3 \ E in zwei offene Halb-
räume, deren Punkte x durch l(x) > 0 bzw. durch l(x) < 0 und haben damit eine von zwei möglichen Richtungen aus-
gekennzeichnet sind. Die durch l(x) ≥ 0 bzw. l(x) ≤ 0 gewählt. Um festzustellen, ob n123 nach außen oder innen
charakterisierten Punktmengen heißen abgeschlossene Halb- zeigt, berechnen wir die Gleichung der Ebene a 1 a 2 a 3 als
räume.
l(x) = n123 · x − k mit l(a 1 ) = 0,
Lemma √
Halbräume sind stets konvexe Mengen, ob sie nun offen sind also k =
n123 · a 1 = 2/3. Nun gilt für den Ursprung, also
oder die Punkte der Begrenzungsebene einschließen. für einen Innenpunkt des Tetraeders:
%
Beweis: Nach der Definition der Konvexität auf Seite 231 l(0) = −k = − 2/3 < 0.
müssen wir beweisen, dass ein offener bzw. abgeschlossener
Dieser orientierte Abstand ist negativ; der Vektor
n123 weist
Halbraum mit zwei Punkten a und b stets die ganze Strecke
somit wie gewünscht nach außen.
ab enthält. Unsere Anschauung zeigt uns, dass dies offen-
sichtlich richtig ist. Trotzdem soll vorgeführt werden, wie Der Normalvektor n124 der Ebene span(a 1 a 2 a 4 ) unterschei-
sich dies durch Rechnung beweisen lässt: det sich von n123 durch das Vorzeichen der ersten und dritten
Koordinate, und analoge Überlegungen ergeben für den rich-
Die Punkte der abgeschlossenen Strecke ab sind als Kon-
tig orientierten Einheitsvektor:
vexkombinationen von a und b darstellbar. Nach Seite 230
ist ⎛ ⎞
√ 0
1
conv{a, b} = { x = λ a + (1 − λ) b | 0 ≤ λ ≤ 1 }.
n124 = √ ⎝− 2 ⎠.
3 1
Wegen l(x) = n · x − k folgt weiter:
Analog berechnen wir:
l(x) = n · [λ a + (1 − λ) b] − k
⎛√ ⎞ ⎛ √ ⎞
= λ(n · a) + (1 − λ)(n · b) − k
1 2 1 − 2
= λ (l(a) + k) + (1 − λ) (l(b) + k) − k
n134 = √ ⎝ 0 ⎠ und
n234 = √ ⎝ 0 ⎠.
= λ l(a) + (1 − λ) l(b). 3 −1 3 −1
7.4 Abstände zwischen Punkten, Geraden und Ebenen 253
Dabei weisen auch diese beiden Vektoren nach außen, denn aus R3×3 . Damit lautet ϕ ausführlich:
wir erhalten für den in beiden Ebenen gelegenen√Punkt a 3 ⎛ ⎞ ⎛ ⎞⎛ ⎞
positive Skalarprodukte a 3 ·
n134 = a 3 ·
n234 = 2/3 > 0. x1 a11 a12 a13 x1
⎝x ⎠ = ⎝ a21 a22 a23 ⎠ ⎝x2 ⎠
2
Die Punkte im Inneren dieses Tetraeders sind somit durch die x3 a31 a32 a33 x3
folgenden vier linearen Ungleichungen beschrieben: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a11 a12 a13
√ √ = ⎝ a21 ⎠ x1 + ⎝ a22 ⎠ x2 + ⎝ a23 ⎠ x3 .
√2 x2 + x3 − √2 < 0
a31 a32 a33
−√2 x2 + x3 − √2 < 0
√2 x1 − x3 − √2 < 0
Wählen wir als Urbild x den Vektor e1 der Standardbasis
− 2 x2 − x3 − 2 < 0
des R3 (siehe Seite 235), also mit x1 = 1, x2 = x3 = 0,
Hier haben √
wir die Hesse’schen Normalformen jeweils mit so ist der Bildvektor x gleich dem ersten Spaltenvektor s 1
dem Faktor 3 erweitert. von A. Analog sind die restlichen Spaltenvektoren Bilder
von e2 bzw. e3 . Die Abbildung ϕ ist somit durch die Bilder
Die Bestimmung der Lösungsmenge von Systemen derarti- ϕ(ei ) = s i der Standardbasis eindeutig festgelegt.
ger linearer Ungleichungen gehört übrigens zum Fachgebiet
lineare Optimierung (siehe Kapitel 24). Nach dem Lemma Auch die identische Abbildung idR3 ist eine lineare Abbil-
auf Seite 252 ist die Lösungsmenge der Durchschnitt endlich dung. Wegen idR3 (ei ) = ei lautet die zugehörige Darstel-
vieler konvexer Mengen und somit ebenfalls konvex. lungsmatrix
⎛ ⎞
1 0 0
? E 3 = ⎝ 0 1 0 ⎠.
Welche geometrische Form wird von den Punkten mit den 0 0 1
n123 ,
Ortsvektoren n124 ,
n134 ,
n234 gebildet?
Diese heißt (dreireihige) Einheitsmatrix, und es ist
E3 x = x für alle x ∈ R3 .
Die obige Zerlegung des Matrizenprodukts A x in eine
Die Orthogonalprojektion ist Anlass für eine Summe von Spaltenvektoren zeigt, dass alle Bildvektoren
x Linearkombinationen der Spaltenvektoren s 1 , s 2 , s 3 von
Vorschau auf lineare Abbildungen
A sind. Die Menge der Bildvektoren ist somit die Hülle der
Spaltenvektoren von A und damit ein Unterraum von R3 .
Bevor wir uns im Anschauungsraum genauer mit Ortho-
Die Dimension dieses Unterraums, des Bildes ϕ(R3 ), heißt
gonalprojektionen auf Ebenen oder Geraden befassen, sind
Rang rg(ϕ) der linearen Abbildung ϕ und auch Rang rg A
einige Zwischenbemerkungen über lineare Abbildungen und
der Darstellungsmatrix A.
über das Rechnen mit Matrizen notwendig.
Bei rg(A) = 3 sind die Spaltenvektoren s 1 , s 2 , s 3 linear un-
Eine Abbildung ϕ von einem Vektorraum V in einen Vek-
abhängig; daher ist det A = 0. In diesem Fall bilden die Spal-
torraum V heißt linear, wenn sie sich nach Einführung von
tenvektoren von A eine Basis des R3 . Nachdem jeder Vektor
Koordinaten in V und V durch Multiplikation mit einer Ma-
x des R3 eine eindeutige Darstellung als Linearkombination
trix beschreiben lässt, also von folgender Bauart ist:
dieser Basisvektoren besitzt, gibt es zu jedem Bildvektor ein
ϕ : V → V mit x → x = A x. eindeutiges Urbild x. Die Abbildung ϕ ist in diesem Fall
bijektiv; es gibt die Umkehrabbildung ϕ −1 .
A heißt Darstellungsmatrix dieser Abbildung. Wir werden Hat man die Urbilder y i der Vektoren ei der Standardbasis
uns sehr ausführlich im Kapitel 12 mit derartigen Abbildun- bereits berechnet, etwa durch Auflösen des zugehörigen li-
gen befassen und dort eine elegantere Definition kennenler- nearen Gleichungssystems A y i = ei , so ist das Urbild von
nen, nämlich eine anhand ihrer beiden Eigenschaften x = 3 −1 3
i=1 xi ei gleich ϕ (x ) = i=1 xi y i , denn für
jedes i ∈ {1, 2, 3} ist
ϕ(x + y) = ϕ(x) + ϕ(y) und ϕ(λx) = λ ϕ(x).
A (xi y i ) = xi (A y i ) = xi ei .
Diese bewirken, dass Linearkombinationen wieder auf Li-
nearkombinationen mit denselben Koeffizienten abgebildet
Dies zeigt, dass auch ϕ −1 eine lineare Abbildung ist; die
werden, also
zugehörige Darstellungsmatrix A−1 heißt inverse Matrix
n von A. Deren Spaltenvektoren y 1 , y 2 , y 3 haben die Eigen-
! !n
ϕ λi x i = λi ϕ(x i ). schaft A y i = ei . Wird also die Matrix A der Reihe nach
i=1 i=1 mit den Spaltenvektoren von A−1 multipliziert, so entstehen
die Spalten der Einheitsmatrix. Wir schreiben dies kurz als
Hier beschränken wir uns auf die lineare Abbildungen Matrizenprodukt
ϕ : R3 → R3 . Deren Darstellungsmatrizen A = aik sind A · A−1 = E3 .
254 7 Analytische Geometrie – Rechnen statt Zeichnen
Dahinter steht die folgende Erweiterung der auf Seite 175 Nachdem bei bijektivem ϕ die Zusammensetzungen ϕ −1 ◦ ϕ
eingeführten Multiplikation einer Matrix mit einem Spalten- und ebenso ϕ ◦ϕ −1 die identischen Abbildung id R3 ergeben,
vektor: folgt für die zugehörigen Darstellungsmatrizen ergänzend zu
oben:
Wir bilden das Matrizenprodukt D = B · C einer Matrix
B ∈ Km×n mit einer Matrix C ∈ Kn×p , indem wir der Reihe A−1 A = A A−1 = E3 .
nach B mit den p Spaltenvektoren von C multiplizieren und
diese als Spalten in D zusammenfassen.
Die bijektiven linearen Abbildungen ϕ : R3 → R3 bilden
Man beachte: Das Produkt kann nur gebildet werden, wenn eine Gruppe, und zwar eine Untergruppe der Gruppe aller
die Spaltenanzahl n des ersten Faktors B gleich der Zeilenan- Permutationen des R3 (siehe Seite 66). Jedem ϕ ist eine Ma-
zahl des zweiten Faktors C ist. Dann lautet das Element dik trix A ∈ R3×3 mit det A = 0 bijektiv zugeordnet, wobei der
der Produktmatrix für i ∈ {1, . . . , m} und j ∈ {1, . . . , p}: Hintereinanderausführung ϕ ◦ ϕ das Produkt A · A ent-
spricht. Deshalb bilden auch die dreireihigen reellen Ma-
!
n
dik = bij cj k . trizen A mit det A = 0 eine Gruppe mit E3 als neutra-
j =1
lem Element und A−1 als zu A inversem Element. Diese
Gruppe heißt allgemeine lineare Gruppe des R3 und wird
In Worten: Das Element an der Stelle (i, k) der Produktmatrix mit GL3 (R) bezeichnet. Die Matrizen aus GL3 (R) heißen
B · C entsteht aus der i-ten Zeile von B und der k-ten Spalte auch invertierbar oder regulär. Später in Kapitel 13 wer-
von C durch „skalare Multiplikation“. den wir erkennen, dass die Matrizen A mit det A = 1 eine
Unterguppe bilden, die spezielle lineare Gruppe SL3 (R). Sie
Die folgende Illustration zeigt die Größenverhältnisse der umfasst diejenigen linearen Abbildungen, welche das orien-
an diesem Matrizenprodukt beteiligten Matrizen B, C und D. tierte Volumen unverändert lassen.
n m
n
p = p · m
zubilden, denn unter der Voraussetzung λi = 1 ist Zu dieser Darstellung des Fußpunkts b kommen wir eigent-
n n lich auch ohne jede Rechnung, denn l(a) gibt den im Sinn
! !
A λi x i = t + A λi x i von n orientierten Normalabstand des Punkts a von E an.
i=1 i=1
Wir haben somit nur vom Punkt a aus längs n die Länge
l(a) zurückzulaufen, um die Ebene E im Fußpunkt b zu er-
!
n !
n
reichen.
= λi t+ λi A x i
i=1 i=1 ?
!
n !
n Zeigen Sie, dass die Formel für b aus (7.12) in jene aus (7.13)
u×v
= λi (t + A x i ) = λi A(x i ). übergeht, wenn durch n ersetzt wird und n·p durch k.
u × v
i=1 i=1
Daher gehen affine Teilräume wieder in affine Teilräume Die Formel (7.13) für b zeigt erneut (vergleiche Seite 249),
über. dass b unter allen Punkten x ∈ E derjenige ist, welcher
dem Punkt a am nächsten liegt, für den also die Gleichung
dist(a, E) = b − a gilt.
Das dyadische Produkt vereinfacht die
Darstellung der Orthogonalprojektionen Aus a = b + λ n, n2 = 1 und n · (b − x) = 0 ergibt sich
nämlich:
Wir kehren nochmals zu der auf Seite 249 definierten Or- a − x2 = (λ n + (b − x))2 = λ2 + (b − x)2 ≥ λ2 .
thogonalprojektion des R3 auf eine Ebene E zurück, die je-
dem Raumpunkt a den Fußpunkt b ∈ E der durch a gehen- Gleichheit tritt nur bei b − x = 0, also bei x = b ein.
den Ebenennormalen zuordnet (Abb. 7.23). Im Gegensatz zu Nun schreiben wir die Abbildung
(7.12) geben wir die Ebene E diesmal in der Hesse’schen Nor-
malform an, und wir fassen die Orthogonalprojektion auf als N : a → b = a − [(n · a) − k] n = k n + [a − (n · a) n]
Abbildung R3 → R3 , auch wenn das Bild nur der affine Teil- in Matrizenform um. Dazu ersetzen wir das auftretende Ska-
raum E ist. Neben der Orthogonalprojektion N : a → b auf larprodukt n · a ∈ R gemäß (7.3) durch ein Matrizenpro-
E soll auch die Spiegelung S : a → a an E in Matrizenform dukt. Nun ist die Matrizenmultiplikation generell assoziativ.
dargestellt werden. Das wird zwar erst im Kapitel 12 allgemein bewiesen; im
vorliegenden Fall lässt sich die Gültigkeit durch einfaches
Ausrechnen bestätigen. Demnach ist
a (n · a) n = n (n0 a) = (n n0 ) a.
b Hier tritt eine symmetrische Matrix auf, nämlich
M
⎛ 2 ⎞
E n1 n1 n2 n1 n3
a
N = n n0 = ⎝ n2 n1 n22 n2 n3 ⎠
Ma
kit taM
hta
n3 n1 n3 n2 n23
the Dabei heißt eine Matrix symmetrisch, wenn die bezüglich der
kitaammeeh
das dyadische Produkt von u und v. In dieser Matrix sind (Abb. 7.24): Dann gilt nach (7.8):
der Reihe nach alle möglichen Produkte zwischen einer Ko-
ordinate von u und einer von v angeordnet. !
3 !
3
x= (x · ni ) ni = (ni n0
i ) x = E3 x.
? i=1 i=1
Welchen Rang hat das dyadische Produkt?
Die Summe der dyadischen Quadrate lautet also:
?
0 1. Warum ist die bei der Orthogonalprojektion auftretende
x1
n1 Darstellungsmatrix (E3 − N ) mit N = n n0 bei n = 1
idempotent, d. h., warum gilt:
Abbildung 7.24 Die Orthogonalprojektionen des Punkts x auf die Ebene E
und auf die Ebenennormale G. (E3 − N)2 = (E3 − N) (E3 − N) = (E3 − N)?
Der Normalvektor n von E spannt eine durch den Ursprung 2. Ist det(E3 − N) = 0?
gehende Ebenennormale G auf, und nun wollen wir den
Raumpunkt x auch normal auf diese Gerade G projizieren.
Für das Bild x 3 von x gilt wegen der geometrischen Bedeu-
tung des Skalarprodukts (Abb. 7.13) Die Orthogonalprojektion auf eine Ebene und
x 3 = (x · n) n. die Spiegelung an dieser Ebene hängen eng
zusammen
Auch diese Abbildung x → x 3 ist eine lineare Abbil-
dung R3 → R3 , denn sie kann ebenfalls durch eine 3 × 3- Für das Spiegelbild x von x bezüglich der Ebene E mit dem
Darstellungsmatrix beschrieben werden. Zu deren Herleitung normierten Normalvektor n gilt (siehe Abbildung 7.23):
schreiben wir ähnlich wie vorhin bei der Orthogonalprojek-
tion nach E die obige Vektordarstellung von x 3 auf ein Ma- 1
2 (x + x ) = x E , also x = 2 x E − x.
trizenprodukt um:
In Matrizenschreibweise bedeutet dies:
x 3 = (x · n) n = n (n0 x) = (n n0 ) x.
x = 2k n + 2(E3 − N) x − x
Die Darstellungsmatrix der Orthogonalprojektion auf die
durch den Ursprung gehende Gerade G ist gleich dem schon mit N als dyadischem Quadrat von n.
vorhin verwendeten dyadischen Quadrat N = n n0 des
normierten Richtungsvektors von G.
Darstellung der Spiegelung an einer Ebene
Nun ist (Abb. 7.24) x = x E + x 3 mit x E als Normalenfuß- Die Spiegelung an der Ebene E mit der Hesse’schen Nor-
punkt von x in E, also malform n · x − k = 0 lautet:
⎛ ⎞
7.5 Wechsel zwischen der Basisvektoren bj . Wir setzen diese an als B bj
a1j
= ⎝ a2j ⎠.
kartesischen a3j
Dann lässt sich die Vektorgleichung
Koordinatensystemen ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13
⎝x2 ⎠ = x ⎝ a21 ⎠ + x ⎝ a22 ⎠ + x ⎝ a23 ⎠
Bei vielen Gelegenheiten ist es notwendig, von einem kar- 1 2 3
x3 a31 a32 a33
tesischen Koordinatensystem auf ein anderes umzurechnen.
Ein Musterbeispiel bildet in der Astronomie die Umrechnung
übersichtlich in Matrizenform schreiben als
von einem in der Sonne zentrierten und nach Fixsternen ori-
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
entierten heliozentrischen Koordinatensystem auf ein lokales x1 a11 a12 a13 x1
System in einem Punkt der Erdoberfläche mit lotrechter x3 - ⎝x2 ⎠ = ⎝ a21 a22 a23 ⎠ ⎝x ⎠
2
Achse und der nach Osten orientierten x1 -Achse. Erst damit x3 a31 a32 a33 x3
ist es möglich vorauszuberechnen, wie die Bewegungen der
Planeten oder des Mondes von der Erde aus zu beobachten Die Matrix (aij ) ist eine Transformationsmatrix, und wir
sein werden. Wir werden uns diesem Problem noch genauer bezeichnen sie mit B T B . Mit ihrer Hilfe transformieren wir
widmen. Koordinaten von einem Koordinatensystem auf ein anderes,
in unserem Fall von B -Koordinaten (rechter Index) auf B-
Koordinaten (linker Index), also
Orthogonale Matrizen erledigen die
Bx = B T B B x. (7.15)
Umrechnung zwischen zwei kartesischen
Koordinatensystemen
In den Spalten von B T B stehen die B-Koordinaten der Basis-
Es seien zwei kartesische Koordinatensysteme mit demsel- vektoren b1 , b2 , b3 . Da diese linear unabhängig sind, hat
ben Ursprung o gegeben, nämlich (o; B) mit der ortho- B T B den Rang 3. Die Gleichung (7.15) beschreibt eine bi-
normierten Basis B = (b1 , b2 , b3 ) und (o; B ) mit B = jektive lineare Abbildung B x → B x; Transformationsma-
(b1 , b2 , b3 ) (Abb. 7.25). Sind dann trizen sind invertierbar.
⎛ ⎞ ⎛ ⎞ Nach (7.8) ist die i-te B-Koordinate von bj gleich dem Ska-
x1 x1
larprodukt bi · bj . Dies führt auf die Darstellung
B x = ⎝x2 ⎠ und B x = ⎝x2 ⎠
x3 x3 ⎛ ⎞
b1 · b1 b1 · b2 b1 · b3
die Koordinaten desselben Punkts x, so bedeutet dies nach B TB = ⎝ b2 · b1 b2 · b2 b2 · b3 ⎠
(7.16)
(7.2): b3 · b1 b3 · b2 b3 · b3
!3 !
3
x−o= xi b i = xj bj . Die Spaltenvektoren in dieser Matrix sind orthonormiert, also
i=1 j =1 paarweise orthogonale Einheitsvektoren.
Sollen umgekehrt die B -Koordinaten aus den B-Koor-
dinaten berechnet werden, so benötigen wir die Umkehrab-
b3 x bildung der linearen Abbildung B x → B x, also die inverse
Matrix. Demnach gilt:
b3 ⎛ ⎞ ⎛ ⎞
b2 x1 x1
⎝x ⎠ = B TB
⎝x2 ⎠ mit B T B = (B T B )−1 .
2
x3 x3
Derartige Matrizen heißen orthogonal. Mehr darüber gibt es Dies gilt sinngemäß auch für das Vektorprodukt, sofern aus-
im Kapitel 17. schließlich Rechtskoordinatensysteme verwendet werden:
Modifizieren wir das Koordinatensystem, so werden sich die
Orthogonale Transformationsmatrizen Koordinaten von (u × v) in derselben Weise ändern wie jene
von u und v.
Die Transformationsmatrizen zwischen kartesischen
Koordinatensystemen sind orthogonal; sie genügen der Dies lässt sich in den folgenden Formeln ausdrücken.
Bedingung
Koordinateninvarianz der Produkte von Vektoren
(B T B )−1 = (B T B )0 , d. h.,
(B T B )0 · B T B = E3 . Ist A eine eigentlich orthogonale Matrix, so gilt:
(A u) · (A v) = u · v,
Die Spaltenvektoren s i in einer orthogonalen Matrix A (A u) × (A v) = A (u × v),
sind nach (7.7) orthonormiert, d. h. paarweise orthogonale det (A u, A v, A w) = det(u, v, w).
Einheitsvektoren, denn die Einträge in der Produktmatrix
A0A = E3 sind identisch mit den Skalarprodukten s i · sj = δij . Die erste dieser Gleichung folgt wegen A0 A = E3 auch
Damit ist umgekehrt jede orthogonale Matrix eine Um- unmittelbar aus (7.3), denn
rechnungsmatrix zwischen kartesischen Basen, nämlich von
(s 1 , s 2 , s 3 ) auf die kanonische Basis (e 1 , e2 , e3 ). (A u) · (A v) = (A u)0 (A v) = u0 A0 A v = u0 v.
In den Spalten der Umrechnungsmatrix B T B von den B - Hinsichtlich des Spatprodukts kann man auf die Formel von
Koordinaten zu den B-Koordinaten stehen die B-Koor- Seite 244 zurückgreifen:
dinaten der bj und in den Zeilen die B -Koordinaten der det (A u, A v, A w) = A u · (A v × A w)
bi . Sind B und B Rechtssysteme, so ist das Spatprodukt = A u · A(v × w) = u · (v × w) = det(u, v, w).
det(b1 , b2 , b3 ) = det A = +1 (siehe Seite 245). Derartige
orthogonale Matrizen heißen eigentlich orthogonal. In dem In Kapitel 13 werden wir übrigens erkennen, dass allgemei-
Beispiel auf Seite 259 ist eine derartigen Matrix zu berech- ner bereits die Bedingung det A = 1 hinreicht für die Inva-
nen. rianz des Spatprodukts.
eigentlich orthogonal? Statt Bewegung sagt man auch gleichsinnige Kongruenz. Die
2. Man bestätige durch Rechnung, dass die auf Seite 256 bei zu einer Bewegung gehörige lineare Abbildung heißt auch
der Spiegelung an einer Ebene auftretende symmetrische gleichsinnige Isometrie.
Matrix M = E3 − 2N orthogonal ist. Warum ist sie un- Offensichtlich sind die Translationen Beispiele von Bewe-
eigentlich orthogonal? gungen, und zwar diejenigen mit A = E3 .
Definitionsgemäß muss die Bewegung B : x → x = t +A x
Wir wissen von den geometrischen Bedeutungen des Skalar- ein kartesisches Rechtssystem mit Ursprung o und ortho-
produkts u · v und des Spatprodukts det(u, v, w) von Vekto- normierten Basisvektoren (b 1 , b2 , b3 ) wieder in ein kartesi-
ren aus R3 . Diese Produkte hängen nur von der gegenseitigen sches Rechtssystem mit Ursprung o = B(o) und Basisvekto-
Lage der jeweiligen Vektoren ab, müssen also unverändert ren (A b1 , A b2 , A b3 ) überführen. Hier haben wir berück-
bleiben, wenn wir das Koordinatensystem ändern. Wir sagen, sichtigt, dass Richtungsvektoren durch die zu B gehörige li-
diese Produkte sind koordinateninvariant. neare Abbildung transformiert werden (siehe Seite 254). Eine
7.5 Wechsel zwischen kartesischen Koordinatensystemen 259
Problemanalyse und Strategie: Der Einheitswürfel W werde von den Basisvektoren b1 , b2 und b3 eines kartesischen
Rechtskoordinatensystems aufgespannt. Wir verknüpfen nun mit dem Würfel ein zweites Rechtskoordinatensystem mit
Basisvektoren b1 , b2 und b3 , welches der geforderten Würfelposition entspricht. Der Vektor b3 weist also in Richtung
der Raumdiagonale, und der Vektor b2 spannt mit b3 eine Ebene auf, welche auch b1 enthält. Dabei entscheiden wir uns
für die Lösung (siehe Abbildung unten rechts) mit positivem Skalarprodukt b1 · b2 .
Nun muss nur der Würfel mit den beiden Koordinatensystemen derart verlagert werden, dass B in Grundstellung kommt,
also b3 lotrecht wird. Um also die gesuchten Koordinaten zu bekommen, brauchen wir nur die bekannten B -Koordinaten
der Würfelecken auf B-Koordinaten umzurechnen. Gemäß (7.15) gelten Umrechnungsgleichungen der Art B x = A B x.
In den Spalten der orthogonalen Transformationsmatrix A = B T B aus (7.16) stehen die B-Koordinaten der Basisvek-
toren b1 , b2 , b3 des Würfels. Wegen A0 = A−1 = B T B stehen in den Zeilen die B -Koordinaten der bi .
Lösung:
b3
b3
b1
b2
b1
b2
Diese brauchen nur mehr in einer Matrix zusammengefasst Dies führt zur Vektordarstellung
zu werden, und wir erhalten
⎛ ⎞ ⎛ ⎞⎛ ⎞ x = (1 − cos ϕ)(d ·x) d + cos ϕ x + sin ϕ (d ×x). (7.18)
x1 cos ϕ − sin ϕ 0 x1
⎝x ⎠ = ⎝ sin ϕ cos ϕ 0 ⎠ ⎝x2 ⎠ Um die Darstellungsmatrix der Abbildung x → x zu erhal-
2
x3 0 0 1 x3 ten, nutzen wir jene der Orthogonalprojektion auf Seite 255.
Bei d = 1 ist
als Darstellung der Drehung um die x3 -Achse.
Diesmal wollen wir auch den Ablauf der Bewegung von der x d = (d d 0 ) x und x E = x − x d = (E3 − d d 0 ) x.
Ausgangslage in die Endlage beschreiben. Angenommen, die
Andererseits ist d × x = S d x, wobei S d die dem Vektor
Drehung von x nach x erfolgt mit der konstanten Winkelge-
d im Sinn von (7.9) zugeordnete schiefsymmetrische Matrix
schwindigkeit ω und beginnt zum Zeitpunkt t = 0. Damit wir
ist.
dann zu jedem Zeitpunkt t wissen, wo sich der Punkt x ge-
rade befindet, ersetzen wir in der obigen Matrizengleichung
das ϕ durch den augenblicklichen Drehwinkel x
ϕ
ψ(t) = ω t mit 0 ≤ t ≤ , d xE⊥
ω
mathematisch positiven Sinn hervorgeht (Abb. 7.28). Wegen Mithilfe des Begriffs der Eigenvektoren (siehe Kap. 14) kann
der Orthogonalität zwischen d und x E ist nach (7.10) man übrigens zeigen, dass jede eigentlich orthogonale drei-
reihige Matrix eine derartige Drehmatrix ist. Deshalb nennt
x⊥
E = d × x E = d × (x − x d ) = d × x. man die von diesen Matrizen gebildete Gruppe SO3 auch die
262 7 Analytische Geometrie – Rechnen statt Zeichnen
Problemanalyse und Strategie: Die Bewegung B, also der Übergang von (b1 , b2 , b3 ) zu (b1 , b2 , b3 ), ist gemäß
der unten gezeigten Abbildung 7.20 die Zusammensetzung folgender drei Drehungen.
1. Die Drehung um b3 durch α bringt b1 nach d.
2. Die Drehung um d durch β bringt b3 bereits in die Endlage b3 und die b1 b2 -Ebene in die Position E.
3. Die Drehung um b3 durch γ bringt auch die restlichen Koordinatenachsen innerhalb von E in ihre Endlagen b1
bzw. b2 .
Aber Achtung: Die Reihenfolge dieser Drehungen darf nicht verändert werden; die Zusammensetzung von Bewegungen
ist so wie die Multiplikation von Matrizen nicht kommutativ!
Rechnerisch einfacher, allerdings nicht so unmittelbar verständlich, ist die folgende Zusammensetzung von B, bei welcher
dieselben Drehwinkel, aber zumeist andere Drehachsen auftreten.
1. Wir drehen um b3 durch γ und bringen damit die Koordinatenachsen innerhalb der anfangs mit der b1 b2 -Ebene
zusammenfallenden Ebene E in die gewünschte Position.
2. Wir drehen um b1 durch β; damit bekommen die Ebene E und der zugehörige Normalvektor b3 bereits die richtige
Neigung.
3. Wir drehen um b3 durch α und bringen damit b3 und auch E in die jeweils vorgeschriebenen Endlagen.
Diese Zerlegung von B hat den Vorteil, dass stets um die ortsfesten Achsen b1 und b3 gedreht wird.
⎛ ⎞⎛ ⎞⎛ ⎞
cα −sα 0 1 0 0 cγ −sγ 0
A = ⎝ sα cα 0 ⎠⎝ 0 cβ −sβ ⎠⎝ sγ cγ 0 ⎠
E
0 0 1 0 sβ cβ 0 0 1
b1
⎛ ⎞⎛ ⎞
cα −sα cβ sα sβ cγ −sγ 0 0
= ⎝ sα cα cβ −cα sβ ⎠ ⎝ sγ cγ 0 ⎠
γ
α b2
0 sβ cβ 0 0 1 β
⎛ ⎞
cα cγ − sα cβ sγ −cα sγ − sα cβ cγ sα sβ b1
d
= ⎝ sα cγ + cα cβ sγ −sα sγ + cα cβ cγ −cα sβ ⎠
sβ sγ sβ cγ cβ Die Euler’schen Drehwinkel α, β und γ .
Wenn umgekehrt eine Position des Rechtsachsenkreuzes
(b1 , b2 , b3 ) gegeben ist, so sind bei linear unabhängigen Kommentar: Diese Überlegungen beweisen: Jede
{b3 , b3 } die zugehörigen Euler’schen Drehwinkel eindeu- Raumlage B eines Achsenkreuzes ist aus deren Aus-
tig bestimmt, sofern man deren Grenzen mit gangslage B durch die Zusammensetzung von drei Dre-
0◦ ≤ α < 360◦ , 0◦ ≤ β ≤ 180◦ , 0◦ ≤ γ < 360◦ hungen zu erreichen, nämlich der Reihe nach durch
festsetzt. Der Vektor d (siehe Abbildung rechts) hat näm- Drehungen um b3 , um b1 und schließlich nochmals um
lich die Richtung des Vektorprodukts b3 × b3 , und d b3 . Mithilfe des Begriffes der Eigenvektoren (siehe Ka-
schließt mit b1 bzw. b1 die Winkel α bzw. γ ein. Dabei pitel 13) lässt sich zeigen, dass es auch stets durch eine
sind diese Winkel als Drehwinkel zu vorgegebenen Dreh- einzige Drehung geht, doch hat deren Drehachse eine all-
achsen jeweils in einem bestimmten Drehsinn zu messen. gemeine Lage.
7.5 Wechsel zwischen kartesischen Koordinatensystemen 263
Drehungsgruppe des R3 . Die Box auf Seite 264 zeigt eine ist. Wir drücken diese Gleichung in (o; B)-Koordinaten aus.
⎛ ⎞
Darstellung der Drehungen mithilfe von Quaternionen. x1
Dann stehen auf der linken Seite die gesuchten ⎝x2 ⎠. Rechts
? ⎛ ⎞
p1
x3
Warum ist R 0
d ,ϕ = R d ,−ϕ = R −d ,ϕ ? müssen wir die (o; B)-Koordinaten ⎝p2 ⎠ von p und jene der
p3
Basisvektoren bj einsetzen. Dabei sind letztere die Spalten
in der orthogonalen Matrix A = B T B . Wir erhalten:
Umrechnung zwischen zwei kartesischen ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
Koordinatensystemen mit verschiedenen x1 p1 x1
⎝x2 ⎠ = ⎝p2 ⎠ + A ⎝x ⎠ mit A−1 = A0 .
Nullpunkten 2
x3 p3 x3
Nun seien zwei kartesische Koordinatensysteme gegeben,
deren Koordinatenursprünge verschieden sind (Abb. 7.29):
Neben dem System (o; B) mit B = (b1 , b2 , b3 ) in gewohn- Erweiterte Koordinaten und Matrizen
ter Position gibt es noch das System (p; B ) mit der ortho- ermöglichen einheitliche Formeln für Punkte
normierten Basis B = (b1 , b2 , b3 ). Nun muss sorgfältig und Vektoren
unterschieden werden, ob wir die Koordinaten von Punkten
umrechnen oder jene von Vektoren. Die Umrechnungsgleichungen für Punktkoordinaten sind
verschieden von jenen für Vektorkoordinaten. Das zwingt
b3 x
zu besonderer Sorgfalt. Zudem ist die Koordinatentrans-
b2 formation von Punkten nicht allein durch eine Matrizen-
b3
multiplikation ausdrückbar, sondern es ist zusätzlich ein kon-
stanter Vektor zu addieren. Dies führt zu unübersichtlichen
b1 Formeln, wenn mehrere derartige Transformationen hinter-
einandergeschaltet werden müssen.
p
Hier erweist sich nun folgender Trick als vorteilhaft: Wir fü-
gen den drei Koordinaten eine weitere als nullte Koordinate
o hinzu. Bei Punkten wird diese gleich 1 gesetzt, bei Vektoren
gleich 0. Wir nennen diese Koordinaten erweiterte Punkt-
b2 bzw. Vektorkoordinaten und kennzeichnen die zugehörigen
b1
Vektorsymbole durch einen Stern. Dann lassen sich die Um-
Abbildung 7.29 Zwei Koordinatensysteme im R3 mit verschiedenen Null- rechnungsgleichungen einheitlich schreiben in der Form
punkten.
∗ ∗ ∗
(o;B) x = (o;B) T (p ;B ) (p;B ) x (7.19)
Beginnen wir mit den Vektoren: Sie sind als Pfeile zu sehen,
⎛ ⎞ ⎛ ⎞
die im Raum beliebig parallel verschoben werden dürfen. Zur x0 x0
Ermittlung der B -Koordinaten eines Vektors u verwenden ⎜ x1 ⎟ ⎜ x1 ⎟
mit (o;B) x = ⎝ ⎠, (p;B ) x = ⎝ ⎟
∗ ⎜ ⎟ ∗ ⎜ und
wir den Pfeil mit Anfangspunkt p. Dann sind die (p; B )- x2 x2 ⎠
Koordinaten des Endpunkts zugleich die B -Koordinaten x3 x3
von u. ⎛ ⎞
1 0 0 0
Die B-Koordinaten von u sind durch den parallelen Pfeil mit
∗ ∗
⎜ p1 a11 a12 a13 ⎟
⎜
A = (o;B) T (p;B ) = ⎝ ⎟
dem Anfangspunkt o bestimmt. Gemäß (7.1) besteht also p2 a21 a22 a23 ⎠
nur die Aufgabe, u einmal aus den bi und dann aus den bj li- p3 a31 a32 a33
near zu kombinieren. Die beiden Koordinatentripel desselben
Vektors u sind somit nach wie vor durch die Matrizenglei- In der 4 × 4 -Matrix A∗ sind die (o; B)-Koordinaten des
chung (7.15) miteinander verknüpft. Punkts p vereint mit der orthogonalen 3 × 3 -Matrix A, wäh-
⎛ ⎞ ⎛ ⎞ rend die erste Zeile immer völlig gleich aussieht. Wir nennen
x1 x1
Anders ist es bei Punktkoordinaten: ⎝x2 ⎠ bzw. ⎝x2 ⎠ sind die diese die erweiterte Transformationsmatrix.
x3 x3
(o; B)- bzw. (p; B )-Koordinaten desselben Raumpunkts x, Wir erkennen, dass die nullten Koordinaten stets unverän-
wenn gemäß (7.2) dert bleiben, d. h. stets x0 = x0 ist. Vektorkoordinaten
bleiben also Vektorkoordinaten, und das analoge gilt für
!
3 !
3 Punktkoordinaten. In den Spalten der erweiterten Transfor-
x =o+ xi bi = p + xj bj mationsmatrix (o;B) T (∗p;B ) stehen der Reihe nach die erwei-
i=1 j =1 terten (o; B)-Koordinaten des Punkts p und der Vektoren bj .
264 7 Analytische Geometrie – Rechnen statt Zeichnen
Für die Vektoren aus H gibt es ein Skalarprodukt, ein Vek- Quaternionen mit der Norm 1, der Einheitsquaternionen,
torprodukt und ein Quaternionenprodukt. Um Verwechs- bildet den Kern dieses Homomorphismus und damit eine
lungen zu vermeiden, verwenden wir von nun an ◦ als Untergruppe von (H \ {0}, ◦).
Verknüpfungssymbol der Quaternionenmultiplikation. Für q = a + v ∈ H1 gibt es wegen q2 = a 2 + v2 = 1
Es gibt einen tieferen Grund für die Interpretation von einen Winkel α mit a = cos α. Deshalb können Einheits-
(i, j, k) als orthonormierter Basis. Den auf Seite 240 an- quaternionen dargestellt werden als:
geführten Vektorprodukten e1 × e2 = e3 , e2 × e1 = −e3 q = cos α + sin α
v mit
v = 1.
usw. von Vektoren der Standardbasis stehen nämlich die
Jede Einheitsquaternion q legt eine Vektorabbildung
Quaternionenprodukte i ◦ j = k, j ◦ i = −k usw. gegen-
über. Nachdem das Quaternionenprodukt distributiv ge- δq : R3 → R3 mit x → x := q ◦ x ◦ q (∗∗)
bildet wird, gilt für je zwei Vektoren v 1 , v 2 ∈ H wegen
i ◦ i = j ◦ j = k ◦ k = −1: fest. x ist tatsächlich wieder ein Vektor, denn
v 1 ◦ v 2 = −(v 1 · v 2 ) + (v 1 × v 2 ). x = q ◦ x ◦ q = q ◦ (−x) ◦ q = −x .
Mithilfe von (∗) lässt sich nachweisen, dass δq linear
Das Quaternionenprodukt zweier Vektoren aus H ist so-
ist und Skalarprodukte sowie Vektorprodukte unverändert
mit bei v 1 · v 2 = 0 nicht mehr vektorwertig. Aber es gilt
lässt. Wir wollen hier allerdings gleich eine explizite Vek-
umgekehrt:
tordarstellung von x herleiten.
v 1 · v 2 = − 12 ((v 1 ◦ v 2 ) + (v 2 ◦ v 1 )) ,
(∗) x = q ◦ x ◦ q = (cos α + sin α v ) ◦ x ◦ (cos α − sin α
v)
v 1 × v 2 = 12 ((v 1 ◦ v 2 ) − (v 2 ◦ v 1 )) . * +
= − sin α( v ·x) + (cos α x + sin α( v ×x)) ◦ (cos α − sin α v)
Durch die Zerlegung der Quaternionen in Skalar- und Vek- = − ,sin α cos α(v ·x) + sin α cos α(v ·x) + sin2 α det(
v,
v , x)
torteil wird das Produkt zweier Quaternionen qi = ai +v i , + sin2 α( v + cos2 α x + sin α cos α(
v ·x) v ×x)
-
i = 1, 2, übersichtlicher, denn − sin α cos α( 2
v ×x) − sin α[(v ×x) × v] .
(a1 + v 1 ) ◦ (a2 + v 2 ) = (a1 a2 − v 1 · v 2 )
Wegen ( v × x) × v = (v · v · x)
v ) x − ( v nach der
+ (a1 v 2 + a1 v 1 + (v 1 × v 2 )) .
Grassmann-Identität (Seite 246) und wegen 2 sin2 α =
Die zu q = a + v konjugierte Quaternion ist q = a − v. 1 − cos2 α + sin2 α = 1 − cos 2α folgt weiter:
Vektorwertige Quaternionen sind durch q = −q gekenn-
x = 2 sin2 α( v + (cos2 α − sin2 α) x + 2 sin α cos α(
v ·x) v ×x)
zeichnet. Ein gleichzeitiger Vorzeichenwechsel von v 1
v ·x)
= (1 − cos 2α)( v + cos 2α x + sin 2α (
v × x).
und v 2 in der obigen Formel zeigt:
Der Vergleich mit der Vektordarstellung (7.18) auf
(q1 ◦ q2 ) = q 2 ◦ q 1 . Seite 261 zeigt: Die Abbildung δq aus (∗∗) mit q =
Bei q = 0 bestimmt q die zu q inverse Quaternion als cos α + sin α
v ist eine Drehung mit
v als Einheitsvek-
q −1 =
1
q. tor in Drehachsenrichtung und mit dem Drehwinkel 2α.
a 2 + b2 + c2 + d 2
Die Zusammensetzung der Drehungen δ1 : x → x =
Im Nenner tritt die Standardnorm des R4 auf. Wir definie-
q1 ◦ x ◦ q 1 und δ2 : x → x = q2 ◦ x ◦ q 2 lautet:
ren diese gleichzeitig als Norm der Quaternion
% % δ2 ◦ δ1 : x → x = (q2 ◦ q1 ) ◦ x ◦ (q2 ◦ q1 ).
q = a 2 + b2 + c2 + d 2 = q ◦ q,
Die Abbildung ψ : q → δq ist somit ein Homomorphis-
wobei jene der Vektoren inkludiert ist. Es gilt: mus (H1 , ◦) → (SO3 , ◦) mit dem Kern {1, −1}; neben q
q1 ◦ q2 = q1 · q2 , stellt auch −q dieselbe Drehung dar. Ein weiterer Homo-
morphismus ist Inhalt der Aufgabe 7.22.
denn wegen der Assoziativität der Multiplikation in H ist
In (∗∗) kann man anstelle q ∈ H1 allgemeiner ein q ∈
(q1 ◦ q2 ) ◦ (q1 ◦ q2 ) = (q1 ◦ q2 ) ◦ q 2 ◦ q 1 H \ {0} verwenden, doch muss dann die rechten Seite noch
= q1 ◦ q2 2 ◦ q 1 = q2 2 q1 2 . durch q2 dividiert werden. Dies führt auf einen surjek-
Damit vermittelt die Abbildung q → q einen Homo- tiven Homomorphismus (H \ {0}, ◦) → (SO3 , ◦) mit dem
morphismus (H \ {0}, ◦) → (R>0 , ·). Die Menge H1 der Kern R \ {0}.
7.5 Wechsel zwischen kartesischen Koordinatensystemen 265
So anschaulich die Geometrie auch scheinen mag, man Forderungen sowohl die euklidische, als auch die nicht-
braucht deutlich mehr Axiome als etwa zur Definition euklidische Geometrie entstehen.
eines Vektorraums, selbst wenn man sich nur auf die ebene Die analytische Geometrie in dem durch Fernpunkte er-
Geometrie beschränkt. Die ersten Versuche für ein Axio- weiterten Anschauungsraum verwendet die auf Seite 263
mensystem der Geometrie gehen auf Euklid (∼ 365–300 eingeführten erweiterten Koordinaten x ∗ bzw. u∗ der
v. Chr.) zurück. Das bekannteste Axiomensystem stammt Punkte und Vektoren. Man muss allerdings in Kauf neh-
von David Hilbert (1862–1943). Es umfasst Inzidenz- men, dass die vier Koordinaten der Punkte des projektiven
axiome über die gegenseitige Lage von Punkten und Raums homogen, also nur bis auf einen Faktor eindeutig
Geraden, Kongruenzaxiome, Distanzen und Winkelmaße sind.
betreffend, Anordnungsaxiome zu den Begriffen „Halb- Punkte des reellen projektiven Raums sind somit eindi-
ebene“ und „zwischen“, sowie ein Stetigkeitsaxiom, ver- mensionale Unterräume des R4 , Geraden sind zweidimen-
gleichbar mit der in Kapitel 4 erklärten Vollständigkeit der sionale und Ebenen dreidimensionale Unterräume. Die
reellen Zahlen. bijektiven linearen Selbstabbildungen des R4 induzieren
Unter den Axiomen kam Euklids Parallelenpostulat eine Kollineationen, und diese spielen die Rolle von Automor-
besondere Rolle zu, nämlich der Forderung, dass durch je- phismen.
den Punkt P außerhalb der Geraden G genau eine Parallele Zeichnet man umgekehrt im projektiven Raum eine Ebene
legbar ist, also eine Gerade, die G nicht schneidet. Die- als Menge von „Fernpunkten“ aus und entfernt man diese,
ses ist experimentell niemals nachprüfbar, denn was weiß so bleibt ein affiner Raum, in dem wieder Parallelitäten er-
man schon von Geraden, wenn man sie weit genug über un- klärbar sind. Kollineationen, welche die gewählte „Fern-
ser Sonnensystem hinaus verlängert. Man versuchte 2000 ebene“ auf sich abbilden, induzieren dann im verbleiben-
Jahre lang vergeblich, dieses Axiom durch äquivalente den Raum affine Abbildungen. Die Gruppe der bijektiven
und eher „überprüfbare“ Aussagen zu ersetzen, bis der affinen Abbildungen bestimmt die affine Geometrie.
Ungar János Bolyai (1802–1860) bestätigte, dass es auch Dieser affinen Raum bestimmt einen Vektorraum (siehe
eine widerspruchsfreie nichteuklidische Geometrie gibt, Seite 228). Die Einführung eines Skalarprodukts auf die-
deren Axiomensystem sich von jenem der euklidischen sem Vektorraum ermöglicht die Definition von Distan-
Geometrie nur dadurch unterscheidet, dass das euklidi- zen und Winkelmaßen. Die zugehörigen Automorphis-
sche Parallelenpostulat ersetzt wird durch die Forderung: men sind die Kongruenzen; deren Gruppe ist isomorph
Durch P gibt es mindestens zwei verschiedene Parallele zur Gruppe der orthogonalen Matrizen. Die zugehörige
zu G. Geometrie ist die euklidische.
Das Studium der Zentralprojektion zeigte, dass in per- Der pythagoräische Lehrsatz gehört demnach zur euklidi-
spektiven Bildern Fluchtpunkte auftreten, also Bilder von schen Geometrie. Der Strahlensatz, wonach parallele Ge-
Punkten, die es in Wirklichkeit gar nicht gibt, nämlich von raden auf zwei schneidenden Geraden Strecken proportio-
Schnittpunkten paralleler Geraden. Dies führte zur Erwei- naler Längen ausschneiden, ist eine affine Aussage. Der
terung unseres Anschauungsraums durch unendlich ferne im Bild unten gezeigte Satz von Pappus-Pascal zählt zur
Punkte. Jede Gerade bekommt einen Fernpunkt dazu, was projektiven Geometrie. Seine Aussage lautet: Für je drei
unserer Anschauung ein wenig widerspricht, denn man Punkte P1 , P2 , P3 auf der Geraden G und Q1 , Q2 , Q3
kommt zu demselben Fernpunkt, egal, ob man in der einen auf der Geraden H liegen die Schnittpunkte S1 , S2 , S3 auf
oder in der entgegengesetzten Richtung die Gerade entlang einer Geraden K. G P3
läuft. Interpretiert man die Menge der Fernpunkte einer P2
Ebene als eine Gerade und jene des Raums als Ebene, so P1
entsteht der projektive Raum. S2
S3 S1
Die Geometrie in diesem Raum, die reelle projektive Geo- K
metrie, erfordert nur wenig Axiome und stellt eine über- Q1 H
Q2
geordnete Geometrie dar, aus welcher durch zusätzliche Q3
7.5 Wechsel zwischen kartesischen Koordinatensystemen 267
Wir setzen die gewünschte Koordinatentransformation zu- Mit obiger Abbildung finden wir, wenn wir den Sinus und
sammen aus dem Wechsel von (p, Bl ) zu (ze ; Be ), der Dre- Kosinus zu s bzw. c abkürzen:
hung von (ze ; Be ) gegenüber (ze ; Be ) um die gemeinsame ⎛ ⎞⎛ ⎞
dritte Koordinatenachse durch den Winkel ϕ und schließlich 1 0 0 0 1 0 0 0
⎜ 0 cλ −sλ 0 ⎟ ⎜ r cβ 0 −sβ cβ ⎟
der Umrechnung von (ze ; Be ) auf das angegebene heliozen- ∗
e T l = ⎝
⎜ ⎟⎜ ⎟=
trische System (zs ; Bs ). Dabei setzen wir voraus, dass der 0 sλ cλ 0 ⎠ ⎝ 0 1 0 0 ⎠
Erdmittelpunkt vom Frühlingspunkt ausgehend den Kreisbo- ⎛0 0 0 1 r sβ 0 cβ
⎞ sβ
gen zum Zentriwinkel ψ zurückgelegt hat (siehe Abb. 7.32). 1 0 0 0
⎜ r cβ cλ −sλ −sβ cλ cβ cλ ⎟
Demgemäß erhalten wir mithilfe der zugehörigen erweiterten = ⎜
⎝ r cβ sλ cλ −sβ sλ cβ sλ ⎠
⎟
Transformationsmatrizen rsβ 0 cβ sβ
∗
s Tl = s T e∗ (ψ) · e T e∗ (ϕ) · e T l∗ . (∗)
Die Bewegung von (ze ; Be ) nach (ze ; Be ) ist eine Drehung
um die gemeinsame dritte Koordinatenachse durch den Win-
b3e kel ϕ. Somit ist
b2l ⎛ ⎞
1 0 0 0
N
b3l
∗ ⎜ 0 cos ϕ − sin ϕ 0⎟
e T e (ϕ) = ⎜
⎝ 0 sin ϕ cos ϕ
⎟
0⎠
0 0 0 1
b1l
p
Die Vektoren aus Be behalten gegenüber dem heliozentri-
schen System ihre Richtungen bei, machen also die Erdrota-
ze β
tion nicht mit. Durch diese dreht sich die Erde gegenüber dem
heliozentrischen System in 24 Stunden durch mehr als 360◦ ,
λ denn während dieser 24 Stunden wandert der Erdmittelpunkt
b 2e
ja auf seiner Bahn weiter.
b1e Betrachten wir dies etwas genauer: Angenommen, wir begin-
nen unsere Winkelmessung genau um 12 Uhr mittags (wahre
Sonnenzeit). Zu dieser Zeit geht die Ebene des Nullmeri-
Abbildung 7.31 Das lokale Koordinatensystem (p; B) und das geozentrische dians durch die Sonnenmitte. Nach einer 360◦ -Drehung der
(ze ; Be ). Erde um ihre Achse ist diese Ebene des Nullmeridians zwar
wieder zu ihrer Ausgangslage parallel. Sie wird aber nicht
Für die Transformationsmatrix e T l∗ benötigen wir die erwei- mehr durch die Sonnenmitte gehen, weil der Erdmittelpunkt
terten (ze , Be )-Koordinaten von p, b1l , b2l und b3l . Wir ge- inzwischen gewandert ist. Wir müssen bis 12 Uhr mittags
hen zunächst vom Nullmeridian aus, also von der Annahme noch etwas weiterdrehen, allerdings um die gegenüber der
λ = 0. Wenn wir darauf die Drehung um die Erdachse b3 b1s b2s -Ebene geneigte Erdachse. Daher ist dieser zusätzliche
durch die gegebene geografische Länge λ anwenden, erhal- Drehwinkel trotz unserer vereinfachenden Annahmen nicht
ten wir die Spaltenvektoren der Transformationsmatrix e T l∗ . konstant.
b 3s
b3e
b2s
σ
zs
ψ b3e
b2e
b1s
σ
b1e
Abbildung 7.32 Das von der Erdrotation „befreite“ geozentrische Koordinatensystem (ze ; Be ) und das heliozentrische System (zs ; Bs ). Die Erde ist rund 2 500-fach
vergrößert dargestellt.
268 7 Analytische Geometrie – Rechnen statt Zeichnen
Im täglichen Leben verwenden wir die mittlere Zeit, die auf gelegt haben und diese daher der Äquatorebene der zugehö-
der Annahme basiert, dass alle Tage gleich lang sind und das rigen Erdposition angehört,
hat b3e die von ψ unabhängigen
Jahr etwa 365.24 Tage umfasst. Das ermöglicht uns, den zu- 0
Bs -Koordinaten − sin σ . Wir wählen die erste Koordinaten-
sätzlichen Drehwinkel durch seinen Mittelwert 360◦ /365.24 cos σ
zu ersetzen. Die Differenz zwischen der wahren und mittle- achse b1e des geozentrischen Systems Be gleich dem b1s .
ren Sonnenzeit heißt Zeitgleichung und beträgt bis zu ±15 Damit folgt:
Minuten. ⎛ ⎞
1 0 0 0
⎜ R cos ψ 1 0 0 ⎟
Wir können ϕ = ωe t + ϕ0 setzen mit der Winkelgeschwin- ∗
s T e (ψ) = ⎜ ⎟
⎝ R sin ψ 0 cos σ − sin σ ⎠
digkeit
0 0 sin σ cos σ
' (
1
ωe = 2π 1 + /(24 · 3 600) Nachdem die Erde in etwa 365.24 Tagen die Sonne einmal
365.24
umrundet, können wir ψ = ωs t setzen mit der Winkelge-
pro Sekunde. ϕ0 ist der Anfangswert zum Zeitpunkt t = 0. schwindigkeit
Übrigens ist r ≈ 6 371 km.
ωs = 2π/(365.24 · 3 600 · 24)
Während der Bewegung der Erde um die Sonne behält die
Erdachse ihre Richtung bei. Nun ist die Äquatorebene um den pro Sekunde. Wir können R ≈ 150 000 000 km annehmen,
Winkel σ ≈ 23.45◦ , der Schiefe der Ekliptik, gegenüber der verzichten hier allerdings darauf, die in der Gleichung (∗)
Bahnebene geneigt. Nachdem wir die erste Koordinatenachse notwendige Matrizenmultiplikation zur Berechnung von s T l∗
unseres heliozentrischen Systems durch den Frühlingspunkt explizit vorzuführen.
Zusammenfassung
Elemente des R3 stellen einerseits Punkte des Anschauungs- Drei paarweise orthogonale Einheitsvektoren (b1 , b2 , b3 )
raums dar, andererseits Vektoren, also Äquivalenzklassen heißen orthonormiert oder kartesische Basis. Sie sind durch
gleich langer und gleich gerichteter Pfeile. bi · bj = δij gekennzeichnet. Die Koordinaten des Vektores
u bezüglich der kartesischen Basis B = (b1 , b2 , b3 ) sind
Es gibt verschiedene Produkte von Vektoren.
Skalarprodukte, nämlich
Das Skalarprodukt u·v verschwindet genau dann, wenn einer Das Vektorprodukt u × v ist genau dann gleich dem Null-
der beteiligten Vektoren der Nullvektor ist oder die beiden vektor, wenn die Vektoren u und v linear abhängig sind. Für
Vektoren u und v zueinander orthogonal sind. linear unabhängige u, v gilt:
Zusammenfassung 269
Geometrische Deutung des Vektorprodukts Beides sind affine Abbildungen des R3 , also von der Bauart
x → x = t + A x mit t ∈ R3 , A ∈ R3×3 .
1) Der Vektor u × v ist orthogonal zu der von u und v
aufgespannten Ebene. Mithilfe des Skalarprodukts und des Vektorprodukts lassen
2) u × v = u v sin ϕ mit ϕ als von u und v sich für je zwei affine Teilräume des R3 , also für Punkte, Ge-
eingeschlossenem Winkel. raden oder Ebenen, die gegenseitigen Abstände berechnen.
3) Die drei Vektoren (u, v, (u × v)) bilden ein Rechts- Dabei wird der Abstand zwischen zwei nichtleeren Punkt-
system, d. h. folgen aufeinander wie die ersten drei mengen M und N des R3 definiert als
Finger der rechten Hand.
dist(M, N) = inf { x − y | x ∈ M und y ∈ N } .
Geometrische Deutung des Spatprodukts Eine affine Abbildung B : R3 → R3 heißt Bewegung, wenn
Der Absolutbetrag | det(u, v, w)| des Spatprodukts ist alle Distanzen und Winkelmaße erhalten bleiben und Rechts-
gleich dem Volumen des von den Vektoren u, v und w systeme wieder in Rechtssysteme übergehen.
aufgespannten Parallelepipeds.
Darstellung einer Bewegung
Jede Ebene E des R3 ist die Lösungsmenge einer linearen Bei Verwendung eines kartesischen Koordinatensystems
Gleichung n1 x1 + n2 x2 + n3 x3 = k. Dabei sind die in dieser sind die Bewegungen B : x → x durch eine Gleichung
Gleichung auftretenden Koeffizienten (n1 , n2 , n3 ) = 0 die x = t + A x mit eigentlich orthogonaler Matrix A ge-
Koordinaten eines Normalvektors n von E. Bei n = 1 kennzeichnet.
heißt die zugehörige Ebenengleichung
Bei der Umrechnung zwischen kartesischen Rechtskoordi-
l(x) = n · x − k = 0
natensystemen (p; B ) und (o; B) mit p = o verhalten sich
Hesse’sche Normalform von E. Punkt- und Vektorkoordinaten verschieden. Daher ist es sinn-
voll, zu erweiterten Punkt- und Vektorkoordinaten x ∗ bzw.
Eigenschaften der Hesse’schen Normalform u∗ aus R4 überzugehen, indem 1 bzw. 0 als nullte Koordi-
nate hinzugefügt wird. Dann gibt es eine erweiterte Trans-
Für alle a ∈ R3 gibt l(a) den orientierten Abstand des
formationsmatrix (o;B) T (∗p;B ) ∈ R4×4 mit einer eigentlich
Punkts a von der Ebene E an.
orthogonalen 3 × 3-Teilmatrix rechts unten, und die Trans-
formationsgleichungen lauten einheitlich:
Die Orthogonalprojektion auf die Ebene E mit der
Hesse’schen Normalform n · x − k = 0 lautet: (o;B) x
∗
= ∗ ∗
(o;B) T (p ;B ) (p;B ) x .
x → x E = k n + (E3 − N) x
Ist A∗ ∈ R4×4 eine derartige Transformationsmatrix, so ist
mit N = n n0 als dyadischem Quadrat von n und E3 als die in einem kartesischen Koordinatensystem durch
dreireihiger Einheitsmatrix. Die Spiegelung an der Ebene E ∗
mit der Hesse’schen Normalform n · x − k = 0 lautet: x ∗ → x = A∗ x ∗
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
Verständnisfragen Rechenaufgaben
7.1 •• Angenommen, die Gerade G ist die Schnitt- 7.6 •⎛ 3
⎞ R sind ⎛
Im zwei ⎞Vektoren gegeben, nämlich
gerade der Ebenen E1 und E2 , jeweils gegeben durch eine 2 2
lineare Gleichung u = ⎝ −2 ⎠ und v = ⎝ 5 ⎠. Berechnen Sie u, v,
1 14
den von u und v eingeschlossenen Winkel ϕ sowie das Vek-
ni · x − ki = 0, i = 1, 2.
torprodukt u × v samt Norm u × v.
Stellen Sie die Menge aller durch G legbaren Ebenen dar 7.7 • Stellen Sie die Gerade
als Menge aller linearen Gleichungen mit den Unbekannten ⎛ ⎞ ⎛ ⎞
(x1 , x2 , x3 ), welche G als Lösungsmenge enthalten. 3 2
G = ⎝ 0 ⎠ + R⎝ −2 ⎠
4 1
7.2 ••• Welche eigentlich orthogonale 3 × 3 -Matrix
A = E3 erfüllt die Eigenschaften als Schnittgerade zweier Ebenen, also als Lösungsmenge
zweier linearer Gleichungen dar. Wie lauten die Gleichun-
⎛ ⎞ ⎛ ⎞
1 1 gen aller durch G legbaren Ebenen?
A = AAA = E3 und A ⎝ 1 ⎠ = ⎝ 1 ⎠.
3
1 1 7.8 •• Im Raum R3 sind die vier Punkte
⎛⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
Wie viele Lösungen gibt es? Gibt es auch eine uneigentlich −1 0 −1 1
orthogonale Matrix mit diesen Eigenschaften? a = ⎝ 0 ⎠, b = ⎝ 0 ⎠, c = ⎝ 2 ⎠, d = ⎝ 2 ⎠
1 2 0 x3
7.3 •• Man füge in der folgenden Matrix M die durch gegeben. Bestimmen Sie die letzte Koordinate x3 von d der-
Sterne markierten fehlenden Einträge derart ein, dass eine art, dass der Punkt d in der von a, b und c aufgespannten
eigentlich orthogonale Matrix entsteht. Ebene liegt. Liegt d im Inneren oder auf dem Rand des Drei-
⎛ ⎞ ecks abc?
1 ∗ −2 2
M = ⎝∗ 1 ∗⎠ 7.9 • Im Anschauungsraum R3 sind die zwei Geraden
3 ∗ ∗ ∗
⎞ ⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞
2 3 2 −1
Wie viele verschiedene Lösungen gibt es? G = ⎝ 0 ⎠ + R⎝ 1 ⎠, H = ⎝ −1 ⎠ + R⎝ 1 ⎠
−3 −1 0 1
7.4 •• Der Einheitswürfel W wird um die durch den gegeben. Bestimmen Sie die Gleichung derjenigen Ebene E
Koordinatenursprung gehende Raumdiagonale durch 60◦ ge- durch den Ursprung, welche zu G und H parallel ist. Welche
dreht. Berechnen Sie die Koordinaten der Ecken des verdreh- Entfernung hat E von der Geraden G, welche von H ?
ten Würfels W .
7.10 • Im Anschauungsraum R3 sind die Gerade
7.5 •• Man bestimme die orthogonale Darstellungs- ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 2 1
matrix R d ,ϕ der Drehung durch den Winkel ϕ um eine durch G = ⎝ 0 ⎠ + R⎝ 1 ⎠ und der Punkt p = ⎝ 1 ⎠
den Koordinatenursprung
⎛ ⎞ laufende Drehachse mit dem Rich- 2 −2 1
d1
tungsvektor d = ⎝ d2 ⎠ bei d = 1. gegeben. Bestimmen Sie die Hesse’sche Normalform derje-
d3 nigen Ebene E durch p, welche zu G normal ist.
Aufgaben 271
7.11 •• Im Anschauungsraum R3 sind die zwei Geraden ist die Umrechnungsmatrix B T B zwischen kartesischen Ko-
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ordinatensystemen (o; B ) und (o; B). Bestimmen Sie die
3 2 2 −1
zugehörigen Euler’schen Drehwinkel α, β und γ .
G1 = ⎝ 0 ⎠ + R⎝ −2 ⎠, G2 = ⎝ 3 ⎠ + R⎝ 1 ⎠
4 1 3 2
7.18 ••• Die drei Raumpunkte
gegeben. Bestimmen Sie die kürzeste Strecke zwischen den
beiden Geraden, also deren Endpunkte a 1 ∈ G1 und a 2 ∈ G2 ⎛ ⎞ ⎞ ⎛ ⎛ ⎞
0 −2 −1
sowie deren Länge d. a 1 = ⎝ 0 ⎠, a 2 = ⎝ 1 ⎠, a 3 = ⎝ −1 ⎠
1 2 3
7.12 •• Im⎛ Anschauungsraum
⎞ R3 ist die Gerade
⎛ ⎞
1 2
bilden ein gleichseitiges Dreieck. Gesucht ist die erweiterte
G= ⎝1⎠ + R⎝ −2 ⎠ gegeben. Welcher Gleichung müssen
2 1 Darstellungsmatrix derjenigen Bewegung, welche die drei
die Koordinaten x1 , x2 und x3 des Raumpunkts x genügen, Eckpunkte zyklisch vertauscht, also mit a 1 → a 2 , a 2 → a 3
damit x von G den Abstand r = 3 hat und somit auf dem und a 3 → a 1 .
Drehzylinder mit der Achse G und dem Radius r liegt?
Der Querstrich
' ( bedeutet hier die Konjugation in C. Wie sieht 7.23 ••• Man zeige:
das zu xy hinsichtlich ∗ inverse Element aus? a) In einem Parallelepiped schneiden die vier Raumdiago-
Beweisen Sie weiter, dass die Abbildung nalen einander in einem Punkt.
b) Die Quadratsumme dieser vier Diagonalenlängen ist
' ( ' (
x x −y gleich der Summe der Quadrate der Längen aller 12 Kan-
ψ : C2 → C2×2 , →
y y x ten des Parallelepipeds (siehe dazu die Parallelogramm-
gleichung (7.2)).
einen injektiven Homomorphismus von (C2 \ {0}, ∗) in die
multiplikative Gruppe der invertierbaren Matrizen aus C2×2 7.24 ••• Angenommen, die Punkte p1 , p2 , p3 , p4 bil-
induziert. Inwiefern bestimmt die Norm der Quaternion q die den ein reguläres Tetraeder der Kantenlänge 1. Man zeige:
Determinante der Matrix (ψ ◦ ϕ)(q)?
a) Der Schwerpunkt s = 14 (p1 + p 2 + p3 + p 4 ) hat von
Damit ist dann bestätigt, dass die von den Einheitsquaternio- allen Eckpunkten dieselbe Entfernung.
nen gebildete Gruppe (H1 , ◦) (siehe Seite 264) isomorph ist b) Die Mittelpunkte der Kanten p1 p 2 , p 1 p3 , p 4 p3 und
zur multiplikativen Gruppe SU2 der Matrizen obiger Bauart p4 p2 bilden ein Quadrat. Wie lautet dessen Kantenlänge?
mit der Determinante 1, der zweireihigen unitären Matrizen c) Der Schwerpunkt s halbiert die Strecke zwischen den
(siehe Kapitel 17). Mittelpunkten gegenüberliegender Kanten. Diese drei
Strecken sind paarweise orthogonal.
S. 235 S. 255
Nach (7.12) ist aufgrund der angegebenen Substitutionen
u·v 1 1
cos ϕ = = √ √ = $⇒ ϕ = 60◦ . det(p−a , u, v )
u v 2 2 2 b = a+ (u × v)
u×v 2
(p −a )·(u×v ) u×v
= a+ u×v u×v
S. 235
= a + [(p − a) · n] n
Wir zeigen, dass das Skalarprodukt (f − b) · u null ist:
= a − [(a · n) − (p · n)] n
(b − a) · u
(f − b) · u = a + u−b ·u = a − [(a · n) − k] n = a − l(a) n.
u·u
(b − a) · u
= (a − b) · u + (u · u)
u·u
= (a − b) · u + (b − a) · u = 0. S. 256
Im dyadischen Produkt sind die Spaltenvektoren der Reihe
Hier haben wir die Linearität des Skalarprodukts ausgenutzt. nach v1 u , v2 u und v3 u und somit skalare Vielfache von u.
Bei b = f beweist das verschwindende Skalarprodukt die Sind u und v verschieden vom Nullvektor, so ist wenigstens
Orthogonalität. Bei b = f muss b bereits als Punkt von einer der Spaltenvektoren vom Nullvektor verschieden und
G gewählt worden sein. Umgekehrt bedeutet b ∈ G, dass daher der Rang des dyadischen Produkts 1. Andernfalls ist
f − b = λ u ist und daher (f − b) · u = λ(u · u) = 0 wegen der Rang 0, denn alle Einträge sind null.
u = 0 nur bei λ = 0, also bei f = b möglich ist.
S. 256
S. 241
1) Wegen n = 1 ist
x liegt genau dann in der Ebene E, wenn der Vektor x−p eine
Linearkombination von u und v ist. Und dies ist, wie vorhin N N = n (n0 n) n0 = n n0 = N
gezeigt wurde, äquivalent zum Verschwinden des Skalarpro-
dukts von x − p und dem Vektorprodukt u × v. und daher (E3 − N)2 = E3 − 2N + N = E3 − N.
S. 246 S. 256
Aus der Schiefsymmetrie des Vektorprodukts folgt: Wegen N 2 = N folgt durch Ausrechnen (E3 − 2N )2 = E3 .
Diese Gleichung ist andererseits daraus zu folgern, dass die
u × (v×w) = −(v× w) × u = −(v · u)w + (w · u)v. zweimalige Spiegelung an E alle Raumpunkte unverändert
lässt.
S. 253
S. 258
Ebenfalls ein reguläres Tetraeder, und zwar eines, das der Ein-
1) Nein, sie ist zwar orthogonal, aber die Spaltenvektoren
heitskugel eingeschrieben ist, nachdem es sich ausschließlich
(s 1 , s 2 , s 3 ) bilden ein Linkssystem; es ist det(s 1 , s 2 , s 3 ) =
um Einheitsvektoren handelt.
−1 und s 1 × s 2 = −s 3 . Erst nach Vertauschung zweier Spal-
ten oder auch Zeilen entstünde eine eigentlich orthogonale
S. 254
Matrix.
⎛ ⎞
4+1+4 2+2−4 4−2−2
2) Die Matrix M ist symmetrisch, und wegen N 2 = N ist
D =⎝ 2+2−4 1+4+4 2−4+2 ⎠
M M 0 = M M = E3 , wie bereits früher auf Seite 256 fest-
⎛ 4 − 2 −⎞
2 2−4+2 4+4+1
gestellt worden ist. Die Spiegelung führt Rechtssysteme in
9 0 0
= ⎝ 0 9 0 ⎠ = 9 E3 . Linkssysteme über. Daher ist die Matrix uneigentlich ortho-
0 0 9 gonal.
274 7 Analytische Geometrie – Rechnen statt Zeichnen
Eine der wichtigsten Errungenschaften der Mathematik ist die Wir haben es hier mit einer Abfolge, den Aktienschlusskur-
konkrete Beschreibung des Unendlichen. Dadurch wurde un- sen, zu tun. Es ist wichtig, die Tage nacheinander zu betrach-
endlich groß und unendlich klein greifbar und mathematischen ten. Begriffe wie steigen oder fallen machen nur einen Sinn,
Aussagen zugänglich. Die Geschichte der Naturwissenschaften wenn wir die Reihenfolge der Tage einhalten. Diesen Aspekt
und Technik ist voll von Irrtümern, die man bei dem Versuch be- finden wir bei einer mathematischen Folge wieder: Irgend-
ging, Unendlichkeit zu fassen. Sie zeigen, wie komplex eigentlich welche Objekte sind in einer Reihenfolge, wir können sie
unser heutiger Begriff des „Grenzwerts“ ist. abzählen.
Folgen spielen bei der Beschreibung des Unendlichen eine Es gibt aber noch einen weiteren Aspekt: Wir haben es mit
entscheidende Rolle und sind daher eines der wichtigsten Hand- einer Liste von Kurswerten zu tun, für die kein Ende definiert
werkszeuge in der Analysis. Zahlreiche nützliche Begriffe lassen ist. Das Diagramm gibt nur einen Ausschnitt der Abfolge aller
sich mit ihrer Hilfe definieren und erklären. Andererseits sind Schlusskurse dieses Index wieder. Es gibt zwar einen Beginn,
Folgen Grundlage für ganz alltägliche Dinge geworden: Stän- nämlich der Tag, an dem der Index an der Börse eingeführt
dig werden in Taschenrechnern, MP3-Playern oder für Wetter- wurde, aber sofern der Index nicht abgeschafft wird, kommt
vorhersagen Folgenglieder berechnet. Hierbei geht es um die mit jedem Handelstag ein neuer Schlusskurs hinzu.
Gewinnung von Näherungslösungen von Gleichungen.
Die Grundlage für einen fehlerfreien Einsatz von Folgen ist
Bei einer Folge haben wir es mit unendlich
eine genaue Begriffsbildung. Dabei wird die Konvergenz von
Zahlenfolgen zunächst im Vordergrund stehen. Aber erst durch vielen Objekten zu tun
Verallgemeinerungen, wie Häufungspunkte und Cauchy-Folgen,
wird die tiefliegende Bedeutung der Konzepte, etwa bei der Natürlich kann man einwenden, dass in der Realität zu je-
Konstruktion der reellen Zahlen, deutlich. dem festen Zeitpunkt auch die Abfolge solcher Aktienkurse
oder anderer Messwerte endlich ist. Wir gelangen zu einer
mathematischen Definition einer Folge, indem wir uns über
diesen Einwand hinwegsetzen: Wir konstruieren gedanklich
8.1 Der Begriff einer Folge eine Abfolge irgendwelcher Objekte, die unendlich fortge-
setzt wird, indem wir den Objekten eine Nummerierung zu-
Um ein Verständnis für den Begriff der Folge zu erhalten, ordnen.
werden wir uns ihm behutsam nähern. Wir tun dies anhand
eines Beispiels. Definition einer Folge
Eine Folge ist eine Abbildung der natürlichen Zahlen in
eine Menge M, die jeder natürlichen Zahl n ∈ N ein
Bei einer Folge stehen Objekte in einer
Element xn ∈ M zuordnet.
Reihenfolge
In der Abbildung 8.1 sehen Sie einen Börsenchart des Aktien- Die Elemente xn werden Folgenglieder genannt und übli-
index DAX für einen Zeitraum im Herbst 2006. Der Ver- cherweise mit einem Index angegeben, obwohl es sich um
lauf der Kurve entspricht den täglichen Schlusskursen die- Bilder einer Abbildung handelt, d. h., wir schreiben xn an-
ses Index. Man sieht, wie der Aktienkurs sich geändert hat, stelle von x(n). Die gesamte Folge wird mit (xn )∞
n=1 , (xn )n∈N
wie er von Tag zu Tag steigt oder fällt. Eigentlich müss- oder, wenn es unmissverständlich ist, einfach mit (xn ) be-
ten hier diskrete, isolierte Werte eingezeichnet sein, eben die zeichnet.
Schlusskurse der entsprechenden Tage, aber aus optischen
Gründen wurden diese Werte durch Strecken verbunden, so- In diesem Kapitel werden wir es zumeist mit Zahlenfolgen
dass eine durchgehende Line entsteht. zu tun haben, bei denen jedes Folgenglied entweder eine re-
elle oder eine komplexe Zahl ist. Es ist dann M = R oder
M = C oder eine Teilmenge davon.
DAX
6500 Beispiel
6400 Die Folge (xn ) bestehend aus den positiven geraden Zah-
len bzw. aus den positiven ungeraden Zahlen ist durch
6200
xn = 2n bzw. xn = 2n − 1
6100
6000
für n ∈ N gegeben.
Okt Nov Bei der Folge (xn ) mit
' (
1 n
Abbildung 8.1 Der Indexchart des DAX, wie man ihn in einer Börsenzeitschrift xn = 1 + , n ∈ N,
findet, stellt eine Folge von Tagesschlusskursen dar. n
8.1 Der Begriff einer Folge 277
ist jedes Folgenglied xn eine positive reelle Zahl. In der Achtung: Es ist nicht unbedingt notwendig, dass die Folge
Abbildung auf Seite 281 sind die ersten 10 Folgenglieder mit dem Index 1 beginnt. Der Startindex kann durchaus 0 oder
dargestellt. eine andere beliebige ganze Zahl sein. Eine verallgemeinerte
Durch die Definition Definition ist aber nicht nötig, da mit einer Verschiebung des
!n Index der Zähler der Folgenglieder stets der ursprünglichen
xn = j Definition angepasst werden kann.
j =1
erhalten wir eine Folge von Summen, ein spezieller
Auch außerhalb der Mathematik tauchen Folgen auf. Hier ist
Fall einer Zahlenfolge. Wir wissen aus Kapitel 4 (siehe
ein Beispiel für eine Folge, mit der fast jeder täglich zu tun
Seite 124), dass diese Folge auch anders beschrieben wer-
hat.
den kann, nämlich durch
n(n + 1) Beispiel Das Referenzformat für Papiergrößen nach Norm
xn = , n ∈ N.
2 DIN 476 ist das Format A0, bei dem ein Blatt einen Flächen-
Solche Folgen von Summen sind mathematische Objekte, inhalt
√ von einem Quadratmeter und ein Seitenverhältnis von
die uns als Reihen im Kapitel 8 wieder begegnen werden. 1 : 2 besitzt. Ausgehend von diesem Format erhält man das
Die Definition einer Folge auf Seite 276 lässt auch Folgen Format An durch n-maliges Halbieren der längeren Seite des
zu, die nicht aus Zahlen bestehen. Für jedes n ∈ N erhalten vorhergehenden Formats. Eine Eigenschaft dieser Konstruk-
wir mit der Vorschrift tion ist, dass dabei das Seitenverhältnis immer gleich bleibt.
Die Norm DIN 476 definiert also eine Folge (An)n∈N0 von
n
Gn = (x, y) ∈ R2 | y = (x − 1) Papierformaten. In der Abbildung 8.3 sind einige typische
5
Vertreter der Folgenglieder dargestellt.
eine Gerade Gn in der Ebene, insgesamt also eine Folge
von Geraden (Gn ). Die ersten Glieder dieser Folge sind
in der Abbildung 8.2 dargestellt. Als Menge M kann hier
die Menge aller Geraden in der Ebene gewählt werden,
oder die Menge aller Geraden durch (1, 0).
G8
4 G7
G6
G5
3
G4
G3
2
G2
1
G1
Abbildung 8.3 Ein Ausschnitt aus der Folge der Papierformate nach DIN 476,
x von der technischen Zeichnung (DIN A2) bis zur Postkarte (DIN A6).
1 2 3 4 5
Abbildung 8.2 Die ersten 8 Folgenglieder einer Folge von Geraden. Folgen können explizit oder rekursiv definiert
werden
In späteren Kapiteln spielen auch Folgen von anderen ma-
thematischen Objekten eine wichtige Rolle. So werden etwa Es gibt einen wichtigen Unterschied in der Definition zwi-
Folgen von Vektoren in einem Vektorraum oder Funktionen- schen dieser letzten Folge und denen, die uns bisher begeg-
folgen betrachtet. net sind: Bisher ließ sich für ein vorgegebenes n ∈ N das
zugehörige Folgenglied xn direkt aus der Definition bestim-
? men. Wir nennen diese Art der Definition einer Folge ex-
Machen Sie sich die Reihenfolge der Folgenglieder in den
Beispielen klar, indem Sie jeweils die ersten 5 bis 10 Folgen- plizit. Im Beispiel der Papierformate wurde das Folgenglied
glieder berechnen. für den Startindex angegeben, der Startwert, und außerdem
eine Rekursionsvorschrift, mit der ein Folgenglied xn+1 aus
278 8 Folgen – der Weg ins Unendliche
0, 1, 1, 2, 3, 5, 8, 13, 21, . . .
1, 1, 1, 1, 1, . . . ' n−1 (
9 3
Abbildung 8.5 Die ersten 60 Folgenglieder der Folge 10 + 10 i
n
? aufgespalten in Real- und Imaginärteil.
Im(z) Im(z)
5
i
4
3
2
1
54 Re(z)
−1 1
3
2
1 Re(z)
−1 1
−i
Abbildung 8.7 Die Folge (un ) scheint den Einheitskreis nicht zu verlassen.
−i
Um eine obere Schranke zu finden, addieren wir null in Allgemein sind arithmetische Folgen, d. h. Folgen, die
der Form 1 − 1 im Zähler und können dann kürzen: gegeben sind durch
2n2 − 2n + 2 1 an = a0 + nd, n ∈ N,
xn = − 2
n2 − n + 1 n −n+1
=2− 2
1
≤ 2. mit Startwert a0 ∈ R, für d > 0 streng monoton wachsend
n −n+1 und für d < 0 streng monoton fallend.
Die Folge ist durch 2 nach oben beschränkt. Die Folge (bn ) mit
Bei der rekursiv definierten Folge (yn ) mit 1
bn = 1 + , n ∈ N,
1 1 n
y1 = , yn+1 = , n ∈ N,
2 2 − yn
ist streng monoton fallend, denn
muss vollständige Induktion angewandt werden, um die
Beschränktheit nachzuweisen. Wir berechnen die ersten 1 1 1
bn+1 − bn = − =− < 0.
Folgenglieder, n+1 n n(n + 1)
Damit folgt:
n
5 10 15 20
1 1
yn+1 = < = 1. Abbildung 8.8 Die ersten 20 Glieder der monoton fallenden Folge 1 + n1 .
2 − yn 1 n
Beispiel
Die Folgen der geraden Zahlen (2n)∞ n=1 und der ungeraden n
5 10 15 20
Zahlen (2n − 1)∞ n=1 sind streng monoton wachsend, denn
n
hier ist die Differenz zweier aufeinanderfolgender Glieder Abbildung 8.9 Die ersten 20 Glieder der Folge 1 + (−1)
n , die nicht
n
stets 2. monoton ist.
8.1 Der Begriff einer Folge 281
Problemanalyse und Strategie: Die einzelnen Folgenglieder werden untersucht. Durch Anwendung bekannter ele-
mentarer Ungleichungen wollen wir zeigen, dass die Schranken gelten.
' (
Lösung: n 1 1 n(n − 1)(n − 2) · · · (n − k + 1)
=
Da 1 + 1/n > 1 ist für n ∈ N, ist auch ·
· · n
k nk k! n
' (
1 n k mal
xn = 1 + > 1. können wir weiter abschätzen: Im rechten Bruch stehen im
n
Zähler und Nenner je k Faktoren, wobei die Faktoren im
Somit ist gezeigt, dass 1 eine untere Schranke ist.
Zähler kleiner oder gleich denen im Nenner sind. Daher ist
der rechte Bruch insgesamt kleiner oder gleich 1. Es folgt
xn
mit der geometrischen Summenformel (siehe Seite 129):
3
!n
1
2 xn ≤ 1 +
k!
1 k=1
!n
1
2 4 6 8 10
n ≤1+
2k−1
k=1
!'
n−1
1
(k
Mit der binomischen Formel (vergleiche Seite 291) erhal- =1+
ten wir 2
k=0
' ( n
1 n 1
xn = 1 + 1− 2
n =1+
! n(
n ' ' (k
1
1 − 12
= 1n−k ' ' (n (
k n 1
k=0 =1+2 1−
!n ' ( 2
n 1
=1+ . ≤ 3.
k nk
k=1 Damit haben wir auch bewiesen, dass 3 eine obere
Die Terme in der Summe Schranke ist.
Kommentar: Die Zahlen 1 und 3 sind keineswegs die größte obere bzw. die kleinste untere Schranke für die Folge. Dies
ist aber für die Tatsache, dass die Folge beschränkt ist, überhaupt nicht wichtig.
Die ersten paar Folgenglieder sind in der Abbildung dargestellt. Die Vermutung liegt nahe, dass die kleinste obere
Schranke für die Folge (xn ) irgendwo bei 2.7 liegt. Tatsächlich werden wir später beweisen können, dass die kleinst-
mögliche obere Schranke eine irrationale Zahl ist, deren erste Stellen so aussehen:
Diese Zahl, die Euler’sche Zahl genannt und mit e bezeichnet wird, wird noch eine große Rolle spielen.
Vielleicht haben Sie das folgende Bild oder eine Variante Iterationen entspricht. Im zweiten Fall nimmt man an, dass
davon schon einmal gesehen: die Folge beschränkt bleibt. Der Bildpunkt wird schwarz
eingefärbt. Alle farbigen Punkte liegen also außerhalb der
Mandelbrotmenge.
Die Mandelbrotmenge ist ein Beispiel für ein Fraktal. Sie
ist eine Menge, die selbst wieder verkleinerte, sich selbst
ähnliche Kopien enthält. Ein Beispiel ist die Abbildung
links unten, die einen Ausschnitt aus der Spitze links in
der ersten Abbildung zeigt. Auch in den 4 kleineren Ab-
bildungen finden Sie zahlreiche, einander ähnliche Struk-
turen. Beim Betrachten eines Ausschnitts kann man auch
nicht entscheiden, welche Vergrößerung vorliegt, da die
Strukturen sich auf jeder Skala ähneln.
Das Bild ist eine Visualisierung der sogenannten Mandel-
brotmenge (nach dem französischen Mathematiker Benoît
Mandelbrot), die etwas mit komplexen Zahlenfolgen zu
tun hat. Dazu betrachtet man die Folge (zn ) mit
2
z0 = 0, zn = zn−1 + c, n ∈ N,
für verschiedene Werte c ∈ C. Es stellt sich die Frage, (i) (iii)
für welche Parameter c diese Folge beschränkt bleibt. Die
Menge dieser Parameter ist die Mandelbrotmenge.
Es lässt sich zeigen, dass die Folge auf jeden Fall dann
unbeschränkt ist, wenn für ein n0 ∈ N die beiden Bedin-
gungen |zn0 | > 2 und |zn0 | ≥ |c| erfüllt sind. In diesem Fall
gilt nämlich |zn0 +m | ≥ q m, |zn0 | mit einer reellen Zahl (ii) (iv)
q > 1. Die Mandelbrotmenge erreichte in den 80er Jahren des
Eine weitere Überlegung ist, dass im Fall |c| > 2 schon 20. Jahrhunderts einen für ein mathematisches Thema
für n0 = 1 beide Bedingungen erfüllt sind. Daher ist die seltenen Bekanntheitsgrad. Die Ästhetik der Bilder fas-
Bedingung |zn0 | > 2 allein bereits hinreichend, damit die zinierte ein breites Publikum. Ein zusätzlicher Fak-
Folge unbeschränkt ist. tor war die zunehmende Verbreitung von Heimcom-
putern, durch die jeder Interessierte selbst Bilder be-
rechnen konnte. Die Abbildungen auf dieser Seite wur-
den mit dem Programm xaos (http://wmi.math.u-
szeged.hu/xaos/) erzeugt. Ein Bildausschnitt wird in
diesem Programm durch den Mittelpunkt und einen Ra-
dius festgelegt. Für die Abbildungen auf dieser Seite wur-
den die folgenden Koordinaten gewählt:
Die Ungleichung am Schluss gilt, da im Bruch sowohl vergangen. Hier haben wir die geometrische Summenformel
Zähler als auch Nenner positiv sind. Dass der Nenner po- angewandt!
sitiv ist, erkennt man an der faktorisierten Darstellung aus
der 2. Zeile. Nun löst sich die scheinbare Paradoxie auf. Keine der Mes-
Es gilt also dn+1 ≥ dn für n ≥ 2. Da auch d2 = 3/5 > 0 sung findet später als Tmax = 43 statt. Es ist also nicht so, dass
= d1 ist, wächst die Folge monoton. Achilles die Schildkröte niemals einholt, sondern er holt sie
nicht innerhalb der ersten 43 Minuten des Experiments ein.
Tatsächlich werden wir später sehen, dass der Zeitpunkt, an
dem die beiden gleichauf sind, eben genau Tmax ist.
8.2 Konvergenz
Viele Generationen von Philosophen rätselten über dieses
Vom Philosophen Zenon von Elea (ca. 450 v. Chr.) ist das oder ähnliche scheinbare Paradoxa. Für uns ist es eine schöne
berühmte Paradoxon von Achilles und der Schildkröte über- Illustration der wichtigsten Frage im Zusammenhang mit
liefert. Folgen: Was passiert mit den Folgengliedern, wenn wir den
Index n ∈ N immer größer werden lassen? Beim Beispiel von
Zenon behauptet, dass bei einem Wettrennen zwischen Achil- Achilles und der Schildkröte kommt es zu einer Häufung der
les und einer Schildkröte Achilles die Schildkröte nie ein- Zeitpunkte und der Positionen der beiden Protagonisten. Wir
holen wird, wenn die Schildkröte zu Anfang einen Vorsprung werden den Begriff der Konvergenz dafür einführen.
bekommt. Sein Argument ist bestechend: Achilles muss nach
dem Start zunächst den Punkt erreichen, an dem die Schild- Um die Notwendigkeit der formalen Definition zu unterstrei-
kröte gestartet ist. In der Zwischenzeit ist die Schildkröte aber chen, möchten wir betonen, dass eine reine Betrachtung der
weitergekrochen. Wenn Achilles nun diesen Punkt erreicht, numerischen Folgenglieder unzureichend ist. Als Beispiel
ist die Schildkröte wieder ein Stück voraus, usw. betrachten wir die beiden Folgen (xn ) und (yn ) mit
Warum überholt Achilles aber doch die Schildkröte, wenn
das Wettrennen wirklich stattfindet? Versuchen wir das Ren- !
n
1 !
n
1
xn = und yn = für n ∈ N.
nen formal durch Folgen zu erfassen: Nehmen wir an, der j j 1,01
j =1 j =1
Vorsprung ist 1 A lang, wobei diese Längeneinheit gerade
die Strecke sein soll, die Achilles pro Zeiteinheit, sagen wir
pro Minute, zurücklegt. Also hat Achilles die Geschwindig- Dezimaldarstellungen einiger Folgenglieder auf 6 Nachkom-
keit 1 A/min . Wenn Achilles nun viermal so schnell ist mastellen gerundet sind:
wie die Schildkröte, dann ist der Abstand zwischen Achil-
les und der Schildkröte bei jedem Betrachtungspunkt in Ze- n xn yn
n
1
nons Gedanken durch die Folge (dn ) mit dn = > 0 4 1 1,000 000 1,000 000
für alle n ∈ Z≥0 gegeben. Da dn stets positiv bleibt, holt 2 1,500 000 1,496 546
Achilles die Schildkröte während des Experiments nicht 3 1,833 333 1,826 238
ein. .. .. ..
. . .
1 000 7,485 471 7,252 980
2 000 8,178 368 7,897 391
3 000 8,583 749 8,272 340
Lösung: Nun zur Folge (yn ). Wir betrachten die Differenz zweier
Eine obere Schranke für die Folge (xn ) erhält man mit Folgenglieder:
quadratischer Ergänzung, 1
yn − yn−1 = − yn−1
xn+1 = 2xn − xn2 2 − yn−1
= 1 − (1 − 2xn + xn2 ) 1 − 2yn−1 + yn−1
2
=
= 1 − (1 − xn )2 2 − yn−1
(1 − yn−1 )2
< 1, = .
2 − yn−1
da das Quadrat positiv ist, und es von 1 abgezogen wird.
Da auch x1 = 1/2 < 1 ist, ist xn < 1 für alle n ∈ N. Das Quadrat im Zähler ist immer positiv. Somit wächst
Außerdem sind alle xn > 0. Dies zeigen wir durch voll- die Folge streng monoton, falls 2 − yn−1 > 0, d. h., falls
ständige Induktion: Der Induktionsanfang ist die Aussage yn−1 < 2 ist, sie fällt streng monoton, falls yn−1 > 2
x0 = 1/2 > 0. Nun zum Induktionsschritt: Wir wissen, gilt. Auch hier ist eine Schranke für die Folgenglieder yn
dass xn ≤ 1 ist, also auch 2 − xn > 0. Aus der Induktions- entscheidend.
annahme xn > 0 folgt nun Wir wollen sogar zeigen, dass yn < 1 für alle n ∈ N gilt.
Dies beweisen wir durch vollständige Induktion. Den In-
xn+1 = 2xn − xn2 = xn (2 − xn ) > 0, duktionsanfang bildet die Aussage für n = 0, und diese
denn beide Faktoren sind positiv. Also ist xn > 0 für alle ist laut Voraussetzung erfüllt: y0 = 0 < 1.
n ≥ 0. Für den Induktionsschritt gelte für ein n ∈ N, dass
Nun können wir den Quotienten der Folgenglieder be- yn−1 < 1 ist. Dann folgt:
trachten: 1
2 − yn−1 > 1, also yn = < 1.
xn+1 xn <1 2 − yn−1
= 2 − xn > 2 − 1 = 1.
xn Damit ist insgesamt gezeigt: yn < 1 für alle n ∈ N. Mit
Also ist xn+1 > xn , die Folge ist streng monoton wach- der Überlegung oben erhalten wir die Aussage, dass die
send. Folge streng monoton wachsend ist.
endlich viele liegen außerhalb. In der Abbildung 8.12 ist dies d. h., die Folge (xn ) ist eine Nullfolge. Wegen der archime-
n
zum Beispiel für die Folge (xn ) mit xn = 1 + (−1) n veran- dischen Eigenschaft von R (siehe den Satz auf Seite 123)
schaulicht. Man kann auch sagen: Ab einem gewissen N lie- können wir zu ε > 0 eine Zahl N ∈ N wählen mit
1
gen alle Folgenglieder innerhalb der ε-Umgebung. Dies gilt N > εq/p . So folgt für alle n ≥ N :
offensichtlich für eine konstante Folge (xn ) mit xn = a ∈ C
1 1
für alle n ∈ N. Somit sind konstante Folgen konvergent. |xn − 0| = |xn | = ≤ < ε.
np/q N p/q
xn Für die erste Abschätzung, haben wir verwendet, dass mit
x > y > 0 auch x r > y r für alle r ∈ Q>0 gilt. Dies
2
ergibt sich als Anwendung der verallgemeinerten dritten
binomischen Formel
1 !
m−1
x m − y m = (x − y) x j y p−j −1 , m ∈ N.
j =0
Lemma
Abbildung 8.13 Die geometrische Folge (q n ) für verschiedene Werte für q.
Jede konvergente Folge ist beschränkt. Die Glieder werden jeweils gegen den Uhrzeigersinn durchlaufen, das erste
Folgenglied q 0 = 1 ist für alle drei Folgen gleich.
?
Suchen Sie ein Beispiel für eine divergente Folge, die be-
schränkt ist. Majoranten helfen bei Konvergenzbeweisen
Sehen wir uns noch einmal an, was wir im Beispiel auf
Häufig wird die Umkehrung dieser Aussage genutzt, um die Seite 285 gemacht haben. Wir haben versucht den Ausdruck
Divergenz einer Folge zu belegen: Jede unbeschränkte Folge |xn −x| abzuschätzen gegen einen Term, bei dem wir leichter
ist divergent. Betrachten wir zum Beispiel die Folge (q n )∞
n=0 die Konvergenz sehen. Im Beispiel war das die uns bekannte
mit einer komplexen Zahl q mit |q| > 1. Da Nullfolge ( n1 )∞
n=1 .
|q n | = |q|n Allgemein gilt, falls wir für eine Nullfolge (yn ) die Abschät-
unbeschränkt ist, ist die Folge divergent. zung |xn − x| ≤ |yn | gefunden haben, so lässt sich zu ε > 0
ein N ∈ N angeben mit |yn | < ε für alle n ≥ N. Es folgt
Die geometrische Folge (q n )∞ n=0 haben wir für den Fall |xn − x| < ε für n ≥ N . Diese Überlegung halten wir fest,
|q| < 1 und für |q| > 1 betrachtet. Im ersten Fall ist sie damit wir uns in Zukunft die explizite Konstruktion von N
konvergent, im zweiten Fall divergent. Es bleibt noch der in Abhängigkeit von ε sparen können.
Fall |q| = 1 zu klären. Für q = 1 ist xn = 1 konstant für alle
n ∈ N, insbesondere auch konvergent.
Majorantenkriterium
Für alle anderen q auf dem komplexen Einheitskreis müssen
wir anders argumentieren. Es ist Wenn es zu einer Folge (xn ) in C eine Nullfolge (yn )
und einen Wert x ∈ C gibt, sodass
q n+1 − q n = q n (q − 1).
|xn − x| ≤ |yn | für n ≥ N ∈ N
Daher gilt auch:
|q n+1 − q n | = |q|n |q − 1| = |q − 1|. gilt, dann konvergiert die Folge (xn ) gegen den Grenz-
wert x.
Die Differenzen aufeinanderfolgender Glieder bilden also
keine Nullfolgen, daher ist (q n ) divergent. Zum Beispiel er-
hält man für q = −1 die alternierende Folge Beispiel Wir wollen zeigen, dass die Folge 1 + 1
n+1
den Grenzwert 1 besitzt. Es gilt die Abschätzung
+1, −1, +1, −1, +1, . . . ,
) )
) )
für q = i die Folge )1 + 1 − 1) = 1 ≤ 1 .
) n+1 ) n+1 n
+1, +i, −1, −i, +1, . . .
Da (1/n) eine Nullfolge ist, folgt mit dem Majorantenkrite-
Die Abbildung 8.13 illustriert dies für rium die Behauptung.
π π
q = r cos + i sin
16 16 Das Majorantenkriterium soll nun für den Nachweis der
mit r ∈ {0, 975 , 1 , 1, 025}. Konvergenz einer wichtigen Folge verwendet werden.
8.2 Konvergenz 287
Die Fakultät strebt schneller gegen Unendlich (zn ) durch zn = xn + yn definieren. Ist diese auch konver-
als die Potenzen einer Zahl gent? Falls ja, was ist ihr Grenzwert?
Es ist zu vermuten, dass der Grenzwert z = x + y ist. Dies
Wir wollen zeigen, dass für jedes q ∈ C gilt:
ist in der Tat so, denn mit der Dreiecksungleichung folgt:
qn
lim = 0.
n→∞ n! |z − zn | = |x + y − xn − yn | ≤ |x − xn | + |y − yn |.
Dies bedeutet, dass die Fakultät, n!, mit n schneller anwächst
als die geometrische Folge q n . Wir wählen dazu ein N ∈ N Die rechte Seite strebt gegen null und daher folgt mit dem
mit Majorantenkriterium die gewünschte Aussage. Griffig lässt
|q| 1 sie sich übrigens als
≤ .
N 2
Dann gilt für alle n ∈ N mit n ≥ N die Ungleichungskette lim (xn + yn ) = lim xn + lim yn
n→∞ n→∞ n→∞
|q|n |q| |q|n−1
1 |q|n−1
= · ≤ · formulieren.
n! n (n − 1)! 2 (n − 1)!
' (n−N
1 |q|N Auch die anderen üblichen Rechenregeln lassen sich auf
≤ ··· ≤ .
2 N! Grenzwerte konvergenter Folgen übertragen. Die wichtigsten
Anders geschrieben haben wir Regeln sind hier zusammengestellt (siehe auch die Übersicht
' (n auf Seite 290).
|q|n |2q|N 1
≤
n! N! 2
Rechenregeln bei konvergenten Folgen
erhalten. Die geometrische Folge ((1/2)n ) ist eine Nullfolge,
Sind x und y die Grenzwerte konvergenter Folgen (xn )
der positive konstante Faktor davor ändert daran nichts. Das
und (yn ) in C, und sind λ ∈ C eine komplexe und
Majorantenkriterium liefert die Konvergenz lim q n /n! = 0.
n→∞ p, q ∈ N natürliche Zahlen, so existieren die folgenden
Grenzwerte, und es gilt:
xn
lim (λxn ) = λx,
n→∞
10 q=2
lim (xn + yn ) = x + y,
q=3 n→∞
Die Abbildung 8.14 zeigt das Verhalten der Folge (q n /n!) für
verschiedene Werte von q. Man sieht, dass q n /n! durchaus Beweis: Die Aussagen lassen sich stets als Folgerungen
große Werte annehmen kann. Konvergenz sagt nur etwas aus aus dem Majorantenkriterium auffassen. Wir führen hier ne-
über das Verhalten für große n. ben der oben hergeleiteten Summe noch den Beweis für den
Die Rechnung oben zeigt, wie umständlich es sein kann, auf Grenzwert des Quotienten zweier Folgen und für die q-te
diese Weise die Konvergenz einzelner Folgen nachzuwei- Wurzel auf. Die anderen Beweise funktionieren ganz analog
sen. Wir wollen uns nach Rechenregeln umsehen, die es ein- und sollten vom Leser nachvollzogen werden (siehe Auf-
facher machen, Grenzwerte zu bestimmen. Dabei wird aber gabe 8.16).
das Majorantenkriterium unser wichtigstes Werkzeug blei- Betrachten wir die Folge (zn ) mit zn = xn /yn . Wenn der
ben. Grenzwert y = 0 ist, so gibt es ein N ∈ N mit |yn −y| ≤ 21 |y|
für alle n ≥ N, und es folgt mit der Dreiecksungleichung
Mit Grenzwerten lässt sich fast wie mit Zahlen 1
rechnen |yn | = |y − (y − yn )| ≥ |y| − |yn − y| ≥ |y|
2
Betrachten wir zwei konvergente Folgen (xn ) bzw. (yn ) mit für alle n ≥ N . Insbesondere sind die Folgenglieder yn = 0
Grenzwerten x bzw. y. Damit können wir eine weitere Folge für n ≥ N, und zumindest ab n ≥ N ist zn wohldefiniert.
288 8 Folgen – der Weg ins Unendliche
Problemanalyse und Strategie: Es soll jeweils das Majorantenkriterium angewandt werden. Will man die Konvergenz
zeigen, muss die Differenz von Folgenglied und vermutetem Grenzwert durch eine Nullfolge nach oben abgeschätzt
werden. Bei der Divergenz werden wir versuchen zu zeigen, dass die Folge unbeschränkt ist.
1/q
Weiter ergibt sich die Abschätzung Wir zeigen nun die Konvergenz von (xn ), falls (xn ) gegen
) ) ) ) x konvergiert. Im Fall x = 0 kann man mit der Definition des
) xn ) ) )
) − x ) = ) yxn − yn x ) 1/q
)y y ) ) yn y ) Grenzwerts sofort nachvollziehen, dass (xn ) eine Nullfolge
n
1 ist.
= |y(xn − x) + (y − yn )x|
|yn | |y| Im Fall x > 0 verwenden wir einen Standardtrick: Hat man es
1 |x| mit der Differenz von q-ten Wurzeln zu tun, verwendet man
≤ |xn − x| + |y − yn |
|yn | |yn | |y| eine Verallgemeinerung der dritten binomischen Formel
2 2 |x|
≤ |xn − x| + |y − yn | !
q−1
|y| |y|2 1/q 1/q (q−1−j )/q
xn − x = (xn −x ) xn x j/q .
für n ≥ N . Rechts steht die Summe zweier Nullfolgen, also j =0
wieder eine Nullfolge. Das Majorantenkriterium liefert, dass
auch die Folge (xn /yn ) konvergiert, und der Grenzwert ist Wie beim Nachweis der Konvergenz eines Quotienten zweier
x/y. konvergenter Folgen sehen wir xn ≥ x für alle n ab einem ge-
8.2 Konvergenz 289
wissen n0 . Damit folgt, ebenfalls für n ≥ n0 , für die Summe Dies sehen wir aus folgender Überlegung. Zu ε > 0 können
auf der rechten Seite: wir N ∈ N finden, sodass |xn − x| ≤ ε/2 und |yn − y| ≤ ε/2
für alle n ≥ N ist. Damit ergibt sich
!
q−1
(q−1−j )/q
!
q−1
x (q−1−j )/q j/q
xn x j/q ≥ x 0 ≤ yn − xn = yn − y − xn + x + y − x ≤ ε + y − x ,
2
j =0 j =0
!'
q−1
1
((q−1−j )/q wenn x = lim xn und y = lim yn sind. Diese Unglei-
n→∞ n→∞
= x (q−1)/q chung erhalten wir für jeden Wert ε > 0, und somit ist x ≤ y.
2
j =0
⎛ ⎞ Die Ungleichung xn ≤ yn bleibt also im Grenzfall erhalten:
!'
q−2
1
((q−1−j )/q x ≤ y. Das Beispiel xn = n12 und yn = n1 zeigt außerdem,
= x (q−1)/q ⎝1 + ⎠ ≥ x (q−1)/q . dass wir bei echten Ungleichung xn < yn aufpassen müssen,
2
j =0 da im Grenzfall im Allgemeinen nur auf x ≤ y geschlossen
Somit gilt für n ≥ n0 : werden kann.
) ) |xn − x| |xn − x|
) 1/q )
)xn − x 1/q ) = q−1 (q−1−j )/q j/q
≤ .
x (q−1)/q Durch Einschließen lassen sich Grenzwerte
j =0 xn x
Die rechte Seite geht gegen null für n → ∞, mit dem Mono- bestimmen
1/q
toniekriterium folgt somit die Konvergenz xn → x 1/q
für n → ∞.
Die letzte Eigenschaft lässt sich für ein weiteres Konvergenz-
kriterium nutzen. Um zu zeigen, dass eine Folge konvergent
ist, benötigten wir bislang eine Vermutung für den Grenz-
Wie diese Regeln zur Berechnung von Grenzwerten genutzt wert, um passende Abschätzungen zu finden. Dies ist aber
werden können, wird im Beispiel auf Seite 291 aufgezeigt. oft nicht möglich. Es ist somit wichtig, Kriterien zur Verfü-
gung zu haben, die erlauben, ohne Kenntnis des Grenzwerts
Achtung: Bei den Rechenregeln haben wir stets die Vor- Aussagen über die Konvergenz einer Folge zu machen.
aussetzung, dass sowohl (xn ) als auch (yn ) konvergieren. Mit dem letzten Resultat halten wir fest: Wenn drei reelle Fol-
Diese Voraussetzung ist notwendig und muss berücksichtigt gen (an ), (bn ) und (cn ) gegeben sind und wir wissen, dass
werden. (an ) und (bn ) gegen denselben Grenzwert a ∈ R konvergie-
ren, so genügt es zu zeigen, dass an ≤ cn ≤ bn für n ∈ N
Die ersten beiden Regeln bezüglich der Summe und der Mul- gilt, um zu sehen, dass auch lim cn = a gilt. Diese Tat-
n→∞
tiplikation mit einer Zahl zeigen, dass wir es mit linearen al- sache wird Einschließungskriterium oder auch Sandwich
gebraischen Strukturen zu tun haben. Fassen wir alle Folgen Theorem genannt.
in C zu einer Menge zusammen, so ergibt sich mit dieser
Addition und der skalaren Multiplikation ein Vektorraum, Beispiel Mit dem Einschließungskriterium lässt sich leicht
der Vektorraum der Folgen in C. Aus den Rechenregeln für einsehen, dass die Folge (cn ) mit
Grenzwerte folgt, dass die Menge der konvergenten Folgen
√
cn = 1 − xn
n
U = {(xn )n∈N | (xn ) konvergent}
ein Unterraum ist. Weiter entdecken wir, dass die Menge aller für jedes x ∈ (−1, 1) gegen 1 konvergiert. Denn wir können
Nullfolgen wiederum einen Unterraum in Raum der konver-
genten Folgen bildet. 1 − x n ≥ 1 − |x|n ≥ 1 − |x|
? und
Finden Sie zur harmonischen Folge, d. h. xn = 1/n, drei 1 − x n ≤ 1 + |x|n ≤ 2
Nullfolgen (yn ), sodass die Folge (xn /yn )∞
n=1
abschätzen. Also ist 1 − |x| ≤ 1 − x n ≤ 2 . Es folgt aus der
1. auch eine Nullfolge,
Monotonie der n-ten Wurzel:
2. eine konvergente Folge mit Grenzwert 2 bzw.
3. divergent ist. √
n √ %
2 ≥ 1 − x n ≥ n 1 − |x|.
n
Neben den erwähnten Rechenregeln, sind auch häufig Un- Da sowohl die linke als auch die rechte Seite dieser Unglei-
gleichungen zwischen Folgengliedern relevant. Sind (xn ) chungskette für n → ∞ gegen 1 konvergieren, folgt mit dem
und (yn ) konvergente Folgen reeller Zahlen mit der Eigen- Einschließungskriterium lim cn = 1.
n→∞
schaft xn ≤ yn für alle n ∈ N, so folgt für die Grenzwerte:
Die Abbildung 8.15 illustriert diese Anwendung des Ein-
lim xn ≤ lim yn .
n→∞ n→∞ schließungskriterium für den Fall x = 1/2.
290 8 Folgen – der Weg ins Unendliche
Ungleichungen
Divergente Folgen Wenn (xn ) und (yn ) konvergente Folgen in C mit Grenz-
√ werten lim xn = x und lim yn = y sind, gilt:
( n!)∞
n n→∞ n→∞
n=1 ,
(q n )∞
n=1 mit |q| > 1, Aus xn ≤ yn für alle n ∈ N folgt x ≤ y.
(a + nd)∞
n=1 mit a, d ∈ C, d = 0. Aus xn < yn für alle n ∈ N folgt nur x ≤ y.
√
xn Beispiel Die rekursiv definierte Folge an+1 = 2an mit
( n 21 ) a0 = 1 liefert
√
2 ( n 1 − xn) .
√
n
( 2) √ √ √
1 1, 2, 2 2, 2 2 2, . . .
Nun nehmen wir an, dass die Folge konvergiert, bzw. genauer,
n es gibt eine Zahl a ∈ R mit lim an = a. Dann folgt aus der
5 10 15 n→∞
Rekursionsformel mit den Rechenregeln (siehe die Übersicht
Abbildung 8.15 Mittels Einschließungskriterium lässt sich oft ein Grenzwert
finden.
auf Seite 290) für a die Gleichung:
% √
a = lim an+1 = lim 2an = 2a .
n→∞ n→∞
Lösungen der Fixpunktgleichung sind
Eine solche Identität für einen möglichen Grenzwert ergibt
mögliche Grenzwerte sich immer bei rekursiv definierten Folgen mit den Rechen-
regeln aus der Rekursionsvorschrift. Sie wird Fixpunktglei-
Die Rechenregeln geben uns auch eine elegante Möglichkeit, chung genannt. Wir erhalten die Fixpunktgleichung, indem
bei rekursiv definierten Folgen Kandidaten für Grenzwerte wir in der Rekursionsformel den Grenzwert für n → ∞ be-
zu bestimmen. Machen wir uns dies an einem Beispiel klar. trachten. Im Beispiel bestimmen wir durch Quadrieren die
8.3 Häufungspunkte und Cauchy-Folgen 291
Problemanalyse und Strategie: Man muss die Folgenglieder so umschreiben, dass die Rechenregeln angewandt
werden können. Am einfachsten ist das, wenn man einen Bruch erzeugt, bei dem im Zähler und Nenner jeweils nur noch
einfache Folgen stehen, zum Beispiel Konstanten oder Nullfolgen. Dann erhält man mit den Rechenregeln sofort den
Grenzwert.
% %
Lösung: xn = ( n2 + 1 − n2 − 2n − 1)
% %
2 n2 + 1 + n2 − 2n − 1
(a) In der Folge können wir durch Kürzen von n direkt ·% %
Nullfolgen erzeugen: n2 + 1 + n2 − 2n − 1
(n2 + 1) − (n2 − 2n − 1)
3 + n2 + n12 =% %
xn = . n2 + 1 + n2 − 2n − 1
5 + n4 + n22 2n + 2
=% % .
Bis auf die jeweils ersten Summanden in Zähler und n + 1 + n2 − 2n − 1
2
Nenner haben wir es jetzt durchweg mit Nullfolgen Nun klammern wir in Zähler und Nenner den Term n
zu tun. Der Zähler konvergiert gegen 3, der Nenner aus und kürzen:
gegen 5. Nach der Regel für den Quotienten gilt nun:
2 + n2
lim (3 + n2 + n12 ) xn = .
n→∞ 3 1 + n12 + 1 − 2 n1 − n12
lim xn = = .
n→∞ lim (5 + n4 + n22 ) 5
n→∞
Jetzt haben wir wieder die einfache Form mit Kon-
(b) Wir erinnern uns an die dritte binomische Formel und stanten und Nullfolgen. Die Rechenregeln liefern
erweitern die Differenz der Wurzeln mit ihrer Summe:
lim 2 + lim n2
n→∞ n→∞
lim xn =
n→∞
lim 1 + n2 + lim 1 − 2 n1 − n12
1
n→∞ n→∞
2
= = 1.
1+1
Kommentar: Diese Beispiele zeigen zwei wichtige Techniken beim Durchführen solcher Rechnungen:
Man kürzt stets den Term, der am stärksten wächst, etwa das Monom höchsten Grades im Zähler und Nenner.
Differenzen von Wurzeln kann man häufig durch Erweitern mit ihrer Summe vereinfachen.
√
√ a = 2a als a = 0 und a = 2.
Lösungen der Gleichung Kandidaten für einen Grenzwert nur die Möglichkeit a = 0.
Da mit an ≥ 1 auch 2an ≥ 1 folgt, kommt von den beiden Aber offensichtlich ist die Folge unbeschränkt und somit
Werten nur a = 2 als möglicher Grenzwert der Folge infrage. nicht konvergent.
Die Abbildung 8.16 illustriert das Vorgehen. Die Lösung der
Fixpunktgleichung
√ ist gegeben durch einen Schnittpunkt der
Kurve y = 2x mit der Winkelhalbierenden y = x. Die 8.3 Häufungspunkte und
Stufen deuten die Rekursionsschritte an.
Cauchy-Folgen
Achtung: Mithilfe der Fixpunktgleichung bei rekursiv de- Die letzten Bemerkungen zeigen die Notwendigkeit von
finierten Folgen lassen sich oft Kandidaten für Grenzwerte theoretischen Konvergenzaussagen und zwar gerade dann,
ermitteln. Dies ist aber kein Beweis dafür, dass die Folge wenn wir keine Vermutung haben, welchen Wert ein mögli-
überhaupt konvergiert. So liefert uns etwa bei der Folge mit cher Grenzwert a hat, und sich keine elementare Abschätzung
an+1 = 2an und a0 = 1 die Fixpunktgleichung a = 2a als von |an − a| anbietet.
292 8 Folgen – der Weg ins Unendliche
Im Beispiel auf Seite 281 haben wir gezeigt, dass diese Folge
beschränkt ist mit 1 ≤ xn ≤ 3.
Gehen Sie einmal die Abbildungen von konvergenten Folgen Nun verwenden wir die Bernoulli-Ungleichung mit h = −1/
in diesem Kapitel durch: In vielen Fällen ist die Folge mono- (n + 1)2 und erhalten die Abschätzung
ton und außerdem beschränkt. Es zeigt sich, dass diese beiden ' (' (
xn+1 1 1
Eigenschaften hinreichend sind, damit Konvergenz vorliegt. ≥ 1+ 1 − (n + 1)
((n + 1)
xn n(' 2
'
1 1
Monotoniekriterium = 1+ 1− = 1.
n n+1
Jede beschränkte und monotone Folge reeller Zahlen ist
konvergent. Es ist stets xn+1 ≥ xn , d. h., die Folge ist monoton wachsend.
Mit dem Monotoniekriterium folgt die Konvergenz der Folge
(xn ). Der Grenzwert dieser Zahlenfolge ist die Euler’sche
Beweis: Wir betrachten den Fall einer monoton wachsen- Zahl e, wie bereits im Kommentar auf Seite 281 angemerkt
den Folge in R. Für monoton fallende Folgen ergibt sich der wurde.
Beweis ganz analog.
Sei also (an ) eine monoton wachsende und beschränkte Im Beispiel auf Seite 293 wird ausführlich gezeigt, wie das
Folge. Nach dem Vollständigkeitsaxiom (siehe Seite 114) Monotoniekriterium genutzt werden kann, um bei rekursiv
besitzt die beschränkte Menge M = {an | n ∈ N} ⊆ R gegebenen Folgen Konvergenz zu prüfen.
ein Supremum a = sup M. Somit gibt es zu ε > 0 eine Zahl
N ∈ N mit der Eigenschaft |aN − a| ≤ ε (siehe Seite 114). ?
Weiter gilt aufgrund der Monotonie der Folge (an ) die Ab- Versuchen Sie es√selbst und zeigen Sie Konvergenz für die
schätzung aN ≤ an ≤ a für alle n ≥ N . Wir erhalten Folge an+1 = 2an mit a1 = 1 aus dem Beispiel auf
Seite 290
|an − a| = a − an ≤ a − aN = |aN − a| ≤ ε
8.3 Häufungspunkte und Cauchy-Folgen 293
Für welche Startwerte x0 konvergiert die Folge? Wie lautet gegebenenfalls der Grenzwert?
Problemanalyse und Strategie: Es soll das Monotoniekriterium verwendet werden, um die Konvergenz der Folge
nachzuweisen. Es muss sichergestellt werden, dass die Folge monoton und beschränkt ist. Das Verhalten von rekursiven
Folgen hängt oft entscheidend von der relativen Lage von Startwert und Grenzwert ab. Daher bestimmen wir zunächst
mögliche Kandidaten für den Grenzwert als Lösungen der Fixpunktgleichung.
Lösung: positiv, denn xn−1 ≥ 0. Der Term 1 + xn−1 ist auch po-
Wir nehmen an, dass die Folge konvergiert und setzen sitiv. Daher hängt das Vorzeichen von xn − xn−1 nur von
x = lim xn . Indem man in der Rekursionsvorschrift auf der Differenz 5 − xn−1 ab: Ist xn−1 > 5, so ist xn < xn−1 ,
n→∞
beiden Seiten zum Grenzwert übergeht, erhält man die ist xn−1 < 5, so ist xn > xn−1 .
Fixpunktgleichung Wir betrachten nun zwei Fälle. Zunächst sei xn−1 > 5.
√ Dann gilt:
x = 5 + 4x. % √
5 − xn = 5 − 5 + 4xn−1 < 5 − 5 + 20 = 0,
Durch Quadrieren ergibt sich die quadratische Gleichung
x 2 − 4x − 5 = 0 mit den Lösungen −1 und 5. Dies sind und es ist auch xn > 5. Mit den bisherigen Überlegun-
die Kandidaten für den Grenzwert. gen folgt durch Induktion: Für einen Startwert x0 > 5 gilt
Für einen Startwert x0 ≥ 0 erkennt man durch Induktion xn > 5 für alle n ∈ N. Die Folge ist in diesem Fall mono-
leicht, dass xn ≥ 0 für alle n ∈ N gilt. Die Folge ist durch ton fallend. Mit dem Monotoniekriterium folgt, dass sie
0 nach unten beschränkt. Aus dieser Beobachtung folgt auch konvergent ist. Da 5 der einzige verbleibende Kan-
auch, dass −1 als Grenzwert nicht infrage kommt. didat für den Grenzwert ist, gilt lim xn = 5.
Es ist nun am einfachsten, die Folge zunächst auf Mono- n→∞
Nun zum zweiten Fall. Wir nehmen jetzt an xn−1 < 5. Es
tonie zu untersuchen. Es gilt:
folgt, dass
%
xn − xn−1 = 5 + 4xn−1 − xn−1 % √
xn − 5 = 5 + 4xn−1 − 5 < 5 + 20 − 5 = 0,
5 + 4xn−1 − xn−1
2
= %
5 + 4xn−1 + xn−1 also xn < 5. Jetzt dreht sich die Argumentation um: Für
(5 − xn−1 ) (1 + xn−1 ) einen Startwert x0 < 5 gilt xn < 5 für alle n ∈ N, und
= % . die Folge ist monoton wachsend. Nach dem Monotonie-
5 + 4xn−1 + xn−1
kriterium konvergiert die Folge, wieder ist 5 der einzige
Beachten Sie, dass wir hier wieder den Trick angewandt Kandidat für den Grenzwert.
haben, eine Differenz von Wurzeln mit der Summe der Es bleibt noch der Fall x0 = 5, in dem die Folge konstant
Wurzeln zu erweitern und die dritte binomische Formel ist. Insgesamt haben wir gezeigt, dass die Folge für jeden
anzuwenden. Die Summe, die jetzt im Nenner steht, ist Startwert x0 ≥ 0 gegen 5 konvergiert.
Kommentar: Dieses Beispiel zeigt, wie sehr gerade bei rekursiv definierten Folgen die Begriffe der Monotonie, Be-
schränktheit und Konvergenz ineinander verzahnt sind. Ein genaues Verständnis jedes dieser Begriffe ist notwendig, um
eine korrekte Argumentationskette aufzubauen.
Teilfolgen sind auch Folgen aber mit unterschiedlichen Grenzwerten. Insgesamt ist die
Folge (an )∞
n=1 allerdings divergent.
Die Monotonie ist eine starke Voraussetzung. Sobald sie nicht
Um ein solches Verhalten mathematisch beschreiben zu kön-
gegeben ist, können sehr unterschiedliche Situationen auftre-
nen, führen wir einen neuen Begriff ein: die Teilfolge. Man
ten. In der Abbildung 8.17 ist die reelle Folge (an )∞
n=1 mit bezeichnet eine Folge (ank )∞ k=1 als Teilfolge einer Folge
' ( (an )∞ , wenn (n )∞ eine streng monoton steigende Folge
1 n=1 k k=1
an = (−1)n 1 + , n ∈ N, von Indizes in N ist. Wir erzeugen etwa mit nk = 2k aus der
n
Folge (an ) die Teilfolge (ank ) mit den Folgengliedern
abgebildet. Es sieht auf den ersten Blick so aus, als seien zwei
Folgen abgebildet. Beide davon scheinen zu konvergieren, a1 , a2 , a4 , a8 , a16 , a32 , . . .
294 8 Folgen – der Weg ins Unendliche
n
5 10 15 20 25 30
Beschränkte Folgen besitzen mindestens
−1
einen Häufungspunkt
Häufig betrachtet man alle Folgenglieder mit geradem oder Beweis: Der Beweis ist unterteilt in drei Schritte:
ungeradem Index. Mit nk = 2k erhält man etwa im Beispiel
oben die Folge (ank ) mit (i) Zunächst konstruieren wir einen Kandidaten für einen
Häufungspunkt im Falle einer beschränkten Folge (an ) in R.
' (
1 1 Wir definieren für jedes k ∈ N die beschränkte Menge
ank = (−1)2k 1 + =1+ , k ∈ N.
2k 2k Mk = {an | n ≥ k}. Nach dem Vollständigkeitsaxiom besitzt
diese Menge ein Supremum. Wir erhalten damit eine weitere
Mit nk = 2k − 1 erhält man dagegen
Folge (bk )∞
k=1 durch
' (
1 1
ank = (−1)2k−1 1 + = −1 − , k ∈ N. bk = sup Mk .
2k − 1 2k − 1
Da Mk+1 ⊂ Mk für alle k ∈ N gilt, ist die Folge bk monoton
fallend. Wegen
Häufungspunkte sind Grenzwerte von
Teilfolgen bk = sup Mk ≥ inf Mk ≥ inf{an | n ∈ N}
ist die Folge (bk ) auch nach unten beschränkt. Somit folgt mit
In diesem Fall sind beide Teilfolgen konvergent: Die Folge
dem Monotoniekriterium, dass (bk ) konvergiert. Wir setzen
(a2k ) hat den Grenzwert 1, die Folge (a2k−1 ) hat den Grenz-
wert −1. Diese beiden Grenzwerte charakterisieren irgend- b = lim bk .
wie das Verhalten der gesamten Folge (an ) selbst, daher ver- k→∞
dienen sie eine besondere Bezeichnung.
(ii) Es ist zu zeigen, dass b Häufungspunkt von (an ) ist.
Definition von Häufungspunkten Angenommen dies ist nicht der Fall. Dann gibt es ein ε > 0
und eine Zahl N ∈ N, sodass |b − an | > ε für alle n ≥ N
Ist eine Teilfolge (ank )∞
konvergent, so heißt ihr
k=1 gilt. Da die Folge (bk ) gegen b konvergiert, existiert weiter
Grenzwert Häufungspunkt der Folge (an ).
ein K ∈ N mit |b − bk | < 2ε für alle k > K. Also ist mit der
Dreiecksungleichung
Ein Zusammenhang von Konvergenz und Häufungspunkt er-
ε
gibt sich direkt aus der Definition. |an − bk | = |an − b − (bk − b)| ≥ |an − b| − |bk − b| ≥
2
Lemma für alle n ≥ N und k ≥ K. Dies steht aber im Widerspruch
Ist eine Folge (an ) von komplexen Zahlen konvergent zur Definition von bk = sup Mk ; denn, wenn k ≥ N ge-
mit Grenzwert a ∈ C, so ist a der einzige Häufungspunkt, wählt wird, so gibt es ein n ≥ k > N mit der Eigenschaft
und jede Teilfolge von (an ) konvergiert ebenfalls gegen a. |an − bk | = |an − sup Mk | < 2ε (siehe Seite 114).
8.3 Häufungspunkte und Cauchy-Folgen 295
(iii) Nun verallgemeinern wir noch die Aussage für be- Analog führt man den Limes Inferior ein mit
schränkte Folgen (an ) in C.
lim inf an = lim (inf{an ∈ R | n ≥ k}) .
Die beiden reellen Folgen des Real- und des Imaginärteils von n→∞ k→∞
an sind beschränkt, da |Re(an )| ≤ |an | und |Im(an )| ≤ |an | In der Literatur findet sich für diese Häufungspunkte auch
gilt. Nach der Aussage für Folgen in R besitzt somit die manchmal die Notation lim für lim inf und lim für lim sup.
Folge (Re(an )) eine konvergente Teilfolge (Re(ank )) mit
Häufungspunkt lim ank = x ∈ R. Wir wenden die Aussage Beispiel Die Folge (an ) mit
k→∞
für reelle Folgen nun auf die Folge (Im(ank ))∞ an. Dem- π
k=1 an = sin( n), n∈N
nach gibt es einen Häufungspunkt y ∈ R zu dieser Folge, d. h. 2
eine Teilfolge (Im(ankl ))l∈N konvergiert gegen y. Insgesamt
besitzt drei Häufungspunkte, −1, 0, 1. Zugehörige Teilfolgen
folgt, dass lim ankl = x + iy ∈ C ein Häufungspunkt der
l→∞ sind etwa (a4n+3 ), (a2n ) und a4n+1 . Damit erhalten wir
ursprünglichen Folge (an ) ist.
Dies ist ein typischer Satz, bei dem man zunächst ohne An- sich jedoch als technisch schwierig. Versuchen Sie ein-
fangsidee für den Beweis steht, also wie der Ochs vor’m mal, eine solche Konstruktion zu realisieren.
Berg. Es bietet sich an, Teilaussagen zu identifizieren, die Leichter ist es, eine geeignete Folge zu konstruieren: In-
getrennt bzw. nacheinander bewiesen werden können. dem wir die Suprema bk der mit wachsendem k kleiner
Wir beginnen gewissermaßen hinten: Der Satz macht Aus- werdenden Mengen
sagen über reelle und komplexe Folgen. Kann man die
Aussage für komplexe Folgen aus der für reelle Folgen Mk = {an | n ≥ k}
ableiten? Was offensichtlich nicht zum Ziel führt, ist die
Aussage für Real- und Imaginärteil getrennt anzuwenden. betrachten, erhalten wir von selbst eine monoton fallende
So erhalte ich zwar eine Teilfolge mit konvergentem Re- beschränkte Folge. Zu zeigen ist nun noch, dass der Grenz-
alteil und eine mit konvergentem Imaginärteil, aber diese wert b dieser Folge auch Häufungspunkt von (an ) ist.
Folgen müssen keine gemeinsamen Glieder besitzen. Aber Diese letzte Aussage ist ideal für einen Widerspruchsbe-
eine kleine Variante funktioniert: Haben wir eine Teil- weis. Sie ist im zweiten Teil des Beweises dargestellt.
folge, deren Realteile konvergieren, so bleibt diese Eigen- Wir nehmen an, dass b kein Häufungspunkt von (an ) ist.
schaft bei jeder Teilfolge erhalten. Man wählt also eine Hieraus folgt, dass sich die Folgenglieder an sich b nicht
Teilfolge dieser Teilfolge, bei der auch die Imaginärteile beliebig dicht nähern können. Andererseits müssen sie
konvergieren. sich aber nach der Definition des Supremums den (bk )
Damit bleibt die Aussage für eine reelle Folge (an ) übrig, beliebig dicht annähern. Hieraus ergibt sich durch eine
der dritte Teil des Beweises. Da wir außer der Beschränkt- Standardanwendung der Dreiecksungleichung der Wider-
heit keinerlei Informationen über die Folge besitzen, ist spruch.
nur die Anwendung eines allgemeinen Konvergenzkrite- Bei der Formulierung des Satzes von Bolzano-Weierstraß
riums möglich, also des Monotoniekriteriums. Um dieses ist es notwendig, sich auf reelle oder komplexe Zahlen zu
einsetzen zu können, benötigen wir aber zusätzlich Mo- beziehen. So besitzt jede monotone und beschränkte Folge
notonie. Ziel muss es also sein, aus unserer beschränkten aus Q zwar einen Häufungspunkt, denn Q ist in R enthal-
Folge (an ) eine monotone beschränkte Folge zu konstru- ten. Dieser Häufungspunkt muss jedoch nicht selbst eine
ieren. rationale Zahl sein. Dazu fehlt Q die Eigenschaft, voll-
Denkbar ist, aus (an ) selbst eine monotone Teilfolge aus- ständig zu sein. Im Zusammenhang mit Cauchy-Folgen
zuwählen. Dann wären wir sofort am Ziel. Dies erweist werden wir diesen Aspekt weiter vertiefen.
√
Beispiel Zu einer Zahl x ∈ R>0 definieren wir die rekur- Es gilt also für alle n ≥ 1, dass an ≥ x ist. Zweimaliges
sive Folge (an ) mit Anwenden dieser Abschätzung führt zu
' ( ' ( ' (
1 x 1 x 1 x
an+1 = an + an+1 = an + ≤ an + √
2 an 2 an 2 x
1 √
und starten mit a0 > 0. Die zugehörige Fixpunktgleichung = (an + x) ≤ an .
2
1 x Die Folge (an ) ist also zumindest ab Index n = 1 nach un-
√
a= a+ , ten durch x beschränkt, und sie fällt monoton (siehe auch
2 a
√ Abbildung 8.18). Damit ist die Folge konvergent.
hat nur die eine positive Lösung a = x. Sie liefert daher,
√
dass der Grenzwert der Folge x sein muss, falls die Folge Kommentar: Diese Methode zur approximativen Berech-
konvergiert. √
nung von x wird Heron-Verfahren genannt. Da sie schon
Mithilfe des Monotoniekriteriums (siehe Seite 292) zeigen den Bewohnern des antiken Babylon bekannt war, spricht
wir Konvergenz. Zunächst beobachten wir, dass induktiv mit man auch vom Babylonischen Wurzelziehen.
a0 > 0 auch an > 0 für alle n ∈ N folgt. Eine Anwendung
der binomischen Formel liefert Schauen wir uns die Folge (an ) aus dem Beispiel etwa für
√ √ x = 2 noch einmal genauer an. Ist der Startwert a0 ∈ Q,
0 ≤ (an − x)2 = an2 − 2an x + x.
so sind offensichtlich√alle Folgenglieder rationale Zahlen.
√ Der Grenzwert a = 2 ist es aber nicht, d. h. in Q ist die
Diese Ungleichung lösen wir nach x auf:
' ( Folge divergent, ihr Grenzwert existiert nicht. Andererseits
√ 1 x verhalten sich die Folgenglieder wie bei einer konvergenten
x≤ an + = an+1 .
2 an Folge.
8.3 Häufungspunkte und Cauchy-Folgen 297
y
y=t es folgt |xm − xm−1 | ≤ q |xm−1 − xm−2 | ≤ · · · ≤
q m−n−1 |xn+1 − xn | . Mit der Dreiecksungleichung, der geo-
metrischen Summe und l = m − j − n − 1 erhält man für
m > n die Ungleichung
y = 21 t + xt
!
m−n−1
|xm − xn | ≤ |xm−j − xm−j −1 |
j =0
!
m−n−1
≤ q l |xn+1 − xn |
a0 √ a2 a1 t
x l=0
Abbildung 8.18 Die Fixpunktiteration für das Heron-Verfahren. Ab dem Index 1 − q m−n
1 ist die Folge monoton fallend und nach unten beschränkt. = |xn+1 − xn |
1−q
|xn+1 − xn | 9
Eine Abschwächung des Konvergenzbegriffs – ≤ = |xn+1 − xn | .
1−q 7
die Cauchy-Folge
Es folgt |xm − xn | ≤ (9/21) q n ≤ ε für alle hinreichend
Der Begriff konvergent ist also nicht adäquat, um dieses Ver- großen Zahlen n, m da die geometrische Folge (q n ) eine
halten von (an ) als Folge in den rationalen Zahlen zu be- Nullfolge ist. Wir haben so die Cauchy-Folgen-Eigenschaft
schreiben. Wir benötigen eine Beschreibung des Verhaltens, gezeigt.
die ohne die Existenz eines Grenzwerts auskommt.
Kommentar: Den zweiten Schritt in diesem Beweis sollte
Definition einer Cauchy-Folge man sich genauer ansehen. Er beinhaltet einen Schluss, dem
Wir nennen eine Folge (an ) von Zahlen eine Cauchy- man in allgemeinen vollständigen Räumen häufiger begeg-
Folge, wenn es zu jedem Wert ε > 0 eine Zahl N ∈ N net, so etwa beim Beweis des Banach’schen Fixpunktsatzes
gibt mit der Eigenschaft, dass für alle Indizes m, n > N (siehe Seite 801). Es wird aus einer Kontraktionseigenschaft,
die Abschätzung |am − an | ≤ ε gilt. nämlich |xn+1 − xn | ≤ q|xn − xn−1 | mit q ∈ (0, 1), die
Cauchy-Folgen-Bedingung durch
Diese Definition bedeutet, dass mit hinreichend großen In- qn
|xm − xn | ≤
dizes die Differenz von Folgengliedern beliebig klein wird. 1−q
Cauchy-Folgen sind benannt nach dem französischen Ma-
mittels des Grenzwerts der geometrischen Summe bewiesen.
thematiker Augustin Louis Cauchy (1789–1857), der mit an-
deren den Weg zur modernen Analysis bereitet hat.
Beispiel Als Beispiel einer Cauchy-Folge wählen wir die Cauchy-Folge und Konvergenz
rekursiv definierte Folge (xn ) mit xn+1 = (1/3) (1−xn2 ) und
x0 = 0. Induktiv sieht man, dass (xn ) im Intervall (0, 1/3) be- Wir hatten angedeutet, dass der Begriff der Cauchy-Folge
schränkt ist. In zwei Schritten zeigen wir, dass es sich um eine schwächer ist als der Konvergenzbegriff. Allgemein gilt, dass
Cauchy-Folge handelt. Zunächst gilt mit der Rekursionsfor- jede konvergente Folgen auch Cauchy-Folge ist; denn mit
mel und der Beschränkung |xn +xn−1 | ≤ |xn |+|xn−1 | ≤ 2/3 einem Grenzwert x und der Dreiecksungleichung können wir
die Abschätzung abschätzen:
) )
)1 1 )
|xn+1 − xn | = )) (1 − xn2 ) − (1 − xn−1 2
))) |xm − xn | = |xm − x + x − xn | ≤ |xm − x| + |xn − x| .
3 3
1 )) 2 )
) Wegen der Konvergenz der Folge (xn ) streben die beiden
= )xn−1 − xn2 ) Terme auf der rechten Seite gegen 0 für n, m → ∞. Also ist
3
1 die Folge eine Cauchy-Folge.
= |xn−1 + xn | |xn−1 − xn |
3 Interessant ist die Umkehrung dieser Aussage. In den ratio-
2 nalen Zahlen kann diese Umkehrung nicht gelten, wie wir es
≤ |xn − xn−1 | . etwa am Beispiel des Heron-Verfahrens auf Seite 296 gese-
9
hen haben. Aber in R oder in C lässt sich, letztendlich wegen
Diese Abschätzung gilt für jede Zahl n ∈ N. Setzen wir des Vollständigkeitsaxioms, die Aussage umdrehen.
q = 2/9 und nutzen die Ungleichung n-mal, so folgt
|xn+1 − xn | ≤ q n |x1 − x0 | = (1/3) q n .
Cauchy-Kriterium
Der zweite Schritt: Für Zahlen m, n ∈ N mit m > n lässt Jede Cauchy-Folge in R bzw. C ist konvergent.
sich diese Abschätzung (m − n − 1)-mal anwenden, und
298 8 Folgen – der Weg ins Unendliche
(−2)n Einschließungskriterium in R (erfordert Anordnung)
Es gibt Folgen (an ) und (bn ) mit
Beweis: Der Satz lässt sich mit dem Satz von Bolzano- ?
Weierstraß (siehe Seite 299) zeigen. Falls (an ) eine Cauchy-
Warum gilt das Monotoniekriterium nicht für Folgen in Q
Folge ist, können wir zu ε = 1 ein N ∈ N finden mit
oder in C?
|an | = |an − aN + aN | ≤ |an − aN | + |aN | ≤ 1 + |aN |
für alle n ≥ N. Also ist die Cauchy-Folge beschränkt durch
max{1+|aN |, |a1 |, |a2 |, . . . , |aN −1 |}. Der Satz von Bolzano-
Weierstraß besagt, dass (an ) einen Häufungspunkt a hat. Die Vollständigkeit der reellen Zahlen muss man bei der
Wenn wir mit (anj )∞j =1 eine Teilfolge bezeichnen, die gegen
Definition der reellen Zahlen durch ein Axiom verankern.
a konvergiert, ergibt sich aus |an −a| ≤ |a−anj |+|anj −an |, Verschiedene Varianten eines Vollständigkeitsaxioms wer-
dass a Grenzwert der gesamten Folge (an ) ist. den in der Literatur diskutiert, zum Beispiel Dedekind’sche
Schnitte, oder, wie es in der Schule üblich ist, die Inter-
Beachten Sie, dass genauso wie das Monotoniekriterium, das vallschachtelungen (siehe Hintergrundbox auf Seite 118).
Cauchy-Kriterium ohne die Kenntnis des Grenzwerts aus- Wir haben in diesem Werk die Existenz des Supremums
kommt. Die Aussage des Cauchy-Kriteriums gilt nach unse- als Vollständigkeitsaxiom verwendet. Genauso könnten man
rem ersten Beispiel (siehe Seite 297) nicht in Q. Dies ist ein aber auch das Cauchy-Kriterium oder den Satz von Bolzano-
substantieller Unterschied zwischen diesen beiden Mengen Weierstraß für das Vollständigkeitsaxiom zugrunde legen.
von Zahlen. Eine Menge von Zahlen, Vektoren oder auch an- Deren Formulierung würde aber gerade die jetzt erarbeiteten
deren Elementen heißt vollständig, wenn jede Cauchy-Folge Kenntnisse von Folgen und von Konvergenz voraussetzten.
konvergiert.
Zusammenfassung 299
Die generelle Tragweite der Cauchy-Folgen wird erst spä- Darstellung und verweisen auf das Kapitel 19 über metrische
ter deutlich. Mithilfe der Cauchy-Folgen lassen sich aus Räume.
den rationalen Zahlen die reellen Zahlen konstruieren. An-
schaulich nehmen wir einfach alle „Grenzwerte“, die wir In den Aufgaben zu diesem Kapitel ergeben sich noch wei-
durch Cauchy-Folgen rationaler Zahlen erreichen können, tere Beispiele zu den Konvergenzkriterien. Rekapitulieren
zur Menge Q hinzu. Um dies mathematisch sauber auszu- wir noch einmal die verschiedene Eigenschaften von Folgen
führen sind entsprechende Äquivalenzklassen zu definieren und die Beziehungen zwischen ihnen. Zusammengefasst ist
(siehe Seite 53). Das Vorgehen liefert letztendlich ein allge- das bisher errichtete Gebäude der Folgen und ihrer Eigen-
meines Konzept zur Vervollständigung von Räumen. Daher schaften in der Übersicht auf Seite 298.
verzichten wir an dieser Stelle zunächst auf eine ausführliche
Zusammenfassung
Bei einer Folge sind abzählbar unendlich viele Folgenglieder Ist eine Folge konvergent, so ist ihr Grenzwert eindeutig be-
in eine Reihenfolge gebracht. stimmt. Eine konvergente Folge muss automatisch auch be-
schränkt sein.
Definition einer Folge Um nicht immer die Definition der Konvergenz bemühen
Eine Folge ist eine Abbildung der natürlichen Zahlen in zu müssen, gibt es Konvergenzkriterien. Beim Majoranten-
eine Menge M, die jeder natürlichen Zahl n ∈ N ein kriterium wird die Differenz zwischen Folgengliedern und
Element xn ∈ M zuordnet. Grenzwert durch die Glieder einer Nullfolge abgeschätzt.
Grenzwerte können auch direkt bestimmt werden, indem man
Von besonderem Interesse sind zunächst Zahlenfolgen, bei eine Folge als Summe, Produkt oder Quotient von Folgen
denen M ⊆ C ist. Später im Buch werden zum Beispiel auch schreibt, deren Grenzwerte bekannt sind.
Funktionenfolgen eine wichtige Rolle spielen. Ohne den Grenzwert zu kennen, kann bei bestimmten Folgen
Elementare Eigenschaften von Zahlenfolgen sind die Be- mit dem Monotoniekriterium auf die Konvergenz geschlos-
schränktheit und die Monotonie. Bei einer beschränkten sen werden.
Zahlenfolge gibt es einen Kreis in der komplexen Zahlen-
ebene, in dem alle Glieder der Folge liegen. Der Betrag der Monotoniekriterium
Folgenglieder kann also nicht beliebig groß werden, sondern Jede beschränkte und monotone Folge reeller Zahlen ist
übersteigt eine bestimmte endliche Größe niemals. konvergent.
Reelle Zahlenfolgen können die Eigenschaft besitzen, mono-
ton zu sein. Bei einer monoton wachsenden Folge werden die Ein weiteres wichtiges Werkzeug im Umgang mit Folgen
Glieder mit zunehmendem Index größer, bei einer monoton sind Teilfolgen. Ist eine Teilfolge konvergent, so heißt ihr
fallenden Folge werden sie mit zunehmendem Index kleiner. Grenzwert Häufungspunkt der ursprünglichen Folge. Aus
dem Monotoniekriterium erhält man in diesem Zusammen-
Die interessantesten Folgen sind solche, die konvergieren,
hang den Satz von Bolzano-Weierstraß.
also einen Grenzwert besitzen. Solche Folgen werden wir
in weiteren Kapiteln verwenden, um unterschiedlichste Be-
griffe zu definieren, etwa die Stetigkeit von Funktionen, die Satz von Bolzano-Weierstraß
Ableitung für differenzierbare oder das Integral für integrier- Jede beschränkte Folge reeller oder komplexer Zahlen
bare Funktionen. besitzt mindestens einen Häufungspunkt.
Definition des Grenzwerts einer Folge Dieser Satz ist äquivalent zum Vollständigkeitsaxiom für die
Eine Zahl x ∈ C heißt Grenzwert einer Folge (xn )∞ n=1
reellen Zahlen. Er dient in theoretischen Überlegungen oft
in C, wenn es zu jeder Zahl ε > 0 eine natürliche Zahl zur Herleitung von nicht-konstruktiven Existenzaussagen:
N ∈ N gibt, sodass Man erhält die Existenz eines Häufungspunkts und kann ihn
für weitere Überlegungen verwenden, ohne ihn explizit zu
|xn − x| < ε für alle n ≥ N kennen.
gilt. Eine Folge (xn ) in C, die einen Grenzwert hat, heißt Später in der Mathematik spielen auch nicht-vollständige
konvergent, andernfalls heißt die Folge divergent. Räume eine große Rolle. √ Zum Beispiel hat eine Folge ra-
tionaler Zahlen, die gegen 2 konvergiert, keinen Grenzwert
300 8 Folgen – der Weg ins Unendliche
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
Verständnisfragen Grenzwerts aus Q aus, dass die Folge mindestens einen Häu-
fungspunkt in Q besitzt?
8.1 • Gegeben sei die Folge (xn )∞mit xn = (n−2)/
n=2
(n + 1) für n ≥ 2. Bestimmen Sie eine Zahl N ∈ N sodass
|xn − 1| ≤ ε für alle n ≥ N gilt, wenn Rechenaufgaben
8.6 • Untersuchen Sie die Folge (xn ) auf Monotonie
1 1
(a) ε= , (b) ε= und Beschränktheit. Dabei ist
10 100
ist. 1 − n + n2 1 − n + n2
(a) xn = , (b) xn = ,
n+1 n(n + 1)
8.2 • Stellen Sie eine Vermutung auf für eine explizite .
1 n+1
Darstellung der rekursiv gegebenen Folge (an ) mit (c) xn = , (d) xn = 1 + .
1 + (−2)n n
an+1 = 2an + 3an−1 und a1 = 1, a2 = 3,
8.7 • Untersuchen Sie die Folgen (an ), (bn ), (cn ) und
und zeigen Sie diese mit vollständiger Induktion. (dn ) mit den unten angegebenen Gliedern auf Konvergenz.
8.3 •• Zeigen Sie, dass für zwei positive Zahlen x, y > 0
gilt: n2 n3 − 2
% an = , bn = ,
lim n x n + y n = max{x, y} . n3 − 2 n2
n→∞
cn = n − 1, dn = bn − cn .
8.4 • Welche der folgenden Aussagen sind richtig? Be-
gründen Sie Ihre Antwort.
(a) Eine Folge konvergiert, wenn Sie monoton und be- 8.8 • Berechnen Sie jeweils den Grenzwert der Folge
schränkt ist. (xn ), falls dieser existiert:
(b) Eine konvergente Folge ist monoton und beschränkt.
(c) Wenn eine Folge nicht monoton ist, kann sie nicht kon- 1 − n + n2
(a) xn =
vergieren. n(n + 1)
(d) Wenn eine Folge nicht beschränkt ist, kann sie nicht kon- n3 − 1 n3 (n − 2)
(b) xn = 2 −
vergieren. n +3 n2 + 1
(e) Wenn es eine Lösung zur Fixpunktgleichung einer re- %
(c) xn = n2 + n − n
kursiv definierten Folge gibt, so konvergiert die Folge % %
gegen diesen Wert. (d) xn = 4n2 + n + 2 − 4n2 + 1
8.5 •• Eine Cauchy-Folge aus Q braucht keinen Grenz- 3n+1 + 2n
(e) xn =
wert aus Q zu besitzen. Reicht es für die Existenz eines 3n + 2
Aufgaben 301
8.9 •• Bestimmen Sie mit dem Einschließungskriterium 8.16 •• Zeigen Sie mit der Definition des Grenzwerts
Grenzwerte zu den Folgen (an ) und (bn ), die durch die folgenden Rechenregeln:
. .
√ (a) Ist (xn ) eine konvergente Folge aus C, und ist x =
n 3n + 2 1
an = , bn = + n − n, n ∈ N , lim xn , so gilt für alle λ ∈ C die Gleichung
n+1 2n n→∞
lim (λxn ) = λx.
gegeben sind. n→∞
(b) Sind (xn ), (yn ) konvergente Folgen aus C, und sind
8.10 ••• Untersuchen Sie die Folgen (an ), (bn ), (cn ) bzw. x = lim xn , y = lim yn , so gilt lim (xn yn ) = xy.
n→∞ n→∞ n→∞
(dn ) mit den unten angegebenen Gliedern auf Konvergenz
und bestimmen Sie gegebenenfalls ihre Grenzwerte: 8.17 •• Gegeben sei eine konvergente Folge (an ) aus
' ( C und eine bijektive Abbildung g : N → N. Setze bk =
1 n ag(k) für k ∈ N. Man nennt die so definierte Folge (bk ) eine
an = 1 − 2 (Hinweis: Bernoulli-Ungleichung),
n Umordnung der Folge (an ).
(n + i)(1 + in)
bn = 2n/2 , Zeigen Sie, dass die Folge (bk ) konvergiert mit
(1 + i)n
1+q n lim bk = lim an .
n→∞
cn = , mit q > 0, k→∞
1 + q n + (−q)n
(iq)n + in 8.18 ••• Im Beispiel auf Seite 278 ist die Folge (an ) der
dn = , mit q ∈ C.
2n + i Fibonacci-Zahlen definiert. Zeigen Sie, dass für die Folge
(bn ) der Verhältnisse
8.11 •• Zu a > 0 ist die rekursiv definierte Folge (xn ) bn =
an+1
, n ∈ N,
mit an
xn+1 = 2xn − axn2 aufeinanderfolgender Fibonacci-Zahlen gilt:
1 √
1
und x0 ∈ (0, gegeben. Überlegen Sie sich zunächst, dass
a)
lim bn = 1+ 5 .
xn ≤ a1 gilt für alle n ∈ N0 und damit induktiv auch xn > 0 n→∞ 2
folgt. Zeigen Sie dann, dass diese Folge konvergiert und be- Dieser Grenzwert wird Zahl des goldenen Schnitts genannt.
rechnen Sie ihren Grenzwert.
Gehen Sie wie folgt vor:
8.12 •• Für welche Startwerte a0 ∈ R konvergiert die (a) Leiten Sie eine Rekursionsformel für die (bn ) her.
rekursiv definierte Folge (an ) mit (b) Zeigen Sie, dass die Teilfolgen (b2n ) und (b2n−1 ) mono-
1 2 ton und beschränkt sind.
an+1 = an + 3 , n ∈ N ? (c) Weisen Sie nach, dass der goldene Schnitt der Grenzwert
4
der Folge (bn ) ist.
8.13 • Bestimmen Sie für die Folgen (an ) mit den 8.19 ••• Beweisen Sie mit der Definition des Grenzwerts
unten angegebenen Gliedern jeweils supn∈N an , inf n∈N an , folgende Aussage: Wenn (an ) eine Nullfolge ist, so ist auch
Limes Superior und Limes Inferior, falls diese Zahlen exis- die Folge (bn ) mit
tieren.
1!
n
(a) an = 1 + (−1) + n n
, n∈N−1/2 bn = aj , n ∈ N,
n
⎧ k−1 j =1
⎪
⎪ , n = 3k,
⎨ k eine Nullfolge.
(b) an = k+1 , n = 3k − 1, k ∈ N
1
⎪
⎪
⎩ 1 8.20 •• Zeigen Sie: Ist (an ) eine beschränkte Folge aus
− k2 , n = 3k − 2,
R, so ist lim sup an gleich dem größten Häufungspunkt von
n2 + 1 n→∞
(c) an = , n∈N (an ).
n+1
8.21 •• Gegeben ist eine Folge von abgeschlossenen In-
tervallen (In ) mit
Beweisaufgaben
I1 ⊇ I2 ⊇ · · · ⊇ In ⊇ In+1 ⊇ · · · .
8.14 • Ist (an ) eine konvergente Zahlenfolge aus C mit
a = lim an , so gilt auch |a| = lim |an |. Setze In = [an , bn ]. Es gelte |In | = bn −an → 0 für n → ∞.
n→∞ n→∞ Zeigen Sie: Es gibt genau eine Zahl a ∈ R mit a ∈ In für
8.15 • Zeigen Sie für p ∈ N und |q| < 1: alle n ∈ N.
Man nennt eine solche Konstruktion eine Intervallschach-
lim np q n = 0 .
n→∞ telung.
302 8 Folgen – der Weg ins Unendliche
Im Kapitel 2 haben wir bereits den Begriff der Abbildung kennen- Den Graphen einer Funktion f : D → W , also die Menge
gelernt, eines der ganz wesentlichen Konzepte der abstrakten
Mathematik. In diesem Kapitel werden wir uns mit ganz spe- Graph(f ) = {(x, f (x)) | x ∈ D} ,
ziellen Abbildungen, den Funktionen, beschäftigen, bei denen können wir im Spezialfall D, W ⊆ R zeichnen, indem wir
Zahlen wieder Zahlen zugeordnet werden. in einem Koordinatensystem die eine Achse mit den x- und
Funktionen bilden eine eigenständige Menge mathematischer die andere Achse mit den f (x)-Werten identifizieren. Sind D
Objekte mit spezifischen Eigenschaften, die für sich genommen und W allgemeine Teilmengen der komplexen Zahlenebene,
schon interessant sind. Man kann mit Funktionen rechnen, sie so handelt es sich in der Anschauung jedoch um ein 4-dimen-
transformieren und miteinander zu neuen Funktionen verknüp- sionales Objekt, das man nicht mehr so einfach zeichnen
fen. Später im Buch werden wir mit der Differenziation und kann. Daher ist es oft hilfreich, auch das Bild der Funktion f ,
Integration noch weitere Operationen kennenlernen, die Funk-
f (D) = {y ∈ W | es gibt x ∈ D mit f (x) = y},
tionen auf andere abbilden. Es entstehen so Strukturen, die wir
schon an anderer Stelle kennengelernt haben. Vor allem von zu betrachten.
Funktionen gebildete Vektorräume spielen eine wichtige Rolle.
Beispiel
Funktionen treten häufig aber als Teile komplexerer mathema- Die Abbildung f : R → R mit f (x) = x 2 ist eine sehr
tischer Probleme auf. Häufige Fragestellungen sind z. B.: einfache Funktion. Hier handelt es sich um eine Funktion
Hat eine Gleichung, in der Funktionen auftauchen, eine mit reellem Definitions- und Wertebereich, und wir kön-
Lösung? nen den Graphen in der Ebene zeichnen. In der Abbildung
Kann ich eine Stelle finden, an der ein Funktionswert optimal 9.1 ist er zu sehen, man nennt ihn Normalparabel.
wird, z. B. maximal oder minimal?
f (x)
Auf diese beiden Fragen werden wir im Verlauf dieses Kapitels
3
eingehen und sie zumindest teilweise beantworten.
Der zentrale Begriff hierbei wird die Stetigkeit sein. Anschaulich 2
gesprochen bedeutet er, dass ein funktionaler Zusammenhang
1
stabil ist: Kleine Änderungen im Argument bewirken auch nur
kleine Änderungen im Funktionswert. Für eine wasserdichte
mathematische Definition werden wir aber den Begriff des −2 −1 0 1 2 x
Grenzwerts aus dem vorherigen Kapitel bemühen.
Abbildung 9.1 Die Normalparabel ist der Graph der Funktion f : R → R,
Stetige Funktionen haben deswegen eine solch herausragende f (x) = x 2 .
Bedeutung, weil man für sie unter geeigneten Voraussetzungen
die beiden Fragen oben bejahen kann. Sie bilden damit das Auch g : [0, 2π] → C mit g(x) = cos(x) + i sin(x) ist
Fundament für alle weiteren Überlegungen in der Analysis. eine Funktion. Das Bild der Funktion ist eine Teilmenge
der komplexen Zahlenebene und in der Abbildung 9.2 zu
sehen. Es handelt sich gerade um den Einheitskreis. Der
Graph der Funktion ist in der Anschauung ein dreidimen-
9.1 Grundlegendes zu sionales Objekt, da der Definitionsbereich im Reellen, der
Wertebereich im Komplexen liegt. In Abbildung 9.3 ist
Funktionen der Graph als blaue Kurve dargestellt. Das Bild von g ist
wieder als roter Kreis dargestellt.
Im Kapitel 2 haben wir Abbildungen f : D → W kennen-
gelernt, die jedem Element der Definitionsmenge D ein Ele- Im g(x)
ment der Wertemenge W zuordnen. In Kapitel 4 wurden kon-
kreter Funktionen einer Veränderlichen eingeführt als Ab- i
g(π/4)
bildungen zwischen Teilmengen der Menge C der komplexen
Zahlen.
Wieso stellt man für Funktionen gerade Teilmengen von R
1 1 Re g(x)
oder C heraus? Zum einen handelt es sich um Zahlenkörper.
Dies bedeutet, dass wir einen reichhaltigen Vorrat an Rechen-
regeln haben, die wir einsetzen können. Zum anderen sind
g(7π/4)
diese Mengen vollständig. Im Abschnitt 9.5 werden wir ganz
genau untersuchen, warum diese Eigenschaft der Körper R −i
und C es uns erlaubt, wichtige Aussagen über Funktionen zu Abbildung 9.2 Das Bild der Funktion g : [0, 2π ] → C mit g(x) = cos(x) +
treffen. i sin(x) ist der Einheitskreis. Der Graph ist in Abbildung 9.3 dargestellt.
9.1 Grundlegendes zu Funktionen 305
x
f (x)
2
Im g(x)
0 1 2 x
g(π/4) Abbildung 9.5 Die Abbildungsvorschrift dieser Funktion definiert man am
besten abschnittsweise.
g(7π/4)
Re g(x)
Problemanalyse und Strategie: Bei Funktionen im Komplexen ist es oft nicht möglich, den Graphen angemessen
auf ein Blatt Papier, das ja von Natur aus zweidimensional ist, zu zeichnen. Bei einer Funktion von C nach C geht
die Abbildung von der komplexen Zahlenebene in die komplexe Zahlenebene, der Graph ist in der Anschauung ein
vierdimensionales Objekt! Wir werden unterschiedliche Formen der Darstellung ausprobieren und nebeneinander stellen.
Graph von g
Eine letzte Möglichkeit der Visualisierung lässt sich aus
x Re g(x)
speziellen Eigenschaften der Funktion h gewinnen. Es
ist eine sogenannte Möbius-Transformation (siehe Ab-
schnitt 4.6), bei der Kreise und Geraden in der komplexen
Im g(x) Zahlenebene wieder auf Kreise bzw. Geraden abgebildet
Bild von g werden. Diese Eigenschaft machen wir uns zu Nutze: In
der linken Abbildung sind einige Kreise und Geraden ein-
gezeichnet, rechts ihre Bilder unter h.
Eine zweite Möglichkeit ist, den Graphen in ein dreidi-
mensionales Koordinatensystem zu zeichnen, mit einer h
Im z
Achse für die Definitionsmenge und je einer Achse für Im h(z)
Real- und Imaginärteil der Wertemenge. Diese Möglich- 2i
keit wird in der Abbildung oben durch die grüne Kurve i 2i
demonstriert. i
−1 1 2 3 Re z
Bei der Funktion h ist es nicht mehr möglich, den Graphen −i
in einer einzigen Abbildung darzustellen. Eine häufig ver- −1 1 Re h(z)
wendete Methode ist, jeweils den Graphen des Realteils
und einer Konstanten c ∈ R erhalten wir eine neue Funktion von f genau um c nach links ergibt. Diese einfache Trans-
f˜ : D̃ → R durch formation von Funktionen nennt man Translation. Analog
verschiebt sich der Graph einer Funktion um einen Wert c
f˜(x) = f (x + c) . nach oben bzw. unten, wenn die Funktion h : D → R mit
h(x) = f (x) + c betrachtet wird.
Ausführlich bedeutet diese Schreibweise, dass wir den Wert
der Funktion f˜ an einer Stelle x bekommen, wenn wir die Auch Streckungen und Spiegelungen der Graphen lassen sich
Funktion f an der Stelle x + c auswerten. Der Defini- durch Multiplikation des Arguments oder der Funktion mit
tionsbereich der neuen Funktion f˜ muss natürlich auch ent- einem Faktor erreichen. Es ergibt sich etwa durch h(x) =
sprechend verschoben werden, d. h., für x ∈ D̃ muss gelten f (−x) als Graph von h die Spiegelung des Graphen von
x + c ∈ D. Stellen wir die Graphen dieser beiden Funk- f an der vertikalen Achse bzw. durch h̃(x) = −f (x) eine
tionen nebeneinander (siehe Abb. 9.6), so sehen wir, dass Funktion h̃, deren Graph die Spiegelung des Schaubilds von
sich der Graph von f˜ aus einer Verschiebung des Graphen f an der horizontalen Achse ist.
9.1 Grundlegendes zu Funktionen 307
f (x)
der Verkettung ergibt, in natürlicher Art und Weise fortset-
zen (siehe Abbildung 9.8). Das ist ein Aspekt, den wir später
genauer analysieren werden.
c
Analog folgt:
f (x) + c
1 1 1
f (x + c) (g◦f )(x) = g(f (x)) = = = (1−x) ,
c 1 + f (x) 1+x
1 + 1−x 2
g◦f 2
f (x) 1
f (−x)
1 3 x
f ◦g
Abbildung 9.7 Spiegelungen des Graphen einer Funktion f (schwarz) mit Die oben angesprochenen Translationen lassen sich etwa mit
h(x) = f (−x) (blau) und h̃(x) = −f (x) (rot). g(x) = x + c und den Verkettungen h = f ◦ g bzw. h̃ =
g ◦ f angeben. Oder die Spiegelungen an den Achsen sind
gegeben durch die beiden Kompositionen mit der Funktion
All diese Transformationen sind gut zu veranschaulichende g mit g(x) = −x.
spezielle Beispiele von Verkettungen von Abbildungen, wie
sie in Kapitel 2 eingeführt wurden. Wir sprechen auch von ?
Komposition oder Hintereinanderausführung. Auch bei Drücken Sie die Funktion h : R → R mit h(x) = 2(x − 2)3
Funktionen ist die Notation f ◦ g für die Hintereinanderaus- als Verkettung der Funktion f : R → R mit f (x) = x 3 mit
führung von f und g üblich. einer weiteren Funktion aus. Welche Transformationen des
Graphen von f werden so beschrieben?
Beispiel Wir betrachten die beiden Funktionen f, g mit
f (x) = 1+x 1
1−x und g(x) = 1+x für x = 1 bzw. x = −1. Dann
ergibt sich: Neben den Verkettungen von Funktionen können wir auch
Kombinationen nutzen, um Funktionen zu verknüpfen. Von
1
1 + g(x) 1+ 1+x 2 Kombinationen sprechen wir immer dann, wenn aus zwei
(f ◦ g) (x) = f (g(x)) = = =1+ , Funktionen f, g durch die üblichen Rechenoperationen in
1 − g(x) 1− 1
1+x
x
R neue Funktionen gebildet werden. So ist naheliegender-
wobei noch der Definitionsbereich festzulegen ist. Da g nur weise die Funktion f + g gegeben durch die Auswertung
für x = −1 definiert ist, müssen wir diese Stelle ausneh- (f + g)(x) = f (x) + g(x). Entsprechend definieren wir die
men. Weiter muss aber auch der Wert x = 0 ausgeschlossen Funktionen f − g, f g und fg punktweise, d. h. an jeder Stelle
werden, da g(0) = 1 die kritische Stelle für die Funktion f x ∈ D (siehe Übersicht auf Seite 308).
ergibt und somit g(0) nicht als Argument von f verwendet
werden kann. Insgesamt ist also eine Einschränkung des De- Beispiel Mit den Funktionen f und g mit f (x) = x1 und
finitionsbereichs von g auf die Menge D = R\{−1, 0} erfor- 1
g(x) = x−1 erhalten wir für x = 0, 1 etwa die Kombinatio-
derlich. Beachten Sie, dass wir den resultierenden Ausdruck nen
für (f ◦ g)(x) ohne Weiteres an der Stelle x = −1 angeben 1 1 1
(f − g)(x) = − =
können. Dies bedeutet, wir können die Funktion, die sich aus x x−1 x − x2
308 9 Funktionen und Stetigkeit – ε trifft auf δ
Polynome lassen sich um beliebige Stellen nommen als Polynomfunktionen bezeichnen sollte. Aller-
entwickeln dings ist diese Bezeichnung unüblich, man spricht stattdessen
ebenfalls von Polynomen. Aus dem Kontext ist hierbei fast
Im Kapitel 4 hatten wir Polynome kennengelernt. Durch Ein- immer klar, ob ein Polynom im algebraischen Sinne oder eine
setzen von komplexen Zahlen für die Unbestimmte erhalten Polynomfunktion gemeint ist, sodass es nicht zu Verwechs-
wir eine wichtige Klasse von Funktionen, die man streng ge- lungen kommen kann.
310 9 Funktionen und Stetigkeit – ε trifft auf δ
Unter einem Polynom im Sinne der Analysis verstehen wir Für eine konkrete Rechnung muss man den Ausdruck für
also eine Funktion p : C → C mit die neuen Koeffizienten natürlich nicht direkt verwenden,
sondern wendet die binomische Formel für jeden Ausdruck
!
n
p(z) = aj zj , z ∈ C. explizit an.
j =0
Beispiel Es soll das Polynom p : C → C mit p(z) =
Hierbei sind aj ∈ C, j = 0, . . . , n . z3 + 2z2 − 1 um den Punkt ẑ = 1 entwickelt werden. Wir
Sämtliche Operationen, die wir für algebraische Polynome berechnen:
kennengelernt haben, übertragen sich auf Polynomfunktio-
nen: Sie können addiert und mit anderen Polynomen oder z3 + 2z2 − 1 = (z − 1 + 1)3 + 2(z − 1 + 1)2 − 1
mit Skalaren multipliziert werden. Bezüglich der Addition = (z − 1)3 + 3(z − 1)2 + 3(z − 1) + 1
und der skalaren Multiplikation bilden die Polynome einen
+ 2(z − 1)2 + 4(z − 1) + 2 − 1
C-Vektorraum, einen Unterraum des Raums der auf C defi-
nierten Funktionen. = (z − 1)3 + 5(z − 1)2 + 7(z − 1) + 2.
Auch die Division mit Rest (siehe Seite 92) kann durchge-
führt werden. Für die Analysis ist dies eine wichtige Opera-
tion, die an vielen Stellen von großem Nutzen ist. Hiermit
können rationale Ausdrücke ggf. vereinfacht werden. Eine 9.2 Beschränkte und monotone
wichtige Anwendung ist die Partialbruchzerlegung, die wir
im Kapitel 16 im Zusammenhang mit der Integration vorstel- Funktionen
len werden.
Wir wenden uns zunächst einigen sehr einfachen Eigenschaf-
Ein Thema, das noch nicht vollständig angesprochen wurde,
ten von Funktionen zu, die den entsprechenden Eigenschaf-
betrifft die Möglichkeit, unterschiedliche Darstellungsfor-
ten der Folgen ähneln. Die erste Eigenschaft nutzt aus, dass
men von Polynomen zu finden. Die obige Form können wir
für komplexe Zahlen stets der Betrag als Maß ihrer Größe zur
ausführlicher schreiben als
Verfügung steht und bringt zum Ausdruck, dass die Funk-
!
n
tionswerte einer Funktion nicht beliebig groß werden. Eine
p(z) = aj (z − 0)j , z ∈ C.
Funktion f : D → W heißt beschränkt, falls es eine positive
j =0
Zahl C gibt mit
Dadurch motiviert kann man nach einer Darstellung der Form
|f (x)| ≤ C für alle x ∈ D.
!
n
j
p(z) = bj (z − ẑ) , z∈C Ist diese Eigenschaft für keine positive Zahl C erfüllt, d. h.
j =0 gibt es zu jedem positiven C ein x ∈ D mit |f (x)| > C, so
für irgendein fest gewähltes ẑ suchen. Im Sinne der oben heißt f unbeschränkt.
betrachteten Translationen suchen wir also ein Polynom q, Bei diesem Begriff wird wieder klar, dass eine Eigenschaft
sodass q(z − ẑ) = p(z) für alle z ∈ C ist. Wir nennen dies einer Funktion nicht nur von der Abbildungsvorschrift, son-
die Entwicklung von p um die Stelle ẑ. Wir erhalten diese dern auch vom Definitionsbereich abhängt. Betrachten wir
Darstellung durch Anwendung der binomischen Formel: die Funktionen f : (1, 2) → R sowie g : (0, 1) → R mit
!
n !
n
1 1
p(z) = aj zj = aj (z − ẑ + ẑ)j f (x) = für x ∈ (1, 2) , g(x) = für x ∈ (0, 1) .
j =0 j =0 x x
!
n j ' (
! Aus x > 1 erhalten wir die Abschätzung
j
= aj ẑj −l (z − ẑ)l .
l 1
j =0 l=0 f (x) = <1 x ∈ (1, 2) .
j x
Definieren wir l = 0 für 0 ≤ j < l, so ergibt sich die Da die Funktionswerte auch alle positiv sind, gilt also
gesuchte Entwicklung nach Vertauschen der Summations- |f (x)| < 1 für alle x ∈ (1, 2), die Funktion f ist beschränkt.
reihenfolge zu
' ( Andererseits gilt für x < 1/n, n ∈ N:
! n ! n
j j −l
p(z) = aj ẑ (z − ẑ)l
l g(x) > n.
j =0 l=0
⎛ ⎞
! n !n ' ( Die Funktionswerte können also größer werden als jede be-
j
= ⎝ aj ẑj −l ⎠(z − ẑ)l . liebige natürliche Zahl, die Funktion g ist unbeschränkt.
l
l=0 j =0
Die beiden Funktionen f und g unterscheiden sich nur
=bl im Definitionsbereich, die Abbildungsvorschrift ist dieselbe.
9.2 Beschränkte und monotone Funktionen 311
y f (x)
hδ
3 f
2 h
2 x → g(x)
1
1 x → f (x)
−1 1 2 3 x
Dg Df
1 2 x −1
Abbildung 9.11 Die beiden Funktionen f und g haben dieselbe Abbildungs-
vorschrift – aber f ist beschränkt, g nicht. x2
Abbildung 9.12 Der Graph der Funktion f (x) = x+1 befindet sich oberhalb
der Geraden h(x) = x − 1, aber unterschreitet die Parallele hδ für genügend
großes x.
Trotzdem ist die eine beschränkt, die andere nicht. Die Situa-
tion ist auch in Abbildung 9.11 veranschaulicht.
mathematisch zu erfassen, verschieben wir den Graphen von
Wie bei Folgen kann man bei reellwertigen Funktionen auch h ein kleines Stück nach oben und erhalten für δ > 0
von nach oben beschränkten oder nach unten beschränk- die Funktion hδ : R → R mit hδ (x) = x − 1 + δ. Setze
ten Funktionen sprechen, wenn xδ = 1/δ − 1. Dann gilt für x ≥ xδ die Ungleichung:
f (x) ≤ C bzw. f (x) ≥ C 1 x≥xδ 1
f (x) = x − 1 + ≤ x−1+
x+1 xδ + 1
für alle x ∈ D gilt. So ist etwa die Funktion f : (0, 1) → R
mit f (x) = x1 zwar, wie wir oben gesehen haben, unbe- = x − 1 + δ = hδ (x) .
schränkt, aber sehr wohl nach unten beschränkt (Abb. 9.11). Für x ≥ xδ gilt also f (x) ≤ hδ (x). Da wir diese Überlegung
Noch allgemeiner kann bei zwei reellwertigen Funktionen für jedes noch so kleine δ > 0 durchführen können, muss
f : D → R, g : D → R mit demselben Definitionsbereich sich der Graph von f also dem Graphen von h immer weiter
die eine Funktion eine Schranke für eine andere Funktion annähern.
bilden, wenn nämlich die Ungleichung
Eine zweite elementare Eigenschaft, die wir bei Folgen ken-
f (x) ≤ g(x) für alle x ∈ D nengelernt haben, ist die Monotonie. Auch diese lässt sich
ganz analog auf Funktionen übertragen. Bei diesem Begriff
gilt. Dies ist oft ein nützliches Werkzeug: Man kann etwa müssen aber D und W Teilmengen von R sein, denn die
eine kompliziertere Funktion durch eine einfachere beschrän- Menge C ist nicht angeordnet, d. h. Ungleichungszeichen ste-
ken, um auf Eigenschaften der komplizierteren Funktion zu hen uns dort nicht zur Verfügung. Eine Funktion f : D → W
schließen. heißt monoton wachsend bzw. monoton fallend, falls für
x, y ∈ D mit x < y stets
Beispiel Wir betrachten die Funktion f : R>−1 → R, de-
finiert durch f (x) ≤ f (y) bzw. f (x) ≥ f (y)
x2
f (x) = . gilt. Ist in diesen Ungleichungen die Gleichheit nicht zugelas-
x+1
sen, so sprechen wir von einer streng monoton wachsenden
Der Graph der Funktion ist in der Abbildung 9.12 dargestellt.
bzw. einer streng monoton fallenden Funktion.
Indem wir im Zähler eine Null addieren, erhalten wir
f (x) =
x2 − 1 + 1
=x−1+
1
.
?
x+1 x+1 Überlegen Sie sich zwei Funktionen mit derselben Ab-
bildungsvorschrift aber unterschiedlichen Definitionsberei-
Der Bruch 1/(x + 1) ist aber stets positiv für x > −1. Also
chen, sodass die eine monoton wachsend, die andere mono-
folgt
1 ton fallend ist.
f (x) = x − 1 + ≥ x − 1.
x+1
Somit ist f durch die Gerade h mit h(x) = x − 1, x ∈ R,
nach unten beschränkt (Abb. 9.12). Unter anderem können Die beschränkten Funktionen bilden einen
wir daran ablesen, dass f nicht nach oben beschränkt ist,
Vektorraum, die monotonen nicht
denn h ist nicht nach oben beschränkt.
In der Abbildung sieht man aber auch, dass sich der Graph In Abschnitt 6.3 wurden Untervektorräume definiert. Für
von f dem Graphen von h anzunähern scheint. Um dies Funktionen gilt die folgende Aussage:
312 9 Funktionen und Stetigkeit – ε trifft auf δ
Lemma 1. Fall: Es ist x < y. Dann muss f (x) < f (y) sein,
Sei D ⊆ C. Dann ist {u : D → C | u ist beschränkt} da f streng monoton wächst. Dies ist ein Widerspruch zu
ein Untervektorraum des Raums der auf D definierten f (x) = f (y).
komplexwertigen Funktionen.
2. Fall: Es ist x > y. Dann muss auch f (x) > f (y) gelten.
Beweis: Sind f , g : D → C beschränkt durch C1 bzw. Wiederum haben wir einen Widerspruch zu f (x) = f (y).
C2 , so gilt für alle x ∈ D und alle λ ∈ C: Es bleibt also nur x = y.
Nach der Definition eines Unterraums (siehe Seite 196) bil- f (xj )
f (x0 )
den die beschränkten Funktionen also einen linearen Unter-
raum des Raums der Funktionen. x1 x2 x3 x x0 x
Abbildung 9.13 Eine nicht monotone Funktion braucht nicht injektiv zu sein
Die Aussage des Lemmas gilt natürlich entsprechend für re-
(links). Eine streng monotone Funktion ist immer injektiv (rechts).
ellwertige Funktionen.
Die Situation ist anders bei den monotonen Funktionen. Wir wollen uns klar machen, dass die Umkehrung dieser
Aussage keinesfalls gilt. Es ist also nicht jede injektive
Beispiel Gegeben sind f , g : [0, 1] → R durch f (x) = x Funktion streng monoton. Dazu betrachten wir die Funktion
sowie g(x) = x 2 . Beide Funktionen sind monoton wachsend. f : [0, 2] → R mit
Setze h = g − f . Dann ist
' ( x, 0≤x<1
1 2 3 f (x) = ,
2
h(x) = x − x = x − + . 3 − x, 1 ≤ x ≤ 2
2 4
Dann gilt für x, y ∈ [0, 1]: die in Abbildung 9.14 zu sehen ist. Für 0 ≤ x < 1 ist auch
' ( ' ( 0 ≤ f (x) < 1. Dagegen ist für 1 ≤ x ≤ 2 die Unglei-
1 2 1 2 chung 1 ≤ f (x) ≤ 2 erfüllt. Die Bilder der beiden Intervalle
h(x)−h(y) = x − − y− = (x−y) (x+y−1) .
2 2 [0, 1) und [1, 2] unter f haben keine gemeinsamen Punkte.
Es reicht also aus, die beiden Intervalle getrennt zu betrach-
Ist nun 1 ≥ x > y > 1/2, so sind beide Faktoren positiv,
ten. Auf beiden ist f aber streng monoton, also injektiv. Es
also h(x) − h(y) > 0. Ist aber 1/2 > x > y ≥ 0, so ist der
folgt, dass f insgesamt injektiv ist.
erste Faktor positiv, der zweite aber negativ. In diesem Fall
ist h(x) − h(y) < 0.
f (x)
Insgesamt folgt, dass h keine monotone Funktion ist. Die
2
Menge der monotonen Funktionen ist also gegenüber den x → 3 − x
Vektorraumoperationen nicht abgeschlossen.
1
x → x
Jede streng monotone Funktion ist injektiv
1 2 x
Auf Seite 44 haben wir den Begriff injektiv kennengelernt.
Eine injektive Abbildung hat die Eigenschaft, dass es zu je- Abbildung 9.14 Eine Funktion, die nicht monoton, aber trotzdem injektiv ist:
dem Funktionswert f (x) nur genau ein Urbild x ∈ D gibt. Zu jedem Funktionswert gibt es nur ein Urbild.
Wir wollen uns klar machen, dass dies bei einer streng mo-
notonen Funktion stets der Fall ist. Geometrisch ist diese Auf Seite 48 hatten wir für bijektive Abbildungen die
Aussage sofort klar, wie man in der Abbildung 9.13 sieht. Umkehrabbildung eingeführt. Im Kontext von Funktionen
spricht man entsprechend von der Umkehrfunktion. Ist eine
Lemma Funktion injektiv, so können wir, indem wir den Wertebe-
Ist D ⊆ R, so ist jede streng monotone Funktion f : D → R reich auf das Bild der Funktion einschränken, eine Umkehr-
injektiv. funktion bilden. Aus unserem Lemma ergibt sich somit eine
Aussage zur Existenz von Umkehrfunktionen.
Beweis: Wir beschränken uns auf den Fall einer streng
monoton wachsenden Funktion. Für eine streng monoton fal- Folgerung
lende Funktion geht die Herleitung analog. Wir nehmen an, Jede streng monotone Funktion f : D → f (D) besitzt
dass es zwei Stellen x, y ∈ D mit f (x) = f (y) gibt. eine Umkehrfunktion f −1 : f (D) → D.
9.3 Grenzwerte für Funktionen und die Stetigkeit 313
t0 t
y
und eine nicht negative reelle Nullfolge (xn ). Dann ist
Aus der Eindeutigkeit des Grenzwerts für Folgen (Seite 285) Somit ist
i+2
ergibt sich automatisch, dass auch die Zahl lim f (x) eindeu- lim h(x) = .
x→x̂ x→2 i−2
tig bestimmt ist, sofern der Grenzwert existiert. Ist x̂ ∈ D, so
Anhand ihres Graphen würden wir sagen, dass die zweite
ergibt sich auch unmittelbar, dass lim f (x) = f (x̂) ist. Aber
x→x̂ Funktion aus dem Beispiel einen Sprung besitzt. Wir erhal-
der Grenzwert ist auch für Punkte definiert, die nicht in D lie- ten unterschiedliche Grenzwerte wenn wir uns der Stelle x̂
gen, sich aber durch eine Folge aus D approximieren lassen. auf unterschiedlicher Weise nähern. Die Folge ist, dass der
Im Abschnitt 9.4 werden wir die Menge dieser Punkte den Grenzwert nicht existiert. Eine besondere Bedeutung aber
Abschluss von D nennen. Will man dagegen einen Grenzwert haben Funktionen, bei denen der Grenzwert von f (x) für
x → x̂ bilden und explizit den Funktionswert an der Stelle x → x̂ immer existiert, wenn x̂ im Definitionsbereich liegt.
x̂ außer Acht lassen, so kann man durch die Notation
Noch klarer wird die Bedeutung dieses Begriffs mit der For- y
mel f (x̂) + ε
lim f (x) = f lim x .
x→x̂ x→x̂ f (x̂)
Ist eine Funktion also an einer Stelle x̂ stetig, so darf man die
f (x̂) − ε
Grenzwertbildung gegen x̂ und die Anwendung der Funktion
vertauschen. Entscheidend hierbei ist, dass die Ausdrücke
auf beiden Seiten dieser Gleichung überhaupt existieren, die x
x̂ − δ x̂ x̂ + δ
Gleichheit ergibt sich dann von selbst.
Abbildung 9.19 Die Situation bei der ε-δ-Definition der Stetigkeit.
?
Wieso ergibt sich aus der Existenz der beiden obigen Aus-
drücke sofort ihre Gleichheit? δ-Umgebung durch f in die ε-Umgebung abgebildet wird.
Wegen dieses Zusammenspiels von ε und δ spricht man auch
von der ε-δ-Definition der Stetigkeit. Die Zusammenhänge
Die Funktion f (x) = x 2 , x ∈ R aus dem Beispiel oben ist sind in der Abbildung 9.19 dargestellt.
also auf ganz R stetig. Die zweite Funktion aus dem Beispiel,
g, ist im Punkt 0 nicht stetig. ?
Können Sie in der ε-δ-Definition der Stetigkeit statt < δ
Beispiel Wir betrachten ein weiteres Beispiel dieser Art, bzw. statt < ε auch ≤ δ bzw. ≤ ε schreiben? Welche Kom-
das Polynom p : C → C mit p(x) = 5x 2 − 2x + 1, das binationen dieser Ungleichungen sind äquivalent zu der hier
wir an der Stelle x̂ = 0 auf Stetigkeit überprüfen wollen. gegebenen Definition?
Gegeben ist eine beliebige Nullfolge (xk ). Dann gilt nach den
Rechenregeln für Grenzwerte von Folgen (siehe Seite 290):
Beweis: Wir geben uns dazu eine Funktion f : D → W
lim p(xk ) = lim 5xk2 − 2xk + 1 = 1 = p(0). vor.
k→∞ k→∞
(i) Aus der Stetigkeit definiert durch Grenzwerte folgt die
Da die Folge (xk ) ganz beliebig war, folgt also: ε-δ-Stetigkeit.
Für ein x̂ ∈ D und jede Folge (xn ) aus D mit lim xn = x
n→∞
lim p(x) = p(0); gelte lim f (xn ) = f (x). Wir nehmen aber an, dass
x→0 n→∞
f in x̂ im Sinne der ε-δ-Definition nicht stetig ist. Das
das Polynom p ist also in 0 stetig.
bedeutet: Es gibt ein ε > 0, sodass für alle δ > 0 ein
x(δ) ∈ D existiert mit
Eine alternative Charakterisierung der |x(δ) − x̂| < δ, aber |f (x(δ)) − f (x̂)| ≥ ε.
Stetigkeit Wir setzen speziell δ = 1/n und xn = x(1/n). Somit ha-
ben wir eine Folge (xn ) aus D \ {x̂} erhalten, die gegen x̂
Es gibt eine zweite äquivalente Definition des Begriffs der konvergiert. Dann konvergiert nach Voraussetzung auch
Stetigkeit, die ohne Folgen auskommt und auf den franzö- (f (xn )) gegen f (x̂). Nach der Definition eines Grenz-
sischen Mathematiker Augustin Louis Cauchy (1789–1857) werts existiert zu dem vorgegebenen ε also ein n ∈ N
zurückgeht. Salopp gesprochen ist eine Funktion f in x̂ ste- mit |f (xn ) − f (x̂)| < ε. Dies ist ein Widerspruch zu der
tig, falls für Stellen x dicht bei x̂ auch die Funktionswerte Definition der xn . Somit ist f in x̂ auch im Sinne der
f (x) dicht bei f (x̂) liegen. ε-δ-Definition stetig.
Mathematisch fassen wir den heuristischen Begriff dicht bei (ii) Aus der ε-δ-Definition der Stetigkeit folgt die Stetigkeit
durch die Verwendung von Umgebungen. Es kommen also definiert durch Grenzwerte.
zwei verschiedene Sorten von Umgebungen ins Spiel: solche Es sei f im Sinne der ε-δ-Definition in x̂ stetig, und wir
um x̂ und solche um f (x̂). wählen eine Folge (xn ) aus D \ {x̂} vor, die gegen x̂
konvergiert. Wir wählen auch ε > 0. Dann existiert ein
δ > 0 mit
Äquivalenz der ε-δ-Definition der Stetigkeit
|f (xn ) − f (x̂)| < ε, falls |xn − x̂| < δ .
Eine Funktion f : D → W ist an der Stelle x̂ ∈ D
genau dann stetig, wenn für jedes ε > 0 ein δ > 0 Wähle nun N ∈ N mit |xn − x̂| < δ für alle n ≥ N . Dann
existiert, sodass für alle x ∈ D mit |x − x̂| < δ auch folgt:
|f (x) − f (x̂)| < ε folgt.
|f (xn ) − f (x̂)| < ε für alle n ≥ N .
Vorgegeben wird also eine ε-Umgebung um f (x̂). Zu dieser Mit anderen Worten: Die Folge (f (xn )) konvergiert ge-
muss es eine passende δ-Umgebung um x̂ geben, sodass diese gen f (x̂).
316 9 Funktionen und Stetigkeit – ε trifft auf δ
Beispiel Auch zu dieser Definition der Stetigkeit betrach- p ist also in x̂ stetig. Da aber auch x̂ beliebig gewählt war,
ten wir als Beispiel das Polynom p : C → C mit p(x) = haben wir die Stetigkeit von p auf ganz C nachgewiesen.
5x 2 − 2x + 1 und x̂ = 0. Zu vorgegebenem ε > 0 müssen (ii) Beweis über ε-δ-Formalismus:
wir ein δ > 0 finden, sodass die Aussage aus der Definition Wir geben uns x̂ ∈ C und ε > 0 vor und setzen
erfüllt ist. Dazu betrachten wir
ε
δ = min 1, .
|p(x) − p(x̂)| = |5x 2 − 2x| ≤ 5|x|2 + 2|x| , n max {|αj | (|x̂| + 1)j −1 }
j =1,...,n
wobei wir im letzten Schritt die Dreiecksungleichung ange-
wandt haben. Ferner ist in diesem Beispiel |x − x̂| = |x|. Dieses δ ist so gewählt, dass es genau für die folgenden
Somit ist δ in Abhängigkeit von ε so zu wählen, dass die Überlegungen passt. Aus δ ≤ 1 folgt nämlich für alle
Ungleichung x ∈ D mit |x − x̂| < δ die Abschätzung
5δ 2 + 2δ < ε
|x| = |x − x̂ + x̂| < δ + |x̂| ≤ |x̂| + 1 .
erfüllt ist.
Daher ist mit der Verallgemeinerung der dritten binomi-
Nun geben wir uns ε > 0 beliebig vor. Dann wählen wir δ so,
schen Formel
dass sowohl δ < 1 als auch δ < ε/7 ist. Dann folgt δ 2 < δ
und somit !
n
5δ 2 + 2δ < 7δ < ε . |p(x̂) − p(x)| ≤ |αj | |x̂ j − x j |
j =1
Also gilt für alle x ∈ C mit |x−x̂| = |x| < δ die Abschätzung ) )
)j! )
!
n
) −1 )
|p(x) − p(x̂)| ≤ 5|x|2 + 2|x| < 5δ 2 + 2δ < ε . = ) l j −1−l )
|αj | ) (x̂ − x) x̂ x )
j =1 ) l=0 )
!
n −1
j!
<δ |αj | |x̂|l |x|j −1−l .
Jedes Polynom ist stetig
j =1 l=0
Zu den einfachsten Funktionen gehören die Polynome. In den Die Summanden in der inneren Summe können wir mit
Beispielen oben hatten wir schon ein spezielles Polynom in den oben gefundenen Ungleichungen abschätzen:
x̂ = 0 auf Stetigkeit untersucht. Wir zeigen nun, dass jedes
beliebige Polynom in jedem Punkt der komplexen Zahlen- |x̂|l |x|j −1−l < (|x̂| + 1)l (|x̂| + 1)j −1−l
ebene stetig ist.
= (|x̂| + 1)j −1 .
Stetigkeit der Polynome Somit folgt wegen δ ≤ ε/(n max {|αj | (|x̂|+ 1)j −1 }):
j =1,...,n
Jedes Polynom ist ein Element von C(C).
!
n −1
j!
Beweis: Mit p : C → C bezeichnen wir ein Polynom vom |p(x̂) − p(x)| < δ |αj | (|x̂| + 1)j −1
Grad n, j =1 l=0
!
n
p(x) = j
αj x , ≤ δ n max {|αj | (|x̂| + 1)j −1 }
j =1,...,n
j =0
≤ ε.
Problemanalyse und Strategie: Um f an der Stelle x̂ auf Stetigkeit zu untersuchen, schätzen wir den Ausdruck
f (x) − f (x̂) so ab, dass ein Produkt aus der Differenz x − x̂ und einem Produkt entsteht, das nicht mehr von x abhängt.
Dieses Produkt liefert die notwendige Information zur Wahl von δ in Abhängigkeit von ε und x̂. Es reicht übrigens auch,
eine Potenz von x − x̂ als ersten Faktor zu erhalten.
Lösung: x x̂
g(x) − g(x̂) = −
(a) Wir betrachten zunächst für x̂, x ∈ R≥0 die Differenz 1+x 2 1 + x̂ 2
der beiden Funktionswerte: x (1 + x̂ ) − x̂ (1 + x 2 )
2
√ =
3 √ (1 + x̂ 2 ) (1 + x 2 )
f (x̂) − f (x) = x̂ − 3 x
(1 − x x̂) (x − x̂)
x̂ − x = .
= . (1 + x̂ 2 ) (1 + x 2 )
x̂ 2/3 + x̂ 1/3 x 1/3 + x 2/3
Durch Anwendung des Betrags, der Dreiecksungleichung
Hier haben wir die Formel und der Abschätzung x 2 ≥ 0 erhalten wir:
a 3 − b3 = (a − b) (a 2 + ab + b2 ) 1 + |x x̂|
|g(x) − g(x̂)| ≤ |x − x̂| .
verwendet, die es entsprechend auch für höhere Potenzen 1 + x̂ 2
gibt. Wir machen nun die Annahme |x − x̂| ≤ 2. Somit ist
Um den Nenner zu vereinfachen, wollen wir annehmen, |x| ≤ |x̂| + 2, und es folgt:
dass x ≥ x̂/2 gilt. Dann folgt: 1 + 2 |x̂| + |x̂|2
|g(x) − g(x̂)| ≤ |x − x̂|
|x̂ − x| 1 + x̂ 2
|f (x̂) − f (x)| =
x̂ 2/3 + x̂ 1/3 x 1/3 + x 2/3 (1 + |x̂|)2
= |x − x̂| .
|x̂ − x| 4 |x̂ − x| 1 + x̂ 2
≤ 1 1
= .
x̂ (1 + 2 + 4 )
2/3 7 x̂ 2/3
Mit der allgemein gültigen Ungleichung
Damit ist eine Schranke der gewünschten Form gefunden. (a + b)2 ≤ 2a 2 + 2b2
Sei nun ε > 0. Wir wählen
folgt hieraus:
x̂ 7 x̂ 2/3 ε
δ = min , . 2 + 2|x̂|2
2 4 |g(x) − g(x̂)| ≤ |x − x̂| = 2|x − x̂| .
1 + x̂ 2
Der erste Term garantiert, dass die Annahme oben er- Dies ist die gewünschte Form. Wir geben nun ε > 0 vor
füllt ist. Den zweiten setzen wir nun ein, denn es folgt und wählen δ durch
für |x̂ − x| ≤ δ: ε
δ = min 2, .
4δ 2
|f (x̂) − f (x)| ≤ ≤ ε.
7 x̂ 2/3 Für |x − x̂| ≤ δ folgt:
Somit ist f in jedem x̂ ≥ 0 stetig. ε
|g(x) − g(x̂)| ≤ 2 = ε.
(b) Für x, x̂ ∈ R betrachten wir zunächst wieder die Dif- 2
ferenz der Funktionswerte. Somit ist g in jedem x̂ ∈ R stetig.
Kommentar:
Machen Sie sich jeweils genau klar, wie die Definition von δ zustande kommt. Durch die Bildung des Minimums
sind in beiden Teilaufgaben zwei Ungleichungen erfüllt. Wo wird jede davon verwendet?
Ein wesentlicher Unterschied zwischen beiden Teilaufgaben liegt darin, dass im ersten Fall die Wahl von δ von x̂
und von ε abhängt, im zweiten Fall nur von ε. Später werden wir Funktionen, bei der der zweite Fall vorliegt, als
gleichmäßig stetig bezeichnen.
318 9 Funktionen und Stetigkeit – ε trifft auf δ
Übliche Beispiele für diesen Begriff sind rationale Funktio- Die Folge (f (xn )) ist unbeschränkt und konvergiert daher
nen an Stellen, in denen ihr Nenner eine Nullstelle hat. Es nicht. Somit existiert auch der Grenzwert limx→−1 f (x)
sei aber darauf hingewiesen, dass der Begriff der stetigen nicht.
Fortsetzung durchaus eine weittragende Bedeutung besitzt.
Insbesondere im Hinblick auf die Stetigkeit von Ableitungen
Die stetigen Funktionen bilden einen
(siehe Seite 559) werden wir wieder darauf zurückkommen.
Vektorraum
Beispiel Betrachten wir f : C \ {−1, 1} → C mit Das vorangegangene Beispiel zeigt, dass es sehr mühsam
ist, bei der Verwendung von Grenzwerten für Funktionen
x 2 − 2x + 1 immer mit Folgen oder -δ-Definition hantieren zu müssen.
f (x) = , x ∈ C \ {1, −1} ,
x2 − 1 Glücklicherweise ist das auch gar nicht notwendig: Da die
9.3 Grenzwerte für Funktionen und die Stetigkeit 319
Grenzwertdefinition auf der Konvergenz für Folgen beruht, eine Richtung zu beschränken. Dazu betrachten wir etwa alle
übertragen sich alle Rechenregeln für Grenzwerte, die wir Folgen (xn ) aus D mit Grenzwert x̂ und xn > x̂ für alle
von den Folgen her kennen, auf das Rechnen mit Funktionen. n ∈ N. Wir nähern uns x̂ also stets von oben. Existiert nun
Die Übersicht auf Seite 290 listet alle diese Regeln auf. Sie eine solche Folge sowie für jede solche Folge der Grenzwert
gelten ganz entsprechend bei Grenzwerten für Funktionen. limn→∞ f (xn ), und sind alle diese Grenzwerte gleich, so
Wir werden sie ab jetzt verwenden und uns dadurch das Leben setzen wir
erheblich vereinfachen. lim f (x) = lim f (xn ).
x→x̂+ n→∞
Die Rechenregeln beinhalten insbesondere das Bilden der Analog definiert man den Grenzwert limx→x̂− f (x) für
Summen und von skalaren Vielfachen von Funktionen. Damit einen Grenzwert von unten.
ergibt sich direkt die folgende Aussage:
Für diese einseitigen Grenzwerte findet man in der Literatur
Satz auch andere Notationen. So ist es etwa auch üblich einen
Für D ⊆ C bildet die Menge C(D) einen Vektorraum schrägen Pfeil beim Limessymbol zu verwenden:
über C.
lim f (x) = lim f (x) und lim f (x) = lim f (x).
x3x̂ x→x̂− x4x̂ x→x̂+
Schränken wir uns auf reellwertige Funktionen ein, so erhal-
ten wir analog einen Vektorraum über R. Noch kürzer ist die Schreibweise f (x̂−) = lim f (x).
x→x̂−
Genauso sind auch Produkte von stetigen Funktionen wieder Es gibt nun drei typische Situationen, bei denen Funktionen
stetig, und auch andere grundlegende Rechenoperationen er- unstetig sein können, die wir im Folgenden vorstellen wollen.
halten die Stetigkeit. Die Übersicht auf Seite 318 listet die
wichtigsten Fälle stetiger Funktionen auf. Beispiel
Die Funktion f : [0, 2] → R mit
?
Bildet die Menge C(D) mit der Multiplikation einen Ring x2, 0 ≤ x ≤ 1,
oder sogar einen Körper? f (x) = x
2 + 1, 1 < x ≤ 2
lim h(xn ) = lim g(f (xn )) definiert sein. Der Graph ist in der Abbildung 9.20 rechts
n→∞ n→∞
dargestellt. Eine Stelle wie die 0 bei 1/x nennt man eine
= g lim f (xn ) = g(f (x̂)) = h(x̂) . Singularität. In der Tat ist g in der Nähe von null unbe-
n→∞
schränkt, weder der Grenzwert limx→0− g(x) noch der
Also ist h in x̂ ∈ D stetig. Da x̂ beliebig gewählt war, ist h Grenzwert limx→0+ g(x) existieren, aber g ist in null de-
auf D stetig.
finiert. Somit ist g in null nicht stetig.
Als dritten Fall betrachten wir die Funktion h : R → R
mit:
0, x ≤ 0,
Bei einseitigen Grenzwerten beschränkt man h(x) =
sin x1 , x > 0,
sich auf bestimmte Folgen
wobei wir im Vorgriff auf deren Definition in Kapi-
Um den Begriff der Stetigkeit noch besser verstehen zu kön- tel 11 die Sinusfunktion verwenden. Diese ist auf R
nen, wollen wir uns mit Funktionen beschäftigen, die nicht definiert, stetig und 2π-periodisch. Den Graphen von
stetig sind. Vorher definieren wir noch ein wichtiges Hilfs- h zeigt die Abbildung 9.21. Während der Grenzwert
mittel. Insbesondere bei Funktionen mit Sprüngen ist es oft limx→0− h(x) existiert (und gleich null ist), existiert der
nützlich, sich bei der Bestimmung eines Grenzwerts nur auf Grenzwert limx→0+ h(x) nicht. Es lässt sich für jedes
320 9 Funktionen und Stetigkeit – ε trifft auf δ
−1 1 1
f
Abbildung 9.21 Unstetigkeit durch Oszillation. g
1 x 1 x
y ∈ [−1, 1] eine Folge (xn ) mit limn→∞ xn = 0 und
limn→∞ h(xn ) = y konstruieren. Man spricht von einer
Oszillationsstelle. −1 −1
Abbildung 9.22 Zwei Funktionen mit einer Singularität bei 1. Für f existiert der
Achtung: Für die vorangegangenen Beispiele ist es we- uneigentliche Grenzwert lim x→1 f (x) = ∞. Bei g existieren nur die einseitigen
sentlich, dass die Unstetigkeitsstelle zum Definitionsbereich uneigentlichen Grenzwerte limx→1− g(x) = −∞ und lim x→1+ g(x) = ∞.
der Funktion gehört. Betrachtet man etwa f : R \ {0} → R
mit f (x) = 1/x, so ist diese Funktion auf ihrem gesamten
Beispiel Die Funktion f : R \ {−1} → R mit
Definitionsbereich stetig! Dies ist die Grenze der anschau-
lichen Vorstellung, dass eine Funktion stetig ist, wenn man x2 + x + 2 2
ihren Graphen zeichnen kann, ohne den Stift dabei abzuset- f (x) = =x+
x+1 x+1
zen. Von Stetigkeit kann man nur an einer Stelle sprechen,
an der die Funktion auch definiert ist. hat an der Stelle −1 eine Singularität. An der zweiten Dar-
stellung lässt sich das Verhalten der Funktion gut ablesen:
Für x < −1 ist der Nenner des Bruchs stets negativ. Er kon-
vergiert gegen null für x → −1, während der erste Summand
Bei unbeschränkten Funktionen können in x beschränkt bleibt, also gilt:
manchen Fällen uneigentliche Grenzwerte 2
lim f (x) = lim = −∞.
definiert werden x→−1− x→−1− x + 1
Dagegen ist der Nenner des Bruchs für x > −1 stets positiv,
Für den Fall von Singularitäten kann man die Definition des hier gilt
Grenzwerts für Funktionen erweitern, um auch in diesen Si-
tuationen mit einer einfachen Darstellung durch eine Formel 2
lim f (x) = lim = +∞.
arbeiten zu können. Betrachten wir dazu eine reellwertige x→−1+ x→−1+ x+1
Funktion f : D → W , W ⊆ R und eine konvergente Folge
Für betragsmäßig große Werte von x dominiert der erste Sum-
(xn ) in D mit limn→∞ xn =: x̂. Es muss dabei x̂ selbst kein
mand, das x, denn der Bruch konvergiert hier gegen null. Hier
Element von D sein.
gilt
Gibt es nun für jede Zahl C > 0 und jede Folge (xn ) aus D
mit limn→∞ xn = x̂ ein N ∈ N mit lim f (x) = lim x = −∞,
x→−∞ x→−∞
lim f (x) = lim x = ∞.
f (xn ) > C für alle n ≥ N, x→∞ x→∞
9.3 Grenzwerte für Funktionen und die Stetigkeit 321
Problemanalyse und Strategie: Beim Nachweis von Stetigkeit im Komplexen muss man sicherstellen, dass man das
Verhalten einer Funktion an der zu untersuchenden Stelle in allen Richtungen betrachtet. Aus einzelnen Richtungen mag
eine Funktion stetig erscheinen, aber aus anderen nicht. Dies ist hier der Fall.
1+i
zn = , n ∈ N.
n
Im z
Auch hier gilt limn→∞ zn = 0, allerdings ist nun Re z
zn 1+i
= = i.
zn 1−i Die Abbildung zeigt einen Ausschnitt des Graphen des
Imaginärteils von f . Man kann gut das Verhalten von f in
Damit folgt:
der Nähe der Stelle 0 erkennen: je nachdem aus welcher
zn Richtung in der komplexen Zahlenebene man sich nähert,
= −i und daher f (zn ) = 2i. erhält man einen anderen Grenzwert für z → 0.
zn
Der Beweis ergibt sich direkt aus der obigen Überlegung und
Definition einer lipschitz-stetigen Funktion
der ε-δ-Definition der Stetigkeit. Es ergibt sich, dass für ein
Falls für eine Funktion f : D → W eine Konstante ε immer δ = ε/L gewählt werden kann, unabhängig davon,
L > 0 mit der Eigenschaft an welcher Stelle x ∈ D die Funktion betrachtet wird. Damit
ist die Lipschitz-Stetigkeit ein Spezialfall der gleichmäßigen
|f (x) − f (y)| ≤ L |x − y| für alle x, y ∈ D
Stetigkeit (siehe Seite 331).
existiert, so nennen wir die Funktion lipschitz-stetig mit Direkt aus der Definition ergibt sich, dass Summen und
Lipschitzkonstante L. skalare Vielfache lipschitz-stetiger Funktionen selbst wie-
der lipschitz-stetig sind. Somit bildet die Menge der auf
Für eine lipschitz-stetige Funktion haben wir somit die Aus- D lipschitz-stetigen Funktionen einen Untervektorraum von
sage: Ist |x−y| ≤ ε/L, so folgt sofort |f (x)−f (y)| ≤ ε. Die C(D).
322 9 Funktionen und Stetigkeit – ε trifft auf δ
Sehr gut kann man sich den Begriff am Beispiel der Wurzel- sehen werden, sind ihre Bildmengen wieder Intervalle. Je-
funktion klar machen (Abb. 9.23). Wir betrachten D = [δ, 1] doch kann sich der Typus der Intervalle ändern. Betrachtet
mit δ > 0 und setzen man z. B. D = (−1, 1) und f : D → R mit f (x) = x 2 , dann
√ ist f (D) = [0, 1).
f (x) = x, x ∈ D.
Im Abschnitt über komplexe Zahlen hatten wir offene und
Dann gilt für δ ≤ y ≤ x ≤ 1 die Abschätzung: abgeschlossene Kreisscheiben eingeführt. Für r > 0 und
a ∈ C hatten wir Ur (a) = {z ∈ C | |z − a| < r} die
√ √ x−y 1 offene Kreisscheibe und U r (a) = {z ∈ C | |z − a| ≤ r} die
|f (x) − f (y)| = x− y= √ √ ≤ √ |x − y|.
x+ y 2 δ abgeschlossene Kreisscheibe mit Mittelpunkt a und Radius
r genannt.
Da
1 1 Ziel dieses Abschnitts ist es, die Begriffe offen und abge-
√ √ → √ x, y → δ,
x+ y 2 δ schlossen zu präzisieren und zu zeigen, dass die offenen bzw.
abgeschlossenen Intervalle bzw. Kreisscheiben wirklich of-
ist diese Abschätzung optimal: Wir können keine √ kleinere fen bzw. abgeschlossen im Sinne einer allgemeineren Defi-
Konstante mit dieser Eigenschaft finden als 1/(2 δ).
nition sind. Im engen Zusammenhang mit abgeschlossenen
Teilmengen stehen kompakte Mengen.
f (x)
)
0.01
1.0 z3
1/(2 √
√ 0.2) √
x
1/(2
ng
igu
ung
0.5 Ste D
Steig
z1 z4
Nun lassen wir δ → 0 gehen. Wir wissen ja, dass die Wur- Abbildung 9.24 An dieser „Amöbe“ lassen sich die verschiedenen möglichen
Fälle für die Lage von Punkten unterscheiden. Punkte wie z1 liegen im Inneren von
zelfunktion auch auf dem Intervall [0, 1] stetig ist, aber die
D, während Punkte wie z3 auf dem Rand zwischen D und seinem Komplement
Lipschitzkonstante geht dann gegen Unendlich! Die Wurzel- liegen. Punkte wie z2 bzw. z4 liegen außerhalb von D.
funktion ist also auf dem Intervall [0, 1] nicht mehr lipschitz-
stetig. Am Graphen kann man auch gut erkennen, warum dies Wir betrachten eine Teilmenge D ⊆ C, die etwa die in Ab-
so ist: Die Kurve wird zunehmend steiler, wenn sie sich der bildung 9.24 dargestellte Gestalt hat. Dann gibt es für die
Null nähert, die Änderungsrate wird immer größer. Lage von Punkten aus C die folgenden Möglichkeiten, die
Lipschitz-Stetigkeit spielt immer dort eine Rolle, wo es auf sich gegenseitig ausschließen:
eine Beschränkung von Änderungsraten ankommt. Dies ist
vor allem bei numerischen Anwendungen der Fall, aber auch Definition: Inneres, Komplement und Rand einer
in dem Kapitel zu Differenzialgleichungen wird uns dieser Menge
Begriff wieder begegnen. Ist z1 ∈ D, und gibt es ein r1 > 0 mit Ur1 (z1 ) ⊆ D,
so nennen wir z1 einen inneren Punkt von D. Die
Gesamtheit D 0 dieser Punkte heißt das Innere von
D.
9.4 Abgeschlossene, offene, Ist z2 ∈ C \ D, und gibt es ein r2 > 0 mit Ur2 (z2 ) ⊆
C \ D, so nennen wir z2 einen äußeren Punkt be-
kompakte Mengen züglich D. Äußere Punkte gehören zum Komplement
von D bezogen auf die Grundmenge (hier: C). Sie
In Abschnitt 4.2 hatten wir verschiedene Intervalltypen de- sind innere Punkte des Komplements C \ D.
finiert. Darunter offene Intervalle, d. h. Intervalle vom Typ Gilt für ein z3 ∈ C und für alle r3 > 0, dass
(a, b) = {x ∈ R | a < x < b} und abgeschlossene Inter- Ur3 (z3 ) ∩ D = ∅ und Ur3 (z3 ) ∩ (C \ D) = ∅, so
valle [a, b] = {x ∈ R | a ≤ x ≤ b} (dabei seien jeweils nennen wir z3 einen Randpunkt von D. Die Gesamt-
a, b ∈ R und a < b). Zwischen diesen Intervalltypen scheint heit dieser Punkte heißt Rand von D, für den wir die
kein großer Unterschied zu bestehen, so haben beide Inter- Bezeichnung ∂D wählen.
valle nach Definition die gleiche Länge b − a.
Stetige Funktionen f mit Intervallen als Definitionsbereiche Diese Begriffe lassen sich ganz analog für Teilmengen von R
haben angenehme Eigenschaften: Wie wir im Abschnitt 9.5 einführen: In der Definition muss C durch R ersetzt werden,
9.4 Abgeschlossene, offene, kompakte Mengen 323
und statt den offenen Kreisscheiben Ur (z) verwendet man Jede endliche Teilmenge von R oder C ist abgeschlossen
offene Intervalle (z − r, z + r). Das Intervall (a, b] hat dann in R bzw. in C.
z. B. die Eigenschaft, dass der Randpunkt a kein Element des Das Intervall (0, 1) ⊆ R ist nicht abgeschlossen in R,
1
Intervalls ist, der Randpunkt b schon. denn für die Folge (xn ) mit xn = n+1 gilt xn ∈ (0, 1],
aber lim xn = 0 ∈ / (0, 1).
n→∞
Achtung: Das reelle Intervall (a, b) ist als Teilmenge von Z ist eine abgeschlossene Teilmenge von R, und Z + Zi
R eine Menge, die nur aus inneren Punkten besteht. Man kann ist eine abgeschlossene Teilmenge von C.
dieses Intervall auch als Teilmenge von C auffassen. Dann hat
es keine inneren Punkte, da für jedes z ∈ (a, b) und jedes r >
?
Beweisen Sie die Aussage des dritten und des fünften Bei-
0 die offene Kreisscheibe Ur (z) nicht reelle Zahlen enthält.
spiels formal!
Die oben definierten Begriffe hängen also entscheidend von
der Obermenge ab, bezüglich der sie definiert werden.
In der Praxis setzt man sehr häufig das folgende Lemma ein,
? um nachzuweisen, dass eine Teilmenge von C abgeschlossen
Finden Sie die Randpunkte der offenen Kreisscheibe Ur (a) ist.
und überprüfen Sie, ob diese Randpunkte Elemente von
Ur (a) sind. Lemma
Sind f1 , . . . , fl : C → R stetige Funktionen, und sind
a1 , . . . , al gegebene reelle Zahlen, dann ist die Menge
Die abgeschlossenen Intervalle vom Typ [a, b], [a, ∞) bzw. A = {z ∈ C | f1 (z) ≤ a1 , . . . , fl (z) ≤ al } abgeschlossen
(∞, b] (a, b ∈ R) haben die folgende Abgeschlossenheitsei- in C.
genschaft:
Eine analoge Aussage erhält man, wenn man „≤“ durch „≥“
Satz ersetzt.
Ist (xn ) eine konvergente Folge von Elementen xn aus
einem dieser Intervalle, dann liegt auch der Grenzwert
x = lim xn in dem betreffenden Intervall. Beweis: Zur Begründung betrachten wir eine konvergente
n→∞ Folge (zn ) von Punkten zn ∈ A und setzen z∗ = lim zn .
n→∞
Aus zn ∈ A folgt fj (zn ) ≤ aj für j = 1, 2, . . . , n. Dann ist
Beweis: Wir geben hier einen kurzen Beweis für den Fall auch fj (z∗ ) = lim fj (zn ) ≤ aj für alle j . Das bedeutet,
des Intervalls [a, ∞). Die anderen Intervalltypen werden ana- n→∞
dass auch z∗ in A liegt. A ist also abgeschlossen.
log behandelt. Wir wählen eine Folge (xn ) mit xn ≥ a für
alle n ∈ N und setzen x = lim xn . Wäre nun x < a, dann
n→∞
gäbe es ein N ∈ N mit |xN − x| < für = a − x > 0. Es Mithilfe der folgenden Prinzipien lassen sich abgeschlossene
wäre daher xN = x + (xN − x) ≤ x + |xN − x| < x + = a Mengen konstruieren:
mit Widerspruch zu xN ≥ a. Also ist auch x ≥ a.
∂A = A ∩ K \ A
Beispiel Ein typisches Beispiel einer offenen Menge ist
In Worten: Der Rand der Menge A ist der Schnitt aus ihrem die „offene“ Kreisscheibe (z0 ∈ C, r > 0) Ur (z0 ) = {z ∈ C |
Abschluss mit dem Abschluss ihres Komplements. |z − z0 | < r}.
9.4 Abgeschlossene, offene, kompakte Mengen 325
Lösung:
Nach dem ersten Schritt haben wir als Menge die Ver- C0
einigung der zwei abgeschlossenen Intervalle [0, 13 ] und C1
[ 23 , 1] mit einer Länge von je 13 erzeugt:
C2
B C B C C3
1 2
C1 = 0, ∪ ,1 . C4
3 3
C5
Jedem dieser beiden Intervalle entnehmen wir nun wieder
das (offene) mittlere Intervalldrittel und erhalten so die
Vereinigung
Für uns ist hier besonders interessant, dass C abgeschlos-
B C B C B C B C sen ist. Jede der Mengen Cn ist als endliche Vereinigung
1 2 1 2 7 8
C2 = 0, ∪ , ∪ , ∪ ,1 . abgeschlossener Intervalle nämlich abgeschlossen. Somit
9 9 3 3 9 9
ist C ein Durchschnitt abzählbar vieler abgeschlossener
Mengen und damit nach Aussage (A2) selbst abgeschlos-
Damit gibt es schon 4 Intervalle, jeweils mit der Länge 19 . sen.
Dieses Vorgehen setzen wir fort. Im n-ten Schritt erhalten Weitere besondere Eigenschaften von C sind:
wir 2n Intervalle der Länge 31n , deren Vereinigung wir Cn C besitzt überabzählbar viele Elemente. Dies werden
nennen. Aufgrund der Konstruktion gilt wir im Kapitel 10 beweisen.
In Kapitel 16 wird gezeigt, dass C eine sogenannte
[0, 1] = C0 ⊇ C1 ⊇ C2 ⊇ C3 ⊇ · · · ⊇ Cn ⊇ · · · Nullmenge ist. Solche Mengen spielen in der Integrati-
onstheorie eine wichtige Rolle. Einfache Beispiele für
solche Mengen sind abzählbar, das Cantor’sche Dis-
Den Durchschnitt aller Cn ,
kontinuum ist aber ein Beispiel für eine überabzählbare
∞ Nullmenge.
C= Cn , Wegen dieser Eigenschaften galt C als „extrem patholo-
n=1
gisch“ für eine Teilmenge von R. C besitzt ein zweidimen-
sionales Analogon, den sogenannten Sierpinski-Teppich.
nennen wir das Cantor’sche Diskontinuum oder auch die
Cantor-Menge, nach dem Mathematiker Georg Cantor, ?
der diese Menge 1853 vorstellte. In der Abbildung ist der Wie könnte man das eindimensionale Vorgehen zum Er-
beschriebene Wischprozess auch schematisch dargestellt. zeugen von C auf zwei Dimensionen erweitern?
∂M = M \ M ◦ = (M \ M ◦ ) ∪ (M \ M). Offen ist also nicht das logische Gegenteil von abgeschlos-
sen, die Begriffe hängen über die Komplementbildung mit-
Diese Beziehung ergibt sich sofort aus der Definition des einander zusammen.
Inneren bzw. der Randpunkte einer Menge über offene
Umgebungen. ?
Warum sind ∅ und R Teilmengen von R mit leerem Rand?
Eine Teilmenge U ⊆ K ist genau dann offen, wenn U = U 0 konvergente Teilfolge besitzt. Der Grenzwert dieser Teilfolge
gilt. liegt wegen der Abgeschlossenheit in K.
besonders zweckmäßig
Man nennt eine Menge, die die Bolzano-Weierstraß-Eigen-
Im Kapitel 19 über metrische Räume und ihre Topologie wer- schaft besitzt auch folgenkompakt. Die Tatsache, dass Teil-
den wir auf offene und abgeschlossene Mengen und die damit mengen von C bzw. von R genau dann kompakt sind, wenn
zusammenhängenden Begriffe noch ausführlicher zu spre- sie folgenkompakt sind, ist eine besondere Eigenschaft die-
chen kommen. Allerdings lassen sich über stetige Funktio- ser Grundmengen. Allgemeiner definiert man in sogenann-
nen, die offene oder abgeschlossene Mengen als Definitions- ten metrischen Räumen (siehe Kapitel 19) Kompaktheit über
mengen besitzen, nur wenig interessante Aussagen treffen. die Überdeckungseigenschaft (Ausblick auf Seite 328). Aus
Um eine reichhaltigere Menge an Aussagen zu erhalten, füh- dieser folgt die Folgenkompaktheit und hieraus wieder Be-
ren wir die kompakten Mengen ein. schränktheit und Abgeschlossenheit. In einem metrischen
Raum muss eine beschränkte und abgeschlossene Menge
nicht kompakt sein.
Definition einer kompakten Menge
Eine Teilmenge K ⊆ K heißt kompakt, wenn sie be-
schränkt und abgeschlossen ist. Existenzsatz von Maximum und Minium kompakter
Mengen
Eine nichtleere kompakte Teilmenge K ⊆ R hat ein
Zur Erinnerung: Eine Menge K ist beschränkt, wenn es eine
Maximum und ein Minimum.
reelle Zahl R gibt, sodass |z| ≤ R für alle z ∈ K gilt. Offen-
sichtlich sind die leere Menge ∅ und jede endliche Teilmenge
{z1 , . . . , zn } ⊆ K kompakt. Diesen Satz werden wir im folgenden Abschnitt 9.5 und an
anderen Stellen häufig verwenden.
Offensichtlich gilt:
Die Vereinigung endlich vieler kompakter Mengen ist Beweis: Da K beschränkt ist, existieren s = sup K und
wieder kompakt. t = inf K. Es ist zu zeigen, dass s, t ∈ K sind. Da der Beweis
Der Durchschnitt beliebig vieler kompakter Mengen ist beider Aussagen völlig analog verläuft, beschränkten wir uns
wieder kompakt. auf s ∈ K.
Der Durchschnitt A ∩ K einer abgeschlossenen Menge A
und einer kompakten Menge K ist wieder kompakt. Mithilfe der ε-Charakterisierung von sup K konstruieren wir
eine Folge (xn ) mit xn ∈ K, xn < s und lim xn = s.
n→∞
? Wegen der Abgeschlossenheit ist sofort lim xn = s ∈ K.
n→∞
Können Sie diese drei Aussagen schnell begründen?
Bei stetigen Funktionen gibt es lokal Wir führen dazu folgende Sprechweisen ein: Ist D ⊆ K eine
betrachtet keine „Überraschungen“ nichtleere Teilmenge, dann heißt eine Teilmenge D0 von D
offen relativ D, wenn es zu jedem a ∈ D0 eine r-Umgebung
Bevor wir uns mit globalen Eigenschaften stetiger Funktio- Ur (a) gibt, für die Ur (a) ∩ D ⊆ D0 gilt. Andere Ausdrucks-
nen beschäftigen, halten wir noch eine bemerkenswerte lo- weisen für diesen Begriff sind: D0 ist D-offen oder D0 ist
kale Abbildungseigenschaft stetiger Funktionen fest, die an offen in D.
einer Stelle einen von Null verschiedenen Funktionswert ha-
ben:
Satz a
Ist f : D → C stetig in x̂ ∈ D, und gilt f (x̂) = 0, Ur (a) ∩ D D
dann gibt es eine δ-Umgebung Uδ (x̂) mit f (x) = 0 für alle
x ∈ Uδ (x̂) ∩ D.
Sei umgekehrt f −1 (V ) offen für jede offene Menge V ⊆ K. Fundamentalsatz über stetige Funktionen mit kom-
Ist a ∈ D beliebig gewählt, dann ist insbesondere für jede paktem Definitionsbereich
-Umgebung V (f (a)) das Urbild f −1 (V (f (a))) D-offen,
Sind K ⊆ K kompakt und f : K → K stetig, dann ist
es gibt also ein δ > 0 mit Uδ (a) ∩ D ⊆ f −1 (V (f (a))).
das Bild f (K) ebenfalls kompakt.
Das bedeutet aber f (Uδ (a) ∩ D) ⊆ V (f (a)), und das ist
die -δ-Stetigkeit von f in a. Da dies für jedes a ∈ D gilt,
ist f global stetig. Beweis: Ist (yn ) eine Folge aus Y , dann gibt es zu jedem
Um die Implikationen 2. ⇒ 3. bzw. 3. ⇒ 2. zu zeigen, n ∈ N ein xn ∈ K mit f (xn ) = yn . Da K aber kompakt
benutzt man die Rechenregel f −1 (K \ A) = D \ f −1 (A) ist, besitzt (xn ) eine Teilfolge (xnk ), die gegen ein x ∈ K
(A ⊆ K). konvergiert. Wegen der Stetigkeit von f konvergiert dann
die Bildfolge (f (xnk )) gegen f (x) ∈ f (K).
?
Können Sie die beiden fehlenden Beweisschritte ausführen,
In der Einleitung zu diesem Kapitel hatten wir zwei Grund-
also den Nachweis der Implikationen 2. ⇒ 3. bzw. 3. ⇒ 2.?
aufgaben der Analysis angesprochen. Für eine davon, die
Optimierungsaufgabe, ist der obige Fundamentalsatz eine
Mithilfe des Kriteriums für globale Stetigkeit lassen sich zentrale Aussage. Um die Optimierungsaufgabe formulieren
zahlreiche offene bzw. abgeschlossene Mengen konstruieren. zu können, benötigen wir einen neuen Begriff.
Aus der Definition der Kompaktheit von Mengen ergibt sich Die Optimierungsaufgabe besteht nun aus der Frage, ob eine
durch eine recht kurze Begründung der folgende Satz. gegebene Funktion f : D → R ein globales Minimum oder
9.5 Stetige Funktionen mit kompaktem Definitionsbereich, Zwischenwertsatz 331
f (x)
Ist K ein nichtleeres Kompaktum in C, dann gibt es zu jedem
f (x + ) p ∈ C \ K einen Punkt b ∈ K, sodass für alle z ∈ K die
Ungleichung |b − p| ≤ |z − p| gilt.
f (x − )
a x− x+ = b x
K
Abbildung 9.28 Globales Maximum und Minimum bei einer reellwertigen z
Funktion.
b
ein globales Maximum besitzt. Die Entwicklung effizienter
p
Verfahren zur Lösung solcher, wenn auch viel komplexerer,
Optimierungsaufgaben ist noch stets aktuelles Forschungsge-
biet der Mathematik. Streng genommen sind mehrere Frage- Abbildung 9.29 Ist K nichtleer und kompakt, so gibt es zu jedem p ∈ C \ K
stellungen zu unterscheiden: Gibt es überhaupt ein globales ein b ∈ K mit |b − p| ≤ |z − p| für alle z ∈ K.
Maximum oder Minimum? Gibt es jeweils genau eine solche
Stelle? Wie berechne ich eine solche Stelle? Beweis: Die stetige Funktion K → R : z → |z − p| hat
Auf die ersten beiden Fragen gibt es je nach Situation ver- ein globales Minimum!
untersucht werden. Welche typischen Fälle gibt es? Muss es eine Lösung geben?
Problemanalyse und Strategie: Ziel ist es, einfache Situationen zu identifizieren, in denen die Lösung der Opti-
mierungsaufgabe angegeben werden kann. Andererseits werden wir uns Fälle überlegen, in denen es keine Lösung
gibt.
a x a b x a b x a b x
b
f (x)
a x
Kommentar: Als Fazit halten wir fest: Sofern Extrema existieren, können sie sowohl
auf dem Rand des Definitionsbereichs oder
im Innern des Definitionsbereichs
liegen. Es müssen stets beide Fälle untersucht werden.
zeigen, dass es für jedes δ > 0 Stellen x, y ∈ (0, 1) mit Der folgende Satz zeigt, dass die gleichmäßige Stetigkeit von
√
|x − y| < δ gibt, für die |g(x) − g(y)| ≥ 1 ist. x auf (0, 1) auch auf die stetige Fortsetzbarkeit der Qua-
dratwurzel auf das kompakte Intervall [0, 1] zurückgeführt
Wir wählen δ > 0 beliebig. Zu y ∈ (0, δ) setzen wir werden kann.
x = y/(y + 1) < y. Dann folgt:
Gleichmäßige Stetigkeit stetiger Funktionen mit
1 1 y+1 1 kompaktem Definitionsbereich
g(x) − g(y) = − = − = 1.
x y y y Sind K kompakt und f : K → K stetig, dann ist f
gleichmäßig stetig auf K.
Damit ist gezeigt, dass g nicht gleichmäßig stetig ist.
9.5 Stetige Funktionen mit kompaktem Definitionsbereich, Zwischenwertsatz 333
Problemanalyse und Strategie: Zunächst werden wir uns eine untere und eine obere Schranke für die Funktionswerte
von f überlegen. Danach werden explizit Stellen angeben, an denen f diese Schranken als Funktionswert hat. Dies
müssen dann Extremalstellen sein.
Beispiel Eine Anwendung der gleichmäßigen Stetigkeit tige Funktion ist und zweitens dass f ein abgeschlossenes
erhält man in dem folgenden Fortsetzungssatz: Intervall als Definitionsbereich hat. In diesem Fall nimmt f
nach dem Existenzsatz für globale Extrema (Seite 331) sein
Ist f : D → K gleichmäßig stetig, dann lässt sich f zu einer
Maximum und sein Minimum an Stellen x + bzw. x − an.
stetigen Funktion f&: D → K fortsetzen.
Ferner ist die gleichmäßige Stetigkeit ein unverzichtbares Zwischenwertsatz von Bolzano
Hilfsmittel, z. B. in der Integralrechnung. Ist f : [a, b] → R eine stetige Funktion mit Minimum
f (x − ) und Maximum f (x + ), so gibt es für jedes y ∈
[f (x − ), f (x + )] eine Zahl x̂ ∈ [a, b] mit
Der Zwischenwertsatz garantiert die Existenz
der Lösung einer Gleichung f (x̂) = y.
Verdeutlichung der Aussage: Die Aussage ist leicht am Da a ∈ A liegt, ist diese Menge garantiert nichtleer. Au-
Graphen einer stetigen Funktion wie dem in der Abbildung ßerdem ist die Menge beschränkt, denn offensichtlich ist
einzusehen. Die Niveaulinie zu y muss bei einer stetigen A ⊆ [a, b]. Somit hat A ein Supremum, das wir mit x̂
Funktion offensichtlich den Graphen schneiden. Genau an bezeichnen.
einer solchen Stelle liegt die gesuchte Stelle x̂.
Was wissen wir über den Funktionswert von f an der Stelle
f (x) x̂ ? Wenn wir eine gegen x̂ konvergente Folge (xn ) aus A
betrachten, so folgt aufgrund der Stetigkeit von f , dass
y ist.
Nun müssen wir noch zeigen, dass f (x̂) = y gilt, d. h.,
f (x − ) wir müssen f (x̂) < y ausschließen. Dazu bietet es sich
an, einen Widerspruch zu konstruieren. Nehmen wir an,
a A x̂ x+ x− b x f (x̂) < y. Dann muss wegen der Stetigkeit von f auch in
einer hinreichend kleinen Umgebung von x̂ diese Abschät-
zung gelten. Insbesondere existieren Stellen x zwischen x̂
Diskussion der Beweisidee: Da wir für eine beliebige und x + , für die f (x) < y ist. Dies ist aber ein Widerspruch
stetige Funktion die Stelle x̂ sicher nicht explizit ange- dazu, dass x̂ das Supremum von A ist. Für den formalen
ben können, müssen wir abstrakter argumentieren, um die Beweis ist diese Argumentation sauberer zu formulieren.
Existenz einer solchen Stelle zu zeigen. Es bieten sich auf Mit der ε-δ-Beschreibung der Stetigkeit wird im Beweis
Grundlage des bisher Bewiesenen zwei Möglichkeiten an, eine Zahl x̃ ∈ [x̂, x + ] konstruiert, für die f (x̃) < y gilt.
die beide wesentlich auf dem Vollständigkeitsaxiom auf- Somit ist x̃ ein Element von A, aber größer als x̂.
bauen. Entweder konstruieren wir explizit eine Folge (xn ),
zu der wir Konvergenz in [a, b] zeigen können, und ver- Mit diesen Überlegungen haben wir den Fall f (a) < y
suchen die Stetigkeit von f zu nutzen, um zu beweisen, vollständig erledigt. Für den Fall f (x̂) > y können wir
dass im Grenzfall gerade der Funktionswert y angenom- den Graphen von f an der Niveauline f (x) = y spiegeln.
men wird. Alternativ können wir versuchen, die Stetigkeit Dies entspricht dem Betrachten von g(x) = y − f (x),
zu nutzen, um eine Teilmenge von [a, b] zu finden, deren x ∈ [a, b]. Im Fall f (a) = y haben wir mit a schon
Supremum gerade die gesuchte Stelle ist. In beiden Fällen die Zwischenstelle gefunden. Insgesamt haben wir einen
besteht ein Beweis aus zwei Teilen. Man muss die Existenz vollständigen Beweis erarbeitet.
von x̂ sicherstellen und sich überlegen, dass f (x̂) = y gilt.
Im Haupttext wurde die zweite Möglichkeit für den Be- Bemerkungen:
weis gewählt. Ein erster rigoroser Beweis des Zwischenwertsat-
zes wurde vom Mathematiker Bernard Bolzano
(1781–1848) in einer Arbeit aus dem Jahre 1817 ausge-
Umsetzung der Idee: Wir beschränken uns zunächst auf
führt. Unabhängig erschien vier Jahre später ein Beweis
den in der Abbildung dargestellten Fall, dass f (a) < y
durch Augustin Louis Cauchy (1789–1857).
ist. Anschaulich ist klar, dass es zwischen a und x + min-
Das Vollständigkeitsaxiom wird nicht nur im Be-
destens einen Schnittpunkt mit der Niveaulinie f (x) = y
weis verwendet, es ist auch fundamental dafür, dass
gibt. Um diesen zu konstruieren, definieren wir die Menge
die Aussage überhaupt gilt. Konstruieren Sie selbst
A durch
ein Gegenbeispiel im Fall einer stetigen Funktion
A = {x ∈ [a, x + ] | f (x) ≤ y} . f : [a, b] ∩ Q → Q.
Beispiel Der Zwischenwertsatz hat viele Anwendungen Zur Beantwortung betrachten wir die Funktion f : [0,59] →
bei Betrachtungen zu Durchschnittswerten. Als Aufgaben- R, die jedem t diejenige Strecke f (t) zuordnet, die das Flug-
stellung betrachten wir folgendes Problem: Ein Flugzeug legt zeug im Zeitintervall [t, t + 1] zurücklegt. Die Aufgaben-
in einer Stunde eine Strecke von 240 km zurück. Gibt es eine stellung macht die Annahme plausibel, dass diese Funktion
Minute, in der es exakt 4 km zurücklegt? stetig ist.
336 9 Funktionen und Stetigkeit – ε trifft auf δ
Wäre nun f (t) > 4 für alle t ∈ [0, 59], so würde das Flug- Ist g(c) = 0, so ist f (c) = y. Ist dagegen g(c) > 0, so
zeug eine Strecke von mehr als 240 km zurücklegen. Es gibt ist g(d) < 0 und umgekehrt. Also gibt es nach dem Null-
also ein t1 mit f (t1 ) ≤ 4. Genauso überlegen wir uns, dass stellensatz ein x̂ ∈ [c, d] ⊆ [a, b] mit g(x̂) = 0. Dann ist
es ein t2 mit f (t2 ) ≥ 4 gibt. Der Zwischenwertsatz liefert f (x̂) = y.
10
Der Nullstellensatz ist ein äquivalente
Formulierung des Zwischenwertsatzes
Zwischenwertsatz
Stetige Funktion mit abgeschlossenem Intervall als De- y
finitionsbereich:
f : [1, 3] → R, f (x) = x 2 .
Funktionen nützlich sind. Wir beginnen mit einer Aussage Wir nehmen zunächst an, dass x kein Randpunkt von I ist.
über Bilder von Intervallen unter stetigen Funktionen. Für Dann können wir ε > 0 so wählen, dass [x − ε, x + ε] ⊆ I
kompakte Intervalle ist diese Aussage aus dem bereits ge- ist. Da f streng wächst erhalten wir
zeigten sofort ersichtlich, für allgemeine Intervalle sind je-
doch allgemeinere Überlegungen nötig. f (x − ε) < y < f (x + ε) .
Wir wählen nun u < v in f (I ). Dann gibt es x, y ∈ I mit Ist x linker bzw. rechter Randpunkt von I , so ist wegen der
f (x) = u, f (y) = v. Setze a = min{x, y}, b = max{x, y}. strengen Monotonie auch y linker bzw. rechter Randpunkt
Nach dem Zwischenwertsatz gib es nun zu jedem w ∈ (u, v) von f (I ). Beachtet man dies, so geht der Beweis in diesen
ein z ∈ [a, b] mit f (z) = w. Es folgt w ∈ f (I ), was zu Fällen ganz analog.
zeigen war.
Beweis: Wir betrachten drei Zahlen a < b < c aus I . für k ∈ N0 an. Für x ≥ 0 sind diese Funktionen streng mono-
ton. Nach der eben bewiesenen Aussage, sind ihre Umkehr-
Angenommen es gilt f (a) < f (b) und f (c) < f (b). Setze funktionen
y = max{f (a), f (c)}. Dann ist f (a) ≤ y < f (b), und nach −1 √
dem Zwischenwertsatz gibt es ein x̂ ∈ [a, b] mit f (x̂) = y. fk |R≥0 (y) = k y, y ∈ R≥0
Andererseits ist auch f (c) ≤ y < f (b), und es gibt somit
nach dem Zwischenwertsatz ein x̃ ∈ [b, c] mit f (x̃) = y. ebenfalls stetig. Ist k ungerade, so ist fk sogar auf ganz R
Da y < f (b), ist x̂ = b und x̃ = b. Somit folgt x̂ < b < x̃ streng monoton, die Umkehrfunktion existiert also auf ganz
und f (x̂) = y = f (x̃). Dies ist aber im Widerspruch dazu, R und ist dort stetig. In diesem Sinne können wir für y < 0
√
dass f injektiv ist. die Zahl k y als eindeutig bestimmte negative Lösung der
Gleichung x k = y auffassen. Hierbei ist aber etwas zu be-
Ganz analog behandeln wir den Fall f (a) > f (b) und achten: Im Kapitel 11 werden wir die allgemeine Potenz y α
f (c) > f (b). Da Gleichheit wegen der Injektivität von f für α ∈ R und y ∈ C \ {0} erklären. Die Zahl y 1/k stimmt
ausgeschlossen werden kann, folgt entweder f (a) < f (b) dabei für y < 0 und k ∈ N nicht mit der eben gefundenen
< f (c) oder f (a) > f (b) > f (c). Somit ist f streng mo- k-ten Wurzel überein, sondern es handelt sich um eine im All-
noton. gemeinen andere, komplexe Lösung der Gleichung x k = y.
Man spricht in diesem Zusammenhang auch von den Haupt-
Aus dem eben bewiesenen Lemma ergibt sich noch eine Fol- und Nebenwerten der k-ten Wurzeln. Mehr dazu im Kapi-
gerung zur Stetigkeit von Umkehrfunktionen. tel 11.
wissen, dass eine Lösung existiert. Sonst liefert der Computer dreifache Nullstelle, . . . ). Die Anzahl der Faktoren, die die-
vielleicht irgendetwas Zufälliges als Ergebnis, das mit dem selbe Nullstelle enthalten, nennt man auch Vielfachheit die-
eigentlichen Problem nichts zu tun hat. Schließlich kann man ser Nullstelle (siehe Abschnitt 3.4).
auch manchmal durch geschicktes Anwenden von Existenz-
aussagen ein Berechnungsverfahren entwickeln. Das Bei-
spiel auf Seite 340 illustriert dies. Beweis: Wir schreiben das Polynom p in der Form
!
n
p(z) = αj zj
Der Fundamentalsatz der Algebra: Jedes j =0
komplexe Polynom vom Grad n ist ein
Produkt von genau n Linearfaktoren mit Koeffizienten αj ∈ C. Wir können annehmen, dass
αn = 1 ist, denn beim Teilen der Gleichung p(z) = 0 durch
Mit dem letzten Satz dieses Kapitels, dem Fundamentalsatz αn würde sich an der Lage der Nullstelle nichts ändern.
der Algebra wollen wir noch einmal unterstreichen, wie trag- (i) Wir zeigen, dass |p| ein globales Minimum besitzt.
fähig die in diesem Kapitel gewonnen Aussagen tatsächlich
sind. Der Name Fundamentalsatz deutet bereits darauf hin, Wir setzen nun f (z) = |p(z)|. Die Funktion f : C → R
dass es sich bei dieser Aussage um einen besonders bedeuten- ist stetig und reellwertig. Wir wollen nun zeigen, dass
den Satz handelt. Umso erstaunlicher ist es, dass wir ihn mit f (z) ≥ f (0) ist, falls |z| groß genug ist. Wir setzen
den bisher gewonnen Mitteln bereits beweisen können. Der C = max{1, (2f (0))1/n , 2 n−1 j =0 |αj |} und betrachten z mit
Satz garantiert die Existenz von Nullstellen von Polynomen |z| ≥ C. Die Konstante C ist gerade so geschickt gewählt,
im Komplexen. dass wir nun abschätzen können:
) )
) !
n−1 )
Fundamentalsatz der Algebra )
n)
)
j −n )
f (z) = |z| )1 + αj z )
Jedes Polynom p : C → C vom Grad n ≥ 1 besitzt ) j =0 )
mindestens eine Nullstelle. ⎛ ⎞
1 ! |αj |
n−1
≥ |z|n ⎝1 − ⎠
Wichtig bei dieser Aussage ist natürlich, dass wir im Komple- |z| |z|n−j −1
j =0
xen arbeiten müssen. Es ist ja hinlänglich bekannt, dass eine ⎛ ⎞
1 !
n−1
quadratische Gleichung im Reellen eben keine Lösung haben |z|≥1
n⎝
≥ |z| 1 − |αj |⎠
muss. Sehr wohl gibt es aber immer Lösungen im Komple- |z|
j =0
xen. Z. B. gilt:
n−1
|z|≥2 |αj |} ' (
2
x + 1 = (x + i)(x − i). j =0 1
≥ |z|n 1 −
2
Es ist keine reelle Nullstelle vorhanden, aber die komplexen |z|≥(2f (0))1/n
Nullstellen ±i. ≥ f (0).
Aus dem Kapitel 4 wissen wir bereits, dass für eine Nullstelle
z0 stets ein Linearfaktor aus dem Polynom ausgeklammert Aus dieser Rechnung folgt also, dass ein globales Minimum
werden kann: von f , falls es existiert, auf jeden Fall im Kreis |z| ≤ C ange-
nommen wird. Dieser Kreis ist aber eine kompakte Menge.
p(z) = (z − z0 ) q(z),
Da f stetig ist, folgt also aus dem Existenzsatz für globale
wobei q einen um eins geringeren Grad als p besitzt. Der Extrema, dass das Minimum von f im Kreis |z| ≤ C ange-
Fundamentalsatz sagt nun aus, dass auch q wieder eine Null- nommen wird. Die zugehörige Minimalstelle bezeichnen wir
stelle besitzt, solange es noch nicht eine Konstante ist. Wie mit ẑ.
verträgt sich dies damit, dass manche Polynome nur eine ein-
(ii) Wir zeigen: Der Wert von p an der Stelle ẑ ist 0.
zige Nullstelle haben? Die Antwort ist, dass natürlich auch
q wieder z0 als Nullstelle besitzen kann. Es folgt, dass man Von Seite 309 wissen wir, dass wir das Polynom p um ẑ
bei Verwendung von komplexen Zahlen, ein Polynom vom entwickeln können, also als
Grad n stets als ein Produkt von n Linearfaktoren schreiben
kann: !
n
p(z) = β0 + βj (z − ẑ)j
p(z) = (z − z0 )(z − z1 ) · · · (z − zn−1 ), j =k
wobei die Nullstellen zj ∈ C nicht alle verschieden sein müs- schreiben. Hierbei ist k eine natürliche Zahl zwischen 1 und
sen. Kommt eine Nullstelle mehr als einmal vor, so spricht n, die so gewählt wird, dass βk = 0 ist. Da p mindestens den
man von mehrfachen Nullstellen (etwa doppelte Nullstelle, Grad 1 hat, gibt es ein solches k auch sicherlich.
340 9 Funktionen und Stetigkeit – ε trifft auf δ
Problemanalyse und Strategie: Der Nullstellensatz garantiert die Existenz mindestens einer Nullstelle der Funktion
in im Intervall [a, b]. Zur Approximation einer Nullstelle wollen wir eine Folge konstruieren, die gegen eine Nullstelle
konvergiert. Die Grundidee ist es, den Funktionswert an der Stelle (a + b)/2 zu betrachten. Entweder liegt dort eine
Nullstelle vor, oder in einem der beiden so entstandenen Teilintervalle kann wieder der Nullstellensatz angewandt werden.
So lässt sich rekursiv fortfahren.
f (x)
Lösung:
Es ist f : [a, b] → R stetig, und es gilt f (a) · f (b) < 0.
y3 = y4
b = y0 =
Nach dem Nullstellensatz existiert eine Nullstelle x̂ von f
y1 = y2
im Intervall [a, b]. Allerdings ist es möglich, dass mehrere
Nullstellen existieren, wie die Abbildung illustriert.
x
x1
x2 = x3
a = x0
x4
f (x)
Wir wollen nun annehmen, dass p keine Nullstelle besitzt. Damit wiederum erhalten wir
Dann ist insbesondere auch β0 = 0. Wir betrachten nun die
Gleichung zk = −β0 /βk . Diese besitzt im Komplexen stets εk
|p(ẑ + εw)| ≤ |β0 | 1 − < |β0 | = |p(ẑ)|.
eine Lösung w. 2
Für ein ε > 0 können wir nun schreiben: Dies ist aber ein Widerspruch, denn ẑ ist eine Minimalstelle
von |p|. Also besitzt p mindestens eine Nullstelle.
!
n
p(ẑ + εw) = β0 + βj (ε w)j
Kommentar: Dieser Beweis des Fundamentalsatzes, der
j =k
so im Wesentlichen im Jahre 1814 vom schweizer Mathema-
!
n
tiker Jean-Robert Argand (1768–1822) geführt wurde, ent-
= β0 + ε k βk wk + βj (ε w)j
hält zwar verschiedene technische Überlegungen, verwendet
j =k+1
aber im Wesentlichen drei fundamentale Aussagen:
!n
βj j −k j
= β0 − ε k β0 + ε k β0 ε w Der Betrag des Werts von Polynomen geht gegen unend-
β
j =k+1 0 lich, wenn das Argument gegen unendlich geht.
⎡ ⎛ ⎞⎤
!n Stetige Funktionen auf kompakten Mengen nehmen ihr
βj j −k j ⎠⎦
= β0 ⎣1 − ε k ⎝1 − ε w . Minimum an.
β0 Die Gleichung zk = u mit u ∈ C \ {0} und k ∈ N besitzt
j =k+1
in C stets eine Lösung. Dies entspricht der Existenz der
Jeder Term in der Summe enthält mindestens den Faktor ε. k-ten Wurzel in C.
Falls also ε klein genug gewählt wird, gilt:
Überlegen Sie sich, wo jede dieser Aussagen verwendet wird.
) )
) ! )
) n βj j −k j ) 1 Neben dem Beweis von Argand gibt es noch viele andere
) ε w )≤ .
) ) 2 Möglichkeiten, den Fundamentalsatz zu beweisen. Beson-
)
j =k+1
β0 )
ders einfache Beweise gelingen mit den Mitteln der Funk-
tionentheorie. Dieses Gebiet der Mathematik umfasst die
Analysis im Komplexen.
Zusammenfassung
Funktionen f : D → W mit D, W ⊆ C sind die grundlegen- lokal, d. h. sie definieren die Stetigkeit einer Funktion in einer
den Bausteine der Analysis. Durch punktweise Addition und einzelnen Stelle x̂.
eine skalare Multiplikation bilden die Funktionen einen Vek-
Ein Funktion f : D → W heißt Lipschitz-stetig, wenn eine
torraum. Zusätzliche Struktur erhalten sie durch die Möglich-
Konstante L > 0 mit der Eigenschaft
keit der Verkettung. Wichtige Klassen von Funktionen sind
die beschränkten und die monotonen Funktionen. |f (x) − f (y)| ≤ L |x − y| für alle x, y ∈ D
Indem man gegen x̂ konvergente Folgen (xn ) aus D und die existiert. Diese Eigenschaft ist global, d. h. sie gilt für den
zugehörigen Folgen der Funktionswerte (f (xn )) betrachtet, ganzen Definitionsbereich D. Insbesondere ist sie stärker als
kann der Grenzwert limx→x̂ f (x) definiert werden. Überle- die Eigenschaft einer Funktion, auf ihrem ganzen Definiti-
gungen zur Vertauschbarkeit dieses Grenzübergangs mit der onsbereich stetig zu sein.
Funktionsanwendung führen auf den Begriff der Stetigkeit.
Wichtige Beispiele stetiger Funktionen sind Polynome. Auch
Definition der Stetigkeit rationale Funktionen sind auf ihrem gesamten Definitionsbe-
reich stetig. Dies gilt ebenso für viele weitere Standardfunk-
Eine Funktion f : D → W heißt an der Stelle x̂ ∈ D
tionen, wie sie im Kapitel 11 über Potenzreihen eingeführt
stetig falls
werden. Eine wichtige Operation ist ferner die stetige Fort-
lim f (x) = f (x̂)
x→x̂ setzung von Funktionen über ihren Definitionsbereich hin-
aus.
gilt. Ist f an jedem x ∈ D stetig, so heißt f auf D stetig.
Die Menge aller auf D stetigen Funktionen bezeichnen Um Eigenschaften stetiger Funktionen zu beschreiben, müs-
wir mit C(D). sen ihre Definitionsbereiche genauer klassifiziert werden.
Hierzu definiert man offene und abgeschlossene Men-
Neben dieser Definition der Stetigkeit über Folgen gibt es gen und den Rand einer Menge. Abgeschlossene Men-
die dazu äquivalente -δ-Definition. Beide Definitionen sind gen können z. B. darüber charakterisiert werden, dass sie die
342 9 Funktionen und Stetigkeit – ε trifft auf δ
Grenzwerte aller konvergenten Folgen aus ihren Elementen Existenzsatz für globale Extrema
enthalten, dass sie ihren Rand enthalten oder dass sie mit
(K. Weierstraß, 1861)
ihrem Abschluss übereinstimmen. Eine offene Menge ent-
hält mit jedem Punkt auch eine Umgebung dieses Punktes. Ist K ⊆ K kompakt und nichtleer, so besitzt jede stetige
Das Komplement jeder abgeschlossenen Menge ist offen und Funktion f : K → R ein globales Maximum und ein
umgekehrt. globales Minimum.
Über offene Mengen lässt sich auch Stetigkeit als globale Ei-
genschaft einer Funktion charakterisieren: Eine Funktion ist Eine weitere zentrale Aussage über stetige reellwertige Funk-
genau dann auf ihrem ganzen Definitionsbereich stetig, wenn tionen ist der Zwischenwertsatz oder der dazu äquivalente
das Urbild jeder offenen Menge wieder offen ist. Diese Aus- Nullstellensatz. Hier muss der Definitionsbereich der Funk-
sage wird in der Topologie als Definition stetiger Abbildun- tion ein Intervall sein.
gen zwischen sogenannten topologischen Räumen genutzt.
Zwischenwertsatz von Bolzano
Ist eine Menge beschränkt und abgeschlossen, so nennt man
sie kompakt. Eine wichtige Charakterisierung kompakter Ist f : [a, b] → R eine stetige Funktion mit Minimum
Mengen ergibt sich aus dem Vollständigkeitsaxiom für R f (x − ) und Maximum f (x + ), so gibt es für jedes y ∈
bzw. C: [f (x − ), f (x + )] eine Zahl x̂ ∈ [a, b] mit
f (x̂) = y.
Bolzano-Weierstraß-Charakterisierung kompakter
Mengen
Eine Teilmenge K ⊆ K ist genau dann kompakt, wenn Der Zwischenwertsatz ist ein wichtiges Werkzeug der Ana-
jede Folge von Elementen aus K eine Teilfolge besitzt, lysis zur Herleitung von Existenzaussagen: Es gibt eine Null-
die gegen einen Punkt aus K konvergiert. stelle, aber wir erhalten keine Information über deren Lage.
Es ergeben sich zahlreiche bedeutende Folgerungen. Eine
sehr bekannte davon sichert die Existenz von Nullstellen von
Die Bilder von kompakten Mengen unter stetigen Funktio-
Polynomen über C.
nen sind wieder kompakt. Eine auf einer kompakten Menge
definierte stetige Funktion ist auch immer gleichmäßig ste-
tig. Da kompakte Teilmengen von R stets ihr Maximum und Fundamentalsatz der Algebra
ihr Minimum enthalten, erhalten wir eine zentrale Aussage
Jedes Polynom p : C → C vom Grad n ≥ 1 besitzt
über stetige reellwertige Funktionen mit kompaktem Defini-
mindestens eine Nullstelle.
tionsbereich.
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
⎨ 1 , x = p , p, q ∈ N teilerfremd, und
q q
f (x) = g(x) = x + 1.
⎩0, sonst.
Zeigen Sie, dass die Graphen der Funktionen mindestens vier
In welchen Punkten ist f stetig? Schnittpunkte haben.
Rechenaufgaben
Beweisaufgaben
9.9 • Berechnen Sie die folgenden Grenzwerte:
9.15 • Gegeben sind zwei stetige Funktionen f ,
x 4 − 2x 3 − 7x 2 + 20x − 12 g : R → C mit f (x) = g(x) für alle x ∈ Q. Zeigen Sie
(a) lim 4
x→2 x − 6x 3 + 9x 2 + 4x − 12 f (x) = g(x) für alle x ∈ R.
344 9 Funktionen und Stetigkeit – ε trifft auf δ
9.16 ••• Sei D ⊆ C. 9.20 •• Es soll gezeigt werden, dass ein abgeschlosse-
nes Intervall [a, b] die Heine-Borel-Eigenschaft besitzt. Ge-
(a) Zeigen Sie: Sind f1 , . . . , fn : D → R stetig, so ist auch
geben ist ein System U von offenen Mengen mit
g mit
[a, b] ⊆ V.
g(x) = max fj (x), x ∈ D, V ∈U
j =1,...,n
Man sagt, die Elemente V von U überdecken [a, b]. Betrach-
stetig. ten Sie die Menge
(b) Es seien fj : D → R, j ∈ N stetig, und es existiere die
Funktion g, die durch M = {x ∈ [a, b] | [a, x] wird durch
endlich viele V aus U überdeckt.} .
g(x) = sup fj (x), x ∈ D,
j ∈N
Zeigen Sie:
definiert ist. Zeigen Sie durch ein Gegenbeispiel, dass g (a) M besitzt ein Supremum.
nicht stetig sein muss. (b) Das Supremum von M ist gleich b.
9.17 •• Gegeben ist eine stetige Funktion f : [0, 1] → R 9.21 • Gegeben ist eine stetige Funktion f : [a, b] →
mit f (0) = f (1). Zeigen Sie: Für jedes n ∈ N gibt es ein R. Für alle x ∈ (a, b) soll es ein y ∈ (x, b] geben mit f (y) >
x̂ ∈ [0, (n − 1)/n] mit f (x̂) = f (x̂ + n1 ). f (x). Für a soll dies nicht gelten. Zeigen Sie, dass f (x) ≤
f (b) für alle x ∈ (a, b) gilt, sowie f (a) = f (b).
In der englischen Literatur wird diese Aussage auch als Ri-
Schinken (M2 )
sing Sun Lemma bezeichnet. Den Grund für diesen Namen
gibt die Abbildung 9.33 wieder.
f (x)
Brot (M1 )
Abbildung 9.32 Wie teilt man ein Schinkenbrot gerecht in zwei Teile?
9.18 ••• Auf einer Scheibe Brot liegt eine Scheibe Schin-
ken, wobei die beiden nicht deckungsgleich sein müssen
(Abb. 9.32). Zeigen Sie, dass man mit einem Messer das a b x
Schinkenbrot durch einen geraden Schnitt fair teilen kann, Abbildung 9.33 Die Voraussetzungen des Rising-Sun-Lemmas charakterisieren
d. h., beide Hälften bestehen aus gleich viel Brot und Schin- Intervalle, auf denen der Graph der Funktion nicht von den Strahlen der im
ken. Machen Sie zur Lösung geeignete Annahmen über ste- Unendlichen aufgehenden Sonne getroffen wird.
tige Abhängigkeiten.
9.22 • Zeigen Sie: Jedes Polynom ungeraden Grades
9.19 •• Zeigen Sie: Eine Teilmenge von R mit leerem mit reellen Koeffizienten hat mindestens eine reelle Null-
Rand ist entweder die leere Menge oder ganz R. stelle.
S. 315 S. 326
Ist f eine auf D definierte Funktion, so besagt die Existenz Aufgrund der Charakterisierung des Randes einer Menge mit
der rechten Seite, dass x̂ ∈ D liegt und diese rechte Seite dem Abschluss (Seite 324) ist
gleich f (x̂) ist. Existiert Grenzwert links und ist x̂ ∈ D, so
ist dieser definitionsgemäß ebenfalls gleich f (x̂). ∂∅ = ∂ R = ∅ ∩ R .
S. 315 Der Abschluss der leeren Menge ist aber die leere Menge,
Alle Kombinationen sind erlaubt. Es gelte z. B. die Definition da man keine konvergenten Folgen aus ihr auswählen kann
mit ≤ in den Ungleichungen. Wir geben ε > 0 vor. Dann und sie ergo auch keine Grenzwerte solcher Folgen enthält.
existiert ein δ mit |f (x) − f (x̂)| ≤ ε/2 für alle |x − x̂| ≤ δ. Es folgt ∂∅ = ∂ R = ∅.
Dann gilt erst recht |f (x) − f (x̂)| ≤ ε/2 für alle |x − x̂| < δ. In einer Beweisaufgabe zu diesem Kapitel ist zu zeigen, dass
Da ε/2 < ε für jedes ε > 0 ist, folgt die Aussage mit echten ∅ und R sogar die einzigen Teilmengen von R mit leerem
Ungleichungen. Rand sind.
Ganz analog zeigt man die Äquivalenz für alle anderen Kom-
binationen der Ungleichungszeichen. S. 327
Es ist
∞ '
(
S. 319 1 1
− , = {0} ,
Sofern f (x) = 0 für alle x ∈ D ist, bildet 1/f eine multi- n=1
n n
plikative Inverse. Mit dieser und der Addition, mit allen zu-
und die Menge {0} ist nicht offen. Außerdem gilt:
gehörigen Regeln, handelt es sich bei C(D) um einen Ring.
Allerdings gibt es zu einer Funktion mit einzelnen Nullstel- ∞ B
C
1 1
len keine multiplikative Inverse, obwohl diese Funktion nicht , = (0, 1] ,
n+1 n
die Nullfunktion ist. n=1
S. 325 S. 334
Aus Intervallen werden Flächen. Funktion mit einem Sprung.
f : (−1, 1) → R, f (x) = x. Die Randpunkte y = −1
S. 326 bzw. y = 1 werden nicht angenommen.
Beispielsweise diese Intervalle: D = (0, 1) und D = [0, 1]∪ f : [−2, 0] ∪ [1, 2] → R, f (x) = x. Der Wert y = 1/2
[2, 3]. zwischen −2 und 2 wird nicht angenommen.
Reihen – Summieren
bis zum Letzten 10
Schon wieder Achilles und die
Schildkröte?
Wie definiert man eine Summe
mit unendlich vielen
Summanden?
Was ändert eine Umordnung
der Reihenglieder?
Was besagt das
Quotientenkriterium?
In diesem Kapitel kehren wir wieder zu den Folgen zurück. Maß nachlässt? Anders gefragt, wie viel ist
Allerdings werden wir uns nun mit einer Klasse von Folgen be- 1 1 1 1
schäftigen, bei denen die Folgenglieder als Summen dargestellt S =1+ + + + + . . .?
2 3 4 5
werden. Solche Objekte nennt man Reihen.
1
Man stößt bei mathematischen Betrachtungen, aber auch in 1
Anwendungen, auf ganz natürliche Art und Weise auf Reihen: 2
1
Die Dezimaldarstellung der reellen Zahlen kann man als eine 3
1
Reihe auffassen. Ein Beispiel wird die korrekte Austarierung 4 1
eines Mobiles betreffen. Und schließlich werden wir es in vielen 5 1
6 1
der folgenden Kapitel zur Analysis mit Reihen zu tun bekommen, 7
sei es bei der Darstellung von Standardfunktionen wie Sinus, Abbildung 10.1 Grafische Darstellung von 1 + 12 + 13 + 14 + 15 + . . .
Kosinus und der Exponentialfunktion oder bei der Definition von
Integralen. Der Schildkröte geht es noch viel schlechter. Nicht nur
lässt ihre Leistung im gleichen Maß nach wie die von
Im Gegensatz zu den meisten Beispielen, die wir im Kapitel über
Achilles, es ist auch ihr Orientierungssinn so beeinträch-
Folgen kennengelernt haben, ist es bei typischen Beispielen
tigt, dass sie immer, nachdem sie eine Minute in eine Rich-
für Reihen oft sehr schwierig, den Grenzwert tatsächlich zu
tung marschiert ist, plötzlich kehrtmacht und in die genau
bestimmen. Aber es gibt ausgefeilte Werkzeuge, sogenannte
entgegengesetzte Richtung aufbricht. Wie weit wird sie
Konvergenzkriterien, um festzustellen, ob eine Reihe konvergiert
damit letztendlich kommen? Wiederum in Zahlen gegos-
oder divergiert.
sen, wie viel ist
Die historische Schreibweise für Reihen ist die als eine Summe 1 1 1 1
mit unendlich vielen Summanden. Diese Notation ist gleicher- S = 1 − + − + ∓ . . .?
2 3 4 5
maßen praktisch wie verwirrend, suggeriert sie doch eine Ana-
logie zwischen Summen und Reihen. Allerdings gibt es ent- 1
scheidende Unterschiede. Zum Beispiel darf die Reihenfolge der 1/2
Glieder bei einer Reihe im Gegensatz zu einer Summe im All- 1/3
1/4
gemeinen nicht vertauscht werden. Eine Ausnahme von dieser 1/5
1/6
Regel bilden die absolut konvergenten Reihen. Solchen Reihen 1/7
begegnet man in Gestalt von Potenzreihen, die das Thema des Abbildung 10.2 Grafische Darstellung von 1 − 12 + 13 − 14 + 15 ∓ . . .
Kapitels 11 bilden, sehr häufig. Da sie ein wesentliches Hilfs-
mittel zur Darstellung vieler Funktionen sind, bilden sie einen
Derartige Fragestellungen haben uns in Kapitel 8 auf den
zentralen Bestandteil des Fundaments der Analysis.
Begriff der Folge und letztlich zu den Konzepten von Kon-
vergenz und Grenzwert geführt. Folgen können ganz allge-
meine Bildungsgesetze haben, während sich die obigen Bei-
spiele dadurch auszeichnen, dass zu einem vorangegangenen
10.1 Motivation und Definition Wert ständig Zahlen, manchmal eben auch negative, addiert
werden.
Viele Probleme scheinen auf das Summieren Was spricht denn nun dagegen, mit „unendlichen Summen“
unendlich vieler Zahlen hinauszulaufen der Art
1 1 1 1 1
Wir hatten es bereits mit Aufgabenstellungen zu tun, bei de- S = 1 − + − + − ± . . .
2 3 4 5 6
nen es darum ging, eine unendlich große Menge von Zah-
genauso zu hantieren, wie mit bekannten endlichen Summen?
len aufzusummieren. Das Paradoxon über den Wettlauf von
Wir wollen zeigen, in welche Widersprüche man sich beim
Achilles und der Schildkröte in Abschnitt 8.2 ist ein Beispiel
naiven Umgang mit solchen Konstrukten verstricken kann.
dafür, das sich auch noch in verschiedener Art und Weise
Dazu addieren wir das 1/2-fache von S zu S :
variieren lässt:
S = 1 − 12 + 13 − 14 + 15 − 16 ± . . .
1 1
Beispiel 2S = 2 − 14 + 16 ∓ . . .
Nach dem Wettkampf mit der Schildkröte ist Achilles er- 3
2S = 1 + 13 − 12 + 15 ±...
schöpft, und das Laufen wird auf dem Weg nach Hause
mit jedem Meter anstrengender. Während er in der ersten Alle Summanden aus S mit positivem Vorzeichen sind auch
Minute noch einen Kilometer schafft, ist es in der zweiten in der Summe unverändert. Die Summanden mit negativem
Minute nur noch ein halber, in der dritten nur noch ein drit- Vorzeichen tauchen ebenfalls alle wieder auf, nur an anderen
tel, in der vierten gar nur noch ein viertel Kilometer. Wie Stellen. Wir scheinen als Ergebnis der Addition wieder S er-
weit kommt Achilles, wenn sein Tempo weiter in diesem halten zu haben, denn alle Glieder der ursprünglichen Summe
10.1 Motivation und Definition 349
kommen, wenn auch in veränderter Reihenfolge, wieder vor. Für die Reihe selbst schreiben wir
Damit erhielten wir n ∞ ∞
3 ! !
S = S ak oder kurz ak .
2 k=1 k=1
n=1
und daher S = 0. Das kann aber nicht sein, da
Es ist allerdings in der Literatur auch üblich, sowohl die Reihe
1 1 1 1 1 1
S = 1 − + − + − ± . . . > als auch, im Falle der Konvergenz, ihren Wert mit dem Sym-
2 3 4 5 6
2 bol
!∞
= 12 >0 >0
ak
ist. Auch die Lösung Unendlich kommt nicht infrage, denn k=1
wir erhalten ja zu bezeichnen. Die ak nennt man Reihenglieder.
1 1 1 1 1 1
S = 1 − + − + − + ∓ . . . < 1.
Kommentar: Die Notation für Reihen und für den Rei-
3 4
5 6
7
2
<0 <0 <0 henwert erinnert stark an die Vereinigung oder den Schnitt
von abzählbar vielen Mengen:
Woher dieser Widerspruch kommt, werden wir in Abschnitt
10.3 aufklären. ∞
∞
An bzw. An .
Um die Arbeit mit unendlichen Summen auf eine solide n=1 n=1
Grundlage zu stellen, werden wir das Konzept der Reihen
Es handelt sich aber um mathematisch grundverschiedene
als Zahlenfolgen mit speziellen Bildungsgesetzen einführen.
Konstruktionen: Im Fall der Mengen kann zum Beispiel die
Über die Begriffe der Konvergenz und des Grenzwerts wird
Vereinigung mit Mitteln der elementaren Mengenlehre ex-
ein widerspruchsfreies Arbeiten möglich sein.
plizit geschrieben werden:
∞
Reihen werden als spezielle Folgen definiert An = {x | x ∈ An für ein n ∈ N} .
n=1
Statt nun also mit unendlichen Summen zu arbeiten, werden
Im Falle des Reihenwerts geht es um Grenzwerte. Der Um-
wir Folgen endlicher Summen betrachten. Wir gehen dazu
gang mit dem Ausdruck und sogar dessen Existenz ist hier
von einer beliebigen Folge (ak ) aus. Zu dieser Folge definie-
an Bedingungen geknüpft.
ren wir die Folge der Partialsummen mittels
s1 = a1 Ob der Summationsindex der Reihe k oder anders heißt, spielt
s2 = a1 + a2 natürlich keine Rolle, und auch ob die Summation bei eins
s3 = a1 + a2 + a3 oder einer anderen ganzen Zahl beginnt, ändert nichts an der
grundlegenden Definition – je nach Art der Summationsvor-
..
. schrift aber oft den Wert der Reihen.
Allgemein gilt also:
sn sn
!
n
sn = ak .
k=1
Die Folge (sn ) kann nun auf Konvergenz untersucht und mög-
licherweise ihr Grenzwert bestimmt werden.
Von dieser Folge können wir sofort sagen, dass sie sicher Diese Formel wird uns in der gesamten Analysis in den unter-
nicht konvergiert. Damit besitzt die Reihe keinen Grenzwert schiedlichsten Zusammenhängen immer wieder begegnen.
und das Symbol Für den Spezialfall q = 12 ergibt sich
!∞
(−1)n !∞
1 1
n=0 = = 2,
∞ n
2k 1− 1
hat keine Bedeutung. ist eine divergente k=0 2
n=0 (−1)
Reihe.
wie es auch die grafische Anschauung in der Abbildung 10.4
Mathematisch gesehen gibt es keine Summen mit unendlich nahelegt.
vielen Summanden, sondern eben Folgen von Partialsum-
men. Trotzdem wird die Schreibweise
∞
! 1
ak = a1 + a2 + a3 + . . . 2
k=1
häufig verwendet, und auch wir werden uns dieser Praxis 1
manchmal anschließen. Sie ist als ein neues Symbol für den 1
8
Grenzwert einer konvergenten Folge von Partialsummen zu 1
sehen, sofern dieser existiert. 4
1
16
Manchen wichtigen Reihen begegnet man Abbildung 10.4 Grafische Darstellung des Werts einer geometrischen Reihe
immer wieder mit q = 1/2.
Bestimmte Typen von Reihen sind in der Mathematik und Für |q| ≥ 1 divergiert die geometrische Folge (q n+1 ) und da-
ihren Anwendungen von großer Bedeutung. Die wichtigsten mit auch die geometrische Reihe. Das Konvergenzverhalten
werden wir nun kennenlernen und dabei auch gleich den Um- der geometrischen Reihe wird in Abbildung 10.5 dargestellt.
gang mit Reihen üben.
Nehmen
wir
als erstes konkretes Beispiel die Reihe
∞ 1
k=0 2k . Für endliche Summen von analoger Gestalt mit
beliebigem q ∈ C gilt die geometrische Summenformel
(siehe Seite 129) Divergenz
i
!
n
1 − q n+1
qk = .
1−q
k=0
Falls |q| < 1 ist, geht q n+1 gegen null für n → ∞. Daher Konvergenz
konvergiert in diesem Fall die entsprechende Reihe, und es
gilt: −1 0 1
∞
! !
n
1 − q n+1 1
q k = lim q k = lim = .
n→∞ n→∞ 1 − q 1−q
k=0 k=0
Für |q| > 1 ist der mit der geometrischen Summenformel −i
gewonnene Ausdruck unbeschränkt. Für |q| = 1 erhält man
die Divergenz der Reihe mit dem Nullfolgenkriterium (siehe
Seite 353). Im Vorgriff darauf erhalten wir die folgende all-
gemeine Aussage.
Als Modell untersuchen wir ein Mobile aus (unendlich Drehmomente: einerseits verursacht durch die Gewichts-
vielen) gleichartigen Stäben konstanter Massendichte, die kraft des Stabes selbst, die in unserer Skizze gegen den
untereinander hängen und bei gleichbleibender Dicke je- Uhrzeigersinn drehen würde, andererseits durch die Ge-
weils um einen konstanten Faktor q kürzer werden. Die wichtskraft aller darunter hängenden Stäbe, die im Uhr-
Stäbe nummerieren wir beginnend bei null durch und be- zeigersinn dreht.
zeichnen die Hälfte ihrer Längen mit Lj , j = 0, 1, 2, . . .
Für das erste Moment erhalten wir g d Mj , wobei Mj
Es gilt dann:
die Gesamtmasse des j -ten Stabes ist, die wir uns am
Ln = L0 q n , n ∈ N0 .
Schwerpunkt x = 0 vereinigt denken können. g ist
dabei die Erdbeschleunigung. Das zweite Moment ist
g (a − d) ∞ n=j +1 Mn .
Eine reelle Zahl lässt sich als Dezimalzahl gilt. Für x = 0 ist dies offensichtlich. Nach der Konstruktion
schreiben der an für x > 0 gilt für alle N ∈ N
' (N !
N −1 ' (n ' (N
Im Kapitel 4 haben wir schon die Dezimalschreibweise für 1 1 1
aN <x− an ≤ (aN + 1) .
natürliche Zahlen kennengelernt. Wir wollen diese jetzt mit 10 10 10
n=1
Hilfe von Reihen auf beliebige reelle Zahlen erweitern. Da
wir auf die Darstellung natürlicher Zahlen zurückgreifen Somit folgt
können, reicht es aus, das Intervall [0, 1] zu betrachten.
!
N ' (n ' (N
Unter einer Dezimaldarstellung einer Zahl x ∈ [0, 1] verste- 1 1
0<x− an ≤ , N ∈ N.
hen wir eine Reihe 10 10
n=1
!∞ ' (n
1
x= an Da die obere Schranke gegen null geht, bedeutet dies die
10 Konvergenz der Reihe gegen x.
n=1
mit an ∈ {0, . . . , 9}, n ∈ N. Zunächst halten wir fest, dass Die Zahl 10 im Nenner bei diesen Überlegungen führt zwar
jede Reihe dieser Form konvergiert (siehe Aufgabe 10.14). auf die wohlbekannte Dezimaldarstellung, ist aber willkür-
lich gewählt. Wie auch bei der Darstellung der natürlichen
Allerdings stellt man fest, dass die Dezimaldarstellung in
Zahlen können wir stattdessen eine beliebige Zahl g ∈ N≥2
dieser Allgemeinheit nicht eindeutig ist. Offensichtlich ist
verwenden und die Überlegung funktioniert analog.
1
= 0.5 = 0.500 000 000 000 . . .
2 g-adische Entwicklung der reellen Zahlen
Andererseits erhält man aber auch: Gegeben sei g ∈ N≥2 . Zu jeder reellen Zahl x ∈ [0, 1] gibt
4 9 9 9 es eine eindeutig bestimmte Folge (an ) aus {0, . . . , g−1}
0.499 999 99 . . . = + + + + ... mit
10 100 '1 000 10 000 ( ∞
!
=
4
+
9
· 1+
1
+
1
+ ... x= an g −n
10 100 10 100 n=1
∞ ' (
4 9 ! 1 k mit
= + ·
10 100 10 !
N
k=0 x> an g −n , N ∈ N, für x > 0
4 9 1 n=1
= + · 1
10 100 1 − 10 und an = 0, n ∈ N für x = 0.
4 9 10 5 1
= + · = =
10 100 9 10 2
Achtung: Im Falle von Zahlen mit nicht abbrechender g-
Man hat also zwei unterschiedliche Dezimaldarstellungen adischer Entwicklung (irrationale Zahlen oder solche mit pe-
derselben Zahl gefunden. riodischer Entwicklung) entspricht die so konstruierte Dar-
Wir wollen daher eine Vorschrift angeben, die einerseits eine stellung der üblicherweise verwendeten, etwa in der Dezi-
eindeutige Darstellung garantiert, mit der sich aber anderer- maldarstellung
seits auch nachweisen lässt, dass es für jede reelle Zahl aus
[0, 1] tatsächlich eine Dezimaldarstellung gibt. Dies geht fol- π = 3.141 592 653 589 793 238 462 643 383 279 . . .
gendermaßen:
Im Falle einer rationalen Zahl, bei der die übliche Darstel-
Ist x = 0, so setze an = 0 für alle n ∈ N. lung abbricht, erhalten wir durch die obige Konstruktion eine
Ist x > 0, so wähle aN rekursiv jeweils so, dass ungewohnte Darstellung, etwa in der Dezimalentwicklung
!
N ' (n !
N ' (n
1 1 1
an = max bn <x| = 0.499 999 999 999 999 999 999 999 999 999 . . .
10 10 2
n=1 n=1
bn ∈ {0, . . . , 9}, n = 1, . . . , N . Als eine überraschende Konsequenz der g-adischen Entwick-
lung ergibt sich die Mächtigkeit der Cantor-Menge, die wir
Die Abbildung x → (an )n ist somit wohldefiniert, d. h.die auf Seite 325 als Beispiel für eine komplizierte abgeschlos-
Dezimaldarstellung zu jedem x ist eindeutig. Wir müssen sene Menge kennengelernt haben.
noch zeigen, dass mit obiger Konstruktion
∞
! ' (n Beispiel Die Cantor-Menge C ergibt sich als Schnitt der
1
x= an auf Seite 325 konstruierten Mengen Cn , n ∈ N, d. h.jedes
10
n=1 Element von C ist in jedem der Cn enthalten.
10.1 Motivation und Definition 353
Wir bringen diese Konstruktion jetzt mit der 3-adischen Ent- Die Umkehrung dieser Aussage ist nicht richtig. Es gibt viele
wicklung der Zahlen aus [0, 1] in Verbindung. Wir betrachten Reihen ∞
die Menge !
⎧ ⎫ an ,
⎨!∞
aj ⎬ n=0
[0, 1] = C0 = | aj ∈ {0, 1, 2} , j ∈ N . für die zwar
⎩ 3j ⎭
j =1 lim an = 0
n→∞
Wollen wir genau die Zahlen aus (1/3, 2/3) herausschneiden, ist, die aber trotzdem divergieren. Als Kriterium zum Nach-
müssen wir, unter Beachtung von weis der Konvergenz einer Reihe ist die obige Aussage also
∞
! ungeeignet. Wir haben aber immerhin eine notwendige Be-
2
1/3 = , dingung für die Konvergenz von Reihen gefunden. Aus der
3j Umkehrung der Aussage ergibt sich nämlich:
j =2
ausschließen, dass a1 = 1 ist. Es ist also Ist lim an = 0 oder existiert der Grenzwert gar nicht, so
n→∞
⎧ ⎫ ∞
⎨!∞ ⎬ ist die Reihe ( n=0 an ) auf jeden Fall divergent.
aj
C1 = | a j ∈ {0, 1, 2} , j ∈ N , a 1 = 1 .
⎩ 3j ⎭
j =1 ?
Ist die Reihe
Mit einer einfachen vollständigen Induktion überzeugt man ∞
sich nun davon, dass ! i n2 + 3n + 2 − i
⎧ ⎫ 2n2 − (1 − 2i) n + 1
⎨ !∞
aj ⎬ n=1
C= x= | aj ∈ {0, 2} .
⎩ 3j ⎭ konvergent oder divergent? Begründen Sie Ihre Antwort.
j =1
!
n !
n−1
Mit dieser Aussage haben wir auch das erste Beispiel von
an = ak − ak −→ A − A = 0 Seite 348 analysiert: Achilles kommt trotz der Verringerung
k=0 k=0
seiner Geschwindigkeit beliebig weit. Die Antwort für das
für n → ∞. zweite Beispiel findet sich in Abschnitt 10.2.
354 10 Reihen – Summieren bis zum Letzten
Problemanalyse und Strategie: Als einfaches Modell für den Turm betrachten wir einen Stapel von Brettern der
Länge 2L, die wir nun so gegeneinander verschieben wollen, dass das oberste Brett möglichst weit rechts liegt, der
Stapel aber eben noch stabil bleibt. Es ist überraschend schwierig, dieses Beispiel von unten her anzugehen, deswegen
betrachten wir lieber den obersten Teil des Stapels. Dazu nummerieren wir die Bretter von oben nach unten mit 1
beginnend durch. Indem wir unten am Stapel jeweils ein Brett hinzufügen, konstruieren wir eine Reihe, und bestimmen
dabei die Gesamtverschiebung des obersten Bretts.
Den Wert einer Reihe kann man nur in ermitteln wir im Beispiel auf Seite 357, und mit ein wenig
seltenen Fällen bestimmen Geschick können wir auch den Wert von manchen anderen
Reihen bestimmen.
Im Fall der geometrischen Reihe hatten wir das Glück, eine
explizite Formel für die Partialsummen sn zur Hand zu haben. Beispiel Um etwa
In diesem Fall konnten wir nicht nur definitive Aussagen über
∞
!
die Konvergenz der Reihe machen, sondern im Fall der Kon- 1
vergenz sogar noch ihren Wert bestimmen. In den meisten k (k + 1)
Fällen wird das nicht ohne Weiteres möglich sein, und oft ist k=1
Wir betrachten nun also die Reihe benötigen wir aber Hilfsmittel, die wir uns erst im Kapi-
∞ '
! 1 ( tel 19 erarbeiten. Sind diese Mittel bereitgestellt, dann fallen
1
− . uns solche Ergebnisse allerdings als Nebenprodukte anderer
k k+1 Rechnungen fast ohne Aufwand in den Schoß.
k=1
!
n !
n−1 !
n−1 etwas ganz anderes als
1 1 1
= ≤ 1 + ∞
!
k2 (k + 1)(k + 1) k(k + 1)
k=1 k=0 k=1 an bn .
und dem Beispiel oben erhalten wir mit dem Monotoniekrite- n=1
∞ 1 Dass eine solche Formel falsch sein muss, wird einem sofort
rium für Folgen (siehe Seite 292, dass die Reihe k=1 k 2
klar, wenn man sich daran erinnert, dass Reihenwerte Grenz-
konvergiert. Für den Nachweis von Formeln wie
werte von Partialsummen sind. Und bei Summen ist schon
∞
! ∞
!
1 π2 (−1)k+1 π2 im einfachsten Fall
= oder =
k2 6 k2 12
(a1 + a2 ) · (b1 + b2 ) = a1 b1 + a2 b2 .
k=1 k=1
356 10 Reihen – Summieren bis zum Letzten
Von der Reihe über 1/n2 wissen wir bereits, dass sie kon- Abbildung 10.6 Das Monotoniekriterium für Reihen: Die Folge der Partial-
vergiert. Die Reihe über den zweiten Summanden entspricht summen wächst monoton, überschreitet aber niemals die gestrichelte obere
Schranke. Die Reihe konvergiert.
einer geometrischen Reihe, die ebenfalls konvergiert. Nach
den Rechenregeln konvergiert also auch die gesamte Reihe,
und für den Reihenwert gilt: ∞
soll bekannt sein, dass die Reihe n=0 bn konvergiert. Da
∞ ∞ ∞ alle Reihenglieder positiv sind, gilt natürlich die Abschät-
! 1 + 2−n n2 ! 1 ! 1
= + zung
n2 n2 2n !N !N
n=1 n=1
'
n=1
( an ≤ bn
π2 1 n=0 n=0
= − −1
6 1 − 1/2 für alle N ∈ N. Die Voraussetzung des Monotoniekriteriums
π2 sind also erfüllt, wobei die Schranke
∞ C gerade der Reihen-
= − 1.
6 wert der konvergenten ∞Reihe n=0 bn ist. Da die Partial-
summen der Reihe
∞
n=0 bn hierbei stets größer sind als
die der Reihe n=0 an , und die Reihe über die bn konver-
Hat eine Reihe eine konvergente Majorante, giert, bezeichnet man sie als konvergente Majorante, siehe
so konvergiert sie auch Abbildung 10.7.
Nun drehen wir die Situation
∞ um und nehmen an, dass wir
Ein zweites einfaches Kriterium für Konvergenz, zumindest wissen, dass die Reihe n=0 an divergiert. Da die Partial-
von Reihen mit reellen Gliedern, beruht auf dem Monotonie- summen der Reihe über die bn stets größer sind, muss also
kriterium für Folgen. Wir erinnern uns daran, dass jede be-
schränkte, monotone Folge konvergiert.
∞ Diese Tatsache kön-
nen wir auf diejenigen Reihen n=0 an übertragen, deren sn
Partialsummen monoton wachsend sind. Dies bedeutet, dass
alle Reihenglieder an ≥ 0 sind. Dabei ist es allerdings nicht
wichtig, dass die Folge der Partialsummen immer monoton
wächst, es reicht wenn sie dies ab einem bestimmten Index
n0 tut. Dargestellt ist die Situation auch in der Abbildung
10.6. Wir formulieren sie als Satz.
Satz (Monotoniekriterium n
∞ für reelle Reihen)
Ist eine Reihe n=0 a n gegeben, und gibt es ferner Abbildung 10.7 Die blau dargestellte Reihe bildet eine konvergente Majorante.
einen Index n0 ∈ N mit an ∈ R≥0 für alle n ≥ n0 sowie eine Die rot dargestellte Reihe darunter muss ebenfalls konvergieren.
Schranke C > 0 mit
sn
!
N
an ≤ C für alle N ∈ N≥n0 ,
n=n0
zeigen wollen.
Problemanalyse und Strategie: Zunächst zeigen wir, dass die Reihe überhaupt konvergiert. Dazu untersuchen wir
die Folge der Partialsummen auf Beschränktheit mit dem Ziel, das Monotoniekriterium für Folgen anwenden zu können.
Eine zusätzliche Überlegung liefert dann die Aussage, dass die obere Schranke auch gleichzeitig der Reihenwert sein
muss.
n
Lösung: ! 1 ∞
Die Zahl e ist uns schon verschiedentlich begegnet. Für Somit ist die Folge der Partialsummen durch
k!
k=0 n=0
uns entscheidend sind die Beispiele auf Seite 281 und 292 1
im Kapitel über Folgen. Zusammen liefern diese Beispiele e nach oben beschränkt. Da die Brüche k! alle positiv
die Konvergenz der Folge oben, deren Grenzwert als die sind, ist es auch eine monoton wachsende Folge. Mit dem
Zahl e bezeichnet wird: Monotoniekriterium erhalten wir die Aussage, dass die
' (n Folge der Partialsummen, also die Reihe
1
e := lim 1 + . ∞
n→∞ n ! 1
Die Folgenglieder werden wir jetzt mithilfe der binomi- ,
k!
k=0
schen Formel umschreiben:
' ( n ' ( ' (k
1 n ! n 1 konvergiert und dass der Reihenwert kleiner oder gleich e
1+ = ist.
n k n
k=0
Nun zur zweiten Abschätzung. Auch hier starten wir mit
!n
n! 1
= ⎡ ⎤
k! (n − k)! nk ' (
1 n ! 1 ⎣ n − j ⎦
n k−1
k=0
⎡ ⎤ 1+ = .
! n k! n
1 n−j
n k−1 k=0 j =0
= ⎣ ⎦.
k! n Nun ersetzen wir jeden Faktor (n − j )/n durch 1 und ma-
k=0 j =0
chen dadurch das Produkt auf der rechten Seite größer. Es
Mit dieser Darstellung gelingen uns jetzt schnell zwei Ab- gilt somit
' (
schätzungen. Zunächst setzen wir m > n voraus. Dann gilt 1 n ! 1
n
die Ungleichung 1+ ≤
⎡ ⎤ n k!
' ( k=0
1 m ! 1 ⎣ m − j ⎦
m k−1
1+ = für jedes n. Somit bleibt diese Ungleichung erhalten, wenn
m k! m wir zum Grenzwert für n → ∞ übergehen:
k=0 j =0
⎡ ⎤
! ' (n ∞
1 ⎣ m − j ⎦ !
n k−1
1 1
≥ . e = lim 1+ ≤ .
k! m n→∞ n k!
k=0 j =0 k=0
In dieser Ungleichung lassen wir jetzt m → ∞ gehen. Da Insgesamt haben wir gezeigt, dass die Exponentialreihe
m−j j konvergiert und dass für ihren Reihenwert die Unglei-
=1− →1 (m → ∞) chungskette
m m ∞ ∞
für jedes j = 0, . . . , n, folgt: ! 1 ! 1
' ( ≤e≤
1 m ! 1 k! k!
n
k=0 k=0
e = lim 1 + ≥ .
m→∞ m k! gilt. Also ist der Reihenwert selbst gleich e.
k=0
Kommentar: Das Beispiel liefert zwei völlig unterschiedliche Darstellungen für die irrationale Zahl e ≈
2, 718 281 828 459 05. Je nach der Situation können wir die eine oder andere Darstellung in einer Überlegung ver-
wenden. Mit einem Taschenrechner kann man sich zum Beispiel schnell davon überzeugen, dass zur Bestimmung der
Dezimaldarstellung die Darstellung als Reihe geeigneter ist: Sie konvergiert deutlich schneller.
358 10 Reihen – Summieren bis zum Letzten
auch diese Reihe divergieren. In dieser Situation nennt man Zusammengefasst spricht man bei diesen Kriterien von Ver-
die Reihe über die an eine divergente Minorante. gleichskriterien, da hier verschiedene Reihen miteinander
verglichen werden. Ein weiteres Kriterium dieser Art ver-
Wir fassen all diese Überlegungen zusammen:
gleicht die Quotienten der Glieder von zwei Reihen.
Wir bilden also die Partialsummen nicht über die Kehr- Auch bei dieser Reihe sind gegenüber der harmonischen
werte aller natürlichen Zahlen, sondern nur über diejeni- Reihe viele Reihenglieder gestrichen worden: Von jeweils
gen aus J . Es werden also gegenüber der harmonischen 1 000 Gliedern der harmonischen Reihe kommt nur eines
Reihe einige Summanden ausgelassen: vor:
1 1 1
1 1 1 1 1 1+ + + + ···
1+ + ··· + + + ··· + + + ··· 1 001 2 001 3 001
2 9 11 19 21
Vom Gefühl her hat man hier noch viel weniger Reihen-
Konvergiert diese Reihe oder nicht?
glieder, als im ersten Beispiel. Aber es stellt sich heraus,
Wir betrachten diejenigen Partialsummen, die alle natürli- dass diese Reihe trotzdem divergiert.
chen Zahlen mit maximal N Stellen berücksichtigen, und
Dazu schätzen wir die Partialsummen nach unten ab:
schreiben diese um:
! 1 !
N p −1
10!
1 !
N
1 1 !
N
1
= =
n n 1 000n + 1 1 000 1
n + 1 000
n∈J p=1 n=10p−1 n=0 n=0
n≤10N −1 n∈J
1 ! 1
N
Die innere Summe rechts berücksichtigt alle Zahlen mit ≥
genau p Stellen. Für jede Stelle kommen nur die Ziffern 1 000 n+1
n=0
1, . . . , 9 infrage, also gibt es genau 9p solcher Zahlen. !
N +1
1 1
Damit können wir abschätzen: = .
p −1 p −1 1 000 n
!
N 10!
1 !
N 10!
1 n=1
≤ Hier können wir also das Minorantenkriterium anwenden
n 10p−1
p=1 n=10p−1 p=1 n=10p−1 und erhalten die Divergenz der Reihe.
n∈J n∈J
!
N Als Fazit halten wir fest: Die Vorstellung von einer Reihe
1
≤ · 9p als unendliche Summe kann schnell aufs Glatteis führen,
10p−1
p=1 da sich Reihen anders verhalten können, als man es in-
!
N −1 ' (p tuitiv von einer Summe erwarten würde. Man ist dagegen
9
=9 . stets auf der sicheren Seite, wenn man die Reihe als Folge
10 und ihren Wert als Grenzwert betrachtet.
p=0
Die beiden Folgen haben also gleiches Konvergenzverhalten, asymptotische Faktor 1/4 zu einer Verschiebung der Gra-
und wie erwartet konvergiert die betrachtete Reihe tatsäch- phen, denn aus
lich.
an 1 1
In der Abbildung 10.9 sind einzelne Glieder der Folgen (an ) ln ≈ ln folgt ln an ≈ ln bn + ln .
bn 4 4
(blau) und (bn ) (grün) in einem logarithmischen Koordina-
tensystem eingezeichnet. Wir greifen hier auf die Definition Die Aussage des Grenzwertkriteriums ist dann, dass zwei
der natürlichen Logarithmusfunktion ln vor, die in Kapitel 11 Reihen dasselbe Konvergenzverhalten haben, wenn ihre Glie-
gegeben wird bzw. verweisen auf das Schulwissen zu Loga- der asymptotisch in einem Plot mit logarithmischen Skalen
rithmen. In Darstellung mit logarithmischen Skalen wird der durch eine Verschiebung auseinander hervorgehen.
360 10 Reihen – Summieren bis zum Letzten
1 · a1 a1
a3
2 · a2
1
2 · a1
4 · a4
a2 1 · a2 8 · a8
2 · a4 4 · a8
a4
Abbildung 10.10 Das Verdichtungskriterium: Für jedes k ∈ N0 ist die Summe aus 2k Reihengliedern zwischen 2k a2k nach oben und 2k−1 a2k nach unten
eingeschlossen. Die Reihe über an hat daher das gleiche Konvergenzverhalten wie die Reihe über 2k a2k .
Das Verdichtungskriterium ist das Werkzeug der Wahl, eine bei dem sich das Vorzeichen der Reihenglieder immer ändert.
Aussage über die Konvergenz von Reihen der Form Allgemein definiert man: Ist (an ) eine Folge mit positiven
∞ reellen Gliedern, so heißt eine Reihe der Form
! 1 ∞
, α ∈ Q>0 , !
nα n
(−1) an
n=1
n=1
zu treffen. Diese Reihen nennen wir zusammengefasst allge-
meine harmonische Reihe. eine alternierende Reihe.
Eine schöne Eigenschaft alternierender Reihen ist, dass es
Kommentar: Die Voraussetzung α ∈ Q ist hier notwen- für ihre Konvergenz schon ausreicht, dass die Folge (an )
dig, da wir bisher nur für solche Exponenten Potenzen erklärt eine monoton fallende Nullfolge ist. Der Satz, der dies als
haben. In Kapitel 11 werden wir Potenzen für allgemeine re- Konvergenzkriterium formuliert, wurde nach dem deutschen
elle Exponenten erklären. Auch für solche bleiben die Aus- Mathematiker Gottfried Wilhelm Leibniz (1646–1716) be-
sagen zur allgemeinen harmonischen Reihe richtig. nannt.
Satz
Leibniz-Kriterium
Die allgemeine harmonische Reihe konvergiert für α > 1,
für α ≤ 1 divergiert sie. Ist die Folge (an ) eine monoton fallende Nullfolge, so
konvergiert die Reihe
Beweis: Mit dem Verdichtungskriterium erhalten wir die ∞
!
Aussage, dass die allgemeine harmonische Reihe dasselbe n
(−1) an .
Konvergenzverhalten hat, wie die Reihe n=1
∞ ∞ ∞ ' (k
! ! ! Für ihren Reihenwert gilt die Abschätzung
k 1 1 1
2 k α = = .
(2 ) 2k(α−1) 2α−1 )∞ )
k=0 k=0 k=0 )! !
N )
) n n )
) (−1) an − (−1) an ) ≤ aN +1
Auf der rechten Seite steht nun eine geometrische Reihe, ) )
1 n=1 n=1
von der wir bereits wissen, dass sie genau für 2α−1 < 1
konvergiert. Das ist genau für α > 1 der Fall. für alle N ∈ N.
sn und
s2N+1 − s2N−1 = −a2N+1 + a2N ≥ 0,
s + an da ja (an ) eine monoton fallende Folge ist. Außerdem gilt
noch:
s sn
s2N − s2N−1 = a2N ≥ 0, also s2N ≥ s2N−1 .
s − an
Wir fassen das eben Gezeigte zusammen: Die Folge (s2N )
n
ist monoton fallend und nach unten beschränkt, zum Beispiel
durch s1 . Die Folge (s2N−1 ) ist monoton wachsend und nach
Abbildung 10.11 Die Abschätzung des Leibniz-Kriteriums garantiert, dass die oben beschränkt, zum Beispiel durch s2 . Beide Teilfolgen
Partialsummen sn den Reihenwert s besser approximieren als s ± an .
sind also konvergent (Abb. 10.12).
Beweis: Wir definieren die Folge der Partialsummen (sN ) (S2n−1 ) (S2n )
durch
S1 S3 S5 S S4 S2
!
N
n
sN := (−1) an
n=1 Abbildung 10.12 Grafische Darstellung der Folgenglieder sN im Beweis des
Leibniz-Kriteriums.
und betrachten die Teilfolgen (s2N ) und (s2N −1 ). Es gilt
dann: Die Grenzwerte sind ebenfalls gleich. Das folgt aus der Glei-
s2N+2 − s2N = a2N +2 − a2N +1 ≤ 0 chung s2N − s2N−1 = a2N , da (an ) eine Nullfolge ist.
10.3 Absolute Konvergenz 363
Wir haben somit die Folge (sn ) vollständig in zwei konver- 10.3 Absolute Konvergenz
gente Teilfolgen zerlegt. Da beide Teilfolgen konvergieren,
ist (sn ) beschränkt, und da beide Teilfolgen denselben Grenz-
Schon im ersten Abschnitt dieses Kapitels hatten wir gese-
wert besitzen, hat (sn ) nur einen einzigen Häufungspunkt.
hen, dass bei Reihen die Reihenfolge der Reihenglieder nicht
Also (siehe die Folgerung auf Seite 295) konvergiert die
vertauscht werden darf, zumindest nicht, wenn man erwartet,
Folge (sn ) selbst, die ja gerade unsere alternierende Reihe
dass sich der Reihenwert nicht ändert. In diesem Abschnitt
ist – den Reihenwert nennen wir S.
wollen wir diese Fragestellung näher untersuchen. Ziel ist es,
Aus unseren Überlegungen folgt auch, dass S für alle N zwi- solche Reihen zu finden, bei denen man wie bei einer end-
schen sN und sN+1 liegt. Es gilt eine der beiden Unglei- lichen Summe die Reihenfolge der Glieder beliebig ändern
chungsketten kann, ohne dass sich der Reihenwert ändert. Es wird sich
herausstellen, dass sich solche Reihen alle durch eine ein-
sN ≤ S ≤ sN+1 oder sN +1 ≤ S ≤ sN . fache gemeinsame Eigenschaft charakterisieren lassen, die
wir absolute Konvergenz nennen wollen.
Es folgt daher:
Definition der absoluten Konvergenz
|S − sN | ≤ |sN +1 − sN | = aN +1 .
Ist
∞ (an ) eine Folge in C und konvergiert
∞ die Reihe
Damit ist auch die Abschätzung für den Grenzwert be- n=1 |an | , so nennen wir die Reihe n=1 an abso-
wiesen. lut konvergent.
Damit ist die Arbeit schon getan: Wegen der absoluten Kon- erhalten die Abschätzung
vergenz der Reihe gibt es zu jedem ε > 0 ein n0 ∈ N, sodass ) )
) 2 ! N
(−1)n ))
∞
!
für alle n ≥ n0 gilt: ) 1
)ln − ) ≤
)∞ ) ) 3 n2 n ) 2n
)! !
n ) !∞ n=1 n=N+1
) ) ∞
!
) |ak | − |ak |) = |ak | ≤ ε . 1 1
) ) =
k=1 k=1 k=n+1 2N +1 2n
n=0
Indem man nur n, m ≥ n0 wählt, sieht man, dass die Reihe 1 1 1
= · = .
eine Cauchy-Reihe ist. 2N +1 1− 1
2
2N
Hier haben wir die Reihe durch eine Indexverschiebung auf
Die Umkehrung gilt, wie wir bereits gesehen haben, nicht. Es die geometrische Reihe zurückgeführt, deren Reihenwert wir
gibt auch konvergente Reihen, die nicht absolut konvergent ausrechnen können.
sind. In diesem Fall spricht man von bedingter Konvergenz.
Wir halten fest: Wenn wir die N-te Partialsumme berechnen,
erhalten wir eine Näherung an ln 23 , die höchstens 2−N vom
richtigen Ergebnis entfernt ist. Für N = 10 ist etwa der Wert
Bei absolut konvergenten Reihen gilt die der Partialsumme
Dreiecksungleichung
!
10
(−1)n
≈ −0,4054346,
Eine weitere Eigenschaft, die wir sofort von endlichen Sum- n 2n
n=1
men auf absolut konvergente Reihen
∞ übertragen
können, ist
die korrekte Dezimaldarstellung ist
die Dreiecksungleichung. Ist n=1 an eine absolut kon-
vergente Reihe, so gilt natürlich für alle Partialsummen 2
ln = −0,4054651 . . .
)N ) 3
)! ) ! N
) ) Der Fehler ist ungefähr 3,046 · 10−5 , unsere Abschätzung
) an ) ≤ |an |.
) ) garantiert einen Fehler von höchstens 9,766 · 10−4 .
n=1 n=1
Solche oder ähnliche Abschätzungen benötigt man, wenn
Nach den Regeln für Grenzwerte bleibt diese Ungleichung
Reihenwerte numerisch berechnet werden sollen, wobei aber
erhalten, wenn N → ∞ Es gilt also für jede absolut
geht.
∞ eine gewünschte Genauigkeit garantiert werden soll. Ein Ver-
konvergente Reihe n=1 an die Dreiecksungleichung in gleich des tatsächlichen Fehlers und der Abschätzung für ver-
der Form )∞ )
)! ) ! ∞ schiedene Werte von N ist in der Abbildung 10.13 dargestellt.
) ) Die Abschätzung gibt den Fehler gut wieder, bis N ≈ 60. Das
) an ) ≤ |an |.
) ) Verhalten für größere Werte von N liegt an Rundungsfeh-
n=1 n=1
lern bei der Bestimmung des korrekten Werts für ln(2/3): In
der heute üblichen Standardarithmetik bestimmen Computer
Beispiel Ein möglicher Weg zur Berechnung der Zahl Funktionswerte auf maximal 16 Dezimalstellen genau.
ln(2/3) ist die Reihendarstellung
∞ Fehler
2 ! (−1)n 1
ln = ,
3 n 2n 10−4
Abschätzung
n=1
10−8 Fehler
die wir einer mathematischen Formelsammlung entnommen
haben. Die Funktion ln ist der natürliche Logarithmus, den 10−12
wir in Kapitel 11 definieren werden. 10−16
) ) )) ∞ )
) 2 ! ) ?
(−1)n )) )) ! (−1)n ))
N ∞
!
) 1
)ln − ) = ) ) ≤ . Welche andere Möglichkeit gibt es, den Unterschied zwi-
) 3 n 2n ) ) n 2n ) n 2n
n=1 n=N +1 n=N +1 schen Partialsumme und exaktem Reihenwert in obigem
Beispiel abzuschätzen? Welche Variante liefert eine bessere
Den Faktor n im Nenner der Reihenglieder ersetzen wir jetzt Schranke?
durch 1, dadurch werden alle Reihenglieder größer, d. h., wir
10.3 Absolute Konvergenz 365
Der Begriff der absoluten Konvergenz erlaubt es uns auch, wobei die Zahlen PN und QN rekursiv definiert sind:
eine Variante des Majorantenkriteriums für Reihen mit kom-
P1 = Q1 = 0
plexen Gliedern zu formulieren.
und
Satz (Majorantenkriterium für Reihen mit komplexen
Gliedern) PN +1 = PN , QN +1 = QN + 1, falls SN ≥ S
∞
Falls es zu einer Reihe n=0 an mit an ∈ C eine sowie
Folge (bn ) aus R≥0 mit |an | ≤ bn für alle n ≥ n0 gibt, und
∞
konvergiert
∞ die Reihe n=0 bn , so konvergiert die Reihe PN +1 = PN + 1, QN +1 = QN falls SN < S
n=0 a n .
für N ≥ 2. Es folgt, dass sowohl (PN ) als auch (QN ) mono-
a
n=1 n , falls es eine bijektive Abbildung u : N → N gibt
mit an = bu(n) , n ∈ N.
Verdeutlichung der Aussage Die Reihenfolge der Glie- Umsetzung der Idee
der bei einer konvergenten, aber nicht absolut konvergen- Wir spalten die Reihe auf in ihren positiven und negativen
ten Reihe ist für den Reihenwert entscheidend. Es kommt Anteil. Dazu definieren wir
dabei darauf an, dass eine andere Folge von Partialsum-
an , an ≥ 0, 0, an ≥ 0,
men entsteht. Bringt man nur endlich viele Glieder in eine bn = und cn =
andere Reihenfolge, so ist klar, dass die Partialsummen 0, an < 0 −an , an < 0
für einen genügend großen Abschneideindex unverändert und schreiben
bleiben.
!
N !
N !
N
Dabei ist es möglich, jeden betragsmäßig noch so großen an = bn − cn .
Reihenwert zu erzielen. Entscheidend für die Aussage ist n=1 n=1 n=1
also die Divergenz der Reihe über die Beträge, denn da- Hier dürfen wir nicht einfach N → ∞ gehen lassen.
durch lässt sich jeder noch so große potenzielle Reihen- Würde nämlich beispielsweise die Reihe über die bn kon-
wert übertreffen. vergieren, so folgt aus den Rechenregeln für Folgen, dass
Diskussion der Beweisidee Das Musterbeispiel für eine auch die Reihe über die cn konvergiert. Dies wiederum
bedingt konvergente Reihe ist die alternierende harmoni- bedeutet die absolute Konvergenz der Reihe über die an .
sche Reihe. Im Beweis des Leibniz-Kriteriums, das die Jetzt ändern wir auf der rechten Seite die Abschneide-
Konvergenz dieser Reihe sicherstellt, hatten wir gesehen, indizes und bilden
dass die Partialsummen den Reihenwert umspringen und !
PN !
QN
abwechselnd Werte darüber und darunter annehmen (siehe SN = bn − cn .
die Abbildungen 10.11 und 10.12). Es erscheint sinnvoll n=1 n=1
dieses Verhalten irgendwie nachzubilden. Dabei sind die PN und QN so zu wählen, dass sie monoton
Geht man davon aus, dass der zu erzielende Reihenwert wachsen (denn sonst läge keine Umordnung der ursprüng-
S positiv ist, so bildet man dazu zunächst Partialsummen lichen Reihe vor) und dass SN +1 ≥ SN ist für SN ≤ S
nur aus positiven Gliedern, bis der Wert der Partialsumme und SN +1 ≤ SN für SN > S. Im Beweis ist die genaue
erstmalig größer als S ist. Anschließend addiert man ne- Konstruktion angegeben.
gative Glieder, bis der Wert wieder kleiner als S ist. Die Es bleibt noch zu überlegen, dass die so konstruierte Reihe
Abbildung stellt dies beispielhaft für die alternierende har- tatsächlich gegen S konvergiert. Auch hier geht man im
monische Reihe und den Grenzwert S = 1.2 dar. Prinzip vor wie im Beweis des Leibniz-Kriteriums. Ist
SN SN ≥ S ≥ SN +1 , so ist
|S − SN | ≤ |SN − SN +1 | = |aQN +1 | .
S
Da die Reihe über die an konvergiert, bilden die an aber
eine Nullfolge. Somit geht dieser Abstand gegen null.
N
Nachdem so S unterschritten wurde, wird |S − SN +k |
Für dieses Vorgehen ist es entscheidend, dass es überhaupt solange kleiner, bis S durch SN +K wieder überschritten
möglich ist, den Wert S immer wieder zu überschreiten wird. Dann erhält man |S − SN +K | ≤ |aPN +K+1 | und hat
und zu unterschreiten. Dazu benötigen wir, dass die Rei- wieder durch ein Glied der Folge (an ) abgeschätzt.
hen über die positiven bzw. über die negativen Glieder von Im Beweis wird dieses Vorgehen formal durch Wahl von
(an ) jeweils divergieren. geeigneten Indizes zu vorgegebenem ε > 0 durchgeführt.
sodass für den Reihenrest der Betragsreihe gilt: Nun untersuchen wir die Folge (bn ). Wir suchen uns eine
∞ Zahl M ∈ N, sodass die Folgenglieder a1 , . . . , aN unter den
!
|an | ≤ ε. Zahlen b1 , . . . , bM sind. Das geht, da ja die Folgenglieder
n=N+1 von (an ) und (bn ) dieselben sind. Dann gilt aber auch
)M )
Damit ist nach der Dreiecksungleichung )! ) ∞
! ∞
!
) )
)N ) )) ∞ )
) )
)
bn − B ) ≤
)
|bn | ≤ |an | ≤ ε.
)! ) ) ! ) !∞
) ) ) n=1 n=M+1 n=N+1
) an − A) = ) an )) ≤ |an | ≤ ε.
) ) )
n=1 n=N +1 ) n=N +1
10.3 Absolute Konvergenz 367
Schließlich ist auch einen führt dies auf keine angenehme Darstellung des Pro-
)N ) dukts, aber es ist auch nicht klar, ob dieses Vorgehen über-
)! !
M ) ∞
!
) ) haupt sinnvoll ist.
) an − bn ) ≤ |an | ≤ ε,
) )
n=1 n=1 n=N +1
Um eine schöne, eingängige Formel zu erhalten, müssen wir
denn in der ersten Differenz bleiben nur Glieder übrig, die in die Reihenglieder in der Produktreihe umordnen. Nach dem
den aN +1 , aN+2 , . . . enthalten sind. bisher Gesagten ist klar: Das dürfen wir nur tun, wenn diese
Reihe absolut konvergiert.
Nun schätzen wir die Differenz der beiden Reihenwerte durch
die Dreiecksungleichung ab: Auf der rechten Seite der Abbildung 10.14 ist dieses Um-
) ) )N ) ordnen schematisch dargestellt. Als Formel
)
) !N ) )!
) ) !M )
) ∞ schreibt
sich
∞
die
|A − B| ≤ )A − an ) + ) an − bn ) Produktreihe für zwei Reihen a
n=1 n und b
n=1 n
) ) ) ) dann als
n=1 n=1 n=1
)M ) ∞ n−1
)! ) !!
) )
+) bn − B ) ak bn−k .
) )
n=1 n=1 k=1
≤ 3ε.
Diese Reihe nennen wir Cauchy-Produkt der beiden Rei-
Wir rekapitulieren: Für jedes ε > 0 ist also |A − B| ≤ 3ε. hen.
Also muss A = B sein. Als Schlussfolgerung können wir
festhalten, dass sich der Reihenwert bei absolut konvergen-
ten Reihen durch eine Umordnung der Reihenglieder nicht Konvergenz des Cauchy-Produkts
∞ ∞
ändert. Sind die Reihen n=1 an und n=1 bn absolut kon-
vergent, dann konvergiert auch ihr Cauchy-Produkt ab-
solut, und für die Grenzwerte gilt:
Zur Berechnung von Produkten von Reihen 2 3 2 3
∞
! ∞
! ∞ n−1
! !
dient das Cauchy-Produkt
an · bn = ak bn−k .
n=1 n=1 n=1 k=1
Von der Möglichkeit, die Glieder einer absolut konvergen-
ten Reihe umzuordnen, wollen wir gleich Gebrauch machen.
Dazu wollen wir uns mit Produkten von Reihen beschäftigen.
Beweis: Wir betrachten eine bijektive Abbildung σ : N →
Nach den Rechenregeln für Grenzwerte von Folgen wissen
N × N mit j → (σ1 (j ), σ2 (j )). Eine solche Abbildung ist
wir, dass das Produkt zweier konvergenter Reihen stets auch
uns zum Beispiel beim Nachweis der Abzählbarkeit von Q
konvergieren muss. Allerdings ist das Ausmultiplizieren der
schon begegnet (siehe Seite 122). Dann konvergiert die Reihe
Partialsummen problematisch: Man hat es mit zwei Grenz-
prozessen zu tun, von denen nicht klar ist, ob sie unabhängig ⎛ ⎞
∞
!
voneinander sind:
⎛ ⎞
⎝ aσ1 (j ) bσ2 (j ) ⎠
!∞ ∞
! !
N ! M j =1
⎝ ⎠
aj · aj = lim lim aj bk
N →∞ M→∞
j =0 k=0 j =1 k=1 absolut, denn setzen wir für alle N ∈ N
Die Abbildung 10.14 stellt links die Bildung der Produkt-
reihe schematisch dar, wenn man bei beiden Reihen die Par- PN = max{σ1 (1), . . . σ1 (N)} ,
tialsummen für dasselbe N miteinander multipliziert. Zum QN = max{σ2 (1), . . . σ2 (N)} ,
a1 b1 a2 b1 a3 b1 a4 b1 a5 b1 ··· a1 b1 a2 b1 a3 b1 a4 b1 a5 b1 ···
a1 b3 a2 b3 a3 b3 a4 b3 a4 b3 .. a1 b3 a2 b3 a3 b3 .. ··· ···
. .
a1 b4 a2 b4 a3 b4 a4 b4 a5 b4 .. a1 b4 a2 b4 .. .. .. ..
. . . . .
a1 b5 a2 b5 a3 b5 a4 b5 a5 b5 .. a1 b5 .. .. .. .. ..
. . . . . .
.. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . .
Abbildung 10.14 Die Ordnung der Reihenglieder in einer Produktreihe. Links ist die Abfolge der Glieder nach der Definition der Reihen abgebildet, rechts die Abfolge
im Cauchy-Produkt.
368 10 Reihen – Summieren bis zum Letzten
Der letzte Bruch ist aber gerade ein Binom. Also gilt mit der Das Wurzelkriterium folgt aus dem Vergleich
allgemeinen binomischen Formel: mit der geometrischen Reihe
∞
! n ' (
1 ! n k n−k Vergleichskriterien sind immer nur so gut wie die Reihen,
e2 = 1 1
n! k die man zum Vergleichen zur Verfügung hat. Eine Reihe, die
n=0 k=0
∞
sich für Vergleiche anbietet – weil wir ja ihre Konvergenz-
! 1
= (1 + 1)n eigenschaften ganz genau kennen – ist die geometrische. Wir
n! werden aus diesem Vergleich sogar ein ganz allgemeines Kri-
n=0
∞ terium gewinnen, eben das Wurzelkriterium.
! 2n
= . Betrachten wir dazu eine Reihe mit nicht negativen Gliedern
n!
n=0 an . Mit Sicherheit wissen wir, dass diese konvergiert, wenn
Ausgehend von diesem Ergebnis kann man nun eine Reihen- es eine positive Zahl q < 1 gibt, sodass ab einem bestimmten
darstellung von e3 berechnen, anschließend dann für e4 , usw. Index n0
Mit vollständiger Induktion lässt sich dabei beweisen, dass an ≤ q n
∞
! ist. Diese Bedingung kann man aber sofort umschreiben zu
pn
ep =
n! √
n=0 n an ≤ q.
10.4 Kriterien für absolute Konvergenz 369
Gäbe es umgekehrt eine Zahl Q > 1, sodass Um uns von der Richtigkeit der letzten Aussage des Krite-
√ riums zu überzeugen, werden wir in den folgenden Beispie-
n an ≥ Q len konvergente und eine divergente Reihe vorstellen, die
√
lim sup n |an | = 1 erfüllen.
ab einem bestimmten Index n0 wäre, dann hätten wir sofort n→∞
die Abschätzung √
Ein wichtiger Spezialfall liegt vor, wenn die Folge ( n |an |)
!
N !
N
sogar konvergiert. In diesem Falle können wir den Limes
an ≥ Qn , superior durch den Grenzwert ersetzen. Das lässt sich knapp
n=n0 n=n0
und kompakt schreiben als
und auf der rechten Seite stünde eine divergente Minorante. ⎧
√ ⎪
⎨< 1 absolute Konvergenz,
Es wird also für viele Reihen genügen, n an zu betrachten, %
um Aussagen über Konvergenz oder Divergenz zu treffen. lim n |an | = 1 keine Aussage,
n→∞ ⎪
⎩
> 1 Divergenz.
Wurzelkriterium
In dieser Formulierung mit einem Grenzwert wird das Wur-
Erfüllt eine Folge (an ) aus C die Bedingung
zelkriterium aber am häufigsten verwendet.
%
lim sup n |an | < 1 ,
n→∞ Beispiel
∞ Wir untersuchen die Reihe
so konvergiert
√ die Reihe n=1 an absolut. Ist dagegen ∞ ' (
die Folge ( |an |) unbeschränkt oder gilt
n ! 1 1 n
−√
% 3
n=1
n
lim sup n |an | > 1 ,
n→∞ auf Konvergenz. Das Wurzelkriterium liefert
so divergiert die Reihe. Im Falle 1) ) ) )
% n )) 1 1 )n ) 1 1 ) 1
% n
|an | = ) − √ )) = )) − √ )) → (n → ∞).
lim sup n |an | = 1 3 n 3 n 3
n→∞
Der Grenzwert ist kleiner als 1, diese Reihe ist also absolut
ist keine Aussage möglich. konvergent.
Nun untersuchen wir die Reihe
Kommentar: Wie wir im Beweis gleich sehen werden, !∞ ' ( 2
1 n
reicht für die Divergenz der Reihe die schwächere Bedin- 1+
√ n
gung, dass n |an | ≥ 1 für unendlich viele n ist. n=1
auf Konvergenz:
? 1
' ( 2 ' (
Für eine Reihe ( ∞n=1 an ), eine Zahl q < 1 und ein n0 ∈ N
%n n 1 n 1 n
|an | = 1+ = 1+ →e (n → ∞).
gilt % n n
n
|an | ≤ q, n ≥ n0 .
Hier ist der Grenzwert größer als 1, die Reihe ist divergent.
Ist diese Reihe absolut konvergent? Welche Aussage können wir mit dem Wurzelkriterium
über die allgemeine harmonische Reihe treffen? Es gilt
1) ) ' (
√
n )) 1 )) 1 α
Beweis: Ist lim sup n |a | < 1, so gibt es ein q < 1 und
n→∞
n
) nα ) = √
n n −→ 1α = 1 (n → ∞)
ein N ∈ N mit
%
n für alle α > √0. Wir haben also stets den Fall vorliegen,
|an | ≤ q für alle n ≥ N .
dass lim sup n |an | = 1 ist. Im Fall α ≤ 1 divergiert die
n→∞
Nach unseren
∞ Vorüberlegungen
ist also die geometrische allgemeine harmonische Reihe, im Fall α > 1 konver-
Reihe q n eine konvergente Majorante der Reihe
∞
n=0 giert sie. Somit sehen wir an diesem Beispiel, das im Fall
n=1 |an | . Hieraus folgt die absolute Konvergenz der „gleich 1“ mit dem Wurzelkriterium keine Aussage über
Reihe über die an . Konvergenz und Divergenz möglich ist.
√
Ist lim sup n |an | > 1, so gibt es eine Teilfolge und somit √
n→∞ √ Nicht immer ist man in der Situation, dass die Folge ( n |an |)
unendlich viele Folgenglieder mit n |an | ≥ 1. Für diese gilt konvergiert. Dann muss der größte Häufungspunkt – so er
dann auch |an | ≥ 1, folglich bildet (an ) keine Nullfolge. denn existiert – auf anderem Wege gefunden werden. Wir
Daher divergiert die Reihe über die (an ). sehen uns auch dazu einige Beispiele an.
10.4 Kriterien für absolute Konvergenz 371
Beispiel Quotientenkriterium
Untersuchen wir etwa die Reihe
Wir betrachten eine Folge (an ) aus C\{0}. Gibt es Zahlen
∞ '
! ( 2 q < 1 und N ∈ N mit
(−1)n n
1+ ) )
n ) an+1 )
n=1 ) )
) a ) ≤ q für alle n ≥ N,
n
auf Konvergenz. Durch das wechselnde Vorzeichen erhal-
∞
ten wir für gerade und ungerade n jeweils unterschiedliche so konvergiert die Reihe n=1 an absolut. Gibt es da-
Ergebnisse: gegen ein N ∈ N mit
⎧ n ) )
% ⎨ 1 + 1 , wenn n gerade, ) an+1 )
) )
|an | = ) a ) ≥ 1 für alle n ≥ N,
n n
n
⎩ 1 − 1 , wenn n ungerade. n
n
so divergiert die Reihe.
Damit erhalten wir
' (2k
% 1
lim |a2k | = lim
2k
1+ = e. Beweis: Wir betrachten zunächst den Fall q < 1 und N ∈ N
k→∞ k→∞ 2k mit ) )
) an+1 )
) )
Es gibt also einen Häufungspunkt, der größer ist als 1. ) a ) ≤ q für alle n ≥ N.
Nach dem Wurzelkriterium divergiert die Reihe. n
Bei der Reihe Damit gilt auch, dass für beliebige n > N
∞ |an | |aN +1 | |aN +2 | |an |
! 1 + (1 + i)n = · ··· ≤ q n−N
|aN | |aN | |aN +1 | |an−1 |
2n
n=0
ist. Demnach ist
|aN | n
können wir den Betrag des Zählers abschätzen durch |an | ≤ q ,
qN
|1 + (1 + i)n | ≤ 1 + 2n/2 ≤ 2(n/2)+1 . und man hat eine geometrische Reihe als konvergente Majo-
rante gefunden.
Somit ist
1) 1 Gibt es dagegen ein N ∈ N mit
) √ √ ) )
) n)
n ) 1 + (1 + i) ) n 2(n/2)+1 √
n 2 2 ) an+1 )
≤ = 2 → ) )
) 2n ) 2n 2 2 ) a ) ≥ 1 für alle n ≥ N,
n
Das Ziehen von n-ten Wurzeln kann gelegentlich ein wenig Aufgrund der Leichtigkeit in seiner Handhabung ist das Quo-
mühsam sein. Stattdessen kann es ausreichen, den Betrag des tientenkriterium das wahrscheinlich beliebteste Konvergenz-
Quotienten zweier aufeinanderfolgender Glieder |an+1 /an | kriterium für Reihen überhaupt – es ist jenes, das man im
zu betrachten. Normalfall als erstes einmal versucht.
372 10 Reihen – Summieren bis zum Letzten
bn divergiert $⇒ an divergiert.
n=0 n=0
Grenzwertkriterium Leibniz-Kriterium
Majoranten-/Minorantenkriterium
Anwendungen: Vergleich mit einfacher bekannter Reihe
ist möglich. Majoranten-/
Minorantenkriterium
Voraussetzungen: bn reell mit 0 ≤ |an | ≤ bn für alle
Verdichtungskriterium
n ≥ n0 .
∞ ∞
bn konvergiert $⇒ an konv. abs. weiterführende Kriterien
n=0 n=0
anderere Methoden
∞ ∞
|an | divergiert $⇒ bn divergiert.
n=0 n=0
10.4 Kriterien für absolute Konvergenz 373
Beispiel Achtung: Vor einem sehr verbreiteten Fehler bei der Hand-
Wir wissen bereits, dass die Reihe habung beider Kriterien wollen wir hier ganz ausdrücklich
warnen. In den Kriterien wurde verlangt, dass der Grenzwert
∞ n
! für n → ∞ von
2
n! %
n |an+1 |
n=1 |an | bzw.
|an |
absolut konvergiert, ihr Reihenwert ist e2 . Liefert auch das existiert und für Konvergenz echt kleiner bzw. für Divergenz
Quotientenkriterium die Aussage über die Konvergenz? echt größer als eins ist. Es genügt zum Feststellen der Kon-
n
Dazu bilden wir mit an = 2n ! : vergenz nicht, dass
) ) ' n (−1 % |an+1 |
) an+1 ) n+1 2n+1 n!
)= 2 2 n
) · = · n |an | < 1 bzw. <1
) a ) (n + 1) ! n! (n + 1) ! 2 |an |
n
2 · 2n n! 2 für alle n ab einem bestimmten Index ist.
= · = → 0 < 1.
(n + 1) · n ! 2n n+1
auf Konvergenz:
Wurzel- und Quotientenkriterium sind nahe
) ) verwandt
) an+1 )
) = (n + 1) 2n n !
n+1
) · =
) a ) 2n+1 (n + 1)! nn
n
Sowohl Wurzel- als auch Quotientenkriterium erhält man aus
(n + 1) (n + 1)n 2n n ! (n + 1)n
= = = dem Vergleich mit einer geometrischen Reihe. Die Vermu-
2 · 2 (n + 1) n ! n
n n 2 nn
' ( ' ( tung, dass es zwischen den beiden Kriterien gewisse Zusam-
1 1+n n 1 1 n e menhänge gibt, ist naheliegend und richtig.
= = 1+ → > 1.
2 n 2 n 2
Von den beiden ist das Wurzelkriterium das stärkere, weil
Diese Reihe divergiert also. es auch für Fälle, in denen das Quotientenkriterium keine
Betrachten wir die Reihe Entscheidung bringt, noch manchmal Aussagen ) erlaubt. ) Das
∞ gilt allerdings )nur, wenn) der Grenzwert von )an+1 /an ) nicht
! 3 + (−1)n existiert. Falls )an+1 /an ) → 1 (n → ∞) gilt, so liefern beide
. Kriterien keine Aussage.
5n
n=0
Das sieht man so: Zu jedem ε > 0 gibt es dann ein N ∈ N
Wir müssen gerade und ungerade n unterscheiden: mit ) )
) an+1 )
1 − ε ≤ )) ) ≤ 1+ε, n ≥ N .
a2k+1 3 + (−1)2k+1 52k 2 1 1 an )
= · = · = .
a2k 52k+1 3 + (−1)2k 5 4 10 Wie im Beweis des Quotientenkriteriums folgert man daraus
3 + (−1)2k 52k−1 ) )
a2k
= ·
4 1 2
= · = . ) an )
a2k−1 52k 3 + (−1)2k−1 5 2 5 (1 − ε)N −n ≤ )) )) ≤ (1 + ε)N −n , n ≥ N ,
aN
In beiden Fällen gilt: und hieraus
) ) 1 1
) an+1 ) 2 |aN | % |aN |
) ) n
≤ |an | ≤ (1+ε) n
n
n ≥ N.
) a ) ≤ 5 < 1, (1−ε)
(1 − ε)N (1 + ε)N
n
die Reihe konvergiert also absolut. Jetzt lässt man zunächst n gegen unendlich
√ und danach ε
gegen null gehen und erhält, dass auch n |an | → 1 gilt.
Generell ist das Auftreten von Fakultäten in den Reihenglie- Ferner gilt: Macht das Wurzelkriterium keine Aussage, so ist
dern ein fast sicheres Zeichen dafür, dass man das Quotien- dies auch sicher für das Quotientenkriterium der Fall. Macht
tenkriterium benutzen sollte. Auch Potenzen kürzen sich, wie jedoch das Quotientenkriterium
) ) keine Aussage und existiert
man auch an den Beispielen oben sieht, auf saubere Weise. der Grenzwert von )an+1 /an ) nicht, so ist es in manchen
374 10 Reihen – Summieren bis zum Letzten
Problemanalyse und Strategie: Es gibt verschiedene Möglichkeiten die absolute Konvergenz nachzuweisen, allen
voran das Quotienten- und das Wurzelkriterium. Man muss ausprobieren, welches Kriterium im konkreten Fall geeignet
ist bzw. funktioniert. Die Berechnung des Reihenwerts kann wegen der absoluten Konvergenz durch eine Umordnung
der Reihenglieder erfolgen.
Allerdings gilt für ungerades n Da die Reihe absolut konvergiert, darf man die Summan-
) ) ) ) den umtauschen. Z. B. kann man eine Reihe bilden, die
) an+1 ) ) 1
) )=) 4n )) nur die Glieder für gerades n und eine, die nur die Glieder
·
) a ) ) 2n+1 1 )
n für ungerades n umfasst. Damit ist
= 2n−1 > 1.
∞
! ∞
! ∞
!
1 −1
Also kann das Quotientenkriterium nicht angewandt wer- an = + =
42n+1 22n
den. n=0 n=0 n=0
∞
! !∞
Mit dem Wurzelkriterium erhält man für gerades n 1 1 1
= − =
4 16n 4n
% 1 n=0 n=0
n
|an | = 1 1 1
2 = · − =
4 1− 1 1
und für ungerades n 16 1− 4
4 4 16
% 1 1 = − =− .
n
|an | = ≤ . 15 3 15
4 2
Da 1/2 < 1, ist das Wurzelkriterium anwendbar: Die
Reihe konvergiert absolut.
Fällen möglich, mit dem Wurzelkriterium die Konvergenz |a2k+1 | 2 + (−1)2k+1 22k−1
= · =
einer Reihe nachzuweisen. Es folgt ein Beispiel für solch |a2k | 22k 2 + (−1)2k
einen Fall.
2−1 22k−1 2
= · = .
Beispiel Untersuchen wir die Reihen 2·2 2k−1 2+1 3
∞
! 2 + (−1)n |a2k | 2 + (−1)2k 22k−2
= · =
2n−1 |a2k−1 | 22k−1 2 + (−1)2k−1
n=1
2+1 22k−2 3
auf Konvergenz, zunächst mit dem Quotientenkriterium. Das = · = .
wechselnde Vorzeichen im Zähler sorgt dafür, dass der Quo- 2·2 2k−2 2−1 2
tient für gerade und ungerade n unterschiedlich aussieht:
10.4 Kriterien für absolute Konvergenz 375
Der Grenzwert der Quotienten existiert nicht, und auch mit konvergent. Es ist aber
der allgemeinen Version des Quotientenkriteriums erhalten
wir keine Aussage.
(1 − β) |an | = (n − 1) |an | − (n − β) |an |
Benutzen wir nun das Wurzelkriterium:
≤ (n − 1) |an | − n |an+1 |
. √
%
n n 2 + (−1)
n n
2 + (−1)n 1
|an | = n−1
= n−1
→ ,
2 2 n 2
für n ≥ N . Da β > 1 vorausgesetzt ist, ist die Teleskopreihe
√ √ bis auf den Faktor 1 − β eine konvergente Majorante der
weil ja n 3 → 1 ebenso wie n 1 → 1 gilt. Die Reihe ist also
konvergent, was auch durch einen Vergleich mit der geome- Reihe über |an |.
trischen Reihe ∞
! 3 Im zweiten Fall ist n an+1 ≥ (n − 1) an > 0 für n ≥ N, d. h.,
die Folge (nan+1 ) ist eine wachsende Folge. Somit gibt es
2n−1
n=1 ein c > 0 mit
ersichtlich ist.
c
an+1 ≥ ,n ≥ N .
Dass das Quotientenkriterium trotz dieser Einschränkungen n
meist als erstes angewandt wird, liegt an seiner einfachen
Handhabbarkeit. Das Quotientenkriterium ist recht schnell
Somit ist die harmonische Reihe eine divergente Minorante
angewandt, und oft gelangt man bereits auf diesem Weg zu
der Reihe über die an .
einer eindeutigen Aussage über Konvergenz oder Divergenz.
so konvergiert die Reihe über die an absolut. Sind alle an für jedes N ∈ N. Die Cauchy-Schwarz’sche-Ungleichung
reell und positiv, und gibt es ein N ∈ N mit ergibt sich aus Überlegungen zu Skalarprodukten in der Li-
nearen Algebra. Wir werden sie im Abschnitt 17.2 beweisen.
an+1 1
≥1− , n ≥ N, ∞
n=1 |an | , so nennt man die Folge
an n Konvergiert die Reihe 2
n |an+1 | ≤ (n − β) |an | , n≥N. Weiterführend lässt sich so auf dem Vektorraum der quadrat-
summierbaren Folgen ein Skalarprodukt definieren. Man er-
Hieraus folgt n |an+1 | < (n − 1) |an |, n ≥ N, d. h., die Folge hält damit den Hilbert-Raum 2 , der in der Funktionalanaly-
(n |an+1 |)∞
n=N ist monoton fallend. Zudem ist sie durch null sis eine wichtige Rolle spielt.
nach unten beschränkt und konvergiert daher. Somit ist die
Teleskopreihe Schließlich gibt es auch einen engen Zusammenhang zwi-
∞ schen der Konvergenz von Reihen und der Integration von
! * + * +
(n − 1) |an | − n |an+1 | = lim −n |an+1 | . Funktionen über unbeschränkte Intervalle. Dieser wird durch
n=1
n→∞ das Integralkriterium ausgedrückt (siehe Kapitel 16).
376 10 Reihen – Summieren bis zum Letzten
Zusammenfassung
Eine Reihe ist definiert als eine Folge von Partialsummen. Eine spezielle Klasse konvergenter Reihen sind die absolut
Die Reihe konvergiert, wenn es diese Folge tut. Der Grenz- konvergenten Reihen.
wert heißt in diesem Fall Reihenwert. Nur in wenigen Fällen
kann der Reihenwert explizit bestimmt werden, meist ist nur Definition der absoluten Konvergenz
die Aussage möglich, dass die Reihe konvergiert oder diver-
giert. Reihen sind ein wichtiges Hilfsmittel in der Analysis
Ist
∞ Folge in C und konvergiert
(an ) eine ∞ die Reihe
und dienen zum Beispiel zur Definition der Standardfunktio- n=1 |an | , so nennen wir die Reihe n=1 an abso-
lut konvergent.
nen wie den trigonometrischen oder hyperbolischen Funk-
tionen oder der Exponentialfunktion (siehe Kapitel 11).
Für solche Reihen gelten viele Eigenschaften, die von ge-
Wichtige Beispiele für Reihen sind etwa die geometrische wöhnlichen Summen her vertraut sind. So gilt die Dreiecks-
Reihe und die harmonische Reihe, ungleichung und man kann die Glieder solcher Reihen nach
∞ ∞ dem Riemann’schen Umordnungssatz in beliebiger Rei-
! !1 henfolge aufsummieren, ohne dass sich der Reihenwert än-
n
q bzw. .
n dert. Für das Produkt zweier absolut konvergenter Reihen
n=0 n=1
gibt es mit dem Cauchy-Produkt eine einfache Darstellung.
Diese werden in vielen Beispielen und Abschätzungen im- Für die Feststellung absoluter Konvergenz gibt es besonders
mer wieder verwendet. Auch die Dezimaldarstellung reeller einprägsame Kriterien.
Zahlen lässt sich auf eine Darstellung dieser Zahlen als Reihe
einer bestimmten Form zurückführen.
Wurzelkriterium
Bei der Analyse von Reihen sind Konvergenzkriterien von Erfüllt eine Folge (an ) aus C die Bedingung
zentraler Bedeutung. Sie dienen als Hilfsmittel, um durch %
Überprüfung einfacher Voraussetzungen schnell festzustel- lim sup n |an | < 1 ,
n→∞
len, ob eine Reihe konvergiert oder divergiert. Das einfachste ∞
von ihnen ist das Nullfolgenkriterium, welches besagt, dass so konvergiert die Reihe n=1 an absolut. Ist dagegen
√
die Glieder jeder konvergenten Reihe eine Nullfolge bilden. die Folge ( n |an |) unbeschränkt oder gilt
%
Das grundlegendste Kriterium zur Feststellung von Konver- lim sup n |an | > 1 ,
genz ist das Majorantenkriterium. n→∞
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
Abbildung 10.15 In jedem Iterationsschritt wird eine Kante durch den roten existiert. Zeigen Sie:
Streckenzug ersetzt.
(a) Jede konvergente Reihe ist Cesàro-summierbar, und C
wird jede Kante durch den in Abbildung 10.15 gezeigten ist gleich dem
∞Reihenwert.
Streckenzug ersetzt. Die Abbildung 10.16 zeigt die ersten (b) Die Reihe k+1 ist Cesàro-summierbar. Be-
k=1 (−1)
drei Iterationen der Kurve. rechnen Sie auch den Wert von C.
Antworten der Selbstfragen 379
∞ ∞
10.17 •• Sei n=1 an eine konvergente Reihe und u : 10.18 • Ist n=1 an absolut konvergent und (bn )
N → N eine bijektive Abbildung mit folgender Eigenschaft: eine
∞ Umordnung
der Folge (an ), so konvergiert auch
∞
Es gibt ein C ∈ N mit |n − u(n)| ≤ C, n ∈ N. Zeigen Sie, n=1 bn . Zeigen Sie, dass die Reihe n=1 bn sogar
∞
dass die Reihe n=1 au(n) ebenfalls konvergiert und die absolut konvergiert.
Reihenwerte beider Reihen übereinstimmen.
S. 353 die sogar für alle x ∈ C mit Re (x) > 1/2 gültig ist. Die
Da Methode aus dem Beispiel ist prinzipiell für jedes solche
i + n3 + 2−i x anwendbar. Die Anwendung des Leibniz-Kriteriums be-
in2 + 3n + 2 − i n2 i
lim = lim = = 0 schränkt sich auf reelle x mit x > 1.
n→∞ 2n2 − (1 − 2i) n + 1 n→∞ 2 − 1−2i + 1 2
n 2 n
S. 368 ∞
ist, bilden die Glieder der Reihe keine Nullfolge. Die Reihe
Diese Eigenschaft hat nur die Nullreihe k=1 0 , deren
ist demnach divergent.
Glieder alle verschwinden. Das Cauchy-Produkt dieser Reihe
S. 355 mit jeder anderen ergibt wieder die Nullreihe, und diese kon-
Die Partialsummen der Reihe sind Teleskopsummen mit vergiert selbstverständlich.
!
n
bk − bk+1 = b1 − bn+1 S. 370
√
k=1 Die Folge ( n |an |)∞n=n0 ist nach Voraussetzung durch q be-
schränkt. Also ist auch jeder Häufungspunkt dieser Folge
für alle n ∈ N. Somit konvergiert die Reihe genau dann, wenn
kleiner oder gleich√q. Für Häufungspunkte
% spielen die end-
die Folge (bn ) konvergiert.
lich vielen Glieder 1 |a1 |, . . . , n0 −1 |an0 −1 | aber keine Rolle,
S. 361 daher ist
Ja, dies entspricht ja nur einem Ausklammern eines Faktors %
lim sup n |an | ≤ q < 1 .
−1 aus den Partialsummen und ist daher für die Konvergenz n→∞
der Reihe unerheblich. Wichtig ist nur, dass alle an dasselbe
Vorzeichen haben und dass die Folge eine monotone Null- Die Reihe über die an konvergiert nach dem Wurzelkriterium
folge ist. also absolut.
S. 363 S. 373
Für die Abschätzung der Differenzen s2N +2 − s2N und Wenn die beiden Kriterien eine Konvergenzaussage machen,
s2N+1 − s2N−1 wird von der Monotonie der Folge (an ) Ge- so liegt immer absolute Konvergenz vor. Es ist also zu er-
brauch gemacht. warten, dass bei einer nur bedingt konvergenten Reihe keine
S. 364 Aussage nach diesen beiden Kriterien gemacht werden kann.
Die Reihe für ln(2/3) ist eine alternierende Reihe, die die
Voraussetzungen für die Anwendung des Leibniz-Kriteriums Das Musterbeispiel einer bedingt konvergenten Reihe ist die
erfüllt. Damit erhält man die Abschätzung alternierende harmonische Reihe
) )
) (−1)n ))
∞
!
) !N
1 (−1)n
)ln(2/3) − )≤ , N ∈ N. .
) n 2n ) (N + 1) 2N +1 n=1
n
n=1
Der Faktor im Zähler ist hier etwas kleiner, die Abschätzung
Wir erhalten
also etwas besser. Gegenüber dem Beispiel gewinnen wir
einen zusätzlichen Faktor 2(N + 1) im Nenner. % 1
n
|an | = n√ → 1,
Der Vorteil der Rechnung im Beispiel ist folgendermaßen n
begründet: Es gibt eine allgemeine Darstellung |an+1 | n
∞
= → 1.
! (x − 1)n |an | n+1
ln(x) = ,
n xn
n=1 Beide Kriterien liefern wie erwartet keine Aussage.
Potenzreihen –
Alleskönner unter 11
den Funktionen
Was ist ein Konvergenzradius?
Wie werden Standard-
funktionen im Komplexen
definiert ?
Wo steckt der Zusammenhang
zwischen den trigonome-
trischen Funktionen und
der Exponentialfunktion?
Die bisher in Beispielen betrachteten Funktionen, Polynom- man durch die Werte der Reihe eine Funktion in Abhängigkeit
funktionen, rationale Funktionen und ihre Umkehrungen, sind von x. Die Situation in (11.1) ist allerdings spezieller. Jede
dadurch gekennzeichnet, dass ihre Auswertung durch Lösen der Partialsummen sn der Reihe ist ein Polynom in x, und
algebraischer Gleichungen beschrieben werden kann. Man fasst beim Übergang von der Partialsumme sn−1 zur Partialsumme
all diese Abbildungen zur Klasse der algebraischen Funktionen sn kommt genau ein Term n-ten Grades hinzu. Dies ist die
zusammen. Dem gegenüber steht die Klasse der transzendenten Situation, in der man von einer Potenzreihe spricht.
Funktionen – Funktionen, deren Definition einen Grenzprozess
erfordert. Die wichtigsten Vertreter in dieser Klasse lassen sich Die Abbildung 11.1 zeigt für das Intervall (−1, 1) die Funk-
durch spezielle Reihen, die Potenzreihen, darstellen. tion f und einige der Polynome, die Partialsummen der Rei-
hendarstellung bilden. Man erkennt, dass schon für recht ge-
Neben der Definition solcher Reihen und dem Studium ihres ringe Werte von n die Graphen der Polynome den Graphen
Konvergenzverhaltens wird es in diesem Kapitel vor allem darum der Funktion in der Nähe der Stelle 0 recht gut approxi-
gehen, wie man Funktionen mit ihrer Hilfe darstellt und welche mieren. Weiter weg von der Null hin zum Rand des Inter-
Funktionen durch sie dargestellt werden können. Dabei stoßen valls (−1, 1), in dem die Reihe konvergiert, gibt es auch für
wir auf gute Bekannte, wie die Exponentialfunktion und die n = 10 erhebliche Unterschiede. Diese Frage der Approxi-
trigonometrischen Funktionen. Wir gehen sogar noch einen mation einer Funktion durch Reihen wird im Kapitel 15 über
Schritt weiter. Erst die Potenzreihen liefern uns die Möglichkeit, Differenzierbarkeit wieder eine Rolle spielen und führt dort
diese Funktionen zu definieren. Dabei erlauben wir von Beginn auf die sogenannten Taylorreihen.
an auch komplexe Argumente und werden dadurch einige neue
Ergebnisse über die komplexen Zahlen entdecken. f (x)
1
Potenzreihen sind Alleskönner – so behauptet es unsere Über- 1 + x + x 2 + · · · + x 10
x−1
schrift. Am Ende des Kapitels werden wir das so verstehen, dass 4 1 + x + x2 + x3
sich die bekannten Standardfunktionen durch Potenzreihen dar-
stellen lassen. Dass diese Reihen noch viel mehr können, werden
3 1 + x + x2
wir in den folgenden Kapiteln sehen, wenn durch Differenzie-
ren und Integrieren die funktionalen Zusammenhänge genauer
durchleuchtet werden. Die Potenzreihen sind zentral in der Ana- 2 1+x
lysis und erlauben weitreichende mathematische Aussagen, die
vor allem in der Funktionentheorie zum Tragen kommen.
1
−1 x
11.1 Definition und Grundlagen
−1
Zum Einstieg in das Thema Potenzreihen rekapitulieren wir
Abbildung 11.1 Die Funktion f (x) = 1/(1 − x) und einige ihrer Partialsum-
noch einmal ein Beispiel aus dem Kapitel über Reihen, die men auf dem Intervall (−1, 1). In der Nähe der Null bilden die Partialsummen
geometrische Reihe. Wir wissen, dass für jedes x ∈ C mit gute Approximationen.
|x| < 1 die geometrische Reihe konvergiert, und wir kennen
auch ihren Reihenwert:
∞
! Definition einer Potenzreihe
1
xn = . (11.1) Unter einer Potenzreihe versteht man eine Reihe der
1−x
n=0 Form ∞
!
n
Die rechte Seite dieses Ausdrucks ist ein Term, wie wir ihn an (z − z0 ) .
schon oft in den Kapiteln über Funktionen gesehen haben. n=0
Der Ausdruck macht für alle x ∈ C mit x = 1 Sinn. Wir Hierbei ist z ∈ C ein Parameter, (an ) eine Folge von
haben es also mit einer Funktion f : C=1 → C zu tun, wobei komplexen Koeffizienten, die feste Zahl z0 ∈ C heißt
1
f (x) = 1−x gilt. Entwicklungspunkt.
Die linke Seite in Gleichung (11.1) macht jedoch nur für
|x| < 1 Sinn, also nur für einen Teil des Definitionsbereichs
Neu hinzugekommen ist bei der Definition der Entwicklungs-
der Funktion. Für diese Teilmenge des Definitionsbereichs
punkt z0 . Er erlaubt es, eine Potenzreihe an den verschiede-
haben wir eine andere Abbildungsvorschrift für die Funktion
nen Stellen der komplexen Zahlenebene zu lokalisieren. Im
f gefunden, nämlich als Wert einer speziellen Reihe.
Fall z0 = 0 ist natürlich (z − z0 )n = zn . Sofern eine Potenz-
Immer wenn die Reihenglieder einer konvergenten Reihe in reihe für ein z ∈ C konvergiert, hängt dieser Reihenwert von
irgendeiner Form von einem Parameter x abhängen, erhält z ab. Wir erhalten eine Funktion mit z als Argument.
11.1 Definition und Grundlagen 383
q
1/
enten an von null verschieden sind. Ab einem bestimmten z0
Index ändern sich dann die Partialsummen nicht mehr. Wir
können übrigens zu einer Polynomfunktion eine endliche Po- absolut
tenzreihe um jeden beliebigen Entwicklungspunkt z ∈ C an- konvergent
geben, in dem wir x n = (x − z + z)n = nj=0 zn−j (x − z)j keine Aussage
ersetzen (siehe Seite 309).
Für den Rest dieses Abschnitts werden uns zwei zentrale Abbildung 11.2 Die Potenzreihe konvergiert nach dem Quotientenkriterium
Fragen beschäftigen: für |z − z0 | < 1/q absolut, außerhalb dieses Kreises divergiert sie. Auf der
Kreislinie selbst macht das Kriterium keine Aussage.
Kann man die Menge derjenigen z, für die eine Potenz-
reihe konvergiert, charakterisieren? Man spricht auch vom
Konvergenzbereich der Potenzreihe. Diese Ungleichungen beschreiben genau die Mengen in-
Welche Eigenschaften hat die durch die Reihenwerte auf nerhalb oder außerhalb des Kreises mit z0 als Mittelpunkt
diesem Konvergenzbereich definierte Funktion? und Radius 1/q. Im Innern des Kreises konvergiert die Po-
tenzreihe absolut, außerhalb des Kreises divergiert sie. Auf
der Kreislinie selbst kann die Potenzreihe konvergieren oder
divergieren, zumindest mit dem Quotientenkriterium erhält
Zu jeder Potenzreihe gehört ein man keine Aussage (siehe Abbildung 11.2).
Konvergenzradius
Die Aussage haben wir
) unter
) der Prämisse hergeleitet, dass
)a )
Um die Konvergenz einer Potenzreihe zu untersuchen, be- der Grenzwert lim ) n+1
an ) existiert. Sie gilt ganz allgemein,
n→∞
dient man sich am sinnvollsten genau jener Kriterien, die wir erfordert zum Beweis aber das Wurzelkriterium in seiner all-
schon für allgemeine Reihen entwickelt haben. Beginnen wir gemeinen Form.
mit dem Quotientenkriterium. Zu untersuchen ist der Quo-
tient ) ) )
)a n+1 ) )
) n+1 (z − z0 ) ) )) an+1 )) Der Konvergenzradius einer Potenzreihe
) )= |z − z0 |.
) a (z − z )n ) ) a ) Zu jeder Potenzreihe ∞ n=0 an (z − z0 ) gehört genau
n 0 n n
im Komplexen ?
Welche der folgenden Mengen können im Reellen den Kon-
im Reellen vergenzkreis einer Potenzreihe darstellen?
(−2, 2), (0, ∞), {−1}, [1, 3], R.
z0 − r z0 + r r
Überlegen Sie sich jeweils auch den Konvergenzradius und
z0 z0
den Entwicklungspunkt.
Abbildung 11.3 Im Reellen ist der Konvergenzkreis ein Intervall mit dem
Entwicklungspunkt als Mittelpunkt. Im Komplexen ist der Konvergenzkreis auch Zur Bestimmung des Konvergenzradius
geometrisch ein Kreis. behandelt man Potenzreihen am besten wie
gewöhnliche Reihen
Beweis: Wir betrachten die Folge
Um den Konvergenzkreis einer Potenzreihe zu ermitteln, las-
% % sen sich die Kriterien nutzen, die wir im Kapitel über Reihen
n
|an (z − z0 )n | = n
|an | |z − z0 |
schon kennengelernt haben.
für n ∈ N und unterscheiden drei Fälle: Beispiel
√ Bei der Potenzreihe
1.√Fall: Die Folge ( n |an |)n∈N ist unbeschränkt. Dann ist auch ∞
( |an (z − z0 )n |) unbeschränkt, wenn z = z0 ist, und die
n ! 2 n! + 1
n
(z − 1)
Reihe divergiert (Seite 353). Also ist der Konvergenzradius n!
n=1
r = 0. Man beachte, dass in diesem Fall die Potenzreihe nur
für z = z0 absolut konvergiert, denn dann sind alle Reihen- bietet es sich an, das Quotientenkriterium anzuwenden.
glieder außer möglicherweise dem allerersten null. Diese Untersuchung ergibt:
) )
) 2 (n + 1)! + 1 n! )
2. Fall: Es gelte für den größten Häufungspunkt: )
) (n + 1)! · · (z − 1)))
2 n! + 1
% ) )
) 2 (n + 1)! + 1 )
lim sup n
|an | = a > 0. = )) · (z − 1)))
n→∞ (2 n! + 1) (n + 1)
) )
) 2 (n + 1) + 1 )
In diesem Fall ist ) n! )
=) · (z − 1))
) (2 + 1 ) (n + 1) )
% n!
lim sup n
|an (z − z0 )n | = a |z − z0 | < 1, ) )
)2 + 1 )
n→∞ ) (n+1)! )
=) · (z − 1) )
) (2 + 1 ) )
n!
wenn |z − z0 | < a1 gilt. Nach dem Wurzelkriterium (Seite
→ 1 |z − 1| , n → ∞.
370) konvergiert die Reihe absolut. Andererseits divergiert
die Reihe nach dem Wurzelkriterium, wenn |z − z0 | > a1 ist. Die Potenzreihe konvergiert also absolut für
Also folgt r = a1 für den Konvergenzradius. |z − 1| < 1,
3. Fall: Im letzten Fall nehmen wir an, dass d. h., für alle z in einem Kreis mit Radius 1 und dem Ent-
% wicklungspunkt z0 = 1 als Mittelpunkt. Für alle z mit
lim sup n |an | = 0 |z − 1| > 1 divergiert die Potenzreihe. Der Konvergenz-
n→∞
radius ist r = 1.
ist. Dann erhalten wir für jede Zahl z ∈ C den Grenzwert Die Potenzreihe
∞
!
% % n
2 (z − i)n
lim sup n
|an (z − z0 )n | = lim sup n |an ||z − z0 | = 0 < 1.
n→∞ n→∞ n=0
kann mit dem Wurzelkriterium untersucht werden. Es ist
Insbesondere besagt das Wurzelkriterium, die Reihe konver- %
giert absolut für jedes z ∈ C.
n
|2n (z − i)n | = 2 |z − i|.
Die Potenzreihe konvergiert nach dem Wurzelkriterium
Häufig werden Potenzreihen nur im Reellen betrachtet. Es absolut für alle z ∈ C mit
sind dann alle Koeffizienten und der Entwicklungspunkt re- 1
|z − i| < .
ell, und man untersucht nur die Konvergenz für z ∈ R. In 2
diesem Fall ist der Konvergenzkreis stets ein symmetrisches Ist |z − i| > 1/2, so divergiert sie. Demnach beträgt der
Intervall mit dem Entwicklungspunkt z0 als Mittelpunkt. Konvergenzradius 1/2.
11.1 Definition und Grundlagen 385
1
Die im zweiten Fall des Beweises gezeigte Formel r = a, durch Potenzreihen gegebene Funktionen auf Stetigkeit hin
mit % untersuchen. Dazu betrachten wir eine Potenzreihe
a = lim sup n |an | > 0 ∞
n→∞ !
n
an z ,
wird als Formel von Hadamard bezeichnet. Eine entspre- n=0
chende, nicht ganz so allgemeine Formel lässt sich auch
aus dem Quotientenkriterium gewinnen. Beiden Formeln ge- die einen Konvergenzradius r > 0 haben soll. Weiterhin wäh-
meinsam ist, dass sie den Konvergenzradius allein aus den len wir eine Stelle ẑ mit |ẑ| < r und eine Folge (zk ) mit
Koeffizienten der Potenzreihe bestimmen, die vordergründig |zk | < r und lim zk = ẑ. Zur Abkürzung setzen wir noch
k→∞
lästige Behandlung des Terms (z − z0 )n entfällt. Allerdings
haben diese Formeln ihre Tücken, die ihre korrekte Hand- ∞
!
habung manchmal schwierig machen. Untersuchen Sie dazu f (z) = an zn , |z| < r.
das folgende Beispiel. n=0
Eine Potenzreihe definiert eine stetige Abbildung 11.4 Der Punkt ẑ im Inneren des Konvergenzkreises liegt sogar
noch innerhalb des etwas kleineren Kreises mit Radius ρ (grün). Auch die Glieder
Funktion der Folge (zk ), die gegen ẑ konvergiert, liegen ab einem bestimmten Index alle
innerhalb des grünen Kreises.
Als Fazit der bisherigen Untersuchungen können wir festhal-
ten, dass durch eine Potenzreihe eine Funktion definiert ist, Wir wählen nun ein ε > 0. Auch ρ liegt im Konvergenzkreis
deren Definitionsbereich durch das Innere des Konvergenz- der Potenzreihe, die Reihe konvergiert für z = ρ sogar ab-
kreises definiert wird. Die grundlegenden Eigenschaften der solut. Das bedeutet, es gibt insbesondere eine Zahl m ∈ N
so gegebenen Funktionen müssen wir genau untersuchen. mit
∞
!
Wobei das Thema hier keinesfalls abschließend behandeln ε
|an | ρ n < .
werden kann; es wird sich wie ein roter Faden durch die wei- 4
n=m+1
teren Kapitel ziehen, die sich mit Analysis beschäftigen.
Als eine ganz wesentliche Eigenschaft von Funktionen haben Zusammen mit der Dreiecksungleichung für absolut konver-
wir in Kapitel 9 die Stetigkeit kennengelernt. Wir wollen nun gente Reihen können wir so die Differenz zwischen f (zn )
386 11 Potenzreihen – Alleskönner unter den Funktionen
Wir gehen den Beweis auf Seite 385 zur Stetigkeit noch gleichzeitig einen festen Wert für m, um den ersten Sum-
einmal durch. Es genügt, einen Entwicklungspunkt z0 = 0 manden zu kontrollieren.
zu betrachten, da die Aussage mit der Transformation
Es ist also im Beweis erforderlich, dass die Reihenreste
z̃ = z−z0 auf diese Situation zurückgeführt werden kann.
unabhängig von den Stellen zk bzw. ẑ abgeschätzt werden
Um Stetigkeit zu zeigen, müssen wir die Differenz können. Zumindest in einer Umgebung U um den Punkt
ẑ muss sich der Index m so wählen lassen, dass für alle
∞
! ∞
! z ∈ U die Abschätzung
|f (ẑ) − f (zk )| = | an ẑn − an zkn |
n=0 n=0 ∞
!
|an ||z|n ≤ ε
gegen den Abstand |ẑ − zk | abschätzen; denn das Einzige,
n=m+1
was wir über die Folge (zk ) voraussetzen können, ist die
Konvergenz gegen ẑ. gilt. Diese Eigenschaft einer Folge von Funktionen nennt
man gleichmäßige Konvergenz, in diesem Fall der Funk-
Wir haben es mit ineinander geschachtelten Grenzwerten ∞
tionenfolgen gn : U → C mit gm (z) = m+1 |an ||z|
n
zu tun. Um letztendlich die beiden Grenzprozesse von-
gegen die Nullfunktion. Anders ausgedrückt: Die Folge
einander zu separieren, wird die Dreiecksungleichung ge-
der Partialsummen fm (z) = m n
n=0 an z konvergiert ab-
nutzt. Die Reihen lassen sich zerlegen in eine endliche
solut und gleichmäßig auf U gegen die Funktion f .
Summe bis zu einem noch frei wählbaren Wert m ∈ N
und den Reihenresten. Wir erhalten mit der Dreiecksun- Um im Beweis diese gleichmäßige Konvergenz zu garan-
gleichung tieren, ist es erforderlich, den Parameter ρ < r einzufüh-
) m ) ren. Denn gleichmäßige Konvergenz lässt sich nur zeigen,
)! !
m )
) ) wenn wir Punkte am Rand ausschließen. Mit ẑ im Inne-
|f (ẑ) − f (zk )| ≤ ) an ẑn − an zkn )
) ) ren des Konvergenzkreises können wir immer einen Wert
n=0 n=0
∞ ∞ ρ > 0 finden, sodass ẑ < ρ < r gilt. Wegen der absoluten
! !
+ |an | |ẑ|n + |an | |zk |n . Konvergenz der Potenzreihen insbesondere an der Stelle
n=m+1 n=m+1 z = ρ lässt sich bei Vorgabe eines Werts ε > 0 stets ein
m ∈ N wählen, sodass für alle z ∈ {z ∈ C : |z| ≤ ρ} die
Damit wir so argumentieren dürfen, muss sichergestellt Abschätzung
sein, dass die beiden Reihen absolut konvergieren. Dies
∞
! ∞
!
gilt aber allgemein für Potenzreihen im Inneren des Kon-
vergenzkreises. |an ||z|n ≤ |an |ρ n ≤ ε
n=m+1 n=m+1
In dieser Abschätzung ist der erste Summand die Diffe-
renz eines Polynoms an den Stellen ẑ und zk . Da Polynome gilt. Mit dieser Zahl m und der Stetigkeit des Polynoms
m n
stetige Funktionen sind, wird deutlich, dass wir diesen Bei- n=0 an z kann der Beweis abgeschlossen werden.
trag bei einem fest gewähltem Grad m mit k → ∞ „klein“ Es wird im präsentierten Beweis noch ε durch ε/4 bzw. ε/2
machen können. ersetzt, damit letztlich die Ungleichung |f (ẑ)−f (zk )| < ε
Wenden wir uns den beiden anderen Termen zu. Es sind elegant aussieht, wie bei der Definition der Stetigkeit.
beides Reihenreste konvergenter Reihen. Ist m nur hinrei- Kommentar: Wir werden dem Konzept der Gleichmäßig-
chend groß, so müssen auch diese Beiträge klein werden. keit noch in vielen verschiedenen Situationen begegnen.
Wo steckt nun das Problem? Es handelt sich um eine wesentliche Schwierigkeit, die zu
Geben wir uns ε > 0 vor, so lässt sich ein m ∈ N wählen berücksichtigen ist, wenn Grenzprozesse vertauscht wer-
mit den sollen. Wir werden später im Kapitel über Integration
∞
! und im Kapitel über Funktionenräume sehen, dass bei Fol-
|an ||zk |n ≤ ε. gen von Funktionen zwischen verschiedenen Konvergenz-
n=m+1 begriffen unterschieden werden muss. Die gleichmäßige
Aber der Wert m hängt von der Stelle zk ab und ändert Konvergenz ist eine dieser Konvergenzarten. Für Potenz-
sich, wenn ein anderes Folgenglied zl betrachtet wird. reihen zumindest haben wir gezeigt, dass auf abgeschlos-
Für die Stetigkeitsabschätzung müssen wir aber unendlich senen und beschränkten Teilmengen des Konvergenzkrei-
viele verschiedene Stellen zk zulassen, und wir benötigen ses gleichmäßige Konvergenz vorliegt.
388 11 Potenzreihen – Alleskönner unter den Funktionen
Beispiel: Auf dem Rand des Konvergenzkreises ist jedes Verhalten möglich
Für welche x ∈ R konvergieren die folgenden Potenzreihen?
∞ ∞ ∞
! (x − 1)n ! n ! (x − 3)n
n
(x − 2)
n n+1 n2 + 1
n=1 n=0 n=0
Problemanalyse und Strategie: Die Konvergenzradien können in allen drei Fällen mit dem Quotientenkriterium
bestimmt werden. Die Fragestellung bedeutet aber, dass nicht nur der Konvergenzradius ermittelt werden muss, sondern
auch eine Untersuchung des Randes des Konvergenzkreises erforderlich ist. Dies muss man separat durchführen. Auf-
grund der Aufgabenstellung müssen wir aber nur reelle Randpunkte untersuchen, nicht die gesamte Kreislinie in der
komplexen Ebene.
Kommentar: Das Beispiel verdeutlicht, dass auf dem Rand des Konvergenzkreises jedes Verhalten möglich ist: Die
erste Reihe konvergiert in einem Randpunkt, im anderen aber nicht, die zweite divergiert in beiden Randpunkten, die
dritte konvergiert in beiden absolut. Alle drei haben aber denselben Konvergenzradius. Bei solchen Untersuchungen ist
wirklich jeder Randpunkt separat zu untersuchen. Nimmt man noch die komplexen Zahlen hinzu, bedeutet dies natürlich
mehr Aufwand, denn dann besteht der Rand aus einer Kreislinie und nicht nur aus zwei Punkten.
11.2 Die Darstellung von Funktionen durch Potenzreihen 389
sowie die Funktion f : (−1, 1) → R mit f (x) = Die Aussage des Grenzwertsatzes besagt, dass die beiden
∞ n
n=0 an x . Gesucht ist nun eine Darstellung der Dif- Grenzprozesse z → ẑ und ∞ n=0 vertauscht werden dürfen.
ferenz s − f (x), die eine Abschätzung gegenüber der Wieder begegnen wir dem Vertauschen von Grenzwerten.
Differenz |1 − x| erlaubt. Aber so unproblematisch wie im Inneren des Konvergenz-
kreises ist die Situation beim Grenzwertsatz nicht. Man ent-
Mit der geometrischen Reihe gilt:
deckt die Schwierigkeit, wenn man versucht, den Satz ins
∞
! ∞
! Komplexe zu verallgemeinern.
1
xn = bzw. (1 − x) xn = 1
1−x
n=0 n=0 Beispiel Wir ersetzen versuchsweise alle reellen Argu-
mente im obigen Beweis durch komplexe Zahlen. Zunächst
für |x| < 1. Da beide Reihen, die Potenzreihe und die
können wir analog vorgehen, indem wir den Entwicklungs-
geometrische Reihe, für |x| < 1 absolut konvergieren,
punkt ẑ durch die Transformation z̃ = 1r (z − z0 )e−i arg(z−z0 )
erhalten wir mit dem Cauchy Produkt (Seite 367):
in die Stelle 1 + i0 drehen. Erst bei der Abschätzung (siehe
∞
∞ ∞ (11.2)) sehen wir das Problem.
! ! !
n n n
an x = (1 − x) x an x
Der Term |1 − z|/(1 − |z|) bleibt in einer Umgebung von
n=0 n=0 n=0
⎛ ⎞ ẑ = 1 nicht beschränkt. Dies ergibt sich etwa mit der Folge
∞
! !
n
zn = 1 − n12 + ni . Denn es gilt:
= (1 − x) ⎝ aj ⎠ x n
n=0 j =0 .
∞ 2 1 1 1 1
! |zn | = 1 − 2 (1 − 2 ) < 1, |1 − zn | = 1+ 2
= (1 − x) sn x n . n n n n
n=0
und
Damit folgt für |x| < 1 die Identität .
1 1
∞ ∞
(1 − |zn |) = 1 − 1− (1 − 2 )
! ! n2 n
s − f (x) = s (1 − x) x n − (1 − x) sn x n (1 − n12 )
1
n=0 n=0 = .
∞ n2 1 + 1 − 1
(1 − n12 )
! n2
= (1 − x) (s − sn )x n .
n=0 Also ist |1 − zn |/(1 − |zn |) unbeschränkt. Für die Beweisidee
des Grenzwertsatzes wird aber eine Schranke unabhängig
(iii) Als letzten Schritt im Beweis schätzen wir nun die Dif-
von N benötigt. Da eine solche gleichmäßige Abschätzung
ferenz ab. Mit der Dreiecksungleichung und |x| < 1 ist
hier nicht möglich ist, versagt das Argument an dieser Stelle.
⎛ ⎞
!
N ∞
! Es lässt sich nach diesen Überlegungen nur dann eine stetige
|s −f (x)| ≤ |1−x| ⎝ |s − sn | + |s − sn ||x| ⎠.
n
Fortsetzung bis in den Punkt ẑ erwarten und auch zeigen,
n=0 n=N +1
wenn durch arg(ẑ − z) ∈ [−ϕ, ϕ] mit 0 ≤ ϕ < π/2 der
Nun lässt sich zu ε > 0 ein N ∈ N wählen, sodass Definitionsbereich von f so eingeschränkt wird, dass der
|s − sn | < 2ε für alle n > N gilt, und es folgt mit der betrachtete Quotient beschränkt bleibt, denn mit Methoden
geometrischen Reihe: der Differenzialrechnung lässt sich zeigen, dass der Quotient
lokal durch 1/ cos ϕ abschätzbar ist.
!
N ∞
!
ε Oft sind beim Vertauschen von Grenzwerten zusätzliche Be-
|s − f (x)| ≤ |1 − x| |s − sn | + |1 − x| |x|n
2 dingungen, wie in diesem Beispiel, erforderlich, um in einem
n=0 n=N +1
passenden Sinn ein gleichmäßiges asymptotisches Verhalten
!
N
ε |1 − x| zu garantieren (siehe Seite 387).
≤ |1 − x| |s − sn | + . (11.2)
2 1 − |x|
n=0
Für 0 < x < 1 ist |1−x| = 1. Wählen wir weiter 11.2 Die Darstellung von Funk-
N 1−|x|
δ = ε/ 2 n=0 |s−sn | , so folgt für |1−x| ≤ min{δ, 1},
dass tionen durch Potenzreihen
!
N
ε Im einführenden Beispiel dieses Kapitels haben wir einen
|s − f (x)| ≤ δ |s − sn | + = ε,
2 Fall kennengelernt, in dem sich eine Funktion einerseits
n=0
durch eine Potenzreihe, andererseits durch eine explizite Ab-
und wir haben die stetige Fortsetzbarkeit im Grenzfall bildungsvorschrift darstellen lässt. In der Tat sind Darstellun-
x → 1 gezeigt. gen von Funktionen durch Potenzreihen wichtige Hilfsmittel.
390 11 Potenzreihen – Alleskönner unter den Funktionen
Sie dienen zur Lösung von Differenzialgleichungen, zur Be- Potenzreihendarstellung erlauben, werden auch als analyti-
rechnung von Integralen oder zur numerischen Auswertung sche Funktionen bezeichnet.
von Funktionen. Gibt man den Entwicklungspunkt z0 vor,
Für die Multiplikation von Potenzreihen machen wir uns zu
spricht man auch von der Potenzreihenentwicklung einer
Nutze, dass Potenzreihen im Innern ihres Konvergenzkrei-
Funktion um z0 .
ses stets absolut konvergieren. Damit steht uns das Cauchy-
Produkt zur Verfügung. Dieselben Voraussetzungen wie
Potenzreihen mit demselben Entwicklungs- oben sollen gelten: Beide Reihen haben denselben Entwick-
lungspunkt z0 , und wir betrachten nur den kleineren der bei-
punkt kann man addieren und multiplizieren den Konvergenzkreise. Dann gilt die Formel:
2∞ 3 2∞ 3 ∞
Da Potenzreihen nichts anderes sind als spezielle Reihen, ! ! !
n n
steht uns das gesamte Arsenal der Rechenregeln für Reihen an (z − z0 ) · bn (z − z0 ) = cn (z − z0 )n ,
und Reihenwerte zur Verfügung. Eine einfache Konsequenz n=0 n=0 n=0
ist die Tatsache, dass man Potenzreihen oder Vielfache von
wobei die Koeffizienten cn durch
ihnen addieren kann und als Ergebnis wieder eine Potenz-
reihe erhält. !
n
cn = ak bn−k
Einige Voraussetzungen sind zu beachten: Zunächst müssen
k=0
beide Potenzreihen denselben Entwicklungspunkt z0 besit-
zen. Ferner gehört zu jeder der beiden ursprünglichen Po- gegeben sind. Das Produkt zweier Potenzreihen liefert also
tenzreihen ein Konvergenzkreis, und es können nur solche auch wieder eine analytische Funktion.
z betrachtet werden, die im kleineren dieser beiden Kreise
liegen. Dann gilt die Formel: Beispiel Für x ∈ C\{−i, i} gilt die Gleichung
∞
! ∞
! 1 1 1
λ an (z − z0 )n + μ bn (z − z0 )n = · .
1 + x2 1+ix 1−ix
n=0 n=0
∞
! Die beiden hinteren Faktoren können wir für |x| < 1 mit der
= (λan + μbn ) (z − z0 )n geometrischen Reihe als Potenzreihen schreiben:
n=0
! ∞
1
für alle λ, μ ∈ C. = (−i)n x n ,
1+ix
n=0
Beispiel Wir betrachten die reellwertige Funktion ! ∞
1
= in x n .
1 1 1−ix
n=0
f (x) = + , |x| < 1.
1−x 1 − x2
Die Koeffizienten im Cauchy-Produkt sind
Für beide Summanden kennen wir schon eine Darstellung als
Potenzreihe mit dem Entwicklungspunkt Null: !
n !
n
cn = (−i)k (i)n−k = in (−1)k .
! ∞ k=0 k=0
1
= xn,
1−x Die in der Summe auftretenden Terme sind abwechselnd
n=0
∞ 1 und −1. Damit ergibt sich für n = 2k die Darstellung
1 !
= x 2n .
1 − x2 c2k = i2k · 1 = (−1)k ,
n=0
Also hat f die Darstellung und für n = 2k + 1 ist c2k+1 = 0. Also gilt:
∞ ! ∞ ! ∞ ! ∞
! 1
f (x) = an x n = cn x n = c2k x 2k = (−1)k x 2k .
1+x 2
n=0 n=0 k=0 k=0
mit an = 2 für gerades n und an = 1 für ungerades n. Allerdings kann man die geometrische Reihe auch direkt auf
den Bruch 1/(1 + x 2 ) anwenden:
Dieses einfache Resultat bedeutet algebraisch, dass die
Menge der Funktionen, die sich in einer Umgebung um einen 1 1 ! ∞ n ! ∞
2
= = −x = (−1)n x 2n .
Punkt als Potenzreihe schreiben lassen, einen Vektorraum 1 + x2 1 − (−x 2 )
n=0 n=0
bildet. Wir können diesen als einen Unterraum der stetigen
Funktionen auffassen (siehe Kapitel 11). Funktionen, die eine Beide Rechnungen liefern die gleiche Potenzreihe.
11.2 Die Darstellung von Funktionen durch Potenzreihen 391
Kommentar: Die durch den Ausdruck Wir beweisen dies durch vollständige Induktion. Mit z = z0
folgt sofort die Gleichung a0 = b0 . Dies ist der Induktions-
1
f (x) = anfang.
1 + x2
Nun nehmen wir an, dass wir wissen, dass aj = bj ist für
definierte Funktion kann auf ganz R definiert werden. Be- j = 1, . . . , N und wollen zeigen, dass dann auch aN +1 =
trachtet man dagegen ihre Potenzreihendarstellung bN +1 sein muss. Aufgrund der Annahme gilt:
∞
! !
N !
N
f (x) = (−1)n x 2n , aj (z − z0 )j = bj (z − z0 )j .
n=0 j =0 j =0
so ist diese nur für |x| < 1 gültig. In den reellen Zahlen gibt Dies sind zwei Polynome, deren Koeffizienten übereinstim-
es für dieses Phänomen keine Erklärung. Erst durch Betrach- men. Also folgt
tung der Potenzreihe im Komplexen wird der Grund klar: Die
∞
! ∞
!
Potenzreihe sieht die komplexen Nullstellen des Nenners bei
an (z − z0 )n = bn (z − z0 )n
±i, auch wenn nur reell gerechnet wird. Diese Nullstellen
n=N+1 n=N+1
schränken den Konvergenzkreis ein. Die komplexen Zahlen
bilden also das natürliche Umfeld, um Potenzreihen zu be- für alle z mit |z − z0 | < r. Auf beiden Seiten kann nun der
trachten und ihre Eigenschaften zu verstehen. Term (z − z0 )N +1 ausgeklammert werden:
∞
!
(z − z0 )N +1 aN +1+n (z − z0 )n
n=0
Der Identitätssatz belegt die Eindeutigkeit ∞
!
der Koeffizienten = (z − z0 )N +1 bN +1+n (z − z0 )n .
n=0
Im ersten Abschnitt des Kapitels haben wir gesehen, dass Auch diese Gleichung gilt für alle z mit |z − z0 | < r. Für
durch jede Potenzreihe innerhalb ihres Konvergenzkreises z = z0 ist der ausgeklammerte Faktor ungleich null, daher
eine Funktion definiert wird. Jetzt wollen wir die Frage stel- muss
len: Falls eine Funktion durch eine Potenzreihe dargestellt
∞
! ∞
!
wird, ist diese Darstellung dann eindeutig? Es ist entschei-
aN +1+n (z − z0 )n = bN +1+n (z − z0 )n
dend, dass diese Frage mit ja beantwortet werden kann, denn
n=0 n=0
so wird garantiert, dass sich aus der Kenntnis der Funktion die
Koeffizienten der Potenzreihe bestimmen lassen, wobei man sein. Die beiden identischen Potenzreihen sind stetig in z0 ,
sich natürlich auf einen Entwicklungspunkt festlegen muss. also gilt die Identität auch für z = z0 , und es folgt aN +1 =
Die entsprechende Aussage nennt man den Identitätssatz für bN +1 . Damit ist der Induktionsschritt durchgeführt.
Potenzreihen.
z2
f (z) = für z ∈ {w ∈ C | |w| < 1}
2 − 3z + z2
mit Entwicklungspunkt z0 = 0.
Problemanalyse und Strategie: Die Funktion wird als ein Produkt geschrieben, wobei wir für jeden Faktor eine
Potenzreihe angeben können. Die Berechnung der Produktreihe kann dann mit dem Cauchy-Produkt erfolgen.
Lösung: die Reihe in der Darstellung des ersten Faktors beginnt erst
Faktorisiert man den Nenner, beim Index 2 und entspricht somit nicht ganz genau der
Darstellung in der Definition des Cauchy-Produkts. Wir
2 − 3z + z2 = (1 − z) (2 − z), schreiben
∞ ∞
erkennt man, dass die Funktion wohldefiniert ist, denn ! ! z n !∞ !
n
n
keine dieser Nullstellen liegt im Definitionsbereich. z · = zn ak bn−k
2
n=2 n=0 n=0 k=0
Somit lässt sich f umschreiben zu
mit
z2 1
f (z) = · .
1−z 2−z 0, k = 0, 1, 1
ak = und bk = .
Die beiden Faktoren erinnern an die geometrische Reihe. 1, sonst 2n
Wenn wir beim zweiten Faktor 1/2 ausklammern, so er-
halten wir Damit erhalten wir:
1 ! z n
∞ !
n !
n !
n−2 !
n−2
1 1 1 1 1 1
= = ak bn−k = = = 2k .
2−z 2 1− z
2 2 2 2n−k 2n−k−2 2n−2
n=0 k=0 k=2 k=0 k=0
für alle z aus dem Definitionsbereich von f . Die Summe im letzten Term lässt sich mit der geometri-
Den ersten Faktor in der Darstellung von f schreiben wir schen Summenformel explizit berechnen. Es ergibt sich
als für n ≥ 2:
!∞ !∞ ∞
!
z2
= z2 zn = zn+2 = zn . !
n
1 1 − 2n−1 2n−1 − 1 1
1−z ak bn−k = · = = 2− n−2 .
n=0 n=0 n=2 2n−2 1−2 2 n−2 2
k=0
Diese Darstellung ist ebenfalls für alle z aus dem Defini-
tionsbereich von f gültig. Für n = 0 oder 1 ist die Summe null. Damit erhalten wir:
∞ ∞ ∞ ' (
Da beide Potenzreihen für |z| < 1 absolut konvergieren, 1 ! n ! z n ! 1
kann man die Produktreihe mit dem Cauchy-Produkt be- f (z) = z · = 1 − n−1 zn .
2 2 2
stimmen. Dabei muss man allerdings vorsichtig sein, denn n=2 n=0 n=2
Der Nenner ist uns schon von der geometrischen Reihe Es gilt für die gesuchte Potenzreihendarstellung:
her bekannt, es gilt: ∞ ∞ ∞ ∞
! ! ! !
! ∞ an zn = zn + zn = 1 + z + 2 zn .
1
= zn , |z| < 1. n=0 n=0 n=2 n=2
1−z
n=0 Aufgrund des Identitätssatzes müssen die beiden Potenz-
Daher können wir die Funktion folgendermaßen darstel- reihen die gleichen Koeffizienten haben. Also ist a0 = 1,
len: a1 = 1 und für alle n ≥ 2 gilt an = 2.
∞
! Insgesamt haben wir die folgende Potenzreihendarstel-
1
f (z) = (1 + z2 ) · = (1 + z2 ) zn lung für f gefunden:
1−z
n=0 ∞
!
∞
! ∞
! ∞
! ∞
! f (z) = 1 + z + 2 zn .
= zn + zn+2 = zn + zn . n=2
n=0 n=0 n=0 n=2
11.2 Die Darstellung von Funktionen durch Potenzreihen 393
Durch Koeffizientenvergleich sehen wir, dass im Vektor- für |1 − z| < 1. Auch das Polynom z2 + 1 muss hier um
raum V der Funktionen, die sich als Potenzreihen um den Punkt z0 = 1 entwickelt werden. Mit z = z − 1 + 1
z0 = 0 mit Konvergenzradius r > 0 schreiben lassen, die folgt:
Monome, also die Funktionen der Form fn (z) = zn , line- z2 + 1 = (z − 1)2 + 2(z − 1) + 2.
ar unabhängig sind (s. Seite 201). Denn für eine endliche
Also muss gelten:
Linearkombination dieser Funktionen mit N n=0 an fn =
0 ∈ V gilt: ∞
! ∞
!
bn (z − 1)n = (−1)n (z − 1)n+2
!
N !
N
an fn (z) = an zn = 0 n=0 n=0
!∞
n=0 n=0
+ 2(−1)n (z − 1)n+1
für |z| < r ∈ R. Der Koeffizientenvergleich liefert n=0
an = 0 für n = 1, . . . , N. Also sind die Funktionen fn , !∞
n = 0, 1, . . . , N als Elemente des Vektorraums V linear + 2(−1)n (z − 1)n .
unabhängig. n=0
Die Beispiele sind einfach, doch sie zeigen die wesentlichen Mit einer Indexverschiebung
Prinzipien der Methode des Koeffizientenvergleichs: Aus- ∞ ∞
! !
gangspunkt ist immer eine Gleichung, bei der auf beiden (−1)n (z − 1)n+2 = (−1)n (z − 1)n ,
Seiten eine Potenzreihe mit demselben Entwicklungspunkt n=0 n=2
steht. Dann stimmen die Koeffizienten links und rechts für ∞ ∞
! !
dieselben Potenzen überein. (−1)n (z − 1)n+1 = − (−1)n (z − 1)n
Ein paar Dinge sind dabei zu beachten: n=0 n=1
Die Potenzreihen links und rechts können die Gestalt von stimmen die Potenzen überein, allerdings starten die
Polynomen oder, was häufig vorkommt, der Nullfunktion Summen bei unterschiedlichem Index. Das wird dadurch
annehmen, wie im zweiten Beispiel. Dann sind unendlich aufgelöst, dass die überzähligen Summanden getrennt auf-
viele Koeffizienten bzw. sogar alle null. geführt werden. Damit ergibt sich:
Steht auf einer Seite eine Summe von Potenzreihen, so ∞
sind gegebenenfalls Indexverschiebungen notwendig, um !
bn (z − 1)n = 2 + (2 − 2) · (z − 1)
diese Reihen zusammenzufassen (siehe Beispiel auf Seite
n=0
394). ∞
! * +
Wichtig ist, dass man wirklich Koeffizienten für dieselben + (−1)n − 2 (−1)n + 2(−1)n (z − 1)n
Potenzen vergleicht – das ist nicht unbedingt dasselbe, wie n=2
Koeffizienten für das gleiche n. ∞
!
=2+ (−1)n (z − 1)n .
? n=2
Angenommen es gilt die Gleichung
Also ist b0 = 2, b1 = 0 und bn = (−1)n für n ≥ 2.
∞
! ∞
! ∞
! ∞ 2n+1
!
n n x
an x = bn (x − 1) = cn x n =
n!
n=0 n=0 n=1 n=0
Konvergenzradius und Entwicklungspunkt
für alle x aus einem Intervall I ⊆ R. Welche Aussagen kann hängen eng zusammen
man über die Koeffizientenfolgen (an ), (bn ) bzw. (cn ) durch
Koeffizientenvergleich treffen? Je nachdem, wie der Entwicklungspunkt gewählt wird, erhält
man für eine Funktion ganz unterschiedliche Darstellungen
als Potenzreihe. Dementsprechend ergeben sich auch ganz
Beispiel unterschiedliche Konvergenzradien.
Eine Koeffizientenfolge (bn ) mit
Allgemein lässt sich dabei nicht formulieren, wie sich der
∞
!
n z2 + 1 Zusammenhang zwischen Entwicklungspunkt und Konver-
bn (z − 1) = , |z − 1| < 1,
z genzradius darstellt. Die Eigenschaften der jeweiligen Funk-
n=0
tion bestimmen dies entscheidend. Für ein einfaches Beispiel
soll gefunden werden. Dazu schreiben wir den Nenner können wir den Zusammenhang aber klar darstellen.
geschickt um:
Wir betrachten die Funktion
∞
!
z2 + 1 z2 + 1
= = (z2 + 1) (1 − z)n 1
z 1 − (1 − z) f (z) = , z ∈ C \ {i}.
n=0 i−z
394 11 Potenzreihen – Alleskönner unter den Funktionen
Problemanalyse und Strategie: Mit einem Ansatz für f als Potenzreihe kann man durch Koeffizientenvergleich
eine Rekursionsformel für die Koeffizienten herleiten. Dazu müssen auch die auftretenden Polynome um z0 entwickelt
werden.
! ∞
Lösung: 1
(z − 1)2 + 2 = (an−2 − 4an−1 + 4an ) (z − 1)n
Der Ansatz für f lautet: 2
n=2
∞
! + (4a1 − 4a0 ) (z − 1) + 4a0 .
f (z) = an (z − 1)n .
n=0 Jetzt haben wir die Voraussetzung für den Koeffizienten-
Multipliziert man mit dem Nenner aus der Abbildungs- vergleich geschaffen: Auf beiden Seiten des Gleichheits-
vorschrift von f , so ergibt sich: zeichens steht eine Potenzreihe in (z − 1). Daher müssen
∞ die Koeffizienten gleich sein. Für die beiden einzelnen
1 2 !
(z − 2z + 5) = (z2 − 6z + 9) an (z − 1)n . Terme bedeutet dies:
2
n=0 1
4a0 = 2, also a0 = ,
Zunächst müssen jetzt auch die Polynome in Potenzen von 2
z − 1 geschrieben werden. Es gilt: 4a1 − 4a0 = 0,
1
also a1 = .
2
z2 − 6z + 9 = (z − 1)2 − 4(z − 1) + 4,
1 2 1 Für die Potenz (z − 1)2 erhält man noch:
(z − 2z + 5) = (z − 1)2 + 2.
2 2 1 3 1
Somit können wir jetzt auf der rechten Seite ausmultipli- = a0 − 4a1 + 4a2 = − + 4a2 , also a2 = .
2 2 2
zieren und erhalten:
1 Für alle größeren n gilt 0 = an−2 − 4an−1 + 4an , was die
(z − 1)2 + 2 Rekursionsformel
2
, -!∞ 1
= (z − 1)2 − 4(z − 1) + 4 an (z − 1)n an = an−1 − an−2 , n ≥ 3,
4
n=0
∞ ∞ liefert. Man kann jetzt noch versuchen, ob sich aus der Re-
! !
= an (z − 1) n+2
−4 an (z − 1) n+1 kursionsformel auch eine explizite Darstellung der Koef-
n=0 n=0 fizienten bestimmen lässt. Meist ist das sehr schwer, hier
∞
! aber ist es möglich. Die nächsten paar Koeffizienten ab
+4 an (z − 1)n . n = 3 lauten nämlich:
n=0 3 4 5
Im nächsten Schritt werden die drei Reihen durch Index- , , , ...
8 16 32
verschiebungen so umgeschrieben, dass in ihnen jeweils
(z − 1)n als Faktor steht. Dies ergibt: Dies legt die Vermutung nahe, dass an = n/2n gilt. Zum
Nachweis, dass dies richtig ist, verwenden wir vollstän-
! ∞
1 dige Induktion. Der Induktionsanfang ist schon erbracht,
(z − 1)2 + 2 = an−2 (z − 1)n
2 für den Induktionsschritt nehmen wir an, dass diese Dar-
n=2
∞ stellung für n − 1 und n − 2 stimmt. Dann gilt:
!
−4 an−1 (z − 1)n n−1 n−2 2n − 2 − n + 2 n
an = − = = n.
n=1 2n−1 4 · 2n−2 2n 2
!∞
+4 an (z − 1)n . Damit ist gezeigt, dass die Koeffizienten für alle n ≥ 3 die-
n=0 ser Darstellung genügen. Da auch a1 und a2 sich genauso
Ab dem Index n = 2 können die Reihen jetzt zusam- schreiben lassen, erhält man:
∞
mengefasst werden. In der zweiten und dritten Reihe blei- 1 ! n
ben dabei Terme übrig, die einzeln hingeschrieben werden f (z) = + (z − 1)n .
2 2n
müssen: n=1
11.2 Die Darstellung von Funktionen durch Potenzreihen 395
und daher:
0 1 Re
∞
!
n
f (z) = −i (−iz) für |z| < 1.
n=0
Im zweiten Schritt haben wir nur eine Indexverschiebung Die Definition des Symbols O(·) ist die folgende: Man
gemacht. schreibt
Der Faktor, mit dem x 6 multipliziert wird, ist nun stets kleiner f (x) = O((x − x0 )p ) für x → x0 ,
oder gleich eins, egal wie wir x wählen. Damit folgt: falls die Funktion f (x)
) ) (x − x0 )p
) )
)f (x) − (1 − x 2 + x 4 )) ≤ |x|6 für |x| < 1. beschränkt ist für alle x aus einer Umgebung von x0 und
x = x0 .
Allgemein gilt für die Differenz zwischen Partialsumme und
Funktion die Abschätzung ?
Bestimmen Sie ein Polynom q, sodass gilt:
) )
) !n ) x
) k) = q(x) + O(x 6 ) für x → 0.
)f (x) − ak (x − x0 ) ) ≤ C |x − x0 |n+1 ,
) ) 1 − x2
k=0
wobei die Konstante C eine Schranke für die verbleibende Es gibt auch eine entsprechende Notation, die ein kleines „o“
Reihe ∞ verwendet. Ihre Definition ist:
!
ak+n+1 (x − x0 )k f (x) = o((x − x0 )p ) für x → x0 ,
k=0 falls f (x)
lim = 0, x = x0 .
darstellt. Kennen wir C, können wir den Fehler also kom- (x − x0 )p
x→x0
plett kontrollieren. Beachten Sie aber, dass diese verblei- In Worten ausgedrückt bedeutet dies, dass f (x) schneller
bende Reihe nur auf einer kompakten Teilmenge des Inneren gegen null geht als (x − x0 )p . Auch die Sprechweise f ist
des Konvergenzkreises beschränkt sein muss. „klein o“ von (x − x0 )p ist gebräuchlich.
Anders als für numerische Zwecke, ist es für die Analysis Um sich ein Verhalten der Form O(x p ) zu veranschaulichen,
häufig nicht wichtig, den Wert von C zu kennen, sondern es ist ein Plot in logarithmischen Skalen am besten geeignet. Die
spielt nur eine Rolle, dass und mit welcher Potenz von x − x0 Definition des Logarithmus, der Umkehrfunktion zur Expo-
der Fehler für x → x0 gegen null geht. Auch in den Natur- nentialfunktion, wird in Abschnitt 11.5 diskutiert. Wendet
wissenschaften ist dies für die Herleitung von Naturgesetzen man in der Abschätzung
) )
eine ganz wichtige Technik. Betrachtet man die komplizier- ) f (x) )
) )
ten Gesetze, die das elastische Verhalten von Körpern allge- ) xp ) ≤ C
mein beschreiben, kann man sich zum Beispiel auf die ersten
auf beiden Seiten den Logarithmus an, so ergibt sich:
beiden Summanden in den Partialsummen beschränken. Das
Ergebnis ist die lineare Elastizitätstheorie, die nur für kleine ln |f (x)| ≤ ln C + p ln |x|.
Verformungen angewandt werden kann. Der Grund ist jetzt Ist also f (x) = O(x p ) (und ist das p hier das größtmögli-
klar: Für kleine Verformungen ist die Differenz zwischen der che), so ist der Plot von f in logarithmischen Skalen in der
gewählten Partialsumme und der eigentlichen Funktion klein Nähe von x0 eine Gerade. Die Abbildung 11.6 zeigt dies am
genug, sodass sich eine gute Näherung an die Wirklichkeit Beispiel der Differenz R(x) = 1/(1 + x 2 ) − nj=0 (−x)2j .
ergibt. Ein weiteres Beispiel findet sich auch in dem Beispiel
auf Seite 397.
R(x)
Es hat sich für diese Art der Näherung eine eigene Nota-
tion eingebürgert, die Landau-Symbolik nach dem deut- 1 1
2
schen Mathematiker Edmund Landau (1877–1938). Statt
den kompletten Fehlerterm aufzuschreiben, geben wir etwa
im Beispiel oben an, dass 10−4
ergibt sich, dass die Reihe für jede komplexe Zahl z ∈ C Funktionalgleichung der Exponentialfunktion
absolut konvergiert. Der Konvergenzradius dieser Reihe ist Für x, y ∈ C gilt:
unendlich.
exp(x + y) = exp(x) exp(y).
Beispiel Wir nutzen die Definition um die Euler’sche Zahl
e = exp(1) ∈ R und den Wert exp(1 + i) zu approximieren.
Beweis: Da beide Potenzreihen auf der rechten Seite der
Um eine Näherung an die Funktionswerte zu bekommen,
Identität absolut konvergieren, erhalten wir mit dem Cauchy-
rechnen wir die Partialsumme der Potenzreihe bis zu einem
Produkt (Seite 367)
N ∈ N aus. So erhalten wir auf acht Dezimalstellen gerundet: ⎛ ⎞
∞ j ∞ k
∞
! x ! y !
!
N
1 !
N
1 exp(x) exp(y) = ⎝ ⎠ = cn
N e≈ e1+i ≈ (1 + i)n j! k!
n! n! j =0 k=0 n=0
n=0 n=0
2 2.500 000 0 2.000 000 0 + 2.000 000 0 i mit
1.468 694 9 + 2.287 354 5 i ! n ' (
1 ! n l n−l
5 2.716 666 7 n
x l y n−l 1
10 2.718 281 8 1.468 693 9 + 2.287 355 2 i cn = = xy = (x + y)n ,
l! (n − l)! n! l n!
20 2.718 281 8 1.468 693 9 + 2.287 355 2 i l=0 l=0
Es scheint, dass wir relativ schnell eine gute Approximation wobei wir die allgemeine binomische Formel verwendet ha-
an den wahren Wert der Zahl e oder der Zahl exp(1 + i) ∈ C ben.
Beweis: Für positive Argumente x ≥ 0 sehen wir die Be- Aus unseren Überlegungen ergibt sich, dass
dingung direkt aus der Potenzreihe mit
∞ n ∞ n
en = exp(n)
! x ! x
exp(x) = =1+x+ ≥ 1 + x, ist.
n! n!
n=0 n=2
Betrachten wir in einem weiteren Schritt noch die Identität
da alle Summanden positiv sind.
' ( ' ( ' ' ((n
1 1 1
Außerdem ergibt sich aus der Funktionalgleichung exp(x) = exp x . . . exp x = exp x ,
exp(z) exp(−z) = exp(z − z) = exp(0) = 1, d. h., es gilt: n n n
1 n-mal
exp(−z) = .
exp(z) so sehen wir, dass offensichtlich der Funktionswert exp(x)
Insbesondere ist exp(x) > 0 für alle reellen Zahlen x ∈ R; zu einem Wert x ∈ R die Gleichung
denn für x > 0 sehen wir dies aus der eben gezeigten Un- ' (
1 %
gleichung exp(x) ≥ x + 1. Im Fall x < 0 gilt exp(x) = exp x = n exp(x)
1/ exp(−x) > 0. Daher gilt die gesuchte Ungleichung of- n
fensichtlich für x ≤ −1, denn in diesem Fall ist die linke erfüllt. Setzen wir x = m ∈ Z, und fassen wir diese Beob-
Seite der Ungleichung negativ. achtungen zusammen, so definieren diese Eigenschaften die
Es verbleibt noch das Intervall (−1, 0) zu untersuchen. Wir übliche Schreibweise
betrachten für x ∈ (−1, 0) die Differenz m √
n
e n = em ,
∞ n
! ∞
!
x (−1)n |x|n
exp(x) − x − 1 = = indem sie den Ausdruck in eine algebraische Beziehung zur
n! n!
n=2 n=2 Euler’schen Zahl e stellen. Auf diesem Weg liefert die Ex-
zwischen der Exponentialfunktion und dem Ausdruck 1 + x. ponentialfunktion die gewohnte Potenzrechnung zur Basis e
Fassen wir je zwei aufeinanderfolgende Reihenglieder zu- und ihre Fortsetzung auf C. Die Notation
sammen, so ergibt sich:
' ( ez = exp(z) für z ∈ C,
|x|2k |x|2k+1 |x|2k |x|
− = 1− . ist damit wohldefiniert. Wesentliche Eigenschaften der Ex-
(2k)! (2k + 1)! (2k)! 2k + 1
|x|
ponentialfunktion und seiner Umkehrung, dem Logarithmus,
Da der Faktor 1− 2k+1 > 0 stets positiv ist für x ∈ (−1, 0) finden Sie in der Übersicht auf Seite 403.
und k ∈ N, sind diese Summanden positiv. Zusammen mit
der absoluten Konvergenz der Reihe für die Differenz ergibt
sich auch in diesem Fall exp(x) ≥ 1 + x. Wir haben damit Der Kosinus hyperbolicus ist gerade und der
die Ungleichung für jedes x ∈ R gezeigt. Sinus hyperbolicus ungerade
Es wurde gezeigt, dass die durch die Potenzreihe gegebene Mit der Monotonie der allgemeinen Potenzfunktion erhal-
Exponentialfunktion f : R → R die beiden Bedingungen ten wir die Abschätzung
' (m n ' (mn +1
f (x + y) = f (x)f (y) und f (x) ≥ 1 + x 1 1 1
1+ < (1 + an ) an < 1+ .
mn + 1 mn
für alle x, y ∈ R erfüllt. Legen wir also für die weiteren
Überlegungen diese Bedingungen zugrunde. Wir beobachten, dass die so konstruierten Zahlen mn mit
n → ∞ auch gegen Unendlich streben. Da die Folge (bm )
Aus den Bedingungen lassen sich, wie im Text bewie- mit bm = (1 + 1/m)m gegen die so festlegbare Euler’sche
sen, weitere Eigenschaften belegen. So folgen aus den Zahl e konvergiert, lässt sich das Einschließungskriterium
Bedingungen f (0) = 1, f (x) = 1/f (−x) und induktiv anwenden, und aus
(f (x/n))n = f (x) bzw.
mn +1
x % 1 + mn1+1
f = n f (x) e = lim
1
≤ lim (1 + an ) an
n n→∞ n→∞
1 + mn1+1
für n ∈ N und x ∈ R. Damit erhalten wir die Abschätzung
x % und
x 1 1 ' (mn ' (
1+ ≤f = n f (x) = x ≤ . 1 1
n n f (− n ) 1− x
n lim (1 +
1
an ) an ≤ lim 1+ 1+ =e
n→∞ n→∞ mn mn
Also gilt die Einschließung
folgt die Konvergenz
x n 1
1+ ≤ f (x) ≤ n 1
n 1 − xn (1 + an ) an → e, n → ∞.
für alle n ∈ N und alle x ∈ R. Wenden wir dieses Resultat auf die Nullfolgen an = x/n
x/n
Um die Behauptung, dass es nur eine Funktion f mit die- bzw. auf an = 1−x/n an, so folgt aus der Einschließung
sen Eigenschaften gibt, zu beweisen, zeigen wir, dass für für die Funktion f , dass für alle x ∈ R
jedes x ∈ R beide Folgen gegen denselben Grenzwert ' (
konvergieren. Damit haben wir insbesondere die Identität x xn x x n
ex = lim 1+ = lim 1 + ≤ f (x)
n→∞ n n→∞ n
x n
ex = lim 1+ . 1 x x n
n→∞ n ≤ lim n = lim 1 + 1 − = ex
n→∞ 1 − x n→∞ n n
n
für x ∈ R bewiesen.
gilt. Die Funktion f ist also die Exponentialfunktion.
Die Existenz des Grenzwerts auf der rechten Seite im Fall
Kommentar: Da im Beweis die allgemeine Potenzfunk-
x = 1 haben wir schon auf Seite 292 gezeigt. Wir verall-
tion verwendet wird, benötigen wir hier die Exponential-
gemeinern diese Konvergenz für beliebige Nullfolge (an )
funktion und ihre Umkehrfunktion definiert durch die Po-
positiver reeller Zahlen an ∈ R>0 . Da (an ) eine Nullfolge
tenzreihe. Es folgt, dass diese Funktion die einzige ist, die
ist, gibt es zu jedem n eine natürliche Zahl mn ∈ N mit
die beiden charakterisierenden Bedingungen erfüllt. Will
der Eigenschaft
man die Exponentialfunktion nur über die beiden Bedin-
1 gungen definieren, muss man die Argumentation entspre-
mn ≤ < mn + 1. chend modifizieren.
an
11.3 Die Exponentialfunktion 401
In seiner Abhandlung beweist Szegö unter anderem, dass wobei die Monotonie der Koeffizienten genutzt wird. Also
sich die skalierten Nullstellen mit n → ∞ immer besser gilt für Nullstellen solcher Polynome |z̃| ≥ 1.
402 11 Potenzreihen – Alleskönner unter den Funktionen
Bei der Exponentialfunktion werden die beiden Anteile Ko- Genauso ergibt sich der ungerade Sinus hyperbolicus:
sinus hyperbolicus und Sinus hyperbolicus genannt. Wir er- ∞ ∞
halten ersteren für den geraden Anteil: 1 z 1 ! zn ! (−z) n
sinh z = (e − e−z ) = −
∞ ∞
2 2
n=0
n!
n=0
n!
1 z −z 1 ! zn ! (−z)n ∞ ∞
cosh z = (e + e ) = + 1 ! zn ! z2k+1
2 2 n! n! = (1 − (−1)n ) = .
∞
n=0
n=0 2 n! (2k + 1)!
∞ n=0 k=0
1 ! zn ! z2k
= (1 + (−1)n ) = .
2 n! (2k)! Wiederum mit dem Quotientenkriterium zeigt sich, dass die
n=0 k=0
Potenzreihen für alle z ∈ C konvergieren.
Mit dem Quotienten Eine gerade Funktion weist Achsensymmetrie des Graphen
) ) auf. Der Graph einer ungeraden Funktion ist punktsymme-
) (2k)!z2(k+1) )
) ) 1 trisch zum Ursprung (Abb. 11.8 und 11.9). Beachten Sie,
) )= |z|2 → 0
) (2(k + 1))!z2k ) (2k + 1)(2k + 2) dass bei einer Potenzreihe zu einer geraden Funktion nur ge-
rade Potenzen auftauchen und bei einer ungeraden Funktion
für k → ∞ folgt sofort, dass der Konvergenzradius unend- umgekehrt nur ungerade Potenzen in der darstellenden Po-
lich ist, d. h., die Potenzreihe konvergiert für jede Zahl z ∈ C tenzreihe einen Beitrag leisten (siehe Aufgabe 11.16).
absolut.
Beispiel Mit der Funktionalgleichung der Exponential-
funktion oder aus den Potenzreihendarstellungen lässt sich
die Identität
1
sinh z cosh z = sinh(2z)
2
zeigen.
Wir rechnen nach:
ez − e−z ez + e−z 1 z z
sinh z cosh z = = e e − e−z e−z
2 2 4
1 2z 1
= e − e−2z = sinh(2z).
4 2
|ez | = eRe(z) .
Abbildung 11.9 Der Realteil von sinh z als Funktion über der komplexen
Zahlenebene. Die roten Punkte markieren die Punkte auf dem Graphen für z und Der Betrag von ez ist also allein durch den Realteil der Zahl
−z. Der Realteil von sinh ist ungerade, es gilt Re sinh z = −Re sinh(−z). z bestimmt.
11.4 Trigonometrische Funktionen 403
ln x ≤ x − 1 x > 0,
1 ln x < ln y für 0 < x < y (Monotonie).
ln
Exponentialfunktionen zur Basis a, b ∈ C\{0}:
Für w, z ∈ C gilt:
−1 1 x
a z = ez ln a ,
−1 a w+z = a w a z ,
(ab)z = a z bz , für arg a + arg b ∈ (−π, π],
sinh a wz = (a w )z , für Im(w ln a) ∈ (−π, π],
ln z
loga (z) = , a ∈ {0, 1},
Kosinus und Sinus hyperbolicus ln a
1 z loga (wz) = loga (w) + loga (z)
cosh z = e + e−z ,
2 für arg(w) + arg(z) ∈ (−π, π].
1 z
sinh z = e − e−z ,
2
Da ex für x ∈ R reell ist, bleibt der Term eiy mit einer reellen
Nachdem wir den Betrag und die konjugiert komplexe Zahl Zahl y zu untersuchen. Mit dem oben ermittelten Betrag
zu ez ∈ C bestimmt haben, fehlen uns noch der Real- und der
Imaginärteil. Wir suchen also im Folgenden die Zerlegung ex = |ez | = ex |eiy |
einer Zahl ez mit z = x + iy und x, y ∈ R in Real- und
Imaginärteil. erhalten wir:
|eiy | = 1 für y ∈ R.
404 11 Potenzreihen – Alleskönner unter den Funktionen
Also liegt eiy auf dem Einheitskreis in der komplexen Zahlen- sammenhang zwischen Exponentialfunktion und den trigo-
ebene. Damit gibt es eine Polarkoordinatendarstellung dieser nometrischen Funktionen. Sicherlich ist dies ein Höhepunkt
Zahl von der Form eiy = cos t + i sin t, wobei t ∈ [0, 2π) der Analysis – die Euler’sche Formel:
gerade das Argument der komplexen Zahl eiy ist, also der
Winkel zur reellen Achse im Bogenmaß. Die Euler’sche Formel
Für t ∈ R gilt:
Definition der trigonometrischen Funktionen eit = cos t + i sin t.
Betrachten wir Real- und Imaginärteil der Potenzreihendar-
Aus der Euler’schen Formel folgt auch:
stellung der Exponentialfunktion, so folgt:
∞
e−it = cos t − i sin t, t ∈ R.
! 1
iy
cos t + i sin t = e = (iy)k und betrachten wir die oben berechnete Zerlegung der Po-
k!
k=0 tenzreihen mit z ∈ C anstelle von y ∈ R, so ergibt sich
∞
! ∞
!
(−1)k (−1)k 2k+1 allgemein die Identität:
= y 2k + i y ,
2k! (2k + 1)! eiz = cos z + i sin z.
k=0 k=0
Kehren wir zurück zur anfänglichen Frage nach dem Real- Auch andere zentrale Eigenschaften der trigonometrischen
und dem Imaginärteil des Bilds ez einer komplexen Zahl z. Funktionen sind direkt aus der Potenzreihendarstellung her-
Wir erhalten mit der Euler’schen Formel aus leitbar. Sehr angenehm ist, dass sich nebenbei die Additions-
theoreme für die trigonometrischen Funktionen aus der Funk-
ez = ex eiy = ex (cos y + i sin y) tionalgleichung der Exponentialfunktion ergeben. Denn aus
für eine komplexe Zahl z = x + iy ∈ C die Zerlegung cos(w+z) ± i sin(w+z) = e±i(z+w) = e±iw e±iz
1 iz 1
beschreiben. Somit folgt mit der Euler’schen Formel für sin z = − (e − e−iz ) = − (e−iz − eiz ) = sin(z).
z ∈ K, dass 2i 2i
iϕ
|eiz | = |ei2e | = |ei2(cos ϕ+i sin ϕ) | Auch der Real- und der Imaginärteil etwa der komplexen
= |e−2 sin ϕ+i2 cos ϕ | = e−2 sin ϕ Zahl cos z für z = x + iy ∈ C ergibt sich aus der Euler’schen
Formel. Für den Realteil erhalten wir aus der Summe der
gilt. komplexen Zahl mit ihrer konjugiert komplexen Zahl die
Gleichung:
Nutzen wir die Symmetrien des Kosinus und des Sinus, so
ergeben sich aus eiz = cos z + i sin z die nützlichen Identitä- 1 1
Re cos z = (cos z + cos z) = (cos z + cos z)
ten 2 2
1 i(x+iy)
1 iz 1 iz = e + e−i(x+iy) + ei(x−iy) + e−i(x−iy)
cos z = (e + e−iz ) und sin z = (e − e−iz ). 4
2 2i 1 ix −y
= e e + e−ix ey + eix ey + e−ix e−y
4
? 1 y ix
= e (e + e−ix ) + e−y (eix + e−ix )
Überlegen Sie sich die Identitäten cos(iz) = cosh z und 4
sin(iz) = i sinh z. 1 y
= (e + e−y )(eix + e−ix ) = cos x cosh y
4
406 11 Potenzreihen – Alleskönner unter den Funktionen
Die Zahl π
Beispiel Setzen wir in der Euler’schen Formel t = π, so
Die Funktion cos : R → R besitzt genau eine Nullstelle
erhalten wir die schöne Identität
x̂ im Intervall [0, 2] ⊆ R. Diese Nullstelle definiert die
Zahl π = 2x̂. eiπ = −1,
(siehe Titelbild des Kapitels).
Beweis: Mit der Potenzreihe zum Kosinus ist für reelle Zah-
len durch Aus sin2 π
= cos2 π
+ sin2 π
= 1 folgt weiter, dass
2 2 2
∞
! ∞
! π
(−1)n (−1)n sin =1
1 − cos x = x 2n = x 2 x 2n 2
(2n + 2)! (2n + 2)!
n=1 n=0
ist, da sin π2 > 0 gelten muss, wie wir im obigen Beweis ge-
eine alternierende Reihe gegeben. Außerdem fällt die Folge sehen haben. Alle weiteren reellen Nullstellen und Extrema
(x 2n /(2n + 2)!) für |x| ≤ 2 monoton und konvergiert gegen der trigonometrischen Funktionen sin und cos, wie sie in der
0. Also lässt sich das Leibniz-Kriterium (siehe Seite 361) Übersicht auf Seite 406 aufgelistet sind, folgen nun aus der
anwenden, und wir erhalten die Fehlerabschätzung: Identität
π n π n
) ) π π
) ein 2 = ei 2 = cos + i sin = in .
x2 ) x 2 )) x4 16 2 2 2
cos x − 1 + ≤ )1 − cos x − ) ≤ ≤ =
2! ) 2! ) 4! 24 3 So sehen wir etwa aus eiπ = −1 die Werte
für x ∈ R mit |x| ≤ 2. Somit ist cos 2 ≤ 1 − 22 /2! + 2/3 = cos π = −1 und sin π = 0.
−1/3 < 0.
Beispiel Aus den speziellen Werten und den Additions-
Andererseits erkennen wir aus der Definition, dass cos 0 = theoremen ergeben sich weitere nützliche Beziehungen der
1 > 0 ist. Damit existieren nach dem Nullstellensatz (siehe trigonometrischen Funktionen. So erhalten wir mit den Ad-
Seite 336) Nullstellen im Intervall [0, 2]. ditionstheoremen bei einer Phasenverschiebung um π2 :
Nun bleibt noch zu zeigen, dass es nur eine einzige Nullstelle π π π
ist. Wiederum nach dem Leibniz-Kriterium gilt für die Reihe cos z + = cos z cos − sin z sin = − sin z
2 2 2
∞
! und
(−1)n π
sin x
= x 2n π π
x (2n + 1)! sin z + = cos z sin − sin z cos = cos z.
n=0 2 2 2
408 11 Potenzreihen – Alleskönner unter den Funktionen
Problemanalyse und Strategie: Es gibt zwei Wege zur Berechnung der Lösungen. Zum einen kann der Kosinus
direkt durch die Exponentialfunktion ausgedrückt werden, was auf eine quadratische Gleichung führt. Der zweite Weg
ist die Aufspaltung der Gleichung in Real- und Imaginärteil, was zu einem Gleichungssystem mit zwei Unbekannten
führt. In beiden Fällen ist die Euler’sche Formel das zentrale Werkzeug.
Lösung: oder
Wir wollen beide Lösungswege vorführen. Im ersten Fall √
verwenden wir die Darstellung der Kosinus-Funktion, die z = 2πn − i ln(4 ± 15), n ∈ Z.
wir aus der Euler’schen Formel gewonnen haben:
Für den zweiten Weg schreiben wir z = x + iy mit x,
1 iz
cos z = e + e−iz . y ∈ R. Dann haben wir schon mit der Euler’schen Formel
2 berechnet, dass
Dies setzt man in die Gleichung ein und multipliziert auf
Re cos z = cos x cosh y
beiden Seiten mit 2eiz :
Wenn wir w = eiz substituieren, erkennen wir, dass es Im cos z = − sin x sinh y
sich um eine quadratische Gleichung handelt:
ist. Wir können also Real- und Imaginärteil der Gleichung
2 getrennt betrachten, d. h.,
w − 8w + 1 = 0.
Mit quadratischer Ergänzung bestimmen wir die Lösun- cos x cosh y = 4, sin x sinh y = 0.
gen
Dies ist ein Gleichungssystem in x, y ∈ R. Die zweite
√
(w − 4)2 − 15 = 0, d. h., w = 4 ± 15. Gleichung kann nur erfüllt sein, falls y = 0 oder aber
sin x = 0 ist. Die Annahme y = 0 bedeutet cosh y = 1.
Wir müssen noch resubstituieren: Dann kann die erste Gleichung für ein reelles x nicht gel-
√ ten. Also muss sin x = 0 sein, d. h., x = πn mit n ∈ Z.
4 ± 15 = w = eiz . Es gilt cos x = cos(nπ) = (−1)n . Da cosh y > 0 ist,
muss cos x ≥ 0 sein, damit die erste Gleichung erfüllt ist.
Gesucht sind alle z ∈ C, die diese Gleichung erfüllen.
Es folgt, dass n gerade und somit cos x = 1 ist. Damit er-
Ist allerdings eine Lösung gefunden, so unterscheidet sich
gibt sich schließlich y = ± arcosh 4 – beachten Sie, dass
jede weitere davon nur durch ein Vielfaches von 2πi. Eine
cosh nur abschnittsweise umkehrbar ist. Die Lösung auf
besondere Lösung z ist diejenige, bei der iz reell ist. Diese
dem zweiten Weg ist also
erhält man durch Anwendung des natürlichen Logarith-
mus. Daher gilt: z = x + iy = 2πn ± i arcosh 4, n ∈ Z.
√
iz = ln(4 ± 15) + 2πi n, n ∈ Z,
Kommentar: Auf den ersten Blick sehen die Lösungen, die wir auf den zwei Wegen gewonnen haben, unterschiedlich
aus. Es gilt aber:
' ( √
√ 1 ln(4±√15) √
− ln(4± 15) 1 √ 1 1 √ 4 ∓ 15
cosh ln 4 ± 15 = e +e = 4 ± 15 + √ = 4 ± 15 + = 4.
2 2 4 ± 15 2 16 − 15
11.5 Der Logarithmus Außerdem gilt für den Hauptwert des Logarithmus stets
Im(ln z) ∈ (−π, π].
Aus den anschaulichen Abbildungseigenschaften der Expo- Wir müssen noch prüfen, ob der so definierte Logarithmus
nentialfunktion auch im Komplexen eine Umkehrfunktion zur Exponential-
funktion ist. Dies ergibt sich direkt aus der Euler’schen For-
|ez | = eRe(z) und arg (ez ) = Im(z) + 2nπ,
mel und Polarkoordinaten.
wobei n ∈ N so zu wählen ist, dass arg (ez ) ∈ (−π, π] gilt, Folgerung: Es gilt:
können wir uns eine Definition der Umkehrfunktion der Ex-
ponentialfunktion, den Logarithmus, verschaffen. Dazu müs- eln z = z für z = 0,
sen die beiden Beziehungen umgekehrt werden. Offensicht- ln(ez ) = z für Im(z) ∈ (−π, π].
lich benötigen wir zunächst den Logarithmus im Reellen.
Lemma
Die Funktion exp : R → R ist streng monoton steigend. Beweis: Die Identitäten lassen sich mit der Euler’schen
Formel nachrechnen. Für z ∈ C\{0} ist
Monotonie von exp liefert die Somit ist der Logarithmus die Umkehrfunktion zu exp :
Umkehrfunktion für reelle Argumente {z ∈ C | −π < Im z ≤ π} → C\{0}.
Im Im
Mit der Folgerung auf Seite 312 existiert die Umkehrfunk- C \ {0} ln
tion zu exp : R → R>0 . Die Surjektivität der Abbildung π
sieht man aus exp(x) → ∞ für x → ∞, dem Grenzwert
lim exp(−x) = lim 1/ exp(x) = 0 und dem Zwischen-
x→∞ x→∞
Re Re
wertsatz. Wir bezeichnen diese Umkehrfunktion als den
natürlichen Logarithmus ln : R>0 → R. −π
Die Umkehrung der Exponentialfunktion Abbildung 11.12 Das Bild des Hauptwerts des komplexen Logarithmus auf
C\{0}.
Mithilfe des Logarithmus auf R lässt sich nun diese Funk-
tion auch auf die komplexe Ebene fortsetzen. Betrachten wir Eine Translation des Imaginärteils im Argument der Expo-
die ersten beiden Identitäten im Abschnitt, so wird deutlich, nentialfunktion um ganzzahlige Vielfache von 2π ändert den
wie der komplexe Logarithmus als Umkehrung dieser beiden Funktionswert nicht, denn mit der Euler’schen Formel ist
Gleichungen zu bilden ist.
ex+i(y+2πn) = ex (cos(y + 2πn) + i sin(y + 2πn))
Für w, z ∈ C gilt:
für Re (z)
⎧
⎨ 1, falls arg(w) + arg(z) > π,
β= 0, falls − π < arg(w) + arg(z) ≤ π,
⎩
−1, falls arg(w) + arg(z) ≤ −π.
z = −2 = 2eiπ
Die allgemeine Potenzfunktion
erhalten wir die Produkte: Für a ∈ C\{0} ist durch
i π4 −i 3π −i π2
vw = 2e e = 2e = −2i,
4
√ i π iπ √ i 5π a z = ez ln a
vz = 2 2e 4 e = 2 2e 4 = −2 − 2i.
der Hauptwert der allgemeinen Potenz definiert. Im
Damit folgt für den Hauptwert des Logarithmus aus diesen Fall a = 0 und z = 0 definieren wir a z = 0.
beiden Produkten:
√ π √ 3π
ln v + ln w = ln 2 + i + ln 2 − i Achtung: Bei dieser Definition ist zu beachten, dass dem
4 4
π Ausdruck 00 keine sinnvolle Bedeutung zugeordnet werden
= ln 2 − i = ln(−2i) = ln(vw) kann. Wenn Ihnen bei Grenzwerten ein solcher Ausdruck
2
begegnen sollte, müssen Sie genau hinsehen und die Konver-
und
√ genz analysieren.
π
ln v + ln z = ln 2 + i + ln 2 + iπ
4
√ 5π Beispiel Gesucht sind Real- und Imaginärteil der Zahl ii .
= ln 2 2 + i Wir verwenden den Hauptwert des Logarithmus und erhalten
'4 (
√ 3π
= ln 2 2 + −i + i2π = ln(vz) + i2π. ln 1+i π2 π
4 ii = ei ln(i) = ei = e− 2 .
Wegen der Einschränkung des Definitionsbereichs beim
Logarithmus, ist beim Wurzelzeichen Vorsichtig geboten.
Da der Hauptwert des Logarithmus nur auf dem Streifen
Wählen wir den Hauptwert, so erhalten wir etwa die Identität
−π < Im(z) ≤ π als Umkehrfunktion der Exponentialfunk-
tion betrachtet werden kann, sind manchmal auch sogenannte 1 1 1 π
(−1) 3 = e 3 ln(−1) = e 3 (ln 1+iπ) = ei 3 .
Nebenzweige, also Phasenverschiebungen um ganzzahlige
Vielfache von 2π , zu betrachten, d. h.: Andererseits wird man im Zusammenhang√mit der reellen
ln(z) + i2πm, mit m ∈ Z. Umkehrfunktion häufig auch die Notation 3 −1 = −1 fin-
den, bei der ein Nebenzweig der dritten Wurzel genutzt
In Abbildung 11.13 bedeutet dies, dass wir an der Nahtstelle wird. Wir verwenden die Potenzschreibweise im ersten Fall
1
bei der negativen reellen Achse die gezeigte Fläche stetig ausschließlich für den Hauptzweig, d. h., (−1) 3 = −1.
nach oben oder unten ankleben. Auch beim Symbol für die Quadratwurzel legen wir den
11.5 Der Logarithmus 411
Hauptzweig fest, also insbesondere die übliche Konvention, Andererseits erhalten wir:
√
dass mit a die positive Wurzel einer reellen Zahl a ≥ 0 √
1
ln 2−i 34 π √ 3
gemeint ist. Nur mit√dieser Festlegung ist die häufig verwen- 2 e−i 8 π ,
1/2 4
(−1 − i) =e 2
=
dete Schreibweise −1 = i sinnvoll. Bei einer Verwendung
des Wurzelsymbols sollten Sie stets berücksichtigen, wel- d. h., wir berechnen die zweite Lösung der quadratischen
cher Zweig des Logarithmus der Notation zugrunde liegt, Gleichung z2 = −1 − i.
um Fehler zu vermeiden.
Die Funktionalgleichung der Exponentialfunktion überträgt Achtung: Aus dem Reellen geläufige Rechenregeln für
sich direkt auf die allgemeine Potenz und wir erhalten für Potenzen übertragen sich teilweise nur mit Einschränkungen
a ∈ C\{0}: ins Komplexe. Im Zweifelsfall müssen neben dem Hauptwert
a w a z = ew ln a ez ln a = e(w+z) ln a = a w+z des Logarithmus auch Nebenwerte mit überprüft werden.
für alle w, z ∈ C.
Für die Umkehrung der allgemeinen Potenzfunktion nutzen
Mit der allgemeinen Definition lassen sich auch weitere wir die Definition des natürlichen Logarithmus und erhalten
Regeln zur Potenzrechnung nachvollziehen. Es gilt: für z ∈ C\{0} und a ∈ C\{0, 1} die Darstellung des Haupt-
x )y werts
(ex )y = e(ln e = exy ln z
loga z = .
für alle x, y ∈ C mit Im(x) ∈ (−π, π]. Analog gilt die Be- ln a
ziehung für die allgemeine Potenz zu einer Basis a ∈ C\{0}, Mit dem natürlichen Logarithmus ergeben sich aus der De-
wenn Im(x ln a) ∈ (−π, π] ist. finition die Umkehreigenschaften
? ln z
a loga (z) = eln a ln a = z
Was ergibt sich für (ex )y , wenn Im(x) ∈ (−π, π]?
und
ln(ez ln a ) 2πm
Achtung: Beachten Sie, dass (a x )y = a (x y )
ist. Klammern loga (a z ) = =z+ i,
ln a ln a
sind bei solchen Ausdrücken also stets erforderlich.
wenn m ∈ Z so gewählt wird, dass Im(z ln a) + 2πm ∈
Aufpassen müssen wir auch bei der Anwendung einer ande- (−π, π] ist.
ren aus dem Reellen geläufigen Regel zur Potenzrechnung.
Es gilt für a, b ∈ C\{0} mit arg a + arg b ∈ (−π, π] die
?
Wie lautet die Funktionalgleichung für loga und welche Vor-
Gleichung:
aussetzungen müssen gelten?
a z bz = ez ln a ez ln b = ez(ln a+ln b) = ez ln(ab) = (ab)z .
Dabei ist die Voraussetzung arg a + arg b ∈ (−π, π] not- In den letzten drei Abschnitten haben wir gesehen, dass sich
wendig, denn wir haben die Funktionalgleichung des Loga- die grundlegenden Funktionen wie die Exponentialfunktion,
rithmus angewandt. Sobald die Bedingung nicht erfüllt ist, der Kosinus oder der Sinus alle mittels Potenzreihen defi-
muss man den zusätzlichen Term der Funktionalgleichung nieren lassen. Weitere Darstellungen von Funktionen durch
für β = 0 berücksichtigen. Potenzreihen um passende Entwicklungspunkte etwa zum
Logarithmus wollen wir an dieser Stelle noch aufschieben.
Beispiel Betrachten wir a = i und b = (−1 + i), so ist Indem wir uns zunächst mit dem Differenzieren beschäfti-
die Bedingung für das Argument verletzt. In der Tat gilt mit gen, ergibt sich über die Taylorreihe ein eleganter Weg, um
dem Hauptwert des Logarithmus im einen Fall: sich explizit Potenzreihen zu gegebenen Funktionen zu ver-
√
π ln 2 3π √ 5π
schaffen.
i1/2 (−1 + i)1/2 = ei 4 e 2 +i 8 = 2 ei 8 .
4
Zusammenfassung 413
Zusammenfassung
Potenzreihen sind Reihen mit einer speziellen Gestalt. Definition der Kosinus- und der Sinusfunktion
Durch die Potenzreihen
Definition einer Potenzreihe
∞
!
Unter einer Potenzreihe versteht man eine Reihe der (−1)k
cos z = z2k ,
Form ∞ (2k)!
k=0
! ∞
n
an (z − z0 ) . ! (−1)k 2k+1
sin z = z
n=0 (2k + 1)!
k=0
Hierbei ist z ∈ C ein Parameter, (an ) eine Folge von
komplexen Koeffizienten, die feste Zahl z0 ∈ C heißt sind die trigonometrischen Funktionen für alle z ∈ C
Entwicklungspunkt. definiert.
Jeder Potenzreihe lässt sich ein Konvergenzradius r ∈ Höhepunkt ist der Zusammenhang zwischen der Exponen-
R≥0 ∪ {∞} zuordnen, sodass die Reihe im Konvergenzkreis tialfunktion und den trigonometrischen Funktionen, der etwa
um den Entwicklungspunkt z0 , also für längs der imaginären Achse durch die Euler’sche Formel be-
schrieben ist
z ∈ {z ∈ C | |z − z0 | < r} ,
Die Euler’sche Formel
absolut konvergiert und außerhalb für |z − z0 | > r divergiert.
Auf dem Kreisrand mit |z − z0 | = r kann keine allgemeine Für t ∈ R gilt:
Konvergenzaussage gemacht werden.
eit = cos t + i sin t.
Innerhalb des Konvergenzkreises ist durch
∞ Alle möglichen Varianten, diesen Zusammenhang in der
!
wie etwa e = cos z +
n komplexen Ebene auszudrücken, iz
f (z) = an (z − z0 )
1 iz
i sin z oder cos z = 2 e + e −iz sind nützlich. Auch die
n=0
Polarkoordinatendarstellung komplexer Zahlen lässt sich
eine stetige Funktion f : {z ∈ C | |z − z0 | < r} → C ge- mit der Euler’schen Formel elegant in der Form z = reiϕ mit
geben. Funktionen, die eine Darstellung als Potenzreihe be- Radius r und Winkel ϕ angeben.
sitzen, heißen analytisch.
Neben diesen Verbindungen zwischen exponentiellen und
Der Identitätssatz besagt, dass Potenzreihen um denselben trigonometrischen Funktionen, sind ihre Umkehrfunktionen
Entwicklungspunkt auf einem Kreis mit Radius r > 0 dann von zentraler Bedeutung. Im Mittelpunkt steht dabei der all-
und nur dann identisch sind, wenn alle Koeffizienten über- gemeine komplexe Logarithmus.
einstimmen. Damit ergibt sich die Möglichkeit des Koeffi-
zientenvergleichs, wenn zwei analytische Funktionen über-
Der komplexe Logarithmus
einstimmen.
Für eine komplexe Zahl z ∈ C\{0} ist durch
Die Exponentialfunktion wird durch ihre Potenzreihe defi-
niert. ln z = ln |z| + i arg(z)
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
Verständnisfragen Rechenaufgaben
11.1 • Handelt es sich bei den folgenden, für z ∈ C 11.6 •• Bestimmen Sie den Konvergenzradius und den
definierten Reihen um Potenzreihen? Falls ja, wie lautet die Konvergenzkreis der folgenden Potenzreihen:
Koeffizientenfolge und wie der Entwicklungspunkt? ∞
! (k!)4
∞ ∞ (a) z k
! 3n 1 ! n (z − 1)n (4k)!
(a) (b) k=0
n! zn z2 ∞
n=0 n=2 !
⎛ ⎞ ∞ (b) n
n (z − 2) n
!∞ ! n ' ( !
⎝ 1 n j
⎠ 2n n=1
(c)
n! j
z (d) z cos z
!∞ ' (
n=0 j =0 n=0 n + i 2n 2n
(c) √ z
n=0
( 2 i)n n
∞
11.2 • Welche der folgenden Aussagen über eine Po- ! (2 + i)n − i
tenzreihe mit Entwicklungspunkt z0 ∈ C und Konvergenz- (d) (z + i)n
in
radius ρ sind richtig? n=0
(a) Die Potenzreihe konvergiert für alle z ∈ C mit 11.7 •• Bestimmen Sie den Konvergenzradius der Po-
|z − z0 | < ρ absolut. tenzreihe ∞
(b) Durch die Potenzreihe ist auf dem Konvergenzkreis eine !
n 2n+1
beschränkte Funktion gegeben. 3 (x − x0 )
(c) Durch die Potenzreihe ist auf jedem Kreis mit Mittel- n=0
punkt z0 und Radius r < ρ eine beschränkte Funktion einmal direkt durch das Wurzelkriterium und einmal mit der
gegeben. Formel von Hadamard.
(d) Die Potenzreihe konvergiert für kein z ∈ C mit
|z − z0 | = ρ. 11.8 • Für welche x ∈ R konvergieren die folgenden
(e) Konvergiert die Potenzreihe für ein ẑ ∈ C mit Potenzreihen?
∞ (
|ẑ − z0 | = ρ absolut, so gilt dies für alle z ∈ C mit ! (−1)n (2n + 1) ' 1 n
|z − z0 | = ρ. (a) x−
n 2
n=1
∞
11.3 •• Bestimmen Sie mithilfe der zugehörigen Po- ! 1 − (−2)−n−1 n!
n
tenzreihen die folgenden Grenzwerte: (b) (x − 2)
n!
n=0
∞
1 − cos x
4
esin(x ) − 1 ! 1 ,% % -n
n
(a) lim , (b) lim . (c) n2 + n − n2 + 1 (x + 1)
x→0 x sin x x→0 x 2 (1 − cos(x)) n2
n=1
11.4 •• Berechnen Sie mit dem Taschenrech- 11.9 ••• Für welche z ∈ C konvergiert die Potenzreihe
ner die Differenz sin(sinh(x)) − sinh(sin(x)) für ∞
x ∈ {0.1, 0.01, 0.001}. Erklären Sie Ihre Beobachtung, ! (2i)n
n
(z − 2i) ?
indem Sie das erste Glied der Potenzreihenentwicklung n2 + in
n=1
dieser Differenz um den Entwicklungspunkt 0 bestimmen.
11.10 •• Gegeben ist die Funktion f : D → C mit
11.5 • Finden Sie je ein Paar (w, z) von komplexen
Zahlen, sodass die Funktionalgleichung des Logarithmus für z−1
f (z) = , z ∈ D.
β = 0, β = 1 und β = −1 erfüllt ist. z2 + 2
Antworten der Selbstfragen 415
(a) Bestimmen Sie den maximalen Definitionsbereich D ⊆ 11.15 •• Gesucht ist eine Potenzreihendarstellung der
∞ n zu der Funktion
C von f . Form n=0 a n x
(b) Stellen Sie f als eine Potenzreihe mithilfe des Ansatzes
∞ ex
! f (x) = , x ∈ R \ {1}.
z − 1 = (z2 + 2) an z n 1−x
n=0
n 1
(a) Zeigen Sie an = k=0 k! .
dar. Was ist der Konvergenzradius dieser Potenzreihe?
(b) Für welche x ∈ R konvergiert die Potenzreihe?
11.11 ••• Bestimmen Sie die ersten beiden Glieder der
Potenzreihenentwicklung von 11.16 • Zeigen Sie: Eine durch eine Potenzreihe mit
f (x) = (1 + x) 1/n
, x > −1, Entwicklungspunkt 0 gegebene Funktion ist genau dann ge-
rade, wenn in der Potenzreihe alle Koeffizienten für ungerade
um den Entwicklungspunkt x0 = 1. Exponenten null sind.
11.12 •• Bestimmen Sie alle z ∈ C, die der folgenden 11.17 •• Die Funktion f : D → C sei durch eine Po-
Gleichung genügen: tenzreihe mit Konvergenzkreis D und Entwicklungspunkt z0
(a) cosh(z) = −1 gegeben. Ferner gelte für eine gegen z0 konvergente Folge
1 (xn ) aus D mit xn = z0 , n ∈ N, dass f (xn ) = 0 ist für alle
(b) cosh z − (1 − 8i) e−z = 2 + 2i n ∈ N. Zeigen Sie, dass f die Nullfunktion ist.
2
11.13 • Bestimmen Sie jeweils alle z ∈ C, die Lösun- 11.18 • Zeigen Sie die Formel von Moivre:
gen der folgenden Gleichung sind:
(cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ)
(a) cos z = cos z, (b) eiz = eiz .
für alle ϕ ∈ R, n ∈ Z. Benutzen Sie diese Formel, um die
Beweisaufgaben Identität
!
n ' (
11.14 • Beweisen Sie, dass die rationale Funktion 2n
cos(2nϕ) = (−1)n−k cos2(n−k) (ϕ) sin2k (ϕ)
1 + z3 2k
k=0
f (z) = , z ∈ C \ {1},
2−z
für alle ϕ ∈ R, n ∈ N0 zu beweisen.
für |z| < 2 durch die Potenzreihe
∞
!
z z2 z n 11.19 • Zeigen Sie das Additionstheorem
f (z) = 1 + + +9
2 4 2
n=3 w+z w−z
darstellbar ist. sin w + sin z = 2 sin cos , w, z ∈ C .
2 2
S. 383 S. 384
(a) Ja. % (−2, 2): Radius 2, Entwicklungspunkt 0.
(b) Nein: Der Term 1 − y 2 hängt von y ab, ist aber keine (0, ∞): Kein möglicher Konvergenzkreis.
Potenz von y. {−1}: Radius 0, Entwicklungspunkt −1.
(c) Nein: Der Term 1/zn passt nicht ins Schema. [1, 3]: Radius 1, Entwicklungspunkt 2.
(d) Ja: Da x 2 − 2x + 1 = (x − 1)2 ist, kann man die Reihe R: Radius ∞, Entwicklungspunkt könnte jede Zahl aus R
auch in der Form sein.
∞ ∞
! !
n−2 n
(x − 1) = (x − 1)
n=2 n=0
schreiben.
416 11 Potenzreihen – Alleskönner unter den Funktionen
S. 385 S. 404 √
Betrachtet man die Potenzreihe als eine gewöhnliche Reihe, Es muss z3 = 2 sein, also z = 3 2 u, wobei u ∈ C mit u3 = 1
so liefert das Wurzelkriterium das Ergebnis, dass die Reihe ist. Die dritten komplexen Einheitswurzeln sind:
absolut konvergiert, falls
0 1 2
1) ) 1) k ) e2π 3 i , e2π 3 i , e2π 3 i ,
) k
k )2
) ) )
k )2 )
) 2 2
) k 2 (z − 1) ) = ) k 2 ) |z − 1| → 2 |z − 1| < 1,
2k
also ist die Lösungsmenge der Gleichung:
√ √ √ 2π √ 4π
3 3 3
also wenn |z − 1| < 1/ 2 ist. 2, 2 e 3 i , 2 e 3 i .
Die Potenzreihe hat aber eine etwas andere Form, als dieje-
nige aus der Definition: Es tauchen nur Potenzen mit gera-
S. 405
dem Exponenten auf. Wenn man es genau nimmt, lauten die
Es gilt:
Koeffizienten:
1 i(iz) 1
0 n = 0 oder n = 2k − 1, k ∈ N, cos(iz) = (e + e−i(iz) ) = (e−z + ez ) = cosh(z)
an = 2 k 2 2
k2
n = 2k, k ∈ N.
und entsprechend:
Mit dieser Beobachtung lässt sich auch die Formel von Ha- 1 −z 1
damard anwenden, und wir erhalten: sin(iz) = (e − ez ) = − sinh z = i sinh z.
2i i
G √
H n
% H 22 2 √
n I
lim sup |an | = lim sup 2 = lim sup
n
= 2.
n→∞ n→∞ n n→∞ ( ) nn 2 S. 412
2 2 Für x ∈ C beliebig wähle man m ∈ Z so, dass Im(x) −
2πm ∈ (−π, π] ist. Dann folgt mit dem Hauptzweig des
Ein gern gemachter Fehler ist jedoch die Rechnung
Logarithmus:
1) ) ln(ex ) = x − 2πm i.
) k)
k )2 ) 2
) k2 ) = (√
k
k)2
−→ 2 (k → ∞),
Wir erhalten:
= exy e−2πmy i .
x )y
die nahelegt, dass der Konvergenzradius 1/2 sein könnte. (ex )y = e(ln e
S. 393
Aus der letzten Gleichheit folgt mit Koeffizientenvergleich S. 412
c2k = 0 und c2k−1 = 1/(k − 1)! für k ∈ N. Ebenfalls durch Mit a ∈ C\{0, 1} folgt im Fall arg(w) + arg(z) ∈ (−π, π]
Koeffizientenvergleich folgt a0 = 0 und an = cn für n ∈ N. die Identität
Über die Koeffizientenfolge (bn ) kann man durch Koeffizi-
loga (wz) = loga (w) + loga (z) ;
entenvergleich keine Aussage treffen, da der Entwicklungs-
punkt in dieser Potenzreihe ein anderer ist.
denn es gilt:
S. 396 ln(wz)
Wegen der geometrischen Reihe ist loga (wz) =
ln a
∞
ln(w) ln(z)
1 ! = + = loga w + loga z.
= x 2n , |x| < 1. ln a ln a
1−x 2
n=0 Analog erhalten wir für arg(w) + arg(z) ∈ (−3π, −π]:
Damit ist 2πi
loga (wz) = loga (w) + loga (z) +
x ln a
= x + x 3 + x 5 + O(x 7 )
1 − x2
und für arg(w) + arg(z) ∈ (π, 3π]:
für x gegen 0. Da ein Ausdruck O(x 7 )
auch O(x 6 ) ist, ist
2πi
q(x) = x + x 3 + x 5 das gesuchte Polynom. loga (wz) = loga (w) + loga (z) − .
ln a
Lineare Abbildungen und
Matrizen – Brücken 12
zwischen Vektorräumen
Wie lassen sich lineare
Abbildungen durch Matrizen
darstellen?
Was besagt die
Dimensionsformel?
Wie wirkt sich ein Basiswechsel
auf die Matrix einer linearen
Abbildung aus?
Den Begriff Homomorphismus haben wir bereits im Zusammen- Anstelle von einer K-linearen Abbildung spricht man oft auch
hang mit Gruppen, Ringen und Körpern im Kapitel 4 kennenge- kurz von einer linearen Abbildung, wenn klar ist, welcher
lernt. Der Begriff ist also sehr allgemein. Ins Deutsche übersetzt Körper zugrunde liegt.
man ihn wohl am besten mit strukturerhaltende Abbildung. Ein
Homomorphismus ist also eine Abbildung zwischen Mengen, ?
welche kompatibel ist mit der Struktur, d. h. die Verknüpfungen Wieso muss V und W derselbe Körper K zugrunde liegen?
auf den zugrunde liegenden Mengen berücksichtigt. Anders gefragt: Was sollte ein Homomorphismus zwischen
einem komplexen und einem reellen Vektorraum sein?
In einem Vektorraum haben wir zwei Verknüpfungen, die Ad-
dition von Vektoren und die Multiplikation von Vektoren mit
Skalaren. Ein Homomorphismus, im Zusammenhang mit Vek- Eine K-lineare Abbildung ϕ : V → W zwischen K-Vektor-
torräumen sprechen wir auch von einer linearen Abbildung, ist räumen V und W heißt
hier eine additive und multiplikative Abbildung zwischen zwei
Vektorräumen. Monomorphismus, wenn ϕ injektiv ist,
Epimorphismus, wenn ϕ surjektiv ist,
In dieser Sichtweise ist ein Homomorphismus durchaus abstrakt. Isomorphismus, wenn ϕ bijektiv ist,
Jedoch gelingt es zumindest in endlichdimensionalen Vektor- Endomorphismus, wenn V = W ist,
räumen, nach Wahl einer Basis jedem Homomorphismus eine Automorphismus, wenn V = W und ϕ bijektiv ist.
sehr anschauliche und vertraute Gestalt zu geben. Zu jedem
Homomorphismus gehört bezüglich gewählter Basen der Vek- Ist ϕ : V → W ein Isomorphismus zwischen den K-Vektor-
torräume eine Matrix – Matrizen haben sich bereits beim Lösen räumen V und W , so sagt man, die beiden Vektorräume V und
von linearen Gleichungssystemen als sehr nützlich erwiesen. W sind isomorph zueinander. Man schreibt dann V ∼ = W
Diese den Homomorphismus darstellende Matrix charakterisiert (vgl. auch den Isomorphiebegriff zu Gruppen auf Seite 72) –
die Abbildung eindeutig. Wir können so Homomorphismen end- zwei zueinander isomorphe Vektorräume unterscheiden sich
lichdimensionaler Vektorräume bezüglich gewählter Basen mit nur in der Bezeichnung der Elemente.
Matrizen identifizieren. Das Abbilden ist dann letztlich eine
einfache Matrizenmultiplikation. Durch diesen Prozess werden
Homomorphismen bezüglich gewählter Basen durch Matrizen Wie erkennt man die Linearität einer
dargestellt. Die Eigenschaften eines Homomorphismus finden Abbildung?
sich in der Darstellungsmatrix wieder.
Jede lineare Abbildung ϕ : V → W bildet den Nullvektor
Wählt man verschiedene Basen, so erhält man im Allgemei-
0V von V auf den Nullvektor 0W von W ab, d. h.,
nen verschiedene Matrizen. In den folgenden Kapiteln werden
wir untersuchen, welche Eigenschaften der Darstellungsmatri-
ϕ(0V ) = 0W .
zen bei verschiedenen Basen erhalten bleiben. Welche Basis
vorzugsweise zu wählen ist, wird das Thema des Kapitels 14 Dies sieht man etwa wie folgt: Wegen der Additivität von ϕ
sein. gilt:
Den Begriff der linearen Abbildung kann man auf verschie- ses in zwei getrennte Schritte, man zeigt die Additivität und
dene Arten definieren. die Homogenität nacheinander.
Wir untersuchen einige einfache Abbildungen auf Linearität.
Kriterien für die Linearität einer Abbildung
Für K-Vektorräume V und W und eine Abbildung Beispiel
ϕ : V → W sind die folgenden Aussagen äquivalent: Für alle K-Vektorräume V und W ist die Abbildung
V → W,
(i) Die Abbildung ϕ ist linear. ϕ:
v → 0
(ii) Für alle v, w ∈ V und λ, μ ∈ K gilt:
linear, da für alle λ ∈ K und alle v, w ∈ V die Gleichung
ϕ(λ v + μ w) = λ ϕ(v) + μ ϕ(w) .
ϕ(λ v + w) = 0 = λ 0 + 0 = λ ϕ(v) + ϕ(w)
(iii) Für alle v, w ∈ V und λ ∈ K gilt: gilt. Die lineare Abbildung ϕ ist nur dann surjektiv, wenn
W = {0} gilt. Außerdem ist sie nur dann injektiv, wenn
ϕ(λ v + w) = λ ϕ(v) + ϕ(w) . V = {0} ist.
Analog begründet man, dass in jedem K-Vektorraum V
die Identität, also die Abbildung
Beweis: Gegeben sind λ, μ ∈ K und v, w ∈ V .
V → V,
(i) ⇒ (ii): Man wende zuerst die Additivität und dann (zwei id :
v → v
Mal) die Homogenität von ϕ an:
linear ist. Diese lineare Abbildung id ist für jeden Vektor-
ϕ(λ v + μ w) = ϕ(λ v) + ϕ(μ w) = λ ϕ(v) + μ ϕ(w) . raum V ein Automorphismus.
Für den reellen Vektorraum R2 ist die Abbildung
⎧
(ii) ⇒ (iii): Man wähle μ = 1 in (ii). ⎪
⎨ R → R ,
2 2
' ( ' 2(
(iii) ⇒ (i): Mit λ = 1 folgt die Additivität von ϕ und mit ϕ: v1 v1
⎪
⎩ v →
w = 0 folgt die Homogenität von ϕ. 2 v2
' (
1
nicht linear, wir erhalten für λ = −1 und v =
Oftmals sind Nachweise der Linearität einer Abbildung lang- 0
wierig und unübersichtlich. Wenn der Nachweis einfach zu ' ( ' (
1 −1
führen ist, empfiehlt sich die dritte Version, wenn er jedoch ϕ(λ v) = und λ ϕ(v) = ,
unübersichtlich wird, dann sollte man auf unsere Definition 0 0
zurückgreifen, sie entspricht einer Zerlegung des Nachwei- also ϕ(λ v) = λ ϕ(v).
420 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Aus der Schule ist das Differenzieren von Polynomen be- als Linearkombination von verschiedenen Basisvektoren dar-
kannt: stellen:
⎛ ⎞ v = λ1 b1 + · · · + λr br
d ⎝! !
n n
an X n ⎠ = n an X n−1 . mit λ1 , . . . , λr ∈ K und b1 , . . . , br ∈ B.
dX
j =0 j =1 Wegen der Additivität und Homogenität von ϕ gilt nun für
das Bild von v:
Im reellen Vektorraum R[X] der Polynome über R ist die-
ses Differenzieren ϕ(v) = ϕ(λ1 b1 + · · · + λr br )
d R[X] → R[X], = λ1 ϕ(b1 ) + · · · + λr ϕ(br ) .
: d
dX p → dX p
Also ist ϕ(v) durch die Linearkombination bezüglich der Ba-
eine lineare Abbildung, da nach den bekannten Differen- sis B und die Bilder der Basisvektoren bestimmt. Wir machen
ziationsregeln für alle λ ∈ R und p, q ∈ R[X] die Glei- uns das zunutze: Ist ϕ eine lineare Abbildung von V nach W ,
chung und kennt man ϕ(b) für jedes Element b einer Basis B von
d d d V , so kennt man ϕ(v) für jedes v aus V , da sich jedes v ∈ V
(λ p + q) = λ p+ q bezüglich der Basis B darstellen lässt. Salopp lässt sich dies
dX dX dX
auch formulieren als: Wenn man weiß, was die lineare Abbil-
gilt. Diese Abbildung ist nicht injektiv, da etwa
dung mit den Elementen einer Basis macht, dann weiß man
d d auch, was die lineare Abbildung mit allen Vektoren macht.
(X + 1) = 1 = (X − 1) Dies lässt sich als Prinzip der linearen Fortsetzung noch wei-
dX dX
ter verschärfen.
gilt. Sie ist jedoch surjektiv, da für jedes Polynom p =
a0 + a1 X + · · · + an X n das Polynom Das Prinzip der linearen Fortsetzung
1 1 Ist σ eine Abbildung von der Basis B von V nach W
P = a0 X + a1 X2 + · · · + an X n+1 ∈ R[X]
2 n+1
B → W,
σ:
offenbar dX d d
(P ) = p erfüllt ist. Die Abbildung dX ist b → σ (b),
somit ein Epimorphismus.
so gibt es genau eine lineare Abbildung ϕ : V → W mit
Die Menge V aller konvergenter reeller Folgen bildet
ϕ|B = σ . Man nennt ϕ die lineare Fortsetzung von σ
einen Untervektorraum von RN0 , da Summe und skalare
auf V .
Vielfache konvergenter Folgen wieder konvergente Fol-
gen sind. Die Abbildung ϕ : V → R, die einer konver-
genten Folge (xn )n ∈ V ihren Grenzwert x ∈ R zuordnet, Achtung: Für σ ist nur vorausgesetzt, dass es eine Abbil-
ist linear. dung von der Menge B in die Menge W ist.
Eine lineare Abbildung ist durch die Bilder der ϕ(λ v + w) = λ λ1 σ (b1 ) + · · · + λ λr σ (br )
Basisvektoren bereits eindeutig bestimmt + μ1 σ (c1 ) + · · · + μs σ (cs )
= λ ϕ(v) + ϕ(w) .
Wir betrachten eine lineare Abbildung ϕ zwischen zwei K-
Vektorräumen V und W . Ist B eine endliche oder unendliche Folglich ist ϕ linear, es ist noch die Eindeutigkeit zu begrün-
Basis von V , so lässt sich jedes v ∈ V auf genau eine Weise den. Sind ϕ und ψ zwei lineare Fortsetzungen von σ , so gilt
12.1 Definition und Beispiele 421
Problemanalyse und Strategie: Wir erklären eine Multiplikation zwischen einer Matrix mit n Spalten und einem
Spaltenvektor aus dem Kn .
Lösung: 6 · 4 + 4 · 1 + 0 · 3 = 28 .
Wir betrachten zuerst den Fall m = 1, d. h., wir erklären
vorab das Produkt einer 1 × n-Matrix Nun sei allgemeinen wieder A = (aij ) ∈ Km×n . Durch
das eben erklärte Produkt ist durch A eine Abbildung
A = z = (aj ) = (a1 , . . . , an ) n
⎛ ⎞ K → Km ,
v1 ϕA :
⎜ .. ⎟ v → A · v
mit einem Spaltenvektor v = (vj ) = ⎝ . ⎠. Für das Pro-
erklärt. Diese Abbildung ist linear, da für alle λ ∈ K und
vn
dukt setzen wir alle v = (vj ), w = (wj ) ∈ V gilt:
⎛ ⎞
v1 ⎛ ⎞
⎜ .. ⎟ !
n λ v1 + w1
z · v = (a1 , . . . , an ) · ⎝ . ⎠ = aj vj . ⎜ ⎟
ϕA (λ v + w) = A · (λ v + w) = A · ⎝ ... ⎠
vn j =1
λ vn + wn
Die Definition dieser Multiplikation fordert, dass die An- ⎛ n ⎞ ⎛ n ⎞ ⎛ n ⎞
zahl der Spalten von z gleich der Anzahl der Zeilen von v ⎜ a1j (λ v j + w j ) ⎟ ⎜ a 1j vj ⎟ ⎜ a1j wj ⎟
ist, z. B. ⎜j =1 ⎟ ⎜ j =1 ⎟ ⎜ j =1 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎛ ⎞ =⎜ .
. ⎟=λ⎜ .
. ⎟+⎜ .
. ⎟
−1 ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟
⎜ n ⎟ ⎜ n ⎟ ⎜ n ⎟
(2, 3, 1) · ⎝ 1 ⎠ = 2 · (−1) + 3 · 1 + 1 · 2 = 3 . ⎝
amj (λvj + wj )
⎠ ⎝
amj vj
⎠ ⎝
amj wj
⎠
2 j =1 j =1 j =1
Nun erklären wir ein Produkt für Matrizen = λ (A · v) + A · w = λ ϕA (v) + ϕA (w) .
⎛ ⎞
z1 Damit ist bereits die Linearität von ϕA begründet.
⎜ .. ⎟
A = (aij ) = ⎝ . ⎠ ∈ Km×n
zm Kommentar:
Ob die lineare Abbildung ϕA injektiv oder surjektiv ist,
mit m solchen Zeilen für jede dieser Zeilen: kann man anhand der Matrix A entscheiden. Das wer-
⎛ n ⎞
den wir später untersuchen.
⎛ ⎞ ⎛ ⎞ ⎜ a v
1j j ⎟
z1 z1 · v ⎜ j =1 ⎟ Den Punkt · für diese Multiplikation einer Matrix mit
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ einer Spalte werden wir in Zukunft weglassen, wir
A · v = ⎝ ... ⎠ · v = ⎝ ... ⎠ = ⎜ ⎜
..
.
⎟
⎟
⎜ n ⎟ schreiben also kürzer A v anstelle von A · v.
zm zm · v ⎝ ⎠ Die Multiplikation einer Matrix mit einer Spalte er-
amj vj
j =1 möglicht es, lineare Gleichungssysteme in kurzer Form
Man beachte: Die Spaltenzahl von A ist gleich der Zeilen- darzustellen. Das System
zahl von v, und die Zeilenzahl von A · v ist die Zeilenzahl
a11 x1 + a12 x2 + · · · + a1n xn = b1
von A. .. .. .. ..
Man nennt den Spaltenvektor b = A · v ∈ Km das Pro- . . . .
dukt von A mit v, z. B. gilt mit der folgenden Matrix am1 x1 + am2 x2 + · · · + amn xn = bm
A ∈ R4×3 und v ∈ R3 :
⎛ ⎞ ⎛ ⎞ mit aij , bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n lässt
2 6 1 ⎛ ⎞ 17
⎜6 4 0 ⎟ 4 ⎜28⎟ sich mit den Abkürzungen
⎜ ⎟ ⎝ ⎠ ⎜ ⎟
⎝0 3 3⎠ · 1 = ⎝12⎠ ⎛
a11 · · · a1n
⎞ ⎛ ⎞
b1
⎛ ⎞
x1
3
4 1 2 23
A=⎝ .
⎜ .. .. ⎠ , b = ⎝ .. ⎠ , x = ⎝ ... ⎟
. ⎟ ⎜ . ⎟ ⎜
⎠
Beispielsweise bestimmen die blau eingezeichneten Zif- am1 · · · amn bm xn
fern der zweiten Zeile in der Matrix den Eintrag in der
zweiten Zeile des Produkts: kurz schreiben als A x = b.
422 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
für jedes v ∈ V :
ϕ(v) = ϕ(λ1 b1 + · · · + λr br )
e2
= λ1 σ (b1 ) + · · · + λr σ (br ) ϕ(e2 )
= ψ(λ1 b1 + · · · + λr br ) ϕ(e1 )
30◦
= ψ(v) .
30◦
Folglich gilt ϕ = ψ.
e1
Beispiel
Es sei En = {e1 , . . . , en } die kanonische Basis des Rn .
Dann ist die eindeutig bestimmte lineare Fortsetzung der
Abbildung v = v1 e1 + v2 e2
En → Rn En → Rn ϕ(v)
σ0 : bzw. σ1 :
ei → 0 e i → ei Abbildung 12.1 Eine Drehung ist durch Angabe der Bilder einer Basis eindeutig
die Nullabbildung bzw. die Identität. bestimmt.
Das Produkt linearer Abbildungen Für das Inverse ψ von ϕ schreibt man ϕ −1 – und auch ϕ −1
ist bijektiv. Man beachte hierzu den Satz von der Umkehrab-
Sind ϕ : V → V und ψ : V → V linear, so ist auch
bildung auf Seite 48. Ist die Abbildung ϕ nicht nur bijektiv,
die Hintereinanderausführung ψ ◦ ϕ : V → V linear.
sondern auch linear, so ist die existierende Umkehrabbildung
ϕ −1 automatisch auch linear, das besagt der folgende Satz:
Beweis: Sind v, w ∈ V und λ ∈ K, so gilt:
(ψ ◦ ϕ)(λ v + w) = ψ(ϕ(λ v + w)) Das Inverse eines Isomorphismus
= ψ(λ ϕ(v) + ϕ(w)) Ist ϕ ein Isomorphismus, so ist auch ϕ −1 : V → V ein
= ψ(λ ϕ(v)) + ψ(ϕ(w)) Isomorphismus.
= λ ψ(ϕ(v)) + ψ(ϕ(w))
= λ ψ ◦ ϕ(v) + ψ ◦ ϕ(w) . Beweis: Es sei ϕ bijektiv. Dann existiert die Umkehrab-
bildung ϕ −1 : V → V . Es ist zu zeigen, dass ϕ −1 linear ist.
Das begründet, dass ψ ◦ ϕ linear ist.
Dazu wählen wir beliebige v , w ∈ V und ein λ ∈ K. Zu
Man beachte, dass ϕ ◦ ψ nicht erklärt sein muss, auch wenn v , w existieren v, w ∈ V mit ϕ(v) = v und ϕ(w) = w ,
ψ ◦ ϕ existiert. d. h., v = ϕ −1 (v ) und w = ϕ −1 (w ). Dann gilt:
ϕ −1 (λ v + w ) = ϕ −1 (λ ϕ(v) + ϕ(w))
Beispiel Wir betrachten die linearen Abbildungen
⎧ 2 = ϕ −1 (ϕ(λ v + w))
⎪
⎪ R → ⎛ R3 , ⎞
⎨' ( = λv + w
x1 − x2
ϕ: x1 und
⎪
⎪ → ⎝ 0 ⎠ = λ ϕ −1 (v ) + ϕ −1 (w )
⎩ x2
2x1 − x2
⎧ Damit ist gezeigt, dass ϕ −1 linear ist.
⎪
⎪ R 3 → ⎛ R4 , ⎞
⎪
⎪⎛ ⎞
⎨ x1 + 2x3
ψ:
x1 ⎜ x2 − x3 ⎟ . ?
⎪ ⎝x2 ⎠ → ⎜
⎪
⎟ Was ist das Inverse von ψ ◦ ϕ, falls ϕ : V → V und
⎪ ⎝ x1 + x2 ⎠
⎪
⎩ x3 ψ : V → V Isomorphismen sind ?
2x1 + 3x3
Wegen ϕ(R2 ) ⊆ R3 ist das Bild von ϕ in der Definitions- Folgerung
menge von ψ. Somit ist die lineare Abbildung ψ ◦ ϕ erklärt. Für jeden K-Vektorraum V bildet die Menge
Wir ermitteln die Abbildungsvorschrift für ψ ◦ ϕ. Es gilt:
⎛ ⎞ GLK (V ) = {ϕ : V → V | ϕ ist ein Isomorphismus}
⎛⎛ ⎞⎞ 5x1 − 3x2
'' (( x1 − x2 ⎜ ⎟ bezüglich der Komposition ◦ eine Gruppe – die allgemeine
ψ ◦ϕ
x1
= ψ ⎝⎝ 0 ⎠⎠ = ⎜ x2 − 2x1 ⎟ .
x2 ⎝ x1 − x2 ⎠ lineare Gruppe von V .
2x1 − x2
8x1 − 5x2
Damit gilt Summe ϕ + ψ und skalares Vielfaches λ ϕ von
⎧ 2
⎪
⎪ R → ⎛ R4 , ⎞ linearen Abbildungen sind lineare
⎪
⎪
⎨' ( 5x1 − 3x2 Abbildungen
ψ ◦ ϕ: x1 ⎜ x2 − 2x1 ⎟ .
⎪ ⎜
→ ⎝ ⎟
⎪
⎪ x2 x1 − x2 ⎠
⎪
⎩
Wir bezeichnen mit HomK (V , W ) die Menge aller linearen
8x1 − 5x2 Abbildungen von V nach W .
Die Abbildung ϕ ◦ ψ ist nicht erklärt. In einem Abschnitt auf Seite 195 haben wir gezeigt, dass die
Menge aller Abbildungen von einer Menge in einen Körper
? einen Vektorraum bildet (vgl. auch das Lemma auf Seite 308).
Sind ϕ und ψ sogar Isomorphismen, so ist auch ψ ◦ ϕ ein In ganz ähnlicher Weise bildet die Menge
solcher – ist das richtig ?
Hom K (V , W ) = {ϕ : V → W | ϕ ist linear }
aller linearen Abbildungen eines K-Vektorraums V in einen
Das Inverse ϕ −1 eines Isomorphismus ϕ ist ein K-Vektorraum W wieder einen K-Vektorraum.
Isomorphismus Wir erklären eine Addition von Elementen aus HomK (V ,W ).
Sind ϕ und ψ zwei lineare Abbildungen von V nach W , also
Eine bijektive Abbildung ϕ ist umkehrbar, d. h., es existiert Elemente aus HomK (V , W ), so setzen wir
eine Abbildung ψ mit
V → W,
ϕ +ψ:
ϕ ◦ ψ = id und ψ ◦ ϕ = id . v → (ϕ + ψ)(v) = ϕ(v) + ψ(v).
424 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Wir benötigen weiter eine skalare Multiplikation. Sind λ ∈ K eine Basis von V , und es gilt:
und ϕ ∈ HomK (V , W ), so definieren wir ' ( ' ( ' ( ' (
0 1 0 1
V → W, W = w1 = , w2 = , w3 = , w4 = .
λϕ: 0 0 1 1
v → (λ ϕ)(v) = λ ϕ(v).
Jede Wahl
Mit dieser Addition + und skalaren Multiplikation · gilt nun:
ϕ ϕ ϕ
e1 → w i , e 2 → w j , e 3 → w k
Der K-Vektorraum der linearen Abbildungen
erklärt eine lineare Abbildung ϕ von Z32 nach Z22 . Da zwei
Es ist HomK (V , W ) ein K-Vektorraum.
verschiedene Wahlen auch verschiedene lineare Abbildun-
gen liefern, gibt es genau 43 = 64 lineare Abbildungen,
d. h.,
Beweis: Die Menge Hom K (V , W ) ist nichtleer, weil die | HomZ2 (Z32 , Z22 )| = 64 .
Nullabbildung 0 : V → W , v → 0 eine lineare Abbildung
ist.
Wir müssen weiter zeigen, dass für beliebige ϕ, ψ ∈
HomK (V , W ) und λ ∈ K sowohl ϕ + ψ als auch λ ϕ wie- Die Menge aller Endomorphismen eines
der Elemente von HomK (V , W ) sind. Wir zeigen zuerst Vektorraums bilden einen Ring
ϕ + ψ ∈ HomK (V , W ):
Im letzten Abschnitt haben wir gezeigt, dass die Menge
Sind v, w ∈ V und μ ∈ K, so gilt:
HomK (V , W ) aller Homomorphismen ϕ : V → W bei ge-
(ϕ + ψ)(μ v + w) = ϕ(μ v + w) + ψ(μ v + w) eigneter Definition einer Addition + und Multiplikation ·
mit Skalaren aus K einen Vektorraum bildet. Wir setzen nun
= μ ϕ(v) + ϕ(w) + μ ψ(v) + ψ(w)
V = W , lassen die Multiplikation · mit Skalaren weg und
= μ (ϕ + ψ)(v) + (ϕ + ψ)(w) . nehmen die Multiplikation ◦ aus dem Abschnitt von Seite 422
hinzu und erhalten:
Nun zeigen wir noch, dass λ ϕ ∈ HomK (V , W ). Sind
v, w ∈ V und μ ∈ K, so gilt: Der Endomorphismenring EndK (V )
Die Menge
(λ ϕ)(μ v + w) = λ ϕ(μ v + w)
= λ (μ ϕ(v) + ϕ(w)) EndK (V ) = HomK (V , V )
= λ μ ϕ(v) + λ ϕ(w)
aller Endomorphismen von V ist mit punktweiser Ad-
= μ (λ ϕ)(v) + (λ ϕ)(w) .
dition + und der Multiplikation ◦ ein Ring mit Einsele-
ment id.
Es ist nun nicht mehr schwer, die verbleibenden Vektorraum-
axiome nachzuweisen.
Es ist (HomK (V , W ), +) eine abelsche Gruppe: Die Addi- Beweis: Es ist (EndK (V ), +) eine abelsche Gruppe (be-
tion + ist assoziativ, das Nullelement ist die Nullabbildung achte den Beweis zu obigem Satz, wonach Hom K (V , V ) ein
0, die jedem Element v ∈ V den Nullvektor aus W zuordnet, Vektorraum ist). Die Multiplikation ◦ ist assoziativ (beachte
und das einem ϕ ∈ HomK (V , W ) entgegengesetzte Element den Satz auf Seite 47), weiterhin gilt
ist die lineare Abbildung −ϕ = (−1) ϕ.
id ◦ϕ = ϕ = ϕ ◦ id
Die Vektorraumaxiome (V1)–(V4) von Seite 222 sind offen-
bar erfüllt. für jedes ϕ ∈ EndK (V ), sodass id ein Einselement ist.
Nach der Definition eines Rings auf Seite 85 bleiben nun
Beispiel Nach dem Prinzip der linearen Fortsetzung ist nur noch die Distributivgesetze nachzuweisen: Für beliebige
jede lineare Abbildung zwischen K-Vektorräumen V und W ϕ, ψ, ϑ ∈ EndK (V ) und v ∈ V gilt:
eindeutig durch Angabe der Bilder der Basisvektoren einer
((ϕ + ψ) ◦ ϑ)(v) = (ϕ + ψ)(ϑ(v))
Basis B von V bestimmt. Wir können folglich explizit alle
linearen Abbildungen zwischen endlichen Vektorräumen an- = ϕ(ϑ(v)) + ψ(ϑ(v))
geben. Wir betrachten den Fall V = Z32 und W = Z22 . Es ist = (ϕ ◦ ϑ + ψ ◦ ϑ)(v) ,
⎧ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
⎨ 1 0 0 ⎬ sodass (ϕ + ψ) ◦ ϑ = ϕ ◦ ϑ + ψ ◦ ϑ gilt. Den Nachweis des
B = e1 = ⎝0⎠ , e2 = ⎝1⎠ , e3 = ⎝0⎠ zweiten Distributivgesetzes ϑ ◦ (ϕ + ψ) = ϑ ◦ ϕ + ϑ ◦ ψ
⎩ ⎭
0 0 1 führt man analog.
12.3 Kern, Bild und die Dimensionsformel 425
Man beachte, dass der Ring (EndK (V ), +, ◦) im Allgemei- Der Kern von ϕ besteht aus jenen Vektoren,
nen weder kommutativ noch nullteilerfrei ist, wie das fol- die auf den Nullvektor abgebildet werden
gende Beispiel zeigt.
Jede lineare Abbildung ϕ : V → W hat einen Kern. Dies
Beispiel Nach dem Prinzip der linearen Fortsetzung ist ist ein Untervektorraum von V , er erlaubt es, auf weitere
jeder Endomorphismus des Z2 -Vektorraums Z22 eindeutig Eigenschaften der linearen Abbildung zu schließen.
durch Angabe der Bilder der Basisvektoren e1 und e2 von
Z22 bestimmt. Wir betrachten die beiden Endomorphismen ϕ
Der Kern und das Bild einer linearen Abbildung
und ψ, die durch die folgenden Zuordnungen gegeben sind:
Ist ϕ eine lineare Abbildung von einem K-Vektorraum
' ( ' ( ' ( ' (
1 ϕ 0 0 ϕ 0 V in einen K-Vektorraum W , so nennt man
→ , → ,
0 1 1 1
' ( ' ( ' ( ' ( ker ϕ = ϕ −1 ({0}) = {v ∈ V | ϕ(v) = 0} ⊆ V
1 ψ 1 0 ψ 0
→ , → .
0 0 1 0 den Kern von ϕ und
sodass ψ ◦ ϕ = ϕ ◦ ψ gilt. Somit ist die Multiplikation ◦ auf Vielfach schreibt man auch Im(ϕ) für das Bild der linea-
EndZ2 (Z22 ) nicht kommutativ. ren Abbildung ϕ; Im kürzt dabei die englische Bezeichnung
Image für das Bild ab.
Außerdem gilt:
ϕ = 0 = ψ , Der Kern von ϕ ist die Urbildmenge des Nullvektors aus W ,
d. h. die Menge aller Vektoren, die auf 0 ∈ W abgebildet
aber für das Produkt ψ ◦ ϕ gilt: werden, und das Bild die Gesamtheit der Vektoren aus W ,
' ( ' ( ' ( ' ( die durch ϕ getroffen werden.
1 ψ◦ϕ 0 0 ψ◦ϕ 0
→ , → ,
0 0 1 0 ϕ
ϕ(V )
Kommentar: Der Ring EndK (V ) ist, wenn man die ϕ −1 ({0}) 0
Multiplikation mit Skalaren berücksichtigt, auch ein K-
Vektorraum. Es gilt zudem für alle λ ∈ K und ϕ, ψ ∈
EndK (V ):
λ (ϕ ◦ ψ) = (λ ϕ) ◦ ψ = ϕ ◦ (λ ψ) . Abbildung 12.3 Der Kern und das Bild einer linearen Abbildung.
D. h., EndK (V ) ist eine K-Algebra (vgl. auch den Kommen- Weil jede lineare Abbildung ϕ(0) = 0 erfüllt, ist der Kern
tar auf Seite 198). einer linearen Abbildung niemals leer, er enthält mindestens
den Nullvektor aus V . Entsprechend ist das Bild einer linea-
ren Abbildung nichtleer,
12.3 Kern, Bild und die {0} ⊆ ϕ −1 ({0}) ⊆ V und {0} ⊆ ϕ(V ) ⊆ W .
Dimensionsformel Es gibt Beispiele, in denen der Nullvektor der einzige Vektor
im Kern bzw. Bild ist, der Kern bzw. das Bild kann aber
Wie bei Abbildungen können wir bei einer linearen Abbil- durchaus auch sehr groß sein.
dungen ϕ : V → W vom Bild der Abbildung ϕ, also von
der Menge ϕ(V ) ⊆ W , und auch vom Urbild einer Menge Beispiel
A ⊆ W unter ϕ, also von ϕ −1 (A) ⊆ V sprechen. Tatsächlich Bei der Spiegelung
ist es so, dass diese Mengen für die spezielle Wahl A = {0} ⎧ 2
sehr eng miteinander zusammenhängen. Dieser Zusammen- ⎨ 'R ( → 'R2 ,(
hang drückt sich in der sogenannten Dimensionsformel aus, σ: v v2
⎩ 1 →
die wir in diesem Abschnitt herleiten wollen. v2 v1
426 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
x3
ϕ −1 ({0})
x2
x1
ϕ(R3 )
Abbildung 12.4 Der Kern kann auch sehr groß sein. aus all jenen Vektoren v des Kn , die das homogene lineare
Gleichungssystem
Av = 0
an der Geraden ' R (e(1 + e'
2 ) besteht
( der Kern nur aus dem
0 über K lösen:
v2
Nullvektor, da = nur im Fall v1 = 0 = v2
v1 0 −1
ϕA ({0}) = {v ∈ Kn | A v = 0} .
−1
gilt, d. h., ϕ ({0}) = {0}. Der Kern ist hier so klein wie
möglich. Das Bild ist so groß wie möglich, da ϕ(R2 ) = R2 Für das Bild ϕA (Kn ) gilt:
gilt.
ϕA (Kn ) = {A v | v ∈ Kn }
Ist ϕ die lineare Abbildung ⎧ ⎛ ⎞ ⎫
⎪
⎨ λ1 ⎪
⎬
V → W, ⎜ ⎟
ϕ: = (s 1 , . . . , s n ) ⎝ ... ⎠ | λ1 , . . . , λn ∈ K
v → 0, ⎪
⎩ ⎪
⎭
λn
so ist ϕ −1 ({0}) = V , da jeder Vektor aus V auf den Null- = {λ1 s 1 + λn s n | λ1 , . . . , λn ∈ K}
vektor abgebildet wird. Hier ist der Kern so groß wie mög-
= -s 1 , . . . , s n . .
lich und das Bild so klein wie möglich, da ϕ(V ) = {0} gilt.
Der Kern der linearen Abbildung Das Bild ϕA (Kn ) besteht also aus allen Linearkombination
⎧ der Spalten von A = (s 1 , . . . , s n ),
⎪
⎪ R3 → R2 ,
⎨⎛ ⎞ ' (
v1 ϕA (Kn ) = -s 1 , . . . , s n . .
ϕ: ⎝v2 ⎠ → v1 + v2
⎪
⎪
⎩ v2
v3
Wir bestimmen den Kern des Differenzierens von reellen
⎛ ⎞
v1 Polynomen:
besteht aus all jenen ⎝v2 ⎠ mit v3 ∈ R, v2 = 0 und
d R[X] → R[X],
v3 : d
v1 + v2 = 0, also: dX p → dX (p).
⎧⎛ ⎞ ⎫ Der Kern besteht aus all jenen Polynomen, die durch das
⎨ 0 ⎬
Differenzieren auf das Nullpolynom abgebildet werden:
ϕ −1 ({0}) = ⎝ 0 ⎠ ∈ R3 | v3 ∈ R .
⎩ ⎭ ' (
v3 d −1 d
({0}) = {p ∈ R[X] | (p) = 0} .
dX dX
Da ϕ surjektiv ist, gilt für das Bild ϕ(R3 ) = R2 . Das ist
in Abbildung 12.5 dargestellt. Polynome vom Grad 1 oder höher werden durch das Dif-
ferenzieren nicht zum Nullpolynom. Hingegen wird jedes
? konstante Polynom c durch das Differenzieren auf das
Begründen Sie ausführlich, warum ϕ surjektiv ist. Nullpolynom abgebildet, also gilt:
' (
Ist A = (s 1 , . . . , s n ) ∈ Km×n , so besteht der Kern der d −1
({0}) = R .
linearen Abbildung dX
n d
K → Km , Nach dem Beispiel auf Seite 420 ist das Bild von dX gleich
ϕA :
v → A v R[X].
12.3 Kern, Bild und die Dimensionsformel 427
? Für ϕ −1 ({0}) = {0} sagt man auch: Der Kern von ϕ ist trivial.
Ist die Sprechweise Je größer der Kern, desto kleiner das Das Kriterium ist sehr gut dafür geeignet, die Injektivität
Bild gerechtfertigt ? linearer Abbildungen nachzuweisen. Man beachte, dass die
Inklusion {0} ⊆ ϕ −1 ({0}) für jede lineare Abbildung ϕ erfüllt
Wir untersuchen Kern und Bild einer linearen Abbildung ϕ ist. Will man also von einer linearen Abbildung ϕ nachwei-
zwischen K-Vektorräumen V und W etwas genauer. sen, dass sie injektiv ist, so hat man nur die Implikation
Da stets der Nullvektor von V im Kern liegt, gilt aus ϕ(v) = 0 folgt v = 0
ϕ −1 ({0}) = ∅.
Sind v und w zwei Elemente des Kerns von ϕ, d. h., ϕ(v) = zu begründen.
0 und ϕ(w) = 0, so liegt wegen der Additivität von ϕ auch
deren Summe v + w im Kern, da ?
Im Beispiel ab Seite 425 werden fünf lineare Abbildungen
ϕ(v + w) = ϕ(v) + ϕ(w) = 0 + 0 = 0 .
vorgestellt. Können Sie angeben, welche dieser fünf linearen
Sind v ein Element des Kerns von ϕ und λ ∈ K ein Skalar, Abbildungen injektiv sind ?
so liegt wegen der Homogenität von ϕ auch λ v im Kern,
da
ϕ(λ v) = λ ϕ(v) = λ 0 = 0 .
Damit haben wir die erste Aussage des folgenden Satzes ge- Die Dimension von V ist die Summe der
zeigt. Mit einem analogen Vorgehen zeigt man die zweite Dimensionen von Kern und Bild einer linearen
Aussage.
Abbildung
Kern und Bild einer linearen Abbildung sind Vektor-
Bei allen bisher betrachteten linearen Abbildungen von V
räume
nach W mit endlichdimensionalem Vektorraum V haben wir
Ist ϕ eine lineare Abbildung von V nach W , so ist der die Beobachtung gemacht, dass die Dimension des Bildes
Kern ϕ −1 ({0}) ein Untervektorraum von V , und das Bild umso kleiner ist, je größer die Dimension des Kerns ist. Die
ϕ(V ) ist ein solcher von W . Nullabbildung und die Identität sind Extremfälle. Bei der
Nullabbildung hat der Kern maximale Dimension und das
Bild die Dimension Null, bei der Identität ist dies gerade
Eine lineare Abbildung ist genau dann anders herum.
injektiv, wenn der Kern trivial ist
Dieser Zusammenhang ist kein Zufall, er ist Inhalt der wich-
Mithilfe des Kerns lässt sich ein wichtiges Kriterium für die tigen Dimensionsformel, die wir nun herleiten. Sie schildert
Injektivität einer linearen Abbildung formulieren. den Zusammenhang von Kern und Bild einer linearen Abbil-
dung ϕ : V → W und der Dimension des Vektorraums V .
Um nachzuweisen, dass eine Abbildung ϕ : A → B für be-
liebige Mengen A und B injektiv ist, ist für alle x, y ∈ A mit
ϕ(x) = ϕ(y) die Gleichheit x = y zu folgern. Bei linearen Die Dimensionsformel
Abbildungen zwischen Vektorräumen vereinfacht sich dieser Ist V ein endlichdimensionaler Vektorraum, so gilt für
Nachweis, man kann y = 0 setzen. jede lineare Abbildung ϕ : V → W die Gleichung
mit λ1 , . . . , λr , λ1 , . . . , λs ∈ K. Wir wenden die lineare Es gilt also für jede lineare Abbildung ϕ von einem endlich-
Abbildung ϕ auf diese Gleichung an und erhalten dimensionalen Vektorraum V in irgendeinen (nicht näher be-
stimmten) Vektorraum: Die Dimension von V ist die Summe
0 = ϕ(0) = ϕ(λ1 b1 + · · · + λr br + λ1 b1 + · · · + λs bs ) der Dimensionen des Kerns und des Bildes von ϕ.
= λ1 ϕ(b1 ) + · · · + λr ϕ(br ) + λ1 ϕ(b1 ) + · · · + λs ϕ(bs )
In der Abbildung 12.6 zeigen wir diesen Zusammenhang für
= λ1 c1 + · · · + λs cs . V = R2 = W und eine lineare Abbildung ϕ = ϕA : v →
A v für die drei möglichen Fälle rg A = 2, rg A = 1 und
Wegen der linearen Unabhängigkeit der Vektoren c1 , . . . , cs rg A = 0.
folgt nun:
λ1 = · · · = λs = 0 . x2 x2
ϕA
Die Gleichung (12.3) lautet damit ' (
1 1 ϕA (R2 )
A=
0 1
λ1 b1 + · · · + λr br = 0 . ker ϕA x1 x1
v̂ = λ1 b1 + · · · + λr br .
Der kanonische Epimorphismus
Setzen wir das in die Gleichung (12.4) ein, so erhalten wir: Für jeden Untervektorraum U eines K-Vektorraums V
ist die Abbildung
v = v̂ + (λ1 b1 + · · · + λs bs )
= λ1 b1 + · · · + λr br + λ1 b1 + · · · + λs bs . V → V /U,
π:
v → v + U
Folglich ist B ein Erzeugendensystem von V .
ein Epimorphismus mit Kern U . Man nennt π den ka-
Nun beachten wir nonischen Epimorphismus bezüglich U . Ist V endlich-
dimensional, so gilt:
dim V = |B| = r + s = dim(ϕ −1 ({0})) + dim(ϕ(V )) .
dim V /U = dim V − dim U .
Das ist die Dimensionsformel.
12.3 Kern, Bild und die Dimensionsformel 429
Bei den vielen Beispielen von linearen Abbildungen ha- gegeben, so folgt wegen der Linearität von ϕ die Glei-
ben wir diese Formel bereits vermutet, beachten Sie die chung:
Selbstfrage auf Seite 427. Will man die Formel beweisen,
so sind mehrere Ansätze naheliegend: ϕ(λr+1 br+1 + · · · + λn bn ) = 0 .
Wir wählen eine Basis {b1 , . . . , br } des
Kerns ϕ −1 ({0}), ergänzen diese zu einer Basis Also gilt:
{b1 , . . . , br , br+1 , . . . , bn } von V und zeigen, dass
n − r = dim ϕ(V ) gilt. λr+1 br+1 + · · · + λn bn ∈ ϕ −1 ({0}) = -b1 , . . . , br . .
Wir wählen eine Basis {b1 , . . . , br } des Kerns
Dies besagt, dass es λ1 , . . . , λr ∈ K mit
ϕ −1 ({0}), eine Basis {b1 , . . . , bs } des Bildes ϕ(V ) und
zeigen, dass r + s = dim V gilt. λ1 b1 + · · · + λr br + λr+1 br+1 + · · · + λn bn = 0
Bei der ersten Methode ist eine (n − r)-elementige Ba-
sis von ϕ(V ) anzugeben, bei der zweiten Methode eine gibt. Wegen der linearen Unabhängigkeit der Vektoren aus
(r + s)-elementige Basis von V . Im Text haben wir die B folgt nun:
zweite Methode für den Beweis der Dimensionsformel be-
nutzt. Wir wollen nun die erste Methode verwenden, um λ1 = · · · = λr = λr+1 = · · · = λn = 0 ,
zu zeigen, dass letztlich die gleichen Schlüsse gezogen
werden. also insbesondere die lineare Unabhängigkeit der Vekto-
ren ϕ(br+1 ), . . . , ϕ(bn ).
Die Dimension des Vektorraums V bezeichnen wir mit
n. Der Kern ϕ −1 ({0}) von ϕ ist ein Untervektorraum von Nun zeigen wir noch, dass diese Vektoren ein Erzeugen-
V mit einer Dimension r ≤ n. Wir wählen eine Basis densystem von ϕ(V ) bilden. Ist w ∈ ϕ(V ) vorgegeben, so
C = {b1 , . . . , br } des Kerns ϕ −1 ({0}) und ergänzen diese gibt es ein v ∈ V mit ϕ(v) = w. Dieses Element v ∈ V
zu einer Basis B des ganzen Vektorraums V : lässt sich aber bezüglich der Basis B von V darstellen:
Beweis: Die Abbildung π ist offenbar surjektiv. Wir be- Im R-Vektorraum RN0 aller reellen Folgen sind die Ab-
gründen, dass π auch linear ist. Für v, w ∈ V und λ ∈ K gilt bildungen
nämlich:
RN0 → RN0 ,
π(λ v + w) = (λ v + w) + U r:
(a0 , a1 , . . .) → (0, a0 , a1 , . . .)
= ((λ v) + U ) + (w + U )
und
= λ (v + U ) + (w + U )
RN0 → RN0 ,
= λ π(v) + π(w) . l:
(a0 , a1 , . . .) → (a1 , a2 , . . .),
Somit ist π ein Epimorphismus. Wir bestimmen nun den Kern bei der die Folgenglieder um eine Stelle „nach rechts ver-
von π. Es gilt: schoben“ bzw. „nach links verschoben“ werden, lineare
Abbildungen.
v ∈ ker π ⇔ π(v) = v + U = U ⇔ v ∈ U . Die Abbildung r ist injektiv, aber nicht surjektiv, die Ab-
bildung l ist surjektiv, aber nicht injektiv. Insbesondere
Somit ist U der Kern von π.
ist der Vektorraum RN0 aller reellen Folgen nicht endlich-
Mit der Dimensionsformel folgt nun unmittelbar wegen dimensional.
Bild π = V /U und ker π = U die angegebene Formel.
Wir ziehen schließlich eine nützliche Folgerung aus der Di- Zeilen- und Spaltenraum einer Matrix sind die
mensionsformel:
Vektorräume, die von den Zeilen und Spalten
Kriterium für Bijektivität einer linearen Abbildung
einer Matrix erzeugt werden
Haben V und W gleiche und endliche Dimension, so sind
Nach dem Beispiel auf Seite 421 ist für jede Matrix
für eine lineare Abbildung ϕ : V → W die folgenden
A ∈ Km×n die Abbildung
Aussagen äquivalent:
(i) ϕ ist injektiv.
Kn → Km ,
(ii) ϕ ist surjektiv. ϕA :
v → A v
(iii) ϕ ist bijektiv.
linear. Für eine Matrix A ∈ Km×n mit den Zeilen z1 , . . . , zm
Beweis: (i) ⇒ (ii): Es sei ϕ injektiv. Dann gilt ϕ −1 ({0})
= und den Spalten s 1 , . . . , s n , d. h.,
{0} und somit dim(ϕ −1 ({0})) = 0. Nach der Dimensionsfor-
⎛ ⎞
mel gilt dim(ϕ(V )) = dim(V ) = dim(W ). Somit ist ϕ sur- z1
⎜ ⎟
jektiv (beachten Sie die Kennzeichnungen endlicher Basen A = ⎝ ... ⎠ = (s 1 , . . . , s n ),
auf Seite 209).
zm
(ii) ⇒ (iii): Ist ϕ surjektiv, d. h., gilt ϕ(V ) = W , so
folgt mit der Dimensionsformel aus dim(V ) = dim(W ) = nennen wir den Untervektorraum
dim(ϕ(V )) sogleich dim(ϕ −1 ({0})) = 0, folglich ist ϕ auch
injektiv und somit bijektiv. -z1 , . . . , zm . ⊆ Kn , der von den Zeilenvektoren erzeugt
wird, den Zeilenraum von A bzw.
(iii) ⇒ (i): Ist ϕ bijektiv, so ist ϕ insbesondere auch in- -s 1 , . . . , s n . ⊆ Km , der von den Spaltenvektoren erzeugt
jektiv. wird, den Spaltenraum von A.
Kommentar: Man beachte die Analogie zu endlichen Die Dimension des Zeilenraums nennen wir den Zeilenrang
gleichmächtigen Mengen A und B: Für eine Abbildung von A und die Dimension des Spaltenraums den Spaltenrang
f : A → B sind nach dem Lemma auf Seite 46 die Eigen- von A.
schaften injektiv, surjektiv und bijektiv gleichwertig. In dem Abschnitt auf Seite 175 haben wir den Rang rg A
einer Matrix A ∈ Km×n eingeführt. Der Rang rg A ist die
Bei unendlichdimensionalen Vektorräumen ist die Aussage Anzahl der Nichtnullzeilen der Matrix in Zeilenstufenform
des obigen Satzes nicht korrekt. Man kann im Allgemeinen und damit die Dimension des Zeilenraums, d. h., der Rang
aus der Injektivität eines Endomorphismus nicht auf die Sur- von A ist der Zeilenrang von A. Wir zeigen nun, dass auch
jektivität schließen – dasselbe gilt auch andersherum. Man der Spaltenrang von A gleich diesem Rang von A ist.
beachte die folgenden Beispiele.
Insbesondere haben wir damit den schuldig gebliebenen
Beispiel Nachweis der Wohldefiniertheit des Rangs von A nachge-
d
Im Fall V = K[X] = W ist das Differenzieren dX eine liefert: Der Rang von A ist die Dimension des Zeilenraums
surjektive, nicht injektive lineare Abbildung. und hängt damit nur von A ab.
12.3 Kern, Bild und die Dimensionsformel 431
Mit der Dimensionsformel folgt Der Kern ist die Lösungsmenge des homogenen linearen
Zeilenrang = Spaltenrang Gleichungssystems
Ax = 0.
Wir werden feststellen, dass letztlich jede lineare Abbildung Wir erhalten eine Basis des Kerns durch elementare Zeilen-
zwischen endlichdimensionalen Vektorräumen von der Form umformungen. Dazu vertauschen wir die ersten beiden Zeilen
ϕA mit einer Matrix A ist. Daher ist das vierte Beispiel von und addieren zum Doppelten der dritten Zeile das Dreifache
Seite 425 sehr bedeutend. Wir formulieren die dort gemach- der zweiten Zeile:
ten Feststellungen erneut mit den nun zur Verfügung stehen- ⎛ ⎞ ⎛ ⎞
0 −3 2 0 −2 −3 0 2
den Begriffen.
⎜−2 −3 0 2 ⎟ ⎜ 0 −3 2 0⎟
⎜ ⎟ ⎜ ⎟
⎝ 3 0 3 −3⎠ −→ ⎝ 0 −9 6 0⎠
Kern und Bild einer Matrix 0 3 −2 0 0 0 0 0
Ist A = (s 1 , . . . , s n ) ∈ Km×n , so gilt für den Kern und
Nun ist die dritte Zeile ein Vielfaches der zweiten Zeile, durch
das Bild von ϕA :
eine elementare Umformung erhalten wir nun die Zeilenstu-
−1 fenform
ϕA ({0}) = {v ∈ Kn | A v = 0},
⎛ ⎞ ⎛ ⎞
ϕA (Kn ) = -s 1 , . . . , s n . . −2 −3 0 2 −2 −3 0 2
⎜ 0 −3 2 0⎟ ⎜ 0 −3 2 0⎟
⎜ ⎟ ⎜ ⎟
Man spricht in diesem Zusammenhang auch vom Kern ⎝ 0 −9 6 0⎠ −→ ⎝ 0 0 0 0⎠
und Bild der Matrix A. 0 0 0 0 0 0 0 0
Es gilt:
−1 =:A
dim(ϕA ({0})) = n − rg A
Die Dimension des Kerns ist somit
und
dim ker A = 4 − rg A = 4 − 2 = 2,
dim ϕA (Kn ) = rg A = dim-s 1 , . . . , s n . .
und für eine Basis des Kerns wählen wir zwei linear unab-
hängige Lösungsvektoren des Systems A x = 0, etwa
Beweis: Die Formel ⎛ ⎞ ⎛ ⎞
? −3 1 @
−1
({0})) = n − rg A ⎜ 2 ⎟ ⎜0⎟
dim(ϕA ker ϕA = ⎝ ⎠ , ⎝ ⎟
⎜ ⎟ ⎜ .
3 0⎠
ist wohlbekannt (siehe Seite 184). Weil die Dimension des 0 1
Bildes von ϕA die Dimension des Spaltenraums -s 1 , . . . , s n .
Das Bild von A ist der Spaltenraum von A, d. h. das Erzeugnis
der Matrix A ist, folgt aus der Dimensionsformel die zweite
der Spaltenvektoren von A. Wir erhalten durch elementare
Formel:
Spaltenumformungen eine Basis. Da wir aber wissen, dass
rg A = dim-s 1 , . . . , s n . .
der Spaltenrang, d. h. die Dimension des Spaltenraums, 2
ist, weil der Spaltenrang gleich dem Zeilenrang ist, reicht
es aus,wenn wir zwei linear unabhängige Vektoren aus dem
Insbesondere haben also Zeilen- und Spaltenraum einer Ma-
Bild von A angeben. Dazu können wir offenbar die ersten
trix die gleiche Dimension. Das halten wir fest:
beiden Spalten von A wählen, d. h.
⎛ ⎞ ⎛ ⎞
Zeilenrang = Spaltenrang ? 0 −3 @
⎜−2⎟ ⎜−3⎟
Für alle natürlichen Zahlen m, n und jede Matrix A ∈ Bild ϕA = ⎜ ⎟ ⎜ ⎟
⎝3⎠, ⎝0⎠ .
Km×n gilt:
0 3
Zeilenrang = Spaltenrang .
Kommentar: Ist ϕ eine lineare Abbildung zwischen K-
Ein direkter Nachweis dieser Formel (also ohne Rückgriff auf Vektorräumen V und W , so sind für die Dimensionen des
den Dimensionssatz) ist möglich, aber ziemlich aufwendig. Bildes ϕ(V ) und des Kerns ϕ −1 ({0}) auch die Bezeichnun-
gen Rang und Defekt üblich:
Beispiel Wir bestimmen den Kern und das Bild der Matrix
Rg ϕ = dim ϕ(V ) und Df ϕ = dim ϕ −1 ({0}) .
⎛ ⎞
0 −3 2 0 Mit diesen Bezeichnungen lautet die Dimensionsformel für
⎜−2 −3 0 2⎟⎟ ∈ R4×4 .
A=⎜ einen endlichdimensionalen Vektorraum V :
⎝3 0 3 −3⎠
0 3 −2 0 dim V = Rg ϕ + Df ϕ .
432 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Nach dem Homomorphiesatz liefert jeder Die Aussage in (iii) ist offensichtlich.
Homomorphismus einen Isomorphismus (iv) Es seien v + U, w + U ∈ V /U und λ ∈ K. Dann gilt:
Auf Seite 77 haben wir den Homomorphiesatz für Grup- ψ(λ (v + U ) + (w + U )) = ψ(((λ v) + w) + U ))
pen begründet. Ein entsprechender Satz gilt auch für Vek-
= ϕ(λ v + w)
torräume:
= λ ϕ(v) + ϕ(w)
Der Homomorphiesatz = λ ψ(v + U ) + ψ(w + U ) .
Ist ϕ : V → V
eine lineare Abbildung von einem K-
Vektorraum V in einen K-Vektorraum V , so ist Damit gilt (iv).
V / ker ϕ → ϕ(V ),
ψ: Jeder Homomorphismus ϕ : V → V induziert somit einen
v + ker ϕ → ϕ(v)
Isomorphismus ψ : V / ker ϕ → ϕ(V ).
ein Isomorphismus vom Faktorraum V / ker ϕ auf das
Bild von ϕ, insbesondere gilt: Kommentar: Man beachte, dass die Injektivität (ϕ(v) =
ϕ(v ) ⇒ v + U = v + U ) die Umkehrung der Wohldefi-
V / ker ϕ ∼
= ϕ(V ) .
niertheit (v + U = v + U ⇒ ϕ(v) = ϕ(v )) ist.
Wir schreiben kürzer U = ker ϕ. Und das Bild ϕA (Kn ) ist der Spaltenraum -s 1 , . . . , s n .
(i) Die Elemente aus V /U haben die Form v +U . Eine solche der Matrix A. Nach dem Homomorphiesatz gilt:
Nebenklasse ist nicht eindeutig durch den Repräsentanten v
Kn /U ∼
= -s 1 , . . . , s n . .
erklärt; es kann durchaus v + U = v + U und v = v
gelten. Damit ψ eine Abbildung ist, muss gewährleistet sein,
dass jedem v + U aus V /U genau ein Element aus ϕ(V ) d
Das Differenzieren dX ist im K-Vektorraum K[X] eine
zugeordnet wird, d. h.,
surjektive lineare Abbildung mit dem Kern K. Nach dem
aus v + U = v + U folgt ϕ(v) = ϕ(v ) . Homomorphiesatz gilt:
Es seien also v, v ∈ V . Dann gilt: K[X]/K ∼
= K[X] .
v+U =v +U ⇒ v−v ∈U
⇒ ϕ(v − v ) = 0
12.4 Darstellungsmatrizen
⇒ ϕ(v) − ϕ(v ) = 0
⇒ ϕ(v) = ϕ(v ) .
In diesem Abschnitt betrachten wir nur endlichdimensionale
Damit gilt (i). Vektorräume.
(ii) Es ist zu zeigen Wir ordnen einer linearen Abbildung ϕ : V → W zwischen
endlichdimensionalen K-Vektorräumen V und W nach Wahl
aus ϕ(v) = ϕ(v ) folgt v + U = v + U . von Basen der Vektorräume eine Matrix A zu – die soge-
Dies gilt, da sich die Implikationen in (i) umkehren lassen: nannte Darstellungsmatrix der linearen Abbildung bezüglich
Es seien v, v ∈ V . Dann gilt: der gewählten Basen.
ϕ(v) = ϕ(v ) ⇒ ϕ(v) − ϕ(v ) = 0 Anstelle des Vektors v ∈ V betrachten wir den zu v gehörigen
Koordinatenvektor B v bezüglich einer Basis B – das ist ein
⇒ ϕ(v − v ) = 0
Spaltenvektor.
⇒ v − v ∈ U
Dann ist das Abbilden des Vektors v, also das Bilden von
⇒ v + U = v + U .
ϕ(v), im Wesentlichen die Multiplikation der Matrix A mit
Damit gilt (ii). dem Koordinatenvektor B v.
12.4 Darstellungsmatrizen 433
' (
In diesem Sinne werden die im Allgemeinen durchaus ab- 1
Der Vektor v = hat bezüglich der geordneten Stan-
strakten Objekte der linearen Abbildungen zwischen endlich- 1
dimensionalen Vektorräumen greifbar – eine lineare Abbil- dardbasis E2 den Koordinatenvektor
dung ist im Wesentlichen eine Matrix und das Abbilden eines ' (
1
Vektors die Multiplikation dieser Matrix mit einem Spalten- E2 v = ,
1
vektor. Damit erklärt sich die bereits betonte Bedeutung des
'' ( ' ((
ausführlichen Beispiels auf Seite 421. 1 −1
bezüglich der geordneten Basis B = , den
1 1
Koordinatenvektor
Durch Koordinatenvektoren wird jeder Vektor ' (
1
zu einem Spaltenvektor Bv = .
0
'' ( ' ((
In Mengen sind die Elemente nicht angeordnet, es gilt −1 1
Und bezüglich der Basis C = , hat v
{a, b} = {b, a}. Im Folgenden wird es für uns aber wichtig 2 −1
sein, in welcher Reihenfolge die Elemente einer Basis an- den Koordinatenvektor
' (
geordnet sind. Dazu benutzen wir Tupel. Für verschiedene 2
Elemente a, b einer Menge A gilt nämlich: C v = ,
3
1 2
Achtung: Es sind dann z. B. (e1 , e2 , e3 ) und (e2 , e1 , e3 ) 1 C 1 = 3
beides geordnete Basen des R3 . Als geordnete Basen sind die
beiden verschieden, als Mengen betrachtet aber sehr wohl
−2 −1 1 2 3
gleich. 1
−1 c2 = −1
Nach einem Ergebnis auf Seite 204 ist jeder Vektor eines Vek-
torraums eindeutig als Linearkombination einer Basis dar- −2
stellbar. Diese Darstellung liefert den Koordinatenvektor.
−3 3 c2
den Koordinatenvektor Damit ist B ϕ nach dem Injektivitätskriterium auf Seite 427
⎛ ⎞ injektiv. ⎛ ⎞
1 λ1
⎜2⎟ ⎜ ⎟
⎜ ⎟
EA = ⎝ ⎠ . Zur Surjektivität: Der Vektor ⎝ ... ⎠ ∈ Kn ist das Bild des
3
4 λn
Vektors
Kommentar: Ein Vertauschen des i-ten Elementes mit v = λ 1 b 1 + · · · + λn b n ∈ V ,
dem j -ten Element einer geordneten Basis führt also zu sodass die Abbildung B ϕ auch surjektiv ist.
einem Vertauschen der i-ten Komponente mit der j -ten Kom-
ponente des Koordinatenvektors.
Die eben bewiesene Isomorphie zwischen einem beliebi-
gen n-dimensionalen K-Vektorraum V und dem Kn besagt,
dass die beiden Vektorräume V und Kn sich nur durch die
Jeder n-dimensionale Vektorraum über K ist Bezeichnung der Elemente unterscheiden. Jeder n-dimen-
zu Kn isomorph sionale K-Vektorraum hat die gleiche Struktur wie der Kn . Ist
die Dimension von V endlich, so beschreibt die Dimension
Ordnet man jedem Vektor v aus V seinen Koordinatenvektor den Vektorraum V eindeutig bis auf Isomorphie.
B v bezüglich einer geordneten Basis B zu, so hat man eine
Damit sind die endlichdimensionalen K-Vektorräume durch
Abbildung von V in den Kn definiert, hierbei ist n = dim V .
ihre Dimension klassifiziert. Zu jeder natürlichen Zahl n gibt
Diese Abbildung liefert ein zentrales Ergebnis der linearen
es im Wesentlichen nur einen einzigen K-Vektorraum der
Algebra:
Dimension n, nämlich den Vektorraum Kn mit den vertrauten
Spaltenvektoren.
Jeder n-dimensionale K-Vektorraum ist zum Kn iso-
morph Nun ist es nur naheliegend, wie wir weiter vorgehen werden:
Den Wunsch, alle linearen Abbildungen ϕ zwischen zwei
Ist B = (b1 , . . . , bn ) eine geordnete Basis des n-di- Vektorräumen V und W beschreiben, erfassen und greifbar
mensionalen K-Vektorraums V , so ist die Abbildung machen zu können, erfüllen wir uns im Fall dim V = n ∈ N
und dim W = m ∈ N wie folgt: Wir identifizieren V mit
V → Kn ,
Bϕ : Kn und W mit Km und beschreiben den Zusammenhang
v → B v
ϕ(v) = w mit v ∈ V und w ∈ W durch eine Darstel-
eine bijektive und lineare Abbildung, d. h. ein Isomor- lungsmatrix A:
phismus. ϕ(v) = w ←→ Bv = A Cw .
v bezüglich der Standardbasis En des Kn für das Bild von v Die Matrix, die eine lineare Abbildung
wegen der Linearität von ϕ darstellt, erhält man spaltenweise
ϕ(v) = ϕ(v1 e1 + · · · + vn en )
Wie eben gezeigt, können wir jeder linearen Abbildung ϕ
= v1 ϕ(e1 ) + · · · + vn ϕ(en ) von Kn in den Km eine Matrix zuordnen, mit der wir die
⎛ ⎞
v1 lineare Abbildung ϕ beschreiben können. Mit der Matrix
⎜ ⎟ A = (ϕ(e1 ), . . . , ϕ(en )) ∈ Km×n gilt:
= (ϕ(e1 ), . . . , ϕ(en )) ⎝ ... ⎠
=:A vn ϕ = ϕA .
= A v = ϕA (v) ,
Wir wollen dies auf endlichdimensionale beliebige K-Vek-
also ϕ = ϕA . torräume V und W verallgemeinern.
Darstellung linearer Abbildungen von Kn in den Km Die Darstellungsmatrix einer linearen Abbildung
bezüglich der Standardbasen
Es seien V ein n-dimensionaler und W ein m-dimen-
Zu jeder linearen Abbildung ϕ von Kn in Km gibt es sionaler K-Vektorraum mit den geordneten Basen B =
eine Matrix A ∈ Km×n mit ϕ = ϕA . Diese Matrix A ist (b1 , . . . , bn ) von V und C = (c1 , . . . , cm ) von W .
gegeben als Und ϕ sei eine lineare Abbildung von V nach W . Man
nennt die Matrix
A = (ϕ(e1 ), . . . , ϕ(en )) ∈ Km×n .
C M(ϕ)B = (C ϕ(b1 ), . . . , C ϕ(bn )) ∈ Km×n
Die i-te Spalte von A ist das Bild des i-ten Basisvektors
der Standardbasis. die Darstellungsmatrix von ϕ bezüglich der Basen B
und C.
Beispiel
Zur Nullabbildung Die i-te Spalte von C M(ϕ)B ist der Koordinatenvektor
des Bildes des i-ten Basisvektors.
R3 → R2 ,
ϕ:
v → 0 Wir drücken das noch etwas ungenauer in einer Form aus,
in der man sich die Konstruktion der Darstellungsmatrix gut
gehört die Nullmatrix 0 aus R2×3 . merken kann: „Die Spalten der Darstellungsmatrix sind die
Zur Identität 3 Bilder der Basisvektoren.“
R → R3 ,
id :
v → v
?
gehört die Einheitsmatrix E3 ∈ R3×3 . Inwiefern verallgemeinert dies die Konstruktion von
Zur linearen Abbildung Seite 435?
⎧ 3
⎪
⎪ R → R2 ,
⎨⎛ ⎞ ' (
x Zu jeder linearen Abbildung zwischen endlichdimensiona-
ϕ : ⎝ 1⎠ x1 + x2
⎪
⎪ x → len Vektorräumen existiert eine Darstellungsmatrix. Inwie-
⎩ 2 x2
x3 fern eine Darstellungsmatrix die lineare Abbildung darstellt,
klären wir gleich nach den folgenden Beispielen.
gehört wegen
' ( ' ( ' ( Beispiel
1 1 0
ϕ(e1 ) = , ϕ(e2 ) = , ϕ(e3 ) = Als Darstellungsmatrix der Nullabbildung ϕ : R2 → R3 ,
0 1 0
v → 0 bezüglich der geordneten Standardbasen E2 des
' (
1 1 0 R2 und E3 des R3 erhalten wir
die Matrix A = . Es gilt:
0 1 0
⎛⎛ ⎞⎞ ⎛ ⎞ E2 M(ϕ)E3 = (E2 ϕ(e1 ), . . . , E2 ϕ(e2 ), E2 ϕ(e3 )) =
x1 x1 ' (
0 0 0
ϕ ⎝⎝x2 ⎠⎠ = A ⎝x2 ⎠ . =
0 0 0
x3 x3
Allgemeiner gilt: Die Darstellungsmatrix der Nullabbil-
? dung eines n-dimensionalen Vektorraums in einen m-
Können auch Zeilen oder Spalten, also Matrizen aus K1×n dimensionalen Vektorraum ist die m × n-Nullmatrix.
oder Kn×1 , solche Darstellungsmatrizen sein? Nun bilden wir die Darstellungsmatrix der Identität
ϕ = idR2 : v → v bezüglich verschiedener geordneter
436 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
und analog
Nun untersuchen wir, wie diese Projektion dargestellt werden Eine lineare Abbildung wird durch eine Darstellungs-
kann. Wir wählen eine Basis {b, c} der Ebene E. Es ist dann matrix beschrieben
B = {n, b, c} offenbar eine Basis des R3 . Nun können wir
Gegeben ist eine lineare Abbildung ϕ : V → W zwi-
jeden Vektor v ∈ R3 als Linearkombination von B darstellen,
schen zwei endlichdimensionalen K-Vektorräumen V
⎛ ⎞
λ1 und W .
v = λ1 n + λ2 b + λ3 c d. h., B v = ⎝λ2 ⎠ .
Ist B = (b1 , . . . , bn ) bzw. C = (c1 , . . . , cm ) eine
λ3
Basis von V bzw. W , so gilt:
Das Durchführen der Projektion ist ganz einfach, beachte = C M(ϕ)B B v .
C ϕ(v)
Abbildung 12.9:
⎧ Der Koordinatenvektor von ϕ(v) ist das Produkt der
⎛ ⎞ →
R3 3
⎪
⎪
⎨ ⎛R ,⎞ Darstellungsmatrix mit dem Koordinatenvektor von v.
λ1 0
π: ⎝λ2 ⎠ .
⎪
⎪ v = ⎝ λ2 ⎠ → ⎛ ⎞
⎩B v1
λ3 λ3
⎜ ⎟
Beweis: Gilt B v = ⎝ ... ⎠, so erhalten wir wegen
n vn
C M(ϕ)B = (C ϕ(b1 ), . . . , C ϕ(bn )):
?
Was sind Kern und Bild der Projektion?
Nachdem klar ist, wie man die Darstellungsmatrix einer li- Kommentar: Die Formel
nearen Abbildung bestimmt, überlegen wir uns, in welcher
C ϕ(v) = C M(ϕ)B B v
Art und Weise die Darstellungsmatrix nun benutzt werden
kann, um die lineare Abbildung, aus der sie gewonnen wurde, kann man sich einfach merken – das B kürzt sich durch das
auszudrücken. Aufeinandertreffen weg.
C M(ϕ) CC p = ⎝ 2 0 0 ⎠ ⎝ 1 ⎠ = ⎝2 ⎠ .
vn
−1 1 0 −3 0
Beispiel Wir bestimmen den Kern und das Bild der auf
Die Formel im obigen Satz liefert im Fall ϕ = id auch Ko- Seite 435 gegebenen linearen Abbildung
ordinatenvektoren von Vektoren eines K-Vektorraums V be-
züglich einer Basis C, wenn jene bezüglich einer Basis B K2×2 → K2×2 ,
ϕ:
bekannt sind. A → M A − A M,
⎛ ⎞ ' (
1 0 −1
wobei M =
Beispiel Der Vektor E3 v = ⎝2⎠, dargestellt bezüglich 1 0
3 Die lineare Abbildung ϕ hat bezüglich der geordneten Stan-
3
der Standardbasis E3 des R , hat bezüglich der geordneten dardbasis E = (E11 , E12 , E21 , E22 ) die Darstellungsma-
Basis C = (e1 + e2 , e2 + e3 , e1 ) den Koordinatenvektor trix ⎛ ⎞
0 −1 −1 0
Cv = C M(id)E3 E3 v ⎜1 0 0 −1⎟
⎛ ⎞⎛ ⎞ ⎛ ⎞ E M(ϕ)E = ⎝
⎜ ⎟
0 1 −1 1 −1 1 0 0 −1⎠
= ⎝0 0 1 ⎠ ⎝2⎠ = ⎝ 3 ⎠ . 0 1 1 0
1 −1 1 3 2
(Seite 435).
Durch elementare Zeilenumformungen erhalten wir den Kern
von A = E M(ϕ)E :
Der Kern und das Bild einer linearen
⎛ ⎞ ⎛ ⎞
Abbildung ist durch den Kern und das Bild 0 −1 −1 0 1 0 0 −1
einer Darstellungsmatrix gegeben ⎜1 0 0 −1⎟ ⎜0 1 1 0⎟
⎜ ⎟→⎜ ⎟
⎝1 0 0 −1⎠ ⎝0 0 0 0⎠
Die Eigenschaften einer linearen Abbildung ϕ finden sich 0 1 1 0 0 0 0 0
in ihrer Darstellungsmatrix wieder. Ist ϕ z. B. eine lineare
Abbildung zwischen zwei endlichdimensionalen K-Vektor- Somit gilt:
⎛ ⎞ ⎛ ⎞
räumen V und W mit dim V = n und dim W = m, so ist ? 1 0 @
jede Darstellungsmatrix von ϕ eine m × n-Matrix. Es sei ⎜0 ⎟ ⎜1⎟
ker A = ⎜ ⎟
⎝0 ⎠ ,
⎜ ⎟ .
⎝−1⎠
A = C M(ϕ)B eine solche Darstellungsmatrix mit Basen B
von V und C von W . Wir zeigen: 1 0
12.4 Darstellungsmatrizen 439
2×2 0 1 −1 0
ϕ(K )=- , ..
1 0 0 1
Beispiel Gegeben ist die Matrix
⎛ ⎞
−2 3 2 3
A = ⎝−3 5 0 1 ⎠ ∈ R3×4 .
−1 2 −2 −2
Jede lineare Abbildung zwischen
endlichdimensionalen Räumen kann durch Wir wollen geordnete Basen B von R4 und C von R3 bestim-
men, sodass die Darstellungsmatrix C M(ϕA )B der linearen
eine sehr einfache Matrix dargestellt werden
Abbildung ϕA : R4 → R3 , v → A v die im obigen Satz
angegebene Form hat.
Wir können zu jeder linearen Abbildung ϕ : V → W zwi-
schen endlichdimensionalen K-Vektorräumen V und W eine Dazu ermitteln wir Basen von ker ϕA und ϕA (R4 ):
ganz einfache Darstellungsmatrix angeben, die von Einsen ⎛ ⎞ ⎛ ⎞
12 10 ⎛ ⎞ ⎛ ⎞
auf einer Diagonalen abgesehen, nur aus Nullen besteht: ⎜7⎟ ⎜6⎟ 1 0
ker ϕA = -⎜ ⎟ , ⎜ ⎟. und ϕ(R4 ) = -⎝ 0 ⎠ , ⎝1⎠..
⎝0⎠ ⎝1⎠
−1 1
Die einfachste Darstellungsmatrix 1 0
Es seien n = dim V und m = dim W , ϕ : V → W linear Wir bestimmen nun Urbilder der angegeben Basisvektoren
und r = dim ϕ(V ). Es existieren Basen B von V und C vom Bild ϕA (R4 ). Es gilt:
von W mit ' ( ⎛⎛ ⎞⎞ ⎛⎛ ⎞⎞
Er 0 −5 ⎛ ⎞ 3 ⎛ ⎞
C M(ϕ) B = 1 0
0 0 ⎜⎜−3⎟⎟ ⎜⎜2⎟⎟
ϕA ⎜ ⎜ ⎟⎟ = ⎝ 0 ⎠ und ϕA ⎜⎜ ⎟⎟ = ⎝1⎠ .
⎝⎝ 0 ⎠⎠ ⎝⎝0⎠⎠
wobei Er die r × r-Einheitsmatrix ist. −1 1
0 0
440 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Beispiel: Die Darstellungsmatrix einer Spiegelung an einer Geraden durch den Ursprung
Wir betrachten im R2 , mit dem üblichen kartesischen
Koordinatensystem, den Endomorphismus ϕ, den wir x2
durch lineare Fortsetzung der Abbildung σ (e1 ) = e2
und σ (e2 ) = e1 erhalten. Bei dieser 'Abbildung wird ϕ(e1 ) = e 2
(
1
jeder Punkt des R2 an der Geraden R gespiegelt.
1 ϕ(v) = v1 ϕ(e1 ) + v2 ϕ(e2 )
v1
Man beachte die nebenstehende Abbildung.
v1
Wir bestimmen die Darstellungsmatrizen dieser linearen
Abbildung zum einen bezüglich der Standardbasis E2
v2 e1 = ϕ(e2 ) x1
und zum anderen bezüglich der geordneten Basis
' ' ( ' (( v2
1 1 v = v1 e 1 + c 2 e 2
B = b1 = , b2 = .
1 −1
Problemanalyse und Strategie: Wir bestimmen die Bilder von e1 , e2 und b1 , b2 und stellen diese Bilder jeweils als
Linearkombinationen der Basen E2 und B dar.
Es gilt: ' (
'' (( ' ( ' ( ' ( v1
v1 v 0 1 v1 für B v = .
ϕ = 2 = , v2
v2 v1 1 0 v2 Anstelle der speziellen Basis B hätten wir auch jede an-
d. h., ϕ(v) = A v. dere Basis wählen und eine entsprechende ϕ darstellende
Matrix angeben können. Tatsächlich liegt gerade hierin
Wir wählen nun eine andere Basis B: der Kern des Kapitels 14: Wie bestimmt man eine Ba-
' ( ' (
1 1 sis mit der Eigenschaft, dass die eine lineare Abbildung
B = b1 = , b2 = .
1 −1 darstellende Matrix bezüglich dieser Basis eine besonders
einfache Gestalt hat? Dabei ist die einfachste Gestalt eine
Da b1 kein Vielfaches von b2 ist, ist B in der Tat eine
Diagonalgestalt. In den praktischen Anwendungen der li-
Basis des R2 . Der Punkt b1 liegt auf der Geraden, an der
nearen Algebra wird dies meistens möglich sein. Die Vor-
gespiegelt wird, und die Strecke vom Ursprung zum Punkt
teile liegen auf der Hand: Mit Diagonalmatrizen ist das
b2 steht senkrecht auf der Geraden, an der wir spiegeln,
Rechnen wesentlich einfacher.
es ist nämlich das Skalarprodukt b1 · b2 gleich null.
Also erhalten wir: x2
ϕ(v)
ϕ(b1 ) = b1 und ϕ(b2 ) = −b2 .
ϕ(w)
x2
b1 x1
ϕ(b2 ) = −b2 w
1 b1 = ϕ(b1 )
b2 v
−1 1 x1
Insgesamt haben wir damit die folgende geordnete Basis B ψ ◦ ϕ mit ϕ, ψ lineare Abbildungen.
des R4 : λ ϕ mit λ ein Skalar, ϕ eine lineare Abbildung.
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞ ϕ + ψ mit ϕ, ψ lineare Abbildungen.
−5 3 12 10
⎜⎜−3⎟ ⎜2⎟ ⎜ 7 ⎟ ⎜ 6 ⎟⎟
B=⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝ 0 ⎠ , ⎝0⎠ , ⎝ 0 ⎠ , ⎝ 1 ⎠⎠ .
Wir behandeln zuerst die letzteren beiden Verknüpfungen.
Um das Produkt ψ ◦ ϕ durch die Darstellungsmatrizen von
0 0 1 0 ψ und ϕ auszudrücken, benötigen wir das Produkt von Ma-
trizen.
Weiter ergänzen wir die Basis des Bildes im R3 zu einer
geordneten Basis C des R3 : Wir betrachten zwei endlichdimensionale K-Vektorräume
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎞ V und W mit den Basen B = (b1 , . . . , bn ) und C =
1 0 0
(c1 , . . . , cm ).
C = ⎝⎝ 0 ⎠ , ⎝1⎠ , ⎝0⎠⎠ .
−1 1 1 Ist ϕ eine lineare Abbildung von V in W , so gilt für jedes
λ ∈ K nach der Definition von Darstellungsmatrizen:
Nun gilt: ⎛ ⎞
1 0 0 0
C M(ϕA )B = ⎝0 1 0 0⎠ C M(λ ϕ)B = (C (λ ϕ(b1 )), . . . , C (λ ϕ(bn )))
0 0 0 0 = (λ C ϕ(b1 ), . . . , λ C ϕ(bn ))
= λ (C ϕ(b1 ), . . . , C ϕ(bn ))
Achtung: Man beachte, dass wir hier die bisherige Auf- = λ C M(ϕ)B .
gabenstellung umdrehen: Bisher waren Basen gegeben, und
wir haben die Darstellungsmatrix dazu bestimmt. Hier ha-
Somit ist die Darstellungsmatrix von λ ϕ gleich dem λ-
ben wir die Basen so gewählt, dass die Darstellungsmatrix
Fachen der Darstellungsmatrix von ϕ.
eine besondere Form hat. Im Kapitel 14 werden wir Endo-
morphismen ϕ eines endlichdimensionalen Vektorraums V Für die Summe ϕ + ψ zweier linearer Abbildungen
betrachten. Nach dem hier geschilderten Ergebnis können ϕ, ψ : V → W erhalten wir
wir auf jeden Fall Basen B und C finden bzgl. der die Dar-
stellungsmatrix von ϕ eine Diagonalgestalt wie im obigen + ψ)B
C M(ϕ
Satz hat. Dabei werden wir uns auch mit der Frage auseinan-
= (C (ϕ + ψ)(b1 ), . . . , C (ϕ + ψ)(bn ))
dersetzen, wann es eine Basis B (also der Fall B = C) gibt,
bezüglich der ϕ Diagonalgestalt hat. = (C (ϕ(b1 ) + ψ(b1 )), . . . , C (ϕ(bn ) + ψ(bn )))
= (C ϕ(b1 ), . . . , C ϕ(bn )) + (C ψ(b1 ), . . . , C ψ(bn ))
= C M(ϕ)B + C M(ψ)B .
Der Vektorraum der Homomorphismen ist
isomorph zum Vektorraum der Matrizen
Die Darstellungsmatrix von ϕ + ψ ist somit die Summe der
Sind V ein n-dimensionaler und W ein m-dimensionaler K- Darstellungsmatrizen von ϕ und ψ.
Vektorraum, so gilt nach dem Satz auf Seite 434:
Achtung: Man beachte, in welchen Vektorräumen die
= Kn und W ∼
V ∼ = Km . Multiplikation mit Skalaren und die Addition von Vektoren
stattfinden: λ ϕ ist die Multiplikation mit Skalaren im Vek-
Bis auf Isomorphie handelt es sich somit bei den Vektoren aus
torraum HomK (V , W ) und λ C M(ϕ)B ist die Multiplikation
V und W um Spaltenvektoren. Für eine lineare Abbildung ϕ
mit Skalaren im Vektorraum Km×n . Und ϕ + ψ ist die Addi-
von V in W gilt mit der Darstellungsmatrix A = C M(ϕ)B
tion von linearen Abbildungen im Vektorraum HomK (V , W )
nach dem Satz auf Seite 437:
und C M(ϕ)B + C M(ψ)B ist die Addition von Matrizen im
= C M(ϕ)B B v . Vektorraum Km×n .
C ϕ(v)
Die Bilder einer linearen Abbildung erhält man also bis auf Wir erklären in Abhängigkeit von den gewählten Basen B
Isomorphie durch Produktbildung einer Matrix mit einem und C eine Abbildung, nämlich
Spaltenvektor.
Nun stellt sich natürlich die Frage, ob die im Abschnitt 12.2 Hom K (V , W ) → Km×n ,
C !B :
besprochenen Verknüpfungen von linearen Abbildungen sich ϕ → C M B (ϕ).
auch durch entsprechende Verknüpfungen der Matrizen be-
schreiben lassen. Unter gewissen Voraussetzungen kann man Gezeigt ist bereits, dass diese Abbildung C !B homogen und
ja lineare Abbildung miteinander oder mit Skalaren verknüp- additiv, d. h. linear ist. Wir zeigen noch, dass C !B bijektiv
fen, wir behandelten die drei Verknüpfungen: ist:
442 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Die Vektorräume HomK (V , W ) und Km×n sind iso- ben. Das Aussehen der Darstellungsmatrix hängt natürlich
morph von der Wahl der Basis ab, und es stellt sich die Frage, was
der Zusammenhang zwischen den Darstellungsmatrizen ein
Es seien V ein n-dimensionaler und W ein m-dimen-
und derselben linearen Abbildung bezüglich verschiedener
sionaler K-Vektorraum mit den Basen B und C. Die
Basen ist. Aber bevor wir auf diesen Zusammenhang zu spre-
Abbildung
chen kommen, diskutieren wir die Injektivität, Surjektivität,
Bijektivität und Invertierbarkeit von linearen Abbildungen
HomK (V , W ) → Km×n ,
C !B : im Zusammenhang mit ihren Darstellungsmatrizen – letzt-
ϕ → C M(ϕ)B
lich sind lineare Abbildungen ja nichts anderes als Matrizen,
ist ein Isomorphismus, insbesondere gilt HomK (V,W ) diese Eigenschaften von Abbildungen müssen damit als Ei-
∼
= Km×n . genschaften der Darstellungsmatrizen erkennbar sein.
Weil die Bijektivität einer Abbildung ϕ zur Umkehrbarkeit
der linearen Abbildung ϕ äquivalent ist, d. h., es existiert eine
Beweis: Es ist nur noch die Bijektivität von C !B nachzu- Abbildung ϕ −1 mit
weisen:
ϕ −1 ◦ ϕ = id = ϕ ◦ ϕ −1 ,
Zur Injektivität: Für ein ϕ ∈ HomK (V , W ) gelte C !B (ϕ) = 0.
Wegen
müssen wir uns zunächst überlegen, was die Darstellungs-
matrix der Komposition von Abbildungen ist.
C !B (ϕ) = (C ϕ(b1 ), . . . , C ϕ(bn )) = (0, . . . , 0)
so sollte A B die Darstellungsmatrix von ψ ◦ ϕ : V → U be- den k-ten Spaltenvektor von B bezeichnen:
züglich der kanonischen Basen En und Er sein, insbesondere
⎛ ⎞
sollte also A B eine r × n-Matrix sein mit z1
⎛ ⎞
⎜ .. ⎟ ..
⎜ . ⎟ · · · . · · ·
(A B) v = (ψ ◦ ϕ)(v) = ψ(ϕ(v)) = A (Bv) , v ∈ V . ⎜ ⎟ ⎜ ⎟
⎜ zi ⎟ (s 1 , . . . , s k , . . . , s r ) = ⎜· · · zi · s k · · ·⎟ .
⎜ ⎟ ⎝ ⎠
⎜ . ⎟ ..
Nun erklären wir das Produkt A B von A mit B so, dass ⎝ .. ⎠ ··· . ···
diese Gleichheit erfüllt ist. Damit wird eine Multiplikation zm
der Matrizen A und B definiert.
C
AB
Setzen wir in die obige gewünschte Gleichheit nacheinander
Um die Matrix C zu bilden, ist also jede Zeile von A mit
die Basisvektoren e1 , . . . , en der kanonischen Basis ein, so
jeder Spalte von B zu multiplizieren. Das sind m r Multipli-
erhalten wir, wenn wir beachten, dass B ei gleich der i-ten
kationen, wobei jede solche Multiplikation von Vektoren aus
Spalte s i der Matrix B = (s 1 , . . . , s n ) ist:
einer Summe von n Produkten besteht.
(A B) e1 = A (Be1 ) = A s 1 ,
(A B) e2 = A (Be2 ) = A s 2 , Zeilen- und Spaltenzahl des Produkts
A · B = C
Damit haben wir die folgende Multiplikation von Matrizen
motiviert.
Achtung: Das Matrixprodukt ist nur für Matrizen A und
B mit der Eigenschaft
Das Matrixprodukt
Spaltenzahl von A = Zeilenzahl von B
Es seien A ∈ Km×n und B = (s 1 , . . . , s r ) ∈ Kn×r .
Dann ist definiert.
A B = (A s 1 , . . . , A s r ) ∈ Km×r ?
Für Matrizen A und B existiere sowohl das Produkt A B als
das Matrixprodukt oder auch nur kurz Produkt von A auch das Produkt B A. Müssen die Matrizen A und B dann
und B. quadratisch sein?
Man beachte: Die Spaltenzahl von A ist gleich der Zei-
lenzahl von B.
Beispiel Die folgenden Matrizen sollen alle reell sein.
Beim ersten Produkt benutzen wir Farbe, um das Prinzip
Wir haben das Produkt von Matrizen auf das r-fache Produkt Zeile mal Spalte deutlich zu machen:
einer Matrix mit einer Spalte zurückgeführt.
⎛ ⎞ Ausformuliert ⎛ ⎞ ⎛ ⎞
z1 2 6 1 ⎛ ⎞ 23 17
⎜ .. ⎟ ⎜6 ⎟ 2 4 ⎜24
lautet die Produktbildung von A = ⎝ . ⎠ ∈ Km×n mit ⎜ 4 0⎟ ⎝ 28⎟
⎝0 · 3 1⎠ = ⎜ ⎟
zm 3 3⎠ ⎝12 12⎠
1 3
B = (s 1 , . . . , s r ) ∈ K :
n×r 4 1 2 13 23
!
n Beispielsweise bestimmen die blau eingezeichneten Zif-
A B = (cik )m,p mit cik = zi · s k = aij bj k . fern der zweiten Zeile in der ersten Matrix und zweiten
j =1 Spalte der zweiten Matrix den Eintrag in der zweiten Zeile
und zweiten Spalte des Produkts:
An der Stelle (i, k) des Produkts C = A B steht also die
Zahl zi · s k , wobei zi den i-ten Zeilenvektor von A und s k 6 · 4 + 4 · 1 + 0 · 3 = 28 .
444 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Die Faktoren des folgenden Produkts kann man nicht ver- Wir bestimmen eine Matrix A ∈ R2×2 , sodass sich die
tauschen: Rekursion in der Form
⎛ ⎞ ' ( ' (
' ( 1 2 3 1 ' ( an an−1
2 3 1 ⎝
1 0 0 1⎠ =
7 9 6 9 =A
3 5 0 8 6 9 8 an+1 an
2 5 0 4
schreiben lässt.
Eine Spalte mal eine Zeile ergibt eine Matrix: Wegen an = 0 an−1 + 1 an und an+1 = −4 an−1 + 4 an
⎛ ⎞ ⎛ ⎞
−1 −2 −3 −1 leistet ' (
⎝ 1 ⎠ (2, 3, 1) = ⎝ 2 3 1 ⎠ 0 1
A= ∈ R2×2
−4 4
2 4 6 2
das Gewünschte.
Beliebige Matrizen kann man nicht miteinander multipli-
Und nun gilt:
zieren:
' (' ( ' ( ' ( ' ( ' (
2 3 1 1 2 3 1 an an−1 an−2 a0
ist nicht definiert. =A = A2 = · · · = An .
3 5 0 1 0 0 1 an+1 an an−1 a1
' (
b11 b12
Eine Diagonalmatrix vervielfacht die Zeilen, wenn sie Ist also An = , so können wir an+1 aus den Start-
b21 b22
links im Produkt steht:
werten berechnen:
⎛ ⎞⎛ ⎞ ⎛ ⎞
a 0 0 1 2 3 1a 2a 3a
⎝0 b 0⎠ ⎝4 5 6⎠ = ⎝4 b 5 b 6 b ⎠ an+1 = b21 a0 + b22 a1
0 0 c 7 8 9 7c 8c 9c
Durch diese Beschreibung gelingt es uns mit noch zu ent-
wickelnden Methoden, an auch explizit für große n anzu-
Eine Diagonalmatrix vervielfacht die Spalten, wenn sie
geben. Es ist z. B. bereits a20 = 20 · 219 . Es wäre müh-
rechts im Produkt steht:
⎛ ⎞⎛ ⎞ ⎛ ⎞ sam, diesen Wert für a20 mit der Folgenvorschrift zu be-
1 2 3 a 0 0 1a 2b 3c stimmen.
⎝4 5 6⎠ ⎝0 b 0⎠ = ⎝4 a 5 b 6 c⎠
7 8 9 0 0 c 7a 8b 9c
Zum Produkt von linearen Abbildungen
Potenzieren von Diagonalmatrizen führt zum Potenzieren gehört das Produkt der Darstellungsmatrizen
der Diagonalelemente:
⎛ ⎞⎛ ⎞⎛ ⎞ ⎛ ⎞ Wir können nun auch die folgende Multiplikativität nachwei-
a 0 0 a 0 0 a 0 0 a3 0 0
⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟ sen:
⎜0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜
b 0⎠ ⎝0 b 0⎠ ⎝0 b 0⎠=⎝ 0 b3 0 ⎟
⎝ ⎠
0 0 c 0 0 c 0 0 c 0 0 c3
Die Darstellungsmatrix eines Produkts linearer Ab-
bildungen
Ausgehend vom letzten Beispiel definieren wir allgemeiner
für eine quadratische Matrix A ∈ Kn×n : Für jede natürliche Für K-Vektorräume V , W und U mit den geordneten
Zahl k bezeichne Basen B, C und D und lineare Abbildungen ϕ : V → W
Ak = A und ψ : W → U gilt:
·
· · A
k-mal
D M(ψ ◦ ϕ)B = D M(ψ)C C M(ϕ)B .
die k-te Potenz von A. Weiter setzen wir
A0 = En .
Beweis: Es seien
Dazu formen wir beide Seiten zu gleichen Ausdrücken um. Beweis: (i) Es seien A ∈ Km×n , B ∈ Kn×r und
Für ein i ∈ {1, . . . , n} gelte: C∈K r×p . In den K-Vektorräumen Kn , Km , Kr , Kp wäh-
⎛ ⎞ len wir die Basen N, M, R, P . Nach dem Isomorphiesatz
b1
⎜ .. ⎟ auf Seite 442 sind
ϕ(bi ) = b1 c1 + · · · + bm cm , d. h., C ϕ(bi ) = ⎝ . ⎠ . ρ = (M !N )−1 (A) , ψ = (N !R )−1 (B) , ϕ = (R !P )−1 (C)
bm lineare Abbildungen,
Damit erhalten wir zum einen ρ : Kn → Km , ψ : Kr → Kn , ϕ : Kp → Kr .
◦ ϕ)(bi ) = D (ψ(ϕ(bi ))) = D (ψ(b1 c1 + · · · + bm cm )) Nun gilt aufgrund des obigen Satzes und der Assoziativität
D (ψ
der Hintereinanderausführung von Abbildungen:
und zum anderen
(AB)C = M M(ρ)N N M(ψ)R R M(ϕ)P
⎛ ⎞
b1 = M M(ρ ◦ ψ)R · R M(ϕ)P = M M (ρ ◦ ψ) ◦ ϕ P
⎜ . ⎟
D M(ψ)C C ϕ(bi ) = (D ψ(c 1 ), . . . , D ψ(c m )) ⎝ .. ⎠ = M M ρ ◦ (ψ ◦ ϕ) P = M M(ρ)N N M(ψ ◦ ϕ)P
bm = M M(ρ)N N M(ψ)R R M(ϕ)P = A(BC).
= b1D ψ(c1 ) + · · · + bmD ψ(cm ) (ii) Das beweist man analog.
= D (ψ(b1 c1 + · · · + bm cm )) .
Beispiel Durch Ausnutzen der Assoziativität (A B) C =
Damit ist die Gleichheit der beiden Matrizen gezeigt.
A (B C) kann man sich reichlich Rechenarbeit ersparen.
Wir berechnen das folgende Matrixprodukt auf 2 Arten:
⎛ ⎞
⎛ ⎞ 2
Viele Rechenregeln für Matrizen sind analog 3 ⎜0⎟
zu den Rechenregeln für z. B. ganze Zahlen, es ⎝−2⎠ (1, −1, −2, 1) ⎜ ⎟ .
⎝2⎠
gibt aber auch Ausnahmen 2
3
Wir begründen nun, dass bezüglich der von uns erklärten Mit der Klammerung (A B) C ergibt sich:
Matrizenmultiplikation und der Addition von Matrizen die ⎛ ⎞
⎛ ⎞ 2 ⎛ ⎞ ⎛ ⎞
Menge aller quadratischen Matrizen einen Ring bildet (siehe 3 −3 −6 3 ⎜ ⎟ 6 + 0 − 12 + 9 3
⎜ ⎟ ⎜0⎟ ⎜ ⎟ ⎜ ⎟
⎜−2 2 4 −2⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
Seite 85). Dazu ist nachzuweisen, dass das Assoziativgesetz ⎝ ⎠ ⎜2⎟=⎝−4 + 0 + 8 − 6⎠=⎝−2⎠ .
⎝ ⎠
für die Multiplikation und die Distributivgesetze gelten. Ein 2 −2 −4 2 4+0−8+6 2
3
direkter Nachweis dieser Gesetze ist möglich aber deutlich
aufwendiger als die Methode, die wir nun verwenden werden. Mit der Klammerung A (B C) ergibt sich dasselbe, aber die
Wir benutzen die Tatsache, dass EndK (V ) mit der punkt- Rechnung ist kürzer (4 + 3 = 7 gegenüber 12 + 12 = 24
weisen Addition und der Hintereinanderausführung einen Multiplikationen):
⎛ ⎞ ⎛ ⎞
Ring bildet. Dabei entspricht diese Addition der Addition 3 3
von Matrizen und die Hintereinanderausführung der Mul- ⎝−2⎠ (2 − 0 − 4 + 3) = ⎝−2⎠ .
tiplikation von Matrizen. So übertragt sich die Ringstruktur 2 2
mit einer bijektiven, additiven und multiplikativen Abbildung
von EndK (Kn ) auf Kn×n . Wir betrachten nun den Fall V = W = U , B = C = D
In den Anwendungen braucht man das Assoziativgesetz aber und beachten, dass HomK (V , V ) = EndK (V ) mit der Hin-
nicht nur für quadratische Matrizen. Daher beweisen wir all- tereinanderausführung ◦ von Abbildungen sogar einen Ring
gemeiner die folgenden Rechenregeln für die Matrizenmul- bildet (siehe Seite 424). Wir erhalten für den additiven Iso-
tiplikation. morphismus B !B von Seite 442 aus obigem Ergebnis:
Rechenregeln für die Matrixmultiplikation Der Endomorphismenring ist zum Matrizenring iso-
morph
(i) Wenn für Matrizen A, B, C die Produkte A B
und B C erklärt sind, existieren auch (A B) C und Die Menge Kn×n aller n × n-Matrizen bildet mit der
A (B C), und es gilt: Addition + und Multiplikation · von Matrizen einen
Ring mit Einselement En , und für jeden n-dimensionalen
(A B) C = A (B C) . K-Vektorraum V gilt:
EndK (V ) ∼
= Kn×n .
(ii) Für quadratische Matrizen A, B, C ∈ Kn×n gelten
Im Fall n > 2 ist Kn×n nicht kommutativ und besitzt
A (B + C) = A B + A C,
Nullteiler, d. h., es gibt Elemente A = 0 = B mit
(A + B) C = A C + B C . A B = 0.
446 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Die zu A inverse Matrix A−1 ist eindeutig Beweis: Ist A ∈ Kn×n invertierbar mit dem Inversen A−1 ,
durch A A−1 = En = A−1 A bestimmt so gilt
ϕA−1 ◦ ϕA = ϕA−1 A = ϕEn = idKn
In K gibt es zu jedem Element a ∈ K \ {0} genau ein Ele- und analog:
ment a ∈ K mit a a = 1 = a a, wobei das Einselement ϕA ◦ ϕA−1 = idKn ,
in K durch die Eigenschaft 1 a = a = a 1 ausgezeichnet
ist. Es gibt auch ein solches Einselement in Kn×n , nämlich sodass
−1
die Einheitsmatrix En , sie erfüllt für jedes A ∈ Kn×n die ϕA = ϕA−1 .
Gleichung Ist nun umgekehrt ϕA invertierbar, so gilt nach dem Darstel-
E n A = A = A En . lungssatz linearer Abbildungen auf Seite 435 für die Um-
kehrabbildung ψ von ϕA :
Aber im Gegensatz zum Körper K, existiert zu einer Matrix
A ∈ Kn×n \ {0} im Allgemeinen kein Inverses A , d. h. eine ψ = ϕB mit einem B ∈ Kn×n .
Matrix A mit A A = En = A A.
' ( Nun folgt aus
1 0
Die reelle Matrix A = ist so ein Beispiel. Ist A =
0 0
) ∈ R2×2 , so gilt: ϕA B = ϕA ◦ ϕB = idKn = ϕB ◦ ϕA = ϕB A
(aij
' (' a
( ' a
( sogleich
A A =
1 0 a11 12 =
a11 12 = E2 . A B = En = B A ,
0 0 a
a21 0 0
22
sodass also B = A−1 gilt.
A A−1 = En = A−1 A . Die zweite Zeile von A, also die Nullzeile, erzwingt eine
Nullzeile in jedem Produkt A A , insbesondere kann für
Eine Matrix, die nicht invertierbar ist, nennt man auch sin- keine Matrix A die Gleichung A A = E2 erfüllt sein.
gulär. Allgemeiner ist jede Matrix, die eine Nullzeile enthält,
nicht invertierbar.
Wir stellen gleich einen Zusammenhang zwischen einer in-
Es ist E2 ∈ K2×2 zu sich selbst invers, da
vertierbaren Matrix A und der Invertierbarkeit des Endomor-
phismus ϕA dar, dazu beachte man den Invertierbarkeitsbe- ' (' ( ' (
1 0 1 0 1 0
griff einer Abbildung auf Seite 48. E2 E2 = = = E2 .
0 1 0 1 0 1
' ( ' (
2 1 1 −1 Beweis: (i) Wegen En = A A−1 = A−1 A ist A das
Zu A = ∈ R2×2 ist das Inverse, da
1 1 −1 2 Inverse zu A−1 , d. h., (A−1 )−1 = A.
' (' ( ' (
2 1 1 −1 1 0 (ii) Wir weisen nach, dass (B −1 A−1 ) das Inverse zu A B
= = E2 .
1 1 −1 2 0 1 ist, es gilt dann (A B)−1 = B −1 A−1 .
⎛ ⎞ ⎛ ⎞
i 1 0 −i i 1 Wegen der Assoziativität der Matrizenmultiplikation gilt fol-
Zu A = ⎝0 1 i ⎠ ∈ C3×3 ist ⎝ 0 1 −i⎠ das Inverse, gende Gleichung:
0 0 1 0 0 1
da (A B) (B −1 A−1 ) = A (B B −1 ) A−1
⎛ ⎞⎛ ⎞ ⎛ ⎞
i 1 0 −i i 1 1 0 0 = A En A−1 = A A−1 = En .
⎝0 1 i ⎠ ⎝ 0 1 −i⎠ = ⎝0 1 0⎠ = E3 .
0 0 1 0 0 1 0 0 1
' ( (iii) Das gilt wegen En En = En .
1 1
Die Matrix A = ∈ K2×2 ist nicht invertierbar, da
1 1
die Gleichung ?
' (' ( ' ( Sind A und B invertierbare n × n-Matrizen, so ist ϕA ◦ ϕB
1 1 a b 1 0
= = E2 eine invertierbare Abbildung. Was ist die Umkehrabbildung
1 1 c d 0 1
von ϕA ◦ ϕB ?
zu dem nicht lösbaren Gleichungssystem
a+c =1 b+d =0
Da die Multiplikation von quadratischen Matrizen assoziativ
a+c =0 b+d =1 ist, ist auch die Multiplikation von invertierbaren Matrizen
führt. Allgemeiner sind Matrizen mit zwei gleichen Zeilen assoziativ. Somit gilt:
niemals invertierbar.
Wir betrachten für ein α ∈ [0, 2 π[ die Matrix Folgerung
' ( Die Menge
cos α − sin α
A= ∈ R2×2 .
sin α cos α
GLn (K) = {A ∈ Kn×n | A ist invertierbar}
' (
cos(−α) − sin(−α)
Dann ist das Inverse von A (man
sin(−α) cos(−α) der invertierbaren n × n-Matrizen über dem Körper K ist mit
beachte cos(−α) = cos α und sin(−α) = − sin α), da der Multiplikation von Matrizen eine Gruppe.
' (' (
cos α − sin α cos(−α) − sin(−α)
sin α cos α sin(−α) cos(−α) Achtung: Im Allgemeinen gilt:
' (
1 0
= = E2 . (A B)−1 = A−1 B −1 .
0 1
Bevor wir zeigen, wie man das Inverse einer invertierbaren Als Beispiel betrachten wir
Matrix bestimmt, geben wir noch wichtige Eigenschaften in- '( ' (
vertierbarer Matrizen an. 2 1 1 1
A= , B= .
1 1 0 1
Eigenschaften invertierbarer Matrizen
Dann gilt:
(i) Wenn A ∈ Kn×n invertierbar ist, so auch A−1 , und
es gilt: ' ( ' (
(A−1 )−1 = A . 1 −1 1 −1
A−1 = , B −1 = .
−1 2 0 1
(ii) Wenn A und B aus Kn×n invertierbar sind, so ist
auch A B invertierbar, und es gilt: Nun rechnen wir nach:
' ( ' (
(A B)−1 = B −1 A−1 2 3 2 −3
AB = , (A B)−1 = B −1 A−1 =
1 2 −1 2
– man beachte die Reihenfolge!
(iii) Es ist En ∈ Kn×n invertierbar, und es gilt: und
' (
En−1 = En . 1 −2
A−1 B −1 = = (A B)−1 .
−1 3
12.6 Das Invertieren von Matrizen 449
Dreiecksgestalt, also auf die Form Wieder notieren wir (A | E 3 ), addieren zur ersten Zeile
⎛ ⎞ das (−x)-Fache der dritten Zeile, zur zweiten Zeile das
∗ ∗ ... ∗ ∗ ∗ ... ∗ (−z)-Fache der dritten Zeile und setzen schließlich die
⎜ . . ⎟
⎜ 0 ∗ . . .. ∗ ∗ . . .
⎜ ∗⎟⎟
dritte Zeile als erste Zeile:
⎜. . . ⎟ ⎛ ⎞
⎝ .. . . . . ∗ ∗ ∗ . . . ∗⎠ x y 1 1 0 0
0 ... 0 ∗ ∗ ∗ ... ∗ ⎝z 1 0 0 1 0⎠ →
1 0 0 0 0 1
=:D ⎛ ⎞
1 0 0 0 0 1
⎝ 0 y 1 1 0 −x ⎠ .
Stellt sich hierbei heraus, dass der Rang von A kleiner als n
ist, d. h., die links stehende Matrix D eine Nullzeile enthält, 0 1 0 0 1 −z
so ist nach dem Kriterium für Invertierbarkeit die Matrix A
Wir addieren in einem zweiten Schritt das (−y)-Fache
nicht invertierbar. Enthält D hingegen keine Nullzeile, so ist
der dritten Zeile zur zweiten und vertauschen schließlich
die Matrix invertierbar. Man setzt in diesem Fall die Zeilen-
diese beiden Zeilen:
umformungen fort und ermittelt das Inverse von A. Die ge-
⎛ ⎞
ringfügige Mehrarbeit, die Zeilenumformungen an der rechts 1 0 0 0 0 1
stehenden Einheitsmatrix im Ansatz (A | En ) durchzuführen, ⎝ 0 y 1 1 0 −x ⎠ →
sollte man in Kauf nehmen. 0 1 0 0 1 −z
⎛ ⎞
1 0 0 0 0 1
Das Bestimmen des Inversen einer Matrix A ∈ Kn×n ⎝0 1 0 0 1 −z ⎠ .
1. Man schreibe (A | En ). 0 0 1 1 −y y z − x
2. Mit elementaren Zeilenumformungen bringe man
(A | En ) auf die Form (D | B), mit einer oberen Drei- Folglich ist
ecksmatrix D. ⎛ ⎞
3. Enthält D eine Nullzeile, so ist A nicht invertierbar. 0 0 1
Enthält D keine Nullzeile, so setze man mit elemen- A−1 = ⎝0 1 −z ⎠ .
taren Zeilenumformungen fort, um das Inverse A−1 1 −y yz − x
von A zu erhalten:
Wir versuchen das Inverse von
(A | En ) → · · · → (En | A−1 ) . ⎛ ⎞
1 2 0 4
⎜1 1 0 2 ⎟
Beispiel A=⎜ ⎟
⎝0 2 1 0⎠ ∈ R
4×4
Wir heben zwei Merkregeln für das Inverse spezieller Matri- Man kann auch das Addieren eines Vielfachen einer Zeile zu
zen hervor. einer anderen Zeile durch eine Matrizenmultiplikation aus-
drücken, so ist etwa
Die Inversen von 2 × 2- und Diagonalmatrizen
' ( ⎛ ⎞⎛ ⎞ ⎛ ⎞
a b 1 0 0 3 3 3 3 3 3
Die Matrix ∈ K2×2 ist genau dann invertier- ⎝−1/3 1 0⎠ ⎝3 3 3⎠ = ⎝2 2 2⎠
c d
bar, wenn a d = b c. Es gilt in diesem Fall: 0 0 1 3 3 3 3 3 3
' (−1 ' (
a b 1 d −b die Addition des (−1/3)-fachen der ersten Zeile zur zweiten.
=
c d ad −bc −c a
?
Die Matrix diag(a1 , . . . , an ) ∈ Kn×n ist genau dann
Welche Zeile ändert sich, wenn der Faktor −1/3 an der Stelle
invertierbar, wenn alle ai = 0 sind, und es gilt in
(3, 1) dieser Matrix steht?
diesem Fall:
⎛ ⎞−1 ⎛ ⎞
a1 0 a1−1 0
⎜ .. ⎟ ⎜ .. ⎟ Ein Vertauschen der Matrizen bewirkt wieder eine entspre-
⎝ . ⎠ =⎝ . ⎠
chende Umformung an den Spalten:
0 an 0 an−1
⎛ ⎞⎛ ⎞ ⎛ ⎞
3 3 3 1 0 0 2 3 3
Diese Aussagen prüft man einfach durch Multiplikation der ⎝3 3 3⎠ ⎝−1/3 1 0⎠ = ⎝2 3 3⎠ .
jeweiligen Matrizen mit den angegebenen Inversen nach. 3 3 3 0 0 1 2 3 3
?
Ist mit zwei invertierbaren Matrizen A, B ∈ Kn×n auch die ?
n × n-Matrix A + B invertierbar ? An welcher Stelle muss der Faktor −1/3 stehen, damit die
zweite Spalte des Produkts nur 2 als Komponenten hat ?
Kommentar: Ist A x = b ein lineares Gleichungssystem
mit invertierbarer Matrix A, so ist die dann eindeutig be-
stimmte Lösung durch A−1 b gegeben. Tatsächlich ist es im In der Tat lässt sich jede elementare Zeilenumformung bzw.
Allgemeinen aber viel aufwendiger, erst A−1 zu bestimmen elementare Spaltenumformung an einer Matrix A ∈ Km×n
und diese Matrix dann mit b zu multiplizieren, als das Glei- durch Multiplikation einer Matrix von rechts bzw. von links
chungssystem mit dem Algorithmus von Gauß und Jordan zu darstellen. Matrizen, die dies bewirken, werden wir Elemen-
lösen. tarmatrizen nennen.
so bewirkt diese Multiplikation eine elementare Spaltenum- Für λ ∈ K und i, j ∈ {1, . . . , m} mit i = j nennt man die
formung an A. m × m-Matrizen der Form
452 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Problemanalyse und Strategie: Man beachte das auf Seite 450 beschriebene Verfahren.
Lösung: Nun erkennen wir, dass A den Rang 3 hat, also auch tat-
Wieder notieren wir zuerst (A | E3 ), tauschen dann die ers- sächlich invertierbar ist. Es folgt der letzte Schritt, in dem
te mit der dritte Zeile und addieren zur zweiten Zeile das wir die dritte Zeile zur ersten Zeile addieren und zur zwei-
(−4)-Fache der neuen ersten Zeile und zur neuen dritten ten Zeile das (−1)-Fache der dritten Zeile hinzufügen:
Zeile das (−6)-Fache der neuen ersten Zeile: ⎛ ⎞
⎛ ⎞ 1 0 −1 0 2 −7
6 8 3 1 0 0 ⎝ 0 1 1 0 −1 4 ⎠ →
⎝4 7 3 0 1 0⎠ → 0 0 1 1 −4 10
1 2 1 0 0 1 ⎛ ⎞
⎛ ⎞ 1 0 0 1 −2 3
1 2 1 0 0 1 ⎝ 0 1 0 −1 3 −6 ⎠
⎝ 0 −1 −1 0 1 −4 ⎠ 0 0 1 1 −4 10
0 −4 −3 1 0 −6
Folglich ist ⎛ ⎞
In einem zweiten Schritt addieren wir zur ersten Zeile das 1 −2 3
2-Fache der zweiten Zeile und zur dritten Zeile das (−4)- A−1 = ⎝−1 3 −6⎠
Fache der zweiten Zeile und multiplizieren schließlich die 1 −4 10
zweite Zeile mit −1:
⎛ ⎞ Kommentar: Beim Invertieren einer Matrix A ∈ Kn×n
1 2 1 0 0 1 passieren leicht Rechenfehler. Man kann sein Ergebnis
⎝ 0 −1 −1 0 1 −4 ⎠ → aber einfach überprüfen, da die Gleichung A A−1 = E n
0 −4 −3 1 0 −6 erfüllt sein muss. Diese Gleichung ist im Allgemeinen sehr
⎛ ⎞ leicht nachzuvollziehen, wir tun dies für unser Beispiel:
1 0 −1 0 2 −7
⎝ 0 1 1 0 −1 4 ⎠ ⎛ ⎞⎛ ⎞ ⎛ ⎞
6 8 3 1 −2 3 1 0 0
0 0 1 1 −4 10 ⎝4 7 3⎠ ⎝−1 3 −6⎠ = ⎝0 1 0⎠
1 2 1 1 −4 10 0 0 1
⎛ ⎞
1 Kommentar: Die Matrizen D i (λ) für λ ∈ K \ {0} und
⎜ .. ⎟ N i,j (λ) für λ ∈ K sind invertierbar, so ist D i (λ−1 ) das In-
⎜ . ⎟
⎜ ⎟ verse zu D i (λ) und N i,j (−λ) jenes zu N i,j (λ).
⎜ 1 ⎟
⎜ ⎟
D i (λ) = ⎜ λ ⎟ ← i
⎜ ⎟ ⎛ ⎞
⎜ 1 ⎟ z1
⎜ .. ⎟ ⎜ ⎟
⎝ . ⎠ Für die m × n-Matrix A = ⎝ ... ⎠ mit den Zeilenvektoren
1 zm
↑ z1 , . . . , zm ∈ Kn erhält man die folgenden Matrizenpro-
i dukte:
und ⎛ ⎞ ⎛ ⎞
⎛ ⎞ z1 z1
1 ⎜ .. ⎟ ⎜ ... ⎟
⎜ .. ⎟ ⎜ . ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ . ⎟ ⎜zi−1 ⎟ ⎜ zi−1 ⎟
⎜ ⎟ ← i ⎜ ⎟ ⎜ ⎟
1 D i (λ) A = ⎜ ⎟ ⎜ ⎟
⎜ λ zi ⎟ und N i,j (λ) A = ⎜zi + λ zj ⎟ .
⎜ λ ⎟
⎜ .. ⎟ ⎜zi+1 ⎟ ⎜ zi+1 ⎟
N i,j (λ) = ⎜ . ⎟ ⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ . ⎟ ⎜ ⎟
⎜ 1 ⎟ ⎝ .. ⎠ ⎝ .. ⎠
⎜ ⎟ .
⎜ .. ⎟
⎝ . ⎠ zm zm
1 Also bewirkt die Matrizenmultiplikation von D i (λ) von links
↑ an A die Multiplikation der i-ten Zeile von A mit λ bzw.
j die Matrizenmultiplikation von N i,j (λ) von links an A die
m × m-Elementarmatrizen. Addition des λ-Fachen der j -ten Zeile zur i-ten Zeile.
12.7 Elementarmatrizen 453
Diese beiden Multiplikationen bewirken also gerade für Das Invertieren von Matrizen kann man auch
λ = 0 im ersten Fall die elementaren Zeilenumformungen mit Elementarmatrizen beschreiben
der Art (ii) und (iii) an A.
Wir überlegen uns nun, welche Matrix das Vertauschen Eine invertierbare Matrix A ∈ Kn×n hat nach einem Ergebnis
zweier Zeilen zi und zj für i = j von A bewirkt. auf Seite 449 den Maximalrang n.
Wir multiplizieren an A von links Elementarmatrizen: Dann ⎛ kann A mit⎞ elementaren Zeilenumformungen auf die
⎛.⎞ ⎛ . ⎞ ⎛ ⎞ 1 ∗ ∗
.. .. .. ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ . ⎟ Form ⎝ . . . ∗ ⎠ gebracht werden und mit weiteren solchen
⎜ zi ⎟ ⎜zi + zj ⎟ ⎜ zi + z j ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 0 1
⎜ .. ⎟ ⎜ .. ⎟ ⎜ . ⎟
A=⎜.⎟→⎜ . ⎟→⎜ .. ⎟ Umformungen schließlich in die Einheitsmatrix En umge-
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜z ⎟ ⎜ z ⎟ ⎜z + (−1) (z + z )⎟ wandelt werden. Jede Umformung bedeutet eine Multiplika-
⎝ j⎠ ⎝ j ⎠ ⎝ j i j ⎠
.. .. .. tion von links mit einer Elementarmatrix. Daher existieren zu
. . . der invertierbaren Matrix A Elementarmatrizen T 1 , . . . , T k
=N i,j (1) A =N j,i (−1) N i,j (1) A mit
⎛ .. ⎞ ⎛ .. ⎞ ⎛.⎞ T k · · · T 1 A = En ,
.
⎜ . ⎟ ⎜ . ⎟ ⎜.⎟
⎜z i + z j ⎟ ⎜zi + zj + (−zi )⎟ ⎜z j ⎟ sodass
⎜ ⎟ ⎜ ⎟ D j (−1) ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
= ⎜ ... ⎟ → ⎜
..
. ⎟ → ⎜ ... ⎟ . T k · · · T 1 = T k · · · T 1 En = A−1 .
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ −zi ⎟ ⎜ −zi ⎟ ⎜ zi ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
.. .. ..
. . . Invertieren von Matrizen
=N i,j (1)N j,i (−1) N i,j (1) A Jede invertierbare Matrix A lässt sich mittels elementarer
Zeilenumformungen in die Einheitsmatrix E n überfüh-
Damit führen also die Elementarmatrizen auch zum Vertau-
ren. Wendet man dieselben Umformungen in derselben
schen der Zeilen zi mit zj , also zur elementaren Zeilenum-
Reihenfolge auf En an, so erhält man A−1 .
formung (i). Diese Vertauschung bewirkt also letztlich die
Matrix
Dieses Vorgehen zum Invertieren einer invertierbaren Matrix
P i,j = D j (−1) N i,j (1) N j,i (−1) N i,j (1) =
⎛ ⎞ ist genau dasselbe, das wir in der Merkbox auf Seite 450
1 geschildert haben.
⎜ . ⎟
⎜ .. ⎟
⎜ ⎟ Man schreibt En rechts neben A, also (A | En ) und wendet
⎜ ⎟ ← i
⎜ 0 1 ⎟ die Umformungen, die A in En überführen, gleichzeitig auf
⎜ ⎟
⎜ .. ⎟ E n an, man erhält also (En | A ). Die Matrix A ist dann das
⎜ . ⎟
= ⎜ ⎟ Inverse A−1 von A.
⎜ 1 0 ⎟ ← j
⎜ ⎟
⎜ .. ⎟ Wir haben damit auch gezeigt:
⎝ . ⎠
1
↑ ↑ Folgerung
i j Jede invertierbare Matrix ist ein Produkt von Elemen-
tarmatrizen, d. h., die Gruppe GLn (K) der invertierbaren
Man nennt P i,j eine Permutationsmatrix, sie vertauscht n × n-Matrizen über dem Körper K wird von den Elemen-
durch Multiplikation von links an A die Zeilen zi und zj . tarmatrizen erzeugt.
Problemanalyse und Strategie: Man gebe eine bijektive additive und multiplikative Abbildung von C nach G an.
' ( ' ( ' (
Lösung: a −b 1 0 0 −1
=a +b −
Wir betrachten die Abbildung b a 0 1 1 0
⎧ ' ( ' (
⎨ C → ' G, ( 1 0 0 −1
bildet die Menge , eine Basis von G.
ϕ: a −b 0 1 1 0
⎩ z = a + i b → Es folgt erneut dimR (C) = 2.
b a
und überzeugen uns von den folgenden vier Tatsachen: Wir heben ein weiteres Resultat hervor: Weil die Multi-
1. ϕ ist injektiv: Aus ϕ(a + i b) = ϕ(a + i b ) folgt so- plikation in C kommutativ ist, ist es auch jene in G, denn
gleich a = a und b = b . zu beliebigen g, g ∈ G gibt es z, z ∈ C mit ϕ(z) = g
2. ϕ ist'surjektiv: und ϕ(z ) = g . Damit erhalten wir g g = ϕ(z) ϕ(z ) =
( ϕ(z z ) = ϕ(z z) = ϕ(z ) ϕ(z) = g g .
a b
Zu ∈ G wähle z = a + i b ∈ C.
−b a Also ist die Multiplikation in G kommutativ, wenngleich
3. Für alle z, z ∈ C gilt ϕ(z + z ) = ϕ(z) + ϕ(z ):
die Multiplikation in R2×2 nicht kommutativ ist.
Sind z = a + i b und z = a + i b ∈ C, so ist Nach Abschnitt 5.2 können wir komplexe Zahlen auch als
' ( Vektoren des R2 interpretieren. Damit haben wir für jede
a + a −(b + b )
ϕ(z + z ) = = ϕ(z) + ϕ(z ) . komplexe Zahl z ∈ C die drei Schreibweisen
b + b a + a ' ( ' (
a a −b
z = a + i b, z = ,z=
4. Für alle z, z ∈ C gilt ϕ(z z ) = ϕ(z) ϕ(z ): b b a
Sind z = a + i b und z = a + i b ∈ C, so ist
Die Multiplikation einer komplexen Zahl z = a + i b mit
ϕ(z z ) = ϕ((a a − b b ) + i (b a + a b )) der imaginären Einheit i ist die Drehung der komplexen
' (
' R (um π/2, also i z = −b + i a, da hierzu der
Zahl z im 2
a a − b b −(b a + a b )
= −b
b a + a b a a − b b Vektor gehört:
' (' ( a
a −b a −b
= = ϕ(z) ϕ(z ) .
b a b a iz a
Folgerung sie stellen ja auch dieselbe lineare Abbildung dar, nur eben
Ist A ∈ Kn×n eine beliebige und S ∈ Kn×n eine bezüglich verschiedener Basen. Zu dem Begriff Äquivalenz-
invertierbare Matrix, so gilt: relation beachte man die Definition auf Seite 53:
C M(ϕ)C = S −1 B M(ϕ)B S ,
Je zwei Darstellungsmatrizen einer linearen
Abbildung sind ähnlich wobei S = B M(idV )C gilt.
nämlich ähnlich; dabei sagt man, dass eine n×n-Matrix A zu Wir stellen die Situation der Basistransformationsformel in
einer n × n-Matrix B ähnlich ist, wenn es eine invertierbare einem Diagramm dar:
n × n-Matrix S mit
A = S −1 B S
Man nennt S = B M(idV )C auch Basistransformationsma- von ϕ bezüglich einer Basis B, so gilt:
trix. Die i-te Spalte von S ist der Koordinatenvektor bezüg-
lich der Basis B des i-ten Basisvektors der Basis C. [M]∼ = {N ∈ Kn×n | N ∼ M}
Aus der Basistransformationsformel ergibt sich Folgendes: = {N ∈ Kn×n | N = S −1 M S für ein S ∈ GLn (K)} .
In Z2×2
2 sind genau die Matrizen Matrizen zu berechnen. Der Rechenaufwand steigt mit der
' ( ' ( ' ( Größe der Matrizen. Viel einfacher ist es zumeist, die Dar-
1 0 1 1 1 0
A= ,B= ,C= , stellungsmatrix bezüglich einer anderen Basis direkt zu er-
0 1 0 1 1 1 mitteln. So erhalten wir etwa bei der Spiegelung im Beispiel
' ( ' ( ' (
1 1 0 1 0 1 sogleich, wenn wir die Elemente der Basis C mit c1 und c2
D= ,E= ,F = bezeichnen:
1 0 1 0 1 1
' (
invertierbar. 1 0
C M(ϕ)C = (C ϕ (c1 ) , C ϕ (c2 )) =
0 −1
?
Warum sind das genau die invertierbaren Matrizen ?
Die Basistransformationsformel hat aber dennoch einen un-
schätzbaren Wert. Angenommen, es gibt eine Basis C, be-
Wegen züglich der die Darstellungsmatrix eine Diagonalmatrix D =
' ( ' ( diag(λ1 , . . . , λn ) ist. Es ist dann einfach, für eine beliebige
0 0 1 0
A−1 MA = , B −1 MB = , Darstellungsmatrix M jede Potenz M k zu berechnen:
1 1 1 0
' ( ' (
0 0 0 1 M k = (S −1 D S)k
C −1 MC = , D −1 MD = ,
0 1 0 1 −1 −1 −1
=S
DSS D
S . . . S D S
' ( ' (
1 1 1 0
E −1 ME = F −1 MF =
k-mal
,
0 0 0 0 = S −1 D k S = S −1 diag(λk1 , . . . , λkn ) S .
sind diese sechs Matrizen die Elemente der Äquivalenzklasse
Wir werden dies noch mehrfach vor allem im Kapitel 14
[M]∼ .
benutzen.
Die Basistransformationsformel gibt an, wie wir die Darstel- Wir formulieren die Basistransformationsformel erneut für
lungsmatrix einer linearen Abbildung bezüglich einer Basis den wichtigen Fall einer linearen Abbildung der Form:
C erhalten, wenn wir diese bezüglich einer Basis B kennen. n
Wir schildern dies an einem einfachen Beispiel. K → Kn ,
ϕ = ϕA :
v → A v.
Beispiel Wir betrachten die Abbildung
⎧ 2
⎨'R ( → 'R2( , Die Transformationsformel für quadratische
ϕ: x1 x2 Matrizen
⎩ → .
x2 x1
Die Darstellungsmatrix der linearen Abbildung
= (
Ist B '' (e1 ,'e2 ) ((
die geordnete Standardbasis des undR2
1 1 ϕA : Kn → Kn , v → A v
C= , eine weitere geordnete Basis, so erhal-
1 −1
ten wir bezüglich einer geordneten Basis B = (b1 , . . . , bn ) des
' ( ' ( Kn lautet
0 1 1 1 B M(ϕA )B = S −1 A S ,
B M(ϕ)B = , S = B M(idR2 )C =
1 0 1 −1
' ( wobei S = (b1 , . . . , bn ) gilt.
1/2 1/2
S −1 = C M(idR2 )B =
1/2 −1/2
Beispiel
' Zu einer(reellen Zahl t betrachten wir die Matrix
und schließlich aus diesen drei Matrizen durch Produktbil- cos t sin t
A= . Ein Element v ∈ R2 schreiben wir in
dung die Darstellungsmatrix von ϕ bezüglich der Basis C: sin t − cos t
' (
C M(ϕ)C = S −1 B M(ϕ)B S v
der Form v = 1 . Damit ist eine lineare Abbildung vom
' (' (' ( v2
1/2 1/2 0 1 1 1
= R2 in den R2 definiert:
1/2 −1/2 1 0 1 −1
' ( '' (( ' ( ' (
1 0 v1 v1 v1 cos t + v2 sin t
= ϕA =A = .
0 −1 v2 v2 v1 sin t − v2 cos t
Dieses einfache Beispiel zeigt bereits, dass die Basistrans- Es ist '' ( ' ((
cos t/2 − sin t/2
formationsformel an sich nicht sehr geeignet ist, die Darstel- B= ,
sin t/2 cos t/2
lungsmatrix bezüglich einer Basis C aus derjenigen bezüg-
lich einer Basis B zu berechnen. Es sind die Basistransfor- wegen der linearen Unabhängigkeit der beiden Elemente von
mationsmatrix, ihr Inverses und zudem das Produkt dreier B eine geordnete Basis des R2 . Tatsächlich stehen die beiden
458 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Vektoren b1 und b2 der Basis B sogar senkrecht aufeinander Der Dualraum von V ist die Menge aller
– dies sieht man, indem man ihr Skalarprodukt bildet (siehe linearen Abbildungen von V in K
Seite 235).
Wir berechnen nun die Darstellungsmatrix B M(ϕA )B . Die Für beliebige K-Vektorräume V und W ist HomK (V , W )
Basistransformationsmatrix S hat als Spalten gerade der nach dem Satz auf Seite 424 ein K-Vektorraum. Da W =
Reihe nach die Elemente b1 und b2 der geordneten Basis B: K natürlich auch ein (eindimensionaler) K-Vektorraum ist,
' ( erhalten wir den K-Vektorraum
cos t/2 − sin t/2
S= . V ∗ = HomK (V , K) = {ϕ : V → K | ϕ ist linear} .
sin t/2 cos t/2
Man nennt V ∗ den Dualraum von V . Die Elemente von V ∗
Das Inverse zu S ist dann
heißen Linearformen, eine Linearform ist damit eine lineare
' (
cos t/2 sin t/2 Abbildung von V in den Grundkörper K.
S −1 = .
− sin t/2 cos t/2
Beispiel
Damit erhalten wir: Im Fall V = Kn ist jede Linearform ϕ : Kn → K durch
' ( einen Zeilenvektor z = (a1 , . . . , an ) ∈ K1×n gegeben:
−1 1 0
B M(ϕA )B =S AS = .
0 −1 ϕ(v) = z v , v ∈ V .
Wegen der Basistransformationsformel erhalten wir damit Umgekehrt definiert jeder Vektor z ∈ K1×n eine Linear-
die sehr einfache Darstellung der linearen Abbildung ϕ durch form. Daher erhalten wir V ∗ ∼= K1×n .
' ( ' (' ( ' ( Der K-Vektorraum V = K[X] hat die Basis {Xk | k ∈ N0 }.
B v =
v1
→ ϕ
B A (v) =
1 0 v1
=
v1
, Ist ϕ ∈ V ∗ eine Linearform:
v2 0 −1 v2 −v2 ⎧
⎨ V → K,
n
d. h. ϕ:
ϕA : v1 b1 + v2 b2 → v1 b1 − v2 b2 . ⎩p = ai X i → ϕ(p),
i=0
Folglich ist ϕA die Spiegelung an der Geraden R b1 , denn b1 so wird durch
steht senkrecht auf b2 (Abb. 12.10).
b0 = ϕ(1) , b1 = ϕ(X) , b2 = ϕ(X2 ) , . . .
x2
eine Folge b = (bi )i∈N0 erklärt. Damit haben wir eine
lineare Abbildung von V ∗ in den K-Vektorraum K[[X]]
aller Folgen über K erklärt,
∗
V → K[[X]],
:
ϕ → (ϕ(X i ))i∈N0 .
Nun gehen wir von einer Folge b = (bi )i∈N0 ∈ K[[X]]
aus. Zu jedem Polynom p = ni=0 ai X i ∈ K[X] betrach-
ten wir das Körperelement ni=0 ai bi ∈ K. Dadurch wird
x1 eine lineare Abbildung von V = K[X] in K, also eine
Linearform ϕb erklärt:
⎧
⎨ V → K,
n n
ϕb :
⎩p = ai Xi → ai bi .
i=0 i=0
Abbildung 12.10 Die Spiegelung an der Geraden R b1 (blau). Da jede Folge (bi )i∈N0 ∈ K[[X]] eine solche Linearform
liefert, erhalten wir somit eine Abbildung
K[[X]] → V ∗ ,
!:
(bi )i∈N0 → ϕ,
12.9 Der Dualraum
die linear ist. Offenbar gilt:
Jeder K-Vektorraum V hat einen Partner, den Dualraum V∗ ! ◦ = idV ∗ und ◦ ! = idK[[X]] ,
von V , das ist die Menge aller linearen Abbildungen von V
in K. Falls V endlichdimensional ist, so hat V ∗ die gleiche d. h., dass V ∗ = K[X]∗ ∼
= K[[X]]. Der Dualraum des
Dimension wie V , und eine Basis von V ∗ ist mithilfe einer Vektorraums aller Polynome über K ist somit bis auf die
Basis von V leicht anzugeben. Im unendlichdimensionalen Bezeichnung der Elemente der Vektorraum aller Folgen
Fall sind die Verhältnisse komplizierter. über K.
12.9 Der Dualraum 459
Problemanalyse und Strategie: Wie üblich bezeichne E = (1, X, X 2 , X 3 ) die kanonische Basis von R[X]3 .
d
Zuerst bestimmen wir die Darstellungsmatrix von dX anhand der Definition, also die Matrix, deren Spalten gerade
die Koordinatenvektoren bezüglich B der Bilder der Basisvektoren sind. Bei der zweiten Lösungsmethode bestimmen
d d
wir die Darstellungsmatrix E M( dX )E von dX bezüglich der Standardbasis, die Basistransformationsmatrix S, deren
Inverses und schließlich das Produkt der drei Matrizen: S −1 E M( dX
d
)E S, und dies ist dann die Darstellungsmatrix
bezüglich der Basis B.
⎛ ⎞
Lösung: 1 0 0 0 0 0 0 1
1. Lösungsweg mit der Definition der Darstel- ⎜0 1 0 0 −2 − 23 13 4⎟
... → ⎜
⎝0
3 ⎟
lungsmatrix: Wir bestimmen die Darstellungsmatrix 0 1 0 1 3 − 3 −2 ⎠
1 5
d
B M( dX )B , indem wir die Bilder der Basisvektoren 0 0 0 1 1 0 −2 0
d d d d
dX (p 1 ), dX (p 2 ), dX (p 3 ), dX (p 4 ) der Reihe nach als Folglich ist das Inverse von S:
Linearkombinationen von p1 , p2 , p3 , p4 darstellen: ⎛ ⎞
0 0 0 1
d ⎜−2 − 2 13
(p 1 ) = 3 X 2 + 6 = p 2 + p3 , 4⎟
dX S =⎜
−1
⎝ 1 1 −5
3 3 ⎟
3 3 −2⎠
d
(p2 ) = 2 X − 1 = −X + (3 X − 1) 1 0 −2 0
dX
1 2 1 d
Die Darstellungsmatrix von dX bezüglich der Standard-
= − (p3 − 2 p 2 ) − p4 = p 2 − p3 − p4 ,
3 3 3 basis E ist einfach zu bestimmen:
d ⎛ ⎞
(p 3 ) = 4 X + 1 = 7 X + (−3 X + 1) ' ( 0 1 0 0
dX d ⎜0 0 2 0⎟
7 14 7 EM E =⎝
⎜ ⎟
= (p3 − 2 p2 ) + p4 = − p2 + p3 + p4 , dX 0 0 0 3⎠
3 3 3 0 0 0 0
d
(p4 ) = −3 = −9 X + (9 X − 3) Damit bleibt nun folgende Rechnung auszuführen:
dX
' ( ' (
= −3 (p3 − 2 p2 ) − 3 p4 = 6 p 2 − 3 p 3 − 3 p4 . d −1 d
B M B = S E M S.
Folglich ist dX dX E
' ( Wir multiplizieren zuerst die beiden hinteren Matrizen und
d ' (
d d d d
B M B = B dX (p1 ), B dX (p2 ), B dX (p3 ), B dX (p4 ) erhalten dann
dX ' (
⎛ ⎞ d
0 0 0 0 BM B =
⎜1 2 − 14 6 ⎟ dX
=⎜ 3 3 ⎟ ⎛ ⎞⎛ ⎞
⎝1 − 1 7 −3⎠ 0 0 0 1 6 −1 1 −3
3 3
0 −1 1 −3 ⎜−2 − 2 13
4⎟ ⎜ ⎟
=⎜ 3 3 ⎟ ⎜0 2 4 0 ⎟
⎝ 1 1 − 5 −2⎠ ⎝3 0 0 0 ⎠
2. Lösungsweg mit der Transformationsformel: Da wir die 3 3
Inverse von S = E M(ϕ)B brauchen, um die Transforma- 1 0 −2 0 0 0 0 0
tionsformel anwenden zu können, starten wir gleich mit d
=E M dX ES
der Berechnung von S −1 – die Zwischenschritte lassen ⎛ ⎞
0 0 0 0
wir jedoch aus: ⎜1 2 − 14 6⎟
⎛ ⎞ =⎜ 3
⎝1 − 1 7
3 ⎟
0 2 4 1 1 0 0 0 3 3 −3⎠
⎜ 6 −1 1 −3 0 1 0 0 ⎟ 0 −1 1 −3
(S | E 4 ) = ⎜ ⎟
⎝ 0 1 2 0 0 0 1 0 ⎠ → ...
Natürlich erhalten wir wieder die gleiche Matrix wie beim
1 0 0 0 0 0 0 1 ersten Lösungsweg.
460 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Zu jeder Basis B von V gibt es eine Dualbasis Im endlichdimensionalen Fall ist B ∗ aber eine Basis von V ∗ :
B ∗ von V ∗
Satz von der Dualbasis
Ist B eine Basis des K-Vektorraums V , so lässt sich jeder
Ist B eine Basis des K-Vektorraums V , so gilt:
Vektor v ∈ V eindeutig darstellen als
(i) B ∗ ⊆ V ∗ ist linear unabhängig.
!
v= λb b , (ii) Im Fall dim V ∈ N0 ist B ∗ eine Basis von V ∗ , ins-
b∈B besondere gilt V ∼ = V ∗.
wobei nur endlich viele der Koeffizienten λb ungleich null
sind. Nun ordnen wir jedem Basiselement b ∈ B eine Line- Beweis: Im Fall B = ∅ gilt B ∗ = ∅, sodass alle Behaup-
arform b∗ zu: tungen richtig sind. Wir setzen nun B = ∅ voraus.
V → K,
b∗ : , (i) Es seien b1 , . . . , bn ∈ B verschiedene Elemente der mög-
v → λb ,
licherweise unendlichen Menge B und
wobei λb eben der Koeffizient von b in der eindeutig be-
stimmten Darstellung von v = b∈B λb b bezüglich der Ba- ϕ = λ1 b∗1 + · · · + λn b∗n = 0
sis B ist.
mit λ1 , . . . , λn ∈ K. Wir setzen auf beiden Seiten die Basis-
Beispiel elemente b1 , . . . , bn ein:
Im Fall V = K3 ist (e1 , e2 , e3 ) eine geordnete Basis, und
es gilt:
ϕ(bi ) = λ1 b∗1 (bi ) + · · · + λn b∗n (bi ) = 0(bi ) = 0.
⎛⎛ ⎞⎞ ⎛⎛ ⎞⎞ ⎛⎛ ⎞⎞
1 1 1
e∗1 ⎝⎝2⎠⎠ = 1, e∗2 ⎝⎝2⎠⎠ = 2, e∗3 ⎝⎝2⎠⎠ = 3 . Wegen λ1 b∗1 (bi )+· · ·+λn b∗n (bi ) = λi für alle i = 1, . . . , n
3 3 3 erhalten wir
λ 1 = · · · = λn = 0 .
Im Fall V = R[X] ist (1, X, X 2 , . . .) eine geordnete
Basis, und es gilt für das Polynom p = 2 + 3 X2 : Somit ist jede endliche Teilmenge {b∗1 , . . . , b∗n } von B ∗ li-
near unabhängig, also auch B ∗ .
(1)∗ = 2 , (X)∗ = 0 , (X2 )∗ = 3 , (X3 )∗ = 0 , . . .
(ii) Es ist zu zeigen, dass B ∗ im Fall dim V ∈ N ein Erzeu-
Für jede Basis B eines K-Vektorraums V nennt man die gendensystem von V ∗ ist. Es sei dazu ϕ ∈ V ∗ gegeben. Für
Menge jedes b ∈ B setzen wir
B ∗ = {b∗ | b ∈ B} ⊆ V ∗
λb = ϕ(b) ∈ K
die Dualbasis zu B, für je zwei Elemente b, b ∈ B gilt
1 , falls b = b , und betrachten nun die Linearform
b∗ (b ) = δb,b =
0 , sonst. !
ψ= λb b∗ ∈ -B ∗ . .
b∈B
Zu jeder linearen Abbildung gibt es eine duale Anstelle von (V ∗ )∗ schreiben wir einfacher V ∗∗ und nennen
Abbildung diesen K-Vektorraum den Bidualraum zu V . Ein Element
ψ des Bidualraums zu V ordnet damit jeder Linearform ϕ
Zu jedem Vektorraum gibt es den Dualraum, zu jeder Basis von V jeweils ein Körperelement ψ(ϕ) zu,
die Dualbasis. Es wundert nun nicht mehr, dass wir auch ∗
V → K,
zu jeder linearen Abbildung zwischen Vektorräumen eine ψ:
ϕ → ψ(ϕ).
duale Abbildung angeben können. Zu einer linearen Abbil-
dung ϕ : V → W erklären wir die Abbildung
∗ Satz vom Bidualraum
∗ W → V ∗,
ϕ : Es sei V ein K-Vektorraum. Die Abbildung
ψ → ψ ◦ ϕ.
⎧ ∗∗
Man nennt diese lineare Abbildung ϕ ∗ die zu ϕ duale Ab- ⎨V → V ∗ ,
bildung. : V → K,
⎩ v → (v) :
ϕ → ϕ(v)
Die duale Abbildung ϕ ∗ ordnet also jeder Linearform aus
W ∗ eine Linearform aus V ∗ zu. Die Linearform aus V ∗ wird ist linear und injektiv. Im Fall dim V ∈ N0 ist auch
dabei durch ihre Wirkung auf einen Vektor aus V definiert: surjektiv und somit ein Isomorphismus.
ϕ ∗ (ψ) angewandt auf v ist per Definitionem gleich ψ(ϕ(v)).
Beispiel Zu einer Matrix A ∈ Km×n betrachten wir die Beweis: Die Abbildung (v) ist linear: Sind ϕ, ψ ∈ V ∗
lineare Abbildung und λ ∈ K, so gilt:
n
K → Km , (v)(λ ϕ + ψ) = (λ ϕ + ψ)(v) = λ ϕ(v) + ψ(v)
ϕA :
v → A v. = λ (v)(ϕ) + (v)(ψ) .
Jede Linearform ψ ∈ (Km )∗ ist durch einen Zeilenvektor
zψ ∈ K1×m gegeben (beachte das Beispiel auf Seite 458): Die Abbildung ist linear: Sind v, w ∈ V und λ ∈ K, so
gilt für alle ϕ ∈ V ∗ :
ψ(v) = zψ v , d. h. ψ = ϕzψ .
(λ v + w)(ϕ) = ϕ(λ v + w) = λ ϕ(v) + ϕ(v)
∗ : (Km )∗ → (Kn )∗
Somit ist die zu ϕA duale Abbildung ϕA = λ (v)(ϕ) + (w)(ϕ) .
gegeben durch
n Die Abbildung ist injektiv: Es sei (v) = 0 für ein v ∈ V .
∗ K → K,
ϕA (ψ) : Dann gilt ϕ(v) = 0 für alle ϕ ∈ V ∗ . Angenommen v = 0.
v → zψ A v.
Aufgrund des Basisergänzungssatzes können wir die linear
Wir bezeichnen mit En∗ und Em ∗ die Dualbasen zu den kano- unabhängige Menge {v} zu einer Basis B von V ergänzen.
nischen Basen En und Em von Kn und Km . Die i-te Spalte Mit der Linearform v ∗ ∈ B ∗ gilt dann v ∗ (v) = 1 – ein
der Darstellungsmatrix En∗ M(ϕA∗ ) ∗ von ϕ ∗ bezüglich dieser Widerspruch. Somit muss v = 0 gelten. Mit dem Injekti-
Em A
Dualbasen ist wegen ze∗i = (0, . . . , 1, . . . , 0) = e0
i
vitätskriterium von Seite 427 folgt hieraus die Injektivität
von .
∗ ∗
En∗ ϕA (ei ) = En∗ (e∗i ◦ ϕA ) = En∗ (ϕe0 ◦ ϕA )
i Gilt nun darüber hinaus dim V = n ∈ N0 , so erhalten wir
= En∗ (ϕe0 A ) = En∗ (ϕ(ai1 ... ain ) ) mit obigem Satz
i
⎛ ⎞
ai1 dim V = dim V ∗ = dim V ∗∗ .
⎜ ⎟
= ⎝ ... ⎠ .
Damit folgt die Surjektivität von in diesem Fall mit dem
ain Bijektivitätskriterium von Seite 430.
Somit gilt
∗ ∗
En∗ M(ϕA )Em = A0 . Achtung: Im Fall dim V = ∞ ist die im Satz zum Bi-
dualraum angegebene injektive Abbildung nicht surjektiv,
beachte das folgende Beispiel.
Der Dualraum zum Dualraum ist der Beispiel Ist B eine Basis eines unendlichdimensionalen K-
Bidualraum Vektorraums V , so ist B ∗ eine linear unabhängige Teilmenge
von V ∗ (beachte den Satz zur Dualbasis auf Seite 460). Wir
Für jeden K-Vektorraum V ist V ∗ wieder ein K-Vektorraum. können die linear unabhängige Menge B ∗ mit dem Basis-
Daher können wir den Dualraum zum Dualraum V ∗ bilden. ergänzungssatz zu einer Basis von V ∗ ergänzen. Nach dem
462 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
Prinzip der linearen Fortsetzung gibt es somit eine lineare mit nur endlich vielen λb ∈ K \ {0}, mit ϕ = (v). Wegen
Abbildung ϕ mit
(v)(b∗ ) = b∗ (v) = λb
ϕ(b∗ ) = 1 für alle b∗ ∈ B ∗ . (∗)
Somit gilt ϕ ∈ V ∗∗ . Angenommen, ϕ ∈ (V ). Dann exis- nimmt (v) nur für endliche viele b∗ von null verschiedene
tiert ein v ∈ V , ! Werte an. Das ist ein Widerspruch zu (∗).
v= λb b ,
b∈B
Zusammenfassung
Eine Abbildung zwischen K-Vektorräumen heißt linear, falls Der Kern und das Bild einer linearen Abbildung
sie additiv und homogen ist, genauer:
Ist ϕ eine lineare Abbildung von einem K-Vektorraum
V in einen K-Vektorraum W , so nennt man
Definition einer linearen Abbildung
Eine Abbildung ϕ : V → W zwischen K-Vektorräumen ker ϕ = ϕ −1 ({0}) = {v ∈ V | ϕ(v) = 0} ⊆ V
V und W heißt K-lineare Abbildung oder Homomor-
phismus, wenn für alle v, w ∈ V und λ ∈ K gilt: den Kern von ϕ und
ϕ(v + w) = ϕ(v) + ϕ(w) (Additivität),
ϕ(λ v) = λ ϕ(v) (Homogenität). Bild ϕ = ϕ(V ) = {ϕ(v) | v ∈ V } ⊆ W
Eine lineare Abbildung nennt man im Fall V = W auch Im Fall dim V = dim W können wir hieraus folgern, dass
Endomorphismus, man schreibt dann EndK (V ) anstelle von eine Abbildung schon dann bijektiv ist, wenn sie injektiv
Hom K (V , V ). In diesem Fall ist stets auch ψ ◦ ϕ und ϕ ◦ ψ oder surjektiv ist. Eine weitere Folgerung aus der Dimen-
für alle Elemente ϕ, ψ ∈ EndK (V ) erklärt und es gilt: sionsformel ist, dass der Zeilen- und der Spaltenrang einer
Matrix stets gleich sind.
Der Endomorphismenring EndK (V )
Ist B = (b1 , . . . , bn ) eine geordnete Basis eines K-Vektor-
Die Menge raums V , so besitzt jedes v ∈ V genau eine Darstellung
EndK (V ) = HomK (V , V )
v = v1 b1 + · · · + vn bn
aller Endomorphismen von V ist mit punktweiser Addi- ⎛ ⎞
v1
tion + und der Multiplikation ◦ ein Ring mit Einselement ⎜ ⎟
id. mit v1 , . . . , vn ∈ K. Es heißt B v = ⎝ ... ⎠ ∈ Kn der Koor-
vn
Zu jeder linearen Abbildung ϕ : V → W gehört der Kern dinatenvektor von v bezüglich B. Hierdurch wird eine Ab-
und das Bild von ϕ; der Kern ist ein Untervektorraum von V bildung von V in den Kn erklärt, für diese Abbildung gilt der
und das Bild ist ein solcher von W . zentrale Satz:
Zusammenfassung 463
Jeder n-dimensionale K-Vektorraum ist zum Kn iso- Wir treiben diese Isomorphie noch weiter, indem wir eine
morph Multiplikation von Matrizen einführen, sodass die Komposi-
tion von linearen Abbildungen mit dieser Multiplikation ver-
Ist B = (b1 , . . . , bn ) eine geordnete Basis des n-di-
träglich ist in dem Sinne, dass das Produkt der Matrizen die
mensionalen K-Vektorraums V , so ist die Abbildung
Darstellungsmatrix des Produktes der linearen Abbildungen
ist. Dabei stellt sich heraus, dass die Zeilen der ersten Ma-
V → Kn ,
ϕ: trix mit den Spalten der zweiten Matrix multipliziert werden
v → B v
müssen. Man erhält dann:
eine bijektive und lineare Abbildung, d. h. ein Isomor-
phismus. Der Endomorphismenring ist zum Matrizenring iso-
morph
Durch diesen Satz können wir jeden endlich-dimensionalen Die Menge Kn×n aller n×n-Matrizen bildet mit der Ad-
K-Vektorraum V , etwa dim V = n, als den Kn auffas- dition + und Multiplikation · von Matrizen einen Ring
sen. In einem weiteren Schritt bildet man dann die Darstel- mit Einselement En , und für jeden n-dimensionalen K-
lungsmatrix A einer linearen Abbildung ϕ zwischen endlich- Vektorraum V gilt:
dimensionalen Vektorräumen V und W und erhält damit eine
konkrete Beschreibung der linearen Abbildung ϕ: EndK (V ) ∼
= Kn×n .
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
⎛ ⎞
Verständnisfragen 0 1 1
12.6 •• Zeigen Sie, dass für M = ⎝1 0 1⎠ gilt:
12.1 • Für welche u ∈ R2 ist die Abbildung 1 1 0
2
R → R2 , M n = an M + bn E3
ϕ:
v → v + u
und bestimmen Sie eine Rekursionsformel für an und bn .
linear?
12.7 • Wir betrachten die lineare Abbildung ϕ :
12.2 • Gibt es eine lineare Abbildung ϕ : R2 → R2 R4 → R4 , v → A v mit der Matrix
mit ⎛ ⎞
3 1 1 −1
(a) ⎜1 3 −1 1⎟
'' (( ' ( '' (( ' ( '' (( ' ( A=⎜
⎝1
⎟
2 2 2 1 6 4 −1 3 1⎠
ϕ = ,ϕ = ,ϕ = −1 1 1 3
3 2 0 1 3 3
bzw. Gegeben sind weiter die Vektoren
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
(b) 1 1 4
'' (( ' ( '' (( ' ( '' (( ' ( ⎜1⎟ ⎜−1⎟ ⎜4⎟
ϕ
1
=
2
,ϕ
2
=
1
,ϕ
5
=
4
? a=⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝1⎠ , b = ⎝−1⎠ und c = ⎝4⎠ .
3 1 0 1 3 3
1 1 4
12.3 • Folgt aus der linearen Abhängigkeit der Zeilen (a) Berechnen Sie ϕ(a) und zeigen Sie, dass b im Kern von
einer reellen 11 × 11-Matrix A die lineare Abhängigkeit der ϕ liegt. Ist ϕ injektiv?
Spalten von A? (b) Bestimmen Sie die Dimensionen von Kern und Bild der
linearen Abbildung ϕ.
Rechenaufgaben (c) Bestimmen Sie Basen des Kerns und des Bildes von ϕ.
(d) Bestimmen Sie die Menge L aller v ∈ R4 mit ϕ(v) = c.
12.4 • Welche der folgenden Abbildungen sind linear ?
⎧ 2
⎨ 'R ( → ' R2 , ( 12.8 • Wir betrachten den reellen Vektorraum R[X]3
(a) ϕ1 : v v2 − 1 aller Polynome über R vom Grad kleiner oder gleich 3, und es
⎩ 1 → d
: R[X]3 → R[X]3 die Differenziation. Weiter
v2 −v1 + 2 bezeichne dX
⎧ 2
⎪ R → ⎛ R3 , sei E = (1, X, X 2 , X3 ) die Standardbasis von R[X]3 .
⎪
⎨' ( ⎞
13 v2 d
(a) Bestimmen Sie die Darstellungsmatrix E M( dX )E .
(b) ϕ2 : v1
⎪
⎪ → ⎝ 11 v1 ⎠ d
⎩ v2 (b) Bestimmen Sie die Darstellungsmatrix B M( dX )B
−4 v2 − 2 v1
⎧ 2 d
von dX bezüglich der geordneten Basis B =
⎪
⎪ R → ⎛ R3 , ⎞
⎨' ( (X3 , 3 X 2 , 6 X, 6) von R[X]3 .
v1
(c) ϕ3 : v1 ⎝ −v 2 v2 ⎠
⎪
⎪ → 12.9 •• Gegeben sind die geordnete
⎩ v2 1
⎛⎛ ⎞ ⎛ Standardbasis
⎞ ⎛ ⎞⎞
v2 − v1 '' ( ' (( 1 1 1
1 0
E2 = , des R2 , B = ⎝⎝1⎠ , ⎝1⎠ , ⎝0⎠⎠
12.5 • Welche Dimensionen haben Kern und Bild der 0 1
1 0 0
folgenden linearen Abbildung? ⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
⎧ 2 1 1 1 1
⎨ 'R ( → ' R2 , ( ⎜⎜1⎟ ⎜1⎟ ⎜1⎟ ⎜0⎟⎟
des R3 und C = ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝1⎠ , ⎝1⎠ , ⎝0⎠ , ⎝0⎠⎠ des R .
4
ϕ: v v1 + v2
⎩ 1 → .
v2 v1 + v2 1 0 0 0
Aufgaben 465
Nun betrachten wir zwei lineare Abbildungen ϕ : R2 → R3 (b) Zeigen Sie, dass
und ψ : R3 → R4 definiert durch '
⎛ ⎞ X(X − 1)
'' (( v1 − v2 B = 1, X, ,
v1 2
ϕ = ⎝ 0 ⎠ und (
v2 X(X − 1)(X − 2) X(X − 1)(X − 2)(X − 3)
2 v1 − v2 ,
⎛ ⎞ 6 24
⎛⎛ ⎞⎞ v1 + 2 v 3
v1 ⎜ v 2 − v3 ⎟ eine geordnete Basis von R[X]4 ist, und berechnen Sie
ψ ⎝⎝v2 ⎠⎠ = ⎜ ⎟ die Darstellungsmatrix B M(6)B von 6 bezüglich B.
⎝ v 1 + v2 ⎠ .
v3 (c) Angenommen, Sie sollten auch noch die Darstellungs-
2 v1 + 3 v3
matrizen der Endomorphismen 62 , 63 , 64 , 65 berech-
Bestimmen Sie die Darstellungsmatrizen B M(ϕ)E2 , nen – es bedeutet hierbei 6k = 6 ◦ · · · ◦ 6 – Ihnen sei
C M(ψ)B und C M(ψ ◦ ϕ)E2 . k-mal
dafür aber die Wahl der Basis von R[X]4 freigestellt.
12.10 •• Gegeben ist eine lineare Abbildung ϕ : Welche Basis würden Sie nehmen? Begründen Sie Ihre
R3 → R3. Die Darstellungsmatrix von ϕ bezüglich der ge- Wahl.
ordneten Standardbasis E3 = (e1 , e2 , e3 ) des R3 lautet:
⎛ ⎞
4 0 −2 Beweisaufgaben
E3 M(ϕ)E3 = ⎝1 3 −2⎠ ∈ R3×3 .
1 2 −1 12.13 •• Es seien K ein Körper, V ein endlichdimensio-
naler K-Vektorraum, ϕ1 , ϕ2 ∈ EndK (V ) mit ϕ1 + ϕ2 = idV .
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
2 1 2 Zeigen Sie:
(a) Zeigen Sie: B = ⎝⎝2⎠ , ⎝1⎠ , ⎝1⎠⎠ ist eine geord-
(a) dim(Bild ϕ1 ) + dim(Bild ϕ2 ) ≥ dim(V ).
3 1 1
3 (b) Falls „=“ in (a) gilt, so ist
nete Basis des R .
(b) Bestimmen Sie die Darstellungsmatrix B M(ϕ)B
ϕ1 ◦ ϕ1 = ϕ1 ,
und die Transformationsmatrix S mit B M(ϕ)B =
S −1 E3 M(ϕ)E3 S. ϕ2 ◦ ϕ2 = ϕ2 ,
ϕ1 ◦ ϕ2 = ϕ2 ◦ ϕ1 = 0 ∈ EndK (V ).
12.11 •• Gegeben sind zwei geordnete Basen A und B
des R3
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞ 12.14 •• Wenn A eine linear unabhängige Menge eines
8 −16 9 K-Vektorraums V und ϕ ein injektiver Endomorphismus von
A = ⎝⎝ −6 ⎠ , ⎝ 7 ⎠ , ⎝ −3 ⎠⎠ V ist, ist dann auch A = {ϕ(v) | v ∈ A} linear unabhängig ?
7 −13 7
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
1 3 2 12.15 ••• Gegeben ist eine lineare Abbildung ϕ : R2 →
B = ⎝⎝ −2 ⎠ , ⎝ −1 ⎠ , ⎝ 1 ⎠⎠ R2 mit ϕ ◦ ϕ = idR2 (d. h., für alle v ∈ R2 gilt ϕ(ϕ(v)) = v),
1 2 2 aber ϕ = ±idR2 (d. h. ϕ ∈ {v → v, v → −v}). Zeigen Sie:
und eine lineare Abbildung ϕ : R3 → R3 , die bezüglich der (a) Es gibt eine Basis B = {b1 , b2 } des R2 mit ϕ(b1 ) = b1 ,
Basis A die folgende Darstellungsmatrix hat ϕ(b2 ) = −b2 .
(b) Ist B = {a 1 , a 2 } eine weitere Basis mit der in (a) an-
⎛ ⎞
1 −18 15 gegebenen Eigenschaft, so existieren λ, μ ∈ R \ {0} mit
A M(ϕ)A = ⎝−1 −22 15⎠ a 1 = λ b1 , a 2 = μ b 2 .
1 −25 22
12.16 •• Es seien K ein Körper und n ∈ N. In
(a) Bestimmen Sie die Darstellungsmatrix B M(ϕ)B von ϕ
dem K-Vektorraum V = Kn seien die Unterräume U =
bezüglich der geordneten Basis B.
-u1 , . . . , ur . und W = -w1 , . . . , wt . gegeben. Weiter seien
(b) Bestimmen Sie die Darstellungsmatrizen A M(ϕ)B und
m = r + t und
B M(ϕ)A .
⎛ ⎞
u1 u1
12.12 ••• Es bezeichne 6 : R[X]4 → R[X]4 den durch ⎜ .. .. ⎟
6(f ) = f (X + 1) − f (X) erklärten Differenzenoperator. ⎜ .
⎜ . ⎟
⎟
⎜ ur ur ⎟ ⎟ ∈ Km×2n
(a) Zeigen Sie, dass 6 linear ist, und berechnen Sie die Dar- A=⎜
⎜ w1
⎜ 0 ⎟ ⎟
stellungsmatrix E M(6)E von 6 bezüglich der kanoni- ⎜ . .. ⎟
schen Basis E = (1, X, X 2 , X3 , X4 ) von R[X]4 sowie ⎝ .. . ⎠
die Dimensionen des Bildes und des Kerns von 6. wt 0
466 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen
(wobei die ui , wi als Zeilen geschrieben sind). Zeigen Sie: U = -(0, 1, 0, −1)0 , (1, 0, 1, −2)0, (−1, −2, 0, 1)0 .
Bringt man A durch elementare Zeilenumformungen auf die W = -(−1, 0, 1, 0)0 , (1, 0, −1, −1)0 , (2, 0, −1, 0)0 .
Form ⎛ ⎞
v1 " des R-Vektorraums V = R4 gegeben.
⎜ .. .. ⎟
⎜ . . ⎟
⎜ ⎟ 12.18 ••• Für A, B ∈ Kn×n sei En − A B invertierbar.
⎜ vl " ⎟
A =⎜
⎜ 0 y1 ⎟ ,
⎟
Zeigen Sie, dass dann auch En − B A invertierbar ist und
⎜ ⎟
⎜ . .. ⎟ bestimmen Sie das Inverse.
⎝ .. . ⎠
0 y m−l 12.19 ••• Es sei A ∈ Km×n und B ∈ Kn×p . Zeigen Sie:
wobei v 1 , . . . , v l paarweise verschieden und linear unab-
rg(A B) = rg(B) − dim(ker A ∩ Bild B) .
hängig sind, so ist {v 1 , . . . , v l } eine Basis von U + W und
-y 1 , . . . , y m−l . = U ∩W . Zeigen Sie weiter: Ist dim(U ) = r
und dim(W ) = t, so ist {y 1 , . . . , y m−l } eine Basis von 12.20 •• Zeigen Sie: Sind A und A zwei n×n-Matrizen
U ∩ W. über einem Körper K, so gilt
A A = En ⇒ A A = En .
12.17 • Bestimmen Sie eine Basis von U ∩ W . Dabei
seien die beiden Untervektorräume Insbesondere ist A = A−1 das Inverse der Matrix A.
S. 418 S. 427
λ v ) = λ ϕ(v) wäre bei verschiede-
Die Gleichung ϕ(
Die erste Abbildung ist injektiv. Die zweite Abbildung ist im
∈V ∈W Fall V = {0} injektiv, im Fall V = {0} ist sie nicht injektiv.
nen Körpern nicht immer sinnvoll. Wäre etwa V ein C- Die dritte Abbildung ist nicht injektiv. Die vierte Abbildung
Vektorraum und W ein R-Vektorraum, so würde λ = i die ist im Fall rg A = n injektiv, im Fall rg A = n ist sie nicht in-
Homogenität unmöglich machen. jektiv. Die fünfte Abbildung ist nicht injektiv. Man betrachte
jeweils den Kern der linearen Abbildung.
S. 420
Ja, man schreibe v − w = v + (−1) w. S. 428
Nein, man beachte die Dimensionsformel: Ist ϕ surjektiv, so
S. 422
gilt dim(ϕ(R11 )) = 7. Wäre dim(ϕ −1 ({0})) = 5, so folgte
Ja, man wähle die lineare Fortsetzung von σ mit σ (e 1 ) = e2
mit der Dimensionsformel 11 = 5 + 7, ein Widerspruch.
und σ (e2 ) = 0.
S. 435
S. 423
Ja. Die Darstellungsmatrix ist dann eine Spalte, wenn man
Ja, beachte den Satz zur Komposition bijektiver Abbildungen
eine Abbildung vom eindimensionalen K-Vektorraum K in
auf Seite 49.
einen n-dimensionalen K-Vektorraum hat, z. B.
S. 423 ⎛ ⎞
v
Das Inverse ist ϕ −1 ◦ ψ −1 wegen ϕ −1 ◦ ψ −1 ◦ ψ ◦ ϕ = id = ⎜0 ⎟
ψ ◦ ϕ ◦ ϕ −1 ◦ ψ −1 . ⎜ ⎟
ϕ : v → ⎜ . ⎟ .
⎝ .. ⎠
S. 426 ' (
v 0
Es sei 1 ∈ R2 . Dann gilt:
v2 Und sie ist dann eine Zeile, wenn man eine Abbildung von
⎛⎛ ⎞⎞ einem n-dimensionalen K-Vektorraum in den eindimensio-
v1 − v2 ' (
v nalen K-Vektorraum K hat, z. B.
ϕ ⎝⎝ v2 ⎠⎠ = 1 , ⎛ ⎞
v2 v1
0
⎜ .. ⎟
ϕ : ⎝ . ⎠ → v1 .
somit gilt ϕ(R3 ) = R2 .
vn
S. 427
Im endlichdimensionalen Fall schon, als Maß scheint die Di- S. 435
mension zu dienen. Dass dem tatsächlich so ist, wird die Dort sind V = Kn , W = Km und B und C die jeweiligen
Dimensionsformel zeigen. Standardbasen.
Antworten der Selbstfragen 467
S. 437 S. 451
Der Kern ist der eindimensionale Untervektorraum -n. des Nein. E2 und −E2 sind invertierbar, die Summe aber nicht.
R3 , und das Bild ist die zweidimensionale Ebene E als Un-
tervektorraum des R3 . S. 451
Die dritte Zeile.
S. 437
Das bedeutet, dass C = B gilt. S. 451
An der Stelle (1, 2) – es geht aber auch die Stelle (3, 2).
S. 442
Wegen der obigen Isomorphie HomK (V , W ) ∼
= Km×n gilt S. 453
Weil P 2 bedeutet, dass zwei Mal vertauscht wird, damit wird
dim HomK (V , W ) = dim Km×n = m n = dim V dim W . die ursprüngliche Vertauschung gerade rückgängig gemacht.
S. 455
S. 443 Nur En selbst, da für jedes invertierbare S ∈ Kn×n gilt:
Nein. Es reicht A ∈ Km×n und B ∈ Kn×m .
S En S −1 = En .
S. 444
Weil sonst das Produkt nicht definiert ist.
S. 457
S. 446 ' ( ' ( ' ( Eine Matrix ist genau dann invertierbar, wenn die Spalten-
1 0 0 0 0 0 vektoren linear unabhängig sind. Damit hat man für die ers-
Nein, wir wählen A = ,B = und C = .
0 0 1 0 1 1 te Spalte die drei möglichen vom Nullvektor verschiedenen
Hiermit gilt Vektoren des Z22 zur Auswahl. Für die zweite Spalte hat man
jeweils noch zwei mögliche, von der ersten Spalte linear un-
A C = 0 = B C und A = B . abhängige Vektoren zur Auswahl. Insgesamt erhält man die
angegebenen sechs Matrizen, die invertierbar sind.
S. 448 S. 460
Wegen Es ist
ϕA ◦ ϕB = ϕA B
V → V ∗,
ist : λb b → λb b∗
−1 b∈B b∈B
ϕA B = ϕ(A B )−1 = ϕB −1 A−1 = ϕB −1 ◦ ϕA−1
Zu jeder quadratischen Matrix A über einem Körper K gibt es Die Elemente aus Sn sind die Permutationen
eine Kenngröße – ihre Determinante. Diese Zahl aus K gibt der Zahlen 1, . . . , n
Aufschluss über Eigenschaften der Matrix. So ist etwa eine
Matrix A genau dann invertierbar, wenn ihre Determinante von Wir erinnern kurz an die symmetrische Gruppe (Sn , ◦) aller
null verschieden ist. Und genau diese Eigenschaft ist es, welche Bijektionen der endlichen Menge
die Determinante so wertvoll macht.
In = {1, . . . , n} ⊆ N
Die Determinante hat viele weitere Anwendungen. Mit ihrer
Hilfe kann man lineare Gleichungssysteme lösen, das Inverse (siehe Seite 67). Die Menge Sn ist gegeben durch:
einer Matrix bilden, n-dimensionale Volumina berechnen, und
selbst beim Interpolationsproblem liefert sie eine Existenz- und Sn = {σ : In → In | σ ist bijektiv} .
Eindeutigkeitsaussage. Aber tatsächlich sind diese Anwendun-
gen im Allgemeinen mit effizienteren Methoden realisierbar. Der Die Elemente von Sn nennt man Permutationen. Die Ver-
Nutzen der Determinante innerhalb der linearen Algebra liegt im knüpfung ◦ der Gruppe Sn ist die Hintereinanderausführung
Wesentlichen in der Bestimmung der Eigenwerte einer Matrix – der Permutationen
das ist ein Thema des nächsten Kapitels. Die Determinante wird
uns auch in der Analysis wieder begegnen, sie ist etwa bei der In → In ,
τ ◦σ:
mehrdimensionalen Integration eine Art Skalierungsfaktor bei i → τ (σ (i)).
der Koordinatentransformation.
Wir definieren die Determinante durch eine explizite Formel Jede Permutation σ ∈ Sn lässt sich übersichtlich in der Form
– die sogenannten Leibniz’sche Formel. Diese Formel ist –
außer für die Fälle von zwei- und dreireihigen Matrizen – für σ : (1, 2, . . . , n) → (σ (1), σ (2), . . . , σ (n))
die Berechnung ungeeignet, da die Zahl der zu addierenden
darstellen. Links stehen die Elemente von In in der natürli-
Ausdrücke mit der Reihenzahl der Matrix enorm schnell wächst.
chen Reihenfolge und rechts die jeweiligen Bilder der Ele-
Wir leiten Methoden und Formeln her, die es gestatten, die
mente aus In unter der Bijektion σ , also alle n Elemente aus
Determinante einer n × n-Matrix für n ∈ N auf die Bestimmung
In in der durch σ festgelegten Reihenfolge.
der Determinanten einer Summe von (n−1)×(n−1) -Matrizen
zurückzuführen. So fortfahrend gelangen wir zu der Aufgabe, Weil σ eine Bijektion ist, hat man nach Festlegung von
Determinanten von möglicherweise zahlreichen 2 × 2-Matrizen σ (1) ∈ {1, . . . , n} für das Element σ (2) die n − 1 verschie-
zu berechnen. Durch trickreiches Rechnen bleibt die Bestimmung denen Möglichkeiten aus {1, . . . , n}\{σ (1)}. So fortfahrend
der Determinante auch einer großen Matrix übersichtlich. erkennt man:
Determinante |Sn | = n !
Wie auf Seite 73 gezeigt, kann man das Signum einer Permu- die Determinante von A.
tation σ ∈ Sn durch die Anzahl f der Fehlstände bestimmen.
Es gilt nämlich:
Anstelle von det(A) schreibt man auch etwas kürzer det A
sgn(σ ) = (−1)f . oder |A|.
Die Formel wirkt sehr kompliziert. Daher ist es angebracht,
Dabei spricht man vom Fehlstand (σ (i), σ (j )), wenn für das
auf die einzelnen Symbole und Details einzugehen:
Paar (i, j ) von Indizes aus In einerseits i < j und anderer-
seits σ (i) > σ (j ) gilt. Ist σ ∈ Sn , so ist σ (i) ∈ {1 . . . , n}, und ai σ (i) ist der
Eintrag an der Stelle (i, σ (i)) der Matrix A.
Eine Permutation aus Sn , die zwei verschiedene Zahlen i und
Ist σ ∈ Sn , so wird bei den Faktoren des Produkts
Bildet man die Summen über die geraden und ungeraden Formel kaum für Berechnungen der Determinanten mehrrei-
Permutationen getrennt, so erhält man higer Matrizen. Selbst Computer-Algebra-Systeme benutzen
andere Methoden.
!
n !
n
det(A) = ai σ (i) − ai σ (i) .
σ ∈An i=1 σ ∈Sn \An i=1 Wie schon auf Seite 240 festgestellt, kann man sich die For-
Wenn wir die n ! Permutationen aus Sn durchnummerie- mel zur Berechnung der Determinante einer 2 × 2-Matrix
ren, leicht merken. Die Determinante ist die Differenz der Pro-
Sn = {σ1 , . . . , σn! } , dukte der Diagonalen, kurz Hauptdiagonale minus Neben-
diagonale:
so können wir die Summenformel für die Determinante
⎛ ⎞
auch wie folgt schreiben: ) ) + −
)a11 a12 ) a12 ⎠
) ) = ⎝ a11
!
n!
n )a21 a22 )
a 21 a22
det(A) = sgn(σk ) ai σk (i)
k=1 i=1
n
n
Auch die Formel zur Berechnung der Determinante einer
= sgn(σ1 ) ai σ1 (i) + · · · + sgn(σn! ) ai σn! (i)
3 × 3-Matrix kann man schematisch darstellen in der bereits
i=1 i=1
auf Seite 243 vorgestellten Regel von Sarrus:
= sgn(σ1 ) a1 σ1 (1) · · · an σ1 (n) + · · ·
⎛ ⎞
· · · + sgn(σn! ) a1 σn! (1) · · · an σn! (n) . ) )
) a11 a12 a13 ) +a13 +a11 + −
a12
−
a13 ⎟ a11
−
) ) ⎜
) a21 a22 a23 ) = ⎜ ⎟
) ) a23 ⎝ a21 a22 a23 ⎠ a21
Beispiel ) a31 a32 a33 )
Im Fall n = 1 gilt S1 = {id }, sodass wegen sgn(id ) = 1 a33 a31 a32 a33 a31
für jede Matrix A = (a11 ) ∈ R 1×1 gilt:
!
1 Achtung: Für die Berechnung von 4- oder mehrreihigen
det(A) = sgn(σ ) ai σ (i) = 1 · a11 = a11 . Determinanten gibt es keine ähnlich einfachen Merkregeln.
σ ∈S1 i=1 Man berechnet 4- oder mehrreihige Determinanten mit Me-
thoden, die wir erst noch auf den folgenden Seiten entwickeln
Im Fall n = 2 gilt S2 = {id = σ1 , σ2 }, sodass wegen
werden.
sgn(σ1 ) = 1 und sgn(σ2 ) = −1 (siehe das Beispiel auf
Seite 470) für jede Matrix A = (aij ) ∈ R 2×2 gilt:
Beispiel
!
1 Für die Einheitsmatrix E2 aus Z2×2 gilt:
det(A) = sgn(σ ) ai σ (i)
) )
σ ∈S2 i=1 )1 0))
det(E2 ) = )) = 1 · 1 − 0 · 0 = 1.
= 1 · a11 a22 + (−1) · a12 a21 0 1)
= a11 a22 − a12 a21 .
' (
2 3
Das stimmt überein mit der Definition auf Seite 240. Für die Matrix ∈ Z2×2
5 gilt:
1 4
Im Fall n = 3 gilt S3 = {σ1 , . . . σ6 } (wir verwenden
die Nummerierung aus dem Beispiel von Seite 470), so- ) )
)2
) 3))
dass wegen sgn(σ1 ) = 1, sgn(σ2 ) = 1, sgn(σ3 ) = 1, = 2 ·4−3· 1 = 5 = 0.
sgn(σ4 ) = −1, sgn(σ5 ) = −1, sgn(σ6 ) = −1 für jede
)1 4)
Matrix A = (aij ) ∈ R 3×3 gilt: ' (
i −4
!
n Für die Matrix ∈ C2×2 gilt:
0 −1
det(aij ) = sgn σ ai σ (i) =
σ ∈S3 i=1 ) )
) i −4)
) )
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 )0 −1) = i · (−1) − (−4) · 0 = −i .
− (a13 a22 a31 + a23 a32 a11 + a33 a12 a21 ) .
Dieser Sonderfall der allgemeinen Determinantenformel Für die Einheitsmatrix E3 aus Z3×3 gilt:
wurde auf Seite 243 bereits vorweggenommen.
) )
)1 0 0 )
) )
Kommentar: Bereits bei n = 4 besteht die Formel aus det(E3 ) = ))0 1 0)) = 1 · 1 · 1 + 0 · 0 · 0 + 0 · 0 · 0
)0 0 1)
4 ! = 24 Summanden, und jeder Summand enthält vier Fak-
toren. Wegen des hohen Rechenaufwands eignet sich diese − (0 · 1 · 0 + 0 · 0 · 1 + 1 · 0 · 0) = 1 .
13.1 Die Definition der Determinante 473
⎛ ⎞
1 4 6 Beweis: Wir setzen A0 in die Definition der Determinante
Für die Matrix ⎝0 2 5⎠ ∈ R3×3 gilt: ein und beachten, dass das Transponieren das Vertauschen
0 0 3 von Zeilen- und Spaltenindex ist:
) )
)1 4 6) !
n
) ) det(A0 ) =
)0 2 5) = 1 · 2 · 3 + 4 · 5 · 0 + 6 · 0 · 0 sgn(σ ) aσ (i) i .
) )
)0 0 3) σ ∈Sn i=1
− (4 · 6 · 0 + 4 · 0 · 2 + 12 · (−3) · (−4)) = 0 . Die Summe wird über alle σ ∈ Sn gebildet. Da mit σ auch
σ −1 die Gruppe Sn durchläuft und sgn(σ ) = sgn(σ −1 ) gilt,
erhalten wir weiter
? !
n !
n
Gibt es für obere und untere 3 × 3-Dreiecksmatrizen, also für sgn(σ ) ai σ −1 (i) = sgn(σ −1 ) ai σ −1 (i) .
Matrizen der Form
σ ∈Sn i=1 σ −1 ∈Sn i=1
⎛ ⎞ ⎛ ⎞
∗ ∗ ∗ ∗ 0 0
⎝0 ∗ ∗⎠ und ⎝∗ ∗ 0⎠ Nun benennen wir den Summationsindex um,
0 0 ∗ ∗ ∗ ∗ !
n !
n
sgn(σ −1 ) ai σ −1 (i) = sgn(τ ) ai τ (i) .
eine einfache Formel zur Berechnung der Determinante? σ −1 ∈Sn i=1 τ ∈Sn i=1
Der letzte Ausdruck ist die Leibniz’sche Formel für die De-
Ist A = (aij ) ∈ R n×n eine Diagonalmatrix, also aij = 0 terminante von A:
für alle i = j , so liefert die Leibniz’sche Formel !
n
nur höchstens
einen von null verschiedenen Summanden sgn(τ ) ai τ (i) = det(A) .
sgn(σ ) ni=1 ai σ (i) , nämlich jenen mit σ (i) = i , also τ ∈Sn i=1
σ = idIn . Damit ist die Determinante einer Diagonalmatrix
gleich dem Produkt der Diagonalelemente Damit ist det(A0 ) = det(A) begründet.
Die Determinante einer transponierten Matrix Wir zeigen nun det(B) = sgn(σ ) det(A):
Für jede quadratische Matrix A ∈ R n×n gilt:
Lemma
det(A) = det(A ) . 0 Gegeben seien eine Matrix A = (aij ) ∈ R n×n und
eine Permutation σ ∈ Sn . Dann gilt für die Determinante
474 13 Determinanten – Kenngrößen von Matrizen
der Matrizen B = (bij ) mit bij = ai σ (j ) und C = (cij ) mit Und hieraus, so könnte man meinen, kann man det(A) = 0
cij = aσ (i) j : folgern. Tatsächlich geht das aber nur, falls 1 = −1 in R
gilt. Den Fall eines Rings mit 1 = −1 hat man dann aber
det(B) = sgn(σ ) det(A) , nicht berücksichtigt. Wir führen nun einen Beweis, der auch
det(C) = sgn(σ ) det(A) . diesen Fall einschließt.
Man beachte, dass die Matrix B aus der Matrix A durch Ver- Beweis: Wir begründen die Behauptung nur für zwei glei-
tauschen von Spalten gemäß der Permutation σ hervorgeht, che Spalten einer Matrix A = (aij )i,j ∈ R n×n . Durch Über-
die Matrix C wird analog aus A durch Vertauschen von Zei- gang zum Transponierten A0 erhält man die Behauptung
len gebildet. dann für die Zeilen.
Bei der Matrix A seien die k-te und j -te Spalte gleich, d. h.
Beweis: Wir bestimmen die Determinante der Matrix B aij = aik für j = k und i = 1, . . . , n. Mit τ bezeichnen wir
mit der Leibniz’schen Formel. Dabei benutzen wir ähnliche die Transposition aus Sn , die die Zahlen j und k vertauscht,
Schlüsse wie im letzten Beweis: τ (j ) = k, τ (k) = j und τ (i) = i für alle i ∈ {1, . . . , n} \
{j, k}. Es gilt sgn(τ ) = −1. Es ist dann Sn die disjunkte
!
n
det(B) = sgn(τ ) bi τ (i) Vereinigung von An = {σ ∈ Sn | sgn(σ ) = 1} und τ ◦ An :
τ ∈Sn i=1 Sn = An ∪ τ ◦ An .
! n
= sgn(τ ) ai σ (τ (i)) Wegen ai l = ai τ (l) für alle i, l ∈ {1, . . . , n} gilt nun mit
τ ∈Sn i=1 der Leibniz’schen Formel
ρ:=σ ◦τ !
n ! n n
= sgn(σ −1 ◦ ρ) ai ρ(i) det(A) = sgn(σ ) ai σ (i) + sgn(τ ◦ σ ) ai τ (σ (i))
ρ∈Sn i=1 σ ∈An i=1 i=1
!
n ! n
n
−1 = ai σ (i) − = 0.
= sgn(σ ) sgn(ρ) ai ρ(i) sgn(σ ) ai τ (σ (i))
ρ∈Sn i=1 σ ∈An i=1 i=1
! n
Das ist die Behauptung.
= sgn(σ −1 ) sgn(ρ) ai ρ(i)
ρ∈Sn i=1
−1 Die Determinante eines Produkts von
= sgn(σ ) det(A)
= sgn(σ ) det(A) . Matrizen ist das Produkt der Determinanten
Wegen det(A) = det(A0 ) gilt die Aussage ebenso für die Wir stehen immer noch vor dem großen Problem, die De-
Zeilen. terminante einer großen Matrix auszurechnen. Wenn wir er-
kennen, dass zwei Zeilen oder Spalten gleich sind, so sind
wir mit dem letzten Ergebnis einen Schritt weiter, die Deter-
Dieses Lemma wird uns mehrfach von großem Nutzen sein.
minante ist dann null. Aber das sind natürlich sehr spezielle
Wir untersuchen den speziellen Fall einer Transposition
Matrizen. Der sogenannte Determinantenmultiplikationssatz
τ ∈ Sn . Weil eine Transposition τ aus Sn nur zwei der Zah-
wird uns ein ganz wichtiges Hilfsmittel bei der Berechnung
len {1, . . . , n} vertauscht und alle anderen festlässt und das
der Determinante allgemeiner Matrizen sein. Der Satz hat
Signum einer Transposition −1 ist, liefert das obige Lemma
neben der Berechnung von Determinanten auch wesentliche
die erste der folgenden beiden Regeln:
theoretische Bedeutung.
Nun setzen wir das Produkt A B in die Leibniz’sche Formel Durch mehrfaches Anwenden des Determinantenmultiplika-
für die Determinante ein und zeigen durch einige Umformun- tionssatzes erhalten wir:
gen, dass dies genau die Formel für das Produkt der Deter-
minanten von A und B ist. Unterhalb der Rechnung erfolgen Folgerung
kurze Erläuterungen zu den benutzten Umformungen: Für jede Matrix A ∈ R n×n und jedes k ∈ N gilt:
(i) !
n
det(Ak ) = (det A)k .
det(A B) = sgn(σ ) ci σ (i)
σ ∈Sn i=1
n Ist R = K ein Körper, so folgt insbesondere aus Ak = 0
(ii) ! n ! sofort det A = 0, weil ein Produkt von Körperelementen nur
= sgn(σ ) ai k bk σ (i)
dann 0 ist, wenn einer der Faktoren 0 ist.
σ ∈Sn i=1 k=1
(iii) ! !
n
n
Beispiel Für die Matrix
= sgn(σ ) ai ki bki σ (i)
⎛ ⎞
σ ∈Sn k1 ,...,kn =1 i=1 0 1 1 0
!n ! n
n ⎜−1 2 0 1⎟
(iv) M=⎜ ⎝−1 0
⎟ ∈ R4×4
= sgn(σ ) ai ki bkj σ (j ) −2 1⎠
k1 ,...,kn =1 σ ∈Sn i=1 j =1 0 −1 −1 0
(v) ! n n ! n
= ai ki sgn(σ ) bkj σ (j ) gilt M 3 = 0, also folgt det M = 0.
k1 ,...,kn =1 i=1 σ ∈Sn j =1
Ist die Matrix A ∈ R n×n invertierbar, so folgt aus
(vi) ! n n
= ai ki det((bkj l )j,l=1,...,n )
A A−1 = En
k1 ,...,kn =1 i=1
die Definition wäre sonst nicht sinnvoll. Dass dies auch tat-
sächlich so ist, wollen wir nun nachweisen.
Sind B und C beliebige geordnete Basen des K-Vektorraums
V , so betrachten wir die beiden im Allgemeinen verschiede- 13.3 Berechnung der
nen Darstellungsmatrizen B M(ϕ)B und C M(ϕ)C . Nach der Determinante
Basistransformationsformel auf Seite 455 gibt es eine inver-
tierbare Matrix S mit
Determinanten von mehrreihigen Matrizen kann man mit der
C M(ϕ)C = S −1 B M(ϕ)B S . Leibniz’schen Formel kaum berechnen. Das ist zum Glück
auch gar nicht nötig. Wir zeigen, dass wir die Determinante
Und nun folgt mit dem Determinantenmultiplikationssatz einer n × n-Matrix rekursiv berechnen können: Die Berech-
(Seite 474): nung der Determinante einer n × n-Matrix wird auf die
Berechnung von n Determinanten von (n − 1) × (n − 1)-
det(C M(ϕ)C ) = det(S −1 B M(ϕ)B S)
Matrizen zurückgeführt. Das Bestimmen der Determinante
= det(S −1 ) det(B M(ϕ)B ) det(S) einer (n − 1) × (n − 1) -Matrix wird auf das Bestimmen von
= det(S)−1 det(S) det(B M(ϕ)B ) n − 1 Determinanten von (n − 2) × (n − 2) -Matrizen redu-
ziert. Das führen wir so lange fort, bis wir die Berechnung
= det(B M(ϕ)B ) . der Determinante einer n×n-Matrix auf das Problem zur Be-
stimmung von Determinanten von 1 × 1-Matrizen reduziert
Also ist die Determinante eines Endomorphismus tatsächlich haben.
unabhängig von der gewählten Basis bei der Darstellungsma-
trix. Beim tatsächlichen Berechnen von Determinanten werden
wir uns aber gewisser Tricks bedienen, die die Vielzahl der
Beispiel Die Spiegelung bei diesen Schritten entstehenden Matrizen begrenzt. Im All-
gemeinen wird man auch nicht bis zur kleinsten Einheit, also
⎧ 2
⎨ 'R ( → 'R2( bis zu 1×1-Matrizen, reduzieren. Vielfach sind schon Deter-
σ: v v2 minanten von 3 × 3-Matrizen einfach abzulesen, sodass das
⎩ 1 →
v2 v1 Verfahren zur Bestimmung der Determinante übersichtlich
bleibt.
an der Geraden R (e1 + e2 ) hat bezüglich der geordneten
' (
0 1
kanonischen Basis (e1 , e2 ) die Darstellungsmatrix .
1 0
Wegen Bei der Berechnung der Determinante kann
' (
0 1 man nach einer beliebigen Spalte oder Zeile
det = −1
1 0 entwickeln
gilt somit det(σ ) = −1.
Für jede quadratische Matrix A ∈ R n×n und i, j ∈
Der Determinantenmultiplikationssatz für Endomorphismen {1, . . . , n} bezeichne Aij ∈ R (n−1)×(n−1) diejenige Matrix,
lautet: die aus A durch Entfernen der i-ten Zeile und j -ten Spalte
13.3 Berechnung der Determinante 477
die zweite Zeile und dritte Spalte bzw. die dritte Zeile und −2 −2 3 6
zweite Spalte und erhalten
⎛ ⎞ ⎛ ⎞ wird man nach der dritten Zeile entwickeln wollen:
) )
1 2 4 1 3 4 ) 4 2 −3 4)
) )
A23 = ⎝4 3 1⎠ bzw. A32 = ⎝5 7 8⎠ . ) 5 6 1 4)
8 7 5 8 6 5 det A = )) )
)
) 0 0 2 0)
)−2 −2 3 6)
Die folgende Methode zur Bestimmung der Determinante = (−1)1+3 · 0 · det(A13 )
wird auch der Entwicklungssatz von Laplace genannt – die
Berechnung der Determinante einer n × n-Matrixwird durch + (−1)2+3 · 0 · det(A23 )
Streichen von Zeilen und Spalten auf das Berechnen von n + (−1)3+3 · 2 · det(A33 )
Determinanten von (n−1)×(n−1)-Matrizen zurückgeführt.
+ (−1)4+3 · 0 · det(A43 )
) )
) 4 2 4)
Entwicklungssatz von Laplace ) )
= (−1)3+3 2 )) 5 6 4))
Für A = (aij ) ∈ R n×n und beliebige i, j ∈ {1, . . . , n} )−2 −2 6)
gilt:
Also gilt:
Entwicklung nach der i-ten Zeile ) )
)4 2 −3 4)) ) )
) ) 4 2 4)
!
n )5 6 1 4)) ) )
) = (−1)3+3 2 ) 5 6 4)
det A = (−1)i+j aij det Aij . )0 0 2 0)) ) )
) )−2 −2 6)
j =1 )−2 −2 3 6)
Entwicklung nach der j -ten Spalte Nun zum Beweis der Aussage, dass diese Entwicklung nach
!
n beliebigen Zeilen und Spalten funktioniert.
det A = (−1)i+j aij det Aij .
i=1 Beweis: Wegen det(A0 ) = det(A) reicht es aus, die Aus-
sage für die Entwicklung nach einer beliebigen Zeile zu be-
Bevor wir uns an den Beweis dieser Aussagen machen, er- weisen – die Entwicklung gilt nach Übergang zur Transpo-
läutern wir diese Entwicklung, wobei wir beachten, dass die nierten auch für beliebige Spalten. Es sei i ∈ {1, . . . , n} ein
Vorzeichen (−1)i+j schachbrettartig über der Matrix A ver- Zeilenindex der Matrix A.
teilt sind:
+ − + − ··· Die Einträge der Matrix A, deren Determinante wir bestim-
− + − + ··· men wollen, seien akl , d. h. A = (akl ). Wir benutzen die
+ − + − ··· Leibniz’sche Formel und fassen jeweils jene Permutationen
− + − + ··· σ zusammen, die den fest vorgegebenen Zeilenindex i auf
.. .. .. .. . . dieselbe Zahl j abbilden:
. . . . .
!
n
Wir entwickeln die Determinante der Matrix det(A) = sgn(σ ) ak σ (k)
⎛ ⎞
a11 a12 · · · a1n σ ∈Sn k=1
⎜a21 a22 · · · a2n ⎟ ! n !
n
⎜ ⎟
A=⎜ . .. .. ⎟ ∈ R n×n = sgn(σ ) ak σ (k) aij .
⎝ .. . . ⎠
j =1 σ ∈Sn k=1
an1 an2 · · · ann σ (i)=j k =i
478 13 Determinanten – Kenngrößen von Matrizen
Wir zeigen nun für jedes j ∈ {1, . . . , n} die Gleichheit Spalten, so suche man nach der Zeile oder Spalte, in der die
meisten Nullen auftauchen und entwickle nach dieser. Sind
!
n
keine oder nur wenige Nullen in der Matrix vorhanden, so
sgn(σ ) ak σ (k) = (−1)i+j det(Aij ) . (∗)
σ ∈Sn k=1
ist es oftmals sinnvoll, durch geschickte Zeilenumformungen
σ (i)=j k=i weitere Nullen zu erzeugen. Wie dies funktioniert, zeigen wir
nach den folgenden Beispielen.
Damit ist dann der Entwicklungssatz von Laplace bewiesen.
Für ein j ∈ {1, . . . , n} und den Zeilenindex i ∈ {1, . . . , n} Beispiel
betrachten wir zwei ganz bestimmte Permutationen σ1 und Für die Determinante der Matrix
⎛ ⎞
σ2 aus der symmetrischen Gruppe Sn : 1 0 2 0
⎜1 0 3 0⎟
σ1 : ( . . . , i − 1, i + 1, . . . , n − 1, n ) → A=⎜ ⎝−1 2 3
⎟
i, 4⎠
( . . . , i − 1, i + 1, i + 2, . . . , n, i ), 2 0 5 1
σ2 : ( . . . , j − 1, j, j + 1, . . . , n − 1, n ) →
erhalten wir nach Entwickeln nach der zweiten Spalte
( . . . , j − 1, j + 1, j + 2, . . . , n, j ). ) )
) 1 0 2 0) ) )
) ) )1 2 0 )
Durch Zählen der Fehlstände erhalten wir ) 1 0 3 0) ) )
det A = )) ) = (−1)3+2 2 )1 3 0)
−1 2 3 4 ) ) )
sgn(σ1 ) = (−1)n−i und sgn(σ2 ) = (−1)n−j . ) ) )2 5 1)
) 2 0 5 1)
Wir setzen Nun entwickeln wir weiter nach der dritten Spalte und
bkl = aσ1 (k) σ2 (l) erhalten
) )
)1 2 0 ) ) )
und erhalten wegen der obigen Wahl von i (die i-te Zeile wird ) ) )1 2))
übersprungen) und von j (die j -te Spalte wird übersprungen) det A = (−2) ))1 3 0)) = (−2) · (−1)3+3 )) = −2 .
)2 5 1) 1 3)
die Matrix
Aij = (bkl )k,l=1,...,n−1 . Die Determinante der Nullmatrix 0 ist null.
Für jede Permutation σ ∈ Sn gilt: Für die Einheitsmatrix En ∈ Kn×n gilt in Übereinstim-
mung mit Seite 473:
σ (i) = j ⇔ σ2−1 ◦ σ ◦ σ1 (n) = n ) )
)1 · · · 0 )
) )
⇔ σ2−1 ◦ σ ◦ σ1 |{1,...,n−1} ∈ Sn−1 . ) )
det En = ) ... . . . ... ) = 1 det En−1
) )
)0 · · · 1)
Also gilt:
= 12 det En−2
!
n
sgn(σ ) ak σ (k) = · · · = 1n−1 det E1
σ ∈Sn
σ (i)=j
k=1
k=i
= 1.
⎛ ⎞
!
n 4 3 2 1
= sgn(σ2 ◦ τ ◦ σ1−1 ) ak σ −1 . ⎜3 2 1 4 ⎟
τ ∈Sn−1 k=1
2 (τ (σ1 (k)))
Für die Matrix A = ⎜ ⎟
⎝2 1 4 3⎠ ∈ R
4×4 gilt:
k=i
1 4 3 2
In diesem letzten Ausdruck setzen wir l = σ1−1 (k), d. h., )
)2 1 4)
) )
)3
)
) ) ) 2 1))
σ1 (l) = k, und erhalten wegen der Homomorphie des Sig-
det A =(−1)1+1 4 ))1 4 3)) + (−1)1+2 3 ))1 4 3))
nums nach Seite 73, also wegen der Multiplikativität von sgn, )4 3 2 ) )4 3 2)
und wegen sgn(σ1−1 ) = sgn(σ1 ): ) ) ) )
)3 2 1) )3 2 1))
) ) )
!
n−1 +(−1)1+3 2 ))2 1 4)) + (−1)1+4 1 ))2 1 4))
sgn(σ2 ) sgn(σ1 ) sgn(τ ) aσ1 (l) σ2 (τ (l)) )4 3 2 ) )1 4 3)
τ ∈Sn−1 l=1
=bl τ (l) So bleiben also vier Determinanten von 3 × 3-Matrizen
= (−1)n−j (−1)n−i det(Aij ) = (−1)i+j det(Aij ) .
zu bestimmen. ⎛ ⎞
2 −3 4
Für die Matrix A = ⎝−4 6 4 ⎠ ∈ R3×3 gilt:
Damit ist die Gleichheit in (∗) gezeigt und die Behauptung
0 0 12
bewiesen.
) )
) 2 −3 4 ) ) )
) ) ) )
)−4 6 4 ) = (−1)3+3 12 ) 2 −3) = 0
Diese Entwicklung der Determinante nach einer Zeile oder ) ) )−4 6 )
) 0 0 12)
Spalte ist das wesentliche Hilfsmittel zur Berechnung der De-
terminante. Hat man eine Matrix mit mehr als drei Zeilen und (vgl. das Beispiel auf Seite 473).
13.3 Berechnung der Determinante 479
Problemanalyse und Strategie: Man entwickelt vorzugsweise nach Zeilen bzw. Spalten, in denen bereits viele Nullen
stehen. Eventuell erzeugen wir uns durch geschickte Zeilen- bzw. Spaltenumformungen zuerst Nullen.
Nun bestimmen wir die Determinante der reellen Matrix wobei 0 ∈ R (n−m)×m die Nullmatrix ist und A ∈ R m×m ,
⎛ ⎞ C ∈ R m×(n−m) , B ∈ R (n−m)×(n−m) sind.
4 3 2 1
⎜3 2 1 4 ⎟ Es gilt die nützliche Regel:
A=⎜ ⎟
⎝2 1 4 3⎠ ∈ R
4×4
.
1 4 3 2
Die Determinante von Blockdreiecksmatrizen
Wegen der zweiten Determinantenregel bleibt die Deter- Für alle quadratischen Matrizen A ∈ R s×s , B ∈ R r×r
minante unverändert, wenn wir zur ersten Zeile das (−4)- und passenden Matrizen 0, C gilt:
Fache der letzten Zeile, zur zweiten Zeile das (−3)-Fache ' ( ' (
der letzten Zeile und schließlich zur dritten Zeile das (−2)- A C A 0
det = det A det B = det
Fache der letzten Zeile addieren: 0 B C B
) ) ) )
)4 3 2 1) )0 −13 −10 −7)
) ) ) )
)3 2 1 4) )0 −10 −8 −2)
det(A) = )) )=)
) )
)
)
Beweis: Mit den Einheitsmatrizen Er und Es und den
)2 1 4 3) )0 −7 −2 −1) passenden Nullmatrizen gilt
) 1 4 3 2 ) )1 4 3 2)
' ( ' (' (
A C Es 0 A C
Damit erhalten wir nun nach Definition der Determi- =
0 B 0 B 0 Er
nante und dreimaligem Anwenden der dritten Regel mit
λ = −1: Wegen
) ) ) )
)−13 −10 −7) )13 10 7) ' ( ' (
) ) ) )
det A = (−1)4+1 ))−10 −8 −2)) = ))10 8 2)) Es 0 A C
det = det(B) und det = det(A)
) −7 −2 −1) ) 7 2 1) 0 B 0 Er
Wir wenden die erste Regel an, vertauschen die erste mit (man entwickle nach den ersten Spalten bzw. letzten Zei-
der dritten Spalte und beachten das Minuszeichen: len) folgt die Behauptung mit dem Determinantenmultiplika-
) ) tionssatz.
)7 10 13)
) )
det A = − ))2 8 10)) . Wegen det(M) = det(M 0 ) gilt die Formel auch für untere
)1 2 7 ) Blockdreiecksmatrizen.
Ist A eine Dreiecksmatrix oder eine Diagonalmatrix, Ist die Matrix A invertierbar, so ist die Determinante
also von der Form der inversen Matrix das Inverse der Determinante:
⎛a11 ∗ . . . ∗ ⎞ ⎛a11 0 . . . 0 ⎞
. . det(A−1 ) = (det A)−1 .
⎜0 a22 . . ⎟
.. . ⎜ ∗ a22 . . ⎟
.. .
⎜ ⎟ oder ⎜ ⎟
⎝ .. .. .. ⎠ ⎝ . . . ⎠
. . . ∗ .
.
.. ..
0 Ist die Koeffizientenmatrix A eines linearen Glei-
0 . . . 0 ann ∗ . . . ∗ ann chungssystems (A | b) quadratisch, so ist (A | b) genau
dann eindeutig lösbar, wenn det A = 0 gilt.
so ist die Determinante von A das Produkt der Diago-
Sind zwei Zeilen oder Spalten einer Matrix linear ab-
nalelemente
hängig, so ist ihre Determinante 0.
det A = a11 · · · ann . Hat die Matrix eine Nullzeile oder Nullspalte, so ist
ihre Determinante 0.
Die Determinante einer Matrix bleibt unverändert,
Die Determinante ändert ihr Vorzeichen beim Vertau- wenn man zu einer Zeile (bzw. Spalte) das Vielfache
schen zweier Zeilen oder Spalten. einer anderen Zeile (bzw. Spalte) addiert.
Die Determinante der Einheitsmatrix En ∈ R n×n ist 1: Die Determinante eines Produkts zweier quadratischer
Matrizen ist das Produkt der Determinanten der beiden
det En = 1.
Matrizen: Für alle A, B ∈ R n×n gilt:
Für jede Matrix A ∈ R n×n und λ ∈ R gilt:
det(A B) = det(A) det(B).
det(λ A) = λn det A ,
Für jede Matrix A ∈ R n×n und jede natürliche Zahl k
insbesondere det(−A) = (−1)n det A. gilt:
Die Determinante einer Matrix ändert sich nicht durch
det(Ak ) = (det A)k .
das Transponieren:
Für eine invertierbare Matrix S ∈ R n×n und jede Ma-
det A = det A0 .
trix A ∈ R n×n gilt:
Eine Matrix A ist genau dann invertierbar, wenn ihre
Determinante von null verschieden ist. det(S −1 A S) = A.
Beweis: (a) Wegen det(A) = det(A0 ) reicht es, die Aus- Aber die Determinante hat durchaus noch andere Anwendun-
sage nur für Zeilen zu zeigen. Die i-te Zeile der Matrix A gen. Zum Beispiel lassen sich lineare Gleichungssysteme mit
sei quadratischer Koeffizientenmatrix mithilfe von Determinan-
λ x + y = (λ x1 + y1 , . . . , λ xn + yn ) . ten lösen, und ist eine Matrix invertierbar, so können wir auch
das Inverse einer Matrix mit Determinanten bestimmen. Wir
Wir setzen dies in die Leibniz’sche Formel ein: wollen aber darauf hinweisen, dass diese Methoden nicht
⎛ ⎞ sehr effizient sind. Der Algorithmus von Gauß und Jordan
..
⎜ . ⎟ ! n führt im Allgemeinen viel schneller zur Lösung eines Glei-
det(A) = det ⎜ ⎝ λ x + y ⎟=
⎠ sgn(σ ) ak σ (k) . chungssystems, und die Methoden aus dem Abschnitt 12.6
.. σ ∈Sn k=1 zur Bestimmung des Inversen einer Matrix sind meist deut-
.
lich effizienter als die Methode, die wir nun mittels Determi-
nanten vorstellen.
Wegen aiσ (i) = λ xσ (i) + yσ (i) erhält man nach Ausmulti-
plizieren:
⎛ ⎞ ⎛ ⎞ Eine Matrix ist genau dann invertierbar, wenn
.. ..
⎜.⎟ ⎜.⎟ ihre Determinante von null verschieden ist
det(A) = λ det ⎜ ⎟ ⎜ ⎟
⎝x ⎠ + det ⎝y ⎠ .
.. ..
. . Es gibt viele Invertierbarkeitskriterien für (quadratische) Ma-
trizen über einem Körper K. Wir geben eines mithilfe der
(b) und (c) haben wir bereits auf den Seiten 473 und 473 Determinante an.
bewiesen.
Invertierbarkeitskriterium
Kommentar: Oftmals werden Determinanten als normier- Für eine Matrix A ∈ Kn×n sind die folgenden Aussagen
te, alternierende Multilinearformen eingeführt. Man kann gleichwertig:
zeigen, dass wenn es eine normierte, alternierende Multi- Die Matrix A ist invertierbar.
linearform gibt, sie eindeutig bestimmt ist. Man nennt diese Es gilt det A = 0.
multilineare Abbildung dann Determinante und beweist ihre
Existenz mittels der Leibniz’schen Formel. Diese Einfüh-
rung der Determinante (siehe Seite 484) hat Vorteile und Beweis: Man bringe A mit elementaren Zeilenumformun-
Nachteile: Ein klarer Vorteil ist, dass die Nachweise für die gen auf Zeilenstufenform Z = (zij ). Wegen des Satzes zur
Eigenschaften der Determinante, wie zum Beispiel der Deter- Determinante nach elementaren Zeilen- oder Spaltenumfor-
minantenmultiplikationssatz, übersichtlicher dargestellt wer- mungen auf Seite 479 gilt dann det(A) = a det(Z) für ein
den können – die Anzahl der Indizes bei den Nachweisen ist a ∈ K \ {0}. Es folgt:
geringer. Ein Nachteil ist: Bis man überhaupt den Begriff
einer Determinante hat, muss man sich durch einen Urwald det(A) = 0 ⇔ det(Z) = z11 · · · znn = 0
mit ungewohnten und nicht einfachen Begriffen schlagen. ⇔ z11 , . . . , znn = 0
Wir haben der direkten Einführung der Determinante über ⇔ rg A = rg Z = n
die Leibniz’sche Formel den Vorzug gegeben und haben so- ⇔ A ist invertierbar
mit in Kauf genommen, dass die Beweise manchmal einer
Schlacht mit Indizes gleichen. Dafür bleibt es klar und ver- Zur letzten Äquivalenz siehe das Kriterium zur Invertierbar-
ständlich, was die Determinante einer Matrix A eigentlich keit auf Seite 449.
ist – eine wohlsortierte Summe von Produkten von Einträgen
in A.
Kommentar: Die Aussage des Satzes gilt in einer entspre-
chenden Formulierung auch für einen kommutativen Ring R
mit 1. Aber der Beweis ist dann anders zu führen, da oben-
13.4 Anwendungen der stehender Beweis bei der Erzeugung der Zeilenstufenform
durch elementare Zeilenumformungen wesentlich benutzt,
Determinante dass jedes von null verschiedene Element aus K invertierbar
ist. Die allgemeinere Aussage werden wir später mithilfe der
Wir behandeln in diesem Abschnitt einige Anwendungen der Adjunkten zeigen.
Determinante. Zuerst zeigen wir, dass die Determinante ein
Invertierbarkeitskriterium liefert: Eine Matrix ist genau dann ?
invertierbar, wenn ihre Determinante von null verschieden Wenn A B mit A, B ∈ Kn×n invertierbar ist, müssen dann
ist. Den Nutzen dieses Kriteriums lernen wir erst im nächsten auch A und B invertierbar sein?
Kapitel zu den Eigenwerten richtig zu schätzen.
484 13 Determinanten – Kenngrößen von Matrizen
Es ist SLn (K) nach dem Lemma auf Seite 74 eine Unter- die adjunkte Matrix zu A. Es gilt:
gruppe von Gln (K) – man nennt sie die spezielle lineare
Gruppe vom Grad n. A ad(A) = ad(A) A = det(A) En .
Die Abbildung det ist surjektiv, da für jedes λ ∈ K \ {0} die Falls A invertierbar ist, so gilt:
Matrix ⎛ ⎞
λ 0 ··· 0 A−1 =
1
ad(A) .
⎜ 0 1 · · · 0⎟ det A
⎜ ⎟
⎜ .. . . .. ⎟
⎝. . .⎠
0 0 ··· 1 Beweis: Die adjunkte Matrix lautet ausführlich
⎛ ⎞
ein Element aus GLn (K) ist und die Determinante λ hat. Nach (−1)1+1 det(A11 ) · · · (−1)1+n det(An1 )
dem Homomorphiesatz für Gruppen von Seite 77 gilt damit: ⎜ .. .. ⎟
ad(A) = ⎝ . . ⎠
GLn (K)/ SLn (K) ∼
= K \ {0} . (−1)n+1 det(A1n ) · · · (−1)n+n det(Ann )
Kommentar: Die linearen Gruppen GLn (K) (später Beachten Sie, dass hier in der adjunkten Matrix der erste
kommen noch weitere hinzu) beschreiben Symmetrien. Die Index von Aj i der Spaltenindex ist und der zweite der Zei-
SLn (K) enthält z. B. die volumen- und orientierungstreuen lenindex.
linearen Abbildungen (Kapitel 7). Wir bezeichnen die Einträge in dem Matrizenprodukt
A ad(A) mit cij , d. h.,
Beispiel Für jedes α ∈ [0, 2 π[ ist
⎛ ⎞ A ad(A) = (cij ) ,
' ( cos α − sin α 0
cos α − sin α
bzw. ⎝ sin α cos α 0⎠ und zeigen
sin α cos α
0 0 1
1 , falls i = j,
ein Element von SL2 (R) bzw. SL3 (R). Die Matrix beschreibt cij = det(A) δij mit δij =
0 , sonst.
jeweils eine Drehung um den Winkel α. Im R2 wird um den
Nullpunkt gedreht, im R3 um die x3 -Achse (Abb. 13.1). Es gilt dann A ad(A) = det(A) En .
486 13 Determinanten – Kenngrößen von Matrizen
Für jedes i ∈ {1, . . . , n} ist cii das Produkt der i-ten Zeile Beispiel Wir berechnen ad(A) und damit A−1 für
von A mit der i-ten Spalte von ad(A): ⎛ ⎞
1 2 1
⎛ ⎞
(−1)1+i det(Ai1 ) A = ⎝−2 1 4⎠ ∈ R3×3 .
⎜ .. ⎟ 1 3 2
cii = (ai1 , . . . , ain ) ⎝ . ⎠
(−1) n+i det(Ain ) ∗ der Adjunkten von A:
Wir ermitteln die Komponenten aij
!
n
' (
= aik (−1)k+i det(Aik ) . ∗ 1+1 1 4
a11 = (−1) det A11 = det = −10 ,
k=1 3 2
' (
∗ −2 4
Nach dem Entwicklungssatz von Laplace (Entwicklung nach a21 = (−1)2+1 det A12 = − det = 8,
i-ter Zeile) von Seite 477 gilt daher für jedes i ∈ {1, . . . , n}: 1 2
' (
∗ −2 1
cii = det(A) . a31 = (−1)3+1 det A13 = det = −7 ,
1 3
' (
∗ 2 1
Und für i = j gilt analog: a12 = (−1)1+2 det A21 = − det = −1 ,
3 2
' (
!
n
∗ 1 1
cij = aik (−1)k+j det(Aj k ) = det(A ) , a22 = (−1)2+2 det A22 = det = 1,
1 2
k=1 ' (
∗ 1 2
a32 = (−1)3+2 det A23 = − det = −1 ,
wobei A ∈ R n×n aus A durch Ersetzen der j -ten Zeile durch 1 3
' (
die i-te Zeile entsteht. Da die Determinante einer Matrix ∗ 2 1
mit gleichen Zeilen null ist, erhalten wir det(A ) = 0, also a13 = (−1)1+3 det A31 = det = 7,
1 4
cij = 0 für i = j . Damit ist gezeigt: ' (
∗ 1 1
a23 = (−1)2+3 det A32 = − det = −6 ,
A ad(A) = det(A) En . −2 4
' (
∗ 1 2
a33 = (−1)3+3 det A33 = det = 5.
Die Formel ad(A) A = det(A) En erhält man analog durch −2 1
Entwicklung nach der i-ten Spalte.
Damit erhalten wir:
Ist schließlich A ∈ R n×n invertierbar, so ist auch det(A) ∈ R ⎛ ⎞
invertierbar (siehe die Folgerung auf Seite 475). Wir multipli- −10 −1 7
zieren die bewiesene Gleichung ad(A) A = det(A) En mit ad(A) = ⎝ 8 1 −6⎠
(det(A))−1 durch und erhalten −7 −1 5
, -
1 und wegen det(A) = −1 folgt:
ad(A) A = En .
det A ⎛ ⎞
10 1 −7
ad(A)
Folglich ist
1
ad(A) das zu A inverse Element A−1 . A−1 = = ⎝−8 −1 6 ⎠
det A det A
7 1 −5
Der Satz zur adjunkten Matrix liefert eine Formel zum In-
vertieren von Matrizen. Für eine invertierbare 2 × 2-Matrix Die Methoden aus dem Abschnitt 12.6 zum Invertieren von
über einem Körper K lautet die Formel: Matrizen führen im Allgemeinen deutlich schneller zum Ziel
als die hier vorgestellte Methode mit der adjunkten Matrix.
Das Inverse einer 2 × 2-Matrix Aber der Satz zur adjunkten Matrix hat eine wichtige theore-
tische Bedeutung, mit ihm folgt nun ein allgemeines Inver-
Für A ∈ K2×2 mit det(A) = 0 gilt:
tierbarkeitskriterium für Matrizen über einem kommutativen
' ( ' ( Ring R mit 1.
a b −1 1 d −b
A= ⇒ A =
c d ad − bc −c a
Folgerung
Für eine Matrix A ∈ R n×n sind die folgenden Aussa-
Die Elemente auf der Hauptdiagonalen werden vertauscht, gen gleichwertig:
die anderen Elemente werden mit einem Minuszeichen ver-
Die Matrix A ist invertierbar.
sehen, und es wird durch die Determinante geteilt.
Die Determinante det A ∈ R ist invertierbar in R.
Bei einer 3 × 3-Matrix ist das Invertieren mit der adjunk-
ten Matrix deutlich komplizierter, wir zeigen dies an einem Man vergleiche dieses Resultat mit dem Invertierbarkeitskri-
Beispiel. terium für eine Matrix A über einem Körper K.
13.4 Anwendungen der Determinante 487
Kommentar: In der Zahlentheorie und ihren Anwendun- Nun ist aber nach der zweiten Regel für die Determinanten
gen in der Kryptologie und Codierungstheorie wird dieses von Seite 474 die Determinante einer Matrix mit gleichen
Ergebnis wie auch die im Folgenden behandelte Cramer’sche Spalten null, sodass in dieser letzten Summe für jedes j = i
Regel mehrfach benutzt. Wir können hier die Ergebnisse lei- aus {1, . . . , n}
der nur etwas unmotiviert darstellen und müssen darauf hof-
det((s 1 , . . . , s i−1 , s j , s i+1 , s n )) = 0
fen, dass ein Leser an unsere Ausführungen hier zurückdenkt
und auf diesen Seiten nachblättert, sobald in der Zahlentheo- gilt und in dieser Summe somit nur der i-te Summand ver-
rie, Kryptologie oder Codierungstheorie darauf verwiesen bleibt, d. h.,
wird, dass man diese Dinge ja im ersten Semester in der
det(Ai ) = vi det(A) .
linearen Algebra gelernt habe.
Da det(A) ∈ R invertierbar ist, können wir diese Gleichung
mit dem Inversen davon multiplizieren und erhalten wie ge-
1
wünscht vi = det(Ai ) .
det A
Beweis: Nach der Folgerung auf Seite 486 ist det(A) ge- hat das gegebene System genau eine Lösung (v1 , v2 , v3 )0 ,
nau dann invertierbar, wenn die Matrix A invertierbar ist, und es gilt mit der Cramer’schen Regel:
) )
d. h., wenn A−1 ∈ R n×n existiert. Es ist dann v = A−1 b )−1 2 3 )
) ) 1
v2 = )) 2 1 −1)) = (−5) = −1 .
1
die eindeutig bestimmte Lösung des linearen Gleichungs-
systems. Damit ist der erste Teil bereits gezeigt.
5
)−2 −1 2 ) 5
mit verschiedenen x0 , . . . , xn ∈ R ein Polynom p ∈ R[X] Die n + 1 Gleichungen in (∗) liefern ein lineares Glei-
gesucht, sodass der Graph {(x, p(x)) | x ∈ R} der Polynom- chungssystem für die n + 1 zu bestimmenden Koeffizienten
funktion p diese Stützstellen enthält, d. h., es gilt: a0 , a1 , . . . , an ∈ R.
Das Polynom p nennt man in diesem Fall ein Interpolati- a0 x00 + a1 x0 + · · · + an x0n = y0
onspolynom.
a0 x10 + a1 x1 + · · · + an x1n = y1
y a0 x20 + a1 x2 + · · · + an x2n = y2
.. .. .. ..
. . . .
(x0 , y0 )
a0 xn0 + a1 xn + · · · + an xnn = yn .
(x3 , y3 )
Als Koeffizientenmatrix erhalten wir die sogenannte
(n + 1) × (n + 1)-Vandermonde-Matrix
⎛ ⎞
(x2 , y2 )
1 x0 x02 . . . x0n
x
⎜1 x12 . . . x1n ⎟
⎜ x1 ⎟
V =⎜ ⎟ j (n+1)×(n+1)
⎜ .. .. .. .. ⎟ = (xi ) ∈ R .
⎝. . . . ⎠
(x1 , y1 ) 1 xn xn2 . . . xnn
yi = a0 + a1 xi + · · · + an xin für i = 0, . . . , n . (∗) Bei diesem Schritt haben wir also die (n + 1) × (n + 1)-
Vandermonde-Matrix auf eine n × n-Vandermonde-Matrix
Es ist dann zurückgeführt. Induktiv folgt nun unter Beachtung von
det(1) = 1 die Formel
p = a0 + a1 X + · · · + an X n ∈ R[X]n
n−1
n
das eindeutig bestimmte Polynom mit der gewünschten Ei- det V = (xi − xj ).
genschaft. j =0 i=j +1
13.4 Anwendungen der Determinante 489
v
w
x1
Abbildung 13.5 Die Vektoren (v, w) sind positiv orientiert und (w, v) negativ.
e2 ' (
v
Gilt det vv1 w
w1
< 0, so nennt man die Vektoren (v, w)
2 2
e1 x1
in dieser Reihenfolge negativ orientiert. Das Vertauschen
der Spalten, also das Umreihen der Basisvektoren ändert die
Abbildung 13.3 Die Spaltenvektoren v = (vi ) und w = (wi ) einer 2 × 2- Orientierung der Basis.
Matrix A erzeugen ein Parallelogramm mit dem Flächeninhalt F = det A.
Beispiel Mittels der Determinante können wir die Flä-
Für F1 gilt: cheninhalte von Dreiecken bestimmen. So erzeugen zwei po-
1 1 sitiv orientierte Vektoren (v, w) das Dreieck 0, v, w mit dem
F1 = w1 w2 + v1 (v2 + 2 w2 ) .
2 2 Flächeninhalt F = 1/2 det((v, w)) (Abb. 13.6).
490 13 Determinanten – Kenngrößen von Matrizen
2 F = det((v 1 , v 2 )) + det((v 2 , v 3 ))
F + det((v 3 , v 4 )) + det((v 4 , v 5 ))
v1
+ det((v 5 , v 1 )).
x1
Abbildung 13.6 Zwei positiv orientierte Vektoren bestimmen ein Dreieck mit
dem Flächeninhalt F = 1/2 det((v 1 , v 2 )).
Der Wert der Determinante einer 3 × 3-Matrix
Damit lassen sich aber auch wesentlich kompliziertere Flä- ist das Volumen des von den Spalten
cheninhalte im R2 bestimmen. Wir betrachten die Fläche F aufgespannten Parallelepipeds
in Abbildung 13.7, die von den Vektoren v 1 , . . . , v 5 erzeugt
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
wird. u1 v1 w1
Sind u = ⎝ u2 ⎠, v = ⎝ v2 ⎠ und w = ⎝ w2 ⎠ Vekto-
x2 v4 u3 v3 w3
ren des reellen Vektorraums R3 , so bilden die acht Punkte
0, u, v, w, u + v, v + w, u + w, u + v + w die Ecken
v3
eines Spates oder Parallelepiped (Abb. 13.9) mit dem Volu-
F
v5 men
F1
−
F2
Das Volumen | det(u, v, w)| des Parallelepipeds ist genau
dann null, wenn die drei Vektoren u, v, w ∈ R3 linear ab-
hängig sind. Der Spat ist dann „flach“, also in einer Ebene
gelegen oder auf einer Geraden, oder er ist überhaupt auf
einen einzigen Punkt geschrumpft.
Abbildung 13.8 Die Fläche F ist die Differenz der beiden Flächen F1 und F2 .
Die vom Koordinatenursprung aus abgetragenen Vektoren
u, v, w sind Mantelkanten einer dreiseitigen Pyramide.
Für den Inhalt der großen Fläche F1 gilt:
Nach Seite 245 beträgt das Volumen dieser Pyramide ge-
2 F1 = det((v 2 , v 3 )) + det((v 3 , v 4 )), rade ein Sechstel des Volumens des von u, v, w aufgespann-
und für jenen der kleinen Fläche F2 gilt: ten Parallelepipeds. Dies ist die Grundlage für die im Essay
auf Seite 491 behandelte Cayley-Menger’sche Determinante,
2 F2 = det((v 2 , v 1 )) + det((v 1 , v 5 )) + det((v 5 , v 4 )) . durch welche das Volumen einer dreiseitigen Pyramide aus
Damit ist dann F = F1 − F2 . deren 6 Kantenlängen berechenbar ist.
13.4 Anwendungen der Determinante 491
Hintergrund und Ausblick: Die Cayley-Menger-Formel für das Volumen einer dreiseitigen
Pyramide
Die Bedeutung dieser von Arthur Cayley (1821–1895) entwickelten und später von Karl Menger (1902–1985) auf metrische
Räume verallgemeinerten Formel liegt darin, dass das Volumen einer dreiseitigen Pyramide allein durch die Längen lij der
sechs Kanten auszudrücken ist. Das Verschwinden dieses Volumens kennzeichnet die Komplanarität der Eckpunkte anhand
einer von den gegenseitigen Distanzen zu erfüllenden Gleichung.
Das Volumen V der dreiseitigen Pyramide mit den Eck- dass das Produkt der Determinanten gleich ist der Deter-
punkten a 0 , . . . , a 3 ist gleich einem Sechstel des Volu- minante des Matrizenprodukts. So entsteht
mens jenes Parallelepipeds, welches von den Vektoren ) )
) 0 1 1 1 1 )
a 1 − a 0 , a 2 − a 0 und a 3 − a 0 aufgespannt wird (siehe ) )
) 1 a0 · a0 a0 · a1 a0 · a2 a0 · a3 )
Beispiel auf Seite 245). Daher gilt: 1 ) )
V2 = − ) 1 a1 · a0 a1 · a1 a1 · a2 a1 · a3 )
V =
1
det(a 1 − a 0 , a 2 − a 0 , a 3 − a 0 ). 36 )) 1 a2 · a0 a2 · a1 a2 · a2 a2 · a3
)
)
) )
6
) 1 a3 · a0 a3 · a1 a3 · a2 a3 · a3 )
Wir bezeichnen die Koordinaten der Punkte a i für i =
0, . . . , 3 mit (xi1 , xi2 , xi3 ) und schreiben diese wie ge- Nun subtrahieren wir für 0 ≤ i ≤ 3 von der (i + 2)-ten
wohnt in Spaltenform. Dies ergibt: Zeile (1 a i · a 0 a i · a 1 a i · a 2 a i · a 3 ) die mit a i · a i /2
) ) multiplizierte erste Zeile und danach von der (j + 2)-ten
) )
1 ) x11 − x01 x21 − x01 x31 − x01 )
Spalte, 0 ≤ j ≤ 3, die mit a j · a j /2 multiplizierte erste
V = )) x12 − x02 x22 − x02 x32 − x02 )
)
6 ) x −x x −x x −x ) Spalte. Damit erhalten wir Nullen in der Hauptdiagonale.
13 03 23 03 33 03
Und an die Stelle (i + 2, j + 2), i = j , kommt der Wert
Diese 3 × 3-Matrix wird schrittweise umgeformt, ohne
ihre Determinante zu verändern. ai · aj − 1
ai · ai − 1 2
a j · a j = − 12 lij
2 2
Wir erweitern durch die Zeile (1 0 0 0) zu einer 4 × 4-
mit lij als Distanz der Punkte a i und a j , denn
Matrix. Deren Entwicklung nach der ersten Zeile beweist,
dass die Determinante unabhängig ist von den restlichen 2
lij = a i − a j 2 = a i · a i − 2 a i · a j + a j · a j .
Einträgen in der ersten Spalte. Demnach ist
) )
) 1 0 ... 0 ) Es bleibt
) )
1 )) x01 x11 − x01 . . . x31 − x01 )
)
) )
V = ) ) 0 1 1 1 1 )
6) x02 x12 − x02 . . . x32 − x02 ) ) )
) ) 1 0 −l01
2
/2 −l02
2
/2 −l03
2
/2 )
) x03 x13 − x03 . . . x33 − x03 ) −1 ) )
V2 = ) 1 −l10
2
/2 0 −l12
2
/2 −l13
2
/2 )
Dann addieren wir zu den Spalten 2 bis 4 die erste: 36 )) 1 −l20
2
/2 −l21
2
/2 0 −l23
2
/2
)
)
) )
) ) ) 1 −l30
2
/2 −l31
2
/2 −l32
2
/2 0 )
) 1 1 1 1 )
) )
1 )) x01 x11 x21 x31 )
) Zur weiteren Vereinfachung multiplizieren wir in dieser
V = ) )
6) x02 x12 x22 x32 ) symmetrischen Matrix die erste Spalte mit −1/2, um dann
) x03 x13 x23 x33 )
aus den Zeilen 2 bis 5 jeweils −1/2 wieder herauszuheben.
In den Spalten kommen genau die Koordinaten der vier Nach den Regeln über Determinanten folgt schließlich die
gegebenen Punkte vor. Nach nochmaliger Erweiterung zu Formel ) )
) 0 1 1 1 1 )
einer 5 × 5-Matrix können wir abkürzend schreiben ) )
) ) ) 1 0 2
l01 2
l02 2
l03 )
) ) 1 ) )
1 )) 1 0 0 0 0 ) V2 = ) 1 2
l10 0 2
l12 2
l13 )
V = )0 1 1 1 1 )
) 288 )) 1 2
l20 2
l21 0 2
l23
)
)
6)0 a a a a ) ) )
0 1 2 3 ) 1 2
l30 2
l31 2
l32 0 )
wobei die Vektorsymbole die in Spalten geschriebenen
mit der Cayley-Menger’schen Determinante.
Koordinatentripel repräsentieren. Derselbe Wert tritt bei
der transponierten Matrix auf, in der wir zusätzlich noch
die ersten beiden Spalten vertauschen, d. h., Kommentar: Die zweidimensionale Version dieser Vo-
) ) lumenformel liefert für das Dreieck mit den Seitenlängen
) 0 1 00 )
) ) a, b, c genau die Heron’sche Flächenformel
1 )) 1 0 a00
)
)
V =− ) .. .. .. )
6 )) ) A2 = s(s − a)(s − b)(s − c) mit s = 12 (a + b + c).
. . . )
) 1 0 a0 )
3
Bei der analog begründbaren n-dimensionalen Fassung
mit a 0
i als Koordinatentripel in Zeilenform. Wir multi- dieser Formel für das Quadrat des Volumens eines
Simplex
plizieren die letzte Formel mit der vorletzten und nutzen, im Rn lautet der Anfangskoeffizient (−1)n+1 / 2n (n!)2 .
492 13 Determinanten – Kenngrößen von Matrizen
Die Determinante ermöglicht die Definition Die Volumina sämtlicher Parallelepipede werden mit dem-
eines n-dimensionalen Volumens selben Faktor | det A| multipliziert (Abb. 13.10). Dieser Vo-
lumenverzerrungsfaktor gilt übrigens für sämtliche Körper-
Im Anschluss an die vorhin betrachteten Fälle im R2 und R3 inhalte im Rn , nicht nur für Parallelepipede.
liegt folgende Verallgemeinerung nahe: Wir betrachten im
Rn das n-dimensionales Parallelepiped P , welches von den x2 x2
n Vektoren v 1 , . . . , v n aufgespannt wird. Wir definieren das
ϕ((1, 1)) = (2, 2)
n-dimensionale Volumen dieses Parallelepipeds als 2 2
' (
2 0
voln (P ) = |det(v 1 , . . . , v n )| . (1, 1) A=
1 1 1 1
Für eine lineare Abbildung ϕ des Rn
erklären wir das Bild
ϕ(P ) als dasjenige Parallelepiped, welches von den n Bild- x1 x1
1 2 1 2
vektoren ϕ(v 1 ), . . . , ϕ(v n ) aufgespannt wird.
Abbildung 13.10 Der Flächeninhalt des Parallelogramms wird mit dem Faktor
Die lineare Abbildung ϕ habe die Darstellungsmatrix A = | det A| = 2 verzerrt.
En M(ϕ)En bezüglich der geordneten Standardbasis En , d. h.,
ϕ(v i ) = A v i für alle i = 1, . . . , n. Damit erhalten wir für
das n-dimensionale Volumen voln (ϕ(P )) des Bildes von P ?
aufgrund des Determinantenmultiplikationssatzes den Wert Welche linearen Abbildungen sind volumentreu, d. h. ändern
die Volumina nicht ?
|det(A v 1 , . . . , A v n )| = |det A det(v 1 , . . . , v n )| .
Zusammenfassung
Hierbei wird die Summe über die n ! Permutationen aus der Die Entwicklung nach beliebigen Zeilen und Spalten
symmetrischen Gruppe Sn gebildet, und es ist sgn(σ ) = ±1 Für A = (aij ) ∈ R n×n und beliebige r, s ∈ {1, . . . , n}
das Signum der Permutation σ . Die Determinante von A = gilt:
(aij ) ist somit eine Summe von Produkten von Komponen- Entwicklung nach der r-ten Zeile:
ten von A. Im Fall n = 2 bzw. n = 3 kann man sich die
Leibniz’sche Formel, die sich über n ! Summanden erstreckt, !
n
det A = (−1)r+s ars det Ars .
leicht merken, es gilt nämlich für n = 2:
s=1
⎛ ⎞
) ) + −
)a11 a12 ) a a Entwicklung nach der s-ten Spalte:
) ) ⎝ 11 12 ⎠
)a21 a22 ) =
a21 a22 !
n
det A = (−1)r+s ars det Ars .
und für n = 3: r=1
Zusammenfassung 493
Vorteilhaft ist die Entwicklung nach einer Zeile oder Spalte, Determinantenmultiplikationssatz
die viele Nullen enthält. Ist dies nicht der Fall, so kann man
Sind A, B ∈ R n×n , so gilt:
vorab Nullen erzeugen, indem man elementare Zeilen- oder
Spaltenumformungen durchführt. Dabei muss man die fol- det(A B) = det A det B.
genden Regeln beachten:
Vertauscht man zwei Zeilen oder Spalten, so ändert die Auch den Beweis dieses Satzes führten wir mit der Leib-
Determinante ihr Vorzeichen. niz’schen Formel. Mit ihrer Hilfe berechneten wir det(A B)
Addiert man zu einer Zeile oder Spalte das Vielfache einer und überzeugten uns durch geschicktes Umformen davon,
anderen Zeile oder Spalte, so ändert sich die Determinante dass dies gerade det A det B ergibt.
nicht.
Der Determinantenmultiplikationsatz ist zentral, schließlich
Multipliziert man eine Zeile oder Spalte mit einem Skalar
folgt aus ihm das für alles weitere wichtige Kriterium:
λ, so multipliziert sich auch die Determinante mit die-
sem λ.
Invertierbarkeitskriterium
Natürlich betreibt man diesen Aufwand, also die Erzeugung
von Nullen in einer Zeile oder Spalte der Matrix A und dar- Für eine Matrix A ∈ Kn×n sind die folgenden Aussagen
auffolgende Entwicklung nach dieser Zeile oder Spalte, nur gleichwertig:
dann, wenn nicht einer der beiden folgenden Sonderfälle von Die Matrix A ist invertierbar.
Matrizen vorliegt: Sind die Zeilen oder Spalten der Matrix A Es gilt det A = 0.
linear abhängig, so gilt det A = 0, und hat die Matrix A eine
Blockdreiecksgestalt, so ist det A das Produkt der Determi- Die Determinante hat verschiedene Anwendungen. So kann
nanten der Blöcke auf der Diagonalen. man mithilfe der Determinante das Inverse einer invertier-
baren Matrix bestimmen; man kann die Determinante auch
Dass man bei den Regeln zur Berechnung der Determinante
zur Flächenberechnung bei Vielecken im R2 einsetzen, und
det A einer quadratischen Matrix A nicht zwischen den Zei-
die Cramer’sche Regel ist eine Methode zur Lösung eines li-
len und den Spalten von A unterscheiden muss, liegt im We-
nearen Gleichungssystems, die auf der Determinante beruht.
sentlichen an dem folgendem Satz:
Tatsächlich ist aber die Determinante nicht unabdingbar zur
Lösung dieser Problemstellungen. Es gibt zu diesen Aufga-
Die Determinante einer transponierten Matrix ben andere Methoden, die meist effizienter sind. Wirklich
Für jede quadratische Matrix A ∈ R n×n gilt: benötigt wird die Determinante zur Bestimmung der Eigen-
werte einer Matrix. Das ist das Thema des nächsten Kapitels.
det(A) = det(A0 ) .
Abschließend bemerken wir noch, dass es auch möglich und
sinnvoll ist, von einer Determinante eines Endomorphismus
Beim Beweis haben wir die Leibniz’sche Formel auf A0 an-
eines endlich-dimensionalen Vektorraums V zu sprechen: Ist
gewandt und uns davon überzeugt, dass dies letztlich die For-
nämlich ϕ ein solcher Endomorphismus, so wähle eine Basis
mel für A ist.
B von V und bilde die Darstellungsmatrix A = B M(ϕ)B
Die Gültigkeit der oben erwähnten Regeln bei den elemen- und setze det ϕ = det A. Diese Definition ist unabhängig
taren Zeilen- oder Spaltenumformungen zur Erzeugung von von der Wahl der Basis. Dies beruht wiederum auf dem De-
Nullen haben wir mit dem Determinantenmultiplikationssatz terminantenmultiplikationssatz.
nachgewiesen:
494 13 Determinanten – Kenngrößen von Matrizen
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
13.2 • Hat eine Matrix A ∈ Rn×n mit n ∈ 2N + 1 und Zusatzfrage: Was haben Kaninchenpaare damit zu tun?
A = −A0 die Determinante 0?
13.8 •• Es seien V ein K-Vektorraum und n eine natür-
13.3 • Folgt aus der Invertierbarkeit einer Matrix A liche Zahl. Welche der folgenden Abbildungen ϕ : V n → K,
n > 1, sind Multilinearformen? Begründen Sie Ihre Antwor-
stets die Invertierbarkeit der Matix A0 ?
ten.
(a) Es sei V = K, ϕ : V n → K, (a1 , . . . , an )0 →
Rechenaufgaben a1 · · · an .
13.4 •• Bestimmen Sie die Determinante der Matrix (b) Es sei V = K, ϕ : V n → K, (a1 , . . . , an )0 → a1 +
⎛ ⎞ . . . + an .
0 0 a 0 (c) Es sei V = R2×2 , ϕ : V 3 → R, (X, Y , Z) →
⎜ 0 0 0 b⎟ Sp(XY Z). Dabei ist die Spur Sp(X) einer n × n-
A=⎜ ⎟
⎝ 0 c 0 0⎠ ∈ R
4×4
Matrix X = (aij ) die Summe der Diagonalelemente:
d 0 0 0 Sp(X) = a11 + a22 + · · · + ann .
mittels der Leibniz’schen Formel. 13.9 ••• Berechnen Sie die Determinante der reellen n ×
13.5 • Berechnen Sie die Determinanten der folgenden n-Matrix ⎛ ⎞
0 . . . 0 d1
reellen Matrizen: ⎜ .. . . ⎟
⎛ ⎞ ⎜. . d2 ∗ ⎟
⎛ ⎞ 2 0 0 0 2 A=⎜ ⎜ .⎟
⎟
1 2 0 0 ⎜0 2 0 2 0⎟ ⎝ 0 . . . . . . .. ⎠
⎜2 1 0 0⎟ ⎜ ⎟
A=⎜ ⎝0 0 3 4⎠
⎟ , B = ⎜0 0 2 0 0⎟
⎜ ⎟ dn ∗ . . . ∗
⎝0 2 0 2 0⎠
0 0 4 3
2 0 0 0 2 13.10 •• Es sei V = R2×2 sowie ϕ '
: V → (V definiert
1 −2
durch X → (A X − 2 X 0 ) mit A = ∈ R2×2 .
0 −1
13.6 •• Berechnen Sie die Determinante des magischen Bestimmen Sie det(ϕ).
Quadrats
16 3 2 13
Beweisaufgaben
5 10 11 8
9 6 7 12 13.11 •• Zeigen Sie, dass für invertierbare Matrizen
4 15 14 1 A, B ∈ Kn×n gilt:
13.12 ••• Zu jeder Permutation σ : {1, . . . , n} → 13.15 ••• Es seien K ein Körper und A ∈ Km×m ,
{1, . . . , n} wird durch fσ (ej ) = eσ (j ) für 1 ≤ j ≤ n ein B ∈ Kn×n . Die Blockmatrix A ⊗ B = (aij B)i,j =1,...,m ∈
Isomorphismus fσ : Kn → Kn erklärt. Es sei P σ ∈ Kn×n Kmn×mn heißt das Tensorprodukt von A und B. Zeigen
die Matrix mit fσ (x) = P σ x. Zeigen Sie P σ P τ = P σ τ , Sie
P −1 0 −1
σ = P σ −1 = P σ und P σ (aij )P σ = (aσ (i)σ (j ) ). Wel- det A ⊗ B = (det A)n (det B)m
che Determinante kann P σ nur haben?
(a) zunächst für den Fall, dass A eine obere Dreiecksmatrix,
13.13 ••• Für Elemente r1 , . . . , rn eines beliebigen Kör- ist;
pers K sei die Abbildung f : K → K, durch f (x) = (b) für beliebiges A.
(r1 − x)(r2 − x) · · · (rn − x) erklärt. Zeigen Sie:
) ) 13.16 •• Es sei x ein Element eines Körpers K, und
)r1 a a . . . a )
) ) An = ((x − 1)δij + 1)i,j =1,...,n ∈ Kn×n . Hierbei ist δij das
) b r2 a . . . a )
) )
) b b r3 . . . a ) = af (b) − bf (a) für a = b.
Kroneckersymbol: δij = 0 für i = j , und δii = 1. Zeigen
) ) a−b Sie:
) ........ )
) )
) b b b . . . rn ) det(An ) = (x − 1)n−1 (x + n − 1).
σ = τ1 ◦ · · · ◦ τk .
Lineare Abbildungen von Vektorräumen in sich sind im Allgemei- Zeile des Produkts DA ist das λi -Fache der i-ten Zeile zi
nen nicht einfach zu beschreiben. Bei endlichdimensionalen Vek- von A: ⎛ ⎞ ⎛ ⎞
torräumen ist es möglich, solche Abbildungen bezüglich einer z1 λ1 z1
⎜ ⎟ ⎜ ⎟
gewählten Basis des Vektorraums durch Matrizen darzustellen. A = ⎝ ... ⎠ ⇒ D A = ⎝ ... ⎠ .
Zu jedem Endomorphismus eines endlichdimensionalen Vektor-
zn λn zn
raums gehört eine Äquivalenzklasse von zueinander ähnlichen
Matrizen (Seite 456). Wir wollen aus jeder Äquivalenzklasse Und Potenzen einer Diagonalmatrix zu bilden, bedeutet
einen Repräsentanten bestimmen, der eine möglichst einfache Potenzen der Diagonaleinträge zu bilden, denn es gilt für
Form hat. Als besonders einfach betrachten wir dabei eine jedes k ∈ N:
Diagonalmatrix. Leider lässt sich nicht jeder Endomorphismus ⎛ ⎞ ⎛ k ⎞
so diagonalisieren, jedoch kann oft ein Repräsentant bestimmt λ1 · · · 0 λ1 · · · 0
⎜ ⎟ ⎜ ⎟
werden, der zumindest eine obere Dreiecksgestalt hat. Die Ur- D = ⎝ ... . . . ... ⎠ ⇒ D k = ⎝ ... . . . ... ⎠
sache dafür, ob es eine solche einfache Form gibt oder nicht, ist
0 · · · λn 0 · · · λkn
im zugrunde gelegten Körper K des Vektorraums zu suchen: Ist
K algebraisch abgeschlossen, d. h. zerfällt jedes nicht konstante ' (
1.8 0.8
Polynom über K in Linearfaktoren, so ist die Existenz einer ein- Für die reelle Matrix A = gilt
0.2 1.2
fachen Form gesichert. Insbesondere werden Polynome (siehe
Abschnitt 3.4) eine wesentliche Rolle im vorliegenden Kapitel ' ( ' (
2 17 12 3 1 33 28
spielen. A = 1/5 , A = ;
3 8 5 7 12
Die Vorteile von Diagonal- oder Dreiecksmatrizen liegen auf
der Hand – die Rechnung mit solchen Matrizen ist deutlich bei Diagonalmatrizen ist es viel einfacher Potenzen zu bilden.
einfacher als mit vollen Matrizen. Und wenn man bedenkt, dass Die Matrizenmultiplikation wird also mit Diagonalmatrizen
das Rechnen mit (Darstellungs-)Matrizen nichts weiter ist, als deutlich erleichtert. Es gibt noch einen weiteren Anlass, bei
das Anwenden von linearen Abbildungen, so sieht man, dass dem man sich Diagonalmatrizen wünscht, bei Darstellungs-
sich damit der Kreis zu den Anwendungen der Mathematik matrizen linearer Abbildungen – letztlich ist es aber auch
schließt. Tatsächlich werden die erzielten Ergebnisse in zahl- hier wieder nur die Vereinfachung der Matrizenmultiplika-
reichen Gebieten der Naturwissenschaften aber auch innerhalb tion, die man sich dabei zum Ziel setzt.
der Mathematik, z. B. bei den Differenzialgleichungssystemen,
benutzt.
Die Schlüsselrolle beim Diagonalisieren bzw. Triangulieren spie- Ein Endomorphismus heißt diagonalisierbar,
len Vektoren v, die durch einen Endomorphismus auf skalare wenn es eine Basis gibt, bezüglich der die
Vielfache λ v von sich selbst abgebildet werden – man nennt v Darstellungsmatrix diagonal ist
einen Eigenvektor und λ einen Eigenwert.
Eine lineare Abbildung nennen wir auch Endomorphismus,
Wir bezeichnen in diesem Kapitel mit K einen Körper. wenn die Bildmenge gleich der Definitionsmenge ist. Wir
betrachten nun einen Endomorphismus ϕ eines n-dimen-
sionalen Vektorraums V , n ∈ N:
14.1 Diagonalisierbarkeit
V → V,
ϕ:
v → ϕ(v).
Um unser Vorgehen zu motivieren, zeigen wir, welche Vor-
teile Matrizen in Diagonalgestalt gegenüber anderen quadra- Die Darstellungsmatrix des Endomorphismus ϕ bezüglich
tischen Matrizen haben. einer geordneten Basis A = (a 1 , . . . , a n ) bezeichnen wir
kurz mit A:
Die Multiplikation einer Diagonalmatrix D ∈ Kn×n mit Die i-te Spalte der Darstellungsmatrix ist der Koordinaten-
einem Vektor v = (vi ) ∈ Kn ist sehr einfach: vektor des Bildes des i-ten Basisvektors.
⎛ ⎞⎛ ⎞ ⎛ ⎞ Nehmen wir nun an, es gibt zur linearen Abbildung ϕ eine
λ1 · · · 0 v1 λ1 v1
⎜ ⎟⎜ ⎟ ⎜ ⎟ solche geordnete Basis B = (b1 , . . . , bn ), für die gilt:
D v = ⎝ ... . . . ... ⎠ ⎝ ... ⎠ = ⎝ ... ⎠ .
0 · · · λn vn λn vn ϕ(b1 ) = λ1 b1 , . . . , ϕ(bn ) = λn bn
Entsprechend einfach ist die Multiplikation einer Diagonal- mit λ1 , . . . , λn ∈ K; d. h., jeder Basisvektor wird auf
matrix D = diag(λ1 , . . . , λn ) mit einer Matrix A. Die i-te ein Vielfaches von sich abgebildet. Dann erhalten wir als
14.1 Diagonalisierbarkeit 499
Darstellungsmatrix von ϕ bezüglich einer solchen geordne- Nicht zu jedem Endomorphismus existiert eine solche Basis,
ten Basis B die Diagonalmatrix bei der jeder Basisvektor auf ein Vielfaches von sich abge-
⎛ ⎞ bildet wird. Ein einfaches Beispiel für einen solchen nicht
λ1 · · · 0 diagonalisierbaren Endomorphismus ist eine Drehung um
⎜ ⎟
B = B M(ϕ)B = (B ϕ(b1 ), . . . , B ϕ(bn )) = ⎝ ... . . . ... ⎠ den Ursprung um einen Winkel α ∈ (0, π).
0 · · · λn
Beispiel Bei einer Drehung δα um den Ursprung im R2
weil die Koordinatenvektoren der Bilder der Basisvektoren um einen Winkel α ∈ (0, π) gibt es keinen vom Nullvektor
b1 , . . . , bn bezüglich der Basis B eine solche einfache Ge- verschiedenen Vektor, der auf ein Vielfaches von sich selbst
stalt haben. Und wir haben weiterhin den Zusammenhang abgebildet wird (Abb. 14.2).
⎛ ⎞
λ1 · · · 0 x2
⎜ ⎟
B = ⎝ ... . . . ... ⎠ = S −1 A S
0 · · · λn
?
−1 1
b2 = −1
Was ist mit den Winkeln α = 0 und α = π?
−2
Nicht alle Endomorphismen lassen sich durch eine Diagonal-
Abbildung 14.1 Bei einer Spiegelung an der Geraden x2 = x1 wird der Vektor matrix darstellen, aber jene, für die das möglich ist, nennen
b1 auf 1 b1 und b2 auf −1 b2 abgebildet. wir diagonalisierbare Endomorphismen, genauer:
' ( ' (
1 1
Für die Elemente b1 = und b2 = gilt: Diagonalisierbare Endomorphismen
1 −1
Ein Endomorphismus ϕ : V → V eines n-dimensiona-
σ (b1 ) = 1 b1 und σ (b2 ) = −1 b2 , len Vektorraums, n ∈ N, heißt diagonalisierbar, wenn
es eine geordnete Basis B = (b1 , . . . , bn ) von V gibt,
d. h., dass für die geordnete Basis B = (b1 , b2 ) gilt: bezüglich der die Darstellungsmatrix B M(ϕ)B Diago-
' ( ' ( nalgestalt hat.
1 0 0 1
B M(σ )B = = S −1 S
0 −1 1 0
Die obige Spiegelung im R2 ist damit ein diagonalisierba-
' (
1 1 rer Endomorphismus, die Drehung im R2 um einen Winkel
mit S =
1 −1 α ∈ (0, π) dagegen nicht.
500 14 Normalformen – Diagonalisieren und Triangulieren
Eine Matrix heißt diagonalisierbar, wenn sie Nicht jeder Endomorphismus bzw. jede Matrix ist diagonali-
ähnlich zu einer Diagonalmatrix ist sierbar (siehe das Beispiel auf Seite 499). Zwei grundlegende
Fragen tauchen auf:
In den Aufgaben und Anwendungen zur Diagonalisierbar- Welche Endomorphismen bzw. Matrizen sind diagonali-
keit werden wir seltener Endomorphismen, sondern viel- sierbar?
mehr Matrizen diagonalisieren. Dabei nennen wir eine Wenn der Endomorphismus ϕ bzw. die Matrix A diago-
Matrix A ∈ Kn×n diagonalisierbar, wenn der Endomor- nalisierbar ist, wie bestimmt man effizient die Basis B
phismus mit B M(ϕ)B = D bzw. die Matrix S mit S −1 A S = D,
n
K → Kn , wobei D eine Diagonalmatrix ist?
ϕA :
v → A v Einen ersten Hinweis liefert das folgende Kriterium:
des Kn diagonalisierbar ist, d. h., dass es eine geordnete Ba-
sis B = (b1 , . . . , bn ) des Kn gibt, bezüglich der B M(ϕA )B 1. Kriterium für Diagonalisierbarkeit
Diagonalgestalt hat. Dies können wir nach der Transforma- Ein Endomorphismus ϕ : V → V eines n-dimensio-
tionsformel für quadratische Matrizen auf Seite 457 auch nalen Vektorraums V ist genau dann diagonalisierbar,
unabhängig vom Endomorphismus ϕA formulieren: wenn es eine geordnete Basis B = (b 1 , . . . , bn ) von
V mit der Eigenschaft
Diagonalisierbare Matrizen
ϕ(b1 ) = λ1 b1 , . . . , ϕ(bn ) = λn bn
Eine Matrix A ∈ Kn×n heißt diagonalisierbar, wenn
sie ähnlich zu einer Diagonalmatrix D ist, d. h., wenn es gibt. In diesem Fall ist D = B M(ϕ)B eine Diagonal-
eine invertierbare Matrix S ∈ Kn×n gibt, sodass matrix mit den Diagonalelementen λ1 , . . . , λn .
Eine Matrix A ∈ Kn×n ist genau dann diagonalisier-
D = S −1 A S bar, wenn es eine geordnete Basis B = (b1 , . . . , bn )
des Kn mit der Eigenschaft
eine Diagonalmatrix ist.
A b 1 = λ1 b 1 , . . . , A b n = λn b n
Nun könnte man zum einen meinen, dass wir die Endomor-
phismen unter den Tisch fallen lassen und nur noch von der gibt. In diesem Fall ist die Matrix D = S −1 A S mit
Diagonalisierbarkeit von Matrizen sprechen könnten. Tat- S = (b1 , . . . , bn ) eine Diagonalmatrix mit den Dia-
sächlich aber sind die Endomorphismen für die Theorie von gonalelementen λ1 , . . . , λn .
großer Bedeutung, vor allem dann, wenn wir zu den nicht dia-
gonalisierbaren Matrizen eine dennoch möglichst einfache Beweis: Es sei ϕ ein Endomorphismus eines n-dimen-
Darstellungsmatrix bestimmen werden. sionalen K-Vektorraums V . Der Endomorphismus ϕ ist ge-
Andererseits könnte man einwenden, dass wir die Matrizen nau dann diagonalisierbar, wenn eine geordnete Basis B =
nicht extra zu betrachten brauchen und anstelle von der Ma- (b1 , . . . , bn ) von V existiert mit
⎛ ⎞
trix A nur noch vom Endomorphismus ϕA sprechen sollten. λ1 0
Aber tatsächlich hat man es in den Anwendungen fast im- ⎜ .. ⎟
B M(ϕ)B = ⎝ . ⎠
mer mit Matrizen zu tun, sodass es etwas weltfremd wäre,
0 λn
wenn wir nur noch mit Endomorphismen hantieren würden.
Außerdem haben die Begriffe in der Sprache der Matrizen Dies ist gleichwertig mit
teils ein Eigenleben, wie bereits bei dem einfachen Begriff ϕ(b1 ) = λ1 b1 , . . . , ϕ(bn ) = λn bn .
der Diagonalisierbarkeit oben. Für eine Matrix A ∈ Kn×n folgt die Aussage aus dem er-
Wir werden im Folgenden daher viele Begriffe doppelt ein- sten Teil, indem man den Endomorphismus ϕA : Kn → Kn
führen, einmal für Endomorphismen, einmal für Matrizen. betrachtet.
Die Begriffe für die Endomorphismen benötigen wir mehr für Die Aussage D = S −1 A S mit S = (b1 , . . . , bn ) steht be-
die Theorie, die für die Matrizen für das tatsächliche Rechnen reits in der Transformationsformel für quadratische Matrizen
und das Anwenden der Theorie. auf Seite 457.
Beispiel Nach den beiden Beispielen auf Seite 499 ist die Eigenwerte und Eigenvektoren machen nur
Matrix ' ( gemeinsam einen Sinn
0 1
A=
1 0 Wir definieren Eigenwerte und Eigenvektoren gleichzeitig
diagonalisierbar, die Matrix für Endomorphismen und Matrizen.
' (
cos α − sin α Eigenwerte und Eigenvektoren
B=
sin α cos α
Man nennt ein Element λ ∈ K einen Eigenwert eines
für α ∈ (0, π ) jedoch nicht. Endomorphismus ϕ : V → V , wenn es einen Vektor
v ∈ V \ {0} mit
ϕ(v) = λ v
Von diagonalisierbaren Matrizen lassen sich gibt. Der Vektor v heißt in diesem Fall Eigenvektor
ganz einfach beliebig hohe Potenzen bilden von ϕ zum Eigenwert λ.
Man nennt ein Element λ ∈ K einen Eigenwert der
Eine der wichtigsten Eigenschaften von Diagonalmatrizen Matrix A ∈ Kn×n , wenn es einen Vektor v ∈ Kn \{0}
ist es, dass man Potenzen davon auf sehr einfache Art und mit
Weise bestimmen kann. Ist A ∈ Kn×n eine nicht notwendig Av = λv
diagonale, aber diagonalisierbare Matrix, so kann man sich
gibt. Der Vektor v heißt in diesem Fall Eigenvektor
mit einem Trick behelfen, um Potenzen von A zu berechnen.
von A zum Eigenwert λ.
Da A ∈ Kn×n diagonalisierbar ist, existiert eine invertierbare
Matrix S ∈ Kn×n mit
⎛ ⎞ Achtung: Der Nullvektor 0 ist kein Eigenvektor – für kei-
λ1 0 nen Eigenwert. Eine solche Definition wäre auch nicht sinn-
⎜ ⎟
D = S −1 A S = ⎝ ..
. ⎠ voll, da der Nullvektor sonst wegen
0 λn ϕ(0) = 0 = λ 0 für alle λ ∈ K
Diese Gleichung besagt Eigenvektor zu jedem Eigenwert wäre. Es ist jedoch durchaus
zugelassen, dass 0 ∈ K ein Eigenwert ist.
A = S D S −1 ,
Beispiel
also gilt für jedes k ∈ N: 1. Die Einheitsmatrix En ∈ Kn×n hat den Eigenwert 1, da
für jeden Vektor v ∈ Kn gilt:
Ak = (S D S −1 )k = S D S −1 S D S
−1
· · · S D S −1
En v = 1 v .
k−mal
= S D k S −1 . Damit kann En auch keine weiteren Eigenwerte haben,
da bereits jeder vom Nullvektor verschiedene Vektor des
Wir erhalten in diesem Fall die k-te Potenz von A durch Kn Eigenvektor zum' Eigenwert
( 1 ist.
Bilden der k-ten Potenz einer Diagonalmatrix und Bilden 3 −1
2. Die Matrix A = ∈C 2×2 hat wegen
des Produkts dreier Matrizen. 1 1
' ( ' ( ' (
Diesen Trick wenden wir bei den Fibonacci-Zahlen auf 1 2 1
Seite 513 an, um eine explizite Formel für die k-te Fibonacci- A = =2
1 2 1
Zahl herzuleiten. Aber dazu müssen wir erst herausfinden, ' (
wie man zu einer nicht diagonalen, aber diagonalisierbaren 1
den Eigenwert 2 und den Eigenvektor zum Eigenwert
Matrix A die auf Diagonalform transformierende Matrix S ' (
1
bestimmt. Dazu dienen Eigenwerte und Eigenvektoren. 1
2. Ebenso ist jedes Vielfache λ , λ ∈ C \ {0}, wegen
1
' ( ' ( ' (
14.2 Eigenwerte und Aλ
1
=λ
2
= 2λ
1
1 2 1
Eigenvektoren ein Eigenvektor zum
' Eigenwert
( 2.
0 1 2×2
Im Mittelpunkt aller bisherigen Überlegungen standen Vek- 3. Die Matrix A = ∈ Z2 hat wegen
1 0
toren v ∈ V \ {0}, für die ϕ(v) = λ v für ein λ ∈ K gilt. Wir ' ( ' (
geben diesen Vektoren v wie auch den zugehörigen Körper- 1 1
A =1
elementen λ Namen. 1 1
502 14 Normalformen – Diagonalisieren und Triangulieren
' (
1 Somit ist mit einem Eigenvektor v zu λ auch jedes vom Null-
den Eigenwert 1 und den Eigenvektor zum Eigen-
1 vektor verschiedene Vielfache μ v wieder ein Eigenvektor
wert 1. zu λ.
4. Nicht jede reelle Matrix
' besitzt
( Eigenwerte. So gibt es x2
0 −1
etwa zur Matrix A = ∈ R2×2 keine Eigenvek-
1 0 ϕ(v)
toren und damit auch keine Eigenwerte, denn die Glei-
chung v
' ( ' (
v1 v
A =λ 1 x1
v2 v2
liefert das System
μv
−v2 = λ v1 , v1 = λ v2 ,
Bald werden wir klären, wie wir den Eigenraum zu einem tematisch berechnen kann. Dabei behandeln wir zuerst den
Eigenwert λ bestimmen können. Zuerst untersuchen wir, wie Fall einer Matrix A ∈ Kn×n . Die Eigenwerte, Eigenräume
wir sämtliche Eigenwerte bestimmen können. und Eigenvektoren eines Endomorphismus ϕ : V → V eines
endlichdimensionalen K-Vektorraums V erhalten wir, indem
? wir die Eigenwerte, Eigenräume und Eigenvektoren einer den
Unter welchem anderen Namen ist Ihnen Eigϕ (0) bzw.
Endomorphismus darstellenden Matrix bezüglich irgendei-
EigA (0) noch bekannt?
ner geordneten Basis B von V bestimmen. Wir werden sehen,
dass es dabei egal ist, welche Basis man wählt.
Zu dem Invertierbarkeitskriterium einer Matrix auf Seite 483 Das wesentliche Hilfsmittel für die Bestimmung der Eigen-
gesellt sich nun ein weiteres. werte einer Matrix ist das charakteristische Polynom, das wir
mithilfe der Determinante erklären werden.
Invertierbarkeitskriterium
Eine Matrix A ∈ Kn×n ist genau dann invertierbar, wenn Kommentar: Hier lernen wir nun einen wesentlichen
0 ∈ K kein Eigenwert von A ist. Grund kennen, weswegen wir die Determinante einer Ma-
trix eingeführt haben. Wir benutzen die Determinante zur
Bestimmung des charakteristischen Polynoms einer Matrix
Beweis: Die Matrix A hat genau dann den Eigenwert 0,
A, dessen Nullstellen die Eigenwerte von A sind. Theore-
wenn das lineare Gleichungssystem (A | 0) vom Nullvektor
tisch könnten wir auch auf die Determinante verzichten. Das
verschiedene Lösungen besitzt. Das ist genau dann der Fall,
passiert auch in dem Lehrbuch von Sheldon Axler, Linear
wenn A einen Rang echt kleiner als n hat (Seite 431). Und
Algebra Done Right, Springer. Wir erläutern die Idee von
das ist nach dem Kriterium für Invertierbarkeit auf Seite 449
Sheldon Axler auf Seite 506.
gleichwertig damit, dass A nicht invertierbar ist.
) )
)1 − X 2 2 ))
Das charakteristische Polynom einer Matrix )
χA = det(A − X E3 ) = )) 2 −2 − X 1 ))
Das Polynom ) 2 1 −2 − X )
) )
χA = det(A − XEn ) )−2 − X 1 ))
)
= (1 − X) )
1 −2 − X )
= (−1)n X n + cn−1 X n−1 + · · · + c1 X + c0 ∈ K[X] ) ) ) )
)2 1 )) )2 −2 − X )
)
+ (−2) ) +2)) )
vom Grad n heißt charakteristisches Polynom der Ma- 2 −2 − X ) 2 1 )
trix A ∈ Kn×n . = −X 3 − 3 X 2 + 9 X + 27 = (3 − X) (−3 − X)2 .
Es gilt: Da 3 und −3 die einzigen Nullstellen des charakteristi-
schen Polynoms von A sind, sind 3 und −3 auch die ein-
λ ∈ K ist ein Eigenwert von A ⇔ χA (λ) = 0 .
zigen Eigenwerte von A.
Die Matrix A hat höchstens n Eigenwerte. Wir berechnen die Eigenwerte der Matrix
⎛ ⎞
−3 1 0 0 0
⎜−1 −1 0 0 0 ⎟
Die letzte Behauptung ist klar, da χA als Polynom vom Grad ⎜ ⎟
A=⎜ ⎜−3 1 −2 1 1 ⎟ ∈ R
⎟ 5×5
.
n über einem Körper K nicht mehr als n Nullstellen haben ⎝−2 1 0 −2 1 ⎠
kann (siehe den Satz auf Seite 94).
−1 1 0 0 −2
Kommentar: In anderen Büchern findet man auch die Zum Berechnen des charakteristischen Polynoms nutzen
Definition wir aus, dass die Matrix eine Blockdreiecksmatrix ist
(siehe den Merksatz auf Seite 481):
χA = det(X En − A) .
χA = det(A − X E3 )
Wegen det(X En − A) = (−1)n det(A − X En ) ist das für ) )
)−3 − X 1 0 0 0 ))
)
)
ungerades n zwar im Allgemeinen nicht das gleiche Polynom, ) −1 −1 − X 0 0 0 ))
) )
aber die Nullstellen, also die Eigenwerte, sind die gleichen. =)) −3 1 −2 − X 1 1 ))
) )
) −2 1 0 −2 − X 1 ))
)
Es folgen nun Beispiele für das Berechnen der Eigenwerte ) −1 1 0 0 −2 − X)
einer Matrix A ∈ Kn×n . Man berechnet hierzu das charakte- ) )
)
ristische Polynom χA und ermittelt dessen Nullstellen – dies )
)−3 − X
) )−2 − X 1 1 ))
1 )) ) )
sind die Eigenwerte von A. =)) ) )
) 0 −2 − X 1 ))
) −1 −1 − X) ) )
) 0 0 −2 − X )
Beispiel = (−2 − X)5 .
Wir berechnen die Eigenwerte der Matrix Der einzige Eigenwert von A ist also −2.
' ( Besonders einfach ist die Bestimmung der Eigenwerte von
3 4 Dreiecks- bzw. Diagonalmatrizen. Ist nämlich
A= ∈ Z2×2 .
1 1 5 ⎛ ⎞
λ11 ∗ . . . ∗
⎜ . ⎟
Es gilt: ⎜ 0 λ22 . . . .. ⎟
D=⎜ ⎜ . .
⎟ ∈ Kn×n
⎟
⎝ . .
) ) . . . . . ∗ ⎠
)3 − X
) 4 ))
χA = det(A − X E2 ) = ) 0 ... 0 λnn
1 1 − X)
etwa eine obere Dreiecksmatrix, so sind wegen
= (3 − X)(1 − X) + 1 = (2 − X)2 .
χD = (λ11 − X) (λ22 − X) · · · (λnn − X)
Da 2 die einzige Nullstelle des charakteristischen Poly- gerade die Diagonalelemente von D die Eigenwerte von
noms von A ist, ist 2 der einzige Eigenwert von A. D. Das gilt analog für untere Dreiecksmatrizen.
Wir berechnen die Eigenwerte der Matrix
⎛ ⎞
1 2 2 Die Summe der Hauptdiagonalelemente einer
A = ⎝2 −2 1 ⎠ ∈ R3×3 . Matrix ist die Spur der Matrix
2 1 −2
Drei Koeffizienten des charakteristischen Polynoms χA las-
Zuerst bestimmen wir wieder das charakteristische Poly- sen sich mithilfe von Größen der Matrix A genau angeben,
nom, indem wir nach der ersten Zeile entwickeln. es gilt nämlich:
14.3 Berechnung der Eigenwerte und Eigenvektoren 505
Für σ = id sind dies aber alles Polynome vom Grad kleiner- Es sei ϕ : V → V ein Endomorphismus eines n-dimen-
gleich n − 2. Man beachte: nur die Faktoren bii = aii − X sionalen Vektorraums V mit einer geordneten Basis B =
liefern Beiträge zu den Graden der Summanden, und falls (b 1 , . . . , bn ). Unter dem charakteristischen Polynom des
bi σ (i) = bii bereits (n − 1)-mal in einem Summanden auf- Endomorphismus χϕ von ϕ versteht man das charakteristi-
taucht, so gilt bi σ (i) = bii schon n-mal, d. h., σ = id, da σ sche Polynom der Darstellungsmatrix A = B M(ϕ)B :
eine Permutation ist.
χϕ = χA = det(A − X En ) .
Damit sind die beiden höchsten Koeffizienten des Polynoms
χA bereits bestimmt. Für den konstanten Koeffizienten c0 des Damit diese Definition sinnvoll ist, muss noch gezeigt wer-
charakteristischen Polynoms gilt: den, dass die Wahl der Basis B keine Rolle spielt; anders
formuliert: Wählt man irgendwelche Basen B und C von V ,
c0 = χA (0) = det(A − 0 En ) = det(A) , so müssen die charakteristischen Polynome
d. h., dass der konstante Koeffizient von χA die Determinante χBM (ϕ)B = det(B M(ϕ)B − X En ) und
von A ist.
χCM (ϕ)C = det(C M(ϕ)C − X En )
Für die restlichen Koeffizienten des charakteristischen Poly- gleich sein. Da je zwei Darstellungsmatrizen A und B ein
noms lassen sich keine solch prägnanten Formeln angeben. und desselben Endomorphismus zueinander ähnliche Dar-
stellungsmatrizen haben, d. h., da
Die Spur einer (quadratischen) Matrix A, das ist die Summe
a11 + · · · + ann der Hauptdiagonalelemente von A = (aij ) ∈ B = S −1 A S
506 14 Normalformen – Diagonalisieren und Triangulieren
mit einer invertierbaren Matrix S gilt, reicht es dazu aus, Wir gehen nun einen Schritt weiter und erklären, wie wir
folgendes Lemma zu beweisen: die Eigenräume und damit die Eigenvektoren zu den Eigen-
werten von A bestimmen können.
Lemma
Ist λ ∈ K ein Eigenwert der Matrix A ∈ Kn×n , so besteht der
Zueinander ähnliche Matrizen haben dasselbe charak-
Eigenraum aus dem Nullvektor und aus allen Eigenvektoren
teristische Polynom.
zum Eigenwert λ, und es gilt:
Beweis: Die zwei n × n-Matrizen A und B mit Einträgen : ;
EigA (λ) = v ∈ Kn | A v = λ v
aus einem Körper K seien zueinander ähnlich; d. h., es gelte : ;
= v ∈ Kn | (A − λ En ) v = 0 .
B = S −1 A S für eine invertierbare Matrix S ∈ Kn×n . Nun
berechnen wir das charakteristische Polynom von B, wobei
Also erhält man den Eigenraum EigA (λ) zum Eigenwert λ
wir S −1 S = En und den Determinantenmultiplikationssatz
durch Lösen des homogenen linearen Gleichungssystems
auf Seite 474 benutzen.
(A − λ En ) x = 0 .
χB = det(B − X En ) = det(S −1 A S − X S −1 S)
= det(S −1 ) det(A − X En ) det(S) Die Lösungsmenge dieses Systems ist der Eigenraum des
−1 Eigenwertes λ, und jeder vom Nullvektor verschiedene Vek-
= det(S ) det(S) det(A − X En )
tor dieses Eigenraums ist ein Eigenvektor zu dem Eigen-
= det(A − X En ) = χA . wert λ.
Damit ist gezeigt, dass die charakteristischen Polynome ähn-
licher Matrizen übereinstimmen.
Bestimmung des Eigenraums zum Eigenwert λ
Ist λ ein Eigenwert von A, so ist die Lösungsmenge des
Übrigens folgen aus diesem Lemma in Verbindung mit dem homogenen linearen Gleichungssystems
Lemma auf Seite 505 erneut die bereits bewiesenen Behaup-
tungen, dass zueinander ähnliche Matrizen dieselbe Deter- (A − λ En ) x = 0
minante haben (Seite 505). Wir erläutern das ausführlich:
Sind A und B ähnliche n×n-Matrizen, so gilt für die charak- der Eigenraum zum Eigenwert λ.
teristischen Polynome χA und χB nach dem eben bewiesenen
Lemma Ist λ ein Eigenwert der quadratischen Matrix A, so gibt es
χA = χB . einen Vektor v ∈ Kn , v = 0 mit A v = λ v. Also ist die
Dimension des Eigenraums EigA (λ) mindestens 1.
Mit dem Lemma auf Seite 505 gilt:
Durch eine Zeilenumformung erhalten wir Wir berechnen die Eigenräume der Matrix
' ( ' ( ⎛ ⎞
1 4 0 1 4 0 −3 1 0 0 0
→ .
1 4 0 0 0 0 ⎜−1 −1 0 0 0 ⎟
⎜ ⎟
A=⎜ ⎜−3 1 −2 1 1 ⎟ ∈ C
⎟ 5×5
.
Damit erhalten wir den Eigenraum zum Eigenwert 2: ⎝−2 1 0 −2 1 ⎠
<' (= −1 1 0 0 −2
1
EigA (2) = .
1
Wegen χA = (−2 − X)5 ist −2 der einzige Eigenwert
Wir bestimmen die Eigenräume der Matrix von A.
⎛ ⎞ Den Eigenraum EigA (−2) von A zum Eigenwert −2 er-
1 2 2 halten wir als Lösungsmenge des homogenen Systems
A = ⎝2 −2 1 ⎠ ∈ C3×3 .
2 1 −2 (A+2 E5 ) v = 0 , d. h.
⎛ ⎞
−3+2 1 0 0 0 0
Wegen χA = (3 − X) (−3 − X)2 hat A die beiden ver- ⎜ −1 −1+2 ⎟
⎜ 0 0 0 0 ⎟
schiedenen Eigenwerte 3 und −3. ⎜ −3 ⎟
⎜ 1 −2+2 1 1 0 ⎟
Wir berechnen zuerst den Eigenraum EigA (3) von A zum ⎝ −2 ⎠
1 0 −2+2 1 0
Eigenwert 3. Wir erhalten ihn als Lösungsmenge des ho-
−1 1 0 0 −2+2 0
mogenen Systems
Den Eigenraum eines Endomorphismus – und Wir betrachten diese, die Eigenräume erzeugenden Spalten-
damit die Eigenvektoren – erhält man mit vektoren als Koordinatenvektoren von 2×2-Matrizen bezüg-
dem Eigenraum einer Darstellungsmatrix lich der Basis E, damit erhalten wir die Eigenräume von ϕ:
<' ( ' (= <' (= <' (=
1 0 0 1 1 −1 1 1
Ist ϕ : V → V ein Endomorphismus des n-dimensionalen 0 1
,
1 0
,
1 −1
,
−1 −1
.
Vektorraums V mit der geordneten Basis B = (b1 , . . . , bn ),
so erhält man die Eigenwerte von ϕ als die Nullstel- =Eigϕ (0) =Eigϕ (2) =Eigϕ (−2)
len des charakteristischen Polynoms der Darstellungsmatrix
B M(ϕ)B , die wir einfacher mit A bezeichnen, A = B M(ϕ)B : ?
χϕ = det(A − X En ) . Prüfen Sie nach, dass die angegebenen Vektoren tatsächlich
Eigenvektoren von ϕ sind.
Es seien λ1 , . . . , λr ∈ K die verschiedenen Eigenwerte von
ϕ. Nun berechnen wir die Eigenräume und damit die Eigen-
vektoren der Matrix A:
(1)
EigA (λ1 ) = -b1 , . . . , b(1)
s1 . , Komplexe Eigenwerte und Eigenvektoren
.. reeller Matrizen treten paarweise auf
.
(r)
EigA (λr ) = -b1 , . . . , b(r)
sr . . Es ist oftmals mühsam und langwierig, die Eigenwerte und
Eigenräume einer Matrix zu bestimmen. Gerne greift man
Damit haben wir die Eigenvektoren der Darstellungsmatrix daher auf jeden Trick zurück, durch den man die Rechnungen
A = B M(ϕ)B des Endomorphismus ϕ : V → V bestimmt, vereinfachen oder abkürzen kann. Einen solchen Trick gibt
(i)
d. h. Vektoren bj ∈ Kn mit es bei komplexen Matrizen mit reellen Komponenten, d. h.
(i) (i) bei den Matrizen der Form
B M(ϕ)B b j = λi b j .
A = (aij ) ∈ Cn×n mit aij ∈ R .
Gesucht sind aber die Eigenvektoren des Endomorphismus ϕ.
Aber die findet man nun einfach mit dem Satz auf Seite 433.
(i) Zur Bestimmung der komplexen Eigenwerte und komplexen
Wir interpretieren die oben erhaltenen Eigenvektoren bj der
Darstellungsmatrix A = B M(ϕ)B als die Koordinatenvek- Eigenvektoren einer solchen Matrix A ist das folgende Er-
(i) (i)
toren bj = B bj der Eigenvektoren von ϕ bezüglich der gebnis nützlich.
Basis B, damit gilt dann:
Lemma
(i) (i)
B M(ϕ)B B bj = λi B bj . Für jede Matrix A ∈ Cn×n mit reellen Komponenten
aij gilt:
Beispiel Die Darstellungsmatrix des Endomorphismus (i) Ist λ ∈ C ein Eigenwert von A, so ist auch λ ein Eigenwert
ϕ : R2×2 → R2×2 , von A.
' (
1 1 (ii) Ist v = (vj ) ∈ Cn ein Eigenvektor von A zum Eigenwert
ϕ(X) = M X − X M mit M = λ, so ist v = (v j ) ein Eigenvektor von A zum Eigenwert λ.
1 1
bezüglich der geordneten kanonischen Basis E = (E11 , E12 ,
E21 , E22 ) von R2×2 ist Beweis: Das charakteristische Polynom χA einer Ma-
⎛ ⎞ trix A mit reellen Komponenten hat nur reelle Koeffizien-
0 −1 1 0 ten a0 , . . . , an , wie man der Leibniz’schen Formel für die
⎜−1 0 0 1 ⎟
A = E M(ϕ)E = ⎜ ⎝ 1 0 0 −1⎠
⎟ Determinante von Seite 471 entnimmt, d. h.:
0 1 −1 0 χA = a0 + a1 X + . . . + an X n ∈ R[X] .
Die Eigenwerte dieser Matrix A sind Ist λ ∈ C ein Eigenwert von A, so gilt χA (λ) = 0. Wegen
λ1 = 0, λ2 = 2, λ3 = −2 .
0 = 0 = χA (λ) = a0 + a1 λ + . . . + an λn
Als Eigenräume erhalten wir = a0 + a1 λ + . . . + an λ
n
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ n
? 1 0 @ ? 1 @ ? 1 @ = a0 + a1 λ + . . . + an λ
⎜0⎟ ⎜1⎟ ⎜ ⎟ ⎜1⎟
⎜ ⎟ , ⎜ ⎟ , ⎜−1⎟ , ⎜ ⎟ . = χA (λ)
⎝0⎠ ⎝1⎠ ⎝1⎠ ⎝−1⎠
1 0 −1 −1
ist auch das konjugiert Komplexe λ eine Nullstelle von χA ,
=EigA (0) =EigA (2) =EigA (−2) also auch ein Eigenwert von A.
510 14 Normalformen – Diagonalisieren und Triangulieren
Ist v = (vj ) ∈ Cn ein Eigenvektor von A = (aij ) zum Induktionsvoraussetzung: Die Behauptung sei für r − 1
Eigenwert λ, so gilt A v = λ v. Da die Komponenten aij von Eigenvektoren zu verschiedenen Eigenwerten λ1 , . . . , λr−1
A reell sind, gilt: korrekt.
⎛ n ⎞ ⎛ n ⎞ Induktionsschritt: Es seien v 1 , . . . , v r Eigenvektoren zu ver-
j =1 a1j v j j =1 a1j vj
⎜ ⎟ ⎜ ⎟ schiedenen Eigenwerten λ1 , . . . , λr . Aus der Gleichung
⎠=⎜ ⎟.
(aij ) (v j ) = ⎝ .. ..
. ⎝ . ⎠
n
a v n
a v μ1 v 1 + · · · + μr v r = 0 (14.1)
j =1 nj j j =1 nj j
mit μ1 , . . . , μr ∈ K folgt durch
Damit gilt A v = A v und daher
Multiplikation der Gleichung (14.1) mit der Matrix A:
Av = Av = λv = λv.
0 = A 0 =A (μ1 v 1 + · · · + μr v r )
Somit ist der komplexe Vektor v ein Eigenvektor zum Eigen-
= μ1 A v 1 + · · · + μr A v r
wert λ.
= μ1 λ1 v 1 + · · · + μr λr v r
? und durch
Bestimmen Sie'die komplexen
( Eigenwerte und Eigenvekto- Multiplikation der Gleichung (14.1) mit dem Eigen-
0 1 wert λr :
ren der Matrix .
−1 0
0 = λr 0 = λr (μ1 v 1 + · · · + μr v r )
= μ1 λr v 1 + · · · + μr λr v r .
14.4 Algebraische und Durch Gleichsetzen erhalten wir
geometrische Vielfachheit μ1 λ1 v 1 + · · · + μr λr v r = μ1 λr v 1 + · · · + μr λr v r .
wobei wir gleiche Linearfaktoren unter Exponenten ki sam- In dieser Situation gilt für die Summe der Exponenten
meln, siehe auch den Abschnitt auf Seite 94: k1 + · · · + kr = n. Die Matrix A hat dann die verschiede-
nen Eigenwerte λ1 , . . . , λr mit den jeweiligen algebraischen
χA = (λ1 − X)k1 · · · (λr − X)kr p ∈ K[X] . Vielfachheiten k1 , . . . , kr , insgesamt also n nicht notwendig
verschiedene Eigenwerte, die genau dann verschieden sind,
Dabei ist p ∈ K[X] der nicht weiter durch Linearfaktoren wenn n = r gilt.
teilbare Anteil des Polynoms χA . Das bedeutet, dass p keine
weiteren Nullstellen in K hat. Die Nullstellen λ1 , . . . , λr Im Fall K = C zerfällt für jede Matrix A ∈ Cn×n das Poly-
von χA sind die Eigenwerte von A. nom χA in Linearfaktoren, da wegen des Fundamentalsatzes
der Algebra jedes nicht konstante komplexe Polynom eine
Man nennt die Vielfachheit k der Nullstelle λ im charakte- Nullstelle in C hat. Damit können wir für jede komplexe n×n-
ristischen Polynom χA die algebraische Vielfachheit des Matrix A mit dem charakteristischen Polynom χA ∈ C[X]
Eigenwerts λ, und man sagt auch λ ist ein k-facher Eigen- folgern:
wert der Matrix A. Für die algebraische Vielfachheit k des
Eigenwerts λ benutzen wir auch die Schreibweise ma (λ), der
Buchstabe m steht dabei für multiplicity. Zur Anzahl der Eigenwerte komplexer Matrizen
Jede komplexe n × n-Matrix A ∈ Cn×n , n ∈ N, hat n
Es ist manchmal nützlich, die Eigenwerte mit ihren entspre-
nicht notwendig verschiedene Eigenwerte.
chenden algebraischen Vielfachheiten zu zählen, d. h., man
fasst einen k-fachen Eigenwert λ, k ≥ 2, auch auf als k (nicht
verschiedene) Eigenwerte.
Die geometrische Vielfachheit ist stets kleiner
Beispiel oder gleich der algebraischen Vielfachheit
Ist χA = X 4 − 2 X3 + 2 X 2 − 2 X + 1 ∈ R[X], so gilt:
Die algebraische Vielfachheit eines Eigenwerts λ ist die Viel-
χA = (1 − X)2 (1 + X2 ) fachheit der Nullstelle λ im charakteristischen Polynom χA .
Es gilt ein enger Zusammenhang zwischen der algebraischen
mit p = X2 +1. Die Matrix A hat also den einzigen Eigen- und der geometrischen Vielfachheit.
wert 1 der algebraischen Vielfachheit 2 oder kürzer: Die
Matrix A hat den zweifachen Eigenwert 1 oder ma (1) = 2. Unter der geometrischen Vielfachheit des Eigenwerts λ
Ist χA = X 4 − 2 X3 + 2 X 2 − 2 X + 1 ∈ C[X], so gilt: einer Matrix A versteht man die Dimension des Eigenraums
EigA (λ), also dim EigA (λ), wir schreiben mg (λ) für die geo-
χA = (1 − X)2 (i + X) (−i + X) . metrische Vielfachheit.
In diesem Fall hat die Matrix A den zweifachen Eigenwert Das kann man sich einfach merken: Geometrie spielt sich in
1 und die jeweils einfachen Eigenwerte i und −i, d. h., Räumen ab, daher ist es klar, den Dimensionsbegriff mit der
ma (1) = 2, ma (i) = 1, ma (−i) = 1. geometrischen Vielfachheit zu verknüpfen. Die Algebra be-
Ist χA = X 2 + 1 ∈ Z2 [X], so gilt: schäftigt sich mit dem Auflösen von Polynomen, daher wird
man den Exponenten eines Linearfaktors eines Polynoms mit
χA = (1 + X)2 . der algebraischen Vielfachheit bezeichnen.
In diesem Fall hat die Matrix A den zweifachen Eigen- Der Zusammenhang zwischen geometrischer und algebra-
wert 1.
ischer Vielfachheit eines Eigenwerts ist folgender:
v → A v bezüglich dieser Basis B hat die Form Dabei haben wir benutzt, dass wegen der Invertierbarkeit von
⎛ ⎞ S und S −1 die Dimensionen der Kerne von S −1 (B −λi En ) S
λ 0
und B − λi En übereinstimmen (siehe die Folgerung auf
⎜ .. ⎟
⎜ . B⎟ Seite 455).
B M(ϕA )B = ⎜
⎟
⎝0 λ ⎠
0 C
Zerfällt χA , und ist die algebraische
mit passenden Matrizen B ∈ Kr×(n−r) , C ∈ K(n−r)×(n−r) Vielfachheit für jeden Eigenwert gleich der
und 0 ∈ K(n−r)×r .
geometrischen, so ist A diagonalisierbar
Nach dem Satz auf Seite 476 gilt (man beachte die Block-
dreiecksgestalt der Matrix B M(ϕA )B ): Wir nehmen an, dass das charakteristische Polynom χA einer
Matrix A ∈ Kn×n über K in Linearfaktoren zerfällt, d. h.,
χA = χBM (ϕA )B = (λ − X)r χC .
Somit ist die algebraische Vielfachheit ma (λ) mindestens r, χA = (λ1 − X)k1 · · · (λr − X)kr
da evtl. χC noch durch λ − X teilbar ist.
mit verschiedenen λ1 , . . . , λr ∈ K. Es sind λ1 , . . . , λr die
Eigenwerte von A mit den jeweiligen algebraischen Viel-
Der Extremfall, nämlich dann wenn bei der zweiten Unglei- fachheiten k1 , . . . , kr , wobei k1 + · · · + kr = n.
chung Gleichheit anstelle von kleiner oder gleich gilt, d. h.,
mg (λ) = ma (λ), liefert das wesentliche Kriterium für die Ist nun für jeden der Eigenwerte λ1 , . . . , λr die geometri-
Existenz einer Basis des Kn , bestehend aus Eigenvektoren sche Vielfachheit gleich der algebraischen, so ist die Summe
einer Matrix A ∈ Kn×n . der Dimensionen der Eigenräume gerade die Dimension des
Vektorraums Kn .
Bevor wir dieses Kriterium formulieren, halten wir noch ein
Ergebnis für zueinander ähnliche Matrizen fest. Nach dem Weil Eigenvektoren zu verschiedenen Eigenwerten linear un-
Lemma auf Seite 507 haben zueinander ähnliche Matrizen abhängig sind (siehe den Satz zur linearen Unabhängigkeit
das gleiche charakterisitsche Polynom und damit auch die von Eigenvektoren auf Seite 510), erhalten wir in dieser Si-
gleichen Eigenwerte. Es gilt noch mehr: tuation die Existenz einer Basis B des Kn , die aus Eigen-
vektoren v 1 , . . . , v n der Matrix A besteht. Dabei trägt je-
Lemma der Eigenraum genauso viele linear unabhängige Vektoren
Die Eigenwerte zueinander ähnlicher Matrizen haben die zu dieser Basis bei, wie die algebraische Vielfachheit dieses
gleichen algebraischen und geometrischen Vielfachheiten. Eigenwerts angibt.
Beweis: Die Matrizen A und B aus Kn×n seien zuein- 3. Kriterium für Diagonalisierbarkeit
ander ähnlich, es gelte S −1 A S = B mit der invertierbaren
Eine Matrix A ∈ Kn×n ist genau dann diagonalisierbar,
Matrix S. Die charakteristischen Polynome χA und χB dieser
wenn
beiden Matrizen stimmen nach obiger Bemerkung überein.
das charakteristische Polynom χA in Linearfaktoren
Wir zerlegen das Polynom χA = χB soweit wie möglich in
zerfällt:
verschiedene Linearfaktoren
χA = (X − λ1 )ki · · · (X − λr )kr p = χB χA = (λ1 − X)ma (λ1 ) · · · (λr − X)ma (λr ) ,
für i = 1, . . . , r gilt. Für ein solches i gilt: Beweis: Es ist nur noch ⇒ zu begründen. Die Matrix A sei
also diagonalisierbar, und es seien λ1 , . . . , λr die verschie-
g (λi ) = dim(EigA (λi )) = dim(ker(A − λi En ))
mA denen Eigenwerte von A. Nach dem Kriterium für Diagona-
= dim(ker(S −1 B S − λi S −1 S)) lisierbarkeit auf Seite 502 existiert eine Basis {b1 , . . . , bn }
des Kn aus Eigenvektoren von A, und weil die geometrische
= dim(ker(S −1 (B − λi En ) S)) Vielfachheit stets kleiner gleich der algebraischen ist, gilt:
= dim(ker(B − λi En ))
!
r !
r
= dim(EigB (λi )) n= mg (λi ) ≤ ma (λi ) ≤ deg(χA ) = n .
= mB
g (λi ) . i=1 i=1
14.4 Algebraische und geometrische Vielfachheit 513
Anstelle der beiden ≤ gilt also sogar =. Aus der ersten entste- Die Matrix ' (
henden Gleichheit folgt sogleich mg (λi ) = ma (λi ) für alle A=
3 4
∈ Z2×2
5
i = 1, . . . , r und aus der zweiten entstehenden Gleichheit 1 1
folgt, dass das Polynom χA zerfällt.
hat wegen
χA = (2 − X)2
Wir erhalten hieraus die Folgerung:
den einzigen Eigenwert 2 der algebraischen Vielfach-
Folgerung
heit 2. Der Eigenraum EigA (2) von A lautet
Hat eine n × n-Matrix n verschiedene Eigenwerte, so ist
<' (=
sie diagonalisierbar. 1
EigA (2) = .
1
Das folgt aus obigem Kriterium, weil in diesem Fall das cha-
rakteristische Polynom zerfällt und für jeden Eigenwert die Damit hat der Eigenwert 2 die geometrische Vielfach-
algebraische Vielfachheit, die gleich 1 ist, mit der geometri- heit 1. Weil die geometrische Vielfachheit des Eigenwerts
schen Vielfachheit, die größer gleich 1 sein muss, überein- 2 echt kleiner der algebraischen ist, ist die Matrix nicht
stimmt. diagonalisierbar.
Dieses Ergebnis erwarteten wir bereits als Antwort auf die Die Matrix ⎛ ⎞
1 3 6
Frage auf Seite 510.
A = ⎝−3 −5 −6⎠
Um eine diagonalisierbare Matrix A ∈ Kn×n zu diagonali- 3 3 4
sieren, geht man zweckmäßigerweise so vor, wie wir es in
hat das charakteristische Polynom χA = −(2+X)2 (4−X),
der Übersicht auf Seite 515 geschildert haben.
also den zweifachen Eigenwert −2 und einfachen Eigen-
Wir führen das Verfahren an Beispielen durch. wert 4. Wir erhalten als Eigenräume
?⎛−1⎞ ⎛−2⎞@ ?⎛ 1 ⎞@
Beispiel
Für die Matrix EigA (−2) = ⎝ 1 ⎠ , ⎝ 0 ⎠ , EigA (4) = ⎝−1⎠ .
⎛ ⎞ 0 1 1
1 2 2
A = ⎝2 −2 1 ⎠ ∈ R3×3 Damit stimmen für jeden Eigenwert geometrische und al-
2 1 −2 gebraische Vielfachheit überein, d. h., dass die Matrix A
diagonalisierbar ist. Mit der Matrix
haben wir bereits in den Beispielen auf Seite 507 die
Eigenwerte und Eigenräume bestimmt. Wir erhielten S = (b1 , b2 , b3 ) ,
?⎛2⎞@ ?⎛−1⎞ ⎛−1⎞@ wobei
EigA (3) = ⎝1⎠ , EigA (−3) = ⎝ 0 ⎠ , ⎝ 2 ⎠ . ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
−1 −2 1
1 2 0
b1 = ⎝ 1 ⎠ , b2 = ⎝ 0 ⎠ , b3 = ⎝−1⎠ ,
Damit existiert eine Basis des R3 aus Eigenvektoren der 0 1 1
Matrix A. Die Matrix ist also diagonalisierbar, und es gilt gilt:
mit den Vektoren ⎛ ⎞
−2 0 0
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
2 −1 −1 S −1 A S = ⎝ 0 −2 0⎠ .
b 1 = ⎝ 1⎠ , b 2 = ⎝ 0 ⎠ , b 3 = ⎝ 2 ⎠ 0 0 4
1 2 0
?
und Wie ändert sich die Diagonalmatrix, wenn man in der Ma-
S = (b1 , b2 , b3 ) trix S zwei Spalten vertauscht?
die Gleichung:
⎛ ⎞
3 0 0
S −1 A S = ⎝0 −3 0 ⎠ Kennt man bereits einige Eigenwerte einer Matrix, etwa
0 0 −3 durch geometrische Überlegungen, so kann man gelegent-
lich mit einer einfachen Rechnung die restlichen Eigenwerte
? dieser Matrix bestimmen. Das liegt daran, dass das Produkt
Prüfen Sie dies nach, indem Sie S −1 A S tatsächlich be- aller Eigenwerte und die Summe aller Eigenwerte einer Ma-
rechnen. trix A bekannte bzw. oftmals leicht bestimmbare Kenngrößen
von A sind.
514 14 Normalformen – Diagonalisieren und Triangulieren
Wenn die Matrix A diagonalisierbar ist, so gelten (i) die algebraischen und geometrischen Vielfachheiten der
und (ii). jeweils gleichen Eigenwerte ähnlicher Matrizen überein-
Wenn (i) und (ii) gelten, so ist die Matrix A diagonali- stimmen, erhalten wir
sierbar.
g (λ) = mg (λ) = ma (λ) = ma (λ) ,
mA D D A
Wir beginnen mit der ersten dieser beiden Richtungen. Es
sei also A ∈ Kn×n eine diagonalisierbare Matrix. Wir d. h., dass (ii) gilt.
wollen zeigen, dass das charakteristische Polynom χA in Der Beweis ist naheliegend und durchsichtig aber etwas
Linearfaktoren zerfällt. Dazu bietet sich das folgende na- lang. Durch einen kleinen Trick können wir den Nach-
heliegende Vorgehen an: Da A diagonalisierbar ist, ist A weis von (i) und (ii) viel kürzer fassen: Ist A ∈ Kn×n
zu einer Diagonalmatrix D = diag(λ1 , . . . , λn ) ähnlich. diagonalisierbar, so gibt es zu den r verschiedenen Eigen-
Da die beiden Matrizen ähnlich sind, haben sie dasselbe werten λ1 , . . . , λr ∈ K eine Basis (b1 , . . . , bn ) des Kn
charakteristische Polynom. Und weil das charakteristische aus Eigenvektoren von A. Somit ist die Summe der Di-
Polynom einer Diagonalmatrix D = diag(λ1 , . . . , λn ) in mensionen der Eigenräume von A gleich n, d. h., es gilt
Linearfaktoren zerfällt, zerfällt auch das charakteristische n = ri=1 mg (λi ).
Polynom von A in solche:
Andererseits gilt ri=1 ma (λi ) ≤ n, da die Zahlen ma (λi )
χA = χD = (λ1 − X) · · · (λn − X) .
die Vielfachheiten der Nullstellen λi des charakteristi-
Damit ist bereits (i) gezeigt. Dieser Beweis basiert auf der schen Polynoms χA vom Grad n sind.
naheliegenden Idee, dass die Matrix A zu einer Diagonal-
Hat man nun erst einmal diese zwei Ungleichungen, so
matrix ähnlich ist. Wir können nun auch versuchen, die
erhält man wegen mg (λi ) ≤ ma (λi ) für jedes λi :
Aussage (ii) auf diese Art zu zeigen. Wir wollen zeigen,
dass die algebraische Vielfachheit ma (λ) für jeden Eigen- !
r !
r
D = diag(λ1 , . . . , λn ) ähnlich ist. Wir können die obige und damit wie im Beweis im Text (i) und (ii).
Beweisidee wieder aufgreifen und gehen den Umweg über Zur zweiten Richtung: Wenn (i) und (ii) gelten, so ist die
die zu A ähnliche Diagonalmatrix D: Wir zeigen, dass die Matrix A diagonalisierbar:
Behauptung für die Diagonalmatrix D gilt und wegen der
Je mehr Linearfaktoren sich vom charakteristischen Po-
Ähnlichkeit dann auch für A.
lynom χA abspalten lassen, um so mehr Eigenwerte hat
Die ähnlichen Matrizen A und D haben die gleichen cha- die Matrix A ∈ Kn×n . Zerfällt das Polynom χA gar, d. h.
rakteristischen Polynome und somit auch die gleichen Ei- es gilt (i), so gibt es die maximale Anzahl von Eigen-
genwerte λ1 , . . . , λr : werten, die mit ihrer algebraischen Vielfachheit entspre-
χA = (λ1 − X)k1 · · · (λr − X)k1 = χD . chend gezählt gerade n = dim Kn ist. Gilt nun zudem (ii)
Daher haben die gleichen Eigenwerte von A und D auch mg (λ) = ma (λ) für jeden Eigenwert λ von A, so gibt es
jeweils die gleichen algebraischen Vielfachheiten. Bei zu jedem Eigenwert die maximal mögliche Zahl linear un-
einer Diagonalmatrix ist aber natürlich die algebraische abhängiger Eigenvektoren. Zu jedem Eigenwert λ von A
Vielfachheit eines Eigenwerts stets gleich der geometri- stecken wir nun diese mg (λ) = ma (λ) vielen linear unab-
schen Vielfachheit dieses Eigenwerts, da die Dimension hängigen Eigenvektoren in eine Basis Bλ . Da Eigenvekto-
des Eigenraums EigD (λ) wegen ren zu verschiedenen Eigenwerten linear unabhängig sind,
⎛ ⎞ ist die Vereinigung B = Bλ1 ∪ · · · ∪ Bλr all dieser Basen
λ1 − λ 0
⎜ .. ⎟ Bλi für die verschiedenen Eigenwerte λ1 , . . . , λr von A
EigD (λ) = ker ⎝ . ⎠ linear unabhängig. Und da nun die Summe der geometri-
0 λr − λ schen Vielfachheiten mg (λi ) = |Bλi | gerade die Summe
gleich der Anzahl der Einträge λ in der Diagonalen ist, der algebraischen Vielfachheiten ma (λi ), also nach (ii)
und diese Anzahl ist gerade die algebraische Vielfachheit gleich n ist, gilt |B| = n. Also ist B eine Basis des Kn aus
von λ. Damit ist gezeigt, dass bei einer Diagonalmatrix D Eigenvektoren von A.
14.4 Algebraische und geometrische Vielfachheit 515
Bestimme das charakteristische Polynom χA von A. aus Eigenvektoren der Matrix A zu einer geordneten
Zerlege χA in Linearfaktoren Basis B = (b1 , . . . , bn ).
Mit der Matrix S = (b1 , . . . , bn ) gilt dann die Glei-
χA = (λ1 − X)ma (λ1 ) · · · (λr − X)ma (λr ) .
chung: ⎛ ⎞
Die r verschiedenen Nullstellen λ1 , . . . , λr sind die λ1 · · · 0
⎜ .. . . .. ⎟ −1
Eigenwerte der Matrix A. ⎝. . . ⎠ = S AS .
Bestimme Basen B1 , . . . , Br der r Eigenräume 0 · · · λn
EigA (λ1 ), . . . , EigA (λr ), dabei gilt:
Diese Gleichung muss nicht nachgeprüft werden, sie
|B1 | = ma (λ1 ), . . . , |Br | = ma (λr ) . gilt bereits nach Konstruktion. Es ist dabei b i ein Ei-
r genvektor zum Eigenwert λi – man achte also auf die
Ordne die Basisvektoren der Basis B = Bi des Kn Anordnung der Basisvektoren.
i=1
Kommentar: Dieses Ergebnis gilt sogar noch etwas allge- Kommentar: Wir haben ein Kriterium für die Diagonali-
meiner für alle Matrizen, deren charakteristisches Polynom sierbarkeit einer Matrix A hergeleitet: Wenn das charakteri-
in Linearfaktoren zerfällt. Wir begründen das auf Seite 544. stische Polynom χA in Linearfaktoren zerfällt und für jeden
516 14 Normalformen – Diagonalisieren und Triangulieren
Problemanalyse und Strategie: Wir geben diese Rekursionsvorschrift durch eine Matrix A ∈ R2×2 wieder und
gelangen durch Berechnen von Potenzen von A zu einer guten Näherungslösung für hinreichend große n.
Problemanalyse und Strategie: Wir bestimmen die Eigenwerte und Eigenvektoren der darstellenden Matrizen.
' ( ' (
Lösung: cos α2 − sin α2
gilt mit b1 = und b 2 = sowie
sin α2 cos α2
' σα :α R( → R die Spiegelung an der Geraden
Ist 2 2
cos( 2 ) S = (b1 , b2 ) die Gleichung:
- ., die mit der x1 -Achse einen Winkel α2 ∈ ' (
sin( α2 ) 1 0
[0, π[ einschließt, so gilt nach dem Beispiel auf Seite 439 S −1 A S =
' ( 0 −1
cos α sin α
σ = ϕA mit A = , also σ (x) = A x .
sin α − cos α Wir kommen zur Drehung. Ist δα : R2 → R2 die Drehung
' ( um den Winkel α ∈ [0, 2 π[ um den Ursprung, so gilt:
x2 a ' (
b cos α − sin α
e2 δ = ϕA mit A = , also δ(x) = A x .
sin α cos α
α/2 ' ( x2
e1 −b ' (
x1
a a
' ( e2 b
b
−a α
α
e1 x1
Zwar wissen wir durch das Bild, dass die Spiegelung σ ge-
nau zwei Geraden des R2 durch 0 auf sich selbst abbildet,
nämlich die Spiegelungsachse und die dazu senkrechte
Gerade. Die Vektoren v auf der Spiegelungsachse sind
Fixpunkte von σ , d. h., A v = v, während die Vektoren auf Wir wissen bereits, dass die Drehung δα – abgesehen
der dazu senkrechten Geraden durch σ auf ihre entgegen- von zwei Ausnahmefällen – keine Gerade durch 0 auf
gesetzten Vektoren abgebildet werden, d. h., A v = −v. sich selbst abbildet und somit keine Eigenwerte besitzt.
Also besitzt A die beiden Eigenwerte 1 und −1 mit zuge- Die beiden Ausnahmen sind die Drehung um den Winkel
' (
hörigen Eigenräumen. Wir wollen dies nun auch rechne- 1 0
risch nachweisen. Dazu bestimmen wir das charakteristi- α = 0, d. h., A = , und die Drehung um den Win-
0 1
sche Polynom der Matrix A. ' (
) ) −1 0
)cos α − X ) kel α = π, d. h., A = . In diesen beiden Fällen
) sin α ) 0 −1
χA = )
sin α − cos α − X) ist die Matrix A bereits diagonal, die Eigenräume sind in
beiden Fällen jeweils der ganze R2 .
= X2 − cos2 α − sin2 α = (1 − X) (−1 − X) .
Für α ∈ {0, π} bestätigen wir unsere Vermutung nun rech-
Also hat A die beiden einfachen Eigenwerte 1 und −1. nerisch und bestimmen das charakteristische Polynom χA :
Insbesondere ist also A diagonalisierbar. Wir bestimmen ) )
)cos α − X − sin α )
die Eigenräume zu den beiden Eigenwerten: χA = ) ) )
' ( sin α cos α − X )
cos α − 1 sin α
EigA (1) = ker , (α = 0)
sin α − cos α − 1 = X2 − 2 cos α X + 1 .
' (
−2 sin2 α2 2 sin α2 cos α2 Für die Nullstellen λ1/2 dieses Polynoms gilt:
= ker
0 0 1
' α α ( λ1/2 = cos α ± cos2 α − 1 2 .
− sin 2 cos 2
= ker
0 0 Für α ∈/ {0, π} gilt aber | cos α| < 1 und damit cos2 α −
<' α (=
cos 2 1 < 0. Also hat das Polynom χA = X 2 − 2 cos α X + 1 =
Also ist EigA (1) = auch für α = 0.
sin α2 0 im Fall α ∈/ {0, π} keine reellen Nullstellen, und damit
<' (=
− sin α2 hat in diesem Fall die Matrix A auch keinen Eigenwert.
Die Berechnung von EigA (−1) = verläuft
cos α2 Wir halten
' ( α ∈]0, 2 π[\{π} ist die Matrix
fest: Für jedes
analog. Wir'halten fest: Für(jedes α ∈ [0, π[ ist die Ma- cos α − sin α
A= nicht diagonalisierbar, und in den
cos α sin α sin α cos α
trix A = diagonalisierbar, und zwar Fällen α = 0 und α = π hat A bereits Diagonalform.
sin α − cos α
518 14 Normalformen – Diagonalisieren und Triangulieren
Eigenwert die algebraische Vielfachheit mit der geometri- Von den vielen verschiedenen Beweisen, die es gibt, ent-
schen übereinstimmt, so ist die Matrix A diagonalisierbar. scheiden wir uns für den wohl kürzesten. Dabei benutzen
Es ist natürlich mühsam, all diese Eigenschaften nachzuprü- wir wiederholt das Kronecker-Symbol
fen. Es wäre sehr nützlich, wenn wir einer Matrix noch viel
1 für i = j,
schneller, quasi ohne jede Rechnung ansehen könnten, dass δij =
0 für i = j.
sie diagonalisierbar ist. Und das geht oftmals, z. B. gilt: Jede
reelle symmetrische Matrix ist diagonalisierbar. Wir werden Beweis: Mithilfe der Matrix A = (aij ) bilden wir die
diese Tatsache in Kapitel 17 begründen.
Matrix B = A0 − X En = (bij ) ∈ K[X]n×n :
⎛ ⎞
a11 − X · · · an1
Die Matrix A ist Nullstelle ihres ⎜ .. .. .. ⎟
B=⎝ . . . ⎠ = (aj i − δij X) .
charakteristischen Polynoms a1n · · · ann − X
Wir betrachten zu einer Matrix A ∈ Kn×n das charakteristi- Und es sei C = (cij ) die Adjunkte zu B (Seite 485); es gilt:
sche Polynom C B = det(B) En = χA En ,
χA = (−1)n X n + cn−1 Xn−1 + · · · + c1 X + c0 ∈ K[X] . da A0 und A das gleiche charakteristische Polynom haben.
Wir betrachten diese Gleichheit von Matrizen nun kompo-
Nach dem Lemma auf Seite 446 können wir den Körper K nentenweise: Für alle j, k ∈ {1, . . . , n} gilt:
als einen kommutativen Teilring des Rings Kn×n auffassen.
Dabei identifizieren wir jedes Element λ ∈ K mit der Diago- !
n
cki bij = δj k χA .
nalmatrix λ En ∈ Kn×n :
i=1
⎛ ⎞
λ 0
Dies sind n2 Gleichungen im Polynomring K[X]. Wir setzen
⎜ ⎟
λ ←→ ι(λ) = ⎝ . . . ⎠ . nun für die Unbestimmte X die Matrix A ein und erhalten
0 λ !
n
cki (A) bij (A) = δj k χA (A) . (14.2)
Nach dem Merksatz zum Einsetzen in Polynome auf Seite 90 i=1
(wir setzen in diesem Satz R = K = ι(K) und S = Kn×n )
Wegen bij (A) = aj i En − δij A gilt für alle i = 1, . . . , n:
dürfen wir daher quadratische Matrizen M aus Kn×n in das
charakteristische Polynom χA für X einsetzen: !
n !
n
bij (A) ej = (aj i En − δij A) ej
χA (M) = (−1)n M n + cn−1 M n−1 + · · · + c1 M + c0 M 0 , j =1 j =1
dabei ist χA (M) ∈ Kn×n . Hierbei ist nun die Addition bzw. ! n
= aj i ej − A ei = 0 . (14.3)
Multiplikation die Matrizenaddition bzw. Matrizenmultipli- j =1
kation.
Nun folgt für alle k ∈ {1, . . . , n}:
Es gibt einen berühmten Satz, der besagt, dass das charakte-
ristische Polynom χA einer Matrix A eben diese Matrix als !
n
χA (A) ek = δj k χA (A) ej
Nullstelle hat, d. h. χA (A) = 0.
j =1
' (
0 1 (14.2) !
n !
n
Beispiel Die Matrix A = hat das charakteristi- = cki (A) bij (A) ej
−1 0
j =1 i=1
sche Polynom χA = X 2 + 1, und es gilt: ⎛ ⎞
' ( ' ( !
n !
n
−1 0 1 0 = cki (A) ⎝ bij (A) ej ⎠
χA (A) = A2 + E2 = +
0 −1 0 1 i=1 j =1
' (
0 0 (14.3)
= = 0. = 0.
0 0
Somit gilt χA (A) = 0.
Kommentar: Der von uns geführte Beweis des Satzes Es ist nicht unmittelbar klar, dass der Ausdruck ∞ 1 k
k=0 k! A
von Cayley-Hamilton wirkt für einen Neuling in der Mathe- überhaupt existiert und wieder eine komplexe Matrix ist. Wir
matik sicher ein bisschen wie algebraische Zauberei. Aber begründen nun, dass diese Definition sinnvoll ist. Unter der
die Umformungen und Schlüsse sind völlig korrekt, und es Konvergenz der Reihe
kommt das gewünschte Ergebnis heraus. Auf einen solchen
∞
!
Beweis kommt ein Student des ersten Studienjahrs ziemlich 1 k
sicher nicht selbstständig. Das erwartet man auch gar nicht. A
k!
k=0
Ein Student sollte sich von der Korrektheit dieses Beweises
überzeugen können, das sollte im ersten Studienjahr voll-
versteht man die Konvergenz aller n2 Komponentenfolgen
kommen ausreichen. Tatsächlich stammt die Beweisidee aus
einer völlig anderen algebraischen Theorie, der sogenannten
Modultheorie. Bei dortigen Rechnungen hatte man zufällig !
N
(Ak )ij
, 1 ≤ i, j ≤ n,
festgestellt, dass entsprechende Rechnungen mit Matrizen k!
k=0 N ∈N0
über Körpern gerade den Satz von Cayley-Hamilton bewei-
sen. So wurde dieser kurze und prägnante Beweis dieses Sat- N 1 k
zes gefunden (siehe A Course in Commutative Algebra, G.
der Folge k=0 k! A N ∈N0 ihrer Partialsummen. Nun zei-
gen wir:
Kemper, Springer). Jeder andere Beweis, der geometrische
und naheliegende Beweisideen benutzt, ist im Allgemeinen
deutlich länger und unserer Auffassung nach komplizierter Die Exponentialfunktion für Matrizen
als der hier angegebene Beweis. Für jede n × n-Matrix A ∈ Cn×n konvergiert die Reihe
∞
! 1 k
A .
14.5 Die Exponentialfunktion k!
k=0
nieren:
' (
∞
! 1 1
1 k 1 Beispiel Wir berechnen exp A für die Matrix A = .
e =
A
A = En + A + A2 + · · · . 0 0
k! 2!
k=0 Wegen Ak = A für k ≥ 1 gilt:
Hierbei werden Potenzen bezüglich der Matrizenmultiplika- ' ( ' ( ' ( ' (
tion gebildet, und das Summenzeichen beschreibt jetzt die 1 0 1 1 1 1 1 e e−1
eA = + + + ··· = .
Addition von Matrizen. 0 1 0 0 2 0 0 0 1
520 14 Normalformen – Diagonalisieren und Triangulieren
' ( −1
Und für die Matrix E12 =
0 1
∈ C2×2 gilt wegen E12
k = Die rechte Seite konvergiert für N → ∞ gegen eS A S .
' (
0 0 Wir begründen nun, dass die linke Seite gegen S −1 eA S
0 0 konvergiert, es folgt dann die Behauptung.
für k ≥ 2:
0 0
Dazu beachten wir, dass für eine n×n-Matrix X = (xij )
' ( ' ( ' ( ' ( die Einträge von S −1 X S Linearkombinationen der xij
1 0 0 1 1 0 0 1 1
eE12 = + + +· · · = . sind, genauer
0 1 0 0 2 0 0 0 1
⎛ (11) (1n) ⎞
i,j λij xij · · · i,j λij xij
⎜ ⎟
Achtung: Für eine Matrix A = (aij ) gilt im Allgemeinen: (∗) S −1 XS = ⎜ ⎝
..
.
..
.
..
.
⎟
⎠
(n1) (nn)
i,j λij xij · · · i,j λij xij
eA = (eaij ) .
(rs)
mit λij ∈ C, r, s ∈ {1, . . . , n}. Wir schreiben für jedes
Man erhält also eA
nicht einfach durch komponentenweises N ∈ N0
Bilden der Potenzen eaij . !N
(N ) 1 k
AN = (aij ) = A
k!
k=0
und beachten
Für diagonalisierbare Matrizen lässt sich eA
(∞)
explizit angeben lim AN = eA = (aij ) .
N →∞
In den beiden letzten Beispielen konnten wir nur deshalb eA Setzt man AN in (∗) für X ein, so erhält man:
explizit bestimmen, da wir Ak für alle natürlichen Zahlen ⎛ (11) (N ) (1n) (N ) ⎞
angeben konnten. Das ist im allgemeinen Fall natürlich nicht i,j λij aij ··· i,j λij aij
⎜ ⎟
so. Aber mithilfe der folgenden Rechenregeln können wir eA S −1 AN S = ⎜ .. .. .. ⎟.
⎝ . . . ⎠
für alle diagonalisierbaren Matrizen explizit bestimmen. (n1) (N ) (nn) (N )
λ
i,j ij a ij · · · λ
i,j ij a ij
Eigenschaften der Exponentialfunktion für Matrizen Nun bilden wir den Limes N → ∞, man beachte dabei,
dass in der Matrix rechts der Limes in jeder Komponente
Die Abbildung
gebildet wird; wegen der Additivität und der Homoge-
exp : Cn×n → Cn×n nität der Limesbildung, d. h.
! (rs) (N ) ! (rs) (N )
lim λij aij = λij lim aij
hat folgende Eigenschaften: N →∞ N →∞
i,j i,j
(a) Für alle A, B ∈ Cn×n mit A B = B A gilt:
(vgl. Seite 287), erhalten wir:
eA+B = eA eB . '! (
lim S −1 AN S = λ(rs) a (∞)
= S −1 eA S .
(b) Für jede invertierbare Matrix S ∈ Cn×n gilt: N →∞ ij ij
r,s
i,j
S −1 A S
S −1 eA S = e . (c) Es gilt
⎛ ⎞k ⎛ k ⎞
(c) Für Diagonalmatrizen gilt die Regel: λ1 · · · 0 λ ··· 0
!
N
⎟ ! 1 ⎜ .1
N
⎛ ⎞ ⎛ λ1 ⎞
1 ⎜. . .
⎝ . . . .. ⎠ = . . .. ⎟
λ1 · · · 0 e ··· 0 k! .
⎝.
k! . . .⎠
⎜ ⎟ ⎜ ⎟ k=0 0 · · · λn k=0 0 · · · λkn
exp ⎝ ... . . . ... ⎠ = ⎝ ... . . . ... ⎠ . ⎛ ⎞
N λk
0 · · · λn 0 · · · e λn 1
⎛ λ1 ⎞
⎜ ⎟ ··· 0
⎜k=0 k! ⎟ e
⎜ ⎟ N →∞ ⎜ . . ⎟
=⎜⎜ . ⎟ ..
.. ⎟ −→ ⎝ .. . .. ⎠ .
Beweis: ⎜ ⎟
⎝ N
λn ⎠
k 0 · · · e λn
(a) Die Behauptung eA+B = eA eB beweist man analog zu k!
k=0
jener für komplexe Zahlen auf Seite 398 (man beachte
hierzu auch Aufgabe 26.23).
(b) Aus S −1 Ak S = (S −1 A S)k folgt:
Beispiel Ein Beispiel dafür, dass eA+B = eA eB nicht all-
!
N
1 k !
N
1 −1 gemein gilt, liefern bereits
' die ( nicht miteinander
' (vertausch-
S −1 A S= (S A S)k . 1 0 0 1
k!
k=0
k!
k=0
baren Matrizen E11 = und E12 = . Mit den
0 0 0 0
14.6 Das Triangulieren von Endomorphismen 521
' (
oben berechneten Matrizen und der dritten Rechenregel gilt 0 −t
Die Matrix B = hat das charakteristische Polynom
nämlich: t 0
' ( ' ( χB ='X 2 +t( , also die beiden Eigenwerte i t und −i t. Es'sind
2
1 1 e e−1 (
exp(E11 + E12 ) = exp = , 1 1
0 0 0 1 t1 = ein Eigenvektor zum Eigenwert i t und t 2 =
' (' ( ' ( −i i
e 0 1 1 e e ein solcher zum Eigenwert −i t. Wir setzen T = (t 1 , t 2 ) und
exp(E11 ) exp(E12 ) = = .
0 1 0 1 0 1 erhalten
' ( ' (
1 1 −1 −i 1
Ist A ∈ Cn×n eine diagonalisierbare Matrix, so existieren T = und T = i/2 ,
−i i −i −1
eine invertierbare Matrix S ∈ Cn×n und komplexe Zahlen
λ1 , . . . , λn mit der Eigenschaft also
⎛ ⎞ ' ( ' (' (' (
λ1 · · · 0
0 −t i 1 1 ei t 0 −i 1
⎜ ⎟ =
S −1 A S = ⎝ ... . . . ... ⎠ = D , d. h., A = S D S −1 . exp
t 0 2 −i i 0 e−i t −i −1
0 · · · λn ' (
1 eit + e−it − 1i (eit − e−it )
= −it )
Nun erhalten wir mit obigen Rechenregeln: 21 it
i (e − e eit + e−i t
' (
e A = eS D S
−1
= S eD S −1 , cos t − sin t
= .
sin t cos t
womit wir eA für diagonalisierbare Matrizen stets berechnen
können.
Wir heben eine weitere interessante Formel für die Spur und
Die Exponentialfunktion für diagonalisierbare die Exponentialfunktion hervor.
Matrizen
Ist A ∈ Cn×n eine diagonalisierbare Matrix mit den Eigen-
Ist A ∈ Cn×n eine diagonalisierbare Matrix mit den
werten λ1 , . . . , λn , so gibt es eine invertierbare Matrix
Eigenwerten λ1 , . . . , λn und Eigenvektoren s 1 , . . . , s n ,
S ∈ Cn×n mit
so gilt mit S = (s 1 , . . . , s n ):
⎛ λ1 ⎞
⎛ ⎞ e ··· 0
e λ1 · · · 0 ⎜ ⎟
⎜ ⎟ eA = S ⎝ ... . . . ... ⎠ S −1 .
eA = S ⎝ ... . . . ... ⎠ S −1 .
0 · · · e λn
0 · · · e λn
Wir wenden auf diese Gleichheit die Determinante an und
Man kann demnach mit D und S die Matrix eA berechnen. erhalten unter Beachtung des Determinantenmultiplikations-
Wir zeigen dies an Beispielen. satzes und des Resultats von Seite 515:
Beispiel Wir berechnen für ein t ∈ C die komplexen Ma- det eA = (det S) (eλ1 +···+λn ) (det S −1 ) = eSp A .
trizen ' ( ' (
0 t 0 −t
exp und exp .
t 0 t 0
' ( Die Determinante von eA
0 t
Die Matrix A = hat das charakteristische Polynom Ist A ∈ Cn×n diagonalisierbar, so gilt:
t 0
χA ='X 2(− t 2 , also die beiden Eigenwerte t und −t. Es' sind
( det eA = eSp A .
1 1
s1 = ein Eigenvektor zum Eigenwert t und s 2 =
1 −1
ein solcher zum Eigenwert −t. Wir setzen S = (s 1 , s 2 ) und
erhalten
' ( ' ( 14.6 Das Triangulieren von
1 1 −1 −1
S= und S −1 = −1/2 , Endomorphismen
1 −1 −1 1
also
' ( ' (' t (' ( Wir gehen jetzt etwas weg von konkreten Berechnungen
0 t 1 1 1 e 0 −1 −1
exp =−
t 0 2 1 −1 0 e−t −1 1 und graben wieder etwas tiefer in der Theorie der linearen
' t −t −t
( Abbildungen. Daher stellen wir nun die konkreten Matri-
1 e +e e −e
t
= zen etwas in den Hintergrund und holen dafür die etwas
2 et − e−t et + e−t abstrakteren Endomorphismen eines endlichdimensionalen
' (
cosh t sinh t K-Vektorraums V hervor. Dabei behalten wir aber im Hin-
= .
sinh t cosh t terkopf, dass der Unterschied nur marginal ist: Nach Wahl
522 14 Normalformen – Diagonalisieren und Triangulieren
einer Basis B von V ist ein Endomorphismus ϕ von V nichts Wir betrachten nun eine besondere Art einer Basis eines n-
anderes als eine Matrix A (siehe Seite 437), dimensionalen K-Vektorraums V . Ist ϕ ein Endomorphis-
mus von V , so nennen wir eine geordnete Basis B =
A = B M(ϕ)B .
(b1 , . . . , bn ) von V eine Fahnenbasis für ϕ von V , falls
Nicht jeder Endomorphismus ist diagonalisierbar, genauer die Untervektorräume
gilt nach dem Kriterium von Seite 512: Der Endomorphismus
ϕA : V → V , v → A v mit A ∈ Kn×n ist genau dann -b1 . , -b1 , b2 . , . . . , -b1 , . . . , bn .
diagonalisierbar, wenn
ϕ -invariant sind, d. h., dass für jedes i = 1, . . . , n gilt:
(i) χA über K in Linearfaktoren zerfällt und
ϕ(-b1 , . . . , bi .) ⊆ -b1 , . . . , bi . .
(ii) ma (λ) = mg (λ) für jeden Eigenwert λ von A gilt.
Wir wollen in diesem Abschnitt zeigen, dass unter der Bei einer Fahnenbasis für ϕ von V hat man also eine auf-
Voraussetzung (i) der Endomorphismus ϕA triangulierbar steigende Folge von ineinander geschachtelten ϕ -invarianten
ist. Dabei nennen wir einen Endomorphismus ϕ eines n- Untervektorräumen von V :
dimensionalen K-Vektorraums triangulierbar, wenn es eine
-b1 . ⊆ -b1 , b2 . ⊆ · · · ⊆ -b1 , . . . , bn . .
geordnete Basis B von V gibt, bezüglich der die Darstel-
lungsmatrix B M(ϕ)B eine obere Dreiecksmatrix ist, d. h.,
⎛ ⎞
∗ ··· ∗ Beispiel
⎜ . . .. ⎟ Die kanonische Basis E2 = (e1 , e2 ) ist für den Endomor-
B M(ϕ)B = ⎝ . .⎠ phismus
0 ∗
' ( ' (' (
2 2 v1 −1 1 v2
Eine Matrix A ∈ Kn×n heißt triangulierbar, falls der Endo- ϕ: K → K , →
v2 0 −1 v2
morphismus ϕA triangulierbar ist, d. h., falls es eine invertier-
bare Matrix S ∈ Kn×n gibt mit eine Fahnenbasis des R2 , denn es gilt:
⎛ ⎞
∗ ··· ∗
⎜ ⎟ ϕ(-e1 .) ⊆ -e1 . und ϕ(R2 ) ⊆ R2 .
S −1 A S = ⎝ . . . ... ⎠ .
0 ∗ Ist ϕ ein diagonalisierbarer Endomorphismus eines
n-dimensionalen K-Vektorraums V , und ist B =
Dazu führen wir neue Begriffe ein. (b1 , . . . , bn ) eine geordnete Basis von V aus Eigenvek-
toren von ϕ, so ist B wegen
d. h., dass B = (b1 , . . . , bn ) eine Fahnenbasis für ϕ von V Abbildung 14.5 Disjunkte Kleeblätter stellen eine direkte Summe dar, die
Schnittmenge sich überlappender bzw. ineinanderliegender Kleeblätter sind
ist. wieder Kleeblätter, nämlich Untervektorräume.
(ii) ⇒ (i): Es sei B = (b1 , . . . , bn ) eine Fahnenbasis
für ϕ von V . Wir bestimmen die Darstellungsmatrix A =
und wegen ϕ(U1 ) ⊆ U1 , ϕ(U2 ) ⊆ U2 , ϕ(U3 ) ⊆ U3 erhal-
B M(ϕ)B . In der i-ten Spalte von A steht der Koordinaten-
ten wir
vektor des Bildes ϕ(bi ) des i-ten Basisvektors bi . Aufgrund
ϕ(V ) = ϕ(U1 ) ⊕ ϕ(U2 ) ⊕ ϕ(U3 ) .
der Voraussetzung gilt für jedes i ∈ {1, . . . , n}:
ϕ(bi ) ∈ -b1 , . . . , bi . , ?
Es sei U ein Eigenraum von ϕ zum Eigenwert λ. Wann gilt
sodass ϕ(U ) = U bzw. ϕ(U ) U ?
ϕ(bi ) = a1i b1 + · · · + aii bi .
Somit ist die Darstellungsmatrix eine obere Dreiecksmatrix: Daher können wir uns diagonalisierbare Endomorphismen
⎛ ⎞ wie in Abbildung 14.6 veranschaulichen.
a11 · · · a1n
⎜ .. . ⎟
A=⎝ . .. ⎠ ∈ K
n×n
. ϕ
0 ann
U1
ϕ(U1 )
Wenn wir einen Endomorphismus ϕ bzw. eine Matrix A tri- ϕ
angulieren wollen, müssen wir somit eine Fahnenbasis für ϕ
bzw. ϕA bestimmen. Der Beweis des folgenden Kriteriums ϕ(U3 )
für Triangulierbarkeit liefert den entscheidenen Hinweis dar- U2 U3 ϕ(U2 )
auf, wie man eine Fahnenbasis bestimmt. Bevor wir aber die- ϕ
sen entscheidenen Satz formulieren, geben wir ein Visuali-
sierung der bisher behandelten Normalformen Diagonalform ϕ(U1 ⊕ U2 ⊕ U3 ) = ϕ(U1 ) ⊕ ϕ(U2 ) ⊕ ϕ(U3 )
und obere Dreiecksform. Abbildung 14.6 Diagonalisierbare Endomorphismen bilden Eigenräume in
Eigenräume ab. Man beachte, dass ein evtl. vorhandener Eigenraum zum
Eigenwert 0 auf den trivialen Untervektorraum {0} abgebildet wird, d. h. ein
Kleeblatt verschwindet.
Diagonalisierbare und triangulierbare
Endomorphismen lassen sich veranschaulichen Ist ϕ hingegen ein triangulierbarer, aber nicht diagonalisier-
barer Endomorphismus, so können wir uns die ϕ -invarianten
Wir stellen uns Untervektorräume als Kleeblätter vor. Dabei Untervektorräume
stehen überlappende Kleeblätter für sich schneidende Un-
tervektorräume, und jedes Kleeblatt enthält den Nullvektor U1 = -b1 . ⊆ U2 = -b1 , b2 . ⊆ · · · ⊆ Un = -b1 , . . . , bn .
(siehe Abbildung 14.5).
einer Fahnenbasis für ϕ wie in der Abbildung 14.7 veran-
Ist ein Endomorphismus ϕ eines endlichdimensionalen K-
schaulichen.
Vektorraums V diagonalisierbar, so ist V die direkte Summe
seiner Eigenräume. Der Einfachheit halber (und weil Klee-
blätter üblicherweise drei Blätter haben) nehmen wir an, dass
Ein Endomorphismus ist genau dann
ϕ drei Eigenwerte hat, wir setzen
triangulierbar, wenn das charakteristische
U1 = EigA (λ1 ) , U2 = EigA (λ2 ) , U3 = EigA (λ3 ) . Polynom in Linearfaktoren zerfällt
Kommentar: Der Beweis lässt sich für die Triangulier- Als Darstellungsmatrix von ϕA bezüglich der Basis B erhal-
barkeit einer Matrix etwas durchsichtiger mit einem Matri- ten wir somit:
zenformalismus führen. Wir führen das in Aufgabe 14.10 ⎛ ⎞
2 1 −1 −1
durch. Jedoch ist die durch den Matrizenformalismus moti- ⎜0 2 0 0 ⎟
vierte Konstruktion der Fahnenbasis dann aufwendiger, so- ⎜
B1 M(ϕA )B1 = ⎝
⎟
0 2 2 0⎠
lange man mit Bleistift und Papier eine solche Basis bestim- 0 0 1 2
men will.
Und die Matrix S = (s 1 , . . . , s 4 ) erfüllt
Wie man nun tatsächlich einen Endomorphismus bzw. eine B1 M(ϕA )B1 = S −1 A S .
Matrix trianguliert, wird durch unseren Beweis nahegelegt.
Wir führen die Konstruktion einer Fahnenbasis an einem Bei- 2. Schritt: Wir kümmern uns nun um die 3 × 3-Untermatrix
spiel vor. ⎛ ⎞
2 0 0
B = ⎝2 2 0⎠
Beispiel Wir konstruieren eine Fahnenbasis des R4 für den 0 1 2
Endomorphismus ϕA : v → A v mit
⎛ ⎞ Der Endomorphismus ψ von U = -s 2 , s 3 , s 4 . mit der Dar-
2 0 0 0 stellungsmatrix B bezüglich der Basis (s 2 , s 3 , s 4 ) hat wegen
⎜2 2 0 0 ⎟
A=⎜ ⎟ χB = (2 − X)3 den dreifachen Eigenwert 2. Wegen
⎝1 −1 2 −1⎠ ⎛ ⎞ ?⎛ ⎞@
0 1 0 2 0 0 0 0
EigB (2) = ker ⎝2 0 0⎠ = ⎝0⎠
0 1 0 1
1. Schritt: Wegen χA = (2 − X)4 – man beachte die Block-
dreiecksgestalt der Matrix – hat der Endomorphismus ϕA den ist 0 s 2 + 0 s 3 + 1 s 4 = s 4 ein Eigenvektor zum Eigenwert 2
vierfachen Eigenwert 2. Als Eigenraum erhalten wir von ψ, d. h., Eigψ (2) = -s 4 ..
⎛ ⎞ ⎛ ⎞
0 0 0 0 ? 0 @ Wir ergänzen nun die linear unabhängige Menge {e3 , s 4 = e4 }
⎜2 0 0 0 ⎟ ⎜0⎟ der beiden aus den bisherigen Schritten gewonnenen linear
EigA (2) = ker ⎜ ⎟
⎝1 −1 0 −1⎠ = ⎝1⎠ .
⎜ ⎟
unabhängigen Vektoren e3 und e4 zu einer geordneten Basis
0 1 0 0 0 B2 des R4 :
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
Wir ergänzen die linear unabhängige Menge {e3 } zu einer 0 0 1 0
geordneten Basis B1 des R4 : ⎜⎜0⎟ ⎜0⎟ ⎜0⎟ ⎜1⎟⎟
B2 = ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝1⎠ , ⎝0⎠ , ⎝0⎠ , ⎝0⎠⎠ .
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
0 1 0 0 0 1 0 0
⎜⎜0⎟ ⎜0⎟ ⎜1⎟ ⎜0⎟⎟
B1 = ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝1⎠ , ⎝0⎠ , ⎝0⎠ , ⎝0⎠⎠ . =:t 1 =:t 2 =:t 3 =:t 4
Wir ergänzen nun die linear unabhängige Menge {e3 , s 4 = e4 , Potenzen von Matrizen in Jordan-Normalform
t 4 = e2 } der drei aus den bisherigen Schritten gewonnenen berechnet man mit der Binomialformel
linear unabhängigen Vektoren e3 , e4 und e2 zu einer geord-
neten Basis B3 des R4 : Nicht jede Matrix ist diagonalisierbar, so hat etwa die kom-
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞ plexe Matrix ' (
0 0 0 1 2 1
⎜⎜0⎟ ⎜0⎟ ⎜1⎟ ⎜0⎟⎟ A= ∈ C2×2
B3 = ⎜⎜ ⎟
⎝⎝1⎠ ,
⎜ ⎟,
⎝0⎠
⎜ ⎟,
⎝0⎠
⎜ ⎟⎟ .
⎝0⎠⎠
0 2
den Eigenwert 2 mit der algebraischen Vielfachheit 2 und
0 1 0 0
der geometrischen Vielfachheit 1 – nach dem Kriterium für
=:u1 =:u2 =:u3 =:u4 Diagonalisierbarkeit auf Seite 512 ist A also nicht diagona-
lisierbar.
Als Darstellungsmatrix von ϕA bezüglich dieser Basis B3
erhalten wir Wir berechnen nun Potenzen dieser Matrix A. Dazu schrei-
ben wir die Matrix als eine Summe einer Diagonalmatrix D
⎛ ⎞
2 −1 −1 1 und einer Matrix N , deren Quadrat die Nullmatrix ist,
⎜0 2 1 0⎟ ' ( ' (
B3 M(ϕA )B3 =⎜
⎝0 0 2 2⎠
⎟ 2 0 0 1
A= + .
0 2 0 0
0 0 0 2
=:D =:N
Und die Matrix U = (u1 , . . . , u4 ) erfüllt
Nun berechnen wir – etwas naiv, aber korrekt – mittels der
Binomialformel Potenzen von A:
B3 M(ϕA )B3 = U −1 A U .
k ' (
! k
Damit ist der Endomorphismus ϕA bzw. die Matrix A tri- Ak = (D + N)k = D k−i N i .
i
anguliert. Die Spalten u1 , . . . , u4 der Matrix U bilden eine i=0
Fahnenbasis für ϕA des R4 .
Wegen N 2 = 0 verkürzt sich diese Formel für k ≥ 1 auf
zwei Summanden. Es gilt also
? Ak = (D + N)k
Können Sie ein Kriterium dafür angeben, wann ein Endomor-
phismus ϕ eines n -dimensionalen K-Vektorraums V durch = D k + k D k−1 N
' k ( ' k−1 (' (
eine untere Dreiecksmatrix dargestellt werden kann ? 2 0 2 0 0 1
= + k
0 2k 0 2k−1 0 0
' k k−1
(
2 k2
= .
0 2k
einer Matrix N eine natürliche Zahl k, sodass N k = 0, so eine Blockdiagonalgestalt mit Jordan-Kästchen J 1 , . . . , J l
nennt man N nilpotent, und die kleinste Zahl r ∈ N mit hat. Dabei müssen die Diagonaleinträge λi der J i nicht ver-
N r = 0 nennt man den Nilpotenzindex von N . Mit der schieden sein, und es dürfen auch 1 × 1-Jordan-Kästchen
Binomialformel erhalten wir folgende Aussage. vorkommen.
so gilt im Fall D N = N D:
' ( Jordan-Matrizen mit zwei Jordan-Kästchen:
k k k−1 k
A = D +k D N +···+ D k−r−1 N r−1 .
r −1 ⎛ ⎞ ⎛ ⎞
3 0 1
1 0 ⎜ ⎟ ⎜0 ⎟
Je kleiner r ist, desto kürzer ist diese Summe, desto leichter , , ⎜
⎝ 2
⎟ ⎜
1 ⎠, ⎝
0 ⎟
⎠
also ist Ak zu berechnen. 2 0
0 2 −1
Wir werden bald sehen, dass jede Matrix in Jordan-Normal-
form die angegebenen Voraussetzungen erfüllt.
Jordan-Matrizen mit drei Jordan-Kästchen:
Beweis: (a) Weil U und W invariant sind unter ϕ, gilt (d) Wegen ϕ(W ) ⊆ Bild ϕ folgt die Behauptung sogleich aus
ψ(U ) ⊆ U und ρ(W ) ⊆ W . Folglich sind ψ und ρ Endo- Bild ϕ ⊆ W .
Schließlich gilt B1 = ∅ wegen ker ϕ ⊆ Bild ϕ, d. h., dass Wegen der Gleichungen (14.5) und (14.6) gelten die Inklu-
U = {0}. Es folgt W = V . sionen
Wir formulieren den letzten Hilfssatz. sodass mithilfe von (i) folgt:
Lemma 4
V = ϕ −1 (U ) + ϕ −1 (W ) ⊆ U + W + B + A
Es sei ϕ ein Endomorphismus eines n-dimensionalen K-
Vektorraums V . =U +W .
ϕ −1 (U ) ∩ ϕ −1 (W ) + U ⊕ A = ϕ −1 (U ) . (14.5)
U = U ⊕ A und W = W ⊕ B .
Kriterium für die Existenz einer Jordan-Normalform
Hieraus folgt U ⊆ U, W ⊆ W , und es gilt: Für einen Endomorphismus ϕ eines n-dimensionalen
K-Vektorraums V , n ∈ N, sind äquivalent:
U ⊆ ϕ −1 (U ) und W ⊆ ϕ −1 (W ) , (i) ϕ besitzt eine Jordan-Normalform.
(ii) Das charakteristische Polynom χϕ zerfällt über K
in Linearfaktoren.
d. h., dass U und W ϕ -invariant sind.
14.7 Die Jordan-Normalform 531
Beweis: (i) ⇒ (ii): Falls ϕ eine Jordan-Normalform be- Wegen (∗) besitzt T nach der Induktionsvoraussetzung eine
sitzt, so ist dies eine obere Dreicksmatrix. Somit zerfällt χϕ Jordan-Basis BT = (b1 , . . . , bk ) bezüglich ϕ|T . Die Dar-
über K in Linearfaktoren. stellungsmatrix
sodass wir für die Dimension des Bildes von ϕ − λ idV nach von T sind ϕ|T -invariant, also ϕ -invariant und schließlich
der Dimensionsformel auf Seite 427 erhalten: auch (ϕ − λ idV ) -invariant. Damit ist T die direkte Summe
zweier (ϕ − λ idV ) -invarianter Untervektorräume U und
dim Bild(ϕ − λ idV ) < n . (∗) W :
U ⊕ W = T = Bild(ϕ − λ idV ) .
Wir treffen eine Fallunterscheidung:
1. Fall. ker(ϕ − λ idV ) ⊆ Bild(ϕ − λ idV ): Wegen Lemma 3 Somit gibt es nach Lemma 4 Untervektorräume U und W
existieren (ϕ − λ idV ) -invariante Untervektorräume U und von V mit U ⊆ U und W ⊆ W , die unter ϕ − λ idV
W von V mit dim U, dim W < n und V = U ⊕ W . Da für invariant sind und V = U ⊕ W erfüllen. Da U , W = {0}
jedes u ∈ U und w ∈ W gilt: gilt, erhalten wir auch U, W = {0}. Nach Lemma 1 (d) gilt:
Da AT die Darstellungsmatrix von ϕ|T bezüglich BT ist, Wir schildern die Konstruktion einer Jordan-Basis und da-
muss somit μ = λ gelten, da andernfalls ker(ϕ|T −λ idT ) = mit der Jordan-Normalform zuerst an Beispielen. Das all-
{0} gelten würde. gemeine Vorgehen wird dann schnell klar. Vorher stellen wir
Hilfsmittel bereit, mit denen man in vielen Fällen eine Jordan-
Mit der Dimensionsformel von Seite 427 gilt nun: Normalform einer Matrix bestimmen kann, ohne eine Jordan-
Basis angeben zu müssen.
1 = dim ker(ϕ|T − λ idT )
Wir beginnen mit dem Fall, dass die Matrix A nur einen
= dim ker(ϕ − λ idV )
Eigenwert hat.
= n − dim Bild(ϕ − λ idV ) ,
Weiter gibt es wegen (ϕ − λ idV )(V ) = T ein bn ∈ V \ T gilt. Weil das charakteristische Polynom in Linearfaktoren
mit zerfällt, existiert zu A eine Jordan-Normalform J , d. h., es
(ϕ − λ idV )(bn ) = bn−1 . gibt eine Matrix S = (b1 , . . . , bn ) ∈ Kn×n mit
⎛ ⎞
J1
Da bn ∈ T , ist B = (b1 , . . . , bn ) eine Basis von V . Wegen ⎜ ⎟
.. −1
J =⎝ . ⎠ = S AS ,
⎛ ⎞
λ 1 Jl
⎜ .. .. ⎟
⎜ . . ⎟ wobei J 1 , . . . , J l Jordan-Kästchen sind.
M(ϕ) = ⎜ ⎟
B B ⎜ .. ⎟
⎝ . 1⎠ Da A und J ähnlich sind, haben A und J dasselbe charakte-
λ ristische Polynom und auch denselben Eigenwert λ mit der
gleichen algebraischen und geometrischen Vielfachheit. Da-
ist B eine Jordan-Basis von V bezüglich ϕ. mit haben also alle Jordan-Kästchen J 1 , . . . , J l nur λ als
Diagonaleinträge,
⎛ ⎞
Da über dem algebraisch abgeschlossenen Körper C jedes ⎛ ⎞ λ 1
J1 ⎜ ⎟
Polynom in Linearfaktoren zerfällt, erhalten wir die Folge- ⎜ .. .. ⎟
⎜ ⎟ ⎜ . . ⎟
rung: J =⎝ ..
. ⎠ mit J i =⎜
⎜
⎟
⎟
⎜ .. ⎟
⎜ . 1⎟
Jl ⎝ ⎠
λ
Jordan-Normalform komplexer Matrizen
Jeder Endomorphismus ϕ eines C-Vektorraums V be- für i = 1, . . . , l. Und wegen
sitzt eine Jordan-Normalform. Insbesondere ist jede mg (λ) = dim(ker(J − λ En ))
komplexe Matrix zu einer Jordan-Matrix ähnlich.
= Anzahl der Jordan-Kästchen von J ,
siehe etwa
⎛ ⎞
14.8 Die Berechnung einer ⎜
0
⎟
⎜ ⎟
Jordan-Normalform und ⎜
⎜
0 1 ⎟
⎟
⎜ 0 1 ⎟
Jordan-Basis ⎜ ⎟
J − λ E7 = ⎜ 0 ⎟
⎜ ⎟
⎜ ⎟
⎜ 0 1 ⎟
⎜ ⎟
In den folgenden Beispielen berechnen wir die Jordan- ⎝ 0 1⎠
Normalformen von Matrizen. Die Jordan-Normalform eines 0
Endomorphismus ϕ erhält man aus der Jordan-Normalform
einer und damit jeder Darstellungsmatrix von ϕ. erhalten wir damit:
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 533
Die Anzahl der Jordan-Kästchen Somit ist das Kästchen J j − λ Enj nilpotent mit Nilpotenz-
index nj . Folglich ist die ganze Matrix J − λ En auch nil-
Die Anzahl der Jordan-Kästchen einer Jordan-Normal-
potent. Und der Nilpotenzindex r von J − λ En ist das
form J zu einer Matrix A ∈ Kn×n zu dem Eigenwert λ
Maximum der Nilpotenzindizes der Jordan-Kästchen, also
ist die geometrische Vielfachheit mg (λ) des Eigenwerts
r = max{n1 , . . . , nl }.
λ von A.
Wegen J = S −1 A S gilt:
Damit ist die Jordan-Normalform von A genau dann eine
Diagonalmatrix, wenn die geometrische Vielfachheit von λ J − λ En = S −1 A S − λ S −1 S
gleich der algebraischen Vielfachheit ist. = S −1 (A − λ En ) S .
? Damit erhalten wir
Durch die Dimension der Eigenräume ist die Jordan-Normal-
form einer 3 × 3-Matrix A ∈ K3×3 bis auf die Reihenfolge
(J − λ En )k = 0 ⇔ S −1 (A − λ En )k S = 0
der Jordan-Kästchen eindeutig festgelegt. Welche wesentlich
verschiedenen Formen gibt es ? ⇔ (A − λ En )k = 0 .
erhalten wir sogleich: eine wesentliche Rolle spielen. Wir betrachten die folgende
⎛⎞ ⎛ ⎞ Kette:
1 2
?1 0 @ {0} ker
N ker
N .
⎜−1⎟ ⎜ 0 ⎟ ? @ ? @
EigA (2) = ⎜ ⎟ ⎜ ⎟ 2
⎝ 0 ⎠ , ⎝ 1 ⎠ und (A − 2 E4 ) = 0 . 1 1 0
= = ,
0 0 1
0 −1
Dabei ist ker N 1 gerade der Eigenraum zum Eigenwert i von
Weil die Dimension des Eigenraums 2 ist, hat die Jordan- A. Weil dieser Eigenraum eindimensional ist, können wir
Normalform zwei Jordankästchen zum Eigenwert 2. Weil die gleich folgern, dass es nur ein Jordan-Kästchen gibt, damit
kleinste natürliche Zahl k mit (A − 2 E4 )k = 0 gleich 2 ist, liegt die Jordan-Normalform bereits fest, wir benutzen im
ist das längste Jordankästchen ein 2 × 2-Kästchen. Damit hat Folgenden aber dieses Wissen nicht.
eine Jordan-Normalform zu A das Aussehen
⎛ ⎞ ?
2 1 Wie sieht die Jordan-Normalform aus?
⎜0 2 ⎟
⎜ ⎟
J =⎜ ⎟
⎜ ⎟
⎝ 2 1⎠ Wir wählen vielmehr ein Element b2 ∈ ker N 2 \ ker N 1 , und
0 2 zwar ' (
0
b2 = .
1
Hier ist die Jordan-Normalform sogar eindeutig, da ein Ver-
tauschen der Kästchen die Matrix nicht ändert. Dies ist gerade der Basisvektor, den wir zu einer Basis von
ker N ergänzt haben, um eine Basis von ker N 2 zu erhalten.
Weil wir nun das Aussehen der Jordan-Normalform J von A Dieser Vektor b2 erfüllt wegen seiner speziellen Wahl die
in diesem Beispiel kennen, könnten wir auch eine Jordan- folgenden Eigenschaften:
Basis konstruieren. Hierzu könnten wir ausnutzen, dass b2 ist kein Eigenvektor von A,
wir nun die Koordinatenvektoren der Bilder der Jordan- N b2 ∈ ker N 1 \ {0}.
Basisvektoren unter der Abbildung ϕA : v → A v kennen
Die zweite Eigenschaft gilt, weil b2 ∈ ker N 2 , d. h.,
– dies sind ja die Spalten von J , also der Darstellungs-
matrix der Abbildung v → A v bezüglich der Jordan-Basis 0 = N 2 b2 = N (N b2 ) ,
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 535
d. h., N b2 ∈ ker N 1 . Und N b2 = 0, da sonst b2 ∈ ker N 1 Beispiel Wir bestimmen eine Jordan-Basis und eine
gelten würde. Jordan-Normalform zur Matrix
⎛ ⎞
Wir setzen nun b1 = N b2 , 2 1 1 0 0 0
b1 = N b2 = (A − i E2 ) b2 = A b2 − i b2 . ⎜0 2 1 0 0 0 ⎟
⎜ ⎟
⎜0 0 2 0 0 0 ⎟
Nun gilt: A=⎜ ⎜ ⎟ ∈ R6×6 .
⎟
⎜0 1 0 2 1 −1⎟
b1 , b2 sind linear unabhängig, da b2 ∈ ker N 2 \ -b1 .. ⎝0 0 0 0 2 0 ⎠
A b1 = i b1 , da b1 ∈ ker N = EigA (i). 0 0 1 0 0 2
A b2 = 1 b1 + i b2 .
Wegen χA = (2 − X)6 existiert eine Jordan-Normalform
Also ist B = (b1 , b2 ) eine Jordan-Basis mit der Jordan-
' ( zu A.
Normalform
i 1
J = Wir berechnen für N = A − 2 E6 die Kette
0 i
zu A. {0} ker N 1 ker N 2 · · · ker N r = R6 .
Und mit der Matrix S = (b1 , b2 ) gilt J = S −1 A S.
Es gilt: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0
? ?⎜ ⎟ ⎜ ⎟ ⎜0⎟
⎜ ⎟ ⎜ ⎟ ⎜
Ist (b2 , b1 ) auch eine Jordan-Basis zu A? 0 0 ⎟@
⎜0⎟ ⎜0⎟ ⎜0⎟
ker N = ⎜ ⎟ , ⎜ ⎟ , ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜
⎟
⎜0⎟ ⎜1⎟ ⎜0⎟
⎝0⎠ ⎝0⎠ ⎝1⎠
Wir haben den Vektor b1 noch gar nicht explizit angegeben. 0 0 1
Wir haben auch an keiner Stelle vom speziellen Aussehen
des Vektors b2 Gebrauch gemacht, sondern nur von der Tat- und
sache, dass b2 ∈ ker N 2 \ ker N 1 gilt. Damit haben wir also ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0 0 0
ein Verfahren entwickelt, das für beliebige nicht diagonali- ?⎜ 0 ⎟ ⎜0⎟ ⎜0⎟ ⎜1⎟ ⎜0⎟@
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
sierbare 2 × 2-Matrizen A mit zerfallendem charakteristi- ⎜0⎟ ⎜0⎟ ⎜0⎟ ⎜0⎟ ⎜0⎟
schem Polynom anwendbar ist, um eine Jordan-Basis zu A ker N 2 = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜0⎟ , ⎜1⎟ , ⎜0⎟ , ⎜0⎟ , ⎜0⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
zu bestimmen. ⎝0⎠ ⎝0⎠ ⎝1⎠ ⎝0⎠ ⎝0⎠
0 0 1 0 1
Jordan-Basen von 2 × 2-Matrizen
Ist A ∈ K2×2 nicht diagonalisierbar und zerfällt das und
charakteristische Polynom von A in Linearfaktoren, so ker N 3 = R6 .
hat A einen zweifachen Eigenwert λ, und es ist B = Es gibt also 3 Jordan-Kästchen, und das größte ist ein 3 × 3-
(b1 , b2 ) mit Kästchen.
b2 ∈ ker N 2 \ ker N 1 und b1 = N b2 , Wir betrachten die Kette mit den zugehörigen Dimensionen
wobei N = A − λ E2 , eine Jordan-Basis zu A. 2 3 6
{0} ker
N ker
N = R
N ker
dim=3 dim=5 dim=6
Dieses Verfahren kann auf größere Matrizen übertragen wer-
den. Wir behandeln auf Seite 536 ausführlich weitere Bei- und gehen nun wie folgt vor, um eine Jordan-Basis
spiele. (b1 , . . . , b6 ) zu konstruieren:
? (i) Wir wählen einen Vektor b6 ∈ ker N 3 \ ker N 2 und
Können Sie eine Jordan-Basis und die Jordan-Normalform setzen b5 = N b6 ∈ ker N 2 und b4 = N b5 ∈ ker N.
zur Matrix A aus dem Beispiel auf Seite 536 für den Fall Dieser Durchlauf der Kette von hinten nach vorne liefert
ε = 2 angeben? ein 3 × 3-Jordan-Kästchen.
(ii) Wir wählen einen Vektor b3 ∈ ker N 2 \ ker N , der zum
Vektor b5 linear unabhängig ist – aus Dimensionsgrün-
Bei der durchgeführten Konstruktion entstehen automa-
den ist eine solche Wahl noch möglich –, und setzen
tisch die größten Jordankästchen unten: Das größte Jordan-
b2 = N b3 ∈ ker N. Dieser Durchlauf der Kette von
Kästchen hat genauso viele Zeilen wie die Kette {0}
hinten nach vorne liefert ein 2 × 2-Jordan-Kästchen.
ker N 1 ker N 2 · · · ker N r echte Inklusionen auf-
(iii) Wir wählen einen Vektor b1 ∈ ker N \ {0}, der zu den
weist, dies ist gerade der Nilpotenzindex r von N = A−λ E3 .
Vektoren b2 und b4 linear unabhängig ist – aus Dimen-
Mit den gesammelten Erfahrungen ist es nun nicht mehr sionsgründen ist eine solche Wahl noch möglich. Dieser
schwierig, Jordan-Basen zu größeren Matrizen zu bestim- Durchlauf der Kette von hinten nach vorne liefert ein
men. 1 × 1-Jordan-Kästchen.
536 14 Normalformen – Diagonalisieren und Triangulieren
Problemanalyse und Strategie: Wir unterscheiden nach den beiden Fällen ε = 1 und ε = 0. In beiden Fällen bilden
wir die Matrix N = A − 1 E2 , die Kette
{0} ker N 1 ker N 2 · · · R3
und wählen dann beim R3 beginnend sukzessive jeweils der Reihe nach die Vektoren b3 , b2 und b1 , um eine Jordan-Basis
(b1 , b2 , b3 ) zu A zu erhalten.
Wir schildern die Konstruktion in unserem Beispiel ausführ- Die Dimension des Hauptraums
lich: Zerfällt das charakteristische Polynom χA von A ∈ Kn×n
(i) Wir wählen in Linearfaktoren:
b6 = (0, 0, 1, 0, 0, 0)0 ∈ ker N 3 \ ker N 2 , χA = (λ1 − X)ma (λ1 ) · · · (λs − X)ma (λs ) ,
Wir erhalten: Hier bricht die Kette ab, weil der Eigenwert 2 die algebraische
Vielfachheit 3 hat. Es gehören also 3 Jordan-Basisvektoren
Zur Anzahl und Größe der Jordan-Kästchen zu dem Eigenwert 2, und diese finden wir in dieser Kette. An
Es sei A ∈ Kn×n eine Matrix mit zerfallendem charak- der Kette erkennen wir auch, dass es genau ein 3 × 3-Jordan-
teristischem Polynom χA . Ist λ ∈ K ein Eigenwert von Kästchen zum Eigenwert 2 gibt.
A mit der Kette der verallgemeinerten Eigenräume Wir wählen
Und es gilt: Falls λ ein Eigenwert von A ist, so steigt die Folge (rk (A, λ))k
monoton und konvergiert gegen die algebraische Vielfachheit
⎛ ⎞
0 des Eigenwerts λ.
?⎜
⎜0⎟@
⎟
⎜ Für jedes k ∈ N setzen wir weiter:
0⎟
ker(A − 4 E6 )1 = ⎜ ⎟
⎜0⎟ .
⎜ ⎟ ck (A, λ) = rk+1 (A, λ) + rk−1 (A, λ) − 2 rk (A, λ)
⎝1⎠
1 und zeigen:
Lemma
Der Jordan-Basisvektor b1 = (0, 0, 0, 0, 1, 1)0 liefert ein
Zerfällt das charakteristische Polynom χA von A ∈ Kn×n ,
1 × 1-Jordan-Kästchen.
so ist für jeden Eigenwert λ von A die Zahl ck (A, λ),
Wir erhalten mit der Jordan-Basis B = (b1 , . . . , b6 ) die k ∈ N, die Anzahl der Jordan-Kästchen der Länge k zum
Jordan-Normalform Eigenwert λ.
⎛ ⎞
4
⎜ ⎟ Beweis: Da für zueinander ähnliche Matrizen A und B
⎜ ⎟
⎜ 3 1 ⎟ für jedes k ∈ N0 die Zahlen rk (A, λ) und rk (B, λ) gleich
⎜ ⎟
⎜ 0 3 ⎟ sind, können wir ohne Einschränkung annehmen, dass A in
J =⎜ ⎟
⎜ ⎟ Jordan-Normalform vorliegt:
⎜ 2 1 0⎟
⎜ ⎟
⎝ 0 2 1⎠ ⎛ ⎞ ⎛λ 1 ⎞
i
0 0 2 J1
⎜ ⎟ ⎜ ... ... ⎟
A=⎝ ..
. ⎠ mit J i = ⎜
⎝
⎟ ∈ Kni ×ni
⎠
..
zu A. Jl . 1
λ i
Man kann das Verfahren zur Bestimmung einer Jordan-Basis für i = 1, . . . , l. Wegen der Dreiecksgestalt von A gilt:
allgemein schildern. Der Formalismus ist nicht ganz einfach,
man kann sich diesen Algorithmus auch nicht gut einprägen. !
l
rk (A, λ) = rk (J i , λ) .
Durch das Berechnen weniger Beispiele wird die Konstruk-
i=1
tion einer Jordan-Basis klar. Die Schwierigkeit, die bestehen
kann, haben wir bereits auf Seite 537 angedeutet: Es kann Nun sei i ∈ {1, . . . , l}.
eben passieren, dass beim zweiten Durchlauf der Kette zwei
1. Fall. λi = λ: Dann ist die Matrix J − λ Eni invertierbar.
Vektoren bi und bj aus ein und demselben verallgemeiner-
Somit ist auch (J − λ Eni )k für jedes k ∈ N0 invertierbar. Es
ten Eigenraum konstruiert werden, die jedoch linear abhän-
folgt:
gig sind. Somit können diese Vektoren nicht Elemente einer
rk (J i , λ) = ni für jedes k ∈ N
Jordan-Basis sein. Wir formulieren in einer Übersicht auf
Seite 540 einen Algorithmus, der dieses Problem bewältigt. und somit ck (J i , λ) = 0.
2. Fall. λi = λ: Dann hat die Matrix
⎛ ⎞
Die Jordan-Normalform einer Matrix ist bis 0 1
auf die Reihenfolge der Jordan-Kästchen ⎜ .. .. ⎟
⎜ . . ⎟
eindeutig bestimmt J i − λ E ni =⎜
⎜
⎟
⎟
⎝ ..
. 1⎠
0
Bei den bisherigen Beispielen zur Jordan-Normalform einer
Matrix A spielte die Matrix N = A − λ En eine Schlüssel- den Rang ni − 1, d. h., r1 (J i , λ) = ni − 1. Für die Potenzen
rolle. Mit den praktischen Erfahrungen, die wir in den Bei- (J i − λ Eni )k gilt:
spielen gesammelt haben, fällt es nun nicht mehr schwer, die
folgenden Ergebnisse nachzuvollziehen: n i − k , k ≤ ni ,
rk (J i , λ) =
Für eine Matrix A ∈ Kn×n , λ ∈ K und k ∈ N setzen wir 0, k > ni ,
sodass ⎧
rk (A, λ) = rg(A − λ En )k . ⎨ 0 , k < ni ,
ck (J i , λ) = 1 , k = ni ,
Die Zahl rk (A, λ) ist der Rang der Matrix (A − λ En )k . ⎩
0 , k > ni .
Falls λ kein Eigenwert von A ist, so gilt rk (A, λ) = n. Damit folgt die Behauptung.
540 14 Normalformen – Diagonalisieren und Triangulieren
tr ist eine geordnete Jordan-Basis des Hauptraums
Bi HauA (λ).
i=1
Die Vereinigung und Anordnung der Jordan-Basen aller
linear unabhängig ist. Haupträume liefert dann eine Jordan-Basis zu A.
Die ermittelte Formel kann dazu dienen, die Jordan-Normal- Zum Eigenwert λ = 2: Die Matrix
form einer Matrix zu ermitteln. Dazu ist es nicht notwendig, ⎛ ⎞
−5 −1 4 −3 −1
dass eine Jordan-Basis bestimmt wird. ⎜ 1 −1 −1 1 0 ⎟
⎜ ⎟
A − 2 E5 = ⎜⎜−1 0 0 0 0 ⎟
⎟
Beispiel Gegeben ist die Matrix ⎝ 4 1 −4 −7 1 ⎠
⎛ ⎞ −2 0 2 −2 −1
−3 −1 4 −3 −1
⎜ 1 1 −1 1
⎜ 0⎟ ⎟ hat den Rang 4. Der Rang der Matrix (A − 2 E5 )2 ist damit
A=⎜⎜−1 0 2 0 0⎟ ⎟∈C
5×5
. auch 4, da für die algebraische Vielfachheit 1 = ma (2) =
⎝ 4 1 −4 −5 1⎠ 5 − rg(A − 2 E5 ) gilt.
−2 0 2 −2 1
Damit erhalten wir
Als charakteristisches Polynom erhalten wir
c1 (A, 2) = r2 (A, 2) + r0 (A, 2) −2 r1 (A, 2) = 1 ,
4
χA = (2 − X) (1 − X) . =4 =5 =4
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 541
d. h., dass es (wie erwartet) genau ein Jordan-Kästchen der Wir sprechen immer von einer Jordan-Normalform und
Länge 1 zum Eigenwert 2 gibt. nicht von der Jordan-Normalform. Das liegt an der Tat-
sache, dass es zu einer Matrix durchaus verschiedene Jordan-
Zum Eigenwert λ = 1: Die Matrix
Normalformen geben kann. Es scheint aber so zu sein, dass
⎛ ⎞ sich je zwei verschiedene Jordan-Normalformen nur in der
−4 −1 4 −3 −1
⎜ 1 0 −1 1 0 ⎟ Anordnung der Jordan-Kästchen unterscheiden. Dass dem
⎜ ⎟
A − E5 = ⎜ ⎜−1 0 1 0 0 ⎟
⎟ tatsächlich so ist, können wir nun zeigen.
⎝ 4 1 −4 −6 1 ⎠
−2 0 2 −2 0 Zur Eindeutigkeit der Jordan-Normalform
Es seien A, B ∈ Kn×n zwei Matrizen mit zerfallendem
hat den Rang 3. Die Matrix
charakteristischem Polynom und zugehörigen Jordan-
⎛ ⎞ Normalformen J A , J B . Dann sind äquivalent:
1 1 −1 1 1
⎜1 0 −1 1 0⎟ (i) Die Matrizen A und B sind ähnlich.
⎜ ⎟
(A − E5 )2 = ⎜
⎜3 1 −3 3 1⎟⎟ (ii) Die Matrizen J A und J B stimmen bis auf die Rei-
⎝3 0 −3 3 0⎠ henfolge der Jordan-Kästchen überein.
−2 0 2 −2 0
Insbesondere ist die Jordan-Normalform einer Matrix
hat den Rang 2. Der Rang der Matrix (A − E5 )3 ist damit 1, bis auf die Reihenfolge der Jordan-Kästchen eindeutig
da für die algebraische Vielfachheit 4 = ma (1) = 5−rg(A− bestimmt.
2 E5 )3 gilt.
Beweis: (i) ⇒ (ii): Für jedes λ ∈ K und k ∈ N gilt
Damit erhalten wir
rk (A, λ) = rk (B, λ), d. h., dass ck (A, λ) = ck (B, λ). Somit
c1 (A, 1) = r2 (A, 1) + r0 (A, 1) −2 r1 (A, 1) = 1 , haben die ähnlichen Matrizen A und B gleich viele gleich
lange Jordan-Kästchen zu den gleichen Eigenwerten. Damit
=2 =5 =3
gilt (ii).
d. h., dass es genau ein Jordan-Kästchen der Länge 1 zum
(ii) ⇒ (i): Die Matrizen J A und J B sind ähnlich, da sie
Eigenwert 1 gibt. Weiter gilt:
dieselbe lineare Abbildung bezüglich verschieden sortierter
c2 (A, 1) = r3 (A, 1) + r1 (A, 1) −2 r2 (A, 1) = 0 , Basen darstellen. Wegen der Transitivtät der Ähnlichkeitsre-
lation ∼ von Matrizen folgt aus
=1 =3 =2
A ∼ JA ∼ JB ∼ B
d. h., dass es kein Jordan-Kästchen der Länge 2 zum Eigen-
die Ähnlichkeit von A und B.
wert 1 gibt. Weiter gilt:
Die n × n-Matrizen A und B seien ähnlich. Es gelte A und B haben dasselbe charakteristische Polynom.
B = S −1 A S. A und B haben dieselben Eigenwerte.
A und B haben dieselbe Determinante. Die algebraischen Vielfachheiten der Eigenwerte von
A und B haben dieselbe Spur. A und B stimmen überein.
Ist A invertierbar, so auch B. Die geometrischen Vielfachheiten der Eigenwerte von
Ist A diagonalisierbar, so auch B, die Diagonalformen A und B stimmen überein.
können gleich gewählt werden. Die Dimensionen der verallgemeinerten Eigenräume
Ist A triangulierbar, so auch B. zu einem Eigenwert λ von A und B stimmen überein.
Gibt es zu A eine Jordan-Normalform, so auch zu B,
die Jordan-Normalformen können gleich gewählt wer-
den.
' (
Beispiel 1
Wir wählen den Vektor b2 = ∈ ker(A − 2 E2 )2 \
0
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ' (
2 1 2 1 −2
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ker(A − 2 E2 ) und setzen b1 = (A − 2 E2 ) b2 = .
⎜
⎜ 2 ⎟ ⎜
⎟=⎜ 2 ⎟ ⎜
⎟+⎜
⎟
⎟
−4
⎜ 3 1⎟ ⎜ 3 ⎟ ⎜ 1⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
Damit ist B = (b1 , b2 ) eine geordnete Jordan-Basis, und es
3 3 hat A die Jordan-Normalform
' (
Nun können wir auch das angekündigte Beispiel angeben. 2 1
J =
0 2
Nun bestimmen wir eine Jordan-Basis zu A und eine zuge- ' man
Daraus erhält ( nach Berechnen der zweiten Zeile von
hörige Jordan-Normalform J . Das charakteristische Poly- −1 g0
' ( 19
SJ S das Ergebnis g20 = 20 · 219 .
1 g1
nom von A lautet χA = (2 − X)2 , und spannt den
2
eindimensionalen Eigenraum zum Eigenwert 2 der algebrai- Nun können wir auch die auf Seite 515 gemachte Behauptung
schen Vielfachheit 2 auf. beweisen:
544 14 Normalformen – Diagonalisieren und Triangulieren
Der Zusammenhang zwischen Spur, Determinante Kommentar: Der Satz von Cayley-Hamilton besagt, dass
und den Eigenwerten einer Matrix die Matrix A Nullstelle des charakteristischen Polynoms χA
ist, χA (A) = 0. Das (eindeutig bestimmte) normierte Poly-
Zerfällt das charakteristische Polynom χA der Matrix
nom μA minimalen Grades, das A als Nullstelle hat, nennt
A ∈ Kn×n in seine n Linearfaktoren, d. h.
man das Minimalpolynom von A. Zerfällt das charakteristi-
χA = (λ1 − X) · · · (λn − X) , sche Polynom χA in Linearfaktoren:
χA = (λ1 − X)s1 · · · (λr − X)sr ,
so gilt:
so gilt:
Sp A = λ1 + · · · + λn , det A = λ1 · · · λn . μA = (λ1 − X)l1 · · · (λr − X)lr ,
wobei 1 ≤ li ≤ si für i = 1, . . . , r die maximale Länge
eines Jordan-Kästchens zum Eigenwert λi ist. Das folgt un-
Beweis: Da χA zerfällt, ist A ähnlich zu einer Jordan- mittelbar aus einer Jordan-Normalform der Matrix A. Insbe-
Matrix J . Da die charakteristischen Polynome ähnlicher Ma- sondere ist das Minimalpolynom ein Teiler des charakteri-
trizen gleich sind, folgt die Behauptung wie auf Seite 515. stischen Polynoms. Man findet es unter den im Allgemeinen
wenigen Teilern von χA .
Zusammenfassung
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
S. 499 S. 508
Die Drehung mit α = 0 ist die Identität, hierbei wird jeder Im ersten Beispiel gilt etwa:
Vektor auf sich selbst abgebildet, sodass die Darstellungsma- ' ( ' (
trix bezüglich jeder geordneten Basis Diagonalgestalt hat – 1 1
A =2 .
sie ist die Einheitsmatrix E2 . Bei der Drehung mit α = π wird 1 1
jeder Vektor v ∈ R2 auf sein entgegengesetztes Element −v
abgebildet. Damit ist diese Abbildung auch diagonalisierbar,
die Darstellungsmatrix ist bezüglich jeder geordneten Basis S. 509
das Negative der Einheitsmatrix −E2 . Wegen
S. 502 1 0 1 0
ϕ( 01 ) = M E2 − E2 M = 0 = 0 01
Sie hat den einzigen Eigenwert 0, da für jeden Vektor v ∈ Kn
0v = 0v und
0 1 1 1 0 1 0 1 1 1
gilt. Jeder vom Nullvektor verschiedene Vektor des Kn ist ϕ 10 = 11 10 − 10 11
Eigenvektor zum Eigenwert 0. 0 1
=0=0 10
S. 503
Unter Kern des Endomorphismus ϕ bzw. der Matrix A (vgl. sind diese beiden Vektoren tatsächlich Eigenvektoren zum
Seite 427 und Seite 431). Eigenwert 0. Wir prüfen als Beispiel noch den angegebenen
Vektor des Eigenraums zum Eigenwert −2 nach, es gilt:
S. 507
Das Gleichungssystem ist jeweils das triviale Gleichungssys- 1 1 1 1
ϕ 1 1
−1 −1 = 11 −1 −1 − −1 −1
1 1 1 1
11
tem −2 −2 1 1
0=0 = 2 2 = −2 −1 −1 .
zu dem jeweils einzigen Eigenwert 1 bzw. 0, und der Lö-
sungsraum ist somit jeweils der ganze Kn . Jeder vom Null- S. 510
vektor verschiedene Vektor ist ein Eigenvektor zum Eigen- ±i; Ei-
Die Eigenwerte sind die konjugiert komplexen Zahlen ' (
wert 1 der Einheitsmatrix bzw. zum Eigenwert 0 der Null- 1
genvektoren sind die konjugiert komplexen Vektoren .
matrix. ±i
548 14 Normalformen – Diagonalisieren und Triangulieren
S. 510 S. 526
Weil es zu jedem Eigenwert auch einen Eigenvektor gibt, Das ist auch genau dann der Fall, wenn das charakteristische
und Eigenvektoren zu verschiedenen Eigenwerten linear un- Polynom χϕ in Linearfaktoren zerfällt. Ist (b1 , . . . , bn ) eine
abhängig sind, existiert zu einer solchen Matrix A also eine Basis von V bezüglich der ϕ obere Dreiecksgestalt hat, so ist
Basis aus Eigenvektoren – eine solche Matrix A ist damit (bn , . . . , b1 ) eine Basis von V bezüglich der ϕ eine untere
diagonalisierbar. Dreiecksgestalt hat.
S. 511 S. 529
Der Eigenwert 1 von A hat die algebraische Vielfachheit 2 Weil wir für einen Endomorphismus des Nullraums {0} kein
und der Eigenwert −3 die algebraische Vielfachheit 4.√Und charakteristisches Polynom erklärt haben. Mit der Vereinba-
die beiden konjugiert komplexen Eigenwerte − 12 (1 ± 3 i) rung χϕ = 1, falls U = {0}, hätten wir den Beweis auch für
haben jeweils die algebraische Vielfachheit 1. beliebige U (und W ) formulieren können.
S. 513
S. 529
Es gilt:
⎛ ⎞ ⎛ ⎞ Z. B.:
2 −1 −1 4 2 2
1
S = ⎝1 0 2 ⎠ und S −1 = ⎝−2 −1 5 ⎠
12
1 2 0 −2 5 −1
und weiter: ϕ−1 (U )
⎛ ⎞⎛ ⎞⎛ ⎞
4 2 2 1 2 2 2 −1 −1 W
1 ⎝
−2 −1 5 ⎠ ⎝2 −2 1 ⎠ ⎝1 0 2 ⎠
12
−2 5 −1 2 1 −2 1 2 0 U
⎛ ⎞
3 0 0
ϕ(U )
= ⎝0 −3 0 ⎠ .
0 0 −3
S. 513
Es vertauschen sich die zugehörigen Eigenwerte in der Dia-
gonalmatrix.
S. 515 S. 533
' (
0 1 Drei verschiedene Eigenwerte λ1 , λ2 , λ3 : Es gibt nur eine
Es gilt etwa für die komplexe Matrix A = mit dem
−1 0 Jordan-Normalform, nämlich
charakteristischen Polynom χA = (i − X) (−i − X) und den ⎛ ⎞
beiden Eigenwerten −i, i: λ1
⎜ ⎟
⎜ ⎟
det A = 1 = (−i) i und Sp A = 0 = −i + i . ⎜ λ2 ⎟
⎝ ⎠
λ3
S. 518
Ein erster Hinweis dafür, dass dieser „Beweis“ nicht in Ord- Zwei verschiedene Eigenwerte λ1 , λ2 : Es gibt zwei wesent-
nung ist, liefert die Tatsache, dass bei diesem „Beweis“ ein lich verschiedene Jordan-Normalformen, nämlich
Widerspruch im Fall n > 1 entsteht: ⎛ ⎞ ⎛ ⎞
λ1 λ1
K n×n
8 0 = χA (A) = 0 ∈ K . ⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ λ2 ⎟ und ⎝ λ2 1 ⎠
Tatsächlich wurde hier die Matrix A falsch eingesetzt, die ⎝ ⎠
Multiplikation bei X En in A − X En ist die Multiplikation λ2 λ2
mit Skalaren, durchgeführt wurde aber bei A − A En die
Matrizenmultiplikation. Dass der „Beweis“ falsch ist, wird Ein Eigenwert λ: Es gibt drei wesentlich verschiedene
ganz offensichtlich, wenn man sich überlegt, was sich für Jordan-Normalformen, nämlich
das Polynom q(Y ) = Sp(A − Y En ) ergäbe.
⎛ ⎞ ⎛ ⎞
λ ⎛ ⎞
S. 523 ⎜ ⎟ ⎜ λ λ 1
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ ⎟, ⎝ ⎟
Wegen ϕ(u) = λ u für jedes u ∈ U gilt ϕ(U ) ⊆ U . Weiter
⎝
λ
⎠ λ 1 ⎠ und ⎝ λ 1⎠
gilt ϕ(U ) = U genau dann, wenn λ = 0 ist, denn: ϕ(U ) = U λ λ
λ
bedeutet ϕ|U : u → λ u ist surjektiv, d. h. λ = 0.
Antworten der Selbstfragen 549
S. 533 S. 535
⎛ ⎞ Nein,
' (die Darstellungsmatrix bezüglich dieser Basis ist
⎜ 1 ⎟
i 0
⎜ ⎟ . Bei unserer Definition stehen die Einsen oberhalb
⎜ ⎟ 1 i
⎜ 1 ⎟
⎜ ⎟ der Hauptdiagonalen. In manchen Lehrbüchern wählt man
J =⎜
⎜
⎟
⎟ aber die umgekehrte Reihenfolge – es stehen dann die Ein-
⎜ 1 1 0 ⎟
⎜ ⎟
⎜ ⎟ sen, so wie hier, unterhalb der Hauptdiagonalen.
⎜ 0 1 1 ⎟
⎝ ⎠
0 0 1
S. 535 ⎛ ⎞ ⎛ ⎞
und jede andere Reihenfolge dieser drei Kästchen. 2 1
Es bilden in diesem Fall etwa b1 = ⎝0⎠, b2 = ⎝2⎠ und
S. 534' ( 0 0
⎛ ⎞ ⎛ ⎞
i 1 0 1 1 0
J = .
0 i b3 = ⎝0⎠ eine Jordan-Basis, und es ist J = ⎝0 1 1⎠ die
1 0 0 1
Jordan-Normalform.
Differenzialrechnung –
die Linearisierung von 15
Funktionen
Welche Information über das
lokale Verhalten einer Funktion
steckt in der Ableitung?
Wie beweist man den
Mittelwertsatz?
Welche Funktionen lassen sich
durch Taylorreihen darstellen?
Eine solche Gerade durch zwei Punkte auf dem Graphen wird Untersucht man die Betragsfunktion f : R → R mit
Sekante genannt und Quotienten von der Form f (x) = |x|, so ergibt sich für den Differenzenquotien-
ten an der Stelle x0 = 0 der Ausdruck
f (x1 ) − f (x0 )
x1 − x0 |x| − |0| 1 für x > 0 ,
=
x−0 −1 für x < 0 .
heißen Differenzenquotient der Funktion f .
Es gibt in diesem Fall keinen Grenzwert für x → 0, da
Lassen wir im Differenzenquotienten den Abstand |x1 − x0 | unterschiedliche Werte beim Grenzübergang von rechts
immer kleiner werden, so wird offensichtlich, dass die durch bzw. von links gegen die kritische Stelle angenommen
die Funktion g beschriebene Gerade im Grenzfall tangential werden. Die Betragsfunktion ist somit an der Stelle x0 = 0
am Graphen von f liegen wird. Wenn es einen Grenzwert des nicht differenzierbar.
Differenzenquotienten für x1 → x0 gibt, so ist dies gerade
die gesuchte Änderungsrate, der Koeffizient a1 der Lineari- y
f (x) = |x|
sierung von f um x0 .
existiert. Diesen Grenzwert nennt man die Ableitung An beliebigen anderen Stellen x0 = 0 ist die Funktion mit
von f in x0 . Er wird mit f (x0 ) bezeichnet. f (x) = |x| differenzierbar mit den Ableitungen
|x| − |x0 | 1 für x0 > 0 ,
f (x0 ) = lim =
Kommentar: Die Betrachtungen zur Differenzierbarkeit x→x0 x − x0 −1 für x0 < 0 .
x=x0
von Funktionen werden hier zunächst nur für Funktionen in
einer reellen Variablen gemacht. Später, im Kapitel 21, wer-
den die Begriffe auf mehrdimensionale Abhängigkeiten über- Die Exponentialfunktion f (x) = ex ist an jeder Stelle
tragen. Die folgenreiche Erweiterung des Ableitungskalküls x0 ∈ R differenzierbar. Wir sehen diese Eigenschaft der
auf komplexe Argumente wird in der Funktionentheorie aus- Exponentialfunktion, wenn wir die charakterisierende Un-
führlich behandelt. gleichung auf Seite 398 zweimal ausnutzen. Es gilt:
1
1 + (x − x0 ) ≤ ex−x0 =
Beispiel ex0 −x
Als erstes Beispiel differenzierbarer Funktionen betrach- 1
≤
ten wir Monome, also eine Funktion f : R → R mit 1 + (x0 − x)
f (x) = x n und n ∈ N. Klammern wir an einer Stelle 1 − (x − x0 ) + (x − x0 )
x0 ∈ R den linearen Faktor (x − x0 ) zur Nullstelle des =
1 − (x − x0 )
Polynoms f (x) − f (x0 ) = x n − x0n aus, so folgt für den (x − x0 )
Differenzenquotienten: =1+ .
1 − (x − x0 )
f (x) − f (x0 ) x n − x0n Subtrahieren wir 1, multiplizieren die Ungleichungen mit
=
x − x0 x − x0 ex0 und dividieren dann durch x − x0 , so ergeben sich für
den Differenzenquotienten die Abschätzungen
(x − x0 ) x n−1 + x n−2 x0 + · · · + x x0n−2 + x0n−1
= ex − ex0 1
x − x0 ex0 ≤ ≤ ex0
x − x0 1 − (x − x0 )
= x n−1 + x n−2 x0 + · · · + x x0n−2 + x0n−1 ,
für x = x0 und |x −x0 | < 1. Das Einschließungskriterium
wenn x = x0 ist. Der Grenzwert für x → x0 existiert und auf Seite 289 liefert Konvergenz für x → x0 , und die
wir erhalten Ableitung ist
x n − x0n ex − ex0
f (x0 ) = lim = n x0n−1 . f (x0 ) = lim = ex0 .
x→x0 x − x0 x→x0 x − x0
x =x0 x=x0
554 15 Differenzialrechnung – die Linearisierung von Funktionen
Zur Bestimmung von Ableitungen ist es manchmal günstiger, Wenn die Funktion f in x0 differenzierbar ist, so ist h eine
den Grenzwert anders zu notieren, indem wir h = x − x0 als stetige Funktion in x0 . Damit wird deutlich, was unter einer
Störung der Stelle x0 um den Wert h ∈ R auffassen. Es ist Linearisierung einer Funktion zu verstehen ist. Wir haben
dann: eine Richtung des folgenden Satzes bewiesen.
f (x) − f (x0 )
f (x0 ) = lim Linearisierung einer Funktion
x→x0 x − x0
x =x0
Eine Funktion f : (a, b) ⊆ R → R ist in einer Stelle
f (x0 + h) − f (x0 ) x0 ∈ (a, b) differenzierbar genau dann, wenn es eine an
= lim
h→0 h der Stelle x0 stetige Funktion h : (a, b) → R gibt mit
h =0
h(x) → 0 für x → x0 und
(siehe Beispiel auf Seite 555). Beachten Sie, dass in der De-
finition keine Vorzeichenbeschränkung an x − x0 bzw. h vor- f (x) = f (x0 ) + f (x0 )(x − x0 ) +h(x)(x − x0 ).
ausgesetzt ist, d. h., der Grenzwert gilt nicht nur für monotone „Linearisierung“
Folgen, die ausschließlich von rechts oder von links gegen x0
konvergieren, sondern auch für beliebig um x0 alternierende
Folgen. Beweis: Die eine Implikation haben wir in der Herleitung
oben bereits gesehen. Für die Rückrichtung der Äquivalenz-
? relation nehmen wir an, dass es zu f : (a, b) → R eine Dar-
Die Definition der Ableitung würde sich ändern, wenn der stellung der Form
Grenzwert des Differenzenquotienten durch den symmetri-
schen Ausdruck f (x) = f (x0 ) + α(x − x0 ) + h(x)(x − x0 )
f (x0 + h) − f (x0 − h) mit einer in x0 stetigen Funktion h : (a, b) → R mit h(x) → 0
lim
h→0 2h für x → x0 gibt. Betrachten wir den Differenzenquotienten,
h=0
so folgt, dass der Grenzwert existiert, und wir erhalten:
ersetzt wird. Finden Sie ein Beispiel, bei dem ein Unterschied
f (x) − f (x0 )
sichtbar wird. lim = α,
x→x0 x − x0
x=x0
Neben der Notation f (x0 ) ist auch eine weitere Schreibweise d. h., f ist differenzierbar in x0 mit f (x0 ) = α.
für die Ableitung üblich, der sogenannte Differenzialquo-
tient: In anderen Worten ausgedrückt besagt diese Darstellung,
df
(x0 ) = f (x0 ) . dass die Differenz zwischen f und der Linearisierung, also
dx der Term h(x)(x − x0 ), schneller gegen null konvergiert als
Um den Begriff eines Differenzials zu verstehen, nutzen wir der lineare Ausdruck (x − x0 ), wenn x gegen x0 strebt. In
die anschauliche Vorstellung, die wir von Ableitungen haben. diesem Sinne approximiert die Linearisierung eine Funktion.
Zunächst konkretisieren wir die vage Vorstellung von der Mit der Landau-Symbolik, wie wir sie in Abschnitt 11.3 ein-
lokalen Approximation durch eine affin-lineare Funktion. geführt haben, schreibt man kurz:
= (x − x0 ) h(x),
d. h.,
x0 x
⎧
⎨ f (x) − f (x0 )
− f (x0 ) für x ∈ (a, b)\{x0 } ,
h(x) = x − x0 Abbildung 15.4 Der Graph der Linearisierung einer Funktion um eine Stelle x0
⎩0 für x = x0 . ist die Tangente an f in x0 .
15.1 Die Ableitung 555
Problemanalyse und Strategie: Mit einem geeigneten Additionstheorem zum Sinus schreiben wir den Zähler
sin(x0 + h) − sin(x0 ) im Differenzenquotienten zur Sinusfunktion so, dass eine Abschätzung gegenüber der Störung h
deutlich wird.
Lösung: Also existiert der Grenzwert und wir erhalten die Ablei-
Mit den Additionstheoremen lässt sich eine Differenz von tung
Funktionswerten zur Sinusfunktion durch
f (x0 ) = cos x0 .
sin(x0 + h) − sin x0 = sin x0 cos h + cos x0 sin h − sin x0
= sin x0 (cos h − 1) + cos x0 sin h Wir können ähnlich vorgehen, um die Ableitung des Ko-
sinus zu zeigen. Schneller sehen wir dies aber, wenn wir
ausdrücken. In der Herleitung zur Zahl π im Abschnitt
die Verschiebung cos x = sin(x + π2 ) ausnutzen. Denn so
auf Seite 407 haben wir mit dem Leibniz-Kriterium die
erhalten wir mit dem oben betrachteten Grenzwert an der
beiden Abschätzungen
Stelle x + π2 für den Differenzenquotienten der Kosinus-
) )
) sin h ) 2 funktion:
) − 1 ) ≤ h
) h ) 6
π π
cos(x0 + h) − cos x0 sin(x0 + + h)−sin(x0 +
2 2)
und =
h2 h h
| cos h − 1| ≤ π
2 → cos(x0 + ) = − sin x0
2
für |h| ≤ 2 gezeigt. Mit diesen Abschätzungen folgt für
den Differenzenquotienten
für h → 0, h = 0. Die letzte Identität sieht man mit
sin(x0 + h) − sin(x0 ) cos h−1 sin h dem Additionstheorem cos(x0 + π2 ) = cos x0 cos π2 −
= sin x0 + cos x0
h h h sin x0 sin π2 = − sin x0 , wobei die Funktionswerte
→ cos x0 , für h → 0 . cos π2 = 0 und sin π2 = 1 eingesetzt wurden.
Differenzierbare Funktionen sind stetig Stelle x0 ab, an der der Grenzwert betrachtet wird. Wenn der
Grenzwert für jede beliebige Stelle x0 im offenen Defini-
Ist f : I ⊆ R → R eine in einer Stelle x0 ∈ I differen-
tionsbereich D ⊆ R einer Funktion F : D → R existiert, so
zierbare Funktion, so ist f in x0 stetig.
sprechen wir von einer differenzierbaren Funktion und lassen
den Zusatz „an einer Stelle“ fallen. Es ergibt sich aus der
Beispiel Die Betragsfunktion ist ein Beispiel für eine Konstruktion der Ableitung in diesem Fall eine neue Funktion
Funktion, die in x0 = 0 zwar stetig aber nicht differenzierbar
ist. Ein weiteres Beispiel ist die stückweise gegebene, stetige f: D → R.
Funktion f : R → R mit
Diese Funktion nennt man Ableitungsfunktion oder auch
x, x < 0, kurz die Ableitung von f , wenn keine Verwechselung zu be-
f (x) = fürchten ist. Somit ist etwa zu f : R → R mit f (x) = x 2
x2, x ≥ 0.
die Ableitungsfunktion f : R → R durch f (x) = 2x gege-
Betrachten wir den Differenzenquotienten in x0 = 0, so ist ben. Bei der Exponentialfunktion exp : R → R ist die Ablei-
tungsfunktion wegen
f (x) − f (0) x2
lim = lim = lim x = 0 .
x→0 x−0 x→0 x x→0 exp (x) = exp(x) für x ∈ R
x>0 x>0 x>0
Beim idealen Pendel schwingt eine Punktmasse M nur un- Diese Gleichung wird auch Schwingungsgleichung ge-
ter Einfluss der Schwerkraft. Es werden Reibungskräfte nannt. Sie beschreibt einen harmonischen Oszillator.
durch die Aufhängung und der Luftwiderstand vernach- Durch die Linearisierung vereinfacht sich die Differen-
lässigt. Bezeichnet man mit l > 0 die Länge des Pendels, zialgleichung, sodass explizit Lösungen bestimmt werden
mit m > 0 die Masse und mit s(t) die Länge des Bo- können. In diesem Fall erhalten wir Lösungen von der Ge-
genstücks zwischen Punktmasse und dem Ruhepunkt des stalt
Pendels zum Zeitpunkt t ∈ R, so lässt sich die Strecke '. ( '. (
auch mithilfe des Auslenkungswinkels α(t) ∈ [−π, π] g g
α(t) = c1 cos t + c2 sin t ,
durch s(t) = lα(t) beschreiben, wenn wir den Winkel im l l
Bogenmaß messen (siehe Abbildung).
wie wir nachprüfen können, indem wir die zweite Ab-
Nach dem Newton’schen Kraftgesetz ist das Produkt aus
leitung berechnen. Im Kapitel 20 über Differenzialglei-
Masse und Beschleunigung gleich der auf der Punktmasse
chungen werden wir eine Methode kennenlernen, wie man
wirkenden Kraft. Da wegen der Aufhängung der Masse
solche Lösungen aus der Differenzialgleichung heraus be-
nur der Anteil der Gravitationskraft tangential zur Bahn
stimmen kann. Außerdem werden wir sehen, dass alle Lö-
der Punktmasse auf die Masse wirkt, erhalten wir für die
sungen die oben angegebene Form haben müssen. Die Mo-
Kraft
dellierung von Oszillationen mithilfe der Schwingungs-
F (t) = −mg sin α(t) ,
gleichung ist grundlegend in vielen Anwendungen.
und es ergibt sich eine Differenzialgleichung
Nimmt man hingegen keine Linearisierung in der Dif-
mlα (t) = ms (t) = −mg sin α(t) ferenzialgleichung vor, lassen sich allgemeine Lösungen
nicht explizit angeben. Die mathematische Theorie, die
zur Beschreibung der Schwingung. Immer wenn eine wir noch diskutieren werden, garantiert aber, dass auch
Funktion und/oder ihre Ableitungen zueinander in einer zu dieser Differenzialgleichung eine Lösung existiert. Wir
Gleichungsrelation stehen, spricht man von einer Diffe- sind auf numerische Verfahren angewiesen, um solche Lö-
renzialgleichung. sungen zu berechnen.
Das Bild zeigt ein Foucault’sches Pendel an der Uni
α
Heidelberg. Es dient zum experimentellen Nachweis der
l Erddrehung. Das relativ ideale mathematische Pendel
schwingt scheinbar nicht in einer Ebene. Dies muss aber
aufgrund der Drehimpulserhaltung der Fall sein. Somit
dreht sich die Bodenplatte gegenüber der Schwingungs-
s
α ebene.
mg
Geht man von relativ kleinen Winkeln α(t) für die Auslen-
kung aus, so ist eine Linearisierung der Sinusfunktion um
α = 0 in dieser Gleichung eine sinnvolle Approximation.
Mit
sin(α) ≈ sin(0) + sin (0)α = α
folgt die Differenzialgleichung
g
α (t) + α(t) = 0 .
l
558 15 Differenzialrechnung – die Linearisierung von Funktionen
Die Aussage zeigen wir induktiv: Für r = 0 und festem Dieser Ausdruck konvergiert nicht für h → 0, da die
Wert n ∈ N haben wir die Ableitungsfunktion f (x) = Grenzwerte von rechts und von links verschieden sind. Die
nx n−1 zu f im Beispiel auf Seite 553 bestimmt. Funktion g ist genau einmal stetig differenzierbar. Nur au-
Nehmen wir nun an, dass für 0 ≤ r < n gilt ßerhalb der Stelle x = 0 kann auch die zweite Ableitung
angegeben werden.
f (r) (x) = n(n − 1) · . . . · (n − r + 1)x n−r ,
f (x) g g
so können wir den von x unabhängigen Faktor n(n − 1)
. . . (n−r+1) aus dem Differenzenquotienten der Funktion 3
f (r) ausklammern und erhalten analog für die (r + 1)-te
Ableitung aus g
2
f (r+1) (x) = f (r) (x)
1
1
die Identität
f (r+1) (x) = n(n − 1) · . . . · (n − r + 1)x n−r -2 -1 1 2 x
n−(r+1)
= n(n − 1) . . . (n − r + 1)(n − r)x
Abbildung 15.6 Graphen der stückweise definierten Funktion g und ihrer
Ableitungen.
für r + 1 ≤ n.
Im Fall r = n ist die Funktion Die Funktion
(n)
f (x) = n(n − 1) . . . · 1 = n! x 2 sin 1
, x > 0,
h(x) = x
Betrachten wir noch die Stelle x = 0. Es ist Also ist h in x = 0 differenzierbar mit h (0) = 0.
Weiter unten werden wir mit der Kettenregel sehen, dass
1* + h2
g(h) − g(0) = h = h, h > 0, für x > 0 die Funktion h differenzierbar ist mit Ableitung
h 0, h < 0. h (x) = 2x sin(1/x) − cos(1/x). Wir ersparen uns hier
eine Herleitung dieser Ableitung direkt aus dem Differen-
Daher gilt zenquotienten. Für x < 0 ist offensichtlich h (x) = 0.
1* +
g(h) − g(0) → 0 Insgesamt erhalten wir die Ableitungsfunktion
h
für h → 0. Also ist g auch in x = 0 differenzierbar mit 2x sin(1/x) − cos(1/x) , x > 0 ,
h (x) =
g (0) = 0. Die Abbildung g : R → R ist stetig auf R, da 0, x ≤ 0.
insbesondere
Diese Funktion ist nicht stetig in 0, denn wählen wir etwa
lim g (x) = lim g (x) = 0 die Nullfolge mit xn = 1/(2πn), n ∈ N, so folgt
x→0 x→0
x<0 x>0 1
h (xn ) = sin(2πn) − cos(2πn) = −1 .
gilt. Für die zweite Ableitung von g bei x = 0 müssen πn
wir den Differenzenquotienten zur Ableitungsfunktion be- Mit der Nullfolge xn = 1/((2n + 1)π) erhalten wir
trachten: 2
2h h (xn ) = sin((2n+1)π)−cos((2n+1)π) = 1 .
1* + = 2, h > 0, (2n + 1)π
g (h) − g (0) = h
h 0, h < 0. Die Ableitung kann somit in x = 0 nicht stetig sein.
15.1 Die Ableitung 559
y 2-mal differenzierbar
h
stetig differenzierbar C 1 (a, b)
1
h differenzierbar
1
2
stetig C(a, b)
− 12
Es werden auch Ableitungsfunktionen f ∈ C([a, b]) auf
abgeschlossenen Intervallen betrachtet, wobei die Funktions-
−1
werte f (a) und f (b) durch eine stetige Fortsetzung der
Ableitungsfunktion definiert sind (Seite 318).
Abbildung 15.7 Graphen von h und der Ableitung h aus dem Beispiel auf Diese Definition einer Ableitung in einem Randpunkt der
Seite 559. Definitionsmenge ist zu unterscheiden von einseitigen Ab-
leitungen, die unabhängig von den Eigenschaften der Ab-
leitungsfunktion im Intervall (a, b) durch einseitige Grenz-
werte, etwa
? lim
f (a + h) − f (a)
Im Beispiel auf Seite 320 hatten wir gesehen, dass sin x1 in h→0 h
h>0
null nicht stetig
fortgesetzt
werden kann. Überlegen Sie sich,
dass mit x sin x1 eine stetige aber in null nicht differenzier- gegeben sind. Dieser Grenzwert, wenn er existiert, heißt
bare Funktion gegeben ist. rechtsseitige Ableitung von f in a. Analog wird die links-
seitige Ableitung definiert.
Analytische Eigenschaften einer Funktion, wie Stetigkeit Beispiel Betrachten wir die beiden Funktionen
oder Differenzierbarkeit, werden oft zusammengefasst un- f, g : (−1, 1) → R mit
ter dem Oberbegriff der Regularität einer Funktion. Beim 1
f (x) = (1 − x 2 ) 2
Umgang mit Funktionen spielt die Regularität nicht nur theo-
retisch, sondern auch numerisch eine entscheidende Rolle, und
wie wir es etwa beim Newton-Verfahren auf Seite 572 noch g(x) = (1 − x 2 ) 2
3
Der Grenzwert existiert. Also besitzt die Funktion g eine wenn wir eine Funktion mit einem Faktor λ ∈ R multipli-
linksseitige Ableitung in x = 1 mit dem Wert 0. Anhand der zieren, gilt die Identität (λf ) (x) = λ f (x). Beide Eigen-
Graphen (siehe die Abbildung 15.9) wird das signifikant un- schaften, Additivität und Homogenität zusammen ergeben
terschiedliche Verhalten der Funktionen an der Stelle x = 1 die Linearität des Differenzialoperators.
deutlich.
und
−1 1 (λf ) (x) = λf (x) .
− 12 1
2
Abbildung 15.9 Das unterschiedliche Verhalten der beiden Funktionen f und
g am Intervallrand zeigt sich in der Existenz einer einseitigen Ableitung Beispiel Polynome sind beliebig oft differenzierbar und
mit
Kommentar: Wir haben so zwei verschiedene Betrachtun- !
n
Die Berechnung einer Ableitung durch Bilden des Grenz- Konsequenz der Linearität des Differenzialoperators bzw. der
werts des Differenzenquotienten ist relativ aufwendig. Zum analogen Eigenschaft bei Stetigkeit ist, dass die Menge der k-
Glück gibt es Regeln, die es ermöglichen, Ableitungen von mal stetig differenzierbaren Funktionen, C k (a, b), mit k ∈ N
Funktionen auf einige wenige differenzierbare Standardfunk- einen Vektorraum (siehe Kapitel 6) bildet. Genauer lässt sich
tionen zurückzuführen. festhalten, das es sich um eine Kette von Unterräumen han-
delt, d. h., es gilt
Ableiten ist eine lineare Operation
C k+1 (a, b) ⊆ C k (a, b) für k ∈ N0 .
Eine Regel ist leicht aus der Definition zu ersehen. Betrachten
Es stehen uns somit allgemeine Aussagen zu Vektorräumen
wir die Summe f +g von zwei differenzierbaren Funktionen
auch in diesen Funktionenräumen zur Verfügung. Eine Tat-
f, g : D → R, so gilt mit den allgemeinen Rechenregeln zu
sache, die sich als nützlich erweisen wird.
Grenzwerten, dass
Es handelt sich bei der Schachtelung von Unterräumen übri-
(f + g)(x) − (f + g)(x0 )
lim gens um echte Teilmengen, wie wir es etwa am Beispiel der
x→x0 x − x0 Betragsfunktion für k = 0 leicht sehen. Bei solchen Beispie-
f (x) − f (x0 ) + g(x) − g(x0 ) len ist die Differenzierbarkeit nur in einer diskreten Stelle ver-
= lim
x→x0 x − x0 letzt. Ein interessantes weiteres Beispiel einer stetigen aber
f (x) − f (x0 ) g(x) − g(x0 ) nirgends differenzierbaren Funktion ist auf Seite 561 kon-
= lim + lim
x→x0 x − x0 x→x0 x − x0 struiert. Da die Suche nach Gegenbeispielen eine wichtige
= f (x0 ) + g (x0 ) . Beweismethode der Mathematik ist, wird diese Konstruktion
exemplarisch genauer betrachtet. In diesem Zusammenhang
Diese Eigenschaft wird auch Additivität des Differenzierens sei auch auf das Lehrbuch Analysis in Beispielen und Gegen-
genannt. Analog erhalten wir die Homogenität. Es bedeutet, beispielen von J. Appell hingewiesen.
15.2 Differenziationsregeln 561
Wie lässt sich eine solche Funktion konstruieren? Zu- Da alle Summanden entweder 1 oder −1 sind, beobachten
nächst verschaffen wir uns mit der Betragsfunktion eine wir, dass für n ungerade die Summe eine gerade Zahl ist
Funktion, die unendlich viele Stellen aufweist, die nicht und für n gerade die Summe ungerade ist. Also kann die
differenzierbar sind, z. B. die Sägezahnfunktion s : R → R Folge der Quotienten nicht konvergieren.
(siehe Abbildung), die durch periodische Fortsetzung von
s(x) = |x| für |x| ≤ 1 entsteht. Offensichtlich ist s ste- Jetzt müssen wir noch zeigen, dass dies im Widerspruch
tig, aber in den Stellen x = k ∈ N nicht differenzierbar. zur Differenzierbarkeit steht. Nehmen wir an, f sei diffe-
renzierbar in x̂, dann folgt mit der Linearisierung (Seite
y
554), dass es eine stetige Funktion h : R → R gibt mit
1 s(x) lim h(x) = 0 und
x→x̂
1
2 s(2x) f (yn ) − f (xn )
-2 -1 0 1 2 x yn − xn
1
Schieben wir die Knicke etwa durch s(nx), n ∈ N zusam- = f (x̂) + f (x̂)(yn − x̂) + h(yn )(yn − x̂)
men, erhalten wir keine stetige Funktion im Grenzfall für yn − xn
n → ∞. Verkleinern wir zusätzlich dabei die Amplitude, − f (x̂) − f (x̂)(xn − x̂) − h(xn )(xn − x̂)
etwa durch n1 s(nx), wird die Grenzfunktion konstant null. yn − x̂ xn − x̂
Es ist eine Funktion zwischen diesen beiden Extremen zu = f (x̂) + h(yn ) − h(xn ) .
yn − xn yn − xn
konstruieren.
−x̂
Die Idee besteht darin, die Zacken aufzusummieren. Da- Da nach Wahl von xn und yn gilt | yynn−x n
| ≤ 1 und
xn −x̂
mit wir sicherstellen, dass die so entstandene Reihe für | yn −xn | ≤ 1, folgt, dass für eine differenzierbare Funktion
x ∈ R konvergiert, wählen wir für n nur Potenzen von 2 der Grenzwert des Quotienten existiert und gleich f (x̂)
und betrachten ist. Wir haben aber mit der Konstruktion gezeigt, dass der
∞
! Grenzwert nicht existiert. Also ist die Funktion f in keiner
1
f (x) = s(2j x) . Stelle x̂ differenzierbar.
2j
j =0
Andererseits können wir bei der Konstruktion als Reihe
Die Konvergenz lässt sich mit dem Majorantenkriterium über stetige Funktionen hoffen, dass f stetig ist. Dies muss
und der geometrischen Reihe zu q = 21 zeigen. aber noch gezeigt werden. Geben wir uns dazu ε > 0 vor.
Betrachten wir Differenzenquotienten zu den einzelnen Mit der geometrischen Reihe können wir N ∈ N so fest-
Summanden. Wir beobachten, dass mit k ∈ Z gilt: legen, dass
1
j ∞ ∞
2j
s(2 y) − s(2j x) ! s(2j x) 1 ! 1 1
= ±1 , ≤ = N ≤ε
y−x 2 j 2 N +1 2 j 2
j =N +1 j =0
falls x, y ∈ [ 2kj , k+1
2j
]. Außerdem ist s(2j 2kn ) = 0 für
j ≥ n + 1 ∈ N und k ∈ Z. An diesen Stelle wird f zu für alle x ∈ R gilt. Weiter lässt sich nun zu den noch übri-
einer endlichen Summe. Um den Differenzenquotienten gen endlich vielen stetigen und periodischen Funktionen
1
an einer Stelle x̂ ∈ R zu untersuchen betrachten wir be- 2j
s(2j x) mit j = 0, . . . , N zu ε ein δ > 0 finden, sodass
nachbarte Nullstellen, d. h., wir definieren Zahlen kn ∈ Z | 21j (h(2j x) − h(2j x̂))| < N ε+1 für alle |x − x̂| ≤ δ ist.
und Folgen (xn ), (yn ) sodass Insgesamt sehen wir die Stetigkeit durch
kn kn + 1 ∞
!
xn = ≤ x̂ ≤ = yn |s(2j x) − s(2j x̂)|
2 n 2n |f (x) − f (x̂)| ≤
2j
1 j =0
gilt. Dann ist |xn − yn | = 2n , beide Folgen konvergieren ∞ ∞
gegen x̂ und es folgt ! 1 ! 1
+ j
+
2 2j
j =N +1 j =N +1
f (yn ) − f (xn ) !
1
n
2j
(s(2j yn ) − s(2j xn ))
= . ε
yn − xn yn − xn ≤ (N + 1) + ε + ε = 3ε .
j =0 N +1
562 15 Differenzialrechnung – die Linearisierung von Funktionen
Beim Ableiten von Verkettungen gilt: „äußere Als Beispiel betrachten wir f : R → R gegeben mit
mal innere Ableitung“ f (x) = (x 3 + 1)7 . Die Funktion f ist offensichtlich eine
Komposition f = g ◦h mit h(x) = x 3 +1 und g(y) = y 7 .
Neben der Linearität und der Produktregel gibt es eine wei- Mit der Kettenregel folgt die Ableitung:
tere grundlegende Regel zum Ableiten, die im Folgenden
ständig genutzt wird. Es ist die Kettenregel zur Differenzia- f (x) = 7(x 3 + 1)6 · (3x 2 ) = 21 x 2 (x 3 + 1)6 .
tion der Komposition zweier Funktionen.
Die Funktion f : R → R mit f (x) = cos(sin(x)) ist
Kettenregel differenzierbar. Mit der Kettenregel erhalten wir
Wenn zwei differenzierbare Funktionen f : D → R und
g : f (D) → R gegeben sind, so ist die Verkettung der f (x) = − sin(sin(x)) · cos(x) .
Funktionen differenzierbar, und es gilt für x ∈ D:
Beachten Sie, dass die Aussage der Kettenregel nicht nur in
(g ◦ f ) (x) = g f (x) f (x) . der Rechenregel zur Berechnung einer solchen Ableitung be-
steht, sondern dass auch die Existenz der Ableitung von f ◦g
Beweis: Um die Kettenregel herzuleiten, betrachten wir aus der Differenzierbarkeit der beiden einzelnen Funktionen
die Ableitung an einer Stelle x0 ∈ D. Beim Beweis muss folgt.
man ein wenig mehr aufpassen als bei den anderen Regeln, Die Differenziationsregeln lassen sich nun beliebig ver-
um eine zusätzliche Voraussetzung der Form f (x) = f (x0 ) schachtelt nutzen, um Ableitungen zu berechnen.
für alle x = x0 in einer Umgebung um x0 zu vermeiden.
Setzen wir y0 = f (x0 ) und definieren die Funktion
?
Berechnen Sie die Ableitungen zu f : R → R mit
: f (D) → R durch
⎧ 1
⎨ g(y) − g(y0 ) für y = y , a) f (x) = ex sin x b) f (x) =
2 + sin x cos x
0
(y) = y − y0
⎩
g (y0 ) für y = y0 .
Problemanalyse und Strategie: Die angesprochenen Ableitungsregeln kommen häufig bunt ineinander verschachtelt
zur Anwendung. Zunächst müssen wir also Produkte und Verkettungen in den jeweiligen Ausdrücken identifizieren, um
so einen Weg zur Berechnung der Ableitung durch Hintereinanderausführen von Differenziationsregeln zu finden.
f (x) = (ln(x) + 1) ex ln(x) = (ln(x) + 1) x x . Nun können wir wieder die Kettenregel anwenden, und es
ergibt sich die Ableitung
Im dritten Beispiel handelt es sich um eine Verkettung der
drei Funktionen arccot, cos und Multiplikation mit a. Mit f (x) = 2x cosh(x 2 ) sinh(sinh(x 2 )) .
f (x) oberen oder in der unteren Halbebene können wir die Linie
arctan
als Graph einer Funktion y : [−1, 1] → R auffassen. Diese
Funktion ist durch
arctan
3
2 2
−3 −2 −1 1 2 3 x y(x) = 1 − |x| 3 ,
|x|2/3 + |y|2/3 = 1 ?
Berechnen Sie die Ableitung der Funktion f : (0, 2π) → C
wird von den Punkten (x, y) in der Koordinatenebene erfüllt, mit f (t) = ezt mit z = a + ib ∈ C.
die auf einer sogenannten Astroide liegen (Abb. 15.12). In der
566 15 Differenzialrechnung – die Linearisierung von Funktionen
Potenzreihen sind beliebig oft differenzierbar Beweis: Ohne Beschränkung der Allgemeinheit betrach-
ten wir den Entwicklungspunkt x0 = 0. Wir stellen den Be-
Die Bedeutung von Potenzreihen (siehe Kapitel 11) ist schon weis hier vor, schließen aber eine ausführliche Diskussion
hervorgehoben worden. Ein weiterer Aspekt ist die Differen- der relativ technischen Beweisführung in der Box auf Seite
zierbarkeit von Funktionen, die durch Potenzreihen gegeben 568 an.
sind. Zunächst ist zu zeigen, dass die beiden Potenzreihen
∞
! ∞
!
Ableitungen einer Potenzreihe f (x) = ak x k und g(x) = k ak x k−1
Eine Funktion f : (x0 − r, x0 + r) → R, die sich um den k=0 k=1
Entwicklungspunkt x0 in eine Potenzreihe mit Konver- denselben Konvergenzradius besitzen. Bezeichnen wir mit r
genzradius r > 0 entwickeln lässt, d. h., es gilt und r die beiden Konvergenzradien von f und g. Für die
∞
! Partialsummen Sm von f gilt:
f (x) = ak (x − x0 )k
!
m
k=0 |Sm (x)| ≤ a0 + |ak | |x|k
für x ∈ (x0 − r, x0 + r), ist beliebig oft differenzierbar, k=1
und die Ableitungen sind durch die gliedweise differen- !m !
m
zierten Potenzreihen ≤ a0 + k |ak | |x|k = a0 + |x| k |ak | |x|k−1 .
!∞ k=1 k=1
f (x) = k ak (x − x0 )k−1 ,
r
Für |x| < konvergieren die Partialsummen auf der rechten
k=1
Seite der Ungleichung für m → ∞. Also konvergiert auch
∞
! die linke Reihe nach dem Majorantenkriterium, und es folgt
f (x) = k(k − 1) ak (x − x0 )k−2 r ≤ r.
k=2
usw. im Konvergenzintervall (x0 − r, x0 + r) gegeben. Seien nun andererseits |x| < r und λ = 12 1 + r/|x| . Dann
konvergiert die Potenzreihe zu f auch für λx. Ferner konver-
15.2 Differenziationsregeln 567
giert die Folge αk = λkk gegen 0. Also gibt es insbesondere dies deutlich ist, kann man mit Indexverschiebungen die Ab-
eine Konstante c > 0 mit αk ≤ c für alle k, d. h. k ≤ cλk für leitung auch anders darstellen durch
alle k. Es ergibt sich: ∞ ∞
! !
k−1 k
k ak (x − x0 ) = (k + 1) ak+1 (x − x0 ) .
!
m
c ! k
m
k=1 k=0
k |ak | |x|k−1 ≤ λ |ak | |x|k
|x|
k=1 k=1 Manchmal wird in der Literatur auch der Term zu k = 0 mit
c !
m angegeben:
= |ak | |λx|k . (15.1) ∞ ∞
|x| ! !
k=1 k−1 k−1
k ak (x − x0 ) = k ak (x − x0 ) .
Wiederum folgern wir mit dem Majorantenkriterium auf k=1 k=0
Konvergenz der linken Partialsumme, und wir haben gezeigt, Diese Variante vermeiden wir im Folgenden, da die schein-
dass r ≤ r ist. Zusammengenommen erhalten wir r = r. bare Singularität des Ausdrucks 1/(x − x0 ) nur durch den
Für den zweiten Teil des Beweises halten wir |x| < r fest Faktor k = 0 aufgehoben wird.
und wählen ε > 0 mit ρ = |x| + ε < r. Dann gilt mit der
binomischen Formel:
?
k '
! ( Bestätigen Sie die Identität
1* + k j −1 k−j
(x + h)k − x k = h x
h j exp (x) = exp(x),
j =1
' ( ! k ' ( indem Sie die Potenzreihe der Exponentialfunktion differen-
k k j −2 k−j
= x k−1 + h h x . zieren.
1 j
j =2
=k
Die Aussage zur Differenzierbarkeit bedeutet, dass Potenz-
Es folgt für |h| ≤ ε die Abschätzung reihen im Konvergenzbereich unendlich oft differenzierbare
) ) Funktionen repräsentieren; denn die Ableitung einer Potenz-
)1* + )
) (x + h)k − x k − k x k−1 ) reihe ist schließlich wieder eine Potenzreihe mit demselben
)h )
Konvergenzradius. So lassen sich die Standardfunktionen
!k ' (
k j −2 k−j exp, cos, sin, etc. beliebig oft differenzieren. Andererseits
≤ |h| ε |x| besagt dies aber auch, dass eine Funktion, die an einer Stelle
j
j =2
nur endlich viele Ableitungen hat, in einer Umgebung dieser
k ' (
|h| ! k j k−j Stelle nicht in eine Potenzreihe entwickelt werden kann.
= ε |x|
ε2 j
j =2 Beispiel
|h| |h| Wir suchen einen geschlossenen Ausdruck für die Potenz-
≤ 2 (ε + |x|)k = 2 ρ k . (15.2)
ε ε reihe
∞
!
Somit gilt für die Partialsummen: nx n
n=1
) )
)1* + ) !
m
) Sm (x + h) − Sm (x) − S (x)) ≤ |h| |ak | ρ k
in ihrem Konvergenzbereich |x| < 1. Für die geometri-
)h m ) ε2 sche Reihe kennen wir die Darstellung
k=1
∞
!
≤ γ |h| 1
xn =
∞ 1−x
n=0
mit γ = ε12 k=1 |ak | ρ . Diese Abschätzung gilt für alle
k
m ∈ N. Der Grenzübergang m → ∞ liefert für |x| < 1. Betrachten wir die Funktion f (x) = 1/(1−x)
) ) für x = 1. Die Funktion ist differenzierbar, und wir be-
)1* + )
) f (x + h) − f (x) − g(x)) ≤ γ |h| . rechnen in beiden Darstellungen die Ableitung
)h )
∞
! 1
Für h → 0 erhalten wir die Behauptung, dass die Potenzreihe f (x) = nx n−1 =
(1 − x)2
f im Konvergenzbereich differenzierbar ist mit der Ableitung n=1
f = g. für x ∈ (−1, 1). Eine Multiplikation der Identität mit x
führt auf die Darstellung
Achtung: Beachten Sie, dass der konstante erste Term ∞
! x
einer Potenzreihe beim gliedweisen Ableiten zu null wird nx n = .
und daher etwa die Reihe zu f erst bei k = 1 beginnt. Wenn (1 − x)2
n=1
568 15 Differenzialrechnung – die Linearisierung von Funktionen
denselben Konvergenzradius besitzen und im Konvergenzbereich die zweite Reihe die Ableitung der ersten ist.
Zunächst lassen sich durch x̃ = x − x0 die Potenzreihen Für λ > 1 ist die Reihe absolut konvergent, und somit
auf den Entwicklungspunkt x0 = 0 transformieren. Da- ist (αk )k∈N eine Nullfolge. Insbesondere ist die Folge be-
her kann ohne die allgemeine Aussage einzuschränken im schränkt, d. h., es gibt eine Konstante c > 0 mit αk < c
Beweis von x0 = 0 ausgegangen werden. für alle k ∈ N.
Man beginnt mit den Konvergenzradien. Wenn der Grenz- Insgesamt folgt die Ungleichung (15.1). Das Majoranten-
wert limk→∞ |ak+1 |/|ak | existiert, folgt kriterium liefert Konvergenz der linken Partialsummen,
|ak+1 | (k + 1)|ak+1 | und wir haben gezeigt, dass auch r ≤ r sein muss.
lim |x| = lim |x|.
k→∞ |ak | k→∞ k|ak | Für den zweiten Teil des Beweises müssen wir an einer
In diesem Fall führt schon das Quotientenkriterium auf Stelle x mit |x| < r den Differenzenquotienten zur Po-
dieselben Konvergenzradien. tenzreihe f betrachten, d. h., es ist eine Abschätzung von
) )
Leider existiert der Grenzwert der Quotienten nicht in je- )1 )
) (f (x + h) − f (x)) − g(x))
dem Fall. Es muss deswegen expliziter vorgegangen wer- )h )
den. Ausgangspunkt sind die beiden Potenzreihen f und gesucht, die belegt, dass im Grenzfall für h → 0 die
g mit Konvergenzradien r für f und r für g. Es bietet sich Differenz null wird. Wir erlauben nur Störungen h mit
an, die Aussage aufzuspalten und getrennt zu zeigen, dass |x + h| < r, damit f (x + h) definiert ist. Also wählen
sowohl r ≤ r als auch r ≥ r ist. wir eine Schranke ε > 0 mit ε < r − |x| und betrachten
Betrachtet man die Partialsumme Sm (x) = m k
k=0 ak x , Werte mit |h| < ε.
so lässt sich diese mithilfe der Dreiecksungleichung, Ver-
Wir haben es wieder mit zwei Grenzprozessen zu tun, und
größern der Koeffizienten um den Faktor k und durch
müssen entsprechend vorsichtig argumentieren. Betrach-
Ausklammern von |x| durch die Terme der Potenzreihe
ten wir zunächst die Differenz der Partialsummen
g abschätzen, wie es in der ersten Ungleichung im Beweis ) )
)1 )
gezeigt ist. Das Majorantenkriterium liefert somit Konver- ) (Sm (x + h) − Sm (x)) − S (x))
genz von (Sm ) für |x| < r . Daher muss der Konvergenz- )h m )
radius von f größer sein, d. h., es gilt r ≤ r. * +
mit den Summanden h1 (x + h)k − x k − kx k−1 . Es ist
Es bleibt r ≤ r zu zeigen. Eine analoge Abschätzung naheliegend, den Term (x + h)k wie im Beweis mit der
der Partialsumme m k=1 k |ak | |x|
k−1 funktioniert nicht,
allgemeinen binomischen Formel umzuschreiben. Einge-
da k|ak | ≥ d|ak | für jede beliebige Konstante d und k > d setzt führt uns dies auf die Abschätzung (15.2). Beachten
gilt. Um das schnellere Wachsen der Koeffizienten k|ak | Sie, dass es sich in der letzten Zeile wirklich um eine Ab-
gegenüber den Koeffizienten |ak | in den Partialsummen schätzung handelt, da die Terme für k = 0 und k = 1
von f zu kontrollieren, bleiben nur die Potenzen |x|k . addiert wurden.
Die Idee besteht nun darin, statt x einen etwas größeren Diese Rechnung führt auf die entscheidende Ungleichung
Wert im Konvergenzbereich zu betrachten, der das lineare ) )
)1 )
Wachstum des Faktors k in den Koeffizienten der Ablei- ) (Sm (x + h) − Sm (x)) − S (x)) ≤ γ |h|,
)h m )
tung kompensiert. Daher wählen wir λ> 1 mit λ|x| < r,
zum Beispiel, wie im Text, λ = 12 1 + r/|x| ; denn wobei die Zahl γ unabhängig(!) von m ist.
λ|x| = 21 (|x| + r) < r für |x| < r. Mit dieser Wahl
Hier steckt sie wieder, die Gleichmäßigkeit, die wir benö-
von λ konvergiert die Potenzreihe zu f auch für λx und
tigen beim Vertauschen von Grenzprozessen, wie wir es
wir erhalten Summanden der Form ak λk x k .
schon im Kapitel 11 auf Seite 387 gesehen haben. Für den
Es ist noch erforderlich, eine Konstante c > 0 zu finden Beweis ist es wesentlich, dass wir eine solche Abschät-
mit k ≤ cλk für alle k ∈ N, um die Partialsummen von g zung gegenüber h → 0 für alle m ∈ N, also unabhängig
abzuschätzen. Die Existenz einer solchen Konstante lässt vom aktuellen Wert von m, zeigen. So können wir letzt-
sich begründen, indem wir die Folge mit αk = λkk be- endlich auf beiden Seiten der Ungleichung zunächst den
trachten. Die Folge ist eine Nullfolge, was sich etwa
aus Grenzwert m → ∞ und dann h → 0 betrachten, um den
∞
dem Quotientenkriterium für die Reihe k=0 k ergibt.
α Beweis abzuschließen.
15.3 Der Mittelwertsatz 569
Dies zeigt aber noch nicht, dass bei x = 1 ein Minimum Auch dies ist eine reine Existenzaussage, ohne Auskunft zu
liegt. In dem Beispiel lässt sich aber argumentieren, dass es geben, wo im Intervall [a, b] die Zwischenstelle z liegt. An-
nur eine Stelle mit f (x) = 0 gibt und f (x) → ∞ für x → 0 schaulich besagt der Satz, dass die Sekante durch die Punkte
und für x → ∞ gilt. Deswegen muss ein globales Minimum (a, f (a)) und (b, f (b)) eine Steigung besitzt, die der Stei-
an der Stelle vorliegen. gung einer Tangenten am Graphen von f an mindestens einer
Stelle zwischen a und b entspricht (Abb. 15.14).
Eine Aussage zur Existenz von Nullstellen der Ableitungs-
funktion lässt sich bei differenzierbaren Funktionen ähnlich f (x)
wie beim Zwischenwertsatz (siehe Seite 334) machen. Mit
dieser nach dem Mathematiker Michel Rolle (1652–1719)
benannten Aussage starten wir, um die Eigenschaften diffe-
f (b)
renzierbarer Funktionen genauer zu beleuchten.
a x0 b x
Beweis: Ist die Funktion f auf [a, b] konstant, so sind die
Differenzenquotienten stets null und somit auch die Ablei-
tung von f . Man kann für x̂ jeden beliebigen Punkt in (a, b) Abbildung 15.14 Der Mittelwertsatz besagt, dass die Steigung der Sekante
wählen. zwischen zwei Punkten auf dem Graphen einer differenzierbaren Funktion auch
Steigung einer Tangente ist.
Betrachten wir den Fall, dass f nicht konstant ist. Wir be-
zeichnen mit x1 ∈ [a, b] eine globale Maximalstelle und mit
x2 ∈ [a, b] eine Minimalstelle. Beide existieren, da f stetig Beweis: Der Mittelwertsatz lässt sich zeigen, indem wir
und das Intervall [a, b] kompakt ist (siehe Seite 330). Au- den Satz von Rolle auf die stetige Funktion : [a, b] → R
ßerdem muss f (x2 ) < f (x1 ) sein, da die Funktion nicht mit
konstant ist. Somit liegt mindestens eine der beiden Stellen f (b) − f (a)
(x) = f (x) − (x − a)
x1 oder x2 im Innern des Intervalls. Aus der notwendigen b−a
Bedingung für Extremalstellen folgt die Behauptung für die-
anwenden. Denn es gilt (a) = f (a) = (b). Daher gibt
sen der beiden Punkte x̂ = x1 bzw. x̂ = x2 im Intervall
es einen Wert z ∈ (a, b) mit
(a, b).
f (b) − f (a)
0 = (z) = f (z) − .
b−a
?
Skizzieren Sie die Aussage des Satzes von Rolle. Dies ist gerade die Behauptung des Mittelwertsatzes.
Problemanalyse und Strategie: In beiden Fällen wird die Differenz von Funktionswerten durch den Mittelwertsatz
beschrieben, um Eigenschaften der Ableitung wie Beschränktheit oder Stetigkeit zu nutzen.
Lösung: Wir setzen voraus, dass auf einem offenen Intervall I eine
Auf Seite 321 wurde der Begriff der lipschitz-stetigen Funktion f : I → R gegeben ist, die für alle x ∈ I \{x̂}
Funktion eingeführt. Bei Funktionen f ∈ C 1 ([a, b]) folgt differenzierbar ist mit Ausnahme einer Stelle x̂ ∈ I . Wenn
diese Eigenschaft direkt aus dem Mittelwertsatz durch die Ableitung f : I \ {x̂} → R stetig fortsetzbar ist in x̂,
dann ist f auch stetig differenzierbar in x̂.
|f (x)−f (y)| = |f (z)(x −y)| ≤ max (|f (z)|) |x −y| .
z∈[a,b]
Zum Beweis betrachten wir den Differenzenquotienten
Wir sehen aber auch mit dem Mittelwertsatz, dass die und wenden den Mittelwertsatz an, der besagt, dass es
Funktionen f : R≥0 → R mit f (x) = x α und α ∈ (0, 1), ein z zwischen x und x̂ gibt mit
also etwa die Wurzelfunktion, in x = 0 nicht lipschitz-
stetig sind. Denn da die Funktionen stetig und auf R>0 f (x) − f (x̂)
= f (z) .
differenzierbar sind, können wir den Mittelwertsatz an- x − x̂
wenden und erhalten für x > 0:
Wir schreiben z = z(x), um deutlich zu machen, dass z
f (x) − f (0) = f (z)x = αzα−1 x von x abhängt. Wenn x → x̂ konvergiert, so strebt auch
mit z ∈ (0, x). Der Term zα−1 ist unbeschränkt für die Zwischenstelle z(x) gegen x̂. Da f stetig fortsetzbar
x → 0. Es lässt sich somit auf keinem Intervall [0, b] im Punkt x̂ ist, existiert der Grenzwert, und es gilt:
für f : [0, b] → R eine Lipschitz-Konstante angeben.
f (x) − f (x̂)
Eine andere Art der Anwendung des Mittelwertsatzes lim = lim f (z(x)) = f (x̂) .
x→x̂ x − x̂ x→x̂
steckt hinter einem nützlichen hinreichenden Kriterium
für Differenzierbarkeit von stückweise zusammengesetz- Damit ist die Differenzierbarkeit von f in x̂ gezeigt, und
ten Funktionen an „Nahtstellen“, wie etwa f : R → R mit der Grenzwert des Differenzenquotient stimmt mit der
f (x) = x 2 für x ≥ 0 und f (x) = 0 für x < 0. Fortsetzung f (x̂) der Ableitungsfunktion überein.
Kommentar: Beachten Sie, dass die letzte Aussage auch in a und b für f ∈ C 1 ([a, b]) gilt, wenn wir den jeweiligen
einseitigen Differenzenquotienten betrachten. Eine Aussage, die wir am Ende von Abschnitt 15.1 schon erwähnt haben.
Beide Anwendungen des Mittelwertsatzes, einmal, um Abschätzungen zu gewinnen, zum anderen, um Grenzwerte zu
untersuchen, wird man häufig in der Analysis finden.
gegeben ist, im Konvergenzintervall dieselbe Ableitung Mit dem Newton-Verfahren lassen sich
∞
! Nullstellen approximieren
g (x) = (−1)n x 2n
n=0 Wir werden dem Mittelwertsatz als beweistechnisches Werk-
besitzt. Somit ist mit obiger Feststellung arctan(x) = zeug immer wieder begegnen, zum Beispiel beim Abschätzen
g(x) + c für |x| < 1 mit einer Konstanten c ∈ R. Aus der Konvergenzordnung numerischer Verfahren. Ein solches
Verfahren ist das Newton-Verfahren zur Lösung von nicht-
0 = arctan(0) = g(0) + c = 0 + c
linearen Gleichungen der Form f (x) = 0. Nur in speziel-
folgt c = 0, und wir erhalten die Potenzreihendarstellung len Situationen, etwa bei affin-linearen oder quadratischen
∞
! Gleichungen, lassen sich Lösungen in geschlossener Form
(−1)n 2n+1
arctan(x) = x angeben. In den meisten Fällen sind wir auf numerische
(2n + 1)
n=0 Approximationen angewiesen, etwa um reelle Lösungen zu
für |x| < 1. cos x − x = 0 zu bestimmen. Das notwendige Kriterium
Diese Reihendarstellung lässt sich zum Beispiel nutzen, f (x) = 0 zur Bestimmung von Extremalstellen führt häufig
um eine Dezimaldarstellung der Zahl π zu berechnen, in- auf solche Gleichungen, deren explizite Lösung nur durch
dem die Auswertung von ein Näherungsverfahren bestimmt werden kann.
! (−1)n ∞ Der Idee der Linearisierung einer Funktion kommt dabei eine
π
= arctan(1) = entscheidende Bedeutung zu und führt unter anderem auf
4 (2n + 1)
n=0 das Newton-Verfahren, die am häufigsten genutzte Methode
1 1 1 1 zum Lösen nichtlinearer Gleichungen.
= 1 − + − + − ...
3 5 7 9
Suchen wir eine Nullstelle x̂ ∈ (a, b) einer differenzierbaren
bei hinreichender Genauigkeit abgebrochen wird. Funktion f : (a, b) → R, so startet die Methode zunächst
Gesucht ist eine Potenzreihendarstellung für den Loga- mit einer Stelle x0 ∈ (a, b), die man vorab wählen bzw.
rithmus, f (x) = ln x, x > 0. Mit der Ableitung errechnen muss. Dort betrachtet man die Linearisierung, d. h.
1 1
f (x) =
= f (x) ≈ g(x) = f (x0 ) + f (x0 )(x − x0 ) .
x 1 − (1 − x)
erkennen wir, dass zumindest für die Ableitung wieder Dies ist die Tangente an f im Punkt (x0 , f (x0 )) (siehe Abbil-
eine geometrische Reihe genutzt werden kann. Wir erhal- dung 15.15). Um eine Approximation an die gesuchte Null-
ten auf diesem Weg die Potenzreihendarstellung stelle zu bekommen, verwenden wir die Nullstelle dieser
∞
! Tangente, d. h., wir bestimmen eine neue Stelle x1 aus der
f (x) = (−1)n (x − 1)n linearen Gleichung
n=0
0 = f (x0 ) + f (x0 )(x1 − x0 ) .
für |x − 1| < 1 um den Entwicklungspunkt x0 = 1.
Andererseits lässt sich leicht nachrechnen, dass die Po- Wenn die Ableitung f (x0 ) von null verschieden ist, folgt
tenzreihe x1 = x0 − f (x0 )/f (x0 ) .
!∞
(−1)n Aus der Abbildung wird deutlich, dass zumindest in der ge-
g(x) = − (x − 1)n
n zeigten Situation x1 näher an der Nullstelle liegt als x0 . Das
n=1
Newton-Verfahren wiederholt diesen Vorgang, und konstru-
in ihrem Konvergenzintervall (0, 2) auch die Ableitung
iert so eine rekursive Folge
∞
! ∞
!
g (x) = − (−1)n (x − 1)n−1 = (−1)n (x − 1)n f (xn )
xn+1 = xn − , n ∈ N.
n=1 n=0 f (xn )
besitzt. Wir können in diesem Fall schließen, dass Nehmen wir an, dass die Folge (xn ) gegen einen Grenz-
ln(x) = g(x) + c wert x̂ ∈ (a, b) konvergiert und xn ∈ (a, b) für alle
n ∈ N gilt, so folgt im Grenzfall aus der Rekursionsglei-
mit einer Konstanten c ∈ R im Konvergenzintervall (0, 2)
chung f (x̂)/f (x̂) = 0, d. h., der Grenzwert x̂ ist Nullstelle
gilt. Berechnen wir f (1) = ln(1) = 0 und berücksich-
von f .
tigen, dass die Potenzreihe g(1) = 0 erfüllt, so folgt die
Identität Ein numerisches Verfahren nennt man Iterationsverfahren,
!∞ wenn, wie beim Newton-Verfahren, rekursiv eine Folge be-
(−1)n
ln(x) = − (x − 1)n für |x − 1| < 1 . rechnet wird, die sich einer Lösung nähert.
n
n=1
In diesen Beispielen haben wir aus Kenntnissen zur Ablei- Folgerung
tung einer Funktion zurück auf die Funktion geschlossen, Sind f : (a, b) → R zweimal stetig differenzierbar, f (x̂) = 0
im Vorgriff auf die Integration im folgenden Kapitel. für ein x̂ ∈ (a, b) und f (x̂) = 0. Dann gibt es ein δ > 0,
15.3 Der Mittelwertsatz 573
gegen eine andere Nullstelle konvergiert. Die schnelle und g(x) = 0, g (x) = 0 für x ∈ I . Wenn der Grenz-
Konvergenz ist in der Tabelle deutlich zu sehen. Beim wert lim f (x)/g (x) existiert, dann existiert auch der
x→a
Startwert x0 = −0.1 benötigt das Verfahren einige x>a
Schritte mehr als beim Startwert x0 = 1.0. Zum einen Grenzwert lim f (x)/g(x), und es gilt:
x→a
ist dieser Startwert weiter entfernt von der Nullstelle und x>a
zum anderen näher an der Stelle x = 0, in der die Ablei- f (x) f (x)
lim = lim .
tung verschwindet. Der Startwert x0 = 0 ist offensichtlich x→a
x>a g(x) x>a g (x)
x→a
Als Konsequenz aus dem verallgemeinerten Mittelwertsatz Oft ist es zunächst nötig den Ausdruck umzuformen,
betrachten wir eine Möglichkeit, Grenzwerte von rationalen damit die L’Hospital’sche Regel genutzt werden kann.
15.3 Der Mittelwertsatz 575
Außerdem ist häufig die Regel mehrmals anzuwenden, Um auf entsprechende Differenzen von Funktionswerten zu
um Erfolg zu haben. kommen, schreiben wir
Es gilt zum Beispiel:
f (x) f (x) − f (b̃) f (x) g(x) − g(b̃)
' ( ' ( =
1 1 sin x − x g(x) g(x) − g(b̃) f (x) − f (b̃) g(x)
lim − = lim
x→0 x sin x x→0 x sin x
f (z) 1 g(b̃)
cos x − 1 = 1− ,
= lim g (z) 1 − f (b̃) g(x)
x→0 sin x + x cos x f (x)
− sin x
= lim = 0. wobei nach dem Mittelwertsatz die Zwischenstelle z mit
x→0 2 cos x − x sin x
x < z < b̃ von den Punkten x, b̃ ∈ (a, b) abhängt. Bei
der Umformung müssen wir gewährleisten, dass alle Nen-
ner von null verschieden sind. Dies können wir aufgrund der
? Unbeschränktheit von f und g sicherstellen, wenn x = b̃
Bei welchem der folgenden beiden Ausdrücke können wir
hinreichend nah bei a liegt.
die L’Hospital’sche Regel anwenden, um einen Grenzwert
x → 0 zu bestimmen, Betrachten wir nun die drei Faktoren. Die letzten beiden stre-
x x ben gegen 1 für x → a und der erste Quotient gegen γ , wenn
sin x
und
cos x
? z → a bzw. b̃ → a. Dies lässt sich folgendermaßen ausnut-
zen:
Es sei ε > 0 vorgegeben. Dann gibt es b̃ ∈ (a, b), sodass
) )
) f (z) )
) )
Bei unbeschränkten Funktionen lässt sich eine ) g (z) − γ ) ≤ ε
Variante der L’Hospital’sche Regel nutzen
für alle z ∈ (a, b) mit |z − a| ≤ |b̃ − a|, da dieser Quotient
Neben der oben angegebene Regel von L’Hospital gibt es eine konvergiert. Wir halten den Wert b̃ fest. Weiterhin gibt es
zweite nützliche Variante, die aber aufwendiger zu zeigen ist. einen Wert δ > 0, sodass δ < |b̃ − a| ist und
) )
) g(b̃) )
) 1 − g(x) )
L’Hospital’sche Regel (zweiter Teil) ) − 1)≤ε
) )
)1 − f ( b̃) )
Sind f, g : I = (a, b) → R differenzierbare Funktionen f (x)
1 1
mit lim |f (x)| = 0 und lim |g(x)| = 0, dann ist
x→a x→a für alle x ∈ (a, a + δ) gilt. Insgesamt erhalten wir mit der
obigen Gleichung und der Dreiecksungleichung die Abschät-
f (x) f (x) zung
lim = lim ,
x→a
x>a g(x) x>a g (x)
x→a
) )
) ) ) )) g(b̃ )
) f (x) ) ) f (z) ) ) 1 − g(x) ) )
) ) ) )) )
) g(x) − γ ) ≤ ) g (z) − γ ) )
falls der Grenzwert auf der rechten Seite existiert.
)
Analog, wie bei den vorherigen L’Hospitalschen Regeln ) 1 − f (b̃) )
f (x)
gilt auch diese Variante für linkseitige Grenzwerte bei ) )
) g(b̃) )
b und in den Fällen I = (a, ∞) für x → ∞ oder I = ) 1 − g(x) )
+ |γ | )) − 1))
(−∞, b) für x → −∞. ) (1 − f (b̃) ) )
f (x)
≤ ε (1 + ε) + |γ | ε
Achtung: Es handelt sich bei der Regel von l’Hospital um
eine hinreichende Bedingung für die Existenz des Grenz- für alle x ∈ (a, b) mit |x − a| ≤ δ. Dies zeigt die Existenz
werts. Die Bedingung ist nicht notwendig, wie es am Beispiel und den Wert von lim f (x)/g(x) = γ .
x→a
limx→∞ sin xx+x = 1 zu sehen ist. x>a
bestimmen.
Problemanalyse und Strategie: Zunächst müssen Darstellungen gefunden werden, die rationale Terme enthalten,
die im Grenzfall auf unbestimmte Ausdrücke der Form „ 00 “ oder „ ∞
∞ “ führen. Dann kann die entsprechende Regel von
L’Hospital angewandt werden.
Lösung: mit dem zweiten Teil der Regel von L’Hospital von Seite
Indem wir den Ausdruck auf einem Bruch schreiben, er- 575 für den Grenzfall „ ∞
∞ “ zu berechnen. Für den gesuch-
gibt sich im Grenzfall die unbestimmte Form „ 00 “, so- ten Limes erhalten wir:
dass die L’Hospital’sche Regel anwendbar ist. Die fol-
gende Rechnung zeigt, dass wir in diesem Beispiel zwei- x ln x
lim x = exp lim 1 = exp(0) = 1 .
mal die Regel anwenden müssen, um im Grenzfall auf x→0 x→0
x
einen bestimmten Ausdruck und somit auf den Grenzwert
zu kommen. Wir erhalten: Auch im dritten Beispiel nutzen wir die Stetigkeit der Ex-
' ( ponentialfunktion. Es gilt:
1 1
lim 1− x t , x -
x→0 x 2 cos2 x lim 1+ = lim exp t ln 1 +
t→∞ t t→∞
, t x -
cos2 x − 1
= lim = exp lim t ln 1 + ,
x→0 x 2 cos2 x t→∞ t
−2 cos x sin x
= lim und wir untersuchen den Exponenten. Dazu schreiben wir
x→0 2x cos2 x − x 2 cos x sin x
−2 cos2 x + 2 sin2 x ,
= lim x - ln 1 + xt
x→0 2 cos2 x − 4x cos x sin x − x 2 (cos2 x − sin2 x) lim t ln 1 + = lim
t→∞ t t→∞ 1/t
= −1 . ln(1 + ε x)
= lim
ε→0 ε
Im zweiten Fall schreiben wir x/(1 + ε x)
= lim = x.
ln x ε→0 1
x
x = exp(x ln(x)) = exp 1
.
x Beachten Sie dabei, dass die Ableitungen bezüglich der
Variablen ε = 1/t betrachtet werden.
Da die Exponentialfunktion stetig ist, genügt es den Mit der Stetigkeit der Exponentialfunktion folgt so die
Grenzwert Identität
1 x t , x -
ln x x lim 1 + = exp lim t ln 1 + = ex ,
lim 1
= lim t→∞ t t→∞ t
x→0 x→0 − 12
x x
= − lim x = 0 die wir schon kennen und auf Seite 400 auf anderem Weg
x→0 gezeigt haben.
auch Newton’sche Reibung genannt. Die Bewegung lässt sich Durch Nachrechnen prüfen wir, dass die Funktion
durch die Differenzialgleichung
1 √
x(t) = ln cosh( μg t)
μ
x (t) + μ(x (t))2 = g
Lösung dieser Gleichung mit den Eigenschaften x(0) =
x (0) = 0 ist.
beschreiben, wobei x(t) die bis zur Zeit t zurückgelegte Hö-
hendifferenz, v(t) = x (t) die Geschwindigkeit, μ den Rei- Mit der Regel von L’Hospital können wir zeigen, dass diese
bungskoeffizienten und g die Erdbeschleunigung bezeich- Lösung für μ → 0 gegen die bekannte Lösung x(t) = g2 t 2
nen. des freien Falls im Vakuum konvergiert.
15.4 Verhalten differenzierbarer Funktionen 577
Dazu fassen wir den Ausdruck für x(t) bei festem Zeitpunkt Wir gehen in mehreren Schritten vor: Zunächst stellen wir
t > 0 als Funktion in μ auf. Zweimal L’Hospital’sche Regel fest, dass es mindestens ein globales Minimum und ein glo-
anwenden liefert: bales Maximum geben muss, da f auf dem kompakten In-
√ tervall [−2π, 2π ] eine stetige Funktion ist.
t g sinh( μg t )
√ √
1 √ 2 μg cosh( μg t) In einem zweiten Schritt suchen wir Extrema im Inneren des
lim ln cosh μg t = lim
μ→0 μ μ→0 1 Intervalls. Da f differenzierbar ist, genügt es, die notwendige
√
tg sinh μg t Bedingung f (x̂) = 0 zu untersuchen. Wir berechnen
= lim √
2 μg
f (x) = 1 + 2 cos x .
μ→0
1
√
tg 2 tg cosh μg t
= lim √ Aus der Bedingung f (x̂) = 0 folgt:
2 μ→0 μg 2√1μg g
g 2 1
= t , cos x̂ = −
2 2
√ als Bedingung für kritische Stellen x̂ ∈ [−2π, 2π]. Mit der
wobei wir den Grenzwert lim μ→0 cosh μg t = 1 einge-
setzt haben. Dies bestätigt die im Grenzfall bekannte Lösung Tabelle auf Seite 406 folgen die Möglichkeiten:
zum freien, ungedämpften Fall. 2 4 2 4
x̂ = π, x̂ = π, x̂ = − π oder x̂ = − π .
3 3 3 3
15.4 Verhalten differenzierbarer Nun berechnen wir die Funktionswerte an den kritischen Stel-
len und in den Randpunkten x = −2π und x = 2π, um
Funktionen festzustellen, an welcher Stelle ein globales Maximum bzw.
ein globales Minimum liegt. Wir erhalten
' (
Nachdem mit den letzten Abschnitten geklärt ist, wie man 4 4 √
Ableitungen bestimmen und den Mittelwertsatz nutzen kann, f (−2π) = −2π , f − π =− π + 3,
3 3
' ( ' (
werden wir nun weiter untersuchen, welche Information die 2 2 √ 2 2 √
Ableitung über das lokale Änderungsverhalten eines funktio- f − π =− π − 3, f π = π + 3,
3 3 3 3
nalen Zusammenhangs liefert. Betrachten wir Tangenten am ' (
4 4 √
Graphen einer stetigen Funktion, so ist offensichtlich, dass f π = π − 3, f (2π) = 2π .
die Steigungen dieser Tangenten Hinweise zum Verhalten der 3 3
Funktion etwa an extremen Stellen beinhalten (Abb. 15.16). Vergleichen wir diese Funktionswerte, so wird deutlich, dass
ein globales Minimum der Funktion bei x = −2π und ein
f (x) globales Maximum bei x = 2π liegen. Ob es sich bei den kri-
tischen Stellen im Inneren des Intervalls um lokale Extrema
handelt, können wir mit dieser Information noch nicht ent-
scheiden. Ein Bild des Graphen gibt uns natürlich Auskunft
über die Extremalstellen (Abb. 15.17).
x
Wir haben ein Kriterium, um eine Funktion auf Extremalstel-
len hin zu untersuchen. Aber es handelt sich um eine notwen-
dige Bedingung. Dies bedeutet, wenn ein Minimum oder
Maximum zu einer differenzierbaren Funktion in x̂ ∈ (a, b)
Abbildung 15.16 Die Lage der Tangenten am Graphen einer differenzierbaren vorliegt, dann gilt f (x̂) = 0. Andersherum können wir nicht
Funktion gibt Auskunft über das lokale Verhalten einer Funktion. folgern, d. h., wenn wir eine Stelle finden mit der Bedingung
f (x̂) = 0, so ist noch nicht gewährleistet, dass es sich um ein
Auf Seite 331 haben wir gesehen, dass jede stetige Funk- Extremum handelt. Das kanonische Beispiel ist die Funktion
tion auf kompakten Mengen Minima und Maxima besitzt. f : R → R mit f (x) = x 3 . Mit f (x) = 3x 2 ist f (0) = 0.
In vielen Situationen lassen sich kritische Stellen, an denen Es liegt aber weder ein lokales Minimum noch ein lokales
solche Extrema liegen, mithilfe des notwendigen Kriteriums Maximum vor, denn f (x) < 0 für x < 0 und f (x) > 0 für
f (x̂) = 0 bestimmen (siehe Seite 569). Betrachten wir dazu x > 0. Eine Stelle, in der die erste Ableitung verschwindet,
noch ein weiteres Beispiel: aber dennoch kein lokales Extremum vorliegt heißt Sattel-
punkt der Funktion f (Abb. 15.18).
Beispiel Gesucht sind alle globalen Extremalstellen der
Trotzdem ist es bei der Suche nach Extrema sinnvoll, die
Funktion
notwendige Bedingung f (x) = 0 zu betrachten. Lösungen
f (x) = x + 2 sin x
dieser im Allgemeinen nichtlinearen Gleichung nennen wir
auf dem Intervall [−2π, 2π ]. kritische Stellen.
578 15 Differenzialrechnung – die Linearisierung von Funktionen
Lemma
Wenn f : [a, b] → R eine stetige und auf (a, b) diffe-
−2π −π π 2π x
renzierbare Funktion ist, so gelten die folgenden Äquiva-
lenzen:
-2 -1 1 2 x
also gilt f (x1 ) ≤ f (x2 ).
-1 Sattelpunkt Andererseits folgt für eine monoton steigende Funktion, dass
der Differenzenquotient
-2
f (x + h) − f (x)
≥0
h
Abbildung 15.18 An der Stelle x = 0 liegt ein Sattelpunkt der Funktion nicht negativ ist. Die Ungleichung bleibt im Grenzfall h → 0
f : R → R mit f (x) = x 3 . erhalten. Also ist f (x) ≥ 0.
Zur Berechnung von kritischen Stellen muss die Gleichung Beachten Sie, dass die gesamte Ableitungsfunktion auf dem
f (x) = 0 für Argumente x ∈ D im Definitionsbereich ge- Intervall positiv sein muss. Für diese Bedingung wird häufig
löst werden. Schon bei Polynomen höheren Grads ist dies auch kurz f ≥ 0 ohne Argument geschrieben.
in geschlossener Form im Allgemeinen nicht möglich, so-
dass wir nur in Spezialfällen explizit Lösungen zu solchen ?
Gleichungen angeben können. Andernfalls bleibt uns nur Finden Sie ein Gegenbeispiel, um zu belegen, dass aus Po-
die Möglichkeit, Lösungen anzunähern, etwa mit dem auf sitivität der Ableitung an einer Stelle im Allgemeinen nicht
Seite 572 vorgestellten Newton-Verfahren. Monotonie folgt
?
Kann man diese Aussage zur strengen Monotonie umkehren?
15.4 Verhalten differenzierbarer Funktionen 579
Beispiel Ist die Ableitungsfunktion einer differenzierba- für x > 1 (Abb. 15.19), bzw.
ren Funktion auf einem Intervall positiv, so ist die Funktion 1
streng monoton wachsend, und es existiert eine differenzier- g (x) = − %
bare Umkehrfunktion. Auf welchem Intervall ist die Funktion x −1
2
Man berechnet zunächst die Ableitung f (x) = sinh(x). Aus für x > z > x̂. Wir haben also ein Kriterium gezeigt, um in
kritischen Stellen zu entscheiden, ob es sich um ein Minimum
ex − e−x ex oder ein Maximum handelt. Wir formulieren dies sowohl für
f (x) = = (1 − e−2x )
2 2 lokale Minima als auch für lokale Maxima in folgender Aus-
sage.
ergibt sich, dass
f (x) x1 x1 + t (x2 − x1 ) x2 x
2
f (x) > 0 f (x) < 0 f (x) > 0 Abbildung 15.21 Der Graph einer konvexen Funktion. Die Menge oberhalb
des Graphen ist konvex.
f
Zunächst wird definiert, was eine konvexe Mengen ist. Eine Funktion f : D → R auf einem Intervall D =
[a, b] ⊆ R heißt konvex, wenn
Konvexe Mengen
f (x + t (y − x)) = f ((1 − t)x + ty)
Eine Menge M ⊆ V in einem reellen Vektorraum V
≤ (1 − t)f (x) + tf (y)
heißt konvex, wenn alle Verbindungsstrecken zwischen
Punkten der Menge ganz in M liegen, d. h., mit x, y ∈ M für alle t ∈ [0, 1] und alle x, y ∈ D gilt.
folgt
x + t (y − x) ∈ M für alle t ∈ [0, 1] .
Können wir die Ungleichung für t ∈ (0, 1) durch eine echte
Ungleichung, „<“ , ersetzen, so wird die Funktion strikt
Man spricht bei Funktionen in einer Variablen von einer kon-
konvex oder streng konvex genannt. Entsprechend nennt
vexen Funktion, wenn die Teilmenge des R2 , die oberhalb
man eine Funktion konkav bzw. strikt konkav auf einem
des Graphen der Funktion liegt, konvex ist, wie zum Beispiel
Intervall, wenn die Funktion −f konvex bzw. strikt konvex
bei der Normalparabel (Abb. 15.21).
ist.
f (x)
−3 −2 −1 1 2 3 x
Für x, y ∈ R und t ∈ [0, 1] gilt: Abbildung 15.23 Eine Funktion, die weder konvex noch konkav ist.
f (x + t (y − x))
Satz
= a(x + t (y − x))2 + 2b(x + t (y − x)) + c Falls eine stetige Funktion f : [a, b] → R strikt kon-
= ax 2 + 2atxy − 2atx 2 + at 2 y 2 − 2at 2 xy vex bzw. strikt konkav ist auf einem Intervall [a, b], besitzt
sie genau ein Minimum bzw. Maximum auf diesem Intervall.
+ at 2 x 2 + 2bx + 2bty − 2btx + c
= (1 − t)(ax 2 + 2bx + c) + t (ay 2 + 2by + c)
Beweis: Wir führen den Beweis nur im Fall einer strikt
− at (x 2 − 2xy + y 2 ) + at 2 (x 2 + y 2 − 2xy) konvexen Funktion und einem Minimum. Die konkave Si-
= (1 − t)f (x) + tf (y) + at (t − 1)(x − y)2 . tuation mit einem Maximum gilt entsprechend.
Wir nehmen an, es gibt zwei lokale Minimalstellen x1 und x2 .
Da der Faktor (t − 1) < 0 ist, folgt im Fall a > 0 die Da wir wissen, dass es mindestens ein globales Minimum ge-
Abschätzung ben muss, genügt es, diese Annahme auf einen Widerspruch
zu führen. Aufgrund der Konvexität folgt
f (x + t (y − x)) < (1 − t)f (x) + tf (y)
f (x1 + t (x2 − x1 ))) < (1 − t)f (x1 ) + tf (x2 )
für x = y und t ∈ (0, 1). Die Funktion ist strikt kon- ≤ max{f (x1 ), f (x2 )}
vex. Andererseits folgt für a < 0, dass die Funktion strikt
konkav ist. für alle t ∈ (0, 1). Dies ist aber ein Widerspruch. Denn so-
Die Funktion f : R → R mit f (x) = |x| ist konvex, denn wohl in einer Umgebung des lokalen Minimums x1 als auch
mit der Dreiecksungleichung folgt: des Minimums bei x2 müssen die Funktionswerte f (x) grö-
ßer als f (x1 ) bzw. f (x2 ) sein, da es sich um lokale Minimal-
|x + t (y − x)| = |(1 − t)x + ty| ≤ (1 − t)|x| + t|y| . stellen handelt. Zumindest auf einer Seite, für kleine t > 0
oder für große Werte t < 1 trifft dies wegen der obigen Un-
gleichung nicht zu, wenn wir von zwei unterschiedlichen Mi-
Die Funktion f : R → R mit f (x) = x 4 − x 3 − 4x 2 + nimalstellen ausgehen. Also kann es nur eine Minimalstelle
4x +6 ist weder konvex noch konkav. Es gilt zum Beispiel geben.
mit x = −1 und y = 2:
Wir können somit bei strikt konvexen Funktionen folgern,
1 2 1
6 = f (0) = f (−1 + (2 + 1)) ≥ f (−1) + f (2) = 2 dass es sich um eine Minimalstelle handelt, wenn wir eine
3 3 3
kritische Stelle x̂ ∈ (a, b) mit f (x̂) = 0 finden. Und ent-
und andererseits: sprechend folgt bei einer konkaven Funktion aus f (x̂) = 0,
dass bei x̂ ein Maximum liegt.
75 5 1 5
= f (3/2) = f (−1+ (2+1)) ≤ f (−1)+ f (2) = 5 . Um die Eigenschaften konvex oder konkav zu definieren,
16 6 6 6
muss keine Regularität der Funktion, wie Stetigkeit oder Dif-
Beachten Sie, dass sich auf Teilintervallen die Funktion f ferenzierbarkeit, vorausgesetzt werden. Wenn aber eine zwei-
sehr wohl konvex oder konkav verhält (Abb. 15.23). mal stetig differenzierbare Funktion vorliegt, so kann man die
582 15 Differenzialrechnung – die Linearisierung von Funktionen
Beobachtung auch anders beschreiben. Der Zusammenhang für ein t ∈ (0, 1). Wenden wir den Mittelwertsatz jeweils
zur zweiten Ableitung einer Funktion lässt sich anschaulich in den Intervallen (x, x + t (y − x)) und (x + t (y − x), y)
begründen. Eine positive zweite Ableitung f (x) > 0 be- an, so gibt es Zwischenstellen z 1 , z2 ∈ (a, b) mit x < z1 <
deutet, eine monoton steigende Ableitungsfunktion f . Aber x + t (y − x) < z2 < y mit
genau dies ist charakteristisch für eine konvexe Funktion, wie
Abbildung 15.24 veranschaulicht. (1 − t)f (x) + tf (y) − f (x + t (y − x))
= (1 − t)f (z1 )(x − (x + t (y − x)))
−tf (z2 )(x + t (y − x) − y)
= −(1 − t)f (z1 )t (y − x) + tf (z2 )(1 − t)(y − x)
f (x)
= (1 − t)t (y − x) f (z2 ) − f (z1 ) .
Gehen wir den ersten Teil des Beweises noch einmal durch, f (x)
so wird deutlich, dass die Ungleichungen durch echte Un- 10
gleichungszeichen ersetzt werden können. Dies führt auf die
Aussage, dass f > 0 strikte Konvexität impliziert. Auch
hier können wir somit die Aussage, wie bei der Monotonie,
in einer Richtung verschärfen. Andersherum klappt es wie-
derum nicht. 5
Hinreichendes Kriterium für Extremalstellen Die zweite Ableitung g mit g (x) = − cos x hat an diesen
Ist eine Funktion f : (a, b) → R zweimal stetig diffe- Stellen die Werte g (zk ) = 0. Somit liefert uns das Kriterium
renzierbar in x̂ ∈ (a, b) mit f (x̂) = 0 und f (x̂) > 0 keine Auskunft über den Typ der kritischen Stellen. Aber aus
bzw. f (x̂) < 0. Dann ist x̂ eine lokale Minimalstelle g (x) = 1 − sin x ≥ 0 für alle x ∈ R folgt, dass f monoton
bzw. Maximalstelle der Funktion f auf (a, b). wachsend ist. Daraus lässt sich schließen, dass die Funktion
g keine Minima oder Maxima auf R besitzt (Abb. 15.25).
f (x) = −2 cos x Es ist naheliegend zu fragen, wie die Näherung, die wir
durch Linearisierung erreichen, gegebenenfalls durch Poly-
erhalten wir f (xk ) = −2 cos(π/6) < 0 und f (yk ) = nome höheren Grades verbessert werden könnte. Geben wir
−2 cos(5π/6) > 0. Also liegen an den kritischen Stellen xk eine Stelle x0 ∈ D vor, so besteht eine Möglichkeit darin,
lokale Maxima der Funktion, und die Punkte yk sind lokale ein Polynom pn vom Grad n zu suchen mit der Eigenschaft
Minimalstellen.
f (k) (x0 ) = pn(k) (x0 )
Betrachten wir die zweite Funktion g und bestimmen die
Nullstellen der Ableitung g (x) = 1 − sin x. Aus sin zk = 1 für den Funktionswert und die Ableitungen, k = 1, . . . , n,
ergeben sich die kritischen Punkte zk = π2 + 2kπ für k ∈ Z. an der Stelle x0 .
584 15 Differenzialrechnung – die Linearisierung von Funktionen
ein allgemeiner Mittelwert definiert. Diese Funktion ist streng monoton steigend. Die Monotonie impliziert die Abschätzungen
zwischen verschiedenen üblichen Mittelwerten.
Problemanalyse und Strategie: Um Monotonie der Funktion m zunächst für positive Argumente 0 < x < y zu
zeigen, betrachten wir die konvexe Funktion f : R>0 → R mit f (z) = zt für t = yx > 1. Die anderen Fälle werden
dann auf diesen Fall zurückgeführt.
⎛ ⎞1/x ⎛ ⎞1/y
Lösung: ! n ! n
1 1
⎝ ajx ⎠ <⎝ aj ⎠
y
Sind t > 1 und f : R≥0 → R definiert durch f (z) = zt ,
n n
dann gilt für die zweite Ableitung: j =1 j =1
f (z) = t (t − 1) zt−2 > 0 für 0 < x < y. Dies bedeutet, die Funktion m ist streng
für alle z > 0. Die Funktion f ist strikt konvex. Insbeson- monoton steigend für positive Argumente.
dere ist ' (
1 1 1 Für x < y < 0 betrachten wir die Kehrwerte und erhalten
f (b1 + b2 ) < f (b1 ) + f (b2 )
2 2 2 mit der oben gezeigten Abschätzung die Monotonie mit
für b1 , b2 > 0. Wir verwenden diese Ungleichung als In- |y| < |x| aus
duktionsanfang, um zu zeigen, dass die Abschätzung ⎛ ⎞1/x
⎛ ⎞t ⎛ ⎞ 1 ! n
1
! n ! n ⎝ aj ⎠
x
= 1/|x|
⎝ 1 1 1 |x|
bj ⎠ = f ⎝ bj ⎠ n
j =1 1
n
n
j =1 a
n n j
j =1 j =1 ⎛ ⎞1/y
1 !n
1 !
n 1 1 !n
1/|y| = ⎝ aj ⎠ .
y
< f (bj ) = bjt <
n n 1 n 1 |y| n
j =1
j =1 j =1 n j =1 aj
für positive Zahlen b1 , b2 , . . . , bn > 0 gilt. Der entspre-
In Aufgabe 15.18 zum Kapitel zeigen wir noch den Grenz-
chende Induktionsschritt ergibt sich mit der Konvexität
wert
von f aus
⎛ ⎞ ⎛ ⎞1/x
1 !
n+1
1 !n
√
f⎝ bj ⎠ lim ⎝ ajx ⎠ = n a1 · a2 · . . . · an .
n+1 x→0 n
j =1
j =1
⎛ ⎞
' ( ! n
1 1 1 Aufgrund der Stetigkeit der Funktion m gelten somit die
=f ⎝ 1− bj + bn+1 ⎠ Monotonieabschätzungen auch für x = 0 oder y = 0.
n+1 n n+1
j =1
⎛ ⎞
In der Abbildung ist der Graph von m für a1 = 2, a2 = 3
1! ⎠
n
n 1
< f⎝ bj + f (bn+1 ) und n = 2 gezeigt.
n+1 n n+1
j =1
1 1 m(x)
< (f (b1 ) + · · · + f (bn )) + f (bn+1 ) , 2.8
n+1 n+1
wobei die erste Abschätzung aus der Konvexität folgt und 2.4
die zweite Ungleichung die Induktionsannahme verwen-
det. 2.0
Beispiel: Kurvendiskussion
Der wesentliche Verlauf einer Funktion, die durch einen Ausdruck gegeben ist, lässt sich durch eine Kurvendiskussion
ermitteln. Es soll das Verhalten der rationalen Funktion f , die durch
x 4 − 5x 2
f (x) =
4(x − 1)3
gegeben ist, untersucht werden.
Problemanalyse und Strategie: Um die durch den Ausdruck gegebene Funktion zu diskutieren, sind mehrere Aspekte
zu betrachten. Zunächst müssen wir einen zulässigen Definitionsbereich der Funktion festlegen. Dann berechnet man
die Nullstellen von f, f , f . Aus diesen Informationen, zusammen mit der Stetigkeit, können Intervalle identifiziert
werden, in denen die Funktion positiv oder negativ, monoton und konvex oder konkav ist. Außerdem ergeben sich aus
den kritischen Stellen die lokalen Extremalstellen der Funktion. Weiter betrachtet man die Grenzwerte von f an den
Rändern des Definitionsbereichs, um das asymptotische Verhalten für x → ±∞ oder an Polstellen zu ermitteln.
In der Abbildung 15.26 ist die Approximationseigenschaft Mit der Verallgemeinerung des Mittelwertsatzes können wir
dieser Polynome an f (x) illustriert. das Restglied in Abhängigkeit der Stelle x0 , dem Argument
x und dem Grad des Taylorpolynoms anders darstellen. Dies
p
p4 5
ermöglicht explizite Abschätzungen der Differenz f − pn ,
f f (x) also des Fehlers bei Approximation der Funktion f durch ihr
Taylorpolynom.
p1 2
Beweis: Das Restglied
!
n
f (j ) (x0 )
rn (x; x0 ) = f (x) − (x − x0 )j
j!
j =0
lässt sich bei fester Wahl von x0 und n als Funktion von
x auffassen. Es gilt für diese Funktion an der Stelle x0 die
Gleichung rn (x0 ; x0 ) = 0. Auch für die Ableitungen gilt
−1 −0.5 0.5 1 x (j )
rn (x0 ; x0 ) = 0 für j = 1, . . . , n, denn dies ist gerade
die Bedingung, die am Anfang an die Taylorpolynome ge-
stellt wurde. Differenzieren wir ein weiteres Mal, so folgt
rn(n+1) (x; x0 ) = f (n+1) (x) für alle x ∈ (a, b), da die weite-
ren Terme im Restglied vom Taylorpolynom herrühren und
Abbildung 15.26 Approximation der Funktion, die durch 1/(1 + x) gegeben
ist, durch einige ihrer Taylorpolynome in einer Umgebung um x0 = 0. somit maximalen Grad n besitzen.
Nun wenden wir den verallgemeinerten Mittelwertsatz (siehe
? Seite 574) (n + 1)-mal an. Es folgt die Behauptung aus
Bestimmen Sie um den Entwicklungspunkt x0 = 1 das Tay-
lorpolynom vom Grad 3 zu der Funktion f (x) = exp(x). rn (x; x0 )
(x − x0 )n+1
rn (x; x0 ) − rn (x0 ; x0 ) rn (z1 ; x0 )
= =
Die Differenz zwischen Funktion und (x − x0 ) n+1 − (x0 − x0 ) n+1 (n + 1) (z1 − x0 )n
Taylorpolynom – das Restglied rn (z1 ; x0 ) − rn (x0 ; x0 )
= = ...
(n + 1) ((z1 − x0 )n − 0n )
Wir erwarten auch in der Umgebung des Punktes x0 eine gute (n) (n) (n)
rn (zn ; x0 ) rn (zn ; x0 ) − rn (x0 ; x0 )
Approximation von f durch pn . Wie gut diese Approxima- = =
(n + 1)! (zn − x0 ) (n + 1)! ((zn − x0 ) − 0)
tion für Punkte x = x0 wirklich ist, bleibt noch zu analy-
(n+1)
sieren. Dazu definieren wir die Differenz zwischen Funktion rn (zn+1 ; x0 ) f (n+1) (zn+1 )
= =
und Taylorpolynom rn (x; x0 ) = f (x)−pn (x; x0 ), das Rest- (n + 1)! (n + 1)!
glied. Auch beim Restglied kennzeichnen wir durch Angabe
des Parameters die Abhängigkeit vom Entwicklungspunkt. mit Zwischenstellen zj +1 ∈ R mit |zj +1 − x0 | < |zj − x0 |
Anders ausgedrückt gilt mit dem Restglied die folgende Iden- für alle j = 1, . . . , n. Mit zn+1 = z ist die Existenz der
tität: Zwischenstelle in der Lagrange’schen Restglieddarstellung
gezeigt.
Die Taylorformel
Die Darstellung einer n-mal stetig differenzierbaren Beispiel Betrachten wir als einfaches Beispiel f (x) = ex
Funktion f : (a, b) → R durch und x0 = 0. Wir rechnen aus: f (k) (x) = ex bzw. f (k) (0) =
f (x) = pn (x; x0 ) + rn (x; x0 ) 1. Somit ist
!
n
α · · · (α − k + 1) k
(1 + x)α = 1 + x + rn (x; 0)
k! Beweis: Zu x definieren wir die Funktion F : R → R
k=1
durch
mit der Lagrange-Darstellung des Restglieds !
n
f (j ) (y)
F (y) = f (x) − (x − y)j .
α . . . (α − n) j!
rn (x; 0) = (1 + z)α−n−1 x n+1 . j =0
(n + 1)!
Die Funktion ist so gewählt, dass F (x0 ) = rn (x; x0 ) und
Für beliebiges α ∈ R und k ∈ N ∪ {0}führt F (x) = 0 gilt. Außerdem ist F stetig differenzierbar mit
man die verall-
gemeinerten Binomialkoeffizienten αk ein durch:
' ( ' ( F (y) = −f (y)
α α . . . (α − k + 1) α
= und = 1. !
n
f (j +1) (y) f (j ) (y)
j j −1
k k! 0 − (x − y) − (x − y)
j! (j − 1)!
Beachten Sie, dass für α ∈ N diese mit den klassischen Bi- j =1
Anwenden des Mittelwertsatzes auf die Funktion F mit Mit den Betrachtungen aus Kapitel 11 konnten wir bislang,
x = x0 + h liefert die Existenz von τ ∈ (0, 1) mit wie in den vorherigen Beispielen, zu Funktionen eine Potenz-
reihe angeben, wenn sich die Funktion irgendwie als Grenz-
rn (x; x0 ) = F (x0 + h) − F (x0 ) wert einer geometrischen Summe schreiben ließ oder wir
= F (x0 + τ h)h die Funktion durch die Potenzreihe definiert haben. Die Tay-
f (n+1) (x0 + τ h) lorreihe bietet prinzipiell die Möglichkeit, auch in anderen
=− (x0 +h − (x0 +τ h))n h Fällen Potenzreihendarstellungen zu berechnen. Dazu muss
n!
aber noch geklärt werden, was die Taylorreihe innerhalb ihres
f (n+1) (x0 + τ h)
=− (h − τ h)n h Konvergenzradius mit den Funktionswerten der sie generie-
n! renden Funktion f zu tun hat. Dazu haben wir bereits zwei
f (n+1) (x0 + τ h) Aussagen fast gezeigt.
=− (1 − τ )n hn+1 .
n!
Lemma
Ist eine Funktion f : (x0 − R, x0 + R) → R durch eine
Mit dieser Restglieddarstellung können wir das Beispiel ab- Potenzreihe
schließen.
∞
!
f (x) = an (x − x0 )n
Beispiel Wir betrachten wieder die Funktion f (x) =
n=0
(1 + x)α und setzen für x ∈ (−1, 0) die Ableitung in die
Cauchy’sche Restglieddarstellung ein. Es folgt mit Konvergenzradius R > 0 gegeben, so ist dies die
Taylorreihe zu f , d. h., f ist unendlich oft differenzierbar
xn in x0 , und es gilt f (k) (x0 ) = k! ak für k ∈ N.
rn (x; 0) = − (1 − τ )n (α · · · · · (α − n))(1 + τ x)α−n−1
n! Ist f : {x ∈ R : |x − x0 | < d} → R eine in x0 ∈ R
bzw. unendlich oft differenzierbare Funktion und gilt für das
' ( ' ( Restglied zur Taylorformel
α 1−τ n
|rn (x; 0)| = |x|n (α − n) (1 + τ x)α−1 lim |rn (x; x0 )| = 0
n 1 − τ |x| n→∞
Da der Weg, Potenzreihen über eine Taylorreihe zu ermitteln schätzen wir ab:
in den meisten Fällen aufwendig ist, wird man, wenn mög-
lich, versuchen, Potenzreihen durch Umformen und Einset- 1 (2x)2n
|r2n−1 (x; 0)| ≤ →0
zen bekannter Potenzreihen zu bestimmen. Häufig ist auch 2 (2n)!
die Idee nützlich, durch Betrachtung der Ableitung einer für n → ∞ (siehe Seite 287). Mit diesen Beweisschritten
Funktion eine Potenzreihe zu ermitteln. Wir haben dies im haben wir nun direkt aus der Taylorformel die Potenzreihe
Beispiel auf Seite 567 schon gesehen. zu sin2 um x0 = 0 hergeleitet.
Mit den Überlegungen zur allgemeinen binomischen
Beispiel Reihe im Beispiel auf Seite 588 und dem zweiten Teil
Gesucht ist eine Potenzreihe zur Funktion f : R → R mit
des Lemmas haben wir insbesondere eine Potenzrei-
f (x) = sin2 x um den Entwicklungspunkt x0 = 0.
henentwicklung der Wurzelfunktion f : R>0 → R mit
√
Um die Potenzreihe zu finden, können wir mit den Addi- f (x) = x um x = 1 mit Konvergenzradius R = 1
tionstheoremen gezeigt. Denn es ist
1 − cos 2x √
f (x) = sin2 x = 1
x = (1 + (x − 1)) 2 .
2
schreiben. Nutzen wir die bekannte Potenzreihe für Also erhalten wir für |x − 1| < 1 die Darstellung
cos 2x, so folgt die Entwicklung:
∞
!
√ 1 1 · 3 · . . . · (2n − 3)
∞
1 1 ! (−1)n x = 1 + (x − 1) + (x − 1)n .
f (x) = − (2x)2n 2 2n n!
n=2
2 2 (2n)!
n=0
∞
! (−1)n−1 2n−1 2n
= 2 x
(2n)!
n=1
Nicht jede Taylorreihe konvergiert gegen die
für alle x ∈ R. sie generierende Funktion
Wir versuchen, dasselbe Ergebnis direkt aus der Definition
der Taylorreihe zu ermitteln. Mit den Ableitungen Im letzten Beispiel ergibt sich aus dem Quotientenkriterium
mit
f (x) = sin 2x, f (x) = 2 cos 2x f (x) = −4 sin 2x ) )
) 1 · 3 · . . . · (2n − 1) 2n n! (x − 1)n+1 ))
)
usw. können wir induktiv zeigen, dass ) )
) 1 · 3 · . . . · (2n − 3)2n+1 (n + 1)! (x − 1)n )
n−1
(n) 2 (−1)n/2−1 cos 2x, n gerade (2n + 1)
f (x) = = |x − 1| −→ |x − 1| , n→∞
2n−1 (−1)(n−1)/2 sin 2x, n ungerade 2(n + 1)
Ohne die Kenntnis des Konvergenzradius sehen wir zwar Achtung: Es gibt Taylorreihen, die zwar konvergieren,
mit dem Quotientenkriterium, dass die Reihe für alle aber nicht gegen den Funktionswert f (x) der sie generie-
x ∈ R konvergiert, wegen renden Funktion f .
) )
) 22j +1 (2j )! x 2j +2 )
)
)
)
)=
4
|x|2 → 0 ?
) (2j + 2)! 2 2j −1 x 2j ) (2j + 1)(2j + 2) Geben Sie die Taylorreihe zur Funktion f : R → R mit
f (x) = |x| um den Entwicklungspunkt x0 = 1 an, und
für j → ∞. Aber um zu beweisen, dass die so gewonnene vergleichen Sie die Funktion und die Taylorreihe.
Reihe die Potenzreihe zu sin2 um x0 = 0 ist, bleibt noch
zu zeigen, dass das Restglied gegen null konvergiert. Mit
Damit die durch die Taylorreihe gegebene Potenzreihe in ih-
f (2n) (ξ ) 2n 22n−1 (−1)n−1 cos 2ξ 2n rem Konvergenzkreis mit der Funktion f übereinstimmt, darf
r2n−1 (x; 0) = x = x
(2n)! (2n)! die oben geforderte Bedingung nicht außer Acht gelassen
15.5 Taylorreihen 591
zu berechnen.
Problemanalyse und Strategie: Um die Taylorreihen zu ermitteln, versuchen wir, schon bekannte Potenzreihen zu
nutzen. Im ersten Fall schreiben wir f (x) = 12 (ln(1 + x) − ln(1 − x)) und verwenden die Potenzreihe zum Logarithmus.
%
Im zweiten Beispiel betrachten wir die Ableitung der Funktion g mit g (x) = 1/ 1 − x 2 und nutzen die allgemeine
binomische Reihe.
werden, dass das Restglied eine Nullfolge bilden muss. Das zeigt man, dass für x = 0 jede Ableitung von der Form
folgende Gegenbeispiel zeigt, dass diese Schwierigkeit beim
Umgang mit Taylorreihen auch bei unendlich oft differen- qk (x)
(k) exp(−1/x) , x > 0
zierbaren Funktionen auftritt. Das Beispiel zeigt auch, dass f (x) = x 2k
0, x<0
die Menge der unendlich oft differenzierbaren Funktionen
auf einem Intervall mehr Funktionen umfasst als die ana-
mit einem Polynom qk vom Grad ≤ k ist.
lytischen, also die Funktionen, die sich in eine Potenzreihe
entwickeln lassen. Jetzt benötigen wir den Grenzwert
∞ ' (
!
∞
! (−1)n 2n
α α n cos x = für x ∈ C
(1 + x) = x für |x| < 1 (2n)!
x
n n=0
n=0
!∞
(−1)n 2n+1
mit dem verallgemeinerten Binomialkoeffizienten sin x = x für x ∈ C
(2n + 1)!
n=0
' ( ∞ 2n 2n
α α · . . . · (α − n + 1) ! 2 (2 − 1)B2n 2n−1 π
= . tan x = x , |x| <
n n! (2n)! 2
n=1
∞
Die Exponentialfunktion π ! 1 · 3 . . . (2n − 1) 2n+1
arccos x = − x , |x| < 1
2 (2n + 1) 2n n!
∞
! n=1
1 n ∞
exp(x) = x für x ∈ C ! 1 · 3 . . . (2n − 1) 2n+1
n! arcsin x = x , |x| < 1
n=0 (2n + 1) 2n n!
!∞ n=1
1 2n ∞
cosh(x) = x für x ∈ C ! (−1)n 2n+1
(2n)! arctan x = x , |x| < 1
n=0 (2n + 1)
!∞ n=0
1 ∞
sinh(x) = x 2n+1 für x ∈ C π ! (−1)n 2n+1
(2n + 1)! arccot x = − x , |x| < 1
n=0 2 (2n + 1)
!∞ n=0
(−1)n+1 22n (22n − 1)B2n π
tanh(x) = x 2n−1 , |x| <
(2n)! 2 Mit B2k sind die sogenannten Bernoulli-Zahlen bezeich-
n=1
∞
net, die sich rekursiv aus
! xn
ln(x + 1) = (−1)n+1
, |x| < 1 n '
! (
n n+1
n=1 B0 = 1 und Bk = 0
' ( ∞
!
k
1 1+x 1 k=0
artanh x = ln = x 2n+1 , |x| < 1
2 1−x 2n + 1 für n ∈ N berechnen lassen.
n=0
so lässt sich abschätzen: für alle m = 0, 1, 2, . . ., und der Grenzwert folgt aus dem
Majorantenkriterium. Daher ist in unserem Beispiel die k-
1 −1/x tm tm
e = t = te Ableitung f (k) für jedes k = 0, 1, 2, . . . ergänzbar mit
x m e ∞ 1 k
k=0 k! t f (k) (0) = 0 zu einer stetigen Funktion auf R. Jedes Taylor-
tm polynom um Entwicklungspunkt x0 = 0 ist konstant null.
≤ 1 m+1 Für keinen Wert x > 0 konvergiert pn (x; 0) n∈N gegen den
(m+1)! t
Funktionswert f (x).
1
= (m + 1)! → 0 , für t → ∞ ,
t
Zusammenfassung 593
Zusammenfassung
Änderungsrate, Steigung des Graphen und Linearisierung, lung der Differenz von Funktionswerten bei differenzierba-
alle drei Betrachtungen führen auf den zentralen Begriff die- ren Funktionen.
ses Kapitels, die Ableitung.
Der Mittelwertsatz
Definition der Ableitung Ist f : [a, b] ⊆ R → R eine stetige Funktion, die auf
Eine Funktion f : I → R, die auf einem offenen Inter- (a, b) differenzierbar ist, dann gibt es eine Zwischen-
vall I ⊆ R gegeben ist, heißt an einer Stelle x0 ∈ I stelle z ∈ (a, b) mit
differenzierbar, wenn der Grenzwert
f (b) − f (a) = f (z) (b − a) .
f (x) − f (x0 )
lim
x→x0 x − x0 Der Mittelwertsatz lässt sich zur Abschätzung von Diffe-
x=x0
renzen von Funktionswerten sowie bei Grenzwerten nutzen.
existiert. Diesen Grenzwert nennt man die Ableitung Eine Verallgemeinerung führt unter anderem auf die Regeln
von f in x0 . Er wird mit f (x0 ) bezeichnet. von L’Hospital. Mit dem Mittelwertsatz lassen sich darüber
hinaus Eigenschaften des Verhaltens von Funktionen, wie
Die Ableitung eines gegebenen Ausdrucks anhand der De- Monotonie und Konvexität und auch Extremalstellen anhand
finition zu bestimmen, ist mühselig. Mit den grundlegenden der Ableitung charakterisieren. Diese Zusammenhänge sind
Techniken der Produktregel in der Übersicht auf Seite 586 aufgelistet.
Deutlich wird die Beziehung zwischen einer Funktion und
(fg) (x) = f (x)g (x) + f (x)g(x) ihren Ableitungen anhand der Taylorpolynome:
und der Kettenregel !
n
f (k) (x0 )
pn (x; x0 ) = (x − x0 )k , x ∈ R.
(g ◦ f ) (x) = g (f (x))f (x) k=0
k!
lässt sich das Differenzieren aber auf einige wenige Ablei- Gilt für das Restglied, die Differenz zwischen Funktion und
tungen zurückführen. Taylorpolynom, mit wachsendem Grad, dass
Ist eine Funktion in eine Potenzreihe entwickelbar, so ist sie |f (x) − pn (x, x0 )| → 0, n → ∞,
im Konvergenzbereich beliebig oft differenzierbar, und die
Ableitung ist durch die gliedweise differenzierte Reihe gege- so ist die Funktion in eine Potenzreihen entwickelbar. Und
ben. Beim Beweis zeigt sich ein weiteres Mal die Bedeutung diese Potenzreihe ist durch die Taylorreihe gegeben.
gleichmäßiger Abschätzungen beim Vertauschen von Grenz-
prozessen, hier im Fall von Differenzquotienten zu Partial-
Definition der Taylorreihe
summen.
Die Potenzreihe
Die bei Differenzierbarkeit sinnvolle Approximation durch ∞
Linearisierung ! f (n) (x0 )
n
(x − x0 ) ,
n!
f (x) = f (x0 ) + f (x0 )(x − x0 ) +o(|x − x0 |) . n=0
„Linearisierung“ generiert durch eine unendlich oft differenzierbare Funk-
tion f : (a, b) → R um einen Entwicklungspunkt
hat weitreichende Konsequenzen beim Umgang mit Funk- x0 ∈ (a, b), heißt Taylorreihe zu f um x0 .
tionen. So liefert der Mittelwertsatz eine nützliche Darstel-
594 15 Differenzialrechnung – die Linearisierung von Funktionen
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
15.13 •• Zeigen Sie für |x| < 1 die Taylorformel 15.19 •• Gegeben sind Zahlen xj ∈ [a, b], λj ∈ (0, 1)
für j = 1, . . . , n und nj=1 λj = 1.
1−x
ln (a) Zeigen Sie, dass für eine konvexe Funktion f : [a, b] → R
1+x
die Ungleichung
x3 x 2n−1 ⎛ ⎞
= −2 x + + ··· + + r2n (x; 0) !n !
n
3 2n − 1
f⎝ λj x j ⎠ ≤ λj f (xj )
mit dem Restglied j =1 j =1
' ( gilt.
−x 2n+1 1 1
r2n (x; 0) = + (b) Beweisen Sie für positive Zahlen xj ≥ a > 0 die Un-
2n + 1 (1 + tx)2n+1 (1 − tx)2n+1 gleichung zwischen gewichteten arithmetischen und geome-
für ein t ∈ (0, 1). trischen Mittelwerten:
15.14 • Berechnen Sie die vier Grenzwerte 15.20 ••• Zeigen Sie, dass eine konvexe Funktion
f : [a, b] → R auf einem kompakten Intervall [a, b]
ln(ln x) 1 1
lim , lim − , (a) nach oben beschränkt und
x→∞ ln x x→0 ex − 1 x
(b) in x ∈ (a, b) stetig ist.
xa − ax
lim cot(x)(arcsin(x)) , lim , a ∈ R>0 \{1} .
x→0 x→a ax − aa 15.21 •• Begründen Sie, dass eine 2n-mal stetig diffe-
renzierbare Funktion f : (a, b) → R mit der Eigenschaft
15.15 • Bestimmen Sie eine Konstante c ∈ R, sodass f (x̂) = · · · = f (2n−1) (x̂) = 0
die Funktion f : [−π/2, π/2] → R
1
und
x2 x = 0 , f (2n) (x̂) > 0
f (x) = (cos x) ,
c, x=0 im Punkt x̂ ∈ (a, b) ein Minimum hat.
stetig ist.
15.22 • Beweisen Sie zur Taylorformel die Restglied-
darstellung von Schlömilch:
Beweisaufgaben
(x − x0 )n+1
15.16 • Beweisen Sie induktiv die Leibniz’sche Formel rn (x; x0 ) = (1−τ )n+1−p f (n+1) (x0 +τ (x−x0 ))
n! p
für die n-te Ableitung eines Produkts zweier n-mal differen-
zierbarer Funktionen f und g: mit p ∈ N, indem sie den verallgemeinerten Mittelwertsatz
anwenden auf die Funktion F : R → R aus dem Beweis zum
n ' (
! n Cauchy’schen Restglied und die Funktion G : R → R mit
(fg)(n) = f (k) g (n−k) für n ∈ N0 .
k G(y) = (x − y)p .
k=0
S. 554 S. 567
Wenn wir die Betragsfunktion um die Stelle x0 = 0 betrach- Mit der Potenzreihendarstellung
ten, so gilt:
∞
!
f (x + h) − f (x − h) |h| − |h| 1 n
lim = lim =0 exp(x) = ex = x
h→0 2h h→0 2h n!
n=0
h=0 h =0
Der Grenzwert existiert somit, aber die Funktion ist in x0 = für x ∈ R folgt:
0 nicht differenzierbar, wie wir im Beispiel auf Seite 553
∞
! ∞
gesehen haben. n n−1 ! 1
exp (x) = x = x n−1 .
n! (n − 1)!
S. 555 n=1 n=1
Die Ableitung im Sinne der Linearisierung einer Funktion
ist ein analytisches Konzept. Die Anschauung als Steigung Verschiebt man den Index n − 1 n, so bestätigt sich das
der Tangente an einem Graphen ist hingegen eher ein geo- frühere Resultat
metrischer Zugang. Die Interpretation der Ableitung als Än- ∞
! 1 n
derungsrate, bzw. bei zeitlicher Änderung einer Ortsvariable exp (x) = x = exp(x) .
als Geschwindigkeit, ist physikalischer Natur. n!
n=0
S. 559
Da |x sin(1/x)| ≤ |x| → 0 für x → 0 gilt, ist die Funktion
stetig in null mit f (0) = 0. Der Differenzenquotient für S. 570
x = 0 ist Da entweder ein Maximum oder ein Minimum nicht am Rand
' (
f (x) − f (0) 1 der Funktion liegen kann, gibt es eine Stelle mit verschwin-
= sin , dender Ableitung, wie die Skizze in Abbildung 15.14 eines
x−0 x
möglichen Graphen illustriert.
d. h., der Grenzwert x → 0 existiert nicht, die Funktion ist
in null nicht differenzierbar.
f (x)
S. 559
Es gilt f (n) ∈ C r−n (a, b).
S. 563
a) Mit Ketten- und Produktregel ergibt sich:
b) Sehen wir den Ausdruck etwa als Komposition von 1/x Abbildung 15.27 Illustration zum Satz von Rolle.
und dem Nenner an, so folgt mit der Kettenregel:
1
f (x) = − (cos2 x − sin2 x)
2 + sin x cos x S. 575
1 − 2 cos2 x Nur im ersten Beispiel ist die Regel anwendbar, denn sowohl
= . für den Zähler als auch für den Nenner gilt sin x → 0 und
2 + sin x cos x
x → 0 für x → 0. Damit ergibt sich der Grenzwert
S. 565
Es gilt: x 1
lim = lim = 1.
x→0 sin x x→0 cos x
f (t) = (eat (cos(bt) + i sin(bt))
= aeat (cos(bt) + i sin(bt)) + beat (− sin(bt) + i cos(bt)) Im zweiten Fall ist der Grenzwert des Nenners, cos x → 1
für x → 0, von null verschieden, und die Regel ist nicht
= (a + ib)eat (cos(bt) + i sin(bt))
anwendbar. Der Grenzwert ergibt sich in diesem Fall direkt
= zezt . zu
x 0
Man beachte, dass sich die Rechenregel aus dem Reellen lim = = 0.
überträgt. x→0 cos x 1
Antworten der Selbstfragen 597
?
Berechnen Sie den Wert des Integrals
J 1 x
f (x) dx Abbildung 16.3 Annäherung einer Funktion durch Treppenfunktionen.
0
für die Treppenfunktion f : [0, 1] → R mit Es ist erforderlich, Folgen von Treppenfunktionen zu be-
' (
n−1 n trachten. In Anlehnung an die bereits bekannten Notationen
f (x) = (−1)n n für x ∈ , , n = 1, 2, . . . , 10. bei Zahlenfolgen definieren wir Monotonie und eine erste
10 10
Variante von Konvergenz bei Folgen von Funktionen.
602 16 Integrale – von lokal zu global
Punktweise Konvergenz von Funktionenfolgen Beweis: Ist (fn ) gleichmäßig konvergent gegen die Funk-
tion f , so gibt es zu ε > 0 ein N ∈ N mit |fn (x) − f (x)| ≤ ε
Eine Folge (fn )n∈N von Funktionen fn : D → R mit
für alle x ∈ D und n ≥ N . Da die Menge {|fn (x) − f (x)| |
gemeinsamer Definitionsmenge D ⊆ R heißt mono-
x ∈ D} beschränkt ist, existiert ein Supremum, und die Ab-
ton wachsend (fallend), wenn
schätzung bleibt für das Supremum erhalten:
fn+1 (x) ≥ fn (x) bzw. fn+1 (x) ≤ fn (x)
sup |fn (x) − f (x)| ≤ ε .
x∈D
für alle x ∈ D ist.
Die Folge (fn )n∈N heißt punktweise konvergent ge- Also ist lim fn − f ∞ = 0.
n→∞
gen eine Funktion f : D → R, wenn der Grenzwert
Andererseits folgt aus lim fn −f ∞ = 0, dass es zu ε > 0
n→∞
lim fn (x) = f (x) ein N ∈ N gibt mit
n→∞
für jedes x ∈ D existiert. |fn (x) − f (x)| ≤ sup |fn (y) − f (y)| = fn − f ∞ ≤ ε
y∈D
Um zwischen der Monotonie einer Funktionenfolge und der für alle x ∈ D. Also ist die Funktionenfolge gleichmäßig
Monotonie der Folge einzelner Funktionswerte, fn (x) für konvergent.
sup x n − 0 ≤ q n → 0, n → ∞.
? x∈[0,q]
Worin besteht der Unterschied bei den Definitionen von
punktweiser und gleichmäßiger Konvergenz? Für q = 1 ist die Folge punktweise konvergent gegen
0 für x ∈ [0, 1),
f (x) =
Später werden auch noch weitere Konvergenzbegriffe bei 1 für x = 1 .
Funktionenfolgen betrachtet (siehe Kapitel 19). Wir beschäf-
Die Folge konvergiert aber nicht gleichmäßig;
√ denn wäh-
tigen uns zunächst mit diesen beiden. Eine nützliche Cha-
len wir etwa zu ε = 1/2 Stellen xn = 1/ 2 ∈ [0, 1], so
n
rakterisierung der gleichmäßigen Konvergenz bei Funktio-
gilt:
nenfolgen ergibt sich mit der Supremumsnorm, die zu
f : D → R definiert ist durch 1
sup |fn (x) − f (x)| ≥ |fn (xn ) − 0| ≥
x∈[0,1] 2
f ∞ = sup |f (x)| ,
x∈D
für n ∈ N. Die Funktionenfolge konvergiert somit nicht
gleichmäßig.
wenn das Supremum existiert.
Die Funktionenfolge fn : [0, 1] → R mit
0.2 f1
0 0.5 1.0 x
Abbildung 16.5 Die Funktionenfolge mit fn (x) = nx(1 − x)n .
j −1 j +1
Wir halten fest, dass es bei Funktionenfolgen unterschied- 2n 2n
liche Arten von Konvergenzen gibt, von denen wir hier zwei Abbildung 16.6 Approximation der Identität durch Folgen von Treppenfunk-
kennengelernt haben. Für eine detailliertere Diskussion ver- tionen mit unterschiedlichen Monotonieeigenschaften.
weisen wir auf das Kapitel 19 und kommen zurück zum Inte-
gralbegriff. Eine Definition des Integrals erfordert nach die- Bei einer Definition muss gewährleistet sein, dass der Inte-
sen Überlegungen eine Festlegung, welche Art von Appro- gralwert zu einer Funktion f unabhängig von der speziellen
ximation durch Treppenfunktionen betrachtet werden soll. Wahl einer approximierenden Folge von Treppenfunktionen
Letztlich basieren die unterschiedlichen Integrationsbegriffe ist. Damit wird deutlich, was neben den Eigenschaften (siehe
auf verschiedenen Konvergenzbegriffen zu Folgen von Trep- Übersicht auf Seite 611) im Detail gezeigt werden muss, um
penfunktionen. Es gibt aber noch eine weitere Schwierig- den Begriff des Integrals für eine größere Klasse von Funk-
keit. Funktionen lassen sich durch unterschiedliche Folgen tionen zu klären.
604 16 Integrale – von lokal zu global
Verschiedene Arten von Konvergenz führen Nullmengen in R sind Mengen mit Maß Null
auf unterschiedliche Integralbegriffe
Deswegen werden Teilmengen von [a, b] betrachtet, die
keine Länge, gewissermaßen keine Ausdehnung besitzen.
Eine Möglichkeit ist es, die Menge aller Grenzfunktionen von
Solche Teilmengen der reellen Zahlen nennt man Nullmen-
gleichmäßig konvergenten Treppenfunktionen zu betrach-
gen. Um eine exakte Definition zu erreichen, führen wir
ten. Diese Funktionen heißen Regelfunktionen und liefern
die Notation |I | = |b − a| für die Länge eines Intervalls
einen Vektorraum integrierbarer Funktionen. Das Riemann-
I = (a, b) ein. Wir sprechen auch vom Maß oder vom Inhalt
Integral hingegen basiert auf einer anderen Idee. Das Integral
des Intervalls I . Mit dieser Bezeichnung lässt sich der Begriff
wird als Grenzwert von Riemann-Summen, d. h.:
Nullmenge definieren.
!
n
f (ξjn )|xjn+1 − xjn | Definition von Nullmengen
j =1
Eine Menge M ⊆ R heißt Nullmenge, wenn es zu jedem
Wert ε > 0 abzählbar viele beschränkte Intervalle Jk ⊆ R,
definiert, wobei mit wachsendem n feinere Zerlegungen des
k ∈ N, gibt mit den beiden Eigenschaften:
Intervalls [a, b] und weitere Stellen ξjn ∈ [xjn , xjn+1 ] in den
Die Vereinigung all dieser Intervalle überdeckt die
entsprechenden Teilintervallen gewählt werden. Dies bedeu-
Menge M, d. h.:
tet, wir betrachten Folgen von Treppenfunktionen, die an spe-
∞
ziellen Stellen mit f übereinstimmen und deren Riemann-
M⊆ Jk .
Summen konvergieren.
k=1
Die verschiedenen Zugänge diskutieren wir in Abschnitt 16.7
Die Summe der Intervalllängen ist durch
genauer und zeigen unter anderem, dass stetige Funktionen
∞
!
auf kompakten Intervallen bei allen Varianten integrierbar
sind. Im folgenden Abschnitt wenden wir uns einer dritten |Jk | ≤ ε
k=1
Möglichkeit zu, dem Lebesgue-Integral. Dabei werden wir
eine Verallgemeinerung der punktweisen Konvergenz nut- abschätzbar.
zen. Die Herleitung dieses Integrationsbegriffs ist aufwen-
diger. Aber wir werden belohnt mit einem Vektorraum inte- Beachten Sie, dass in der Definition Jk = ∅ zugelassen ist
grierbarer Funktionen, der genau die Eigenschaften aufweist, und somit auch endlich viele Intervalle ausreichen können.
die in sehr vielen weiterführenden Bereichen der Mathematik
grundlegend sind. Warum dies so ist, wird mit den Abschnit-
ten 16.5 bis 16.7 deutlich werden. Auch die spätere Erwei-
terung der Integration im Rn (siehe Kapitel 22) ergibt sich
relativ direkt mit der folgenden Definition. Abbildung 16.7 Eine Nullmenge lässt sich durch Intervalle überdecken, deren
Gesamtlänge durch ε > 0 nach oben beschränkt ist.
Mit dem Beispiel ergibt sich etwa, dass die rationalen Zah- Somit ist J˜k eine Überdeckung von M = ∞ n=1 Mn mit einer
len Q ∩ [a, b] ⊆ [a, b] eine Nullmenge bilden, da wir die Gesamtlänge kleiner ε. Eine entsprechende Abschätzung gilt
rationalen Zahlen abzählen können (siehe Seite 122). für jeden Wert ε > 0. Es folgt, dass M eine Nullmenge
ist.
?
Kann ein Intervall (a, b) ⊆ R eine Nullmenge sein?
Mit dem Beispiel in der Vertiefung auf Seite 606 wird deut-
lich, dass es auch überabzählbare Nullmengen gibt.
Achtung: Hier, in der Maß- und Integrationstheorie, wird
der Ausdruck „fast alle“ für „alle bis auf eine Menge vom
Maß Null“ verwendet. Die genaue Bedeutung der Phrase
hängt aber vom Kontext ab. Gilt etwa eine Aussage für fast Fast überall punktweise konvergente und
alle Glieder einer Folge (an ), so gilt sie für alle bis auf endlich
monotone Funktionenfolgen sind der
viele Folgenglieder.
Schlüssel zum Integralbegriff
Jede abzählbare Vereinigung von Nullmengen Mit dem Begriff der Nullmenge können wir nun angeben,
ist wieder eine Nullmenge welche Art Grenzwerte von Folgen von Treppenfunktionen
beim Lebesgue-Integral betrachtet werden. Wir nennen eine
Zwei Eigenschaften von Nullmengen sind für die Konstruk- Folge (fn )n∈N von Funktionen fast überall monoton, wenn
tion eines allgemeinen Integralbegriffs wichtig. Die erste
Aussage ist relativ klar.
fn+1 (x) ≥ fn (x) bzw. fn+1 (x) ≤ fn (x)
Lemma
Jede Teilmenge einer Nullmenge ist wieder eine Null- für fast alle x ∈ [a, b] gilt. Entsprechend ist (fn ) fast überall
menge punktweise konvergent gegen f : [a, b] → R, wenn
Jede Menge Cn ist eine Überdeckungen der Cantormenge Also ist fn (x) eine Cauchy-Folge und insbesondere kon-
A
C = ∞ n=0 n , denn Cn+1 ⊆ Cn . Also ist C eine Null-
C vergent. Wir definieren die Grenzfunktion f : [0, 1] → R
menge. durch f (x) = limn→∞ fn (x).
Die Cantormenge ist wie die Mandelbrotmenge von Die Funktion f ist stetig. Dies folgt aus obiger Abschät-
Seite 282 ebenfalls ein Beispiel für ein Fraktal. Der Menge zung; denn die Cauchy-Folgen lassen sich gleichmäßig
kann man nicht mehr sinnvoll eine ganzzahlige Dimension über x ∈ [0, 1] abschätzen, d. h., fm − fn ∞ → 0,
zuordnen. m, n → ∞. Später in Kapitel 19 werden wir sehen, dass
stets aus gleichmäßiger Konvergenz gegen f Stetigkeit
Übrigens lässt sich das Prinzip der Cantormenge nutzen, der Grenzfunktion folgt.
um eine stetige Funktion f : [0, 1] → R zu konstruieren
mit f (0) = 0 und f (1) = 1, die aber fast überall konstant Es bleibt zu überlegen, dass die Grenzfunktion außerhalb
ist. der Nullmenge C stückweise konstant ist. Dazu zeigen wir
induktiv:
Die ersten Schritte zur Konstruktion einer solchen Funk-
tion f : [0, 1] → R, der Teufelstreppe, sind in der folgen- fm (x) = fn (x) auf [0, 1]\Cn−1 für m ≥ n.
den Abbildung gezeigt:
Wegen [0, 1]\Cn−1 ⊆ [0, 1]\Cn für alle n ∈ N genügt
es, die Aussage für m = n + 1 zu zeigen. Ist fn auf
[0, 1]\Cn−1 stückweise konstant, so bleibt die Eigenschaft
bei festem n ∈ N für alle folgenden Funktionen fm mit
m ≥ n und somit für f erhalten.
Ein Induktionsanfang ist gegeben, da f3 (x) = f2 (x) = 12
auf [0, 1]\C1 = 13 , 23 gilt. Für den Induktionsschritt
* +
beobachten wir, dass aus x ∈ 0, 13 \Cn folgt 3x ∈
* +
[0, 1]\Cn−1 . Somit erhalten wir für x ∈ 0, 13 \Cn mit
der Induktionsannahme und der Rekursion:
Rekursiv beschreiben wir die Konstruktion durch eine
Folge von Funktionen fn : [0, 1] → R, n ∈ N, mit fn+2 (x) =
1 1
fn+1 (3x) = fn (3x) = fn+1 (x).
f1 (x) = x und 2 2
⎧ 1
* + * +
⎪
⎨ 2 fn (3x), x ∈ 0, 13 , Analog folgt die Identität auf 23 , 1 \Cn . Da auf 13 , 23
fn+1 (x) = 1
2, x ∈ 13 , 23 , nach Definition stets Gleichheit gilt, ist der Induktions-
⎪
⎩ 1 * +
x ∈ 23 , 1 . schritt für die gesamte Menge [0, 1]\Cn gezeigt.
2 (1 + fn (3x − 2)),
16.2 Das Lebesgue-Integral 607
ermöglicht die Definition des Integrals von f , wenn gezeigt δ ≤ ϕnj (xnj ) ≤ ϕm (xnj ) .
wird, dass der Grenzwert unabhängig von der speziellen Wahl
der Folge von Treppenfunktionen ist. Da ϕm stetig ist, erhalten wir im Grenzwert j → ∞ die
Ungleichung δ ≤ ϕm (x). Diese Abschätzung lässt sich
Der Beweis erfordert einigen Aufwand. Wir gehen in drei
für jede Zahl m ∈ N durchführen im Widerspruch zu
Schritten vor, die wir in den folgenden Lemmata formulie-
ϕm (x) → 0, m → ∞. Also gibt es ein n0 ∈ N mit
ren. Dabei wird unter anderem deutlich, warum zunächst die
max ϕn (x) ≤ ε für alle n ≥ n0 .
zusätzliche Forderung nach Monotonie der Folge erforder- x∈J
lich ist. Ausgangspunkt ist eine Eigenschaft monoton gegen Im zweiten Schritt des Beweises zeigen wir nun noch, dass
die Nullfunktion fallender Treppenfunktionen.
Jb
Lemma ϕn (x) dx ≤ (b − a + C)ε
Für eine nicht negative Folge (ϕn ) von Treppenfunk- a
tionen auf einem Intervall [a, b], die fast überall monoton
fallend gegen die Nullfunktion konvergiert, für alle n ≥ n0 ist, wobei C > 0 eine Konstante bezeichnet
mit ϕn (x) ≤ C für alle n ∈ N und für fast alle x ∈ [a, b].
lim ϕn (x) = 0 f.ü. auf [a, b] , Zu dem im ersten Schritt ermittelten n0 ∈ N wählen wir
n→∞
n ≥ n0 . Die Treppenfunktion ϕn hat die Form ϕn (x) = c für
konvergiert auch die Folge der Integrale mit x ∈ (z−1 , z ), = 1, . . . , N, wenn a = z0 < · · · < zN = b
die zu ϕn gehörende Zerlegung des Intervalls [a, b] ist. Weiter
Jb definieren wir
lim ϕn (x) dx = 0 . : ;
n→∞
a
L := ∈ {1, . . . , N} : z−1 , z ∩ J = ∅ .
Dabei bedeutet nicht negativ, dass ϕn (x) ≥ 0 für fast alle Dann ist c ≤ ε für ∈ L, da ϕn (x) ≤ ε für x ∈ J gilt
x ∈ [a, b]. und ϕn auf (z−1 , z ) konstant mit Wert c ist. Für ∈/ L
∞
ist (z−1 , z ) ⊆ =1 jU also ist auch die Vereinigung
j∞
Beweis: Der Beweis gliedert sich in zwei wesentliche / (z−1 , z ) ⊆
∈L j =1 Uj . Daher ist
Schritte, die wir hier darstellen. Auf Seite 608 findet sich ∞
! !
aber noch eine Diskussion der Aussage und der Beweisidee. |z − z−1 | ≤ |Uj | ≤ ε.
Es sei ein Wert ε > 0 vorgegeben. Mit M bezeichnen wir die ∈L
/ j =1
Menge aller Sprungstellen der Treppenfunktionen ϕn , n ∈ N,
vereinigt mit der Nullmenge, auf der keine Konvergenz vor- Letztendlich können wir mit der oben angegebenen Kon-
liegt. Nach Voraussetzung ist M eine Nullmenge. Daher gibt stante C > 0 abschätzen:
608 16 Integrale – von lokal zu global
Unter der Lupe: Konvergenz der Integrale monoton gegen null fallender Treppenfunktionen
Eine Folge nicht negativer Treppenfunktionen, die fast überall monoton fallend gegen null konvergiert, liefert eine gegen null
konvergente Folge von Integralen. Diese naheliegende Feststellung des Lemmas auf Seite 607 ist der entscheidende Schlüssel
zur allgemeinen Definition des Integrals. Denn sie liefert die Monotonieabschätzung des folgenden Lemmas und somit, dass
die Menge L↑ (a, b) auf Seite 609 wohldefiniert ist. Deswegen sehen wir uns die Aussage und die Struktur des Beweises noch
einmal an.
Schon beim Begriff des Integrals bei einer Treppen- es am Anfang des Beweises beschrieben wird. Mit der
funktion musste sichergestellt sein, dass die Definition einen Teilmenge werden alle Stellen überdeckt, an denen
nicht von unterschiedlichen Zerlegungen abhängt (siehe die punktweise Konvergenz der Treppenfunktionen nicht
Lemma auf Seite 601). Dieses Problem stellt sich ver- gewährleistet ist. Da es sich bei diesen kritischen Stellen
stärkt, wenn wir eine Funktion durch Treppenfunktionen um eine Nullmenge handelt, lässt sich das Maß der Teil-
approximieren. Egal welcher Konvergenzbegriff zugrunde menge kleiner als jeder vorgegebene Wert ε annehmen.
liegt, die konstruierte Folge von Integralen muss konver-
gieren, und der Grenzwert darf nicht von der konkreten Auf der verbleibenden abgeschlossenen Menge J sind die
Wahl einer speziellen Folge abhängen. Das Lemma zielt Treppenfunktionen ϕn stetig, da alle kritischen Stellen aus-
auf den zweiten Aspekt. Es wird gezeigt, dass der Grenz- genommen sind. Auf J lässt sich deswegen das zweite
wert der Integrale einer fast überall monoton gegen null oben beschriebene Problem der Gleichmäßigkeit lösen.
fallenden Folge von Treppenfunktionen existiert und null Ausgearbeitet wird dies im ersten Schritt des Beweises.
ist. Mit der Monotonie der Folge von Treppenfunktionen wird
gezeigt, dass
Starten wir mit einer monoton fallenden Folge von Trep- max ϕn (x) ≤ ε
penfunktionen. Für die Integrale ergibt sich: x∈J
J b !n gilt. Somit lässt sich der entsprechende Anteil in der Folge
ϕn (x) dx = cj(n) (xj − xj −1 ) der Integrale abschätzen.
a j =1
Für den Rest benötigen wir eine obere Schranke C > 0 für
(n)
≤ sup cj (b − a) .
j,n Werte der Treppenfunktionen, die aufgrund der Monoto-
(1)
Wäre die Folge überall auf [a, b] monoton gegen null nie etwa durch die Konstante c1 gegeben ist. Zusammen
konvergent und die Funktionswerte an den Nahtstellen mit dem Maß |[a, b]\J | ≤ ε der verbleibenden Teilmenge
(n) (n) erhalten wir die gesuchte Abschätzung
durch cj oder cj +1 gegeben, so wäre zu zeigen, dass zu
ε > 0 ein N ∈ N existiert, sodass sich die Funktionswerte
Jb
|cj(N ) | < ε, j = 1, . . . , N, abschätzen lassen. Aufgrund
ϕn (x) dx ≤ (b − a + C) ε ,
der Monotonie der Folge ergäbe sich so die Abschätzung
J a
ϕn (x) dx ≤ ε(b − a)
die für jeden Wert ε > 0 gilt und somit die Konvergenz
für alle n ≥ N, und die gesuchte Konvergenz der Integrale beweist.
wäre gezeigt. Beachten sollte man, dass das Lemma in der angegebe-
nen Allgemeinheit auf der Kombination beruht, auf J die
Bei dieser Idee ergeben sich zwei Probleme. Zum einen
Funktionswerte auf der Ordinate abzuschätzen und auf
soll die Folge der Treppenfunktionen nur fast überall kon-
[a, b]\J das Maß längs der Abszisse zu kontrollieren. Das
vergieren, und es sollten beliebige Funktionswerte an den
Zusammenwirken von Nullmenge und punktweiser Kon-
Nahtstellen zugelassen sein. Zweitens müssen wir darauf
(N) vergenz ist hier somit entscheidend für die Aussage und
achten, dass eine gleichmäßige Abschätzung |cj | < ε,
letztendlich für die Definition des Integrals. Die beiden
d. h. für alle j = 1, . . . , N bei einem Wert N , erreicht sich herauskristallisierenden Probleme, die beschriebene
werden muss. Gleichmäßigkeit und der Umgang mit Nahtstellen, sind
Um beide Schwierigkeiten zu überwinden, ist es erforder- prinzipieller Natur und treten nicht erst durch den gewähl-
lich, das Intervall [a, b] = J ∪ ([a, b]\J ) aufzuteilen, wie ten Zugang auf.
Jb ! ! Damit ist die Konvergenz der Folge der Integrale gegen null
ϕn (x) dx = c |z − z−1 | + c |z − z−1 | gezeigt.
a ∈L ∈L
/
!
N !
≤ε |z − z−1 | + C |z − z−1 |
=1 ∈L
/
≤ ε (b − a) + C ε = (b − a + C) ε .
16.2 Das Lebesgue-Integral 609
Integrale lassen sich entsprechend der Somit müssen nach dem Einschließungskriterium die Grenz-
Integranden abschätzen werte gleich sein.
f (x) Mit der Abschätzung im Lemma auf Seite 609 ergibt sich
für die Funktionen (f1 + g2 ), (f2 + g1 ) ∈ L↑ (a, b) mit
f1 + g2 ≤ f2 + g1 auch
J b J b
(f1 + g2 )(x) dx ≤ (f2 + g1 )(x) dx .
a a
Wenn der Integrand f : [a, b] → R durch |f (x)| ≤ c ∈ R Substitution f ∈ C([α, β]), u ∈ C([a, b]) ∩ C 1 ((a, b)),
f. ü. beschränkt ist, kann weiter abgeschätzt werden u([a, b]) ⊆ [α, β] und (f ◦ u)u ∈ L(a, b), so ist
J b J b J u(b)
|f (x)| dx ≤ c |b − a| . f (u(x)) u (x) dx = f (u) du .
a a u(a)
612 16 Integrale – von lokal zu global
Stetige Funktionen auf kompakten Intervallen haben gezeigt, dass alle stetigen Funktionen in dieser Menge
sind integrierbar liegen. Wir können bei stetigen Funktionen in der Definition
des Lebesgue-Integrals f2 = 0 setzen. Im dritten Teil des
In vielen Fällen müssen wir uns zum Glück relativ wenig Beweises zum Satz von Beppo Levi (auf Seite 625) kommen
Gedanken über die Existenz eines Integrals machen, denn wir auch im allgemeinen Fall nochmal genauer auf Wahl-
für stetige Integranden lässt sich eine allgemeine Aussage möglichkeiten von f2 in der Zerlegung f = f1 − f2 zurück.
machen.
Bemerkung: In der Maßtheorie werden abstraktere Zugänge
Integrierbarkeit stetiger Funktionen zum Lebesgue-Integral und auch andere Maße betrachtet.
Dabei geht man von sogenannten messbaren Mengen im Bild
Es gilt C([a, b]) ⊆ L(a, b). einer Funktion aus und definiert elegant, dass eine Funk-
tion messbar ist, wenn Urbilder messbarer Mengen wieder
Beweis: Konstruktionen von Folgen von Treppenfunktio- messbar sind. Dies wollen wir hier nicht weiter vertiefen,
nen durch Intervallhalbierung sind uns bereits begegnet. Zu kommen aber in Kapitel 22 wieder darauf zurück.
jeder stetigen Funktion auf einem kompakten Intervall lässt
sich eine monoton wachsende Folge von Treppenfunktionen
konstruieren, die gegen f konvergiert. 16.3 Stammfunktionen
Setzen wir zj(n)
=a+ j
− a), j =
2n (b 0, . . . , 2n ,
und defi-
nieren wir Treppenfunktionen durch Wie umfassend der nun definierte Vektorraum der inte-
grierbaren Funktionen letztendlich ist, werden wir in Ab-
(n) (n)
ϕn (x) = min f (z) : z ∈ [zj −1 , zj ] schnitt 16.5 genauer untersuchen. Zunächst wenden wir uns
(n) (n) dem zentralen Zusammenhang zwischen Integral und Ablei-
für x ∈ zj −1 , zj ,
tung zu. Dies wird unter anderem Wege aufzeigen, die nach
j = 1, . . . , 2n . Beachten Sie, dass wir an dieser Stelle die der Definition relativ mühselig erscheinende Berechnung von
Voraussetzung der Stetigkeit nutzen, da so garantiert ist, dass Integralwerten in vielen Fällen zu erleichtern.
das Minimum existiert (siehe Seite 322). Zu x ∈ [a, b] be-
(n)
zeichnen wir die Minimalstelle zmin mit |zmin − x| ≤ b−a 2n .
(n) Mit dem Zwischenwertsatz folgt der
Dann gilt |zmin − x| → 0, n → ∞ und wegen der Stetigkeit
Mittelwertsatz der Integralrechnung
von f folgt ϕn (x) = f (zmin ) → f (x) für n → ∞.
Aus der Monotonie und der Beschränktheit Zunächst erhalten wir aus dem Zwischenwertsatz einen Zu-
J b sammenhang zwischen Integral und Integrand. Setzen wir
ϕn (x) dx ≤ max {f (x)} (b − a) eine stetige Funktion f : [a, b] → R voraus. Da das Intervall
x∈[a,b]
a [a, b] kompakt ist, nimmt f auf dieser Menge ein Maximum
für alle n ∈ N ergibt sich die Konvergenz der Folge von und ein Minimum an. Wir definieren m = min {f (x)} und
x∈[a,b]
Integralen ab ϕn (x) dx . Also ist die stetige Funktion f M = max {f (x)}. Also ist
x∈[a,b]
integrierbar. Es gilt sogar f ∈ L↑ (a, b).
m ≤ f (x) ≤ M für alle x ∈ [a, b] .
Integriert man die drei Terme in den beiden Ungleichungen,
Man beachte, dass wegen der Zerlegungseigenschaft des In-
so ergibt sich wegen der Monotonie des Integrals:
tegrals auch stückweise stetige Funktionen auf kompakten J b J b
Intervallen integrierbar sind (Abb. 16.9). m(b − a) = m 1 dx ≤ f (x) dx
L(I ) a a
J b
≤M 1 dx = M(b − a)
a
stückweise
stetig bzw. J b
f (x) dx
L↑ (I ) −L↑ (I ) a
m≤ ≤M.
tig
b−a
ste
Mittelwertsatz der Integralrechnung Wenden wir den Mittelwertsatz (siehe Seite 614) im Inter-
vall [x0 , x] bzw. [x, x0 ] an, so gibt es eine Zwischenstelle z
Zu einer stetigen Funktion f : [a, b] → R gibt es ein
zwischen x0 und x mit
z ∈ [a, b] mit
J b F (x) − F (x0 )
= f (z) .
f (x) dx = f (z)(b − a) . x − x0
a
Da f eine stetige Funktion ist, folgt lim z→x0 f (z) = f (x0 ).
Somit gilt mit |z − x0 | ≤ |x − x0 | → 0 für x → x0 , dass der
Die Aussage des Mittelwertsatzes der Integralrechnung
Grenzwert des Differenzenquotienten existiert. Wir erhalten
kann man sich in einer Skizze grafisch veranschaulichen
F (x) − F (x0 )
(Abb. 16.10). F (x0 ) = lim = f (x0 ) .
x→x0 x − x0
x=x0
f (x)
Dies gilt für jeden Wert x0 ∈ (a, b).
f (z) Beispiel
Wir verifizieren die Aussage des ersten Hauptsatzes am
b Beispiel auf Seite 609. Es gilt:
f (z)(b − a) = f (x) dx J x
a 1
F (x) = t dt = x 2 ,
0 2
F (x) = e−x .
2
Der Mittelwertsatz führt uns direkt auf eine zentrale Aussage
der Analysis, eine Beziehung zwischen Differenzieren und Der erste Hauptsatz lässt sich anschaulich interpretieren: Die
Integrieren. Änderung des Flächeninhalts F (x0 ) zwischen dem Graph
einer positiven Funktion f und der x-Achse ist in linearer
1. Hauptsatz der Differenzial- und Integralrechnung Näherung durch f (x0 )(x − x0 ) gegeben, d. h., mit f (x0 )
Die Funktion F : [a, b] → R mit erhalten wir die Änderungsrate (Abb. 16.11).
J x
y
F (x) = f (t) dt
a f (x)
zu einer stetigen Funktion f : [a, b] → R ist differen-
zierbar auf (a, b), und es gilt:
F (x0 )
Beweis: Zu f ∈ C([a, b]) und F : [a, b] → R, gegeben
durch J x x0 x x
F (x) = f (t) dt , Abbildung 16.11 Der Funktionswert f (x0 ) entspricht der Änderungsrate des
a Flächeninhalts F (x0 ) unter dem Graphen von f .
betrachten wir für zwei Stellen x, x0 ∈ (a, b) den Differen-
zenquotienten von F , d. h. ?
BJ x J x0 C Im Beweis des 1. Hauptsatzes wird die Stetigkeit von f ge-
F (x) − F (x0 ) 1
= f (t) dt − f (t) dt nutzt, um Differenzierbarkeit von F zu zeigen. Mit unstetigen
x − x0 x − x0 c c
J x Integranden gilt der Satz im Allgemeinen nicht. Geben Sie
1
= f (t) dt . ein Gegenbeispiel an.
x − x0 x0
16.3 Stammfunktionen 615
Offensichtlich impliziert die Voraussetzung der Stetigkeit Im Fall F = f , sprechen wir also einerseits von der Ablei-
von f die Differenzierbarkeit von F . Ohne eine solche Vor- tung f der Funktion F und andererseits von einer Stamm-
aussetzung gilt dies nicht. Wir können aber zumindest zeigen, funktion F zu f . Im Englischen ist mit den Bezeichnungen
dass F stetig ist. Ein wichtiges Resultat, wie wir später noch derivative und antiderivative deutlicher, dass es sich um die
sehen werden. gleiche Situation aus zwei verschiedenen Blickwinkeln han-
delt.
Satz
Sind f ∈ L(a, b) und x ∈ [a, b], dann ist die Funktion Die Funktion J x
F : [a, b] → R mit F (x) = f (t) dt
J x a
F (x) = f (t) dt aus dem ersten Hauptsatz ist eine Stammfunktion der stetigen
a Funktion f , und wir können schreiben:
stetig. 'J x (
d
f (t) dt = f (x), für x ∈ (a, b) .
dx a
Beweis: Für diesen Beweis müssen wir nochmal auf die
Definition des Integrals eingehen. Da f integrierbar ist, gibt
es eine Zerlegung f = f1 − f2 mit f1 , f2 ∈ L↑ (a, b). Somit Beispiel Durch Differenzieren bekannter Funktionen las-
genügt es, Stetigkeit für f ∈ L↑ (a, b) zu zeigen. sen sich Stammfunktionen zu einer Vielzahl von Funktionen
Wir gehen von f ∈ L↑ (a, b) aus. Dann gibt es zu ε > 0 eine auflisten:
Treppenfunktion ϕ : [a, b] → R mit ϕ ≤ f fast überall und Es ist die Funktion f : R → R mit f (x) = e−x die Ab-
J b leitung der Funktion F mit F (x) = −e−x . Also ist F eine
ε
0≤ f (t) − ϕ(t) dt ≤ . Stammfunktion zu f .
a 2 Genauso sehen wir, dass durch F (x) = n+1 1
x n+1 eine
Betrachten wir nun x, x0 ∈ [a, b], so ergibt sich mit der Stammfunktion zur Funktion f mit f (x) = x n gegeben
Dreiecksungleichung: ist.
)J x ) Leiten wir F mit F (x) = sin x ab, so ergibt sich F (x) =
) )
)
|F (x) − F (x0 )| = ) f (t) dt )) cos x. Mit anderen Worten: Der Sinus ist eine Stammfunk-
x tion zur Kosinusfunktion.
)J 0x ) )J x )
) ) ) )
≤)) )
f (t) − ϕ(t) dt ) + )) ϕ(t) dt ))
x0 x0 Der Hauptsatz besagt, dass die Existenz einer Stammfunktion
)J ) für stetige Funktionen f gesichert ist. Beachten sollten wir,
ε )) x )
≤ +) ϕ(t) dt )) . dass es nicht nur eine Stammfunktion zu einer Funktion f
2 x0
gibt. Deswegen sprechen wir von der Ableitung, aber von
Setzen wir weiter c = maxj =1...,M |cj | für die endlich vielen einer Stammfunktion. Wir können eine beliebige Konstante
Funktionswerte cj , j = 1, . . . , M, der Treppenfunktion ϕ, zu F addieren, d. h. G(x) = F (x) + c mit c ∈ R betrachten.
so folgt: )J x ) Die Eigenschaft G (x) = f (x) gilt analog wie für F , d. h.,
) ) G ist auch eine Stammfunktion. So ist etwa die Funktion
) ϕ(t) dt ) ≤ c|x − x0 | .
) ) G : R → R mit G(x) = 1 − e−x auch eine Stammfunktion
x0
zu e−x .
Damit erhalten wir, wenn
ε
|x − x0 | ≤
2c Stammfunktionen einer Funktion
ist, die Abschätzung |F (x) − F (x0 )| ≤ ε/2 + ε/2 = ε. Also unterscheiden sich höchstens um eine
ist F stetig. Konstante
Der Zusammenhang F = f , wie er im ersten Hauptsatz Diese Beobachtung können wir umkehren, was Sie in fol-
gegeben ist, ist grundlegend für die Differenzial- und Inte- gender Aufgabe zeigen sollten.
gralrechnung, und man führt eine Bezeichnung dafür ein.
?
Beweisen Sie: Ist F irgendeine Stammfunktion einer stetigen
Definition der Stammfunktion
Funktion f auf (a, b), so sind alle weiteren Stammfunktionen
Ist f : (a, b) → R eine auf einem offenen Intervall von der Form
(a, b) definierte Funktion, dann heißt jede differenzier- G(x) = F (x) + c
bare Funktion F : (a, b) → R mit F = f Stammfunk-
tion von f . für x ∈ (a, b) mit Konstanten c ∈ R.
616 16 Integrale – von lokal zu global
Manchmal ist es nicht offensichtlich, dass zwei Darstellun- Beweis: Nehmen wir an, dass α, β ∈ (a, b) sind, so
gen von Stammfunktionen nur durch eine Konstante von- ist
x nach dem ersten Hauptsatz durch die Abbildung x →
einander abweichen. F (t) dt für x ∈ (α, β) eine Stammfunktion zur stetigen,
α
integrierbaren Funktion F auf (α, β) gegeben.
Beispiel Für die Funktion F : R → (− π2 , π2 ) mit F (x) =
Also existiert für die
x Stammfunktion F zu F eine Darstel-
arctan(x) ist die Ableitung arctan (x) = 1+x
1
2 . Außerdem ist
lung F (x) = c + α F (t) dt mit einer Konstanten c ∈ R.
π Durch Einsetzen von x = α berechnen wir F (α) = c. Insge-
arctan(x) = − arccot(x) + .
2 samt folgt für das bestimmte Integral im Intervall (α, β) die
Identität J
Also sind sowohl durch arctan(x) als auch durch − arccot(x) β
Stammfunktionen zu f mit f (x) = 1+x 1
2 gegeben. F (t) dt = F (β) − F (α) .
α
Wenn eine Stammfunktion zu einer stetigen Funktion be-
trachtet wird, wobei es auf eine Festlegung der Konstanten Der linke Ausdruck ist wegen F ∈ L(a, b) nach dem Satz
nicht ankommt, schreibt man häufig auf Seite 615 stetig in β ∈ [a, b] und analog auch bezüglich
J α ∈ [a, b]. Außerdem ist vorausgesetzt, dass F ∈ C([a, b])
f (x) dx . gilt. Die Grenzwerte für α → a und β → b in obiger Glei-
chung liefern die Behauptung
Man nennt dies ein unbestimmtes Integral im Gegensatz J
b
zu dem bestimmten Integral ab f (x) dx, wenn die Gren- F (t) dt = F (b) − F (a).
Ableitung In der Übersicht auf Seite 617 sind die wichtigsten Stamm-
funktionen aufgelistet.
1 1
F (x) = = % ?
cos(arcsin(x)) 2
cos (arcsin(x))
Berechnen Sie die Integrale
1 1 J 1 J
= = % . 1 1
1 − sin2 (arcsin(x)) 1 − x2 I1 = e−x dx und I2 = dx .
0 0 1 + x2
Somit gilt:
J 1 ' ( Beispiel Die Aussage des zweiten Hauptsatzes bedeutet,
2 1 1 π π π
% dx = arcsin(x)| 1 2
= − − = . dass eine Bilanz, also der Wert
− 21 1 − x2 −2 6 6 3 J b
F (b) = F (a) + F (x) dx ,
a
Auf der Grundlage der Hauptsätze der Differenzial- und In- aus dem Anfangszustand F (a) und der Änderung F ermit-
tegralrechnung lassen sich viele Stammfunktionen notieren, telt werden kann, wenn diese Änderung eine integrierbare
wenn wir die uns bekannten Ableitungen zusammenstellen. Funktion ist.
618 16 Integrale – von lokal zu global
So zeichnet ein Fahrtenschreiber, wie er in Abbildung 16.13 zwar stetig, jedoch an der Sprungstelle von f nicht differen-
dargestellt ist, nur die momentane Geschwindigkeit v(t) auf. zierbar ist. Mit der Zerlegungseigenschaft können wir den
zweiten Hauptsatz auf den Teilintervallen anwenden und er-
Da die Geschwindigkeit die Ableitung des zurückgelegten
halten:
Wegs s nach der Zeit t ist, J 1 J 0 J 1
v(t) = s (t) , sign (x) dx = sign (x) dx + sign (x) dx
−1 −1 0
J 0 J 1
erhält man umgekehrt die in einem Zeitintervall [t1 , t2 ] zu-
=− dx + dx
rückgelegte Wegstrecke S durch −1 0
J t2 1 1
S= v(t) dt .
= |x||0−1 + |x||10 = 0 .
2 2
t1
Satz
Ist f : (x0 − r, x0 + r) → R durch eine Potenzreihe
∞
!
f (x) = an (x − x0 )n
n=0
Mit der geometrischen Reihe erhalten wir für die Ableitung Beachten Sie, um die partielle Integration anzuwenden,
die Potenzreihendarstellung müssen Sie sich entscheiden, welcher Term die Rolle von
∞ u bzw. v übernimmt. Es ist in diesem Beispiel sinnvoll,
!
arctan (x) = (−1)n x 2n den Ausdruck x 2 abzuleiten, da durch das Ableiten die
n=0 Potenz reduziert wird. Außerdem ändert sich der Charak-
ter des zweiten Terms nicht durch Integrieren, aus Sinus
für |x| < 1. Mit dem Satz ergibt sich eine Potenzreihe für
wird lediglich Kosinus.
eine Stammfunktion, also gilt:
Gesucht ist eine Stammfunktion zur Funktion f : R → R
∞
! mit f (x) = cos2 x. Auch hier bietet sich eine partielle
(−1)n 2n+1
arctan(x) = c + x Integration an. Für Stammfunktionen folgt:
2n + 1
n=0
J J
für |x| < 1 mit einer Integrationskonstanten c ∈ R. Setzen cos2 x dx = − sin x cos x + sin2 x dx .
wir x = 0 in die Identität ein, so folgt c = 0, und wir erhalten
die Potenzreihendarstellung des Arkustangens.
Eine weitere partielle Integration hilft an dieser Stelle
nicht weiter, probieren Sie es aus! Nutzen wir aber das
Die Produktregel führt auf partielle Additionstheorem sin2 x + cos2 x = 1, so ist
Integration J J
cos2 x dx = − sin x cos x + 1 − cos2 x dx
Mit den Hauptsätzen führen uns die Ableitungsregeln J
(siehe Übersicht auf Seite 566) letztendlich auch auf Inte- = − sin x cos x + x − cos2 x dx
grationsregeln. Aus der Produktregel ergibt sich die partielle
Integration oder Produktintegration.
bzw.
Partielle Integration J
1
cos2 x dx = (x − sin x cos x) + c
Sind u, v ∈ C([a, b]) auf (a, b) stetig differenzierbar 2
mit u v, uv ∈ L(a, b), so gilt:
J J mit beliebiger Konstante c ∈ R.
b b
u (x)v(x) dx = u(x)v(x)|ba − u(x)v (x)d x .
a a
?
Berechnen Sie eine Stammfunktion zu f : R → R mit
Beweis: Mit der Produktregel ist (uv) = u v + uv ∈ f (x) = sin x cos x.
L(a, b), und der zweiten Hauptsatz ist auf das Produkt uv
anwendbar. Es folgt die Identität
J b In manchen Fällen ist ein passendes Produkt für die Anwen-
u(x)v(x)|ba = (uv) (x) dx dung der partiellen Integration nicht sofort offensichtlich. Ein
a Paradebeispiel liefert der Logarithmus.
J b J b
= u (x) v(x) dx + u(x) v (x) dx.
a a Beispiel Gesucht ist eine Stammfunktion zu f : R>0 → R
mit f (x) = ln x. Dazu ergänzen wir den Integranden u(x) =
Wir können das Resultat des Satzes mit dem ersten Haupt- ln x durch den Faktor v (x) = 1 und erhalten mit partieller
satz auch entsprechend für Stammfunktionen schreiben und Integration:
erhalten kurz: J J J
J J
ln x dx = 1 · ln x dx = x ln x − dx = x ln x − x + c
u v dx = uv − uv dx.
mit Integrationskonstante c ∈ R.
Beispiel
Mit zweimaliger partieller Integration ergibt sich
J π J π
2
2 2
π 2 Das Gegenstück zur Kettenregel ist die
x sin x dx = −x cos x|0 + 2
2
x cos x dx
0 0 Substitutionsregel
2 J π 3
π 2
= 0 + 2 x sin x|02 − sin x dx Die Produktregel führte uns auf partielle Integration. Ent-
0
π sprechend folgt aus der Kettenregel eine weitere wesentliche
= π + 2 cos x|0 = π − 2 .
2
Möglichkeit beim Integrieren.
620 16 Integrale – von lokal zu global
Kommentar: Es ist angebracht, sich für konkrete Bei- Der Fundamentalsatz der Algebra liefert eine vollständige
spiele eine Schreibweise anzugewöhnen, die die Substitution Faktorisierung von q. Damit ergibt sich, zusammen mit dem
nachvollziehbar werden lässt. Eine Möglichkeit ist etwa Lemma, eine additive Zerlegung rationaler Funktionen.
J √ J )
π 1 π ) u = x2
x sin(x 2 ) dx = sin u du ) Partialbruchzerlegung
2 ) du = 2x dx
0 0 Sind p, q : C → C Polynome mit deg(p)
< deg(q)
= ... und der Faktorisierung q(x) = qn m j =1 (x − zj )
μj
m
mit μj ∈ N und j =1 μj = deg(q) = n ∈ N,
bei der Rechnung im Beispiel auf Seite 620. dann gibt es eindeutig bestimmte Konstanten aj k ∈ C,
k = 1, . . . , μj sodass
μj
p(x) ! !
m
aj k
Rationale Funktionen lassen sich mittels =
q(x) (x − zj )k
Partialbruchzerlegung integrieren j =1 k=1
Damit erzielen wir im letzten Term einen Grad des Zähler- Wie beim Differenzieren (siehe Seite 565) übertragen sich
polynoms kleiner als der des Nennerpolynoms. Für diesen auch die Integrationstechniken auf komplexwertige Funktio-
Anteil lässt sich eine Partialbruchzerlegung durchführen. nen in einer reellen Variablen. Unter Ausnutzung der Eu-
ler’schen Formel kann dies hilfreich sein.
Mit der Faktorisierung x 3 −x 2 +x −1 = (x −1)(x +i)(x −i)
ergibt sich: Beispiel Wir bestimmen die beiden Stammfunktionen
J J
1 a b c
= + + I1 = eax cos(bx) dx und I2 = eax sin(bx) dx .
x3 − x2 + x − 1 x−1 x+i x−i
(a + b + c)x 2 + (−b − c − i(b + c))x + a + i(b − c)
= . Durch zweimaliges partielles Integrieren erhalten wir:
x3 − x2 + x − 1
1
I1 = eax (a cos(bx) + b sin(bx)) + C1
Ein Koeffizientenvergleich führt auf a2 + b2
und
a + b + c = 0,
a − (1 + i) b − (1 − i) c = 0 , 1
I2 = eax (a sin(bx) − b cos(bx)) + C2 .
a + ib + ic = 1. a 2 + b2
Wir lösen das lineare Gleichungssystem und erhalten a = 12 , Eleganter erhält man diese Stammfunktionen durch das In-
b = − 1+i 1−i tegral
4 und c = − 4 , d. h., es gilt die Partialbruchzerle-
gung J J
I = I1 + I2 = eax eibx dx = e(a+ib)x dx
1 1 1 11+i 11−i
= − − . 1 a − ib ax ibx
x3 − x2 + x − 1 2x−1 4x+i 4x−i = e(a+ib)x = 2 e e +C
a + ib a + b2
a − ib ax
Bringen wir die letzten beiden Summanden auf den gemein- = 2 e (cos(bx) + i sin(bx)) + C ,
samen Hauptnenner, so folgt: a + b2
wenn wir Real- und Imaginärteil vergleichen und die Inte-
1 1 1 1 x+1 grationskonstante zu C = C1 + iC2 aufspalten.
= − .
x −x +x−1
3 2 2 x − 1 2 x2 + 1
Weitere grundlegende Techniken zum Berechnen von be-
Mit dieser Zerlegung lässt sich eine Stammfunktion bestim- stimmten Integralen durch komplexe Formulierungen erge-
men zu: ben sich im Rahmen der Funktionentheorie, die üblicher-
J weise nicht Stoff des ersten Studienjahrs ist. In der Funk-
x4 tionentheorie beschäftigt man sich mit komplex differenzier-
dx
x3 − x2 + x − 1 baren Funktionen und ihren Eigenschaften. Dabei ergibt sich
J J
1 ein enger Zusammenhang zur Theorie der Potenzreihen.
= x + 1 dx + dx
x3 − x2 + x − 1
J Wir haben einige Techniken bereitgestellt, um Integrale zu
1 1 1
berechnen. Aber es gibt auch Integranden, wie etwa e−x ,
2
= x2 + x + dx
2 2 x−1
J J zu denen eine Stammfunktion nicht durch elementare Funk-
1 x 1 1 tionen ausgedrückt werden kann. Insbesondere in solchen
− dx − dx
2 x +1
2 2 x +1
2
Situation ist es erforderlich, Integralwerte numerisch zu ap-
1 1 1 1 proximieren. Im Ausblick auf Seite 624 finden sich ein paar
= x 2 + x + ln |x − 1| − ln(x 2 + 1) − arctan(x)
2 2 4 2 Anmerkungen zu diesem Thema, das in der Numerischen
Mathematik ausführlich behandelt wird.
mit der Substitution u = x 2 im mittleren Integral.
%
Problemanalyse und Strategie: Bei rationalen Ausdrücke mit Potenzen von x und 1 + x 2 sind Substitutionen
durch sinh sinnvoll, um letztendlich auf eine rationale Funktion zu kommen, die mit einer Partialbruchzerlegung integriert
werden kann. Bei rationalen Ausdrücken mit trigonometrischen Funktionen hilft stets eine Substitution t = tan(x/2).
mit Gewichten ωj ∈ R, j = 1, . . . , N, nennt man Quadraturformel. In der Numerischen Mathematik werden unter
anderem solche Quadraturformeln und deren Approximationseigenschaften systematisch untersucht.
Die einfachste Quadraturformel ergibt sich direkt aus dem In der Tabelle werden die Integralwerte der letzten beiden
Zugang zum Integral über Treppenfunktionen. Als erste Methoden für f (x) = sinx x auf [0, 2π] verglichen. Deut-
Näherung können wir ab f (x) dx ≈ (b − a) f (a) be- lich ist die schnellere Konvergenzordnung zu erkennen.
trachten. Diese Regel heißt Rechteckregel und benötigt
N Trapezregel Simpsonregel
nur die Kenntnis von f an der Stelle a. Verbessern lässt
2 1.5708 1.0472
sich die Approximation, wenn auch f (b) bekannt ist durch
4 1.4521 1.4125
die Trapezregel
J b 8 1.4264 1.4179
(b − a) 16 1.4202 1.4181
f (x) dx ≈ f (a) + f (b) .
a 2 32 1.4187 1.4181
Dabei wird die Fläche des Trapezes mit Eckpunkten
Die Abbildung illustriert die verschiedenen Approxima-
(a, 0)0 , (b, 0)0 , (b, f (b))0 und (a, f (a))0 als Nähe-
tionen durch Rechteck-, Trapez- und Simpsonregel.
rung genutzt.
Kennen wir den Integranden an N +1 äquidistanten Stütz- y y y
stellen xj = a + j b−aN mit Abstand h = N > 0, so
b−a
ein Funktionswert des Integranden etwa in den Randpunkten Der Satz von B. Levi liefert die zentrale
a, b eines Intervalls nicht erforderlich. Damit stellt sich die Konvergenzaussage zu monotonen Folgen
Frage, ob Funktionen, die an einer Stelle nicht definiert sind, integrierbarer Funktionen
etwa einer Oszillationsstelle oder einer Singularität (siehe
Seite 320), zur Menge der integrierbaren Funktionen gehö- Wie aus der Definition des Integrals zu erwarten ist, ist punkt-
ren. Wir haben diesen Aspekt bisher unterschlagen. Nur in weise Konvergenz fast überall von Funktionenfolgen die zen-
dem Beispiel der Funktion f : (0, 1] → R mit f (x) = √1x trale Eigenschaft in der Klasse der integrierbaren Funktionen,
auf Seite 610 wurde schon eine Singularität angedeutet. Ein um Existenzfragen zu klären. Die folgende grundlegende
weitreichendes Kriterium, um die Frage nach der Integrier- Aussage der Lebesgue-Theorie, die nach dem Mathematiker
barkeit einer Funktion zu klären, ist Ziel dieses Abschnitts. Beppo Levi (1875–1961) benannt wird, belegt dies deutlich.
Wichtige Anwendungen der Integralrechnung erfordern dar-
über hinaus die Integration über unbeschränkte Bereiche, wie Der Satz von Beppo Levi
etwa R oder R>0 . Beispiele dafür sind Integraltransformatio- Ist (fn )n∈N eine fast überall monotone Folge von
nen wie die Fouriertransformation oder die Laplacetransfor- lebesgue-integrierbaren fn ∈ L(I ), und ist
Funktionen
mation. Auch bei diesen Integralen stellt sich die Frage nach die Folge der Integrale I fn dx n∈N in R beschränkt,
der Existenz. dann konvergiert die Funktionenfolge (fn ) punktweise
fast überall gegen eine integrierbare Funktion f ∈ L(I ),
Beide Situationen lassen sich parallel klären. Daher erwei- und es gilt:
tern wir zunächst die Definition des Integrals von den bisher J J
in Abschnitt 16.2 betrachteten kompakten Intervallen auf un-
lim fj dx = f dx .
beschränkte Intervalle. j →∞ I I
Beachten Sie, dass dieser Satz nicht nur die Konvergenz der
Integrale beinhaltet, sondern auch die Existenz der integrier-
Treppenfunktionen auf unbeschränkten baren Grenzfunktion f ∈ L(I ) klärt. Wir können die Aus-
Intervallen erweitern die Integraldefinition sage des Satzes als Monotoniekriterium im Funktionenraum
L(I ) bezüglich der punktweisen Konvergenz auffassen. Dar-
Unter einer Treppenfunktion auf einem unbeschränkten In- aus lässt sich erahnen, welche zentrale Rolle diese Aussage
tervall versteht man eine Funktion f , die auf einem be- in der Lebesgue-Theorie spielt.
schränkten Intervall I˜ ⊆ I eine Treppenfunktion nach der
Definition in Abschnitt 16.2 ist und außerhalb, auf I \ I˜, Beweis: Der Beweis des Satzes ist sicher einer der auf-
konstant 0 ist (Abb. 16.15). wendigsten, den wir in diesem Werk behandeln. Wir gehen
in vier Schritten vor. Zunächst zeigen wir, dass eine monoton
wachsende Folge von Treppenfunktionen, deren Integrale be-
schränkt bleiben, einen Grenzwert in L↑ (I ) besitzen. Damit
können wir im zweiten Schritt die Aussage des Satzes für be-
liebige Funktionenfolgen in L↑ (I ) zeigen. Zur Vorbereitung
des allgemeinen Falls beweisen wir im dritten Schritt, dass
zu einer Funktion f ∈ L(I ) bei Zerlegung in eine Differenz
aus Elementen aus L↑ (I ) der zweite Anteil beliebig klein
gewählt werden kann. Mit diesen Vorarbeiten lässt sich dann
Abbildung 16.15 Eine Treppenfunktion über den gesamten reellen Zahlen. im vierten Schritt die allgemeine Aussage für eine Folge mit
fn ∈ L(a, b) herleiten.
Wenn Sie die Beweise des Abschnitts 16.2 durchsehen, ist i) Die erste Behauptung lautet: Ist (ϕn ) eine monoton wach-
schnell offensichtlich, dass mit dieser Erweiterung des Be- sende Folge von Treppenfunktionen auf einem Intervall I mit
griffs Treppenfunktion auch auf unbeschränkten Intervallen der Eigenschaft, dass die Integrale
die Menge der lebesgue-integrierbaren Funktionen definiert J
ist. Somit lässt sich insbesondere die Menge L(R) der inte- ϕn (x) dx ≤ C
I
grierbaren Funktionen über R betrachten.
für alle n ∈ N durch eine Konstante C ∈ R>0 beschränkt
Wir erfassen alle uns interessierenden Konstellationen, in- sind, so gibt es eine Funktion f ∈ L↑ (I ) mit
dem wir im Folgenden von einem offenen Intervall I ⊆ R, be-
lim ϕn (x) = f (x) f.ü.
schränkt oder unbeschränkt, ausgehen und klären, ob Funk- n→∞
tionen in der Menge L(I ) sind. und J J
lim ϕn (x) dx = f (x) dx .
n→∞ I I
626 16 Integrale – von lokal zu global
Betrachten wir eine solche monoton steigende Folge (ϕn ) Dazu wählen wir zu jedem fn eine monoton wachsende Folge
von Treppenfunktionen. Zu einem Wert ε > 0 definieren wir von Treppenfunktionen (ϕkn ) aus, die für k → ∞ punktweise
die Menge fast überall gegen fn konvergiert. Wegen der Monotonie der
Folge (fn )n∈N gilt nach Konstruktion fast überall:
C
Nn = x ∈ I | ϕn (x) ≥ .
ε ϕkn ≤ fn ≤ fk
Diese Menge ist entweder leer oder besteht aus endlich vielen für n ≤ k. Definieren wir mit diesen Treppenfunktionen eine
Intervallen, und wir können die Gesamtlänge |Nn | abschät- weitere monoton wachsende Folge durch
zen durch j
J J J ψn (x) = max{ϕk (x) | k, j = 1, . . . , n} ,
C C
|Nn | = 1 dx ≤ ϕn (x) dx ≤ ϕn (x) ≤ C . dann gilt:
ε ε Nn Nn I
J J
Somit ist |Nn | ≤ ε für alle n ∈ N. ψn (x) dx ≤ fn (x) dx ≤ K .
I I
Da die Monotonie ϕn ≤ ϕn+1 f. ü. vorausgesetzt ist, gilt
Nn ⊆ Nn+1 , und wir können die Differenzmengen Nn+1 \Nn Die Folge der Integrale über ψn bleibt somit beschränkt.
als Vereinigung endlich vieler disjunkter
Intervalle ansehen. Nach Teil i) des Beweises gibt es eine Grenzfunktion
Deswegen ist die Vereinigung N = ∞ n=1 Nn eine Vereini- f ∈ L↑ (I ), und es gilt:
gung von höchstens abzählbar vielen Intervallen J1 , J2 , . . . , J J
indem man zunächst die endlich vielen Intervalle zur Dar- lim ψn (x) dx = f (x) dx .
n→∞ I
stellung von N2 \N1 und dann von N3 \N2 usw. zählt. Auf- I
grund der Konstruktion gilt für die von ε abhängende Menge Weiter ist für n ≤ j ≤ ψj . Diese Ungleichung bleibt
auch ϕjn
N= ∞ j =1 Jj die Abschätzung im Grenzfall j → ∞ bestehen, d. h., es ist fn ≤ f für alle
∞
n ∈ N. Aus der Ungleichungskette
!
|Jj | ≤ ε . ψn ≤ fn ≤ f
j =1
und der punktweisen Konvergenz ψn (x) → f (x), f. ü., folgt:
Nun betrachten wir die Menge J J
: ; f (x) dx = lim ψn (x) dx
n→∞ I
M = x ∈ I | (ϕn (x))n∈N ist unbeschränkt . I
J
≤ lim fn (x) dx
Dann ist M ⊆ N für jedes ε > 0. Somit ist M eine Null- n→∞ I
J
menge. Für eine Stelle x ∈ I \M ist die monoton wach-
sende Folge (ϕn (x)) beschränkt und somit nach dem Mono- ≤ f (x) dx .
I
toniekriterium konvergent. Bezeichnen wir den Grenzwert
mit f (x) ∈ R, so bekommen wir durch Wegen dieser Einschließungen ergibt sich, dass die Folge
(fn ) punktweise fast überall gegen f konvergiert und auch
lim ϕn (x) für x ∈ I \M , die Integrale konvergieren.
f (x) = n→∞
0 für x ∈ M iii) Um nun dieses Resultat auch für beliebige Funktionen
in L(I ) herzuleiten, benötigen wir zunächst noch eine Aus-
eine Funktion f , die fast überall Grenzwert der Treppenfunk- sage zur Auswahlmöglichkeit der Darstellung von Funktio-
tionen ϕn ist. Also gilt f ∈ L↑ (I ), was wir im ersten Schritt nen f ∈ L(I ) durch Differenzen der Form f = g − h mit
zeigen wollten. g, h ∈ L↑ (I ). Und zwar lässt sich zu jedem ε > 0 eine
ii) Wir betrachten die Aussage des Satzes jetzt für den Fall solche Zerlegung finden, bei der die Funktion h ≥ 0 ist und
einer monoton wachsenden Folge (fn )n∈N von Funktionen J
aus L↑ (I ), für die es eine obere Schranke K > 0 zu den h(x) dx ≤ ε
I
Integralen gibt, d. h.:
J gilt.
fj (x) dx ≤ K für alle j ∈ N . Diese Behauptung zeigt man, indem man von einer beliebi-
gen Zerlegung f = g0 − h0 mit g0 , h0 ∈ L↑ (D) startet.
I
ist, und setzen wir mit der geometrischen Summe. Auch die Folge der Integrale
zu Gn bleibt wegen
h0 (x) − ϕN (x) , falls h0 (x) ≥ ϕN (x), J J J
h(x) =
0, sonst.
Gn (x) dx = fn (x) dx + Hn (x) dx
I I I
Dann ist h ∈ L↑ (D). Da h0 − ϕN ≥ 0 nur fast überall gilt,
ist in der Definition von h auf der Nullmenge, wo diese Ab- beschränkt, da nach Voraussetzung die Integrale über fn be-
schätzung nicht gilt, der Wert auf null gesetzt, sodass die re- schränkt sind.
sultierende Funktion die Bedingung h ≥ 0 auf ganz I erfüllt. Wir können die Aussage des zweiten Teils ii) anwenden auf
Am Integralwert ändert sich durch diese Korrektur nichts, Gn ∈ L↑ (I ) und Hn ∈ L↑ (I ). Diese besagt, dass beide
und es gilt: J Folgen punktweise fast überall gegen Funktionen G, H ∈
h(x) dx ≤ ε . L↑ (I ) konvergieren, d. h., es existiert die Grenzfunktion mit
I
Außerdem ist mit g := g0 +ϕN = g0 +h−h0 eine Funktion fn = Gn − Hn → G − H =: f ∈ L(I ), n→∞
g ∈ L↑ (I ) gegeben, und wir erhalten mit
punktweise fast überall, und es gilt:
f = g0 − h0 = g0 + h − h0 − h = g − h J
lim fn (x) dx
n→∞ I
die gewünschte Zerlegung. J J
iv) Mit diesen Vorbereitungen lässt sich jetzt der allgemeine = lim Gn (x) dx − lim Hn (x) dx
n→∞ I n→∞ I
Satz von Beppo Levi beweisen. Es genügt eine fast überall J J J
monoton wachsende Folge (fn )n∈N von Funktionen in L(I ) = G(x) dx − H (x) dx = f (x) dx .
I I I
zu betrachten. Der Fall einer monoton fallenden Folge ist
damit auch abgedeckt, da man in diesem Fall die Aussage Damit haben wir alle Beweisschritte abgeschlossen.
wobei U, V : [a, b] → R die stetigen Funktionen Vertauschen wir die Rollen von ϕn und ψn und addieren beide
J x J x Integrale auf, so folgt die Behauptung:
U (x) = u(t) dt und V (x) = v(t) dt J b J b
a a u(x) V (x) dx + U (x) v(x) dx
bezeichnen (siehe Seite 615). Wir vermeiden hier den Begriff a a
J b J b
Stammfunktion für U oder V , da die Funktionen zwar stetig,
= lim ϕn (x)!n (x) dx + n (x)ψn (x) dx
aber nicht unbedingt differenzierbar sind. In der Literatur n→∞ a a
wird teilweise der Begriff unbestimmtes Integral in diesem ! n−1
n−1 !
allgemeineren Sinne verwendet. = lim cj c̃i |Ii | |Ij |
n→∞
j =0 i=0
Um die partielle Integration zu zeigen, nehmen wir zunächst )b
an, dass u, v ∈ L↑ (a, b) sind. Wir benennen die deswegen )
= lim n (b)!n (b) = U V ) .
existierenden Folgen von Treppenfunktionen (ϕn ), (ψn ), die n→∞ a
punktweise fast überall, monoton gegen u bzw. v konvergie-
Der allgemeine Fall u, v ∈ L(a.b) ergibt sich nun aus Zerle-
ren, und definieren
gungen u = u1 − u2 und v = v1 − v2 mit u1 , u2 , v1 , v2 ∈
J x J x
L↑ (a, b) und der Lineartität des Integrals. Man beachte, dass
n (x) = ϕn (t) dt und !n (x) = ψn (t) dt .
a a das Resultat richtig bleibt, wenn zu U oder V eine Konstante
addiert wird, d. h., die Wahl der verallgemeinerten Stamm-
Ohne Einschränkung nehmen wir an, dass ϕn und ψn nicht
funktionen U und V spielt keine Rolle.
negativ sind. Sonst betrachte man ϕn − ϕ1 und ψn − ψ1 .
Dann sind auch die Produkte (ϕn !n ) und (n ψn ) monoton
steigende Funktionenfolgen und sie konvergieren fast überall
?
Worin besteht die Verallgemeinerung der hier angegebenen
mit
partiellen Integration gegenüber der ursprünglichen Formu-
lim ϕn (x)!n (x) = u(x)V (x)
n→∞ lierung von Seite 619 ?
und
lim n (x)ψn (x) = U (x)v(x) .
n→∞ Wir greifen das erste der beiden Beispiel nochmal auf. Mit
Nach dem Satz von B. Levi folgt uV ∈ L(a, b) und U v ∈ dem Satz von Beppo Levi lässt sich ein nützliches, allge-
L(a, b) mit meines Kriterium zeigen, das in vielen Fällen geeignet ist,
J b J b Existenz von Integralen zu beweisen.
lim ϕn (x)!n (x) dx = u(x)V (x) dx
n→∞ a a Konvergenzkriterium für Integrale
und Eine Funktion f : I → R ist integrierbar über einem
J b J b offenen Intervall I , d. h. f ∈ L(I ), wenn f auf einer
lim n (x)ψn (x) dx = U (x)v(x) dx . Folgevon Teilintervallen I1 ⊆ I2 ⊆ · · · ⊆ I ⊆ R mit
n→∞ a
I= ∞
a
j =1 Ij integrierbar ist, kurz f ∈ L(Ij ) für j ∈ N,
Wir rechnen die partielle Integration für die stückweise und die Folge der Integrale
konstanten Treppenfunktionen explizit nach und betrachten J
den Grenzfall n → ∞: Für eine gemeinsame Zerlegung |f (x)| dx
a = x0 < · · · < xn = b und Werte cj ∈ R bzw. c̃j ∈ R Ij j ∈N
der Treppenfunktionen ϕn und ψn auf den Teilintervallen
Ij = [xj , xj +1 ] folgt: beschränkt ist. In diesem Fall gilt:
J b J J
ϕn (x)!n (x) dx f (x) dx = lim f (x) dx .
a I j →∞ Ij
!
n−1 J xj +1 J x
= cj ψn (t) dt dx
j =0 xj a Beweis: Um zu sehen, dass das Konvergenzkriterium eine
⎛ ⎞ Folgerung des Satzes von Beppo Levi ist, nehmen wir zu-
!
n−1 J xj +1 −1
j! J x
= cj ⎝ c̃i |Ii | + c̃j dt ⎠ dx nächst f ≥ 0 auf dem Intervall I an und definieren die Folge
xj xj
j =0 i=1 f (x), x ∈ Ij ,
fj (x) =
!!
n−1 !
n−1 J xj +1 J x 0, sonst.
= cj c̃i |Ii | |Ij | + cj c̃j dt dx Die Funktionenfolge (fj ) konvergiert punktweise und mono-
j =0 i<j j =0 xj xj
ton gegen f . Da die Folge der Integrale
!!
n−1
1!
n−1 'J ( J
= cj c̃i |Ii | |Ij | + cj |Ij |2 . fj dx = f dx
2
j =0 i<j j =0 I Ij
16.5 Integration über unbeschränkte Intervalle oder Funktionen 629
nach Voraussetzung beschränkt ist, folgt nach dem Satz von existiert. In diesem Fall können wir das Integral berechnen,
Beppo Levi, dass f ∈ L(I ) lebesgue-integrierbar ist und etwa mithilfe einer Stammfunktion, durch den Grenzwert
J J J ∞ J b
f dx = lim f dx f (x) dx = lim f (x) dx
I j →∞ Ij a b→∞ a
gilt. oder J J
b b
Ist nun f : I → R beliebig, so zerlegen wir f = f+ − f− f (x) dx = lim f (x) dx .
−∞ a→−∞ a
mit
f (x) für f (x) ≥ 0 ,
f + (x) =
0 für f (x) < 0 Es gibt unbeschränkte, aber integrierbare
und Funktionen
0 für f (x) ≥ 0,
f − (x) =
−f (x) für f (x) < 0 . Nachdem wir das Konvergenzkriterium bei unbeschränkten
Damit lässt sich das obige Resultat für positive Funktionen Intervallen angewandt haben, sehen wir uns jetzt noch Defi-
auf f + und f − anwenden, und wir erhalten die Behaup- nitionslücken des Integranden genauer an.
tung. Im einfachsten Fall lässt sich eine Lücke im Definitionsbe-
reich wie jene von
Die Tragweite des Kriteriums verdeutlichen wir uns an ver- sin x
schiedenen Beispielen. f (x) = durch f (0) = 1
x
Beispiel Wir prüfen mit dem Konvergenzkriterium, dass bei x = 0 stetig ergänzen (siehe Seite 318). Da das Inte-
das Integral gral stetiger Funktionen über abgeschlossenen Intervallen
J ∞
existiert und einzelne Punkte keinen Einfluss auf das Integral
xe−x dx haben, ist die Existenz des Integrals gesichert. Ein Wert lässt
0
sich mit einer Stammfunktion bestimmen, wenn wir diese
existiert.
kennen. Auch ein endlicher Sprung im Integranden lässt sich
Da xe−x ≥ 0 für x ≥ 0 gilt, können wir das Kriterium durch Aufteilen in zwei Integrationsintervalle klären (siehe
direkt anwenden. Wir suchen eine Stammfunktion zum In- Seite 611). Schwierigkeiten machen hingegen Funktionen
d
tegranden. Mit der Produktregel folgt dx ((1 + x)e−x ) = wie
−x −x −x
e − (1 + x)e = −xe . Setzen wir weiter Ij = (0, j ) 1 1
für j ∈ N, so erhalten wir: f (x) = sin( ), f (x) = ln |x| oder f (x) = ,
x x
J j
die an einer Stelle x0 , wie hier für x0 = 0, nicht definiert
xe−x dx = −(1 + x)e−x |0 = −(1 + j )e−j + 1 .
j
0 sind. Auch wenn die Funktion bei Annäherung an eine sin-
guläre Stelle betragsmäßig beliebig groß wird, kann es durch-
Wegen der Eigenschaft 0 ≤ e−j der Exponentialfunktion für aus sein, dass ihr Integral begrenzt bleibt. Es gibt aber auch
j ∈ N lassen sich die Integrale durch Situationen, in denen der Flächeninhalt unter dem Graphen
J j unbeschränkt ist.
xe−x dx = 1 − (1 + j )e−j ≤ 1
0 Beispiel Wir kennen bereits die Stammfunktion
abschätzen und somit ist die Folge der Integrale beschränkt. F : (−1, 1) → R mit F (x) = arcsin x zur Funktion
Das Konvergenzkriterium besagt, dass das Integral über f mit f (x) = √ 1 2 . Also erhalten wir mit Ij = 0, 1 − j1
1−x
(0, ∞) existiert. Außerdem erhalten wir den Wert die Abschätzung
J ∞ J j J 1− j1
xe−x dx = lim xe−x dx = lim 1−(1+j )e−j = 1 . %
1
dx = arcsin x|0
1− j1
0 j →∞ 0 j →∞
0 1 − x2
' (
1 π
= arcsin 1 − − arcsin 0 ≤
j 2
Das Beispiel legt ein allgemeines Vorgehen nahe. Denn, wenn
der Integrand f auf beschränkten Intervallen integrierbar ist, für alle j ∈ N. Mit dem Konvergenzkriterium existiert das
etwa da f stetig ist, so besagt das Kriterium, dass die Funktion Integral über dem Intervall (0, 1), und es gilt:
auf (a, ∞) oder (−∞, b) integrierbar ist, wenn der Grenz- J 1 ' (
wert für 1 1 π
% dx = lim arcsin 1 − = arcsin(1) = .
J b J b 0 1−x 2 j →∞ j 2
lim |f (x)| dx bzw. lim |f (x)| dx
b→∞ a a→−∞ a
630 16 Integrale – von lokal zu global
Problemanalyse und Strategie: Da die Integranden auf den Integrationsgebieten positiv sind, müssen wir den Grenz-
wert über den Betrag der Funktionen nicht gesondert betrachten. Mit passenden Majoranten/Minoranten lässt sich die
Existenz der Integrale klären.
J
Lösung:
b * +b
lim e−x dx = lim −e−x 1
Im ersten Beispiel stellen wir zunächst fest, dass für posi- b→∞ 1 b→∞
B C
tive x > 0 immer die Ungleichung −b 1 1
= lim −e + = .
1 1 b→∞ e e
≤ 2
x + x2 x
Somit ist e−x integrierbar auf [1, ∞) mit
gilt. Das Integral über die rechte Seite der Ungleichung J ∞
1
können wir aber problemlos ermitteln, und damit erhal- e−x dx = .
ten wir mit dem Vergleich, dass das Integral J1 existiert. 1 e
Genauer gilt: e– x
J ∞ J ∞
dx dx 2
J1 = ≤
1 x + x2 1 x2
J b B C
dx 1 b 1
= lim = lim −
b→∞ 1 x 2 b→∞ x 1
1
= − lim + 1 = 1. 0 1 2 3 4 x
b→∞ b
e−x
2
Das Integral von f (x) = über dem Intervall [0, 1]
Im zweiten Beispiel wissen wir, dass der Kosinus für existiert, da die Funktion stetig ist. Da für alle x ∈ [0, 1]
x ∈ (− π2 , π2 ) positiv ist, also insbesondere auch im Inter- immer e−x ≤ 1 ist, kann man das Integral großzügig mit
2
J b J b
Auch in dieser Situation, wenn eine Stammfunktion bekannt
lim |f (x)| dx bzw. lim |f (x)| dx
ist, lässt sich aus dem allgemeinen Kriterium ein generelles b→x0 − a a→x0 + a
Vorgehen ableiten. Nun nehmen wir an, dass eine Singula-
rität des Integranden am linken oder rechten Rand des Inte- prüfen. Wenn dieser Grenzwert existiert, ist die Funktion in-
grationsbereichs liegt. Andernfalls spalten wir das Integral tegrierbar, und es gilt:
entsprechend auf.
J x0 J b
Für die Integration über Funktionen mit einer Singularität an
f (x) dx = lim f (x) dx
einer Stelle x0 ∈ R können wir den Grenzwert a b→x0 − a
16.5 Integration über unbeschränkte Intervalle oder Funktionen 631
bzw. J J Oft ist ein Vergleich mit der Funktion g mit g(x) = x1α =
b b
f (x) dx = lim f (x) dx . x −α hilfreich. In Abhängigkeit vom Parameter α > 0 lassen
x0 a→x0 + a sich Aussagen über das gesuchte Integral machen. Um diese
Technik nutzen zu können, untersuchen wir zunächst solche
Beispiel Vergleichsintegrale. Für das Integral
J ∞
Mit der Ableitung 1
α
dx
1 x
1
(x ln x − x) = x + ln x − 1 = ln x erhalten wir mit α = 1:
x
J )b
und der Regel von de L’Hospital erhalten wir für die Be-
b
−α x −α+1 ))
1 lim x dx = lim )
rechnung des Integrals 0 ln x dx: b→∞ 1 b→∞ −α + 1 )
1
J 1 J 1 b1−α 1
| ln x| dx = − ln x dx = −(x ln x − x)|1 = lim − .
b→∞ 1 − α 1−α
= 1 + ( ln − ) → 1 Für α > 1 existiert der Grenzwert
lim b1−α = 0
für → 0. Da der Grenzwert existiert, gilt ln ∈ L((0, 1)). b→∞
Unter Berücksichtigung des Vorzeichens erhalten wir:
und somit auch das Integral. Für α < 1 hingegen liegt Diver-
J 1 genz vor. Den ausgeschlossenen Fall α = 1 haben wir schon
ln x dx = −1 . im letzten Beispiel geklärt. Das Integral existiert nicht.
0
Analog betrachten wir noch
Mit der Ableitungsregel (ln x) = 1
x erhalten wir: J 1
1
J 1 dx .
1 xα
dx = ln x|1ε = − ln ε , 0
ε x Setzen wir wieder zunächst α = 1 voraus, so ist
und dieser Ausdruck divergiert für ε → 0. Das Integral J 1 )1
1 1
−α x −α+1 ))
0 x dx existiert nicht. x dx = )
a −α + 1 )
a
Wir haben auf Seite 623 bereits ein Beispiel gesehen, bei dem 1 a 1−α
keine Stammfunktion durch Standardfunktionen ausgedrückt = − .
1−α 1−α
werden kann. Damit lässt sich ein Grenzwert, wie oben be-
schrieben, nicht ausnutzen. Aber es lässt sich eine weitere In diesem Fall existiert das Integral für α < 1, denn wir
Möglichkeit ableiten, die Existenz eines Integrals zu prüfen, erhalten den Grenzwert:
J 1
und zwar ohne den Wert des Integrals zu berechnen. 1 1
lim x −α dx = − lim a 1−α = .
a→0 a 1 − α a→0 1−α
Mit einer Majorante lässt sich die Existenz Für α > 1 divergiert der Limes und somit auch das Integral.
Den Ausnahmefall α = 1 haben wir oben überprüft, das
eines Integrals auch ohne Kenntnis einer
Integral existiert nicht.
Stammfunktion klären
Wie man diese Integrale als Majoranten nutzen kann, ist in ei-
Betrachten wir das Konvergenzkriterium noch einmal genau, nigen der Beispiele auf Seite 630 zu sehen. Gerade beim letz-
so beantwortet es uns die Frage nach der Existenz des Inte- ten der dort gezeigten Beispiele wird die Bedeutung solcher
grals, wenn wir neben f ∈ L(Ij ) zeigen können, dass die Abschätzungen deutlich. Wir können klären, ob ein Integral
Folge der Integrale existiert, auch wenn keine Stammfunktion gegeben ist.
J Lässt sich die Existenz eines Integrals auf Intervallen der
|f (x)| dx Form (N, ∞) klären, so liefert dies ein weiteres Kriterium
Ij j ∈N für die Konvergenz entsprechender Reihen.
beschränkt ist. Also genügt eine Abschätzung für diese Folge. Integralkriterium für Reihen Ist f : [N, ∞) → R eine mo-
Wegen der Monotonie des Integrals ist es naheliegend, den noton fallende, positive, auf kompakten Teilintervallen inte-
Integranden durch Funktionen abzuschätzen, zu denen uns grierbare Funktion und ist an = f (n) für n ≥ N ∈ N, so
die Existenz des entsprechenden Integrals bekannt ist. Wir konvergiert die Reihe
sprechen dann von einer Majorante bzw. Minorante. Im ∞ ∞
! !
Beispiel auf Seite 630 ist diese durch die Konstante 1 gege- an = f (n)
ben. n=N n=N
632 16 Integrale – von lokal zu global
2 ln x dx → ∞, b→∞
0 1
J ∞ 1 J 1
dx = π 1
dx → ∞, a→0 für α ≥ 1
−∞ 1 + x2 xα
a
J 1 1 1
dx = für 0 ≤ α < 1
0 x α 1−α
J 1
Kommentar: Den Zusammenhang zwischen Konver-
ln x dx = −1 genz und Divergenz der Integrale über x1α einerseits in
0 (0, 1), andererseits in (1, ∞) kann man mit der Substi-
tutionsregel aus Kapitel 16.4 direkt herstellen. Durch die
Substitution u = x1 wird die Komplementarität klar.
genau dann, wenn das Integral für α > 1 konvergiert, betrachten wir mit der Substitution
J ∞ u = ln(x) und partieller Integration
f (x) dx J J
N b ln(x) ln b
dx = u e(1−α)u du
existiert. 1 xα 0
1 b(1−α) ln(b) b(1−α)
= − +
Beweis: Aus aj = f (j ) ≤ f (x) ≤ f (j + 1) = aj +1 für (1 − α)2 (1 − α)2 1−α
j ≥ N und x ∈ [j, j + 1] und mit In = [N, n] für n ∈ N 1
→ , b → ∞.
gilt: (1 − α)2
!
n−1 J !n
aj ≤ f (x) dx ≤ aj . Mit dem Kriterium ergibt sich Konvergenz der Reihe.
j =N In j =N +1
Also liefert die Reihe eine Majorante für die Integrale über
alle In . Nach dem Konvergenzkriterium auf Seite 628 exis- Manchmal reicht das Lebesgue-Integral
tiert somit J ∞ nicht aus
f (x) dx .
N
Auch wenn die Klasse der integrierbaren Funktionen recht
Andererseits folgt aus der Existenz des Integrals N∞ f (x) dx umfassend ist, gibt es Situationen, in denen diese nicht aus-
eine obere Schranke für die monoton steigende Folge der reicht. Ein für die Signalverarbeitung wichtiges Beispiel ist
Partialsummen. Nach dem Monotoniekriterium konvergiert auf Seite 634 gezeigt. Wir sprechen von einem uneigent-
damit die Reihe. lichen Integral, wenn die betrachtete Funktion nicht inte-
grierbar ist, aber ein Grenzwert, etwa wie im Beispiel
Das Konvergenzkriterium ist in manchen Fällen ein eleganter J x
Weg, um Konvergenz zu belegen. lim sinc(t) dt ,
x→∞ 0
Eine weitere Erweiterung des Integralbegriffs ist mit dem so- Wir definieren eine Funktion g : R>1 → R durch das
genannten Cauchy’schen Hauptwert gegeben. Nach der De- Integral J ∞
finition existiert das Integral
g(s) = ex e−sx dx .
J 1
0
1 Diese Definition ist sinnvoll, da das Integral für s > 1
dx
−1 x existiert, und es gilt:
J ∞
nicht, da die beiden Integrale
g(s) = e(1−s)x dx
J B J 1 0
dx dx )
lim und lim 1 (1−s)x ))b
B→0− −1 x A→0+ A x = lim e )
b→∞ 1 − s x=0
divergieren. Andererseits verhalten sich beide Anteile sym- 1
=
metrisch. Wenn man die Grenzübergänge nicht separat, son- s−1
dern simultan vollzieht, ergibt sich:
J mit dem Grenzwert limb→∞ e(1−s)b = 0 für s > 1.
J 1 −T dx J 1 Die Funktion g nennt man die Laplacetransformierte der
dx dx
P := lim + Funktion exp.
−1 x T →0+ −1 x T x
)−T )1 Ist mit f : R → R die Rechteckfunktion mit
) )
= lim ln(−x)) + ln x )
T →0+ −1 T 1, t ∈ [−1, 1] ,
f (x) =
= lim {ln T − ln 1 + ln 1 − ln T } = 0. 0, sonst
T →0+
notiert, dann erhalten wir bis auf einen Faktor die soge-
Wenn ein solcher symmetrischer Grenzwert existiert, nennt nannte Fouriertransformation g : R → C durch
man ihn Cauchy’scher Hauptwert. Um dieses Integral von J ∞
eigentlichen Integralen zu unterscheiden, wird es manchmal g(s) = f (t)e−ist dt .
mit P für principal value gekennzeichnet. −∞
1 2 k−1 k k+1 x
Ein zentraler Satz der Integrationstheorie gibt an, unter wel-
Abbildung 16.16 Graphen der Funktionen aus dem Beispiel auf Seite 633. chen Voraussetzungen an die Folge der Integranden Grenz-
wert und Integral vertauscht werden können, ohne dass sich
der Wert ändert.
Man sieht, dass die Folge punktweise gegen null konvergiert.
Für die Folge der Integrale gilt aber:
J ∞ J k J k+1 Lebesgue’scher Konvergenzsatz
fk (x) dx = (x+1−k) dx+ (k+1−x) dx = 1 .
−∞ k−1 k Wenn es zu einer Folge von integrierbaren Funktionen
fn ∈ L(I ) über einem Intervall I ⊂ R, die punktweise
Somit ist fast überall gegen f : I → R konvergiert, eine integrier-
J ∞ J ∞ bare Funktion g ∈ L(I ) gibt mit |fn (x)| ≤ g(x) für fast
1 = lim fk (x) dx = lim (fk (x)) dx = 0 . alle x ∈ I und alle n ∈ N, dann ist f ∈ L(I ) integrierbar,
k→∞ −∞ −∞ k→∞ und es gilt:
Es macht einen Unterschied, ob wir den Grenzwert der In- J J
tegrale betrachten oder ob wir über den Grenzwert der Inte- lim fn (x) dx = f (x) dx .
n→∞ I I
granden integrieren.
16.6 Parameterabhängige Integrale 635
Beachten Sie, dass diese Aussage nicht nur das Vertauschen und J J
der Grenzprozesse ermöglicht, sondern auch zeigt, dass die lim hn (x) dx = f (x) dx.
Grenzfunktion eine integrierbare Funktion ist. n→∞ I I
Beispiel Die am Anfang des Abschnitts definierte Gam- Durch die Forderungen p(0) = 0 und p (0) = 0 sind zwei
mafunktion ist eine stetige Funktion für t > 0. Dies ergibt Koeffizienten der Parabel festgelegt. Es bleibt nur noch ein
sich aus der oben gezeigten Aussage, denn die Integranden freier Parameter, den wir mit t bezeichnen, d. h., die gesuchte
e−x x t−1 sind bei festem Wert t > 0 auf I = (0, ∞) inte- Parabel ist gegeben durch p(x) = tx 2 . Für die integrierte
grierbar. Außerdem handelt es sich um stetige Funktionen quadratische Abweichung erhalten wir
bezüglich der Variablen t für jedes x > 0. Eine integrierbare J 1, -2
Majorante erhalten wir auf jedem abgeschlossenen Intervall F (t) = x 4 − tx 2 dx .
[a, b] ⊆ (0, ∞) durch die Abschätzung −1
−x a−1 Aus unseren Ergebnissen zu Parameterintegralen wissen wir,
e x x≤1
f (t, x) ≤ g(x) = dass F differenzierbar ist. Um ein Extremum zu finden, leiten
e−x x b−1 x>1 wir den Ausdruck nach t ab, indem wir, wie gezeigt, den
für t ∈ [a, b]. Integranden differenzieren und erhalten:
J 1, -
F (t) = 2 x 4 − tx 2 (−x 2 ) dx
Auch Differenzierbarkeit nach einem −1
J 1 , -
Parameter lässt sich mittels einer Majorante = −2 x 6 − tx 4 dx
prüfen −1
2 31 B C
x7 x5 1 1
Wenn f (., x) differenzierbar ist auf einem Intervall [a, b], = −2 −t = −4 −t .
7 5 7 5
so überträgt sich dies auch auf G, aber wiederum nur unter −1
gewissen zusätzlichen Voraussetzungen. Nullsetzen der Ableitung liefert t = 57 . Wegen F (t) = 45 > 0
haben wir tatsächlich ein Minimum gefunden. Das Polynom
Die Ableitung eines Parameterintegrals q, die beste Parabel p und die quadratische Abweichung sind
Sind f (., x) für fast alle x ∈ I differenzierbare Funk- in Abbildung 16.18 dargestellt.
tionen auf [a, b] mit Ableitungen ∂f
∂t (., x) = (f (., x)) , y
und gibt es für alle t ∈ [a, b] eine integrierbare Funktion
g ∈ L(I ) mit | ∂f
1 x4
∂t (t, x)| ≤ g(x) für fast alle x ∈ I , so
ist das Parameterintegral G differenzierbar, und es gilt: 5 2
7
x
J
∂f
G (t) = (t, x) dx, t ∈ [a, b] .
I ∂t
Zunächst überlegen wir, wie man eine Idee über das Wir definieren
asymptotische Verhalten der Fakultät bekommen kann. 2n−1 √ √
1+ x
√ e− nx , x > −2 n ,
Dazu ist es sinnvoll, sich den Logarithmus anzusehen: hn (x) = 2 n √
0, x ≤ −2 n .
!
n
ln(n!) = ln(j ) . Die Funktion hn ist nicht negativ auf R, und es gilt
j =1 limx→∞ hn (x) = 0 für jedes n ∈ N. Mit der Ableitung
Die Summe rechts lässt sich etwa im Sinne der Trapezregel
(siehe Seite 624) interpretieren, d. h.: h (x)
J n ' (' (2n−2 √
!n 2n − 1 √ x x
1
ln(j ) − ln(n) ≈ ln x dx = √ − n(1 + √ ) 1 + √ e− n x
2 1
2 n 2 n 2 n
j =1
√
mit Intervallbreite h = 1. Da wir eine Stammfunktion zum auf (−2 n, ∞) ergibt sich die einzige kritische Stelle bei
−1
Integral kennen, erhalten wir die Approximation x = √ n
. Also liegt dort ein Maximum; und es gilt die
! 1 Abschätzung:
ln(j ) ≈ n ln(n) − n + 1 + ln(n)
2
j =1
n −1 1 2n−1
0 ≤ hn (x) ≤ hn ( √ ) = (1 − ) e ≤ e.
bzw. mit der Exponentialfunktion n 2n
√ n n
n! ≈ e n . Damit erhalten wir eine integrierbare Majorante, g(x) =
e 2
Die Differenz zwischen dem Integral und der Trapez- exp − x4 + 1 . Mit dem Lebesgue’schen Konvergenzsatz
summe für große n lässt sich mithilfe der sogenannten ist J ∞
x2
Euler-MacLaurin Summenformel genauer untersuchen. lim qn = lim hn (x) e− 4 dx .
n→∞ −∞ n→∞
So lässt sich die Approximation auch als Startpunkt für
einen rigorosen Beweis der Stirling’schen Formel nutzen, Für den punktweisen Grenzwert von (hn (x))n∈N schrei-
den wir hier aber nicht weiter ausführen. ben wir
' (−1 √
Eine andere Möglichkeit, nun das asymptotische Verhal- x x
2n ln(1+ 2√ )− n x
hn (x) = 1 + √ e n
ten der Fakultät für wachsendes n ∈ N zu beweisen, ist es 2 n
den Quotienten
n! en √
qn = n √ für x > −2 n. Mit der Taylorformel 2. Ordnung zu
n n ln(1 + ξ ) um ξ = 0 folgt:
zu betrachten. Auf diesem Weg können wir Parameter- B C
x √
integrale anwenden, genauer die Darstellung der Fakultät lim 2n ln 1 + √ − n x
mithilfe der Gammafunktion, (n − 1)! = (n) (siehe Auf- n→∞ 2 n
2 ' ( 3
gabe 16.12). Es folgt: x 1 x2 x 3 √
= lim 2n √ − +O √ − nx
en (n) n→∞ 2 n 2 4n 2 n
qn = n−1 √
n n
J ∞ x2
en =−
= n−1 √ ξ n−1 e−ξ dξ . 4
n n 0
für jeden Wert x ∈ R. Insgesamt erhalten wir die Stir-
Einer Idee von J. M. Patin in A very short proof of Stirling’s ling’sche Formel aus
formula, Amer. Math. Monthly 96 (1989) folgend ergibt J ∞
x2
sich mit der Substitution
' (2 lim qn = lim hn (x)e− 4 dx
n→∞ −∞ n→∞
x J ∞
ξ =n 1+ √ x2 √
2 n = e− 2 dx = 2π,
die Identität −∞
J ∞ ' (2n−1 √
x x2 wobei wir den Wert des letzten Integrals im Beispiel auf
qn = √ 1 + √ e− n x− 4 dx .
−2 n 2 n Seite 639 berechnen.
16.7 Weitere Integrationsbegriffe 639
Lösung: Da
Die Existenz des Integrals haben wir bereits auf Seite 630 J 1
gezeigt. 1 π
G(0) = dx = arctan x|10 =
0 1 + x2 4
Wir betrachten nun die Funktion G : R → R mit
J 1 −(1+x 2 )t 2 ist, ergibt sich insgesamt:
e
G(t) = dx .
0 1 + x2 'J t (2
π
e−x dx
2
−(1+x 2 )t 2 = − G(t) .
Mit der Ableitung, |−2te | ≤ 2t, des Integranden 0 4
ist die Konstante 2T integrierbare Majorante auf [0, 1] für
alle t ∈ [0, T ] mit T > 0. Somit ist das Parameterintegral Nun können wir den Grenzwert
G differenzierbar, und wir erhalten mit der Substitution J
e−(1+x )t
1 2 2
u = t x: lim G(t) = lim dx = 0
J 1 t→∞ t→∞ 0 1 + x2
(1 + x 2 )t e−(1+x )t
2 2
G (t) = −2 dx
0 1 + x2 unter Verwendung des Lebesgue’schen Konvergenzsatzes
J t bestimmen, da mit 1/(1 + x 2 ) eine auf [0, 1] integrierbare
= −2e−t e−u du .
2 2
Majorante gegeben ist. Insgesamt erhalten wir:
0
J ∞
= g(t) 1√
e−x dx =
2
π.
Mit der angegebenen Definition ist g eine Stammfunktion 0 2
zu g (t) = e−t . Der zweite Hauptsatz der Integralrech-
2
Später auf Seite 941 werden wir sehen, wie der Wert dieses
nung liefert aber Integrals noch auf einem anderen Weg bestimmt werden
J t kann.
G(t) − G(0) = G (τ ) dτ
0
J t' J τ (
e−τ e−x dx dτ
2 2
= −2
0 0
J t
= −2 g (τ )g(τ ) dτ
0
)t J t
)
= −2 (g(τ ))2 ) + 2 g (τ )g(τ ) dτ
0 0
'J t (2
e−x dx
2
= −2 − G(t) + G(0) .
0
Regelfunktionen sind Grenzwerte gleichmäßig Die Menge aller Regelfunktionen über [a, b] bildet einen
konvergenter Folgen von Treppenfunktionen Vektorraum; denn mit der Definition und der Linearität des
Grenzwerts folgt für zwei Regelfunktionen f, g, dass auch
Betrachten wir wieder Treppenfunktionen auf einem kom- λf + μg für λ, μ ∈ R Regelfunktion ist.
pakten Intervall [a, b].
Beispiel
Jede stetige Funktion f ∈ C([a, b]) ist Regelfunktion, da
Definition der Regelfunktion sich eine Folge von Treppenfunktionen konstruieren lässt,
Eine Funktion f : [a, b] → R heißt Regelfunktion, die gleichmäßig gegen f konvergiert.
wenn es eine Folge von Treppenfunktionen ϕn : [a, b] Um eine solche Folge zu bekommen, nutzen wir zunächst,
→ R gibt, die gleichmäßig gegen f konvergiert. dass f auf dem kompakten Intervall gleichmäßig stetig ist.
Es gibt somit zu ε > 0 ein δ > 0 mit
|f (x) − f (y)| ≤ ε
640 16 Integrale – von lokal zu global
und ϕ(b) = f (b). Dann ist Die Treppenfunktion ϕN ist beschränkt, da sie endlich
viele Werte, die Funktionswerte der Stufen und gegebe-
|f (x) − ϕ(x)| ≤ ε nenfalls isolierte Werte an den endlich vielen Sprung-
stellen, annimmt. Mit der Dreiecksungleichung erhalten
für alle x ∈ [a, b], da zu x ∈ [a, b] ein n ∈ N existiert mit
wir für die Supremumsnorm von f :
x ∈ [xn−1 , xn ), und somit ist |x − zn | ≤ |xn − xn−1 | ≤ δ.
Konstruieren wir zu εm = 1/m diese Treppenfunktion
ϕm , so erhalten wir eine Folge von Treppenfunktionen f = f − ϕN + ϕN ∞ ≤ 1 + ϕN ∞ .
(ϕm )m∈N mit
Somit ist auch f beschränkt.
1 (b) Eine gleichmäßig gegen f konvergierende Folge von
f − ϕm ∞ ≤ → 0, m → ∞.
m Treppenfunktionen (ϕn ) ist wegen
Das bedeutet (ϕm ) konvergiert gleichmäßig gegen f , und
wir haben gezeigt, dass f eine Regelfunktion ist. |f (x) − ϕn (x)| ≤ f − ϕn ∞ → 0, n→∞
Die Funktion f : [0, 1] → R mit
auch punktweise konvergent, und mit Teil (a) ist durch
0, x = 0, die Konstante f ∞ auf dem kompakten Intervall [a, b]
f (x) =
sin x1 , x ∈ (0, 1] eine integrierbare Majorante gegeben. Mit dem Lebes-
gue’schen Konvergenzsatz (siehe Seite 634) ist daher
ist keine Regelfunktion. auch die Grenzfunktion f lebesgue-integrierbar.
Angenommen f wäre Regelfunktion, so gibt es eine Trep- (c) Wir zeigen, dass die Grenzfunktion eine Regelfunktion
penfunktion ϕ mit f − ϕ∞ ≤ 14 . Weiter wählen wir zur ist. Denn wenn ε > 0 vorgegeben ist, so gibt es zu jedem
Treppenfunktion ein δ > 0, sodass ϕ(x) = c ∈ R für fn , n ∈ N, eine Treppenfunktion ϕn mit
x ∈ (0, δ) konstant ist. Ist nun N ∈ N hinreichend groß
mit 2π1N < δ, so folgt: ε
fn − ϕn ∞ ≤ .
) ) 2
1 ) 1 1 )) 1
|c| = |ϕ( )| = ))f ( ) − ϕ( )) ≤
2πN 2πN 2πN 4 Außerdem gibt es N ∈ N, sodass
im Widerspruch zu ε
) ) f − fn ∞ ≤ für n ≥ N
) 1 1 ) 1 2
|1 − c| = ))f ( ) − ϕ( ))) ≤ .
2π N + π
2 2πN + π
2 4 gilt. Es folgt mit der Dreiecksungleichung
Daher ist f keine Regelfunktion.
ε ε
f − ϕn ∞ ≤ f − fn ∞ + fn − ϕn ∞ ≤ + = ε.
Eine andere Charakterisierung der Regelfunktionen beleuch- 2 2
tet das letzte Gegenbeispiel genauer und wird auf Seite 641 Mit (ϕn ) ist eine Folge von Treppenfunktionen gegeben,
angesprochen. In Hinblick auf die Integration konzentrieren die gleichmäßig gegen f konvergiert. Also ist f Regel-
wir uns auf einige wenige Eigenschaften dieser Funktionen. funktion.
Nutzen Sie die Regelfunktionen als Einstieg in die Integrati-
onstheorie, sollten Sie bei den folgenden Aussagen Teil (b)
Mit den ersten beiden Aussagen wird deutlich, dass die
ignorieren.
Menge der Regelfunktionen eine echte Teilmenge der
lebesgue-integrierbaren Funktionen ist. Die letzte Aussage
Satz
bedeutet, dass die Regelfunktionen bezüglich der gleichmä-
(a) Jede Regelfunktion f : [a, b] → R ist beschränkt. ßigen Konvergenz bzw. der Supremumsnorm einen abge-
(b) Jede Regelfunktion f : [a, b] → R ist lebesgue- schlossenen normierten Raum bilden (siehe Kapitel 19).
integrierbar.
(c) Ist (fn )n∈N eine Folge von Regelfunktionen auf [a, b], Das Integral einer Regelfunktion definiert man analog zum
die gleichmäßig gegen eine Funktion f : [a, b] → R Lebesgue-Integral als Grenzwert der Integrale über die ap-
konvergiert, so ist auch die Grenzfunktion f eine Regel- proximierenden Treppenfunktionen. Für eine solche Defini-
funktion. tion müssen vorab zwei Fragen geklärt werden.
16.7 Weitere Integrationsbegriffe 641
Die Treppenfunktionen haben offensichtlich die Eigen- Für die Rückrichtung müssen wir zeigen, dass eine Funk-
schaft, dass sich die Funktion auch in den Sprungstellen tion f : [a, b] → R, zu der in jeder Stelle x0 die entspre-
sowohl von links als auch von rechts stetig fortsetzen lässt chenden links- bzw. rechtsseitigen Grenzwerte existieren,
und nur ein endlicher Sprung vorliegt. Solche Stellen wer- eine Regelfunktion ist:
den in der Literatur auch Unstetigkeit 1. Art genannt. Bei
Geben wir uns ein n ∈ N vor. Wenn die Grenzwerte exis-
den Regelfunktionen bleibt diese Eigenschaft erhalten. In-
tieren, so gibt es zu jedem x0 ∈ [a, b] ein δ > 0, sodass
teressant ist, dass andersherum genau diese Eigenschaft
|f (x) − f (y)| ≤ n1 für alle x, y ∈ Iδ (x0 ) = {x ∈ [a, b] |
die Regelfunktionen charakterisiert. Damit bekommt man
|x − x0 | ≤ δ} mit x < y < x0 bzw. x0 < y < x gilt.
eine deutlichere Vorstellung, welche Funktionen Regel-
funktionen sind. Da [a, b] kompakt ist, gibt es eine endliche Überdeckung
von [a, b] durch solche Intervalle Iδ (zj ), j ∈ {1, . . . , M}
Um diese Äquivalenz zu zeigen, betrachten wir die Im-
mit z1 , . . . , zM ∈ [a, b]. Nun betrachten wir die Zerle-
plikationen separat. Zunächst gilt es zu beweisen, dass es
gung a = x0 < x1 , · · · < xm−1 < xm = b, bestehend
bei einer Regelfunktion f : [a, b] → R zu jeder Stelle
aus den Randpunkten a, b, den Mittelpunkten zj und den
x ∈ (a, b) einen linksseitigen und einen rechtsseitigen
Randpunkten der Intervalle Iδj (zj ) nach ihrer Größe sor-
Grenzwert gibt und in den Randpunkten die jeweils ent-
tiert (siehe Abbildung).
sprechende stetige Fortsetzung existiert.
Dazu betrachte man eine Folge von Treppenfunktionen
Iδ (zj+2 )
(ϕn ), die gleichmäßig gegen f konvergiert. Mit der Drei- xn xn+1 xn+2 · · · · · ·
ecksungleichung folgt:
zj−1 zj zj+1 zj+2
|f (x) − f (y)|
≤ |f (x) − ϕn (x)| + |ϕn (x) − ϕn (y)| + |ϕn (y) − f (y)| Wir wählen aus jedem Intervall ξj ∈ (xj , xj +1 ) und defi-
nieren die Treppenfunktionen
für x, y ∈ [a, b]. Da (ϕn ) gleichmäßig konvergiert, gibt es
zu ε > 0 ein N ∈ N, sodass |f (x) − ϕn (x)| ≤ ε für alle
f (ξj ) für x ∈ (xj , xj +1 ) ,
x ∈ [a, b] und n ≥ N gilt. Also können wir den ersten ϕn (x) =
f (xj ) für x = xj .
und dritten Term durch ε abschätzen.
Fixieren wir nun n ≥ N und eine Stelle z ∈ [a, b). Da Damit folgt:
1
zur Treppenfunktion ϕn der Grenzwert lim ϕn (x) exis- |f (x) − ϕn (x)| ≤
x→z+ n
tiert, gibt es δ > 0 mit |ϕn (x) − ϕn (y)| ≤ ε für alle
für alle x ∈ [a, b]. Wir haben somit eine Folge von Trep-
x, y ∈ I = {x ∈ (z, b) | |x − z| ≤ δ}. Somit lässt
penfunktionen (ϕn ) konstruiert, die gleichmäßig gegen f
sich auch der mittlere Term abschätzen, und obige Un-
konvergiert. Also ist f eine Regelfunktion.
gleichung zeigt, dass rechtsseitig eine Cauchy-Folge vor-
liegt und somit der rechtsseitige Grenzwert existiert. Ana- Insgesamt erhalten wir die Äquivalenz zwischen der Ei-
log folgt die Existenz des linksseitigen Grenzwerts für genschaft von existierenden einseitigen Grenzwerten und
z ∈ (a, b]. der Regelfunktion.
für n → ∞. Damit ergibt sich für die Differenzen, die ≤ f (x) + f − ϕn ∞ − f − ϕn ∞ = f (x) .
wiederum Treppenfunktionen sind, die Konvergenz
Analog definieren wir die gegen g konvergierenden Treppen-
)J J b )
) b ) funktionen ψ̃n = ψn + g − ψn ∞ und erhalten g ≤ ψ̃n .
) )
) ϕn (x) dx − ψn (x) dx )
) a a ) Es gilt ϕ̃n (x) ≤ f (x) ≤ g(x) ≤ ψ̃n (x). Wegen der Monoto-
J b nieeigenschaft für Treppenfunktionen folgt:
≤ |ϕn (x) − ψn (x)| dx J b J b
a
f (x) dx = lim ϕ̃n (x) dx
≤ ϕn − ψn ∞ (b − a) → 0, n → ∞. a n→∞ a
J b
Die Grenzwerte sind identisch.
≤ lim ψ̃n (x) dx
n→∞ a
J b
= g(x) dx.
a
Regelfunktionen sind integrierbar In der Aufgabe 16.21 bleibt als weitere Eigenschaft zu zei-
gen, dass der Betrag |f | einer Regelfunktion f : [a, b] → R
Mit diesen Vorüberlegungen lässt sich das Integral für integrierbar ist und die daraus resultierende, insbesondere bei
Regelfunktionen unabhängig vom Lebesgue-Integral durch stetigen Funktionen häufig genutzte Beschränkung
)J )
J J ) b )
b b ) )
) f (x) dx ) ≤ f ∞ |b − a|,
f (x) dx = lim ϕn (x) dx ) a )
a n→∞ a
gilt.
mit einer gleichmäßig gegen f konvergierenden Folge von
Treppenfunktionen ϕn definieren.
Mit dem Argument zur Lebesgue-Integrierbarkeit der Regel- Im Sinne uneigentlicher Integrale lassen sich
funktion (siehe Seite 640) ist offensichtlich, dass der so bei auch unbeschränkte Intervalle und Funktionen
Regelfunktionen definierte Integralwert identisch ist mit dem betrachten
Wert des Lebesgue-Integrals über f . Die Eigenschaften aus
der Übersicht auf Seite 611 lassen sich direkt aus der Defi- Mit diesen Überlegungen ist der Zugang zum Integral mit-
nition für Regelfunktionen zeigen. hilfe von Regelfunktionen abgeschlossen, und man kann mit
16.7 Weitere Integrationsbegriffe 643
Abschnitt 16.3 die Hauptsätze und Integrationstechniken her- Definition riemann-integrierbarer Funktionen
leiten. Unterschiede zeigen sich erst in den Abschnitten 16.5
Eine Funktion f : [a, b] → R heißt riemann-inte-
und 16.6. Zum Beispiel haben wir bereits gesehen, dass unbe-
grierbar, wenn jede Riemann-Folge konvergiert. Der
schränkte Funktionen keine Regelfunktionen sind. Es gibt so-
Grenzwert
mit Funktionen, die lebesgue-integrierbar, aber im Sinne der
Regelfunktionen nicht integrierbar sind. Wird der Integralbe- !
N J b
griff über die Regelfunktionen eingeführt, weicht man bei un- lim f (zjN ) xjN − xjN−1 = f (x) dx
N →∞ a
beschränkten Integranden oder Integrationsgebieten auf un- j =1
eigentliche Integrale aus, wie wir es beim Lebesgue-Integral
auf Seite 632 gesehen haben. Der Begriff des uneigentlichen zu einer Riemann-Folge heißt Riemann-Integral von f .
Integrals wird bei der Einführung des Integrals von Regel-
funktionen für erheblich mehr Funktionen relevant. y
Denken wir an das Problem des Flächeninhalts unter Definition äquivalent ist zur Definition des Riemann-
einem Graphen, so ist es naheliegend, zu einer Zerlegung Integrals, d. h., es gilt Gleichheit in der obigen Unglei-
Z des Intervalls [a, b] in jedem Teilintervall den größten chung genau dann, wenn f riemann-integrierbar ist, und
und den kleinsten Funktionswert wir erhalten in diesem Fall:
J b
fk = inf f (x), fk = sup f (x) .
[xk−1 , xk ] [xk−1 , xk ]
sup S Z = f (x) dx = inf S Z .
Z a Z
|Z N | → 0 für N → ∞ gegeben. Sind f, g riemann-inte- Beweise der drei folgenden Aussagen aufwendig und unab-
grierbare Funktionen, und ist ε > 0 vorgegeben, so gelten hängig voneinander sind, stellen wir sie der besseren Über-
für alle N > N0 , wenn N0 hinreichend groß ist, die Abschät- sicht wegen in einem Satz zusammen.
zungen
) )
)! J b ) Satz
)N ) ε
) f (z N
)(x − x ) − f (x) dx )≤ (a) Eine Regelfunktion f : [a, b] → R ist riemann-inte-
) j j j −1 ) 2
)j =1 a ) grierbar.
(b) Ist f : [a, b] → R riemann-integrierbar, so ist f be-
und entsprechend für die Funktion g. Also erhalten wir für schränkt.
die Summe f + g: (c) Eine riemann-integrierbare Funktion f : [a, b] → R ist
) )
)N J b J b ) lebesgue-integrierbar.
)! )
) (f + g)(zN )(xj − xj −1 ) − f (x) dx − g(x) dx )
) j )
)j =1 a a )
) ) Beweis:
)N J b ) (a) Als erstes zeigen wir, dass jede Regelfunktion f : [a, b]
)! )
≤ ) ) N
f (zj )(xj − xj −1 ) − f (x) dx )) → R auch riemann-integrierbar ist. Dazu beweist man,
)j =1 a ) dass zu jedem ε > 0 ein δ > 0 existiert mit
) )
)! J b ) ) )
)N ) ) J b )
+ )) g(zjN )(xj − xj −1 ) − g(x) dx )) ) )
)j =1 ) )R(Z, z) − f (x) dx ) ≤ ε
a ) a )
ε ε
≤ + = ε.
2 2 für alle Zerlegungen Z von [a, b] mit Feinheit |Z| ≤ δ.
Damit ist gezeigt, dass eine Riemann-Folge zu f + g kon- Man beachte, dass das Integral existiert, da f Regelfunk-
vergiert. Also ist f + g riemann-integrierbar, und es gilt: tion ist.
J b J b J b Außerdem ist f Grenzwert von Treppenfunktionen im
Sinne gleichmäßiger Konvergenz. Daher ist es nahelie-
(f + g)(x) dx = f (x) dx + g(x) dx .
a a a gend, die Differenz gegenüber Treppenfunktionen zu be-
trachten. Seien also Z eine Zerlegung des Intervalls und
Entsprechend lässt sich auch ϕ eine Treppenfunktion, so gilt mit der Dreiecksunglei-
J b J b chung:
λf (x) dx = λ f (x) dx ) )
a a ) J b )
) )
für λ ∈ R zeigen. Wie zu erwarten war, ist das Riemann- )R(Z, z) − f (x) dx )
) a )
Integral eine lineare Operation.
!
N
dass es zu jedem ε > 0 und einer Treppenfunktion mit oben unbeschränkt ist. Andernfalls betrachten wir −f .
bis zu m ∈ N Sprungstellen stets ein δ > 0 gibt, sodass Es gibt somit eine Folge (ξn ) in [a, b] mit ξn → ξ ∈
) ) [a, b] und f (ξn ) → ∞ für n → ∞.
)! J b )
)N ) Wählen wir weiter eine Riemann-Folge zu Zerlegun-
)
) ϕ(zj )(xj − xj −1 ) − ϕ(x) dx )) ≤ ε gen Z N des Intervalls [a, b]. Da die Stelle ξ ∈ [a, b]
)j =1 a )
ist, gibt es zu jedem N ∈ N ein k ∈ {1, . . . , N}
mit ξ ∈ [xk−1 , xk ]. Setze I N = [xk−1 , xk ], wenn
gilt für alle Zerlegungen mit |Z| ≤ δ. Ist nun ϕ eine
ξ ∈ (xk−1 , xk ). Im Fall, dass ξ = xk−1 oder ξ = xk
Treppenfunktion mit m + 1 Sprungstellen, so zerlegen
wir ϕ = ϕ̃ + ϕ̂ mit gilt, wählen wir gegebenenfalls ein benachbartes Inter-
vall für I N , sodass zumindest eine Teilfolge von (ξn )
ϕ(x) für a ≤ x < ξm+1 , ganz in I N liegt. Ohne Änderung der Notation nutzen
ϕ̃(x) =
ϕm für ξm+1 ≤ x ≤ b wir im Folgenden auch in diesem Fall den von N abhän-
genden Index k für das Intervall I N und die Bezeichnung
und (ξn ) für diese Teilfolge.
Wir streichen zunächst jeweils das k-te Intervall aus den
0 für a ≤ x < ξm+1 ,
ϕ̂(x) = Riemann-Summen und definieren
ϕm+1 − ϕm für ξm+1 ≤ x ≤ b ,
!
N
wobei mit ξj die j -te Sprungstelle der Treppenfunktion SN = f zjN xjN − xjN−1 .
und mit ϕj der Funktionswert auf dem j -ten Intervall j =1,j =k
bezeichnet sind. Da sowohl ϕ̃ als auch ϕ̂ eine bzw m
Im Intervall I N modifizieren wir die Zwischenstelle zkN .
Sprungstellen haben, gibt es nach Induktionsvorausset-
Da die Folge (f (ξn )) unbeschränkt ist, gibt es zu jedem
zung zu ε > 0 ein δ, sodass für beide Funktionen die
N ∈ N ein n ∈ N mit ξn ∈ I N und
Differenz kleiner als ε/2 ist. Wir erhalten mit diesem δ
und der Dreiecksungleichung: N − SN
f (ξn ) ≥ .
) ) (xk − xk−1 )
)N J b )
)! )
) ϕ(z )(x − x ) − ϕ(x) dx ) Wir nutzen die Zwischenstellen z̃N , bei denen gegenüber
) j j j −1 )
)j =1 a ) zN nur das k-te Element zkN durch ξn ersetzt ist. Es folgt
) )
)! J b ) für die zugehörige Riemann-Folge:
)N )
≤ ) ) ϕ̃(zj )(xj − xj −1 ) − ϕ̃(x) dx )) R Z N , z̃N = S N + f (ξn )(xk − xk−1 ) ≥ N → ∞
)j =1 a )
) ) für N → ∞, im Widerspruch zur Riemann-Integrier-
)N J b )
)! ) barkeit von f .
+ )) ϕ̂(x) dx ))
ϕ̂(zj )(xj − xj −1 ) −
)j =1 a )
(c) Im dritten Beweis gehen wir in drei Schritten, (i)–(iii),
ε ε vor. Zunächst zeigen wir, dass Untersummen gegen das
≤ + = ε.
2 2 Riemann-Integral konvergieren. Im zweiten Schritt folgt
Damit ist die Induktion abgeschlossen. Insgesamt gibt mit dem Satz von B. Levi, dass die zugehörige Folge von
es zu gegebenem ε > 0 eine Treppenfunktion ϕ mit Treppenfunktionen gegen eine lebesgue-integrierbare
f − ϕ∞ ≤ 3(b−a) ε
, und zu dieser Treppenfunktion Funktion f˜ konvergiert. Im letzten Schritt müssen wir
lässt sich δ > 0 wählen, sodass noch belegen, dass f˜ fast überall mit f übereinstimmt
) ) und somit gezeigt ist, dass f lebesgue-integrierbar ist.
)N J b ) (i) Seien f : [a, b] → R eine riemann-integrierbare
)! ) ε
) ϕ(zj )(xj − xj −1 ) − ϕ(x) dx )) ≤ Funktion und Z N eine Folge verfeinerter Zerlegungen,
)
)j =1 a ) 3 etwa xjN = a + 2jN (b − a) für j = 0, . . . , 2N . Da f
beschränkt ist (siehe Seite 645), existiert auf jedem Teil-
für alle Zerlegungen mit |Z| < δ gilt. Obige Abschät- intervall inf z∈[x N ,x N ] f (z) für j = 1, . . . , 2N , und wir
zung liefert: j −1 j
können zu jeder Zerlegung die Untersummen
) J b )
) ) 2ε
) ) ε !
2 N
)R(Z, z) − f (x) dx ) ≤ + =ε
) a ) 3 3 N
U (Z ) = inf xjN − xjN−1
j =1 z∈[xj −1 ,xj ]
N N
Da f riemann-integrierbar ist, gilt für die zugehörigen mit l ∈ N und zeigt, #l ist
Nullmenge. Damit ist auch die
Riemann-Summen für hinreichend große N ∈ N: abzählbare Vereinigung ∞ l=1 #l Nullmenge, und wir
) J b ) erhalten ω(ξ ) = 0 fast überall.
) ) ε
) ) Um zu sehen, dass #l Nullmenge ist, fassen wir zur
)R(Z N , zN ) − f (x) dx ) ≤ .
) a ) 2 Zerlegung Z N die Indizes J N = {j ∈ {1, . . . , 2N } |
#l ∩ IjN = ∅} zusammen. Dann ergibt sich mit Teil (i):
Mit der Dreiecksungleichung folgt:
) J b ) 1 ! N
) ) 1
) ) |#l | ≤ |Ik |
)U (Z N ) − f (x) dx ) l l
) a ) k∈J N
) ) ⎛ ⎞
) ) ) J b ) 2N
!
) N N N ) ) N N ) ⎝f (zj ) − inf f (z)⎠ (xj − xj −1 )
≤ )R(Z , z ) − U (Z ))+ )R(Z , z ) − f (x) dx ) ≤
) a ) z∈IjN
j =1
) ⎛ ⎞ )
) n )
)! ) = R(Z N , zN ) − U (Z N ) → 0
≤ )) ⎝f (zN ) − inf f (z)⎠ (x N − x N )) + ε
j j j −1 ) 2
)j =1 z∈[xjN−1 ,xjN ] ) für N → ∞, wobei wir für die Zerlegung in den Inter-
ε ε vallen IjN mit j ∈ J N Zwischenstellen zjN = ξ ∈ #l
≤ + = ε.
2 2 wählen.
Also konvergiert die Folge der Untersummen Insgesamt haben wir gezeigt, dass die riemann-integrier-
(U (Z N ))N∈N gegen den Wert des Riemann-Integrals bare Funktion f fast überall mit einer lebesgue-inte-
von f . grierbaren Funktion f˜ übereinstimmt und somit selbst
(ii) Definieren wir zu Z N die Treppenfunktionen lebesgue-integrierbar ist.
⎧ *
⎪
⎨ * inf + f (z) für x ∈ xjN−1 , xjN , Da stetige Funktionen Regelfunktionen sind (siehe Seite
N N
ϕ N (x) = z∈ xj −1 ,xj 630), sehen wir mit der ersten Aussage, dass stetige Funk-
⎪
⎩ f (b) tionen riemann-integrierbar sind. Beachten Sie, dass wir im
für x = b .
ersten Beweis auch explizit gezeigt haben, dass Treppen-
Mit den Zerlegungen Z N ist (ϕ N ) offensichtlich mono- funktionen riemann-integrierbar sind. Als weitere Bemer-
ton steigend. Somit ist eine monoton wachsende Folge kung weisen wir noch darauf hin, dass wir im dritten Be-
von Treppenfunktionen gegeben mit weis sogar f ∈ L↑ (a, b) gezeigt haben (siehe Definition auf
J b J b Seite 607).
lim ϕ N (x) dx = f (x) dx .
N→∞ a a
Nach dem Satz von Beppo Levi (siehe Seite 625) kon- Das Lebesgue-Integral ist der allgemeinere
vergiert ϕ N punktweise fast überall gegen eine lebesgue- Integrationsbegriff
integrierbare Funktion f˜ ∈ L(a, b).
(iii) Es bleibt zu zeigen, dass f˜ = f fast überall auf Mit Abschnitt 16.5 wurde deutlich, dass unbeschränkte Funk-
[a, b] gilt. Wir nutzen die oben konstruierte Folge von tionen auf einem kompaktem Intervall lebesgue-integrierbar
Treppenfunktionen und betrachten an einer Stelle ξ ∈ sein können. Offensichtlich umfasst der Vektorraum der
[a, b] die Abschätzung lebesgue-integrierbaren Funktionen die Menge der riemann-
) ) ) ) integrierbaren Funktionen, beinhaltet aber noch weitere
) ) ) )
|f˜(ξ ) − f (ξ )| ≤ )f˜(ξ ) − ϕ N (ξ )) + )ϕ N (ξ ) − f (ξ )) . Funktionen. Die folgenden Beispiele vervollständigen das
Bild.
ϕ N konvergiert fast überall punktweise gegen f˜, sodass
die erste Differenz fast überall gegen null konvergiert. Beispiel
Betrachten wir noch die zweite Differenz. Sei wieder I N Im Beispiel auf Seite 640 haben wir bereits gesehen, dass
das Intervall bezüglich der N -ten Zerlegung mit ξ ∈ I N , die Funktion f : [0, 1] → R mit
so ist ⎧ 1
⎨
sin für x = 0 ,
|ϕ N (ξ ) − f (ξ )| = f (ξ ) − inf f (z) = ωN (ξ ) . f (x) = x
z∈I N ⎩0 für x = 0
Da die Folge (ωN ) beschränkt und monoton fallend ist,
keine Regelfunktion ist.
existiert der Grenzwert ω(ξ ) = limN →∞ ωN (ξ ) für je-
Da f beschränkt und fast überall stetig ist, handelt es sich
des ξ ∈ [a, b].
nach dem Lebesgue’sche Integrabilitätskriterium um eine
Ziel ist es, ω(ξ ) = 0 für fast alle ξ ∈ [a, b] zu zeigen.
riemann-integrierbare Funktion. Explizit sehen wir dies,
Dazu betrachtet man die Mengen
indem wir einige wesentliche Argumente, die zu den bei-
1 den Integrabilitätskriterien führen (siehe Seite 644), am
#l = ξ ∈ [a, b] | ω(ξ ) ≥
l Beispiel nachvollziehen.
648 16 Integrale – von lokal zu global
Sei Z N eine Folge von Zerlegungen des Intervalls [a, b] Wir haben gezeigt, dass jede Riemann-Summe konver-
mit |Z N | → 0 für N → ∞. Da f beschränkt ist, gibt es giert mit R(Z N , zN ) → supM∈N U (Z M ) für N → ∞,
zu jeder Zerlegung eine Unter- und eine Obersumme, und d. h., f ist riemann-integrierbar.
es gilt: Ein klassisches Beispiel für eine beschränkte, lebesgue-
integrierbare Funktion, die nicht riemann-integrierbar ist,
!
N
ist die Dirichlet’sche Sprungfunktion D : R → {0, 1},
U (Z N ) = inf f (z) (xj − xj −1 )
j =0 z∈Ij
N die gegeben ist durch
!
N
1 für x ∈ Q ,
≤ f (zjN ) (xj − xj −1 ) = R Z N , zN D(x) =
j =0 0 für x ∈ Q .
!
N
In jedem beliebig kleinen Intervall nimmt diese Funktion
≤ sup f (z) (xj − xj −1 ) = O Z N
N die Werte Null und Eins an.
j =0 z∈Ij
Da Q ∩ [a, b] eine Nullmenge ist, konvergiert die Folge
mit IjN = [xjN−1 , xjN ]. der Treppenfunktionen, die konstant null sind, punkt-
weise und monoton fast überall gegen D. Somit ist
Ist ε > 0 vorgegeben, so definieren wir die Indizes J N =
D ∈ L↑ (a, b), und es gilt:
{k ∈ N | xkN ≤ ε}. f ist auf [ 2ε , 1] gleichmäßig stetig.
Daher lässt sich N0 ∈ N finden mit J b
ε D(x) dx = 0 .
sup f (z) − inf f (z) ≤ a
z∈I N N
z∈Ij (b − a)
j
Andererseits können wir zu jeder Zerlegung Z eines Inter-
für alle N ≥ N0 und j ∈ J N . Es folgt für die Differenz valls [a, b] Zwischenstellen zj , wj ∈ [xj −1 , xj ] angeben
aus Ober- und Untersumme: mit f (zj ) = 1 bzw. f (wj ) = 0, und wir erhalten zu jeder
Zerlegung Riemann-Summen mit
0 ≤ O(Z N ) − U (Z N )
⎛ ⎞ R(Z, z) = 1, und R(Z, w) = 0 .
! !
≤2 |IjN | + ⎝ sup f (z) − inf f (z)⎠ |I N |
j
z∈IjN z∈IjN Es können somit nicht alle Riemann-Folgen gegen den-
j ∈J N j ∈J N
selben Grenzwert konvergieren. Die Funktion ist nicht
≤ 3ε . riemann-integrierbar.
Also gilt O(Z N ) − U (Z N ) → 0 für N → ∞.
Nun benötigen wir noch, dass für zwei Zerlegungen Z1 Zusammenfassen können wir die Betrachtungen zu den
und Z2 stets U (Z1 ) ≤ O(Z2 ) gilt; denn betrachten wir die verschiedenen Integralbegriffen über kompakte Intervalle
Zerlegung Z, die sich durch Zusammenfügen der beiden in einem Diagramm (Abb. 16.20). Mit den lebesgue-
Zerlegungen ergibt, so werden sowohl Z1 als auch Z2 integrierbaren Funktionen und den Konvergenzaussagen aus
durch Hinzunahme von Zerlegungsstellen verfeinert, und den Abschnitten 16.5 und 16.6 werden wir später den voll-
es gilt: ständigen normierten Raum der integrierbaren Funktionen
L1 (a, b) definieren, der eine zentrale Rolle in der Analysis
U (Z1 ) ≤ U (Z) ≤ O(Z) ≤ O(Z2 ) . spielt (siehe Kapitel 19). Weder die Regelfunktionen noch das
Riemann-Integral sind für diese Konstruktion ausreichend.
Damit folgt weiterhin:
Darüber hinaus ermöglicht uns das Lebesgue-Integral eine
sup U (Z N ) ≤ inf O(Z N ) , direkte Erweiterung der Integration auf höhere Dimensionen
N∈N N ∈N
(siehe Kapitel 22).
und aus der oben gezeigten Konvergenz erhalten wir:
C([0, 1])
0 ≤ inf O(Z N )− sup U (Z N ) ≤ O(Z N )−U (Z N ) → 0
N∈N N ∈N
Regelfunktionen (Treppenfkt.)
für N → ∞, d. h., supN ∈N U (Z N ) = inf N ∈N O(Z N ).
Mit ε > 0 und N ≥ N0 ergibt sich für die Riemann-
Summen: riemann-integrierbar (sin x1 )
−3ε ≤ U (Z N ) − O(Z N ) ≤ R(Z N , zN ) − O(Z N )
lebesgue-integrierbar (Dirichlet-Sprungfkt.)
≤ R(Z N , zN ) − inf O(Z M )
M∈N
Abbildung 16.20 Die verschiedenen Integrationsbegriffe über einem kompak-
= R(Z , z ) − sup U (Z M )
N N
ten Intervall führen auf echte Unterräume zur Menge der lebesgue-integrierbaren
M∈N
Funktionen. Beispiele von Funktionen etwa auf (0, 1), die nicht zu den jeweiligen
≤ R(Z N , zN ) − U (Z N ) ≤ O(Z N ) − U (Z N ) ≤ 3ε . Teilmengen gehören, sind mit angegeben.
Zusammenfassung 649
Auf das Adjektiv „uneigentlich“ kann in Mit dem Beispiel auf Seite 634 wird deutlich, dass auch
manchen Situationen nicht verzichtet werden bei Nutzung des Lebesgue-Integrals manchmal uneigentli-
che Integrale oder Cauchy’sche Hauptwerte betrachtet wer-
Wird das Integral über Regelfunktionen oder im Riemann- den müssen. Beim Lebesgue-Integral ist der Zusatz
uneigent-
Sinne definiert, so ist man, wie wir gesehen haben, bei unbe- lich somit sehr wichtig, da eine Notation wie a∞ f dx sonst
schränkten Integranden oder Intervallen auf die Erweiterung Integrierbarkeit suggeriert. Legt man den Riemann’schen
zum uneigentlichen Integral angewiesen, d. h., man definiert Begriff oder Regelfunktionen zugrunde, wird das Adjektiv
etwa die Notation in der Literatur oft nicht angemerkt, da Integrale bei unbe-
J ∞ J b schränktem Integrationsgebiet und/oder Integrand dann stets
f (x) dx = lim f (x) dx, nur im uneigentlichen Sinn definiert sind.
a b→∞ a
Zusammenfassung
Integrale von Treppenfunktionen sind anschaulich durch Der erste Hauptsatz besagt, dass die durch das Integral defi-
den Flächeninhalt zwischen x-Achse und ihrem Graphen de- nierte Funktion F eine Stammfunktion des Integranden f
finiert. Einen allgemeinen Begriff vom Integral erhalten wir ist, d. h., es gilt F ist differenzierbar mit F = f . Der zweite
durch punktweise fast überall konvergente Folgen von Trep- Hauptsatz vervollständigt das Bild.
penfunktionen, deren Integralwerte beschränkt sind. Solche
Folgen ermöglichen die Definition des Lebesgue-Integrals.
Andere Zugänge zu Integration, die zumindest für einen Teil 2. Hauptsatz der Differenzial- und Integralrechnung
der betrachteten Integranden erklärt sind, ergeben sich durch Wenn F : [a, b] → R eine stetige und auf (a, b) stetig
Regelfunktionen oder durch Riemann-Summen. differenzierbare Funktion ist mit integrierbarer Ablei-
Nachdem die Definition des Integrals festgelegt ist, zeigt sich, tung F , d. h. F ∈ L(a, b) ∩ C(a, b), dann gilt
dass stetige Funktionen über kompakten Intervallen integrier- J b
bar sind. Damit ergeben sich grundlegende Aussagen, wie F (t) dt = F (b) − F (a) .
etwa der Mittelwertsatz. a
J b J u(b)
1. Hauptsatz der Differenzial- und Integralrechnung
f (u(x)) u (x) dx = f (u) du ,
Die Funktion F : [a, b] → R mit a u(a)
J x
F (x) = f (t) dt wenn die Funktionen hinreichend regulär sind.
a
Verallgemeinerungen dieser Integrationstechniken in Hin-
zu einer stetigen Funktion f : [a, b] → R ist differen-
blick auf weniger reguläre Integranden oder unbeschränkte
zierbar auf (a, b), und es gilt:
Integrationsgebiete lassen sich mithilfe einer zentralen Kon-
F (x) = f (x) für x ∈ (a, b) . vergenzaussage der Lebesgue’schen Integrationstheorie, dem
Satz von Beppo Levi, erreichen.
650 16 Integrale – von lokal zu global
Der Satz von Beppo Levi deutlicht, dass der Satz ein Monotoniekriterium im Funktio-
nenraum L(I ) der integrierbaren Funktionen ist.
Ist (fn )n∈N eine fast überall monotone Folge von
lebesgue-integrierbaren
Funktionen
fn ∈ L(I ), und die Eine weitere wichtige Folgerung ergibt sich im Zusammen-
Folge der Integrale I fn dx n∈N in R ist beschränkt, hang mit parameterabhängigen Integralen. Der Lebesgue’
dann konvergiert die Funktionenfolge (fn ) punktweise sche Konvergenzsatz beschreibt sehr allgemeine Bedingun-
fast überall gegen eine integrierbare Funktion f ∈ L(I ), gen, unter denen ein Grenzprozess mit einer Integration ver-
und es gilt: tauscht werden darf.
J J
lim fj dx = f dx . Lebesgue’scher Konvergenzsatz
j →∞ I I
Wenn es zu einer Folge von integrierbaren Funktionen
fn ∈ L(I ) über einem Intervall I ⊂ R, die punktweise
Eine nützliche Konsequenz aus dem Satz von Beppo Levi fast überall gegen f : I → R konvergiert, eine integrier-
ist das Konvergenzkriterium. Wenn f : I → R über einer bare Funktion g ∈ L(I ) gibt mit |fn (x)| ≤ g(x) für fast
∞ von Teilintervallen I1 ⊆ I2 ⊆ · · ·⊆
Folge I ⊆ R mit I = alle x ∈ I und alle n ∈ N, dann ist f ∈ L(I ) integrierbar,
I
j =1 j integrierbar ist und die Folge Ij |f (x)| dx j ∈N und es gilt:
beschränkt bleibt, so ist f auf I integrierbar mit J J
J J lim fn (x) dx = f (x) dx .
n→∞ I I
f (x) dx = lim f (x) dx .
I j →∞ Ij
Es handelt sich um eine Aussage von weitreichender Be-
Viele weitere Aussagen stützen sich auf den Satz von B. Levi. deutung, etwa wenn eine Funktion wie die Gammafunktion
Die Vielschichtigkeit lässt sich erahnen, wenn man sich ver- mithilfe einer Integraldarstellung beschrieben wird.
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
J J (n + 1) = n!
π 1 ex
I1 = t 2 sin(2t) d t, I2 = dx , √
0 0 (1 + ex )2 (c) Berechnen Sie den Wert ( 21 ) = π.
J J
1 √
2
2 1 (d) Zeigen Sie ∈ C(R>0 ).
I3 = r 1 − r dr , I4 = arctan((ln(x))3 ) dx .
0 1
2
x
16.13 •• Berechnen Sie das Parameterintegral
16.16 • Zeigen Sie in einer Umgebung um einen Ent- für alle n ∈ N durch c > 0 beschränkt sind, so ist f inte-
wicklungspunkt x0 die Integraldarstellung grierbar.
!
n
f (n) (x0 ) (b) Belegen Sie den wesentlichen Unterschied zum Lebesgue’
rn (x, x0 ) = f (x) − (x − x0 )k schen Konvergenzsatz, indem Sie die Funktionenfolge (fn )
k!
J
k=0 mit fn : [0, 1] → R und
1 x
= (x − t)n f (n+1) (t) dt *
n! n, x ∈ 0, n1 ,
x0 fn (x) =
0, x ∈ [1/n, 1]
des Restglieds zur Taylorentwicklung einer (n+1)-mal stetig
differenzierbaren Funktion f . untersuchen.
16.17 ••• Zeigen Sie, dass zu Polynomen p, q mit reellen 16.20 ••• Zeigen Sie folgende Verallgemeinerung der
Koeffizienten und deg(p) < deg(q) durch Partialbruchzer- Substitutionsregel: Sind f ∈ L(α, β) und u ∈ C([a, b])
legung auf (a, b) monotone, stetig differenzierbare Funktionen mit
m μj
p(x) ! ! aj k u(a) = α und u(b) = β, dann ist f (u(.))u (.) integrierbar
=
q(x) (x − zj )k auf (a, b), und es gilt:
j =1 k=1
J J
stets eine reelle Stammfunktion zu p/q : I → R auf offe- b u(b)
nen Intervallen I ⊆ R, die keine Nullstelle von q enthalten, f (u(x)) u (x) dx = f (u) du.
a u(a)
angegeben werden kann.
16.18 •• Zeigen Sie: Ist f ∈ C([a, b]) und g ∈ L(a, b) 16.21 •• (a) Zeigen Sie: Ist f Regelfunktion auf [a, b],
dann gibt es in Verallgemeinerung des Mittelwertsatzes ein so gilt )J )
) b )
z ∈ [a, b] mit ) )
J b J b ) f (x) dx ) ≤ f ∞ |b − a|,
) a )
f (x)g(x) dx = f (z) g(x) dx .
a a wobei nur vom Integralbegriff für Regelfunktionen auszuge-
hen ist.
16.19 •• (a) Beweisen Sie das Lemma von Fatou:
(b) Begründen Sie: Zu zwei Regelfunktionen f und g ist auch
Ist (fn ) eine Folge nicht negativer, integrierbarer Funktionen,
das Produkt f g eine Regelfunktion.
die fast überall punktweise gegen eine Funktion f : (a, b) →
R konvergiert und deren Integrale (c) Finden Sie ein Gegenbeispiel, um zu belegen, dass
J b die Aussage aus Teil (b) im Allgemeinen für lebesgue-
fn (x) dx ≤ c integrierbare Funktionen nicht gilt.
a
mit dem Lemma auf Seite 609. Zusammen mit der Linearität S. 620
des Integrals folgt: Mit der Substitution f = f (x) und der Ableitung des Loga-
J J rithmus folgt:
b b
f (x) dx ≤ g(x) dx. J J
a a f (x) 1
dx = df = ln |f | + c = ln |f (x)| + c
f (x) f
S. 614 nach Rücksubstitution in den Fällen f (x) > 0 für x ∈ [a, b]
Betrachten wir die Treppenfunktion f : [0, 1] → R mit oder f (x) < 0 für x ∈ [a, b]. Falls f Nullstellen auf [a, b]
besitzt, können wir nur entsprechend gewählte Teilintervalle
0 für x ∈ [0, 1/2),
f (x) = betrachten.
1 für x ∈ [1/2, 1],
S. 617 S. 642
Aus der Tabelle der Stammfunktionen sehen wir sofort: Da der Grenzwert sich linear verhält und für Treppenfunktio-
J 1 J 1 nen die entsprechende Eigenschaft gilt, folgt mit zwei Folgen
)1
I1 = e−x dx = − (−e−x ) dx = − e−x ) 0
von Treppenfunktionen ϕn und ψn , die f bzw. g approximie-
0 0 ren:
)0 1
= e−x )1 = e0 − e−1 = 1 − J b J b
e
λf (x) + μg(x) dx = lim λϕn (x) + μψn (x) dx
a n→∞ a
und J b J b
J 1 = lim λ ϕn (x) dx + lim μ ψn (x) dx
1 n→∞ n→∞
I2 = dx = arctan x|10 J
a
J
a
0 1 + x2 b b
π =λ f (x) dx + μ g(x) dx.
= arctan(1) − arctan(0) = . a a
4
S. 619 S. 645
Partielle Integration führt auf Gilt f (x) ≤ g(x) auf [a, b] so gilt für die Riemann-Summen
J J zu einer Zerlegung Z die Abschätzung
sin x cos x dx = sin2 x − sin x cos xdx ,
∞
! ∞
!
f (zj )(xj − xj −1 ) ≤ g(zj )(xj − xj −1 ) .
und es folgt:
j =1 j =1
J
1 2
sin x cos x dx = sin x + c Sind f und g riemann-integrierbar, so bleibt die Abschätzung
2
im Grenzfall entsprechender Riemann-Folgen erhalten. Das
mit einer Integrationskonstante c ∈ R. Integrieren ist monoton.
Euklidische und unitäre
Vektorräume – 17
orthogonales
Diagonalisieren
Was ist der kürzeste Abstand
eines Vektors zu einem
Untervektorraum ?
Warum sind symmetrische
Matrizen diagonalisierbar ?
Sind die Darstellungsmatrizen
orthogonaler Endomorphismen
orthogonal ?
Wann ist eine Matrix normal ?
Im Kapitel 7 zur analytischen Geometrie haben wir ausführlich Längen von Vektoren und Winkel zwischen
das kanonische Skalarprodukt im (reellen) Anschauungsraum Vektoren sind im R2 bzw. R3 mit dem
behandelt. Wir haben festgestellt, dass zwei Vektoren genau Skalarprodukt bestimmbar
dann orthogonal zueinander sind, wenn ihr Skalarprodukt den
Wert null ergibt.
Für jede natürliche Zahl n und Vektoren
Wir sind auch mit höherdimensionalen reellen und komplexen
Vektorräumen und auch mit Vektorräumen, deren Elemente ⎛ ⎞ ⎛ ⎞
v1 w1
Funktionen oder Polynome sind, vertraut. Es ist daher eine ⎜ .. ⎟ ⎜ .. ⎟
v = ⎝ . ⎠ , w = ⎝ . ⎠ ∈ Rn
naheliegende Frage, ob es auch möglich ist, ein Skalarpro-
dukt zwischen Vektoren solcher Vektorräume zu erklären. Dabei vn wn
sollte aber das vertraute Standardskalarprodukt des Anschau-
ungsraums verallgemeinert werden. Dass dies in vielen Vektor- nannten wir das Produkt
räumen möglich ist, zeigen wir im vorliegenden Kapitel. Dabei
können wir aber nicht mehr mit der Anschauung argumentie- !
n
v · w = v0w = vi wi ∈ R
ren. Wir werden vielmehr die algebraischen Eigenschaften des
i=1
Skalarprodukts im Anschauungsraum nutzen, um ein (allgemei-
nes) Skalarprodukt in reellen bzw. komplexen Vektorräumen zu
das kanonische Skalarprodukt oder auch das Standard-
erklären. Damit gelingt es dann auch von einer Orthogonalität
skalarprodukt von v und w. Dieses ist ein Produkt zwi-
von Funktionen zu sprechen – Funktionen sind per Definition
schen zwei Vektoren des reellen Vektorraums Rn , bei dem
dann orthogonal, wenn ihr Skalarprodukt den Wert null hat.
als Ergebnis eine reelle Zahl entsteht.
Tatsächlich erfordern viele Anwendungen der linearen Algebra,
wie etwa die abstrakte Formulierung der Quantenmechanik,
eine solche Orthogonalitätsrelation für Funktionen. Auch bei Kommentar: Statt v · w schreibt man oft auch -v, w.
der Entwicklung periodischer Funktionen in eine Fourierreihe oder s(v, w). Und anstelle von v · v findet man oft auch
behilft man sich mit der Tatsache, dass das Skalarprodukt die Schreibweise v 2 . Wir werden üblicherweise die Notation
zwischen bestimmten trigonometrischen Funktionen den Wert v · w verwenden, falls es sich um Vektoren v und w des
null hat. Rn oder um nicht näher spezifizierte Vektoren handelt. Sind
v und w aber Funktionen f und g eines Vektorraums von
Wie immer in der Algebra betrachten wir neben einer alge- Funktionen, so bevorzugen wir die Schreibweise -f, g., da
braischen Struktur, in vorliegendem Fall die euklidischen und dies bei Funktionen die übliche Notation ist.
unitären Vektorräume, die strukturerhaltenden Abbildungen. Da
lineare Abbildungen in verschiedener Art und Weise mit Ska-
larprodukten verträglich sein können, unterscheiden wir auch In den Anschauungsräumen, also in den Fällen n = 2 und
verschiedene Arten von linearen Abbildungen. Wir behandeln n = 3, drückt v · w = 0 die Tatsache aus, dass die beiden
ausführlich orthogonale bzw. unitäre, selbstadjungierte und nor- Vektoren v und w senkrecht aufeinanderstehen. Der Wert
male Endomorphismen. Wir können auch entscheiden, welche
√
dieser Endomorphismen diagonalisierbar sind. v = v · v = v12 + v22 bzw.
√
v = v · v = v12 + v22 + v32 ,
17.1 Euklidische Vektorräume
also die Wurzel des Skalarprodukts eines Vektors mit sich
Wir wollen den Begriff des Senkrechtstehens zweier Vekto- selbst, gibt die Länge des Vektors v an. Anstelle von der
ren weitreichend verallgemeinern. Neben den bisher betrach- Länge eines Vektors sprachen wir auch von der Norm eines
teten Vektorräumen Rn und Cn , in denen wir von zueinander Vektors.
orthogonalen Vektoren gesprochen haben, wollen wir eine
solche Relation auch für Elemente abstrakter Vektorräume
√
?
erklären, wie etwa dem Vektorraum aller auf einem kompak- Wieso existiert v · v für jedes v ∈ R2 bzw. R3 ? Anders
ten Intervall stetiger reellwertiger Funktionen. Wir beginnen gefragt: Wieso ist v · v eine nicht negative reelle Zahl?
mit dem reellen Fall.
(das Transponieren ändert eine reelle Zahl nicht) und der f 2 (t) f 2 (t0 ) = 0
Symmetrie der Matrix A, d. h. A0 = A, gilt:
v · w = v 0 A w = w0 A0 v t0
= w0 A v = w · v . a
b t
U (t0 )
Und '
schließlich
( ist das Produkt positiv definit, da für alle
Abbildung 17.1 Der Graph der stetigen Funktion f 2 schließt mit der t-Achse
v1
v= ∈ R2 gilt: einen positiven Flächeninhalt ein.
v2
' (
0 v
v · v = v A v = (2 v1 + v2 , v1 + v2 ) 1 also ist das Produkt auch symmetrisch und somit eine sym-
v2 metrische Bilinearform.
= 2 v12 + 2 v1 v2 + v22 Wir zeigen nun, dass das Produkt positiv definit ist. Für
= v12 + (v1 + v2 )2 ≥ 0 , jedes f ∈ C(I ) gilt:
J b J b
und Gleichheit gilt hierbei genau dann, wenn v1 = 0 = v2 , -f, f . = f (t) f (t) dt = (f (t))2 dt ≥ 0 .
d. h. v = 0 ist. a a
Damit ist also gezeigt, dass · ein euklidisches Skalarpro- Ist f nicht die Nullfunktion, so gibt es ein t0 ∈ [a, b] mit
dukt ist und der R2 mit diesem Skalarprodukt ein euklidi- f (t0 ) = 0. Da f stetig ist, gibt es somit eine Umgebung
scher Vektorraum ist. U (t0 ) ⊆ [a, b], sodass f für alle Argumente aus U (t0 )
Wir erklären ein Produkt - , . im Vektorraum aller auf von null verschiedene Werte annimmt (Abb. 17.1). Da
einem abgeschlossenen Intervall I = [a, b] ⊆ R mit
a < b stetigen reellwertigen Funktionen, also im reellen J J b
2
Vektorraum 0< f (t) dt ≤ f (t)2 dt ,
U (t0 ) a
C(I ) = {f ∈ RI | f ist stetig } .
ist das Integral -f, f . = ab (f (t))2 dt größer als null. Es
Dazu multiplizieren wir zwei Funktionen f und g aus folgt die positive Definitheit:
C(I ) folgendermaßen:
-f, f . = 0 ⇔ f = 0 .
J b
-f, g. = f (t) g(t) dt ∈ R. Somit ist · ein Skalarprodukt.
a
Weil stetige Funktionen nach einem Ergebnis auf Kommentar: Hätten wir anstatt der Stetigkeit nur die
Seite 613 integrierbar sind, ist dieses Produkt auch de- Integrierbarkeit gefordert, so wäre das so definierte Pro-
finiert. dukt kein Skalarprodukt. Eine Funktion f , die außer an
Nun verifizieren wir, dass dieses Produkt einer Stelle t0 zwischen a und b stets den Wert Null an-
nimmt, ist nicht die Nullfunktion, sie ist aber integrierbar,
- , . : C(I ) × C(I ) → R
und es gilt -f, f . = ab (f (t))2 dt = 0 (Abb. 17.2).
ein Skalarprodukt ist.
Aufgrund der Rechenregeln von Seite 611 für das Integral f (t) f (t0 ) = 0
gilt für alle Funktionen f, g, h ∈ C(I ):
b
J b a f dt = 0
-f + g, h. = (f (t) + g(t)) h(t) dt
a
t0
b
a
J b J b t
f (t) = 0 f (t) = 0
= f (t) h(t) dt + g(t) h(t) dt
a a
Abbildung 17.2 Das Integral einer Funktion, die nur auf einer Nullmenge von
= -f, h. + -g, h. . null verschiedene Werte annimmt, ist null.
Damit dieses Produkt ein Skalarprodukt ist, fehlt noch die Weitere Beispiele werden auf Seite 660 diskutiert.
Eigenschaft v · v > 0, also v 0 A v > 0, für alle vom Null-
vektor verschiedenen Vektoren v des Rn . Jede positiv definite Matrix liefert ein euklidisches Skalar-
produkt, das besagt der folgende Satz.
Nicht jede symmetrische Matrix erfüllt diese positive '
Definit-
(
1 1
heit. Man betrachte etwa die symmetrische Matrix , Positiv definite Matrizen definieren Skalarprodukte
1 1
für die gilt: Jede positiv definite Matrix A ∈ Rn×n definiert durch
' (' (
(1, −1)
1 1 1
= 0, v · w = v0 A w
1 1 −1
' ( ein euklidisches Skalarprodukt. Mit diesem Skalarpro-
1 dukt · ist der Rn ein euklidischer Vektorraum.
obwohl = 0 gilt.
−1
Definitheit symmetrischer Matrizen Man erhält bei diesem Skalarprodukt mit der Wahl A = En
Wir nennen eine reelle symmetrische n × n-Matrix A das kanonische Skalarprodukt zurück – die Einheitsmatrix
positiv definit, wenn für alle v ∈ Rn \ {0} gilt: En ist positiv definit.
v0A v > 0 ,
Die Darstellungsmatrix einer Bilinearform
negativ definit, wenn für alle v ∈ Rn \ {0} gilt: erhält man komponentenweise
v0A v < 0 , Ist ϕ ein Endomorphismus eines n-dimensionalen K-
Vektorraums V , so können wir diesen durch eine Matrix aus
positiv semidefinit, wenn für alle v ∈ Rn \ {0} gilt:
Kn×n darstellen. Diese Darstellungsmatrix B M(ϕ)B von ϕ
v 0 A v ≥ 0, bezüglich einer gewählten Basis B von V erhält man spal-
tenweise: In der i-ten Spalte steht der Koordinatenvektor des
660 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Problemanalyse und Strategie: Wir bestimmen für jede der angegebenen Matrizen M ∈ Rn×n und jeden Vektor
v ∈ Rn die Zahl v 0 M v ∈ R und stellen Überlegungen über das Vorzeichen an.
Die Symmetrie und schließlich die positive Definitheit von zueinander ähnlich, d. h., es gibt eine invertierbare Matrix
M B folgt hieraus mit der Symmetrie und der positiven Defi- S ∈ Kn×n mit
nitheit des Skalarprodukts.
= S −1 B M(ϕ)B S .
C M(ϕ)C
Wir können aus obigem Ergebnis eine Folgerung ziehen, die Darstellungsmatrizen bezüglich verschiedener Basen
die Ähnlichkeit der Darstellungen von Endomorphismen und Ist V ein n-dimensionaler euklidischer Vektorraum mit
Skalarprodukten weiter unterstreicht. dem euklidischen Skalarprodukt · und den Basen B =
(b1 , . . . , bn ) und C = (c1 , . . . , cn ), so gilt mit der
Folgerung Matrix S = B M(id)C die Gleichung:
Für jede Basis B eines n-dimensionalen Vektorraums
V ist die Abbildung M C = S0M B S .
ψB : s → M B (s)
eine Bijektion von der Menge aller euklidischer Skalarpro- Beweis: Die i-te Spalte der Matrix S = (sij ) ist der
dukte auf V in die Menge aller positiv definiten n × n- Koordinatenvektor von ci bezüglich der Basis B, d. h.,
Matrizen. ci = nk=1 ski bk .
An der Stelle (i, j ) der Matrix M C steht der Eintrag
Beweis: Nach dem obigen Satz zur Darstellungsmatrix n n
! ! ! n
eines euklidischen Skalarprodukts ist ψB eine Abbildung ci ·cj = ski bk · slj bl = ski slj (bk · bl ) ,
von der Menge aller euklidischer Skalarprodukte auf V in k=1 l=1 k,l=1
die Menge aller positiv definiten n × n-Matrizen. Diese Ab-
und dies ist der Eintrag in der Matrix S 0 M B S an der Stelle
bildung ist injektiv, da aus M B (s) = M B (s ) für zwei eu-
(i, j ).
klidische Skalarprodukte s und s erneut nach obigem Satz
Dies ausführlich zu begründen haben wir als Übungsaufgabe Skalarprodukt das kanonische ist. Mit dem Begriff der Norm
gestellt. werden wir dann Abstände zwischen Vektoren und Winkel
zwischen Vektoren erklären und so letztlich zu dem Begriff
Nach dem Satz auf Seite 55 zerlegt jede Äquivalenzrelation
der Orthogonalität kommen.
ihre Grundmenge in ihre nichtleeren Äquivalenzklassen. Die
Äquivalenzklassen bezüglich der Äquivalenzrelationen Ähn-
ä k
lichkeit ∼ und Kongruenz ∼ sind jedoch im Allgemeinen Vektoren in euklidischen Vektorräumen
sehr verschieden, es können nämlich alle möglichen Fälle haben eine Norm
auftreten: ' (
v1
Zueinander kongruente Matrizen können zueinander ähn- Wir haben für einen Vektor v = der Anschauungs-
v2
lich sein:
' ( ' ( ' ( ' ( ebene R2 gezeigt, dass der Ausdruck
1 0 k 1 0 1 0 ä 1 0 √
∼ und ∼ .
0 2 0 2 0 2 0 2 v = v · v = v12 + v22
Zueinander nicht kongruente Matrizen können zueinander die Länge der Strecke vom Ursprung zum Punkt v angibt. In
ähnlich sein: der Sprechweise des Kapitels 7 ist dies die Norm des Vek-
' ( ' ( ' ( ' ( tors v.
1 0 k
∼
0 1
und
1 0 ä
∼
0 1
. √
0 2 −2 3 0 2 −2 3 Der Ausdruck v · v existiert aber für jedes euklidische Ska-
larprodukt ·. Dies liegt an der positiven Definitheit, die sicher-
Zueinander nicht ähnliche Matrizen können zueinander stellt, dass man diese Wurzel bilden kann.
kongruent sein: √
Wir werden die Größe v · v die Norm des Vektors v nennen
' ( ' ( ' ( ' ( und sie wieder mit v bezeichnen.
1 0 ä 4 0 1 0 k 4 0
∼ und ∼ .
0 2 0 8 0 2 0 8
Die Norm von Vektoren
Zueinander nicht ähnliche Matrizen können zueinander
Ist v ein Element eines euklidischen Vektorraums mit
nicht kongruent sein:
dem euklidischen Skalarprodukt ·, so nennt man die po-
' ( ' ( ' ( ' ( sitive reelle Zahl
1 0 ä 0 0 1 0 k 0 0
∼ und ∼ .
0 2 0 0 0 2 0 0 √
v = v·v
? die Norm bzw. Länge des Vektors v.
Begründen Sie diese Behauptungen.
Beispiel Wir können also etwa exp für die auf dem In-
tervall [0, 1] stetige reelle Funktion exp bezüglich des Ska-
larprodukts -f, g. = 01 f (t) g(t) dt auf dem reellen Vek-
torraum C der auf dem Intervall [0, 1] stetigen Funktionen
bilden:
1 .
% J 1
1 2
exp = -exp, exp. = e2t dt = (e − 1) .
0 2
Damit hat die Funktion
% exp in diesem euklidischen Vektor-
raum die Norm √1 (e2 − 1).
2
Abbildung 17.3 Die Äquivalenzrelationen Kongruenz und Ähnlichkeit zerlegen Hätten wir für das Skalarprodukt etwa das Intervall%[0, 2] ge-
den Kn×n im Allgemeinen in verschiedene Äquivalenzklassen.
wählt, so hätte exp eine andere Norm, nämlich √1 (e4 − 1).
2
Dieser Begriff der Norm hängt vom erklärten Skalarprodukt
ab.
17.2 Norm, Abstand, Winkel,
Orthogonalität ?
Welche Norm hat die Polynomfunktion p : R → R, p(t) = t 2
bezüglich des euklidischen Skalarprodukts
In euklidischen Vektorräumen, also in reellen Vektorräumen
J 1
mit einem euklidischen Skalarprodukt, ist es möglich, Vekto-
-f, g. = f (t) g(t) dt ?
ren eine Norm zuzuordnen. Diese Norm entspricht dabei dem 0
anschaulichen Begriff der Länge im R2 bzw. R3 , wenn das
17.2 Norm, Abstand, Winkel, Orthogonalität 663
Die Cauchy-Schwarz’sche Ungleichung besagt, Ist andererseits vorausgesetzt, dass v und w linear abhängig
dass der Betrag des Skalarprodukts zweier sind, so existiert ein ν ∈ R mit v = ν w. Wir erhalten
Vektoren kleiner ist als das Produkt der
|v · w| = |u| w w = ν w w = v w .
Normen beider Vektoren
Damit ist alles begründet.
Für alle λ, μ ∈ R gilt die Ungleichung: von V in die Menge der nicht negativen reellen Zah-
len eine Norm, wenn die folgenden drei Eigenschaften
0 ≤ (λ v + μ w) · (λ v + μ w) . erfüllt sind:
(N1) N(v) = 0 ⇔ v = 0,
Wir wählen nun λ = w · w (> 0) und μ = −v · w und (N2) N(λ v) = |λ| N(v) für alle λ ∈ K.
erhalten so: (N3) N(v + w) ≤ N(v) + N(w) für alle v, w ∈ V
(Dreiecksungleichung).
0 ≤ (λ v + μ w) · (λ v + μ w) Einen K-Vektorraum V mit einer Norm N nennt man
= λ λ (v · v) + λ μ (v · w) + μ λ (w · v) + μ μ (w · w) auch normierten Raum.
= λ (λ (v · v) + μ (v · w) + μ (w · v) + μ μ)
= λ ((w · w) (v · v) − μ μ − μ μ + μ μ) Beispiel Wir betrachten die folgenden Abbildungen N1 ,
N2 und N∞ von V = Kn in R≥0 , die gegeben sind durch
= λ (w2 v2 − (v · w) (v · w)) .
n
N1 ((vi )i ) = |vi | ,
Wir können die positive Zahl λ in dieser Ungleichung kürzen i=1
und erhalten 1
n
(v · w)2 ≤ w2 v2 . N2 ((vi )i ) = |vi |2 ,
i=1
Da die Wurzelfunktion monoton wächst, folgt die Cauchy- N∞ ((vi )i ) = max{|vi | | i = 1, . . . , n} .
Schwarz’sche Ungleichung
Die Behauptung ist, dass die Abbildungen N1 , N2 , N∞ :
|v · w| ≤ v w . V → R≥0 Normen sind.
(N1) und (N2) sind offenbar für jede der Abbildungen
Weiterhin folgt aus der Gleichheit
N1 , N2 , N∞ erfüllt.
|v · w| = v w (N3) besagt für
mit obiger Wahl für λ und μ sogleich N1 : Für alle v = (vi ), w = (wi ) ∈ Kn gilt:
!
n !
n !
n
(λ v + μ w) · (λ v + μ w) = 0 , |vi + wi | ≤ |vi | + |wi | ,
i=1 i=1 i=1
wegen der positiven Definitheit des Skalarprodukts also
λ v + μ w = 0. Weil λ = 0 gilt, bedeutet dies, dass v und w was bekanntlich nach der Dreiecksungleichung in K er-
linear abhängig sind. füllt ist.
664 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Problemanalyse und Strategie: Die Vektoren v ∈ R2 der Länge 1 lassen sich wegen
√
v·v =1 ⇔ v·v =1
durch die Gleichung v · v = 1 beschreiben. Die Lösungsmenge dieser Gleichung sind die gesuchten Vektoren, sie lässt
sich grafisch darstellen.
Lösung:
(1) Im Fall A = E2 ist das gegebene euklidische Skalar-
' ( das kanonische Skalarprodukt. Der Vektor v =
produkt
(0, 1)
v1
∈ R2 hat die Länge
v2
v = v12 + v22 .
4 v12 + v22 = 1 .
v12 + (v1 + v2 )2 = 1 .
Die Punkte v, deren Komponenten diese Gleichung erfül-
len, bilden im R2 die folgende Menge:
17.2 Norm, Abstand, Winkel, Orthogonalität 665
Diese Ungleichung heißt Minkowski-Ungleichung, die eine Norm auf V . Man nennt · die von · auf V indu-
Gültigkeit dieser Ungleichung nachzuweisen haben wir zierte Norm.
als Übungsaufgabe 17.16 gestellt.
N∞ : Für alle v = (vi ), w = (wi ) ∈ Kn gilt:
Beweis: Wegen v = 0 ⇔ v = 0 und λ v = |λ| v
max {|vi + wi |} ≤ max {|vi |} + max {|wi |} , für alle λ ∈ R und v ∈ V ist nur die Dreiecksungleichung
i=1, ..., n i=1, ..., n i=1, ..., n zu begründen. Es seien dazu v, w ∈ V . Dann gilt wegen der
Cauchy-Schwarz’schen Ungleichung:
was offensichtlich korrekt ist.
v + w2 = (v + w) · (v + w)
In Abbildung 17.4 zeigen wir für den Fall K = R und n = 2 = v2 + w2 + 2 v · w
die Menge aller Vektoren, deren Norm 1 ist.
≤ v2 + w2 + 2 |v · w|
≤ v2 + w2 + 2 v w
1 1 1
= (v + w)2 .
Da die Wurzelfunktion auf R≥0 monoton wachsend ist, folgt
−1 1 −1 1 −1 1 v + w ≤ v + w.
den Abstand oder die Distanz von v und w. Abbildung 17.5 Zwischen zwei Vektoren existieren zwei Winkel.
Im R2 oder R3 mit dem kanonischen Skalarprodukt entspricht Für den kleineren Winkel α zwischen den beiden Vektoren v
dies genau dem anschaulichen Abstand zweier Punkte von- und w haben wir auf Seite 235 die Formel
einander. v·w
α = arccos
Wir ermitteln einige Abstände zwischen Vektoren euklidi- v w
scher Vektorräume. hergeleitet.
Nun gehen wir umgekehrt vor: Wir nutzen die Cauchy-
Beispiel
Schwarz’sche Ungleichung aus, um Winkel zwischen Vek-
Im euklidischen R2 mit dem kanonischen Skalarprodukt
toren eines allgemeinen euklidischen Vektorraums, die nicht
ist der Abstand von e1 zu e2
der Nullvektor sind, zu definieren. Dabei gehen wir so vor,
K' (K
K 1 K √ dass diese Definition sich mit der intuitiven Begriffsbildung
e1 − e2 = K K
K −1 K = 1 + (−1) = 2 .
2 2
im Anschauungsraum aus dem Kapitel 7 deckt.
Dazu schreiben wir die Cauchy-Schwarz’sche Ungleichung
' ( das durch v · w =
Aber bezüglich des Skalarprodukts,
für zwei vom Nullvektor verschiedene Vektoren v, w eines
2 1
v0 Aw mit der Matrix A = definiert ist, erhalten euklidischen Vektorraums mit dem euklidischen Skalarpro-
1 1
dukt · um:
wir v·w
−1 ≤ ≤ 1.
K' (K 1 ' ( v w
K 1 K 1
K
e1 − e2 = K K = (1, −1) A Zu jeder reellen Zahl zwischen −1 und 1 gibt es genau ein
−1 K −1
1 α ∈ [0, π ] mit
' ( v·w
1 cos α =
= (1, 0) = 1. v w
−1
(Abb. 17.6).
Die Polynomfunktion p : R → R, p(x) = x hat von der
cos α
Sinusfunktion sin : R → R bezüglich des euklidischen
1
Skalarprodukts
J π
-f, g. = f (t) g(t) dt π π α
−π 2
den Abstand −1
1J
π Abbildung 17.6 Der Kosinus bildet das Intervall [0, π ] bijektiv auf das Intervall
p − sin = t 2 − 2 t sin t + sin2 (t) dt [−1, 1] ab.
−π
.
2 3
= π +π. Der Winkel zwischen Vektoren
3
Sind v und w zwei vom Nullvektor verschiedene Vek-
toren eines euklidischen Vektorraums V mit dem eukli-
Winkel zwischen Vektoren eines euklidischen dischen Skalarprodukt ·, so nennt man das eindeutig be-
Vektorraums werden mithilfe des Skalar- stimmte α ∈ [0, π ] mit
produkts erklärt v·w
cos α =
v w
In der Anschauungsebene R2 haben wir Winkel zwischen
Vektoren durch das kanonische Skalarprodukt ausgedrückt. den Winkel zwischen v und w und schreibt hierfür auch
Zwischen zwei vom Nullvektor verschiedenen Vektoren v
α = (v, w) .
und w existieren stets zwei Winkel.
17.2 Norm, Abstand, Winkel, Orthogonalität 667
da ' (' (
2 1 0
(−1, 1) =0
1 1 1
α (Abb. 17.8).
v
x2
Abbildung 17.7 Die Einschränkung auf [0, π] entspricht der Wahl des kleine- ' (
−1 ' (
ren Winkels α der beiden Winkel zwischen zwei Vektoren. 0
1 1
Beispiel
Im euklidischen R2 mit dem kanonischen Skalarprodukt
schließen die beiden Vektoren e1 und e1 + e2 den Winkel
1
(e 1 , e1 + e2 ) = arccos √ = π/4 x1
2
ein. Abbildung 17.8 Bezüglich des durch die Matrix A definierten Skalarprodukts
In dem euklidischen Vektorraum aller auf dem abge- stehen die beiden Vektoren senkrecht aufeinander, wenngleich die Anschauung
anderes vermittelt.
schlossenen Intervall [0, 1] stetigen reellen Funktionen
mit dem euklidischen Skalarprodukt In dem euklidischen Vektorraum aller auf dem abge-
J 1
schlossenen Intervall [0, 1] stetigen reellen Funktionen
-f, g. = f (t) g(t) dt
0 mit dem euklidischen Skalarprodukt
schließen die Polynomfunktion p mit p(x) = x und J 1
1
die Funktion exp wegen -p, exp. = 0 t exp t dt = 1, -f, g. = f (t) g(t) dt
% √ 0
exp = √1 e2 − 1 und p = 1/ 3 den Winkel
2
steht die Polynomfunktion q mit q(x) = 2 − 3 x auf dem
1
(p, exp) = arccos % = 1.409 . . . Polynom p mit p(x) = x senkrecht, da
6 (e2 − 1) J 1
ein.
-2 − 3 x, x. = 2t − 3t 2 dt = 0 .
0
Zwei Vektoren sind orthogonal zueinander, Die sogenannten Legendre’schen Polynome p n mit
wenn ihr Skalarprodukt null ergibt 1 dn 2
pn (x) = (x − 1)n
2n n! dx n
In Abschnitt 7.2 haben wir gezeigt, dass zwei Vektoren v
und w des R3 genau dann orthogonal zueinander sind, wenn sind auf ganz R für n = 0, 1, . . . Lösungen der Le-
ihr kanonisches Skalarprodukt v 0 w = 0 ist. Wir haben dabei gendre’schen Differenzialgleichung
mit der Anschauung argumentiert. Nun abstrahieren wir dies,
(1 − x 2 ) y − 2 x y + n (n + 1) y = 0 .
indem wir das Senkrechtstehen für Vektoren eines euklidi-
schen Raums, also für beliebige euklidische Skalarprodukte, Die ersten Legendrepolynome lauten
definieren.
p0 (x) = 1,
Orthogonalität von Vektoren p1 (x) = x ,
Sind v und w Elemente eines euklidischen Vektorraums 1 3
V mit dem euklidischen Skalarprodukt ·, so sagt man, v p2 (x) = − + x 2 ,
2 2
ist orthogonal zu w oder steht senkrecht auf w, wenn 3 5
p3 (x) = − + x 3 .
v·w =0 2 2
gilt. Für diesen Sachverhalt schreibt man auch Wir zeigen nun, dass die Legendrepolynome bezüglich
v ⊥ w. des Skalarprodukts
Sind v und w vom Nullvektor verschieden, so gilt: J 1
v ⊥ w ⇔ (v, w) = π/2 . -p, q. = p(t) q(t) dt
−1
668 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
orthogonal zueinander sind. Dazu notieren wir die Le- Die Anschauung vermittelt, dass Vektoren, die orthogonal
gendre’sche Differenzialgleichung etwas anders: zueinander sind, linear unabhängig sind. Dies ist tatsäch-
lich für jedes beliebige Skalarprodukt der Fall. Sind nämlich
d d
D y = n (n + 1) y mit D = − (1 − x 2 ) . v 1 , . . . , v r vom Nullvektor verschiedene Vektoren eines eu-
dx dx klidischen Vektorraums V orthogonal zueinander, gilt also
Man beachte:
' ( v i · v j = 0 für i = j ,
d d
D y = − (1 − x 2 ) y
dx dx
d so folgt für λ1 , . . . , λr ∈ R mit
= − (y − x 2 y ) = −y + 2 x y + x 2 y ,
dx
λ 1 v 1 + · · · + λr v r = 0
d. h., dass also tatsächlich D y = n (n + 1) y nur eine
andere Schreibweise für die Legendre’sche Differenzial-
gleichung ist. durch Skalarproduktbildung beider Seiten von rechts nach-
einander mit v 1 , . . . , v r und der Linearität im ersten Argu-
Kommentar: Tatsächlich ist D nichts anderes als ein ment:
Endomorphismus des Vektorraums aller Polynomfunk-
tionen. Man nennt einen solchen Endomorphismus eines λ1 = λ1 (v 1 · v 1 ) + · · · + λr (v r · v 1 ) = 0 · v = 0,
Funktionenraums auch linearen Operator und benutzt λ2 = λ1 (v 1 · v 2 ) + · · · + λr (v r · v 2 ) = 0 · v = 0,
die angegebene Schreibweise D y anstelle von D(y).
..
.
In der Form D y = n (n+1)y lässt sich die Legendre’sche
λr = λ1 (v 1 · v r ) + · · · + λr (v r · v r ) = 0 · v = 0 .
Differenzialgleichung auch als Eigenwertgleichung inter-
pretieren: Die Lösung y ist ein Eigenvektor zum Eigenwert
n (n + 1) der (linearen) Abbildung D. Damit gilt λ1 = · · · = λr = 0, d. h., v 1 , . . . , v r sind linear
Nun folgt mit partieller Integration für m, n ∈ N0 : unabhängig.
J 1
-p n , D pm . = pn (t) D pm (t) dt Orthogonale Vektoren sind linear unabhängig
−1
= −(1 − t 2
) (p n (t) p m (t) − p n (t) p m (t))|1−1 Jede Menge von Vektoren = 0 eines euklidischen Vek-
J 1 torraums, die paarweise orthogonal zueinander sind, ist
+ D pn (t) pm (t) dt linear unabhängig.
−1
= -D p n , p m . ,
Eine naheliegende Fragestellung ist nun folgende: Gibt es
also schließlich: in euklidischen Vektorräumen stets Orthonormalbasen? Der
folgende Abschnitt behandelt diese Frage.
-pn , D p m . = m (m + 1) -pn , pm .
-D p n , p m . = n (n + 1) -p n , p m . .
Abbildung 17.9 Normieren eines Vektors; seine Richtung bleibt dabei gleich. Etwas allgemeiner kann man zeigen, dass die Menge B
der Funktionen
Wegen
K K 1
K 1 K 1 √ , cos(n t), sin(n t) , n ∈ N
K K
K v v K = v v = 1 2
hat der normierte Vektor die Norm 1. bezüglich dieses Skalarprodukts ein Orthonormalsystem
bildet.
Damit kann man also aus einer Orthogonalbasis eines eukli- Wie weit diese Menge B davon entfernt ist, eine Ortho-
dischen Vektorraums auf einfache Weise eine Orthonormal- normalbasis von V zu sein, ist Thema der Fouriertheorie
basis konstruieren. (siehe Kapitel 19).
670 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Jeder endlichdimensionale euklidische Damit erhalten wir den Koordinatenvektor von v bezüg-
Vektorraum besitzt eine Orthonormalbasis lich B: ' (
1 5
Bv = √ .
Die Orthogonalität von Vektoren erleichtert vieles. Orthogo- 2 1
nale Vektoren sind linear unabhängig, und auch die Darstel-
lung von Vektoren bezüglich Orthonormalbasen ist leicht. Jeder Vektorraum besitzt eine Basis. Dieses tief liegende und
wichtige Ergebnis haben wir auf Seite 207 aufgeführt. Eu-
Koordinatenvektoren bezüglich Orthonormalbasen klidische Vektorräume sind spezielle Vektorräume. Nur in
solchen Vektorräumen hat es einen Sinn, von Orthogonali-
Ist B eine Orthonormalbasis eines euklidischen Vektor-
tät oder spezieller von Orthonormalbasen zu sprechen. Es
raums V mit dem euklidischen Skalarprodukt ·, so gilt
ist naheliegend zu hinterfragen, ob jeder euklidische Vektor-
für jeden Vektor v ∈ V :
raum eine Orthonormalbasis besitzt. Hierbei bezieht sich die
v = λ1 b1 + · · · + λr br Orthogonalität und das Normiertsein natürlich auf das eukli-
dische Skalarprodukt des betrachteten euklidischen Vektor-
mit Vektoren b1 , . . . , br ∈ B und λi = v · bi ∈ R für raums V .
i = 1, . . . , r.
Tatsächlich besitzt nicht jeder euklidische Vektorraum eine
Orthonormalbasis. Aber viele wichtige euklidische Vektor-
Beweis: Dass eine Darstellung der Art v = λ1 b1 + · · · + räume haben eine solche Basis.
λr br mit b1 , . . . , br ∈ B und λ1 , . . . , λr ∈ R existiert,
Mit dem Gram-Schmidt’schen Orthonormalisierungsverfah-
folgt aus der Tatsache, dass B eine Basis ist. Die Koeffizien-
ren kann man aus einer gegebenen Basis eines endlichdimen-
ten λ1 , . . . , λr sind dadurch auch eindeutig festgelegt. Und
sionalen euklidischen Vektorraums eine Orthonormalbasis
weiter gilt für alle i = 1, . . . , r:
konstruieren.
v · bi = (λ1 b1 + · · · + λr br ) · bi
Die Geometrie des Verfahrens von Gram und Schmidt haben
= λ1 (b1 · bi ) + · · · + λr (br · bi ) wir für zwei Vektoren in der Abbildung 17.10 dargestellt. Im
= λi (bi · bi ) = λi . Folgenden erläutern wir das Verfahren allgemein.
a2 a2 c2 a2
a1 (a 2 · b1 )b1 b2
b1 b1 b1
Abbildung 17.10 Mit dem Verfahren von Gram und Schmidt entsteht aus der Basis {a 1 , a 2 } die Orthonormalbasis {b1 , b 2 }.
17.3 Orthonormalbasen und orthogonale Komplemente 671
Beweis: Wir zeigen die Behauptung, indem wir per In- a 1 , . . . , a n linear unabhängig sind. Da stellt sich die Frage,
duktion nach k beweisen: ob es nun wirklich nötig ist, dass man erst die lineare Un-
abhängigkeit der gegebenen Vektoren nachprüfen muss. Tat-
{b1 , . . . , bk } ist ein Orthonormalsystem,
sächlich ist das nicht der Fall. Sind nämlich die Vektoren
-a 1 , . . . , a k . = -b1 , . . . , bk ..
a 1 , . . . , a n linear abhängig, etwa a k+1 ∈ -a 1 , . . . , a k ., so
Induktionsanfang: Offenbar gelten die Behauptungen im Fall entsteht beim Orthonormierungsverfahren als ck+1 der Null-
k = 1. vektor (dieser steht nämlich auf allen vorher konstruierten
Vektoren des Orthonormalsystems senkrecht). Man variiert
Induktionsvoraussetzung: Die Behauptungen gelten für ein
das Verfahren dann einfach dadurch, dass man diesen Vektor
k ∈ {1, . . . , n}.
im Orthonormalsystem weglässt.
Induktionsschritt: Es sei k ≥ 1. Wir betrachten das Element
ck+1 = a k+1 − ki=1 (bi · a k+1 ) bi . Wegen der Bilinearität Eine unmittelbare Folgerung aus dem Verfahren von Gram
von · gilt für alle l < k + 1 nach Induktionsvoraussetzung: und Schmidt und der Tatsache, dass jeder Vektorraum eine
Basis besitzt, ist das folgende Ergebnis.
!
k
bl · ck+1 = bl · a k+1 − (bi · a k+1 ) (bl · bi )
i=1 Existenz von Orthonormalbasen
=δli
Jeder höchstens abzählbardimensionale euklidische
= bl · a k+1 − bl · a k+1 = 0 .
Vektorraum besitzt eine Orthonormalbasis.
Somit gilt ck+1 ⊥ bl , wobei wir noch nicht wissen, ob ck+1
der Nullvektor ist. Wegen Wir wenden nun die erzielten Ergebnisse an, um minimale
Abstände von Vektoren zu Untervektorräumen zu erklären.
!
k Dazu führen wir zuerst den Begriff des orthogonalen Kom-
a k+1 = ck+1 + (bi · a k+1 ) bi plements eines Untervektorraums ein.
i=1
Aus dieser Gleichheit können wir aufgrund der linearen Un- Gegeben ist ein euklidischer Vektorraum V . Das Skalarpro-
abhängigkeit von a 1 , . . . , a n schließen, dass ck+1 = 0 gilt. dukt bezeichnen wir wieder mit einem Punkt · .
Mit bk+1 = ck+1 −1 ck+1 erhalten wir nun die Behauptun-
Für den Sachverhalt, dass das Skalarprodukt zweier Vektoren
gen.
v, w ∈ V null ist, v·w = 0, haben wir auch „v steht senkrecht
auf w“ gesagt und mit v ⊥ w abgekürzt. Sind A und B
Explizit lauten die Formeln für die ersten drei Vektoren Teilmengen von V , so ist die Schreibweise A ⊥ B üblich für
b1 , b2 , b3 der so konstruierten Orthonormalbasis: die Tatsache, dass jedes a ∈ A auf jedem b ∈ B senkrecht
steht:
b1 = a 1 −1 a 1 ,
A ⊥ B ⇔ a ⊥ b ∀a ∈ A, b ∈ B .
b2 = c2 −1 c2 mit c2 = a 2 − (a 2 · b1 ) b1 ,
b3 = c3 −1 c3 mit c3 = a 3 − (a 3 · b1 ) b1 − (a 3 · b2 ) b2 . Ist A eine einelementige Menge A = {a}, so schreibt man
Als Beispiel bilden wir das Skalarprodukt von c3 mit b2 : a ⊥ B anstelle von {a} ⊥ B .
Beispiel: Orthonormalisierung einer Basis nach dem Verfahren von Gram und Schmidt
Wir bestimmen eine Orthonormalbasis bezüglich des Standardskalarprodukts von
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
? 3 −1 −1 @
⎜−1⎟ ⎜ 3 ⎟ ⎜−1⎟
U= ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝−1⎠ , ⎝−1⎠ , ⎝ 3 ⎠ ⊆ R .
4
−1 −1 −1
Problemanalyse und Strategie: Wir nennen die Vektoren der Reihe nach a 1 , a 2 , a 3 und wenden die Formeln an.
A = QR.
Problemanalyse und Strategie: Mit dem Orthonormalisierungsverfahren von Gram und Schmidt bilden wir aus den
linear unabhängigen Spalten von A eine Orthonormalbasis B des Rn und bestimmen die Darstellungen der Spalten von
A bezüglich dieser Basis B. Das liefert eine Gleichheit der Form A = Q R mit n × n -Matrizen der gesuchten Form.
Achtung: Die Voraussetzung dim V ∈ N in (c) ist not- euklidischen Vektorraums V , so lässt sich jedes v ∈ V
wendig, es gibt nämlich Beispiele unendlichdimensionaler eindeutig in der Form
euklidischer Vektorräume V mit einem Untervektorraum U
und U + U ⊥ V , beachte das folgende Beispiel. In die- v = u + u
sem Fall ist das orthogonale Komplement U also kein zu U
komplementärer Untervektorraum – ein orthogonales Kom- mit u ∈ U und u ∈ U ⊥ schreiben. Und im Fall dim V =
plement ist also nicht notwendig ein Komplement. n ∈ N gilt:
dim U ⊥ = dim V − dim U .
Beispiel Es sei V der R-Vektorraum aller stückweise ste-
tigen, beschränkten Funktionen auf dem abgeschlossenen In-
tervall [0, 1], die an der Stelle 0 stetig sind und an den jewei-
ligen rechten Ränder linksstetig sind (Abb. 17.11).
?
Zeigen Sie die Eindeutigkeit der Darstellung v = u + u mit
u ∈ U und u ∈ U ⊥ direkt.
y
V = U1 ⊕ · · · ⊕ Ur mit Ui ⊥ Uj für i = j ,
x2
v Die Abbildung 17.14 illustriert diesen minimalen Abstand
im R3 mit dem kanonischen Skalarprodukt.
u = v − u U
u U⊥
b2 v
u
b1 x1
Abbildung 17.13 Der Punkt u entsteht aus dem Punkt v, indem man das Lot
von v aus auf die Gerade U fällt. Der Vektor u = v − u steht senkrecht auf U .
U = ϕA (Rr ) = {A x | x ∈ Rr } = -s 1 , . . . , s r . ⊆ V mit Wir bilden die Matrix A, deren Spalten die Basisvektoren
den Spalten s 1 , . . . , s r von A. b1 , b2 von U sind und erhalten dann den Koordinatenvektor
von u bezüglich der Basis B = (b1 , b2 ) durch Lösen der
Nach dem Projektionssatz ist ein Element A x ∈ Rn mit
Normalgleichung
x ∈ Rr genau dann eine Lösung von v − A x = min,
wenn v − A x ⊥ U , d. h., A x ist die senkrechte Projektion
A0 A x = A0 v .
von v auf U . Nun gilt:
Das Gleichungssystem lautet:
v − Ax ⊥ U
' ( ' (
⇔ v − A x ⊥ si für alle i = 1, . . . , r 2 2 4
x= .
⇔ s i · (v − A x) = 0 für alle i = 1, . . . , r 2 3 6
⇔ s0
i (v − A x) = 0 für alle i = 1, . . . , r ' (
0
0 Die eindeutig bestimmte Lösung besagt, dass die senk-
⇔ A (v − A x) = 0 2
⇔ A0 A x = A0 v . ⎞ Projektion von v auf U der Vektor u = 0 b1 + 2 b2 =
rechte
⎛
2
Damit ist gezeigt, dass die Lösungsmengen des linearen Aus- ⎝2⎠ ist.
gleichsproblem und der Normalgleichung übereinstimmen. 2
Es bleibt zu zeigen, dass die Lösungsmenge genau dann ein-
elementig ist, wenn A den Rang r hat. Das begründen wir, So erhalten wir für den minimalen Abstand von v zu U
indem wir zeigen, dass A0 A genau dann invertierbar ist, K⎛ ⎞ ⎛ ⎞K
K 1 2 K
wenn A den Rang r hat. Es gilt: K K √
v − u = K 2 − 2⎠K
K ⎝ ⎠ ⎝
K = 2.
0 K 3 2 K
A A ist invertierbar
0
⇔ A Aw = 0 nur für w = 0
0
⇔ wA Aw = 0 nur für w = 0
⇔ (A w) · (A w) = 0 nur für w = 0 Symmetrische Bilinearformen kann man über
⇔ Aw = 0 nur für w = 0 beliebige Körpern erklären
⇔A hat Rang r.
Wir haben das (euklidische) Skalarprodukt · eines R-Vektor-
Damit ist alles gezeigt. raums V definiert als eine positiv definite, symmetrische Bi-
linearform, · : V × V → R. Für die positive Definitheit ist
Kommentar: Die Matrix A0 A ist im Allgemeinen nicht die Eigenschaft von R nötig, dass man die von null verschie-
invertierbar. Also ist es im Allgemeinen nicht möglich, die denen Elemente von R in positive und negative Elemente
Normalgleichung nach dem Vektor v durch Berechnen von unterscheiden kann. Verzichtet man auf die positive Definit-
(A0 A)−1 aufzulösen. heit, so kann man für jeden Körper K eine symmetrische
Bilinearform · in einem K-Vektorraum V erklären, also eine
symmetrische, bilineare Abbildung · : V × V → K.
Wir kehren nun zu der Situation des Projektionssatzes zurück
im Fall V = Rn und U = -b1 , . . . , br . = ϕA (Rr ) = {A x | Durch das Fehlen der positiven Definitheit haben diese Ver-
x ∈ Rr } ⊆ V , wobei A = (b1 , . . . , br ). Zu v ∈ Rn erhalten allgemeinerungen von Skalarprodukten Eigenschaften, deren
wir die orthogonale Projektion π(v) = u = A x durch Lösen geometrische Deutungen etwas seltsam wirken.
der Normalgleichung Ist V ein K-Vektorraum mit einer symmetrischen Bilinear-
form ·, so definiert man (wie beim euklidischen Skalarpro-
A0 A x = A0 v .
dukt):
Bilden b1 , . . . , br eine Basis von U , so ist die Lösung ein- v heißt senkrecht bzw. orthogonal zu w, v ⊥ w, für zwei
deutig bestimmt. Vektoren v, w ∈ V , falls v · w = 0 gilt.
Man nennt v ∈ V isotrop, falls v ⊥ v gilt.
Beispiel
⎛ ⎞ Wir suchen den minimalen Abstand des Punktes U ⊥ = {v ∈ V | v ⊥ u für alle u ∈ U } nennt man den
1 Orthogonalraum zu U für jeden Untervektorraum U von
v = ⎝2⎠ zu der Ebene V.
3 Rad(V ) = V ∩ V ⊥ ist das Radikal von V .
⎛ ⎞
? ⎛ ⎞@ Man nennt · ausgeartet, falls Rad(V ) = {0}.
1 1
U = b1 = ⎝0⎠ , b2 = ⎝1⎠ . Die Vektoren im Radikal sind allesamt isotrop, sie stehen
1 1 nämlich auf allen Vektoren aus V , also insbesondere auch
17.3 Orthonormalbasen und orthogonale Komplemente 677
Problemanalyse und Strategie: Wir benutzen die Lösung des linearen Ausgleichsproblems durch die Normalglei-
chung. Dabei wählen wir Basisfunktionen, die einen Untervektorraum U des Vektorraums aller Funktionen erzeugen und
bestimmen eine Funktion f aus U , deren Graph einen im oben erwähnten Sinne minimalen Abstand zu den gegebenen
Punkten (t1 , y1 ), . . . , (tn , yn ) hat.
Lösung: f
Um eine solche beste Annäherung zu erhalten, trägt man
zuerst die Messpunkte (t1 , y1 ), . . . , (tn , yn ) in ein Koor-
dinatensystem ein und überlegt sich, welche Funktionen
f1 , . . . , fr als Basisfunktionen in Betracht zu ziehen sind.
Bei der ersten Punkteverteilung in der folgenden Skizze
−2 −1 0 1 2
auf sich selbst, senkrecht. Ist K = R und · sogar positiv ist dann in zwei Versionen zu interpretieren: Einmal für den
definit, d. h. ein euklidisches Skalarprodukt, so gilt: reellen Fall, ein zweites Mal für den komplexen Fall. Um
die Theorie übersichtlicher und klarer zu gestalten, wählten
Rad(V ) = {0} , wir einen anderen Weg. Wir schließen vorläufig die Theorie
der euklidischen Vektorräume ab und führen nun in einem
da V ⊥ = {0}. Außerdem ist nur der Nullvektor in diesem
eigenen Abschnitt die unitären Vektorräume ein.
Fall isotrop. Es folgen nun Beispiele von Vektorräumen mit
symmetrischen Bilinearformen, die keine euklidischen Ska-
larprodukte sind. In komplexen Vektorräumen gibt es keine
symmetrischen, positiv definiten
Beispiel
Es ist Bilinearformen
⎧ 2 × R2
⎨'' R( ' (( → R, An ein euklidisches Skalarprodukt eines reellen Vektorraums
·: v1 w1 stellten wir die drei Forderungen der
⎩ , → v1 w1 − v2 w2
v2 w2
(Bi-)linearität,
eine symmetrische Bilinearform auf dem WegenR2 . Symmetrie und
' ( ' ( positiven Definitheit.
1 1
· =1·1−1·1=0 Die positive Definitheit war es letztlich, die es ermöglichte,
1 1
Normen von Vektoren und damit Abstände, Winkel und
steht der Vektor (1, 1)0 auf sich selbst senkrecht, sodass Orthogonalität zwischen Vektoren zu erklären. Würde man in
(1, 1)0 isotrop ist. Der Vektorraum R2 ist aber bezüglich komplexen Vektorräumen nun ebenso vorgehen, um solche
· nicht ausgeartet, da es zu jedem Vektor v ∈ R2 , der vom Begriffe einführen zu können, so stößt man auf ein Problem.
Nullvektor verschieden ist, einen Vektor w ∈ R2 gibt mit So ist zwar das Produkt für Vektoren
v · w = 0. ⎛ ⎞ ⎛ ⎞
Es sei V der Z2 -Vektorraum Z22 . Es ist v1 w1
⎜ .. ⎟ ⎜ .. ⎟
⎧ v = ⎝ . ⎠ , w = ⎝ . ⎠ ∈ Cn ,
⎨'' V( ×'V (( → Z2 ,
vn wn
·: v1 w1
⎩ , → v1 (w1 + w2 ) + v2 (w1 + w2 )
v2 w2 das wir analog zum kanonischen Produkt im Rn definieren,
eine symmetrische Bilinearform auf V . Da !
n
' ( v · w = v0 w = vi wi ∈ C ,
1 i=1
⊥ v für alle v ∈ V ,
1
bilinear und symmetrisch, aber nicht positiv definit, da etwa
enthält der Untervektorraum Rad(V ) von V den eindi- ' ( ' (
i i
mensionalen Untervektorraum -(1, 1)0 ., d. h., dass V be- · = i2 = −1 ∈ R≥0 .
0 0
züglich · ausgeartet ist. Da aber (1, 0)0 nicht isotrop ist,
ist das Radikal nicht zweidimensional, wir erhalten
Es kann auch sein, dass die Größe v 0 v gar keine reelle Zahl
<' (=
1 ist: ' ( ' (
Rad(V ) = . 1+i 1+i
1 · = (1 + i)2 = 2 i ∈ R .
0 0
Das Radikal besteht in diesem Beispiel genau aus den Also kann es im Cn keine symmetrischen, positiv definiten
isotropen Vektoren. Bilinearformen geben.
?
Nennen Sie für jede natürliche Zahl n einen Vektor v ∈ Cn
17.4 Unitäre Vektorräume mit v 0 v < 0.
0 ≤ |z|2 = z z, stellen wir an unitäre Skalarprodukte eines Unitäres Skalarprodukt und unitärer Vektorraum
komplexen Vektorraums V statt der Symmetrie die Forde-
Ist V ein komplexer Vektorraum, so heißt eine Abbil-
rung
dung
v · w = w · v für alle v, w ∈ V . V × V → C,
·:
(v, w) → v · w
Vertauscht man die Faktoren des Produkts, so kommt das ein unitäres Skalarprodukt, wenn für alle v, v , w ∈
konjugiert Komplexe dabei heraus. Wir sagen, ein Produkt V und λ ∈ C die folgenden Eigenschaften erfüllt sind:
· : V × V → C ist hermitesch, wenn v · w = w · v für alle (i) (v + v ) · w = v · w + v · w und (λ v) · w = λ (v · w)
v, w ∈ V gilt. (Linearität im ersten Argument),
(ii) v · w = w · v (hermitesch),
Für jede Matrix A = (aij ) ∈ Cr×s , also auch für jeden
(iii) v · v ≥ 0 und v · v = 0 ⇔ v = 0 (positive Definit-
Spaltenvektor, schreiben wir wieder A = (a ij ) und erwähnen
heit).
die bereits benutzte Regel
Ist · ein unitäres Skalarprodukt in V , so nennt man V
einen unitären Vektorraum.
Av = Av
Wir stellen die Axiome (i), (ii) und (iii) für den euklidischen
für Vektoren v.
und den unitären Fall gegenüber:
Wir erklären nun ein Produkt · von Vektoren des C2 :
euklidisch unitär
!
n (v+v ) · w =v·w + v
·w (v+v ) · w = v · w + v · w
v · w = v0 w = v i wi ∈ C . (λ v) · w = λ (v · w) (λ v) · w = λ (v · w)
i=1 v·w =w·v v·w =w·v
v·v ≥0 v·v ≥0
Nun rechnen wir mit unseren obigen Beispielen, aber bezüg- v·v =0⇔v =0 v·v =0⇔v =0
lich des neu erklärten Produkts · nach:
Aus (ii) folgt wegen der Additivität und der Multiplikativität
' ( ' ( ' (
i i −i des Konjugierens die halbe Linearität im zweiten Argument,
· = (i, 0) = i (−i) = 1 ∈ R≥0
0 0 0 d. h., es gilt für alle v, w, w ∈ V und λ ∈ C:
und v · (w + w ) = (w + w ) · v = w · v + w · v
' ( ' ( ' ( = v · w + v · w = v · w + v · w
1+i 1+i 1−i
· = (1 + i, 0) = 2 ∈ R≥0 . v · (λ w) = (λ w) · v = λ (w · v)
0 0 0
= λ v · w = λ (v · w) .
(λ v) · w = λ (v · w) und v · (λ w) = λ (v · w) .
wir das kanonische (unitäre) Skalarprodukt. Weil stetige Funktionen integrierbar sind, ist dieses Pro-
Die Linearität im ersten Argument ist unmittelbar klar. dukt auch definiert. Der Nachweis, dass · ein unitäres
⎛ ⎞ ⎛ ⎞ Skalarprodukt ist, erfolgt analog zum reellen Fall.
v1 w1
⎜ .. ⎟ ⎜ .. ⎟
Sind v = ⎝ . ⎠ und w = ⎝ . ⎠, so gilt:
Das zweite Beispiel mit der Matrix A lässt sich wesentlich
vn wn verallgemeinern. Ist n eine natürliche Zahl, so ist für jede
Matrix A ∈ Cn×n das Produkt
!
n !
n
v · w = v0w = vi wi = wi vi
v · w = v 0 A w für alle v, w ∈ Cn
i=1 i=1
!
n linear im ersten Argument. Und erfüllt die Matrix A die
= wi v i = w · v . Eigenschaft A0 = A, so ist das Produkt · auch hermitesch.
i=1 Daher ist die folgende Definition nur naheliegend.
Also ist das Produkt auch hermitesch. Und die positive
Definitheit des Produkts folgt aus Hermitesche Matrizen
0
0 2
v · v = v v = |v1 | + · · · + |vn | ≥ 0 ,2 Eine Matrix A ∈ Cn×n mit A0 = A, d. h., A = A,
heißt hermitesch.
wobei die Gleichheit genau dann gilt, wenn alle vi gleich
null sind, d. h., wenn v = 0. Die Diagonaleinträge aii einer hermiteschen Matrix A =
( für Vektoren v, w ∈ C mittels der Matrix
2
Wir definieren
' (aij ) ∈ Cn×n müssen wegen
2 i
A= das Produkt ⎛ ⎞ ⎛ ⎞
−i 1 a 11 · · · a 1n a11 · · · an1
⎜ .. ⎟ = ⎜ .. .. ⎟ = A0
A = ⎝ ... . ⎠ ⎝ . . ⎠
v · w = v0A w .
a n1 · · · a nn a1n · · · ann
Die Linearität im ersten Argument begründet man wie im
reellen Fall. reell sein. Die hermiteschen Matrizen übernehmen im Kom-
Das Produkt ist hermitesch, da wegen plexen die Rolle der symmetrischen Matrizen im Reellen.
v 0 A w = (v 0 A w)0 = w 0 A0 v
Positiv definite Matrizen definieren unitäre
(Transponieren einer komplexen Zahl ändert diese Zahl Skalarprodukte
nicht) und wegen A0 = A gilt:
= w0 A v = w0 A v = w · v . v · w = v 0 A w für alle v, w ∈ Cn
Schließlich
' ( ist das Produkt positiv definit, da für v = eine hermitesche Sesquilinearform. Aber das Produkt ist
v1 nicht für jede hermitesche Matrix A positiv definit, man
∈ R2 gilt:
v2 wähle etwa die Nullmatrix, diese ist hermitesch, das Produkt
' ( aber in diesem Fall sicher nicht positiv definit.
0 v1
v A v = (2 v1 − i v2 , i v1 + v2 )
v2 Wir nennen eine hermitesche n×n-Matrix A positiv definit,
wenn für alle v ∈ Cn
= 2 v1 v 1 − i v2 v 1 + i v1 v 2 + v2 v 2
= |v1 |2 + |v1 + i v2 |2 ≥ 0 , v 0 A v ≥ 0 und v 0 A v = 0 ⇔ v = 0
und Gleichheit gilt hierbei genau dann, wenn v = 0 ist. gilt – man beachte v 0 A v ∈ R. Jede positiv definite Matrix
Wir erklären ein Produkt - , . im Vektorraum aller auf dem liefert somit durch die Definition
abgeschlossenen Intervall [a, b] für reelle Zahlen a < b
stetigen komplexwertigen Funktionen, also im komplexen v · w = v0 A w
Vektorraum
ein unitäres Skalarprodukt. Man beachte, dass positiv definite
C = {f : [a, b] → C | f ist stetig } . Matrizen insbesondere hermitesch sind.
17.5 Orthogonale und unitäre Endomorphismen 681
Vektoren in unitären Vektorräumen haben Bei euklidischen bzw. unitären Vektorräumen haben wir die
eine Norm weitere Verknüpfung · des euklidischen bzw. unitären Ska-
larprodukts. Trägt ein Endomorphismus ϕ auch dieser Ver-
Unitäre Vektorräume entziehen sich, vom eindimensionalen knüpfung des Skalarprodukts im folgenden Sinne Rechnung,
Fall abgesehen, der Anschauung. Aber auch in diesen Räu- so wollen wir einen solchen Endomorphismus einen orthogo-
men kann man Begriffe wie Norm und Länge einführen. Dazu nalen bzw. unitären Endomorphismus nennen, je nachdem,
gehen wir völlig analog zum reellen Fall vor, das können wir ob ein euklidischer oder unitärer Vektorraum vorliegt.
wegen der positiven Definitheit des unitären Skalarprodukts.
Orthogonale und unitäre Endomorphismen
Die Norm von Vektoren Einen Endomorphismus ϕ eines euklidischen bzw. uni-
Ist v ein Element eines unitären Vektorraums mit dem tären Vektorraums V mit Skalarprodukt · mit der Eigen-
unitären Skalarprodukt ·, so nennt man die positive reelle schaft
Zahl √
v = v · v v · w = ϕ(v) · ϕ(w) für alle v, w ∈ V
die Norm oder Länge des Vektors v. nennt man im euklidischen Fall, d. h., K = R, einen
orthogonalen Endomorphismus und im unitären Fall,
Nun lassen sich alle Überlegungen aus dem Abschnitt zu d. h., K = C, einen unitären Endomorphismus.
den euklidischen Vektorräume für unitäre Vektorräume wie-
derholen. Wir stellen alle wesentlichen Begriffe und Eigen-
Wir haben die Länge eines Vektors v eines euklidischen oder
schaften in einer Übersicht auf Seite 682 zusammen.
unitären Vektorraums V definiert als
Kommentar: In vielen Lehrbüchern findet man auch die √
0 v = v·v.
Schreibweise AH = A . Und Physiker schreiben in der
0
Quantentheorie oft auch A† für A .
Ist ϕ ein orthogonaler oder unitärer Endomorphismus, so gilt
für jedes v ∈ V :
Wir untersuchen nun lineare Abbildungen in euklidischen
und unitären Vektorräumen. Dabei behandeln wir diese Vek- √ %
v = v · v = ϕ(v) · ϕ(v) = ϕ(v) .
torräume nicht wie bisher getrennt, sondern gleichzeitig.
und
In diesem und im folgenden Abschnitt steht das Symbol K
für einen der Körper R oder C. Wir sprechen allgemein von
einem Skalarprodukt, meinen damit stets ein euklidisches ϕ(v + w)2 = ϕ(v)2 + ϕ(w)2 + 2 (ϕ(v) · ϕ(w))
Skalarprodukt, falls K = R und ein unitäres Skalarprodukt,
falls K = C gilt. und ϕ(v + w) = v + w schließlich
Für alle Elemente v und w aus V gilt die Cauchy- Ist {a 1 , . . . , a n } eine Basis von V , so ist {b1 , . . . , bn }
Schwarz’sche Ungleichung mit
|v · w| ≤ v w . b1 = a 1 −1 · a 1 , bk+1 = ck+1 −1 · ck+1 ,
Die Gleichheit gilt hier genau dann, wenn v und w li-
k
near abhängig sind. wobei ck+1 = a k+1 − bi · (bi · a k+1 ) für k = 1,
Die Abbildung i=1
. . . , n − 1, eine Orthonormalbasis von V , diese Kon-
V → R≥0 ,
· : √ struktion einer Orthonormalbasis aus einer Basis nennt
v → v = v · v man das Orthonormalisierungsverfahren von Gram
ist eine Norm, insbesondere gilt für alle v, w ∈ V die und Schmidt.
Dreiecksungleichung Jeder höchstens abzählbardimensionale euklidische
bzw. unitäre Vektorraum besitzt eine Orthogonalbasis.
v + w ≤ v + w . Für jeden Untervektorraum U von V ist die Menge
Sind v und w zwei Elemente aus V , so nennen wir die
U ⊥ = {v ∈ V | v ⊥ w für alle w ∈ U }
reelle Zahl
d(v, w) = v − w = w − v wieder ein Untervektorraum von V , das orthogonale
Komplement von U in V .
den Abstand oder die Distanz von v zu w. Ist U ein Untervektorraum von V , so gibt es zu jedem
Sind v und w Elemente aus V , so sagt man, v steht v ∈ V genau ein u ∈ U mit v − u ⊥ U . Die hierdurch
senkrecht auf w oder ist orthogonal zu w, wenn definierte Abbildung
v·w =0
V → U,
p:
gilt. Für diesen Sachverhalt schreiben wir auch v → u
v ⊥ w.
heißt orthogonale Projektion von V auf U .
Eine Basis B von V heißt Orthogonalbasis, wenn je Und für den Vektor u = v − u ∈ U ⊥ gilt:
zwei verschiedene Basisvektoren aus B senkrecht auf-
einander stehen. u ≤ v − w für alle w ∈ U .
Eine Orthogonalbasis heißt Orthonormalbasis, wenn
jeder Basisvektor die Länge 1 hat. Es hat u minimalen Abstand zu v.
Wegen dieser längenerhaltenden Eigenschaften eines ortho- Sind v und w nicht der Nullvektor, so gilt für den Winkel
gonalen bzw. unitären Endomorphismus nennt man eine sol- α zwischen v und w und einen orthogonalen Endomorphis-
che Abbildung auch Isometrie. mus ϕ:
Weil nur der Nullvektor die Länge 0 hat und eine lineare v·w ϕ(v) · ϕ(w)
cos α = = ,
Abbildung genau dann injektiv ist, wenn ihr Kern nur aus v w ϕ(v) ϕ(w)
dem Nullvektor besteht, können wir folgern:
also gilt:
(v, w) = (ϕ(v), ϕ(w)) .
Folgerung
Jeder orthogonale bzw. unitäre Endomorphismus ϕ ist in-
jektiv, und ist V endlichdimensional, so ist ϕ sogar bijektiv. Und weil zwei Vektoren genau dann senkrecht aufeinan-
der stehen, wenn ihr Skalarprodukt null ist, erhalten wir aus
v · w = ϕ(v) · ϕ(w) für einen orthogonalen bzw. unitären
Endomorphismus:
Dabei folgt die zweite Behauptung aus dem Kriterium für
Bijektivität auf Seite 430.
Folgerung
Orthogonale sind nicht nur längenerhaltend, sie erhalten auch Orthogonale bzw. unitäre Endomorphismen bilden or-
Winkel zwischen vom Nullvektor verschiedenen Vektoren. thogonale Vektoren auf orthogonale Vektoren ab.
17.5 Orthogonale und unitäre Endomorphismen 683
und
' (' ( δα (b)
cos α sin α cos α − sin α
D0
α Dα = = E2
− sin α cos α sin α cos α Abbildung 17.16 Die Drehung δα ist längenerhaltend.
S0 0
α S α = E2 und D α D α = E2 ,
was wiederum besagt, dass die Zeilenvektoren von A paar-
weise orthogonal zueinander sind und die Länge 1 haben,
d. h., dass die Spalten von S α und D α Orthonormalbasen des also auch eine Orthonormalbasis des Kn bezüglich des ka-
Rn sind. nonischen Skalarprodukts bilden.
684 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Problemanalyse und Strategie: Wir prüfen nach, dass σw ein längenerhaltender Endomorphismus ist und konstruieren
uns schließlich eine Basis bezüglich der der Endomorphismus Diagonalgestalt hat.
En M(σw )En = En − 2 w w0 .
D = S 0 (En − 2 w w0 ) S .
Anstelle von entlang w sagt man auch an der Hyperebene Im R3 hat⎛etwa⎞ die Spiegelung σw entlang des Vektors
w⊥ = -w.⊥ ; dies ist ein (n − 1)-dimensionaler Unter- 1
vektorraum des Rn , im Fall n = 2 also eine Gerade. Wir 1 ⎝ ⎠
w = 14 2 bezüglich der geordneten Standardbasis
untersuchen solche Spiegelungen etwas näher. 3
die Darstellungsmatrix
Offenbar erfüllt jede Spiegelung σw die Eigenschaften:
⎛ ⎞ ⎛ ⎞
σw (w) = −w. 1 2 3 6 −2 −3
Aus v ⊥ w folgt σw (v) = v. E3 − 1/7 ⎝2 4 6⎠ = 1/7 ⎝−2 3 −6⎠
Für alle v ∈ Rn gilt σw2 (v) = v. 3 6 9 −3 −6 −2
Damit erhalten wir sehr einfach eine geordnete Ortho-
normalbasis des Rn bezüglich der σw eine Diagonalge- Kommentar: In manchen Büchern verlangt man nicht,
stalt hat: Wir wählen die geordnete Orthonormalbasis dass der Vektor w die Länge 1 hat, und betrachtet statt-
(w, b2 , . . . , bn ), wobei (b2 , . . . , bn ) eine geordnete Or- dessen für einen beliebigen Vektor w = 0 aus dem Rn die
thonormalbasis des (n − 1) -dimensionalen Untervektor- Abbildung
raums w⊥ ist. Für die Darstellungsmatrix B M(σw )B be- n
züglich dieser Basis B gilt: R → Rn
⎛ ⎞ σw :
−1 0 · · · 0 v → v − 2 ww··wv w
⎜ 0 1 · 0⎟
⎜ ⎟ und nennt sie Spiegelung. Diese Abbildung wirkt kompli-
D = B M(σw )B = ⎜ . .. ⎟
⎝ .. . ⎠ zierter, tatsächlich sorgt aber der Nenner im Bruch für die
0 ··· 1 Normierung, die wir für w vorausgesetzt haben.
17.5 Orthogonale und unitäre Endomorphismen 685
Hat umgekehrt eine Matrix A ∈ Kn×n die Eigenschaft Orthogonale bzw. unitäre Endomorphismen und
0 0
A A = En , so gilt wie eben auch A A = En , also bilden orthogonale bzw. unitäre Matrizen
sowohl die Spalten als auch die Zeilen von A eine Orthonor- Für eine Matrix A ∈ Kn×n ist der Endomorphismus
malbasis des Kn bezüglich des kanonischen Skalarprodukts.
n
K → Kn ,
Matrizen mit dieser Eigenschaft bekommen einen eigenen ϕA :
v → A v
Namen.
genau dann orthogonal (K = R) bzw. unitär (K = C) be-
Orthogonale und unitäre Matrizen züglich des kanonischen Skalarprodukts, wenn die Ma-
Eine reelle bzw. komplexe n × n-Matrix mit der Eigen- trix A orthogonal bzw. unitär ist.
schaft
0
A A = En
Beweis: Es ist nur noch zu zeigen, dass die Matrix A
heißt orthogonale bzw. unitäre Matrix. orthogonal bzw. unitär ist, wenn ϕA orthogonal bzw. unitär
Die Zeilen und Spalten einer orthogonalen bzw. unitären bezüglich des kanonischen Skalarprodukts ist.
n × n -Matrix bilden Orthonormalbasen des Rn bzw. Cn .
Die Determinante jeder orthogonalen bzw. unitären Ma- Ist nun ϕA orthogonal bzw. unitär, so gilt für alle v und w aus
Kn :
trix A ∈ Kn×n hat den Betrag 1,
| det A| = 1 . v 0 w = v · w = (A v) · (A w) = v 0 A0 A w .
Man beachte, dass mit obiger Gleichung v · w = Bv · Bw Eigenwerte und Eigenvektoren orthogonaler bzw.
insbesondere auch unitärer Matrizen
ϕ(v) · ϕ(w) = B ϕ(v) · B ϕ(w) Ist λ ein Eigenwert einer orthogonalen bzw. unitären Ma-
trix, so gilt |λ| = 1.
gilt. Wir berechnen nun das Produkt A0 A:
Eigenvektoren orthogonaler bzw. unitärer Matrizen zu
⎛ 0⎞
B ϕ(b 1 ) verschiedenen Eigenwerten stehen senkrecht aufeinan-
⎜ .. ⎟
A0 A = ⎝ . ⎠ (B ϕ(b1 ), . . . , B ϕ(bn ))
der.
0
B ϕ(bn ) Insbesondere können damit höchstens 1 und −1 reelle Eigen-
⎛ 0 0 ⎞
B ϕ(b 1 ) B ϕ(b1 ) · · · B ϕ(b1 ) B ϕ(bn ) werte orthogonaler bzw. unitärer Matrizen sein; und die kom-
⎜ .. .. ⎟ plexen Eigenwerte liegen auf dem Einheitskreis (Abb. 17.17).
=⎝ . . ⎠
0 0
B ϕ(bn ) B ϕ(b1 ) · · · B ϕ(bn ) B ϕ(bn )
Beweis: Sind λ1 und λ2 verschiedene Eigenwerte einer
Ist nun ϕ ein orthogonaler bzw. unitärer Endomorphismus, orthogonalen bzw. unitären Matrix A ∈ Kn×n mit den Eigen-
d. h. ϕ(v) · ϕ(w) = v · w, so können wir also ϕ in den n2 vektoren v 1 zu λ1 und v 2 zu λ2 , so gilt mit dem kanonischen
Produkten weglassen, damit folgt dann, weil die Elemente Skalarprodukt · im Kn :
der Basis B ja eine Orthonormalbasis bilden:
v 1 · v 2 = (A v 1 ) · (A v 2 ) = (λ1 v 1 ) · (λ2 v 2 )
A0 A = En .
= λ1 λ2 · (v 1 · v 2 ) .
Also ist die Matrix A orthogonal bzw. unitär. Ist umgekehrt
vorausgesetzt, dass die Matrix A orthogonal bzw. unitär ist, Aus v 1 · v 2 = 0 folgte λ1 λ2 = 1, wegen λ2 = λ−1 2 somit
d. h., A0 A = En , so zeigt obige Darstellung des Produkts, λ1 = λ2 , ein Widerspruch. Damit gilt v 1 · v 2 = 0.
' ( Wir wählen einen solchen und ergänzen diesen zu einer Or-
Zu dem Punkt
a
∈ R2 mit a 2 + b2 = 1 gibt es genau ein thonormalbasis (b1 , b2 , b3 ) des R3 . Mit der orthogonalen
b Matrix S = (b1 , b2 , b3 ) gilt dann:
α ∈ [0, 2 π[ mit a = cos α und b = sin α. Also gilt: ⎛ ⎞
1 0 0
M = S 0 A S = ⎝0 r s ⎠
Diagonalisierbarkeit orthogonaler 2 × 2-Matrizen 0 t u
Ist A ∈ R2×2 orthogonal, so gilt: Nun ist auch die Matrix M orthogonal, da
' (
A=
cos α sin α
= S α , falls det A = −1, M 0 M = (S 0 A S)0 (S 0 A S) = S 0 A0 A S = E3 .
sin α − cos α ' (
' ( r s
cos α − sin α Und weil det = det M = det S 0 det A det S =
A= = Dα , falls det A = 1 . t u
sin α cos α det A = 1, folgt die Existenz eines α ∈ [0, 2 π[ mit
Jede 2 × 2-Spiegelungsmatrix S α ist diagonalisierbar. ' ( ' (
r s cos α − sin α
=
Eine 2 × 2-Drehmatrix D α mit α ∈ [0, 2 π [ ist genau t u sin α cos α
dann diagonalisierbar, wenn α ∈ {0, π}. Damit haben wir gezeigt, dass es zu jeder orthogonalen 3×3-
Matrix A mit Determinante +1, d. h. zu jeder Drehmatrix,
eine orthogonale Matrix S und ein α ∈ [0, 2 π [ gibt mit
Drehmatrizen über R sind also nicht immer diagonalisier- ⎛ ⎞
bar. Wir können aber jede solche (orthogonale) Drehmatrix 1 0 0
auch als eine unitäre Matrix über C auffassen (siehe Auf- S 0 A S = ⎝0 cos α − sin α ⎠
gabe 17.10). 0 sin α cos α
688 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Ist α = 0, so nennt man den dann eindimensionalen Eigen- 2. Fall: α = 0. Es handelt sich dann bei
raum zum Eigenwert 1 einer Drehmatrix A die Drehachse ⎛ ⎞
der Drehung v → A v. −1 0 0
M = ⎝ 0 cos α − sin α ⎠
0 sin α cos α
Drehachse
um die Darstellungsmatrix einer Drehspiegelung.
Nun wenden wir uns dem Fall zu, dass eine orthogonale Ma- Unitäre Matrizen sind diagonalisierbar,
trix A ∈ R3×3 die Determinante −1 hat. Wie oben zeigt orthogonale nicht immer
man, dass A in diesem Fall den Eigenwert −1 mit einem
zugehörigen normierten Eigenvektor b1 besitzt. Es gilt also Bei jeder unitären Matrix A ∈ Cn×n zerfällt das charakteris-
A b1 = −b1 . tische Polynom χA als Polynom über C stets in Linearfakto-
Wieder ergänzen wir diesen Eigenvektor zu einer geordneten ren:
Orthonormalbasis (b1 , b2 , b3 ) des R3 . Wir erhalten mit der χA = (λ1 − X) · · · (λn − X)
orthogonalen Matrix S = (b1 , b2 , b3 ) die ebenfalls ortho- mit nicht notwendig verschiedenen λ1 , . . . , λn ∈ C.
gonale Matrix
Wir folgern nun, dass für solche Matrizen stets algebraische
⎛⎞
−1 0 0 und geometrische Vielfachheit für jeden Eigenwert überein-
M = S0A S = ⎝ 0 r s ⎠ stimmen. Insbesondere sind also unitäre Matrizen stets dia-
0 t u gonalisierbar. Wir folgern dieses Ergebnis aus dem Satz:
' (
r s Unitäre Endomorphismen sind diagonalisierbar
Wegen − det = det M = det A = −1 folgt wieder:
t u
Ist ϕ ein unitärer Endomorphismus eines endlichdimen-
' ( ' ( sionalen unitären Vektorraums V mit den Eigenwerten
r s cos α − sin α
= λ1 , . . . , λn , so existiert eine Orthonormalbasis B von V
t u sin α cos α
aus Eigenvektoren von ϕ, d. h.
für ein α ∈ [0, 2 π [. ⎛ ⎞
λ1 0
1. Fall: α = 0. Es handelt sich dann bei ⎜ .. ⎟
B M(ϕ)B =⎝ . ⎠
⎛ ⎞
−1 0 0 0 λn
M = ⎝ 0 1 0⎠
0 0 1
Beweis: Wir beweisen den Satz durch Induktion nach der
um die Darstellungsmatrix der Spiegelung entlang b1 (siehe Dimension n von V . Ist n = 1, so ist die Behauptung richtig,
Seite 684). Damit ist erkannt, dass A die Darstellungsmatrix da man jede von Null verschiedene komplexe Zahl als ein-
einer Spiegelung, kurz eine Spiegelungsmatrix, ist. ziges Element einer solchen Orthonormalbasis wählen kann,
17.5 Orthogonale und unitäre Endomorphismen 689
jede solche Zahl ist ein Eigenvektor von ϕ. Setzen wir also Die Dimension jedes Eigenraums ist der Exponent des zuge-
nun voraus, dass n > 1 ist und die Behauptung für alle Zahlen hörigen Eigenwerts im charakteristischen Polynom.
m < n gilt.
Damit ist klar, wie wir vorgehen, um zu einer unitären Matrix
Ist v 1 ein Eigenvektor zum Eigenwert λ1 von ϕ, so betrachten A ∈ Cn×n eine Orthonormalbasis bestehend aus Eigenvek-
wir das orthogonale Komplement zum Erzeugnis von v 1 : toren von A zu konstruieren:
Jeder orthogonale Endomorphismus ist ein Für W = -v.⊥ gilt ϕ (W ) = W , denn für u ∈ W gilt:
Produkt von Spiegelungen
v · ϕ (u) = ϕ (v) · ϕ (u) = v · u = 0 .
Die Spiegelungen sind die Bausteine der orthogonalen Endo- Folglich ist ϕ |W ein orthogonaler Endomorphismus des
morphismen, da jeder orthogonale Endomorphismus ein Pro- n − 1-dimensionalen euklidischen Vektorraums W bezüg-
dukt von Spiegelungen ist. Man hat sogar eine obere Grenze lich des kanonischen Skalarprodukts von W . Nach Induk-
für die Anzahl der Spiegelungen, die hierzu als Faktoren auf- tionsvoraussetzung gibt es normierte w2 , . . . , wk ∈ W mit
tauchen. Diese obere Grenze ist die Dimension des Vektor- k ≤ n und
raums, in dem die Spiegelung betrachtet wird; genauer: ϕ |W = σw2 ◦ . . . ◦ σwk .
Zerlegung orthogonaler Endomorphismen Wir zeigen nun ϕ = σw2 ◦ . . . σwk , wobei wir die σwi als
Spiegelungen auf V auffassen. Dabei benutzen wir, dass sich
Jeder orthogonale Endomorphismus ϕ des Rn ist ein Pro-
jeder Vektor v ∈ V wegen V = R v + W in der Form
dukt von höchstens n Spiegelungen, d. h., es gibt nor- v = λv + u schreiben lässt.
mierte w 1 , . . . , w k ∈ Rn mit k ≤ n und
Sind u ∈ W und λ ∈ R, so erhalten wir:
ϕ = σw1 ◦ · · · ◦ σwk .
(σw2 ◦ . . . ◦ σwk )(λv + u) = λ (σw2 ◦ . . . ◦ σwk )(v)
Die Identität betrachten wir dabei als ein Produkt von 0 + (σw2 ◦ . . . ◦ σwk )(u)
Spiegelungen.
= λv + ϕ (u)
= λ ϕ (v) + ϕ (u)
Beweis: Ist ϕ ein orthogonaler Endomorphismus ungleich = ϕ (λ v + u) .
der Identität, so wählen wir ein v ∈ Rn mit ϕ(v) = v. Dann
gilt (v − ϕ(v)) · v = 0, da andernfalls v2 = ϕ(v) · ϕ(v) = Damit gilt ϕ = σw ◦ σw2 ◦ . . . ◦ σwk mit k ≤ n.
Weil wir wissen, dass A ein Produkt zweier Spiegelungsma- dischen bzw. unitären Vektorraums V mit dem Skalarprodukt
trizen ist, muss A eine Spiegelungsmatrix⎛sein.⎞Wir können · gilt:
0 v · w = ϕ(v) · ϕ(w)
dies aber auch nachprüfen. Es ist a 1 = ⎝−1⎠ ein Eigen-
für alle v, w ∈ V . Selbstadjungierte Endomorphismen sind
1
⎛ ⎞ ⎛ ⎞ ganz ähnlich erklärt:
1 0
vektor zum Eigenwert −1, und a 2 = ⎝0⎠, a 3 = ⎝1⎠ sind
0 1 Selbstadjungierter Endomorphismus
Eigenvektoren zum Eigenwert 1. Die Matrix S = Man nennt einen Endomorphismus ϕ eines euklidischen
(s 1 , s 2 , s 3 ) mit den Spalten s i = a1i a i erfüllt dann bzw. unitären Vektorraums V selbstadjungiert, wenn
⎛ ⎞ für alle v, w ∈ V gilt:
−1 0 0
0
S A S = ⎝ 0 1 0⎠ . ϕ(v) · w = v · ϕ(w) .
0 0 1
Wir erhalten die gewünschte Zerlegung: Beispiel
⎛ ⎞⎛ ⎞ Ist A ∈ Kn×n eine symmetrische bzw. hermitesche Ma-
2 2 −1 1 0 0 trix, gilt also A0 = A, so ist der Endomorphismus
A = 1/9 ⎝ 2 −1 2 ⎠ ⎝0 0 1⎠ . ϕ = ϕA : v → A v des Kn bezüglich des kanonischen
−1 2 2 0 1 0 Skalarprodukts selbstadjungiert, da für alle v, w ∈ Kn
gilt:
Wir haben nun ausführlich orthogonale bzw. unitäre Endo-
ϕ(v) · w = (A v)0 w = v 0 A0 w
morphismen euklidischer bzw. unitärer Vektorräume behan-
delt. Nun betrachten wir weitere Endomorphismen euklidi- = v 0 (A w) = v · ϕ(w) .
scher bzw. unitärer Vektorräume.
Im euklidischen Vektorraum V aller auf dem Intervall
I = [a, b] stetiger reellwertiger Funktionen mit dem Ska-
larprodukt
J b
17.6 Selbstadjungierte -f, g. = f (t) g(t) dt
Endomorphismen a
ist für jede fest gewählte Funktion h ∈ V der Endomor-
phismus
Wir behandeln in diesem Abschnitt eine weitere wichtige
Art von Endomorphismen euklidischer bzw. unitärer Vek- V → V,
ϕ:
torräume, die sogenannten selbstadjungierten Endomorphis- f → f · h
men. Der Begriff selbstadjungiert steht für den reellen wie
auch den komplexen Fall, eine Unterscheidung wie bei or- selbstadjungiert, da
thogonal und unitär gibt es nicht. Es ist allerdings bei den J b J b
Darstellungsmatrizen eine Unterscheidung üblich: Die Dar- -f, ϕ(g). = f (t) g(t) h(t) dt = f (t) h(t) g(t) dt
stellungsmatrix selbstadjungierter Endomorphismen eukli- a a
Jede Spiegelung σ des Rn ist selbstadjungiert. Es folgt Wir erhalten nun für die Komponente aij der Darstellungs-
nämlich aus σ −1 = σ und der Orthogonalität von σ für matrix wegen der Orthonormalität von B den Ausdruck:
alle v, w ∈ V :
bi · ϕ(bj ) = bi · (a1j b1 + · · · + anj bn ) = a ij
−1
σ (v) · w = v · σ (w) = v · σ (w) . und analog für aj i :
Ein anderes Argument ist die Symmetrie der Darstellungs- ϕ(bi ) · bj = (a1i b1 + · · · + ani bn ) · bj = aj i .
matrizen von Spiegelungen.
Nicht selbstadjungiert ist die Drehung ϕ im R'2 um Wegen bi · ϕ(bj ) = ϕ(bi ) · bj folgt also aij = a j i .
( den
1
Winkel 120 Grad. So gilt etwa für den Vektor v , dass
0 Mit diesem Satz haben wir die selbstadjungierten Endomor-
' ( '√ (
−1/2 3/2 phismen durch reelle symmetrische bzw. hermitesche Dar-
ϕ(v) = √ und w = , also
3/2 1/2 stellungsmatrizen bezüglich Orthonormalbasen beschrieben.
0 = ϕ(v) · w = v · ϕ(w) .
Eigenwerte reeller symmetrischer bzw.
hermitescher Matrizen sind reell
Darstellungsmatrizen selbstadjungierter
Endomorphismen bezüglich Orthonormal- Ist λ ∈ K ein Eigenwert einer reellen symmetrischen bzw.
basen sind symmetrisch bzw. hermitesch hermiteschen Matrix A ∈ Kn×n und v = (vi ) ∈ Kn ein
0
Eigenvektor zum Eigenwert λ, so gilt wegen A = A und
Nach obigem Beispiel bestimmt jede reelle symmetrische A v = λ v:
bzw. hermitesche Matrix A ∈ Kn×n durch ϕ : v → A v einen
selbstadjungierten Endomorphismus des Kn . Diese Matrix λ (v 0 v) = v 0 λ v = v 0 A v = (A v)0 v = λ (v 0 v) .
ist dann auch Darstellungsmatrix dieses Endomorphismus n
bezüglich einer Orthonormalbasis, nämlich der kanonischen Nun folgt wegen v = 0 zuerst v 0 v = |vi |2 = 0 und dann
i=1
Orthonormalbasis En . λ = λ, also λ ∈ R.
Wir überlegen uns, dass die Darstellungsmatrizen selbstad-
jungierter Endomorphismen bezüglich beliebiger Orthonor- Eigenwerte symmetrischer und hermitescher
malbasen reell symmetrisch bzw. hermitesch sind. Matrizen
Ist λ ein Eigenwert einer reellen symmetrischen bzw.
Darstellungsmatrizen selbstadjungierter Endo- hermiteschen Matrix, so ist λ reell.
morphismen
Ist ϕ ein selbstadjungierter Endomorphismus eines end- Wir wissen aber bisher noch nichts über die Existenz von
lichdimensionalen euklidischen bzw. unitären Vektor- Eigenwerten reeller symmetrischer bzw. hermitescher Ma-
raums mit einer geordneten Orthonormalbasis B, so gilt trizen. Wir haben nur gezeigt, dass, wenn eine solche Matrix
für die Darstellungsmatrix A = B M(ϕ)B : einen Eigenwert hat, dieser dann zwangsläufig reell ist. Tat-
sächlich ist es aber so, dass jede reelle symmetrische bzw.
0 hermitesche n × n-Matrix auch n Eigenwerte hat, hierbei
A0 = A bzw. A = A .
zählen wir die Eigenwerte entsprechend ihrer algebraischen
Vielfachheiten. Die Begründung erfolgt über einen Ausflug
Beweis: Es reicht aus, wenn wir das für den komplexen ins Komplexe.
Fall zeigen, der reelle Fall ergibt sich dann einfach durch
Weglassen der Konjugation.
Jede symmetrische n × n-Matrix hat n reelle
Wir wählen eine beliebige Orthonormalbasis B =
Eigenwerte
(b1 , . . . , bn ) von V , insbesondere ist also die Dimension von
V gleich n.
Wir betrachten eine symmetrische Matrix A ∈ Rn×n . Diese
Ist A = (aij ) die Darstellungsmatrix des selbstadjungier- Matrix definiert einen selbstadjungierten Endomorphismus
ten Endomorphismus ϕ bezüglich B, so ist für alle i, j ∈ ϕA : v → A v des Rn . Hier setzen wir an: Wir erklären einen
{1, . . . , n} selbstadjungierten Endomorphismus in dem größeren Vek-
aij = a j i torraum Cn . Die Abbildung
n
zu zeigen. Wir geben uns i, j ∈ {1, . . . , n} vor. Die j -te C → Cn ,
ϕ̃A :
Spalte von A ist der Koordinatenvektor des Bildes des j -ten v → A v
Basisvektors bj :
ist wegen A0 = A ein selbstadjungierter Endomorphismus
ϕ(bj ) = a1j b1 + · · · + anj bn . des Cn .
17.6 Selbstadjungierte Endomorphismen 693
Die Darstellungsmatrix En M(ϕ̃A )En = A ∈ Cn×n von ϕ̃A stimmen – wie wir gleich sehen werden – algebraische und
bezüglich der kanonischen Orthonormalbasis ist hermitesch. geometrische Vielfachheit für jeden Eigenwert überein. Ins-
besondere sind reelle symmetrische bzw. hermitesche Matri-
Mit dem Fundamentalsatz der Algebra folgt nun, dass das
zen also diagonalisierbar (siehe das Kriterium auf Seite 512).
charakteristische Polynom von A über C in Linearfaktoren
zerfällt:
χA = (λ1 − X)k1 · · · (λr − X)kr . Diagonalisierbarkeit selbstadjungierter Endo-
morphismen
Dabei sind λ1 , . . . , λr die verschiedenen Eigenwerte von A
Ist ϕ ein selbstadjungierter Endomorphismus eines n-
mit den jeweiligen algebraischen Vielfachheiten k1 , . . . , kr ,
dimensionalen euklidischen bzw. unitären Vektorraums
d. h., k1 + · · · + kr = n. Die Eigenwerte λ1 , . . . , λr sind
V mit den (reellen) Eigenwerten λ1 , . . . , λn , so existiert
reell.
eine Orthonormalbasis B von V aus Eigenvektoren von
Wegen χA = χϕ̃A = χϕA ∈ R[X] hat A ein in Linearfakto- ϕ mit ⎛ ⎞
ren zerfallendes charakteristisches Polynom, und damit hat λ1 0
⎜ .. ⎟
A die reellen Eigenwerte λ1 , . . . , λr . B M(ϕ)B = ⎝ . ⎠
0 λn
Eigenwerte symmetrischer bzw. hermitescher
Matrizen
Der Beweis geht ähnlich zu dem Beweis des Satzes zur Dia-
Jede symmetrische bzw. hermitesche n × n-Matrix hat n gonalisierbarkeit unitärer Endomorphismen.
nicht notwendig verschiedene Eigenwerte. Jeder Eigen-
wert ist reell.
Beweis: Wir beweisen den Satz durch Induktion nach der
Dimension n von V . Ist n = 1, so ist die Behauptung richtig,
Wir wollen nun noch begründen, dass es zu jeder reellen sym-
man kann jede von Null verschiedene reelle bzw. komplexe
metrischen bzw. hermiteschen Matrix A ∈ Kn×n eine Or-
Zahl als einziges Element einer solchen Orthonormalbasis
thonormalbasis des Kn aus Eigenvektoren von A gibt. Dazu
wählen, jede solche Zahl ist ein Eigenvektor von ϕ. Setzen
liefert der folgende Abschnitt einen ersten Anhaltspunkt.
wir also nun voraus, dass n > 1 ist und die Behauptung für
alle Zahlen m < n gilt.
Eigenvektoren zu verschiedenen Eigenwerten Ist v 1 ein Eigenvektor zum Eigenwert λ1 von ϕ, so betrachten
stehen senkrecht zueinander wir den Orthogonalraum zum Erzeugnis von v 1 :
Für reelle symmetrische bzw. hermitesche Matrizen lässt sich Mit der Matrix S = (b1 , b2 , b3 ) gilt:
das wie folgt formulieren: ⎛ ⎞
0 0 0
⎝0 2 0⎠ = S 0 A S .
Diagonalisierbarkeit reeller symmetrischer bzw.
0 0 2
hermitescher Matrizen
Ist A ∈ Kn×n eine reelle symmetrische bzw. hermite-
sche Matrix, so gibt es eine orthogonale bzw. unitäre Achtung: Reelle symmetrische Matrizen sind zwar
Matrix S und λ1 . . . , λn ∈ R mit stets diagonalisierbar, für komplexe symmetrische Matri-
zen stimmt
' das
( hingegen nicht: Die symmetrische Matrix
⎛ ⎞
λ1 0 1 i
A= ∈ C2 ist nicht diagonalisierbar.
0 ⎜ .. ⎟ i −1
S AS = ⎝ . ⎠
0 λn
Kommentar: Im R3 hat man das Vektorprodukt × zur
Dabei sind die Spalten von S eine Orthonormalbasis des Verfügung. Damit kann man sich oftmals etwas an Arbeit
Kn aus Eigenvektoren von A. ersparen. Sucht man eine Orthonormalbasis des R3 , wobei
ein normierter Basisvektor b1 = (b1 , b2 , b3 )0 = e3 vorge-
Ist A ∈ Kn×n eine reelle symmetrische bzw. hermitesche geben ist, so ist (b1 , b2 , b3 ) mit b2 = (−b2 , b1 , 0)0 und
Matrix, so existiert nach diesem Satz eine Orthonormalbasis b3 = b1 × b2 eine geordnete Orthogonalbasis. Normieren
des Kn aus Eigenvektoren von A. Dies heißt aber, dass n liefert eine Orthonormalbasis.
linear unabhängige Eigenvektoren von A existieren. Damit Mithilfe der erzielten Ergebnisse können wir nun ein Problem
muss für jeden Eigenwert von A die geometrische Vielfach- lösen, vor dem wir zu Beginn dieses Kapitels standen.
heit gleich der algebraischen sein:
Die Dimension jedes Eigenraums ist der Exponent des zuge-
Die Definitheit von reellen symmetrischen
hörigen Eigenwertes im charakteristischem Polynom.
bzw. hermiteschen Matrizen lässt sich mit den
Damit ist wieder klar, wie wir vorgehen, um eine Orthonor- Eigenwerten und Hauptunterdeterminanten
malbasis zu einer reellen symmetrischen bzw. hermiteschen
bestimmen
Matrix A ∈ Kn×n zu konstruieren.
χA = ((1 − X) (1 − X) − 1) (2 − X) = X (2 − X)2 . Nach dem Ergebnis auf Seite 692 hat eine reelle symme-
trische bzw. hermitesche n × n-Matrix n (nicht notwendig
Damit haben wir den einfachen Eigenwert 0 und den doppel- verschiedene) reelle Eigenwerte; es ist somit sinnvoll, von
ten Eigenwert 2. Nun bestimmen wir die Eigenräume: positiven und negativen Eigenwerten zu sprechen.
?⎛ i ⎞@
Das Eigenwertkriterium zur Definitheit
EigA (0) = ker A = ⎝−1⎠ ,
0 Eine reelle symmetrische oder hermitesche n×n-Matrix
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ A ∈ Kn×n ist genau dann
−1 i 0 i 0
positiv definit, wenn alle Eigenwerte von A positiv
EigA (0) = ker ⎝ −i −1 0⎠ = -⎝1⎠ , ⎝0⎠. .
sind,
0 0 0 0 1
negativ definit, wenn alle Eigenwerte von A negativ
Die angegebenen Vektoren bilden bereits eine Orthogonal- sind,
basis des C3 . Wir normieren nun diese Vektoren und erhalten positiv semidefinit, wenn alle Eigenwerte von A po-
eine geordnete Orthonormalbasis B = (b1 , b2 , b3 ), expli- sitiv oder null sind,
zit: negativ semidefinit, wenn alle Eigenwerte von A ne-
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ gativ oder null sind,
i i 0
1 ⎝ ⎠ 1 ⎝ ⎠ indefinit, wenn A positive und negative Eigenwerte
b1 = √ −1 , b2 = √ 1 , b3 = ⎝0⎠ .
2 2 0 hat.
0 1
17.6 Selbstadjungierte Endomorphismen 695
0 0 −i 2 4 8 12 16
Problemanalyse und Strategie: Wir bestimmen die Eigenwerte und die Orthonormalbasen der Eigenräume.
Beweis: Wir begründen das Kriterium für die positive De- Das Hauptminorenkriterium zur Definitheit
finitheit. Die Beweise für die negative Definitheit und die
Eine reelle symmetrische oder hermitesche n×n-Matrix
Semidefinitheit ergeben sich analog. Die Indefinitheit zu be-
A ∈ Kn×n ist genau dann
weisen haben wir als Aufgabe gestellt.
positiv definit, wenn alle n Hauptminoren positiv
Ist λ ∈ R ein Eigenwert einer positiv definiten Matrix A und v sind,
ein zugehöriger Eigenvektor zum Eigenwert λ, so gilt wegen negativ definit, wenn die n Hauptminoren alternie-
A v = λ v durch Skalarproduktbildung dieser Gleichung mit rend sind, d. h.,
dem Vektor v 0 :
det(aij )11 < 0 , det(aij )22 > 0 , det(aij )33 < 0 , . . .
0
A v = v 0 λ v = λ
v
v0 v .
>0 >0 Beweis: Wir begründen das Kriterium für die positive De-
finitheit:
Somit muss λ positiv sein.
⇒: Die Matrix A sei positiv definit. Dann sind auch die Ma-
Interessanter ist, dass auch die Umkehrung gilt. Wir gehen trizen (aij )1≤i,j ≤k für alle k = 1, . . . , n positiv definit. Es
von einer reellen symmetrischen bzw. komplexen hermite- genügt also, wenn wir det(A) > 0 zeigen. Weil A symme-
schen Matrix A ∈ Kn×n aus, deren n nicht notwendig ver- trisch bzw. hermitesch ist, gibt es eine orthogonale Matrix
schiedenen Eigenwerte λ1 , . . . , λn positiv sind. Nach dem 0
S und eine Diagonalmatrix D ∈ Kn×n mit S A S = D.
Satz zur Diagonalisierbarkeit reeller symmetrischer bzw. her-
Da A positiv definit ist, sind sämtliche Diagonaleinträge von
mitescher Matrizen auf Seite 694 existiert eine Orthonormal-
D reell und echt größer Null, insbesondere ist det(D) > 0.
basis B = (v 1 , . . . , v n ) des Kn aus Eigenvektoren von A. 0
Wir stellen v ∈ Kn \ {0} als Linearkombination bezüglich Also folgt det(S A S) = | det(S)|2 det(A) = det(D) > 0
der Basis B dar: und somit det(A) > 0.
⇐: Es sei nun det(aij )1≤i,j ≤k > 0 für alle k = 1, . . . , n.
v = μ1 v 1 + · · · + μn v n , Wir beweisen durch vollständige Induktion nach n, dass A
positiv definit ist. Für n = 1 ist die Behauptung klar. Es
wobei also μ1 , . . . , μn ∈ K sind. sei also n > 1. Wir betrachten die zu A gehörige hermite-
sche Sesquilinearform · : Kn × Kn → K, (v, w) → v 0 A w.
Wegen v 0 0
i v j = 0 für i = j sowie v i v i = 1 erhalten wir mit Wir setzen U = -e1 , . . . , en−1 ., wobei ei wie üblich den
der Sesquilinearität des kanonischen Skalarprodukts: i-ten Vektor der kanonischen Basis des Kn bezeichne, und
à = (aij )1≤i,j ≤n−1 . Die Matrix à beschreibt die Sesquili-
!
n !
n
nearform ·|U ×U eingeschränkt auf den Untervektorraum U .
0
v (A v) = μi v 0 μi λ i v i
i Nach Induktionsvoraussetzung ist ·|U ×U positiv definit. Wir
i=1 i=1
wählen mit dem Verfahren von Gram und Schmidt eine Or-
!
n
= λi |μi |2 v i 2 > 0 , thonormalbasis (a 1 , . . . , a n−1 ) von U bezüglich des Ska-
i=1
larprodukts ·|U ×U und erhalten U = -a 1 , . . . , a n−1 .. Wir
a i ·e n
wählen weiter u = en − n−1 i=1 a i a i ∈ K \ U (wobei
n
Wegen det(−B) = − det(B) für jede quadratische Matrix nachzuweisen. Wir werden eine komplexe Matrix, die diese
B, deren Zeilen- und Spaltenzahl ungerade ist, folgt die Be- Gleichung erfüllt, normal nennen. Unter den komplexen Ma-
hauptung. trizen sind es also genau die normalen Matrizen, die diago-
nalisierbar sind.
Kommentar: Es ist nur dann sinnvoll, eines der beiden Natürlich behandeln wir nicht nur den komplexen Fall. Wir
geschilderten Kriterien zu benutzen, wenn die Matrix klein bestimmen auch im reellen Fall die Normalform normaler
ist. Große Matrizen bringt man besser auf Sylvester’sche Nor- Matrizen. Abgesehen von evtl. 2×2-Kästchen auf der Haupt-
malform. An dieser Normalform kann ebenfalls die Definit- diagonalen ist dies ebenfalls eine Diagonalmatrix.
heit entschieden werden. Wir behandeln diese Normalform
Der Begriff des normalen Endomorphismus verallgemeinert
im Kapitel 18.
orthogonale bzw. unitäre und selbstadjungierte Endomor-
phismen.
Beispiel ' (
1 1 Mit K bezeichnen wir wieder einen der Körper R oder C –
Die Matrix A = ist positiv semidefinit. Sie hat
1 1 im euklidischen Fall ist K = R, im unitären gilt K = C.
nämlich die Eigenwerte 0 und 2.
Mit dem zweiten Kriterium finden wir, dass A nicht positiv
definit ist, da
Nicht zu jedem Endomorphismus gibt es einen
adjungierten Endomorphismus, aber falls
det(aij )11 = 1 > 0 , aber einer existiert, so ist er eindeutig bestimmt
det(aij )22 = det A = 1 · 1 − 1 · 1 ≯ 0 .
⎛ ⎞ Wir nannten einen Endomorphismus ϕ eines euklidischen
1 0 1 bzw. unitären Vektorraums V selbstadjungiert, wenn für alle
Die Matrix A = ⎝0 1 2⎠ ist nach dem zweiten Krite- v, w ∈ V gilt:
1 2 6
rium positiv definit, da v · ϕ(w) = ϕ(v) · w .
det(aij )11 = 1 > 0 , det(aij )22 = 1 · 1 > 0 , Diese Bedingung schwächen wir nun ab: Sind ϕ und ψ Endo-
det(aij )33 = det A = 6 − (1 + 4) > 0 . morphismen eines euklidischen oder unitären Vektorraums
V , so heißt der Endomorphismus ψ zu ϕ adjungiert, wenn
Mit dieser Matrix A ist also das Produkt zwischen Vekto- für alle v, w ∈ V gilt:
ren v und w des R3
v · ϕ(w) = ψ(v) · w .
v · w = v0A w
Ist ϕ selbstadjungiert, so ist ϕ zu sich selbst adjungiert – so
von Vektoren v und w des R3 ein euklidisches Skalar- erklärt sich die Namensgebung der selbstadjungierten Endo-
produkt, und R3 versehen mit diesem Produkt · ist ein morphismen.
euklidischer Vektorraum. Ist ϕ irgendein Endomorphismus von V , so kann man natür-
lich die Frage stellen, ob es überhaupt einen Endomorphis-
? mus ψ von V gibt, der zu ϕ adjungiert ist. Und falls es einen
Entscheiden Sie über die Definitheit einer Diagonalmatrix. gibt, dann fragt man als nächstes, ob es verschiedene solche
zu ϕ adjungierte Endomorphismen geben kann. Wir werden
zeigen, dass, falls es überhaupt einen zu ϕ adjungierten En-
domorphismus ψ gibt, dieser dann eindeutig bestimmt ist.
Daher ist es angebracht, einen Endomorphismus ψ, der zu ϕ
17.7 Normale Endomorphismen adjungiert ist, mit ϕ ∗ zu bezeichnen, ψ = ϕ ∗ , d. h.,
Wir haben gezeigt, dass eine n × n-Matrix A über einem be- v · ϕ(w) = ϕ ∗ (v) · w für alle v, w ∈ V .
liebigen Körper genau dann diagonalisierbar ist, wenn das
charakteristische Polynom über diesem Körper in Linear- Mit ϕ ∗∗ = (ϕ ∗ )∗ bezeichnen wir den (eindeutig bestimmten)
faktoren zerfällt und für jeden Eigenwert die algebraische zu ϕ ∗ adjungierten Endomorphismus.
Vielfachheit gleich der geometrischen ist. Wir leiten nun für
den Körper C ein deutlich einfacheres Kriterium her. Über C Eindeutigkeit des adjungierten Endomorphismus
zerfällt jedes Polynom vom Grad größer gleich 1 in Linear- Es sei ϕ ein Endomorphismus von V . Dann gilt:
faktoren, damit ist die erste Bedingung automatisch erfüllt. (a) Falls ψ und ψ zu ϕ adjungierte Endomorphismen
Anstelle der Gleichheit der Vielfachheiten ist aber tatsächlich sind, so folgt ψ = ψ .
nur die Gleichheit (b) Falls ϕ ∗ existiert, so existiert auch ϕ ∗∗ , und es gilt
0 0 ϕ ∗∗ = ϕ.
A A = AA
698 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Beweis: (a) Es seien ψ und ψ zwei zu ϕ adjungierte Es sei V der Vektorraum der auf dem Intervall [−1, 1]
Endomorphismen. Wir zeigen, dass ψ − ψ der Nullendo- stetigen reellwertigen Funktionen mit dem euklidischen
1
morphismus ist, es folgt dann die Behauptung. Dazu sei ein Skalarprodukt -f, g. = −1 f (x) g(x) dx.
beliebiges v ∈ V vorgegeben. Für alle w ∈ V gilt: Wir wählen den Punkt 0 ∈ [−1, 1] und erklären einen
Endomorphismus ϕ0 von V durch
(ψ(v) − ψ (v)) · w = ψ(v) · w − ψ (v) · w
[−1, 1] → R,
= v · ϕ(w) − v · ϕ(w) ϕ0 : f → f0 :
x → f (0).
= 0.
Das Bild von f unter ϕ0 ist also die konstante Funktion
Somit steht der Vektor (ψ(v) − ψ (v))
auf jedem w ∈ V f0 , die jedem x ∈ [−1, 1] die reelle Zahl f (0) zuord-
senkrecht, d. h., (ψ(v)−ψ (v)) ∈ V ⊥ = {0}. Es folgt ψ(v)− net. Wir zeigen nun, dass zu ϕ0 keine adjungierte Abbil-
ψ (v) = 0. Da v ∈ V beliebig war, gilt diese Gleichheit für dung existiert. Dazu berechnen wir zuerst -f, ϕ0 (g). für
alle v ∈ V , und somit ist ψ − ψ die Nullabbildung. f, g ∈ V :
J 1 J 1
(b) Der zu ϕ adjungierte Endomorphismus ϕ ∗ existiere. Es -f, ϕ0 (g). = f (x) g(0) dx = g(0) f (x) dx .
gilt somit für alle v, w ∈ V −1 −1
J 1
b
Dieser Widerspruch zeigt, dass −1 f (x) dx = 0 gilt.
-f, ϕh (g). = f (x) h(x) g(x) dx
a Aber auch diese Gleichheit ist sicher nicht für alle f ∈ V
J b erfüllt. Und dieser Widerspruch begründet nun, dass zu ϕ
= h(x) f (x)g(x) dx keine adjungierte Abbildung existieren kann.
a
Es sei V der Vektorraum aller 2 π-periodischen, unendlich
= -ϕh (f ), g. . oft differenzierbaren komplexwertigen Funktionen auf R.
Dabei heißt eine Funktion 2 π-periodisch, falls
Damit ist der zu ϕh adjungierte Endomorphismus gleich
ϕh , d. h., ϕh∗ = ϕh . f (x + 2 π) = f (x) für alle x ∈ R .
17.7 Normale Endomorphismen 699
Wir versehen den Vektorraum V mit dem unitären Skalar- Ein Endomorphismus ist normal, wenn er mit
produkt J seinem Adjungierten kommutiert
π
-f, g. = f (x) g(x) dx .
−π Nun kommen wir endlich zu der Definition normaler Endo-
Nun betrachten wir den Endomorphismus ϕ : V → V , morphismen.
f → f . Mit partieller Integration gilt:
J π Normale Endomorphismen und Matrizen
-f, ϕ(g). = f (x) g (x) dx Ein Endomorphismus ϕ eines euklidischen bzw. uni-
−π
tären Vektorraums V heißt normal, falls der adjun-
= f (π ) g(π) − f (−π) g(−π)
gierte Endomorphismus ϕ ∗ existiert und
=0
J π ϕ ◦ ϕ∗ = ϕ∗ ◦ ϕ
− f (x) g(x) dx
−π gilt.
= -−ϕ(f ), g. . Eine Matrix A ∈ Kn×n heißt normal, falls
0 0
Somit gilt ϕ ∗ = −ϕ. A A = AA
gilt.
Wir untersuchen nun die Standardvektorräume Rn und Cn
mit den kanonischen Skalarprodukten. Jeder Endomorphis- Im Fall K = R heißt eine quadratische Matrix also dann nor-
mus ϕ : Kn → Kn hat die Form ϕ = ϕA : v → A v mit mal, wenn A0 A = A A0 gilt. Wir listen zahlreiche Beispiele
einer Matrix A ∈ Kn×n . Wir können den Endomorphismus auf.
ϕ mit der Matrix A identifizieren. Wie sieht die Matrix des zu
ϕ adjungierten Endomorphismus aus? Existiert der zu ϕ ad- Beispiel
jungierte Endomorphismus überhaupt? Die Antworten sind Jede symmetrische Matrix A ∈ Rn×n ist normal; es gilt
bestechend einfach: A0 = A und damit A0 A = A A0 .
Jede hermitesche Matrix A ∈ Cn×n ist normal; es gilt
Adjungierte von Matrizen 0 0 0
A = A und damit A A = A A .
Es sei V = Rn mit dem kanonischen euklidischen Jede schiefsymmetrische Matrix A ∈ Rn×n ist normal; es
Skalarprodukt. Ist A ∈ Rn×n , so gilt für den Endo- gilt A0 = −A und damit A0 A = A A0 .
morphismus ϕA : v → A v: Jede schiefhermitesche Matrix A ∈ Cn×n ist normal. Da-
∗
bei heißt eine Matrix A ∈ Cn×n schiefhermitesch, falls
ϕA = ϕA0 . 0
gilt A = −A. Für jede solche Matrix gilt A0 A = A A0 .
Jede orthogonale Matrix A ∈ Rn×n ist normal; es gilt
Es sei V = Cn mit dem kanonischen unitären Ska- A0 = A−1 und damit A0 A = A A0 .
larprodukt. Ist A ∈ Cn×n , so gilt für den Endomor- 0
Jede unitäre Matrix A ∈ Cn×n ist normal; es gilt A =
phismus ϕA : v → A v: 0 0
A−1 und damit A' A = (AA .
∗ 1 2
ϕA = ϕA0 . Die Matrix A = ∈ R2×2 ist nicht normal. Es gilt:
3 4
0 ' ('( ' (
Man nennt die Matrix A ∈ Kn×n die zu A ∈ Kn×n 1 2 1 3 5 11
adjungierte Matrix. A A0 = =
3 4 2 4 11 25
' (' ( ' (
0 1 3 1 2 10 14
A A= =
Beweis: Für alle v, w ∈ Rn gilt: 2 4 3 4 14 20
v · ϕA (w) = v 0 (A w) = (A0 v)0 w = ϕA0 (v) · w . Jeder orthogonale bzw. unitäre Endomorphismus ϕ eines
euklidischen bzw. unitären Vektorraums V ist normal.
Im komplexen Fall folgt die Aussage analog.
Denn es gilt für alle v, w ∈ V :
Achtung: Man verwechsle nicht die adjungierte Matrix v · ϕ(w) = ϕ −1 (v) · ϕ −1 (ϕ(w)) = ϕ −1 (v) · w .
(siehe oben) mit der adjunkten Matrix (Seite 485).
Somit gilt ϕ ∗ = ϕ −1 . Beachte ϕ ∗ ◦ ϕ = idV = ϕ ◦ ϕ ∗ .
Jeder selbstadjungierte Endomorphismus ϕ ist normal; es
Im Standardvektorraum Kn existiert somit zu jedem Endo- gilt ϕ ∗ = ϕ.
morphismus ϕ der dazu adjungierte Endomorphismus ϕ ∗ . Ist Der Endomorphismus aus obigem Beispiel (das Differen-
A die Darstellungsmatrix von ϕ bezüglich der kanonischen zieren der 2π-periodischen Funktionen) ist normal; es gilt
0
Basis, so ist A diese von ϕ ∗ . ϕ ∗ = −ϕ.
700 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Damit sind die normalen Endomorphismen eine gemein- von ϕ und λ. Wegen ϕ ∗∗ = ϕ und λ = λ gilt folglich
same Verallgemeinerung der orthogonalen bzw. unitären und Eϕ ∗ (λ) ⊆ Eϕ (λ).
Diagonalmatrix: A = diag(λ1 , . . . , λn ), hat die die Spalten und Zeilen der Matrix bilden Orthonormal-
Eigenwerte λ1 , . . . , λn , ist genau dann invertierbar, basen des Rn :
wenn λ1 , . . . , λn = 0: ⎛ ⎞
' ( − √1 √1
1 0 A = ⎝ 1 2 12 ⎠
A= √ √
0 3 2 2
Obere bzw. untere Dreiecksmatrix: Die Eigenwerte Spezielle orthogonale Matrix: eine orthogonale Ma-
stehen auf der Hauptdiagonalen, ist zu einer Jordan- trix mit det A = 1, stellt eine Drehung dar:
Matrix ähnlich, ist genau dann invertierbar, wenn alle ⎛ ⎞
Diagonaleinträge ungleich null sind: √1 − √1
' ( A=⎝ 2 2⎠
1 2 √1 √1
A= 2 2
0 3
0
Reelle symmetrische Matrix: A0 = A, hat nur reelle Unitäre Matrix: A = A−1 , hat Eigenwerte vom Be-
Eigenwerte, ist diagonalisierbar, liefert eine symmetri- trag 1, ist invertierbar, ist diagonalisierbar, die Spalten
sche Bilinearform: und Zeilen der Matrix bilden Orthonormalbasen des
' ( Cn : ⎛ ⎞
1 2 √1 √1
A=
2 3 A=⎝ 2 2 ⎠
√i − i
√
2 2
Hermitesche Matrix: A0 = A, hat nur reelle Eigen-
werte, ist diagonalisierbar, liefert eine hermitesche Ses- Positiv definite Matrix: v 0 A v > 0 für alle v = 0, ist
quilinearform: ' ( symmetrisch, hat nur positive Eigenwerte, ist invertier-
1 −i bar, liefert ein Skalarprodukt:
A=
i 3 ' (
1 2
Reelle schiefsymmetrische Matrix: A0 = −A, hat A=
2 5
nur Nullen auf der Hauptdiagonalen, hat nur rein ima-
ginäre Eigenwerte: Negativ definite Matrix: v 0 A v < 0 für alle v = 0,
' (
0 −1 ist symmetrisch, hat nur negative Eigenwerte, ist inver-
A=
1 0 tierbar: ' (
−3 2
A=
Invertierbare Matrix: A A−1 = En , es gilt det A = 2 −2
0, hat höchstens Eigenwerte ungleich 0:
' ( Indefinite Matrix: Es gibt v, w mit v 0 A v < 0 und
1 0 w 0 A w > 0, ist symmetrisch, hat einen negativen und
A=
2 3 positiven Eigenwert:
' (
Idempotente Matrix: A2 = A, stellt eine Projektion −1 2
A=
dar, hat höchstens die Eigenwerte 0 und 1, ist diagona- 2 −2
lisierbar: 1 1
2 2 Reelle normale Matrix: A0 A = A A0 , ist von evtl.
A=
1 1 2 × 2 -Kästchen auf der Hauptdiagonalen abgesehen
2 2
diagonalisierbar:
Nilpotente Matrix: Ap = 0 für ein p ∈ N, hat den ' (
einzigen Eigenwert 0, ist zu einer Jordan-Matrix ähn- 1 −1
A=
lich: ' ( 1 1
−1 1
A=
−1 1 0 0
Komplexe normale Matrix: A A = A A , ist dia-
Orthogonale Matrix: A0 = A−1 , hat höchstens die gonalisierbar: ' (
Eigenwerte ±1, ist invertierbar, ist von evtl. Drehkäst- 1 i
A=
chen auf der Diagonalen abgesehen diagonalisierbar, −i 5
702 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
und Schmidt ist es möglich, in den Eigenräumen Orthonor- Mit dem Gram-Schmidt’schen Orthonormierungsverfahren
malbasen zu erzeugen, solange die Dimensionen der Eigen- können wir in jedem der r Eigenräume Eigϕ (λi ) eine Ortho-
räume höchstens abzählbar unendlich sind. Falls zudem noch normalbasis Bi konstruieren. Die Vereinigung
L⊥ = {0} im Teil (b) gilt, so ist das Orthonormalsystem sogar
eine Orthonormalbasis. Und nun kommt das Entscheidende:
r
B= Bi
Ist V endlichdimensional, so sind diese zwei Dinge von selbst
i=1
erfüllt.
dieser Orthonormalbasen B1 , . . . , Br ist dann eine Ortho-
normalbasis von V . Die Elemente von B sind Eigenvektoren
Zu jedem normalen Endomorphismus eines von ϕ. Damit ist alles begründet.
0 = 0 · v i = (v 1 + · · · + v r ) · v i = v i 2 ,
Beim Spektralsatz für unitäre Räume bzw. für normale Matri-
d. h., dass v 1 = · · · = v r = 0 gilt. Wir haben begründet, zen ist es ganz wesentlich, dass der Grundkörper der Körper
dass V die direkte orthogonale Summe der Eigenräume ist, C der komplexen Zahlen ist. Über C zerfällt nämlich jedes
d. h. Polynom in Linearfaktoren, sodass man sich um die allge-
V = Eigϕ (λ1 ) 9⊥ ··· 9
⊥ Eigϕ (λr ) . meine Voraussetzung zur Diagonalisierbarkeit, dass nämlich
17.7 Normale Endomorphismen 703
das charakteristische Polynom zerfallen muss, nicht den Kopf Beweis: (a) Wir schreiben kürzer ϕ = ϕA . Ist v ∈ Eϕ (λ),
zerbrechen muss. Über R ist dies nicht gewährleistet. Und so gilt:
so wird man natürlich erwarten, dass man über R nicht je- ϕ(v) = A v = A v = λ v = λ v ,
den normalen Endomorphismus bzw. jede normale Matrix d. h., dass v ∈ Eϕ (λ), d. h., Eϕ (λ) ⊆ Eϕ (λ). Wendet man
diagonalisieren kann. Wir untersuchen nun den reellen Fall nun diese Argumentation auf λ anstelle von λ an, so erhält
genauer. man die andere Inklusion Eϕ (λ) ⊆ Eϕ (λ). Damit ist bereits
(a) gezeigt.
Zu jedem normalen Endomorphismus eines (b) Es gilt:
euklidischen Vektorraums gibt es eine Ortho- 1 1
normalbasis bezüglich der die Darstellungs- Re (v) = (v + v) , Im (v) = (v − v) .
2 2i
matrix eine Blockdiagonalmatrix ist Damit erhalten wir
Wir haben bereits erwähnt, dass es zu orthogonalen und Re (λ) Re (v) − Im (λ) Im (v) =
' (
selbstadjungierten Endomorphismen ϕ eines endlichdimen- 1 1
sionalen euklidischen Vektorraums V eine Orthonormalbasis = (λ + λ) (v + v) − 2 (λ − λ) (v − v)
4 i
gibt bezüglich der die Darstellungsmatrix von ϕ eine Block- 1
diagonalgestalt hat (Seiten 688 und 693). Im Fall eines selbst- = (2 λ v − 2 λ v)
4
adjungierten Endomorphismus ist die Darstellungsmatrix so- 1
gar diagonal, im Fall eines orthogonalen = (ϕ(v) + ϕ(v))
Endomorphismus
α − sin α auf. 2
tauchen evtl. 2 × 2 -Matrizen der Form cos sin α cos α = ϕ(Re (v)) .
Nun sind orthogonale und selbstadjungierte Endomorphis-
men insbesondere normal. Wir erhalten somit diese Resultate Damit ist (i) in (b) nachgewiesen, die Gleichung in (ii) zeigt
aus dem allgemeineren Satz für normale Endomorphismen: man analog.
Der Spektralsatz für euklidische Räume Mit diesem Lemma ist der Beweis des Spektralsatzes kurz.
Es sei ϕ ein normaler Endomorphismus des endlichdi-
mensionalen euklidischen Vektorraums V . Dann besitzt Beweis: (des Spektralsatzes für euklidische Räume) Wir
V eine Orthonormalbasis B, sodass dürfen ohne Einschränkung annehmen, dass V = Rn , · das
⎛ ⎞ kanonische Skalarprodukt und ϕ = ϕA durch eine normale
λ1 Matrix A ∈ Rn×n gegeben ist. Nach dem Spektralsatz für
⎜ ⎟
⎜ .. ⎟ normale Matrizen existiert eine Orthonormalbasis B̃ von Cn
⎜ . ⎟
⎜ ⎟
⎜ ⎟ aus Eigenvektoren von A. Nach obigem Lemma kann B̃ als
⎜ λr ⎟
⎜ ⎟
⎜ ⎟
⎜
⎜ a1 −b1 ⎟
⎟ B̃ = (v 1 , . . . , v r , v r+1 , v r+1 , . . . , v r+s , v r+s )
B M(ϕ)B = ⎜
⎜ b1 a1
⎟
⎟
⎜ ⎟ gewählt werden, wobei für i ≤ r der Vektor v i ein Eigen-
⎜ ⎟
⎜ .. ⎟
⎜
⎜ . ⎟
⎟ vektor zum Eigenwert λi ∈ R sogar aus dem Rn gewählt
⎜ ⎟
⎜ ⎟ werden kann, und für j > r der Vektor v j Eigenvektor zum
⎜ as −bs ⎟
⎝ ⎠ Eigenwert λj ∈ C \ R ist. Setze für jedes solche j nun
bs as
√ √
uj = 2 Re (v j ) , w j = 2 Im (v j ) ∈ Rn .
mit λ1 . . . , λr , a1 , . . . , as , b1 , . . . , bs ∈ R, b1 , . . . ,
bs = 0. Im Fall s = 0 ist ϕ diagonalisierbar. Es gilt dann:
√ 2
2
Zum Beweis dieses Satzes benötigen wir eine Hilfsaussage, uj · wj = (v j + v j ) (v j − v j )
2
die wir dem Beweis des Spektralsatzes voranstellen.
1
= (v j 2 − v j 2 ) = 0
Lemma 2
Wir betrachten den Endomorphismus ϕA : Cn → Cn , und
v → A v, wobei A ∈ Rn×n . Dann gilt für jedes λ ∈ C: √ 2
2 2
(a) EϕA (λ) = EϕA (λ) = {v | v ∈ EϕA (λ)}. uj = (v j + v j ) (v j + v j )
2
(b) Für v ∈ EϕA (λ) seien Re (v), Im (v) ∈ Rn der Real-
und Imaginärteil von v. Dann gilt: 1
=(1 + 1) = 1 ,
(i) ϕA (Re (v)) = Re (λ) Re (v) − Im (λ) Im (v), 2
(ii) ϕA (Im (v)) = Im (λ) Re (v) + Re (λ) Im (v). wj 2 = 1 .
704 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Diagonalgestalt hat. Beweis: Laut dem Spektralsatz für euklidische Räume be-
sitzt V eine Orthonormalbasis B, sodass
⎛ ⎞
Beweis: Ist A ∈ Rn×n symmetrisch, so ist der Endomor- λ1
phismus ϕA : v → A v selbstadjungiert und somit normal. ⎜ ⎟
⎜ .. ⎟
⎜ . ⎟
Nach dem Spektralsatz für euklidische Räume gibt es eine ⎜ ⎟
⎜ ⎟
⎜ λr ⎟
Orthonormalbasis B des Rn aus Eigenvektoren von A mit ⎜ ⎟
⎜ ⎟
der im Satz angegeben Form, B M(ϕA )B = S −1 A S, wo- ⎜
⎜ a1 −b1 ⎟
⎟
bei die Spalten der orthogonalen Matrix S die Orthonormal- B M(ϕ)B =⎜
⎜ b1 a1
⎟
⎟
⎜ ⎟
basis B bilden. Man beachte, dass die Darstellungsmatrix ⎜ ⎟
⎜ .. ⎟
−1 ⎜ . ⎟
B M(ϕA )B = S A S wegen ⎜
⎜
⎟
⎟
⎜ ⎟
⎜ as −bs ⎟
(S −1 A S)0 = S 0 A0 (S −1 )0 = S −1 A S ⎝ ⎠
bs as
symmetrisch ist. Daher kann es wegen −bi = bi , bi = 0,
keine 2 × 2-Kästchen auf der Diagonalen von B M(ϕA )B mit λ1 , . . . , λr , a1 , . . . , as , b1 , . . . , bs ∈ R, b1 , . . . , bs = 0.
geben. Somit ist B M(ϕA )B eine Diagonalmatrix.
Da B eine Orthonormalbasis ist, ist die Matrix B M(ϕ)B
Nun existiere zu A ∈ Rn×n eine orthogonale Matrix S, d. h., orthogonal. Damit gilt λ2i = 1, sodass λi = ±1 für alle
S −1 = S 0 , sodass D = S −1 A S eine Diagonalmatrix ist.
i = 1, . . . , r. Und für die Kästchen ( abii −b
ai ) gilt ai +bi = 1
i 2 2
Es folgt:
für alle i = 1, . . . , s. Somit gibt es zu jedem solchen Käst-
A = S D S −1 = S D S 0 chen ein αi ∈]0, 2 π[\{π} mit ai = cos αi und bi = sin αi ,
d. h.
= (S D 0 S 0 )0 ' ( ' (
ai −bi cos αi − sin αi
= (S D S 0 )0 =
bi ai sin αi cos αi
= A0 .
für jedes solche i. Damit hat B M(ϕ)B die gewünschte
Folglich ist A symmetrisch. Form.
Zusammenfassung 705
reell komplex
Zusammenfassung
Im Folgenden bezeichne K einen der Körper R oder C. Bei ein Skalarprodukt. Weitere Beispiele erhält man mit positiv
einem Skalarprodukt eines K-Vektorraums V werden Vekto- definiten Matrizen. Dabei nennt man eine n × n-Matrix A
0
ren verknüpft, und als Ergebnis erhält man einen Skalar aus mit A = A positiv definit, wenn für alle v ∈ Kn
K, genauer:
v 0 A v ≥ 0 und v 0 A v = 0 ⇔ v = 0
Definition von Skalarprodukt
gilt. Ist A ∈ Kn×n positiv definit, so wird durch
Ist V ein K-Vektorraum, so heißt eine Abbildung
v · w = v0A w
V × V → K,
·:
(v, w) → v · w
ein Skalarprodukt auf dem Kn erklärt. Ist umgekehrt · ein
Skalarprodukt eines endlich-dimensionalen Vektorraums V
ein Skalarprodukt, wenn für alle v, v , w ∈ V und
mit der Basis B = (b1 , . . . , bn ), so ist die sogenannte Dar-
λ ∈ K die folgenden Eigenschaften erfüllt sind:
stellungsmatrix des Skalarprodukts
(i) (v +v )·w = v ·w +v ·w und (λ v)·w = λ (v ·w),
(ii) v · w = w · v, ⎛ ⎞
b1 · b1 · · · b 1 · bn
(iii) v · v ≥ 0 und v · v = 0 ⇔ v = 0. ⎜ .. ⎟ ∈ Kn×n
M B (·) = (bi · bj )i,j = ⎝ ... . ⎠
Im Fall K = R nennt man das Skalarprodukt euklidisch und b n · b 1 · · · bn · bn
V einen euklidischen Vektorraum, im Fall K = C nennt man
· unitär und V einen unitären Vektorraum. Das bekannteste positiv definit. Ist C eine weitere Basis von V , so sind die Ma-
Beispiel ist das kanonische Skalarprodukt: Für jede natürli- trizen M B und M C zueinander kongruent, d. h., es existiert
che Zahl n ist im Vektorraum Kn das Produkt eine invertierbare Matrix S ∈ Kn×n mit
0
v · w = v0w S MB S = MC .
706 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren
Vor allem für die Anwendungen ist das folgende Beispiel Damit stellt sich gleich die Frage nach Orthonormalbasen
eines Skalarprodukts wichtig. Für reelle Zahlen a < b be- in solchen Vektorräumen, also nach Basen, bei denen je
zeichne C den Vektorraum aller auf [a, b] stetigen Funktio- zwei verschiedenen Elemente orthogonal zueinander sind
nen mit Werten in K. Setzt man für f, g ∈ C und jedes Element die Länge 1 hat. Mithilfe des Gram-
J b Schmidt’sche Orthonormierungsverfahren kann zu jeder end-
-f, g. = f (t) g(t) dt , lichen linear unabhängigen Menge X = {a 1 , . . . , a n } von
a Vektoren von V eine Orthonormalbasis B = {b1 , . . . , bn }
so ist - , . ein Skalarprodukt. angeben werden, die denselben Vektorraum erzeugt, d. h.
-X. = -B., damit erhält man:
Durch das Skalarprodukt kann man Vektoren v ∈ V eine
Länge und je zwei Vektoren v, w ∈ V einen Abstand und
im Fall K = R einen dazwischenliegenden Winkel zuordnen. Existenz von Orthonormalbasen
Diese Begriffe stimmen natürlich im Fall K = R und V = R2
Jeder höchstens abzählbardimensionale euklidische
oder V = R3 mit den kanonischen Skalarprodukten mit den
Vektorraum besitzt eine Orthonormalbasis.
anschaulichen Begriffen von Länge, Abständen und Winkel
überein. Für die Definition der Norm bzw. der Länge
√ Von den strukturerhaltenden Abbildungen von Vektorräumen
v = v · v
mit einem Skalarprodukt haben wir drei Arten genauer unter-
eines Vektors v ist wesentlich, dass das Skalarprodukt positiv sucht: Die orthogonalen bzw. unitären Endomorphismen, die
definit ist. Mithilfe dieser Norm erklärt man den Abstand selbstadjungierten Endomorphismen und die normalen En-
zwischen Vektoren v und w als die nichtnegative reelle Zahl domorphismen. Dabei sind die ersten zwei Arten spezielle
normale Endomorphismen.
d(v, w) = v − w = w − v .
Um nun auch Winkel zwischen Vektoren einführen zu kön-
nen, benötigen wir die Cauchy-Schwarz’sche Ungleichung: Orthogonale und unitäre Endomorphismen
Für alle v und w aus V gilt Einen Endomorphismus ϕ von V mit der Eigenschaft
für alle v und w eines Vektorraums V mit Skalarprodukt Orthogonale bzw. unitäre Endomorphismen sind nicht nur
begründen, zum anderen benutzt man sie wegen längenerhaltend, sie erhalten auch die Orthogonalität zwi-
v·w schen vom Nullvektor verschiedenen Vektoren.
−1 ≤ ≤1
v w Die wichtigsten Beispiele orthogonaler Endomorphismen
zur Definition des Winkels α ∈ [0, π] im Fall K = R zwi- des Rn sind Spiegelungen. Diese sind nämlich die Bau-
schen je zwei vom Nullvektor verschiedenen Vektoren durch steine, aus denen die orthogonalen Endomorphismen aufge-
v·w baut sind: Jeder orthogonale Endomorphismus ϕ des Rn ist
α = arccos . nämlich ein Produkt von höchstens n Spiegelungen.
v w
Daher ist es auch sinnvoll zu sagen, zwei Vektoren v und w in Orthogonale bzw. unitäre Endomorphismen hängen eng
V sind orthogonal zueinander, wenn das Skalarprodukt v · w mit orthogonalen bzw. unitären Matrizen zusammen. Da-
den Wert null ergibt. Für zueinander orthogonale Vektoren bei nennt man eine Matrix A ∈ Rn×n orthogonal, falls
kann man zeigen: A0 A = En gilt, und eine Matrix A ∈ Cn×n heißt unitär,
0
falls A A = En gilt. Damit bilden die Spalten und Zeilen
Orthogonale Vektoren sind linear unabhängig einer orthogonalen bzw. unitären Matrix eine Orthonormal-
Jede Menge von Vektoren = 0 in V , die paarweise or- basen des Rn bzw. Cn . Der angesprochene Zusammenhang
thogonal zueinander sind, ist linear unabhängig. zwischen den Endomorphismen und den Matrizen beschreibt
der Satz:
Zusammenfassung 707
phismus ϕ ∗ gibt und ϕ mit ϕ ∗ vertauschbar ist, d. h., wenn Der Spektralsatz für euklidische Räume
gilt
Es sei ϕ ein normaler Endomorphismus des endlichdi-
ϕ ◦ ϕ∗ = ϕ∗ ◦ ϕ .
mensionalen euklidischen Vektorraums V . Dann besitzt
Selbstadjungierte, orthogonale und unitäre Endomorphismen V eine Orthonormalbasis B, sodass
sind Beispiele normaler Endomorphismen. Das wichtigste ⎛ ⎞
Ergebnis ist: Zu einem normalen Endomorphismus ϕ eines λ1
⎜ ⎟
komplexen Vektorraums existiert stets eine Orthonormalba- ⎜ .. ⎟
⎜ . ⎟
⎜ ⎟
sis aus Eigenvektoren von ϕ: ⎜ ⎟
⎜ λr ⎟
⎜ ⎟
⎜ ⎟
⎜ a1 −b1 ⎟
⎜ ⎟
Der Spektralsatz für unitäre Räume B M(ϕ)B =⎜ ⎟
⎜ b1 a1 ⎟
⎜ ⎟
Es sei ϕ ein normaler Endomorphismus des endlichdi- ⎜ ⎟
⎜ .. ⎟
mensionalen unitären Vektorraums V . Dann besitzt V ⎜ . ⎟
⎜ ⎟
⎜ ⎟
eine Orthonormalbasis, die aus Eigenvektoren von ϕ be- ⎜ ⎟
⎜
⎝ as −bs ⎟
⎠
steht. Insbesondere ist ϕ diagonalisierbar. bs as
Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!
Verständnisfragen Rechenaufgaben
17.1 • Sind die folgenden Produkte Skalarprodukte? 17.5 •• Gegeben ist die reelle, symmetrische Matrix
⎧
⎨ '' R( ×'R2 (( →
2 R, ⎛ ⎞
10 8 8
·: v1 w1 ,
⎩ , → v1 − w1 . A = ⎝ 8 10 8 ⎠
v2 w2
⎧ 2 × R2
8 8 10
⎨ '' R( ' (( → R,
·: v1 w1 Bestimmen Sie eine orthogonale Matrix S ∈ R3×3 , sodass
⎩ , → 3 v1 w1 + v1 w2 + v2 w1 + v2 w2 .
v2 w2 D = S −1 A S eine Diagonalmatrix ist.
P i = bi b0
i ∈R
n×n
für jedes i ∈ {1, . . . , n} .
−5 5 x1
Zeigen Sie:
x1 = −x2
!
n
(a) ϕP2 i = ϕP i und (b) En = Pi .
−5 i=1
17.18 •• Zeigen Sie, dass eine hermitesche Matrix A ∈ 17.21 • Es sei U ein Untervektorraum eines euklidi-
Cn×n genau dann indefinit ist, wenn sie sowohl einen posi- sches Vektorraums V . Zeigen Sie, dass im Fall U = R u mit
tiven als auch einen negativen Eigenwert hat (Seite 694). u = 1 die orthogonale Projektion π durch π(v) = (v·u) u,
v ∈ V , gegeben ist (Seite 675).
17.19 •• Eine Matrix A ∈ Kn×n , K ein Körper, nennt
man idempotent, falls A2 = A gilt. Zeigen Sie: Für jede 17.22 • Zeigen Sie: Die Matrix eiA ist unitär, falls
idempotente Matrix A ∈ Kn×n gilt: A∈C n×n hermitesch ist.
Kn = ker A ⊕ Bild A . 17.23 • Zeigen Sie, dass man den Spektralsatz für
einen selbstadjungierten Endomorphismen ϕ eines endlich-
dimensionalen R- bzw. C-Vektorraums V auch wie folgt for-
17.20 •• Zeigen Sie, dass die Q R-Zerlegung A = Q R mulieren kann: Es ist ϕ eine Linearkombination der orthogo-
für eine invertierbare Matrix A eindeutig ist, wenn man for- nalen Projektionen auf die verschiedenen Eigenräume, wobei
dert, dass die Diagonaleinträge von R positiv sind. die Koeffizienten die Eigenwerte sind.
S. 674 S. 687
Gilt Weil in diesem Fall die Matrix A den zweifachen Eigenwert
u + u = v = w + w 1 haben müsste; der dritte (verbleibende) Eigenwert müsste
für Elemente u, w ∈ U und u , w ∈ U ⊥ , so folgt: dann aber auch 1 sein, da die Determinante das Produkt der
Eigenwerte ist.
u − w = w − u .
∈U S. 688
∈U ⊥
Dann rutscht die 1 mit zugehöriger Zeile und Spalte nach
Weil aber für den Durchschnitt U ∩ U ⊥ = {0} gilt, folgt rechts unten durch,
sogleich u = w und u = w , also die Eindeutigkeit einer ⎛ ⎞
1 0 0
solchen Darstellung.
⎝0 cos α − sin α ⎠ ,
0 sin α cos α
S. 678
⎛ ⎞ ⎛ ⎞
v1 cos α 0 − sin α
⎜ .. ⎟ ⎝ 0 1 0 ⎠,
v = ⎝ . ⎠ ∈ Cn mit v1 = i und v2 , . . . , vn = 0, der Fall
cos α 0 sin α
vn ⎛ ⎞
n = 1 ist eingeschlossen. cos α − sin α 0
⎝ sin α cos α 0⎠ .
0 0 1
S. 685
Ja, das prüft man durch den Nachweis von A0 A = E3 nach.
S. 697
S. 686 Eine Diagonalmatrix D = diag(λ1 , . . . , λn ) ist genau
Sind B = (b1 , . . . , bn ) eine Orthonormalbasis von V und dann positiv semidefinit bzw. negativ semidefinit, wenn alle
ϕ : V → V linear, so gilt für A = B M(ϕ)B : λ1 , . . . , λn größer gleich bzw. kleiner gleich null sind. Die
Diagonaleinträge von D sind nämlich die Eigenwerte der
A0 A = En ⇔ v · w = ϕ(v) · ϕ(w) ∀ v, w ∈ V . Matrix D.
Quadriken – vielseitig
nutzbare Punktmengen 18
Was ist ein hyperbolisches
Paraboloid?
Warum ist die Signatur einer
quadratischen Form träge?
Inwiefern löst die
Pseudoinverse unlösbare
Gleichungssysteme?
Unter einer Quadrik in einem affinen Raum verstehen wir die eine Bilinearform auf V , wenn für alle x, x , y, y ∈ V und
Menge jener Punkte, deren Koordinaten einer quadratischen λ ∈ K gilt:
Gleichung genügen.
σ (x + x , y) = σ (x, y) + σ (x , y) ,
Die zweidimensionalen Quadriken sind – von Entartungsfällen σ (λx, y) = λ σ (x, y) ,
abgesehen – identisch mit den Kegelschnitten und seit der σ (x, y + y ) = σ (x, y) + σ (x, y ) ,
Antike bekannt. Den Ausgangspunkt für die Untersuchung der σ (x, λy) = λ σ (x, y) .
Kegelschnitte bildete damals allerdings nicht deren Gleichung,
sondern die Kegelschnitte wurden als geometrische Orte ein- Die Bilinearform σ heißt symmetrisch, wenn stets gilt:
geführt, etwa die Ellipse als Ort der Punkte, deren Abstände σ (y, x) = σ (x, y). Bei σ (y, x) = −σ (x, y) heißt die Bi-
von den beiden Brennpunkten eine konstante Summe erge- linearform alternierend.
ben. Aber auch die Tatsache, dass Ellipsen als perspektive
Bilder von Kreisen auftreten, war vermutlich bereits um etwa Beispiel Bei V = R2 ist z. B.
300 v. Chr. bekannt. Anfang des 17. Jahrhunderts konnte Johan- σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5x2 y2
nes Kepler nachweisen, dass die Planetenbahnen Ellipsen sind. ' ( ' (
Sir Isaak Newton formulierte die zugrunde liegenden mechani- für x = xx1 , y = yy1 eine symmetrische Bilinearform.
2 2
schen Gesetze und erkannte, dass sämtliche Kegelschnitttypen
So wie im Kapitel 17 können wir diese Bilinearform auch
als Bahnen eines Massenpunkts bei dessen Bewegung um eine
mithilfe einer symmetrischen Matrix A darstellen, nämlich
zentrale Masse auftreten.
als
Dies war nur der Anfang jener herausragenden Bedeutung der ' (' (
1 1 y1
Kegelschnitte und ihrer höherdimensionalen Gegenstücke für σ (x, y) = x 0 A y = (x1 x2 ) .
1 −5 y2
die Mathematik und ihre Anwendungen in Naturwissenschaften
und Technik. Quadriken haben bemerkenswerte geometrische Dabei ist zu beachten, dass an der Stelle (i, j ) der Matrix A
Eigenschaften und werden oft als lokale oder globale Approxi- der Koeffizient von xi yj steht.
mationen für Kurven und Flächen verwendet. Ellipsoide spielen
Von der Berechnung zweireihiger Determinanten her kennen
in der Konvexitätstheorie eine besondere Rolle. Doch soll die
wir die alternierende Bilinearform
ästhetische Seite nicht unerwähnt bleiben, so treten Ellipsoide
als Kuppeln auf oder hyperbolische Paraboloide als attraktive σ (x, y) = x1 y2 − x2 y1 .
Dachflächen.
Die Matrix der Koeffizienten ist schiefsymmetrisch, denn
Wir behandeln im Folgenden die Hauptachsentransformation ' (' (
und damit zusammenhängend die Klassifikation der Quadriken. 0 1 y1
σ (x, y) = (x1 x2 ) .
Von den Quadriken ist es nur ein kurzer Weg zu anderen −1 0 y2
wichtigen Begriffen wie der „Singulärwertzerlegung“ oder der
„Pseudoinversen“ einer Matrix, welche z. B. bei Problemen der
Ausgleichsrechnung und Approximation eingesetzt werden. Zu je zwei Bilinearformen σ1 , σ2 auf dem K-Vektorraum V
lässt sich eine Summe definieren durch die Vorschrift
9
1
linearform σ : V × V → K auf die Diagonale {(x, x) | −4
4
x ∈ V } von V einschränken. Das bedeutet, wir betrachten −1
1
0 0 x1
nur die Fälle von σ (x, y) mit x = y. Dann entsteht eine
−3 −2 −1 0 1 2
quadratische Form −1
1
−4
4
V → K, −1 −9
ρ:
9
x → ρ(x) = σ (x, x) −16
−2 −25
auf V . Auf Seite 716 lernen wir übrigens eine von σ unab-
−36
hängige Definition quadratischer Formen kennen.
Abbildung 18.1 Einzelne Niveaulinien der quadratischen Form ρ(x) =
In dem Sonderfall einer alternierenden Bilinearform σ ent-
x12 + 2x1 x2 − 5x22 , also Fasern { x | ρ(x) = c = konst.} der Abbildung
steht als Einschränkung auf die Diagonale von V ledig- ρ.
lich die Nullform, denn wegen σ (y, x) = −σ (x, y) ist
ρ(x) = σ (x, x) = −σ (x, x), und somit ρ(x) = 0 für alle
x ∈ V. 36 x2
25
2
Beispiel Bei unserem Zahlenbeispiel, der symmetrischen 16
Bilinearform 9
4 1
σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5 x2 y2 1
eine Vorstellung von der Werteverteilung der quadratischen Bei char K = 2 ist & σ gleichzeitig alternierend, d. h.
Form. Abbildung 18.1 zeigt die Niveaulinien zu den Werten &
σ (y, x) = −&σ (x, y), und die Einschränkung von & σ auf
c = 0, ±1, ±4, . . . Im Gegensatz dazu nimmt die in Abbil- die Diagonale ist die Nullform.
dung 18.2 gezeigte quadratische Form keine negativen Werte
an. Alternativ dazu ist in Abb. 18.3 eine quadratische Form Folgerung
dargestellt, bei welcher sämtliche Niveaulinien aus Geraden Bei char K = 2 gibt es zu jeder quadratischen Form ρ
bestehen. auf dem K-Vektorraum V genau eine symmetrische Bi-
linearform σ mit ρ(x) = σ (x, x), nämlich deren Polarform.
?
Beweisen Sie, dass die Einschränkungen der Bilinearformen
σ und σ auf die Diagonale genau dann dieselbe quadratische
Form ergeben, wenn σ − σ alternierend ist, also Bilinearformen sind stets durch Matrizen
darstellbar
(σ − σ )(y, x) = σ (y, x) − σ (y, x) = −(σ − σ )(x, y)
für alle x, y ∈ V . In Kapitel 12 wurde gezeigt, dass jede lineare Abbildung
ϕ : V → W zwischen endlichdimensionalen K-Vektor-
räumen V und W nach der Einführung von Basen B in V
Wenn wir die quadratische Form ρ als Einschränkung der und C in W eine Darstellungsmatrix C M(ϕ)B besitzt mit
Bilinearform σ definieren, so gilt nach den Eigenschaften der Eigenschaft
einer Bilinearform ρ(λ x) = σ (λ x, λ x) = λ2 ρ(x) sowie
ρ(x + y) = σ (x + y, x + y) C ϕ(x) = C M(ϕ)B B x .
= σ (x, x) + σ (y, y) + (σ (x, y) + σ (y, x))
Dies bedeutet, die C-Koordinaten des Bildes ϕ(x) ∈ W sind
= ρ(x) + ρ(y) + σ (x, y)
aus den B-Koordinaten des Urbilds x ∈ V durch Multipli-
mit σ (x, y) = σ (x, y) + σ (y, x) als symmetrischer Bi- kation mit der Darstellungsmatrix C M(ϕ)B zu berechnen.
linearform. Wir nehmen dies zum Anlass für eine Definition, Umgekehrt stellt jede Matrix eine lineare Abbildung dar, und
die nicht von Bilinearformen ausgeht. Eigenschaften von Matrizen spiegeln sich in Eigenschaften
von linearen Abbildungen wieder.
Definition einer quadratischen Form Wir zeigen im Folgenden, dass die symmetrischen Matrizen
Eine Abbildung ρ des Vektorraums V in seinen Grund- M, also solche mit M 0 = M, auf ähnliche Weise den sym-
körper K heißt quadratische Form, wenn für alle x, y ∈ metrischen Bilinearformen zugeordnet werden können.
V und λ ∈ K gilt:
V sei ein n-dimensionaler Vektorraum über K mit der geord-
1. ρ(λ x) = λ2 ρ(x), und
neten Basis B = (b1 , . . . , bn ). Für x, y ∈ V , also
2. die Abbildung
&
σ : (x, y) → ρ(x + y) − ρ(x) − ρ(y) x = x1 b1 + · · · + xn bn und y = y1 b1 + · · · + yn bn ,
ist eine Bilinearform auf V . ergibt sich aus unseren Regeln für Bilinearformen:
⎛ ⎞
Offensichtlich ist &
σ symmetrisch. Als Einschränkung von &
σ ! n !
n !n
& mit
auf die Diagonale entsteht die quadratische Form ρ σ (x, y) = σ ⎝ xi bi , yj bj ⎠ = xi yj σ (bi , bj ) .
i=1 j =1 i,j =1
&(x) = ρ(2 x) − 2 ρ(x) = 2 ρ(x) .
ρ
Die letzte Summe erfolgt über alle möglichen Paare (i, j ) mit
Nun kommt es auf die Charakteristik des Körpers K an: i, j ∈ {1, . . . , n}. Die darin auftretenden n2 Koeffizienten
Bei char K = 2 gibt es zur quadratischen Form ρ eine σ (bi , bj ) legen σ eindeutig fest.
symmetrische Bilinearform
1 1 Definition der Darstellungsmatrix
σ1 = &
σ : (x, y) → (ρ(x + y) − ρ(x) − ρ(y)) ,
2 2
Sind σ eine Bilinearform auf dem n-dimensionalen K-
deren Einschränkung auf die Diagonale gleich ρ ist. Man
Vektorraum V und B eine Basis von V , so heißt die
nennt diese Bilinearform die Polarform von ρ.
Matrix
Angenommen, neben σ1 sei auch σ2 eine symmetrische M B (σ ) = σ (bi , bj ) ∈ Kn×n
Bilinearform mit σ2 (x, x) = σ1 (x, x) für alle x ∈ V .
Dann folgt aus σ1 (x + y, x + y) = σ2 (x + y, x + y) für Darstellungsmatrix von σ bezüglich der Basis B.
alle (x, y) ∈ V 2 :
σ1 (x, x) + 2 σ1 (x, y) + σ1 (y, y) Mithilfe der Darstellungsmatrix M B (σ ) lässt sich σ (x, y)
= σ2 (x, x) + 2 σ2 (x, y) + σ2 (y, y) als Matrizenprodukt schreiben, nämlich:
0
und daher σ1 (x, y) = σ2 (x, y), also σ1 = σ2 . σ (x, y) = Bx M B (σ ) B y. (18.1)
18.1 Symmetrische Bilinearformen 717
Beweis: Wir bestätigen die in (18.1) angegebene Matri- b) Bei alternierendem σ ist σ (bj , bi ) = −σ (bi , bj ), also
zenschreibweise für σ (x, y) durch Nachrechnen: M B (σ )0 = −M B (σ ).
Zunächst ist Umgekehrt können wir wie im symmetrischen Fall vorgehen:
⎛⎞ ⎛ n ⎞ Bei einer schiefsymmetrischen Matrix M ist
y1 j =1 σ (b1 , bj ) yj
⎜ ⎟ ⎜ ⎟ y 0 M x = (y 0 M x)0 = x 0 M 0 y = −x 0 M y
M B (σ ) ⎝ ... ⎠ = ⎝ ..
. ⎠.
n
yn j =1 σ (bn , bj ) yj und daher σM (y, x) = −σM (x, y).
Daraus folgt: Wegen der Nullen in der Hauptdiagonale einer schiefsymme-
n(n − 1)
⎞ ⎛ trischen n × n -Matrix treten darin nur voneinander
y1 2
unabhängige Einträge auf.
⎜ ⎟
(x1 . . . xn ) M B (σ ) ⎝ ... ⎠
yn Beispiel Wir kehren zurück zum obigen Beispiel einer
⎛ ⎞
Bilinearform auf V = R2 :
!
n !
n !n
= xi ⎝ σ (bi , bj ) yj ⎠ = xi yj σ (bi , bj ).
i=1 j =1 i,j =1
σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5x2 y2 .
n 1 Wir berechnen
1 n
1 = 1 · · n σ (b1 , b1 ) = −2, σ (b1 , b2 ) = σ (b2 , b1 ) = 0, σ (b2 , b2 ) = 3
Beweis: a) Bei symmetrischem σ ergibt sich die Sym- ist die Darstellungsmatrix von σ zur kanonischen Basis
metrie der Darstellungsmatrix M B (σ ) unmittelbar aus E = (e1 , e2 ), also A = M E (σ ).
σ (bj , bi ) = σ (bi , bj ), und zwar für alle Basen B.
Wenn wir nun die auf dem n-dimensionalen K-Vektorraum V
Umgekehrt legt jede n × n -Matrix M durch die Definition definierte Bilinearform σ mit der Darstellungsmatrix M B (σ )
auf die Diagonale von V einschränken, so entsteht die qua-
σM (x, y) = x 0 M y dratische Form ρ, wobei mit (18.1) gilt:
eine Bilinearform auf Kn fest, denn es gilt ρ(x) = σ (x, x) = 0
Bx M B (σ ) B x .
0 0 0
(x + x ) M y = x M y + x My, Bei M B (σ ) = (aij ) lautet die Summendarstellung dieser
0 0
(λx) M y = λ(x M y) , quadratischen Form:
Ist umgekehrt die quadratische Form durch die Summenfor- Je zwei Darstellungsmatrizen einer
mel (18.2) gegeben, so können wir die Koeffizientenmatrix Bilinearform sind kongruent
(aij ) noch abändern, ohne dabei ρ(x) zu ändern. Wir müssen
ja nur dafür sorgen, dass die Einträge in der Hauptdiagona- Wenn wir in unserem Vektorraum von der Basis B zu B
len gleich bleiben und ebenso die Summen (aij + aj i ). Bei wechseln, so gilt für die jeweiligen Koordinaten von x:
char K = 2 können wir diese Summen zu gleichen Teilen
aufteilen, also B x = B TB B x .
aij = aj i = 1
2 (aij + aj i ) Die hier auftretende Transformationsmatrix
setzen. Damit erhalten wir eine symmetrische Koeffizienten- = = ( B b1 , . . . ,
). Diese ist offensichtlich die Darstellungsmatrix B TB B M(id V )B B bn )
matrix (aij
der in der Folgerung auf Seite 716 als eindeutig erkannten ist invertierbar (siehe Kapitel 6). In ihren Spalten stehen die
Polarform der quadratischen Form, also jener symmetrischen B -Koordinaten der Basisvektoren von B. Man beachte als
Bilinearform σ , deren Einschränkung auf die Diagonale von Merkregel, dass der linke Index von B T B übereinstimmt mit
V die gegebene quadratische Form liefert. dem linken Index der Spaltenvektoren B bi und das Koordi-
Ist die Matrix der Koeffizienten aij in (18.2) bereits symme- natensystem festlegt, in welchem die Vektoren der im rechten
trisch, so können wir die Summe auch schreiben als Index angegebenen Basis dargestellt sind.
!
n !
n Umgekehrt ist
ρ(x) = aii xi2 + 2 aij xi xj . −1
i=1 i,j =1 Bx = B TB B x mit B TB = B TB .
i<j
Der Wert σ (x, y) ist unabhängig von der verwendeten Basis,
Nachdem die quadratischen Formen und die zugehörigen
d. h., für alle x, y ∈ V muss nach (18.1) gelten:
symmetrischen Bilinearformen, die Polarformen, einander
gegenseitig bedingen, macht es keinen Unterschied, ob man 0 0
σ (x, y) = Bx M B (σ ) B y = B x M B (σ ) B y .
von der Darstellungsmatrix einer quadratischen Form spricht
oder von der Darstellungsmatrix der Polarform. Wir ersetzen im mittleren Ausdruck die B-Koordinaten von
x und y durch die jeweiligen B -Koordinaten. Dies führt zu
?
Bestimmen Sie die Polarform σ (x, y) zur gegebenen qua-
(B T B B x)0 M B (σ ) (B T B B y)
dratischen Form
= B x 0 B T B0 M B (σ ) B T B B y
ρ(x) = x12 − 3x32 + 2x1 x2 − 5x2 x3 = 0 M (σ ) y .
B x B B
auf dem Vektorraum R3 zusammen mit deren kanonischer Nachdem die letzte Gleichung für alle B x, B y ∈ Kn gelten
Darstellungsmatrix, also der Darstellungsmatrix M E (σ ) be- muss, können wir hierfür Vektoren der kanonischen Basis
züglich der kanonischen Basis E. einsetzen, etwa B x = ei und B y = ej . Dann aber bedeutet
die Gleichung, dass in M B (σ ) und in dem Matrizenprodukt
(B T B )0 M B (σ ) B T B die Einträge an der Stelle (i, j ) über-
So wie bei den linearen Abbildungen eines Vektorraums in
sich, den Endomorphismen, wollen wir auch bei den Bilinear- einstimmen, und zwar für alle i, j = 1, . . . , n. Also sind
formen durch die Wahl spezieller Basen möglichst einfache diese Matrizen gleich.
Darstellungsmatrizen erreichen. Dabei ist es hier etwas ein-
facher, denn es gibt zu jeder symmetrischen Bilinearform Transformation von Darstellungsmatrizen
Darstellungsmatrizen in Diagonalform. Nachdem umgekehrt Für die Darstellungsmatrizen der Bilinearform σ bezüg-
eine Diagonalmatrix stets symmetrisch ist, muss jede diago- lich der Basen B und B gilt:
nalisierbare Bilinearform symmetrisch sein.
M B (σ ) = (B T B )0 M B (σ ) B T B (18.3)
Eine Darstellungsmatrix M B (σ ) in Diagonalform hat viele
Vorteile: Es vereinfacht sich die Koordinatendarstellung von
mit B T B = B b1 · · · B bn als invertierbarer Matrix.
σ zu
!
n
σ (x, y) = 2
xi yj σ (bi , bj ) = a11 2
x1 y1 + · · · +ann xn yn . Als kleine Gedächtnisstütze merken wir uns, indem wir die
i,j =1
Transformationsgleichung von rechts lesen: Wir bekommen
die Darstellungsmatrix von σ bezüglich B , indem wir die
Es gibt nur mehr n Summanden. Die zugehörige quadratische B -Koordinaten zuerst auf B-Koordinaten umrechnen und
Form ρ ist genau dann positiv definit (siehe Seite 659), wenn diese dann mit der zur Basis B gehörigen Darstellungsmatrix
aii > 0 ist für alle i ∈ {1, . . . , n}. multiplizieren.
18.1 Symmetrische Bilinearformen 719
Noch ein Hinweis zu der hier verwendeten Bezeichnungs- Die Kongruenz von Matrizen ist natürlich zu unterscheiden
weise der Darstellungsmatrizen: Bei den linearen Abbildun- von der in Kapitel 12 auf Seite 455 behandelten Ähnlichkeit.
gen schreiben wir beide Basen dazu, also z. B. B M(ϕ)B . Zur Erinnerung, zwei quadratische Matrizen C, D heißen zu-
Bei den symmetrischen Bilinearformen oder quadratischen einander ähnlich, wenn D = T −1 C T ist mit einer invertier-
Formen ist, so wie in M B (σ ), nur eine Basis erforderlich. baren Matrix T . Wenn man allerdings die Transformations-
matrizen T auf orthogonale Matrizen T beschränkte, also auf
Beispiel Wir bestätigen (18.3) anhand des Beispiels der solche mit T −1 = T 0 (siehe Seite 683), dann wären ähnliche
Bilinearform σ auf V = R2 von Seite 717 mit Matrizen D, C gleichzeitig kongruent und umgekehrt.
σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5 x2 y2 , Nach den Ergebnissen von Kapitel 12 ändert sich der Rang
einer Matrix nicht bei Rechts- oder Linksmultiplikation mit
also σ (x, y) = x 0 A y und einer invertierbaren Matrix. Demnach haben alle Darstel-
' ( lungsmatrizen einer Bilinearform σ denselben Rang. Wir
1 1 nennen diesen den Rang von σ und bezeichnen ihn mit rg(σ ).
M E (σ ) = A =
1 −5
Es gibt noch eine andere Begründung für die Invarianz des
als Darstellungsmatrix von σ zur kanonischen Basis E = Rangs, bei der wir uns allerdings auf den Fall einer symme-
(e1 , e2 ). Wie lautet die Darstellungsmatrix M B (σ ) bezüglich trischen Bilinearform σ beschränken wollen:
der Basis B = (b1 , b2 ) mit Wie in Kapitel 17 (siehe Seite 676) erklärt, ist σ Anlass für
' ( ' ( eine symmetrische Relation auf V : Zwei Vektoren x, y ∈ V
1 2
b1 = E b 1 = , b2 = E b2 = ? heißen σ -orthogonal genau dann, wenn σ (x, y) = 0 ist.
1 1
Vektoren mit σ (y, y) = 0 heißen isotrop bezüglich σ . Zu
Dazu beachten wir die Transformationsmatrix jedem Unterraum U von V gibt es einen σ -Orthogonalraum
' ( U ⊥ mit der Eigenschaft, dass σ (x, y) = 0 ist für alle x ∈ U
1 2 und y ∈ U ⊥ .
T
E B = ( b , b
E 1 E 2 ) = .
1 1
Der σ -Orthogonalraum V ⊥ heißt Radikal der symmetri-
Aus unserem Gesetz über die Transformation der Darstel- schen Bilinearform σ . Die Vektoren y ∈ V ⊥ sind zu allen
lungsmatrizen von Bilinearformen folgt nun: Vektoren aus V σ -orthogonal, also insbesondere auch zu sich
selbst und daher isotrop.
M B (σ ) = (E T B )0 M E (σ ) E T B
' (' (' ( Die Matrizengleichung x 0 M B (σ ) y = 0 ist genau dann für
=
1 1 1 1 1 2 alle x ∈ V erfüllt, wenn M B (σ ) y = 0 ist, also y das homo-
2 1 1 −5 1 1 gene lineare Gleichungssystem mit der Koeffizientenmatrix
' (' ( ' (
2 −4 1 2 −2 0 M B (σ ) löst. Die Dimension des Radikals von σ ist somit
= = , n − rg σ .
3 −3 1 1 0 3
Eine symmetrische Bilinearform auf dem n-dimensionalen
in Übereinstimmung mit dem auf Seite 717 angegebenen
K-Vektorraum V heißt entartet, wenn ihr Rang kleiner ist
Wert für M B (σ ) = σ (bi , bj ) .
als n. Andernfalls heißt σ nicht entartet oder radikalfrei,
denn das Radikal ist {0}. Ist σ z. B. positiv definit, wie bei
Allgemein heißt die n × n -Matrix D kongruent zur n × n -
einem euklidischen Skalarprodukt, so gilt für x = 0 stets
Matrix C (siehe Seite 661), wenn es eine invertierbare n×n -
σ (x, x) = x · x > 0. Dann ist 0 der einzige isotrope Vektor
Matrix T gibt mit D = T 0 C T .
und σ daher radikalfrei.
Folgerung ?
Alle Darstellungsmatrizen derselben Bilinearform sind un- Welche Eigenschaft hat die symmetrische Darstellungsma-
tereinander kongruent. Umgekehrt sind je zwei kongruente trix M B (σ ), wenn der i-te Basisvektor bi ∈ B isotrop ist
Matrizen aus Kn×n aufzufassen als Darstellungsmatrizen bezüglich σ ? Wie sieht M B (σ ) aus, wenn bi dem Radikal
derselben Bilinearform auf Kn . von σ angehört?
1. Zwei Basisvektoren werden vertauscht, d. h. bi = bj und einer symmetrischen Bilinearform durch geeigneten Basis-
bj = bi bei i = j . wechsel auf Diagonalform zu bringen: Dabei wenden wir
2. Ein Basisvektor wird durch das λ-Fache ersetzt, also bi = wiederholt elementare Zeilenoperationen und die damit ge-
λbi und λ = 0. koppelten gleichartigen Spaltenoperationen an.
3. Zum i-ten Basisvektor wird das λ-Fache des j -ten Basis-
vektors addiert, also bi = bi + λ bj bei i = j . Beispiel Gegeben ist die symmetrische Bilinearform
σ (x, y) = x 0 A y auf R4 mit der Darstellungsmatrix
Was bedeuten diese elementaren Basiswechsel
für die
sym- ⎛ ⎞
metrische Darstellungsmatrix M B (σ ) = σ (bi , bj ) ? 0 1 −2 1
⎜ 1 1 0 0⎟
A=⎜
⎝ −2
⎟
Wir werden erkennen, dass jeder dieser Schritte eine ele- 0 −4 4 ⎠
mentare Zeilenumformung und die gleichartige elementare 1 0 4 −1
Spaltenumformung nach sich zieht. Dabei ist gleichgültig,
ob zuerst die Zeilen- und dann die Spaltenumformung vor- Schritt 1: Wenn es ein Element aii = 0 in der Hauptdiago-
genommen wird oder umgekehrt. Diese elementaren Zeilen- nale gibt, so bringen wir dieses durch die Zeilenvertauschung
umformungen sind uns übrigens erstmals im Kapitel 5 beim zi ↔ z1 und die gleichartige Spaltenvertauschung s i ↔ s 1
Verfahren von Gauß und Jordan zur Lösung linearer Glei- nach links oben. In unserem Beispiel ist es das Element a22 :
chungssysteme begegnet. ⎛ ⎞ ⎛ ⎞
1 1 0 0 1 1 0 0
z 2 ↔z 1 ⎜ 0 1 −2 1 ⎟ s 2 ↔s 1 ⎜ 1 0 −2 1 ⎟
1. Die Vertauschung von bi und bj bewirkt in M B (σ ) die A −→ ⎜ ⎟ −→ ⎜ ⎟
⎝ −2 0 −4 4 ⎠ ⎝ 0 −2 −4 4 ⎠
Vertauschung der Elemente σ (bi , bk ) mit σ (bj , bk ) für 1 0 4 −1 0 1 4 −1
jedes k ∈ {1, . . . , n}, also der i-ten Zeile mit der j -ten
Zeile. Es werden aber auch die Elemente an den Stellen Schritt 2: Nun subtrahieren wir geeignete Vielfache der ers-
(k, i) und (k, j ) vertauscht, also die i-Spalte mit der j - ten Zeile von den übrigen Zeilen und wenden die analogen
Spalte. Spaltenumformungen an. Dadurch werden – bis auf das Ele-
2. Die Multiplikation von b i mit dem Faktor λ bewirkt eine ment in der Hauptdiagonale – alle Einträge der ersten Zeile
Multiplikation der i-ten Zeile und der i-ten Spalte von und Spalte zu null. In unserem Beispiel subtrahieren wir z1
M B (σ ) mit dem Faktor λ. Insbesondere kommt das Dia- von der zweiten Zeile und ebenso s 1 von s 2 .
gonalelement an der Stelle (i, i) zweimal dran; es wird ⎛ ⎞ ⎛ ⎞
1 1 0 0 1 0 0 0
daher insgesamt mit λ2 multipliziert. z2 −z1 ⎜ 0 −1 −2 1⎟ s 2 −s 1 ⎜ 0 −1 −2 1 ⎟
−→ ⎜ ⎟ −→ ⎜ ⎟
3. Wird bi ersetzt durch bi + λ bj , so wird zur i-ten Zeile ⎝ 0 −2 −4 4 ⎠ ⎝ 0 −2 −4 4 ⎠
das λ-Fache der j -ten Zeile addiert und zur i-ten Spalte 0 1 4 −1 0 1 4 −1
das λ-Fache der j -ten Spalte. Dadurch kommt das Ele-
ment an der Stelle (i, i) wiederum zweimal dran – ganz Damit sind die erste Zeile und erste Spalte erledigt, und wir
in Übereinstimmung mit verfahren mit der dreireihigen Restmatrix auf dieselbe Weise:
Schritt 1 entfällt, denn es ist a22 = 0. Wir brauchen also nur
σ (bi + λ bj , bi + λ bj ) geeignete Vielfache der zweiten Zeile und Spalte zu subtra-
= σ (bi , bi ) + 2λ σ (bi , bj ) + λ2 σ (bj , bj ) . hieren:
⎛ ⎞ ⎛ ⎞
Die zu diesen Basiswechseln gehörigen Transformations- z3 − 2z2 1 0 0 0 s 3 − 2s 2 1 0 0 0
z4 + z2 ⎜ 0 −1 −2 1 ⎟ s 4 + s 2 ⎜ 0 −1 0⎟
matrizen B T B , die Elementarmatrizen (siehe Kapitel 13), −→ ⎝ 0 ⎜ ⎟ ⎜
−→ ⎝ 0
0 ⎟
0 0 2⎠ 0 0 2⎠
entstehen aus der Einheitsmatrix durch Ausübung der jewei-
0 0 2 0 0 0 2 0
ligen elementaren Spaltenumformung. So gehört etwa zum
Ersatz von bi durch bi = bi + λ bj die Transformationsma- Nun bleibt nur mehr eine zweireihige Matrix rechts unten
trix ⎛ ⎞ übrig. Allerdings tritt hier ein neues Phänomen auf: Die
1
⎜ .. ⎟
Restmatrix ist noch nicht gleich der Nullmatrix, aber ihre
⎜ . ⎟ Hauptdiagonale enthält nur mehr Nullen. Wir können weder
⎜ ⎟
⎜ 1 ⎟ ←i
⎜ ⎟ Schritt 1, noch Schritt 2 anwenden, jedoch den folgenden
B TB = ⎜
.. ⎟
⎜ . ⎟
⎜ ⎟ ←j Schritt 3: Gibt es außerhalb der Hauptdiagonalen noch ein
⎜ λ 1 ⎟
⎜ ⎟
⎝ .. ⎠ Element aij = 0, so addieren wir zur i-ten Zeile die j -te Zeile
.
1 und verfahren ebenso mit den Spalten. Dies ergibt als neues
Diagonalelement aii = 2 aij , und wir können mit Schritt 2
Jeder Umrechnung der Darstellungsmatrix einer symmetri-
fortfahren.
schen Bilinearform auf eine geänderte Basis kommt somit
der wiederholten Anwendung von jeweils gleichartigen ele- In unserem Beispiel ist a34 = 0, daher
mentaren Zeilen- und Spaltenumformungen gleich. ⎛ ⎞ ⎛ ⎞
1 0 0 0 1 0 0 0
z3 +z4 ⎜ 0 −1 0 0 ⎟ s 3 +s 4 ⎜ 0 −1 0 0 ⎟
In dem folgenden Beispiel wird vorgeführt, welcher Algo- −→ ⎜ ⎝0 0 2 2⎠
⎟ −→ ⎜
⎝0 0 4 2
⎟
⎠
rithmus angewandt werden kann, um die Darstellungsmatrix 0 0 2 0 0 0 2 0
18.1 Symmetrische Bilinearformen 721
Nun werden die dritte Zeile und Spalte noch gemäß Schritt 2 Will man bei dem oben vorgeführten Algorithmus gleich-
reduziert: zeitig wissen, welche Transformationsmatrix B T B die Um-
⎛ ⎞ ⎛ ⎞ rechnung von M B (σ ) auf M B (σ ) bewirkt, so kann man zu
1 0 0 0 1 0 0 0
z4 − 21 z3 ⎜ 0 −1 0 0⎟ s − 1
4 2 3 ⎜ 0 −1 0
s 0⎟ Beginn unter der Darstellungsmatrix M B (σ ) die Einheitsma-
−→ ⎝ 0 ⎜ ⎟ −→ ⎜ ⎟
0 4 2⎠ ⎝0 0 4 0⎠ trix En dazuschreiben und bei den elementaren Spaltenum-
0 0 0 −1 0 0 0 −1 formungen gleichzeitig mit umformen. Dann steht am Ende
Das Resultat ist eine Diagonalmatrix, die wir platzsparend des Algorithmus unter M B (σ ) genau die Transformations-
als diag (1, −1, 4, −1) schreiben können. matrix B T B , welche mittels (18.3) die Umrechnung auf die
Diagonalmatrix ermöglicht.
Das hier in dem Beispiel aus R4 vorgeführte Verfahren funk-
tioniert auch in anderen Körpern K. Allerdings versagt bei Beispiel Welche Transformationsmatrix B T B bringt ge-
char K = 2 Schritt 3, denn 2 aij = 0. mäß (18.3) in dem Beispiel von Seite 720 die Umrechnung
von A auf die endgültige Diagonalmatrix?
Diagonalisierbarkeit symmetrischer Bilinearformen Wir wenden alle obigen Spaltenoperationen der Reihe nach
V sei ein endlichdimensionaler K-Vektorraum und auf die Einheitsmatrix E4 an:
char K = 2. Dann gibt es zu jeder symmetrischen Bi- ⎛ ⎞ ⎛ ⎞
0 1 0 0 0 1 0 0
linearform σ auf V eine Basis B , für welche M B (σ ) s 2 ↔s 1 ⎜ 1 0 0 0⎟ s 2 −s 1 ⎜ 1 −1 0 0 ⎟
eine Diagonalmatrix ist. E4 −→ ⎜ ⎝0 0 1 0⎠
⎟ −→ ⎜
⎝0 0 1 0⎠
⎟
0 0 0 1 0 0 0 1
⎛ ⎞ ⎛ ⎞
Beweis: Wir wenden auf die gegebene n-reihige Darstel- s 3 − 2s 2 0 1 −2 1 0 1 −1 1
s 4 + s 2 ⎜ 1 −1 2 −1 ⎟ s +s ⎜ ⎟
lungsmatrix A = M B (σ ) den folgenden Algorithmus an: −→ ⎜ ⎟ 3 4 ⎜ 1 −1 1 −1 ⎟
−→ ⎝ 0 0 1
⎝0 0 1 0⎠ 0⎠
Gibt es in der Hauptdiagonalen von A ein aii = 0, so wenden 0 0 0 1 0 0 1 1
wir die nachstehend angeführten Schritte 1 und 2 an. Stehen ⎛ ⎞
0 1 −1 3/2
hingegen in der Hauptdiagonale lauter Nullen, und gibt es s 4 − 12 s 3 ⎜ 1 −1 1 −3/2 ⎟
−→ ⎝ 0 ⎜ ⎟ = B TB .
ein aij = 0, so beginnen wir mit Schritt 3. Andernfalls ist A 0 1 −1/2 ⎠
die Nullmatrix, und wir sind bereits fertig. 0 0 1 1/2
1. Schritt: Wir vertauschen die 1. Zeile mit der i-ten Zeile Damit gilt M B (σ ) = (B T B )0 M B (σ ) B T B , denn
und ebenso die 1. Spalte mit der i-ten Spalte. Damit entsteht ⎛ ⎞
die Matrix A = (aj k ), in welcher links oben ein von null 0 1 0 0
⎜ 1 −1 0 0⎟⎟
verschiedenes Element a11 steht. diag (1, −1, 4, −1) = ⎜
⎝ −1 1 1 1⎠
3/2 −3/2 −1/2 1/2
2. Schritt: Wir subtrahieren für j = 2, . . . , n von der j -ten ⎛ ⎞⎛ ⎞
−2 1 0 1 −1 3/2
Zeile das aj 1 /a11
-Fache der ersten Zeile und ebenso von der 0 1
⎟
⎜ 1
⎜ 1 0 0⎟ ⎜
⎟ ⎜ 1 −1 1 −3/2 ⎟
= a das a /a -Fache der ersten
j -ten Spalte wegen a1j j1 j 1 11 ⎝ −2 0 −4 4 ⎠ ⎝ 0 0 1 −1/2 ⎠
Spalte. Bis auf das Element a11 links oben stehen dann in der 1 0 4 −1 0 0 1 1/2
ersten Zeile und in der ersten Spalte lauter Nullen.
3. Schritt: Stehen in der Hauptdiagonalen lauter Nullen, und
gibt es ein Element aij = aj i = 0 bei j = i, so addieren ?
wir zur i-ten Zeile die j -te Zeile und ebenso zur i-ten Spalte Geben Sie einen Basiswechsel an, welcher die symmetrische
die j -te Spalte. Dann entsteht an der Stelle (i, i) das neue Bilinearform
Element 2 aij , das bei charK = 0 von null verschieden ist.
Wir können daher mit den Schritten 1 und 2 fortfahren. σ : R2 → R, σ (x, y) = x1 y2 + x2 y1
In der Folge lassen wir die erste Zeile und die ersten Spalte auf Diagonalform bringt.
der Matrix A außer Acht und wenden uns der verbleibenden
Matrix A1 ∈ K(n−1)×(n−1) zu: Ist A1 die Nullmatrix, so sind
Nach der algorithmischen Diagonalisierung folgt noch eine
wir bereits fertig. Andernfalls beginnen wir je nach Situation
Charakterisierung der diagonalisierenden Basen.
mit Schritt 1 oder Schritt 3 und kommen zu einer Matrix, in
welcher die ersten beiden Zeilen und Spalten lauter Nullen
Lemma
außerhalb der Hauptdiagonalen aufweisen. Es verbleibt die
Es sei σ eine symmetrische Bilinearform auf dem n-dimen-
Restmatrix A2 ∈ K(n−2)×(n−2) u.s.w.
sionalen K-Vektorraum V . Dann hat die Darstellungsmatrix
Dieses Vorgehen wird so lange wiederholt, bis die Restmatrix M B (σ ) genau dann die Diagonalform diag (a11 , . . . , arr ,
rechts unten nur mehr ein Element enthält oder die Nullmatrix 0, . . . , 0), wenn die Vektoren der Basis B paarweise
ist. σ -orthogonal sind, also σ (bi , bj ) = 0 ist für alle i = j , und
722 18 Quadriken – vielseitig nutzbare Punktmengen
9
dem Kern der Linearform 1
−4 b1
b2
−1
ϕu : V → K, y → σ (u, y) 0 0 b2 x1
−3 −2 −1 1 2
1
an. Liegt u im Radikal von σ , so ist ϕu die Nullform und
b1
4
der zugehörige Kern ganz V . Andernfalls ist der Kern von −1 −9
ϕu ∈ V ∗ ein (n − 1)-dimensionaler Unterraum von V .
9
−16
−2 −25
Kommentar: Bei unserem Diagonalisierungsverfahren −36
mittels gekoppelter Zeilen- und Spaltenumformungen ergibt
sich die zugrunde liegende Basis automatisch (Abb. 18.4): Abbildung 18.4 Die Niveaulinien der quadratischen Form ρ(x) aus Abbil-
dung 18.1 samt den diagonalisierenden Basen B = (b 1 , b2 ) und B = (b1 , b2 ).
Wir können keinesfalls erwarten, dass diese orthogonal oder
gar orthonormiert ist. Es gibt zwar in euklidischen Räumen
eine diagonalisierende und gleichzeitig orthonormierte Ba- Aber auch die Basis
sis, wie wir aus Kapitel 17 wissen, doch erfordert deren Be- ' ( ' (
rechnung die Bestimmung von Eigenwerten und -vektoren 1 1
B = (b1 , b2 ) mit b1 = , b2 =
einer symmetrischen Matrix. Wir kommen darauf noch bei −1 0
der Hauptachsentransformation auf Seite 727 zurück und
nennen dies das orthogonale Diagonalisieren. (Abb. 18.4) führt auf eine Diagonalmatrix, denn
' (
−6 0
M B (σ ) = σ (b1 , b2 ) = = diag (−6, 1).
0 1
Eine symmetrische Bilinearform hat viele
verschiedene Diagonaldarstellungen
Es sind sowohl b1 und b2 σ -orthogonal, als auch b1 und b2 .
Das ist auch anhand der Niveaulinien der zu σ gehörigen
Obwohl der obige Algorithmus zum Diagonalisieren der
quadratischen Form ρ erkennbar. Man kann nämlich zeigen,
Darstellungsmatrix eine gewisse Abfolge von Zeilen- und
dass zwei σ -orthogonale und von 0 verschiedene Vektoren
Spaltenumformungen vorschreibt, so bestehen doch Wahl-
ein Paar konjugierter Durchmesser der Niveaulinien aufspan-
möglichkeiten in den Schritten 1 und 3. Deshalb sind die dia-
nen; es haben nämlich die Niveaulinien in den Schnittpunk-
gonalisierten Darstellungsmatrizen der symmetrischen Bi-
ten mit einem der Durchmesser stets Tangenten, die zu dem
linearform σ keinesfalls eindeutig. Das geht auch aus dem
anderen Durchmesser parallel sind.
obigen Lemma hervor.
So können wir in der Basis B mit M B (σ ) =
diag (a11 , . . . , ann ) den Vektor bi durch bi = λ bi ersetzen. Was haben die verschiedenen diagonalisierten Darstellungs-
matrizen von σ gemein? Im Fall K = R gibt es darauf eine
Die Darstellungsmatrix behält Diagonalform, aber das Dia-
Antwort, wie der folgende Abschnitt zeigt.
gonalelement σ (bi , bi ) = aii aus M B (σ ) wird ersetzt durch
σ (bi , bi ) = λ2 aii in M B (σ ).
Aber auch Basiswechsel mit bi ∈ K bi können erneut zu
Diagonalmatrizen führen, wie das folgende Beispiel zeigt. Reelle symmetrische Bilinearformen haben
eine eindeutige Signatur
Beispiel Die symmetrische Bilinearform auf V = R2 von
Seite 714 mit der kanonischen Darstellungsmatrix
' ( Angenommen, die Darstellungsmatrix M B (σ ) ∈ Rn×n der
1 1 symmetrischen Bilinearform σ hat Diagonalform. Dann kann
M E (σ ) =
1 −5 jedes positive Diagonalelement aii durch den Ersatz von bi
√
'' ( ' (( durch bi = λ bi mit λ = 1/ aii auf 1 normiert werden.
hat bezüglich der Basis B =
1
,
2
(siehe Seite 717 √
1 1 Bei einem negativen aii ergibt die Wahl λ = 1/ −aii das
und Abbildung 18.4) die Darstellungsmatrix Diagonalelement −1. Damit kommen in der Hauptdiagonale
' ( von M B (σ ) nur mehr Werte aus {1, −1, 0} vor. Nach einer
−2 0 eventuellen Umreihung der Basisvektoren erreichen wir die
M B (σ ) = = diag (−2, 3).
0 3 folgende Normalform.
18.1 Symmetrische Bilinearformen 723
heißt Signatur von σ . Dabei sind diese drei Zahlen bereits Es gibt also einen Vektor x = 0 aus dem Durchschnitt die-
vor der obigen Normierung als Anzahlen der positiven und ser Unterräume, und dies führt zum offensichtlichen Wider-
negativen Einträge sowie der Nullen in der Hauptdiagonale spruch
von M B (σ ) = diag (a11 , . . . , ann ) feststellbar.
Dass kongruente Matrizen denselben Rang r haben, wissen x ∈ U>0 \ {0} $⇒ ρ(x) > 0 und
x ∈ U≤0 $⇒ ρ(x) ≤ 0 .
wir schon. Dass sie aber auch dasselbe p und damit dieselbe
Signatur haben, ist Gegenstand des folgenden Satzes.
Somit bleibt p = p.
Beweis: Mit jeder σ diagonalisierenden Basis 2. Der Begriff Signatur wird in der Literatur nicht immer
(b1 , . . . , bn ) sind gewisse Unterräume verknüpft: einheitlich verwendet: Manchmal bezeichnet man damit
nur das Zahlenpaar (p, r − p), vor allem dann, wenn
Für Vektoren x aus der Hülle der ersten p Basisvektoren, also die Dimension n von V von vornherein feststeht. Manch-
p
x = i=1 xi bi ∈ - b1 , . . . , bp ., ist bei x = 0 mal meint man damit die Folge der Vorzeichen, also etwa
(+ + + − − 0) anstelle des Tripels (3, 2, 1).
ρ(x) = σ (x, x) = a11 x12 + · · · + app xp2 > 0 ,
nachdem alle hier auftretenden Koeffizienten positiv sind. Natürlich lässt sich anhand der Signatur (p, r −p, n−r) so-
fort beantworten, ob eine reelle symmetrische Bilinearform
Analog ist für alle x ∈ - bp+1 , . . . , bn .
σ oder ihre Darstellungsmatrizen positiv oder negativ definit
2 oder semidefinit sind oder indefinit (siehe Seite 659). Negativ
ρ(x) = ap+1 p+1 xp+1 + · · · + arr xr2 ≤ 0 ,
semidefinit etwa ist äquivalent zu p = 0.
denn hier sind die Koeffizienten durchwegs negativ, und die
restlichen Koordinaten xr+1 , . . . , xn kommen gar nicht vor. ?
Bestimmen Sie die Signatur der auf den Seiten 714, 717, 719
Wir vergleichen dies mit einer zweiten Diagonaldarstellung und 722 behandelten symmetrischen Bilinearform σ . Welche
von σ : Die Basis B = (b1 , . . . , bn ) bringe σ auf eine Dia- Basen B bringen σ auf die Normalform?
, . . . , a ) mit p positiven und r − p
gonalform diag (a11 nn
724 18 Quadriken – vielseitig nutzbare Punktmengen
18.2 Hermitesche ?
Beweisen Sie für hermitesche Formen die beiden Rechenre-
Sesquilinearformen geln:
Die Aussage, dass die Darstellungsmatrix einer symmetri- ρ(λx) = |λ|2 ρ(x) und
schen Bilinearform σ diagonalisierbar ist, gilt für alle Kör- ρ(x + y) + ρ(x − y) = 2 (ρ(x) + ρ(y)) .
per K mit char K = 2 . Von einer Signatur kann man nur
sprechen, wenn in K zwischen positiven und negativen Ele-
Ähnlich wie bei den quadratischen Formen (Seite 716)
menten sinnvoll unterschieden werden kann. Dies trifft auf
kann man auch die hermiteschen Formen direkt definieren,
angeordnete Körper zu (siehe Seite 84), wie z. B. R, aber
ohne von einer hermiteschen Sesquilinearform auf dem C-
nicht auf C.
Vektorraum V auszugehen: Dazu fordert man von einer Ab-
Und doch gilt ein Resultat ähnlichen Inhalts auch noch für C, bildung ρ : V → R für alle x, y ∈ V und λ ∈ C:
allerdings nicht für die symmetrischen Bilinearformen, son-
1. ρ(λx) = λ λ ρ(x).
dern für die im Kapitel 17 bereits vorgestellten hermiteschen
2. ρ(x + y) + ρ(x − y) = 2 (ρ(x) + ρ(y)).
Sesquilinearformen. Wir wiederholen nochmals kurz deren
3. Die induzierte Abbildung &
σ : V × V → C mit
Definition.
&
σ (x, y) = ρ(x +y)+iρ(x +iy)− (1+i) (ρ(x) + ρ(y))
Wir setzen V als Vektorraum über C voraus. Eine Abbildung
ist eine Sesquilinearform.
V × V → C,
σ: Es stellt sich dann ρ als Einschränkung der Sesquilinearform
(x, y) → σ (x, y)
σ = 12 &σ auf die Diagonale von V heraus, denn
heißt Sesquilinearform, wenn für alle x, x , y, y ∈ V und
λ ∈ K gilt: &
σ (x, x) = 4 ρ(x) + i(1 + i)(1 − i)ρ(x) − 2(1 + i)ρ(x)
= 4 ρ(x) + 2i ρ(x) − 2ρ(x) − 2i ρ(x) = 2 ρ(x) .
σ (x + x , y) = σ (x, y) + σ (x , y) , Man nennt dann so wie im Reellen &
σ die zu ρ gehörige Po-
σ (λx, y) = λ σ (x, y) , larform.
σ (x, y + y ) = σ (x, y) + σ (x, y ) ,
σ (x, λy) = λ σ (x, y) ,
Alle Darstellungsmatrizen einer hermiteschen
wobei λ die zu λ konjugiert komplexe Zahl bezeichnet. σ ist Sesquilinearform sind untereinander
somit linear im ersten und halblinear im zweiten Argument,
kongruent
also insgesamt anderthalbfach (lateinisch: sesqui) linear.
Nach Charles Hermite (1822–1901) heißt eine Sesquilinear- Bei der Definition der Darstellungsmatrix einer Sesquili-
form hermitesch, wenn stets gilt: nearform können wir wie im Reellen vorgehen: Sind B =
(b1 , . . . , bn ) eine geordnete Basis des endlichdimensionalen
σ (y, x) = σ (x, y). (18.4) C -Vektorraums V und
!
n !
n
x= xi bi sowie y = yj bj ,
? i=1 j =1
Warum kann eine Sesquilinearform nicht symmetrisch sein,
d. h., warum führt eine generelle Forderung σ (y, x) = so folgt aus unseren Regeln für Sesquilinearformen:
σ (x, y) zu Widersprüchen? ⎛ ⎞
!n !
n !n
σ (x, y) = σ ⎝ xi bi , yj bj ⎠ = xi yj σ (bi , bj ) .
i=1 j =1 i,j =1
Die Einschränkung der hermiteschen Sesquilinearform σ auf
die Diagonale von V ist eine Abbildung Die n2 Koeffizienten σ (bi , bj ) legen σ eindeutig fest und
können in Form der Darstellungsmatrix
V → R,
ρ: M B (σ ) = σ (bi , bj )
x → ρ(x) = σ (x, x) .
angeordnet werden.
Sie heißt hermitesche Form auf dem C -Vektorraum V . Dass
hier als Zielmenge R angegeben ist, ist kein Tippfehler, son- Schreiben wir die Koordinaten aus, so bedeutet dies:
dern wegen (18.4) σ (y, x) = σ (x, y) muss ρ(x) = ρ(x) ⎛ ⎞
y1
und damit reell sein. Es macht also durchaus Sinn, von po- ⎜ ⎟
sitiv definiten hermiteschen Formen zu sprechen, wenn für σ (x, y) = (x1 . . . xn ) M B (σ ) ⎝ ... ⎠
(18.5)
alle x ∈ V \ {0} das ρ(x) > 0 ist. Und dieser Begriff wurde yn
in Abschnitt 17.4 auch schon verwendet. = B x 0 M B (σ ) B y.
18.2 Hermitesche Sesquilinearformen 725
Ist die Sesquilinearform überdies hermitesch, so hat deren Darstellungsmatrizen von Sesquilinearformen
Darstellungsmatrix die kennzeichnende Eigenschaft
Für die Darstellungsmatrizen der Sesquilinearform σ be-
M B (σ )0 = M B (σ ) , (18.6) züglich der Basen B und B gilt
denn aj i = σ (bj , bi ) = σ (bi , bj ) = aij . Derartige Matri-
M B (σ ) = (B T B )0 M B (σ ) B T B (18.7)
zen aus Cn×n heißen hermitesch (siehe Seite 680).
Man beachte: Die Theorie der hermiteschen Sesquilinearfor- mit B T B = B b1 · · · B bn als invertierbarer Matrix. Je
men umfasst jene der reellen symmetrischen Bilinearformen zwei derartige Darstellungsmatrizen von σ heißen zuein-
als Sonderfall. Wenn wir nämlich in der Darstellungsmatrix ander hermitesch kongruent.
nur Einträge aij ∈ R zulassen, so handelt es sich um die Dar-
stellungsmatrix einer reellen symmetrischen Bilinearform, ?
nachdem die im hermiteschen Fall geforderte Bedingung Warum sind die zu einer hermiteschen Matrix kongruenten
(18.6) dann wegen aj i = aij = aij eben nur die gewöhnliche Matrizen wieder hermitesch?
Symmetrie bedeutet.
Wie lautet eine hermitesche Form ρ(x), wenn sie in Koordi- Will man eine hermitesche Darstellungsmatrix diagonali-
naten dargestellt wird? Wie kann man aus dieser Darstellung sieren, so kann man mithilfe dieser neuartig gekoppelten
ersehen, dass ρ(x) stets reell ist? elementaren Zeilen- und Spaltenumformungen ganz ähnlich
Wir spalten die Summe vorgehen wie in dem auf Seite 721 vorstellten Algorithmus
für symmetrische Bilinearformen. Wir verzichten auf die ge-
!
n
ρ(x) = σ (x, x) = aij xi xj naue Formulierung der notwendigen Schritte 1 bis 3 und zei-
i,j =1
gen dafür ein Zahlenbeispiel.
in der neuen Darstellungsmatrix M B (σ ). Dagegen wird Hierauf verfahren wir mit der Restmatrix ähnlich:
aki = σ (bk , bi ) zu ⎛ ⎞ ⎛ ⎞
1 0 0 z3 +(3+i)z2 1 0 0
⎝0 −1 3 − i ⎠ −→ ⎝ 0 −1 3 − i ⎠
σ (bk , bi + λ bj ) = σ (bk , bi ) + λ σ (bk , bj ) = aki + λ akj .
0 3+i⎛ 0 ⎞ 0 0 10
Es wird also beim Übergang von M B (σ ) zu M B (σ ) zur i- s 3 +(3−i)s 2 1 0 0
ten Zeile die λ-fache j -te Zeile addiert und zur i-ten Spalte −→ ⎝ 0 −1 0 ⎠ = diag (1, −1, 10) .
0 0 10
die λ-fache j -Spalte. Jede elementare Zeilenumformung ist
also hier mit der gleichartigen, jedoch konjugiert komplexen Soll auch hier so wie auf Seite 721 die Transformationsmatrix
Spaltenumformung zu koppeln. B T B mitberechnet werden, so wenden wir auf die Einheits-
Dies folgt auch aus der Matrizendarstellung (18.5): Für alle matrix E3 der Reihe nach die obigen Spaltenoperationen an.
x, y ∈ V muss gelten: Dies führt zu B T B :
σ (x, y) = B x 0 M B (σ ) B y = B 0
x M B (σ) B y
⎛
1 0 0
⎞ s2 − i s1 ⎛
1 −i i
⎞
0 s3 + i s1
= (B T B B x) M B (σ ) B T B B y E3 = ⎝ 0 1 0⎠ −→ ⎝0 1 0⎠
= B x 0 (B T B )0 M B (σ ) B T B B y . 0 0 1
⎛ ⎞0 0 1
s 3 +(3−i)s 2 1 −i −1 − 2i
Das führt auf die folgende Gleichung zwischen den Darstel- −→ ⎝ 0 1 3 − i ⎠ = B TB .
lungsmatrizen. 0 0 1
726 18 Quadriken – vielseitig nutzbare Punktmengen
Zur Probe können wir für M B (σ ) = A bestätigen: In unitären Räumen haben hermitesche
⎛ ⎞ Sesquilinearformen diagonalisierende
1 0 0
(B T B )0 M B (σ ) B T B = ⎝i 1 0⎠ Orthonormalbasen
⎛ ⎞⎛ −1 + 2i 3 +⎞i 1
1 i −i 1 −i −1 − 2i
⎝ −i 0 2 − i ⎠⎝ 0 1 3−i ⎠
Die bisher behandelten Basen, für welche die Darstellungs-
i 2⎛+ i 1 matrix einer gegebenen hermiteschen Sesquilinearform σ
⎞0 0 1
1 0 0 Diagonalform hatte, wurden allein durch Zeilen- und Spal-
=⎝0 −1 0 ⎠ = M B (σ ) . tenumformungen bestimmt. Sie unterlagen keinerlei weite-
0 0 10 ren Einschränkungen. Jetzt möchten wir uns aber aus all
Die Elemente in der Hauptdiagonalen einer hermiteschen diesen Basen die orthonormierten heraussuchen. Dazu sind
Matrix sind wegen ajj = ajj stets reell. Man kann daher tiefer liegende Methoden erforderlich, die jedoch bereits im
die positiven Diagonaleinträge wieder mittels bj = λ bj Kapitel 17 entwickelt worden sind.
√
und λ = 1/ ajj auf +1 normieren und die negativen mit In der Folge verwenden wir neben der Sesquilinearform σ
%
λ = 1/ −ajj auf −1. noch das durch einen Punkt gekennzeichnete Skalarprodukt
Nun ist eine Bemerkung notwendig: Da wir mit komplexen sowie dessen Koordinatendarstellung als Matrizenprodukt,
Zahlen rechnen, könnte man z. B. bei ajj = −4 auch den sofern den Koordinaten eine orthonormierte Basis B zu-
grunde liegt. Das folgenden Lemma zeigt, dass sich σ direkt
Basiswechsel bj = 21i bj vornehmen. Wird die j -te Zeile
mit einem Skalarprodukt in Beziehung bringen lässt.
mit 21i = − 2i multipliziert, so muss die j -te Spalte mit dem
konjugiert komplexen Wert 2i multipliziert werden. Beides Lemma
zusammen ergibt als neues Diagonalelement aber erst wieder Zu jeder auf einem unitären Raum definierten Sesqui-
1
4 (−4) = −1. Beide Möglichkeiten führen zu demselben linearform σ gibt es einen Endomorphismus ϕ mit
Ergebnis.
σ (x, y) = ϕ(x) · y, wobei B M(ϕ)B = M B (σ )0 .
Somit gilt die Normalform von Seite 723 auch für die hermi-
teschen Sesquilinearformen. Und auch der Trägheitssatz von σ ist genau dann hermitesch, wenn ϕ selbstadjungiert ist.
Sylvester von Seite 723 bleibt weiterhin gültig, denn wegen
ρ(x) ∈ R kann der obige Beweis wortwörtlich übernommen
werden. Beweis: Nach (18.5) ist
σ (x, y) = B x 0 M B (σ ) B y
Trägheitssatz für Sesquilinearformen 0
= M B (σ )0 B x By = ϕ(x) · y .
Für hermitesche Sesquilinearformen σ gilt ebenfalls der
Trägheitssatz von Silvester: σ hat eine eindeutige Si- Nach den Ergebnissen aus dem Abschnitt 17.6, Seite 692,
gnatur (p, r − p, n − r), und es gibt stets Basen B, sind selbstadjungierte Endomorphismen durch hermitesche
deren Darstellungsmatrix M B (σ ) die Normalform von Darstellungmatrizen gekennzeichnet. Und dies ist in unserem
Seite 723 aufweist. Fall gegeben, denn
0
Liegt eine positiv definite hermitesche Sesquilinearform vor B M(ϕ)B = M B (σ ) = M B (σ )0 = B M(ϕ)B .
an. Es ist also tatsächlich jede positiv definite hermitesche Wir gehen somit von einer beliebigen orthonormierten Basis
Sesquilinearform als ein Skalarprodukt mit den üblichen Ei- B eines n-dimensionalen unitären Vektorraums aus und be-
genschaften aufzufassen. In diesem Sinn ist dann jede Basis stimmen die Eigenvektoren der hermiteschen Darstellungs-
B mit M B (σ ) = En orthonormiert. matrix M B (σ )0 . Zwar wissen wir bereits aus Kapitel 17
(siehe Seite 694), dass es eine Basis aus Eigenvektoren gibt,
Im Folgenden verwenden wir in dem C -Vektorraum V zwei die sogar orthonormiert ist, doch zum besseren Verständnis
hermitesche Sesquilinearformen σ und σ1 gleichzeitig: Da- fügen wir noch die folgende Rechnung an. Dabei bezeich-
bei soll σ1 positiv definit sein. Damit können wir σ1 als Ska- nen wir die orthonormierte Basis aus Eigenvektoren mit H ,
larprodukt interpretieren. Wir verwenden einfachheitshalber nachdem deren Vektoren h1 , . . . , hn die Hauptachsen von
den Punkt als Verknüpfungssymbol, setzen also x · y = σ aufspannen. Für die zugehörigen Eigenwerte λ1 , . . . , λn
σ1 (x, y). Der Vektorraum V wird dadurch zu einem unitären gilt:
Raum (Seite 678) mit einer weiteren hermiteschen Sesquili-
nearform σ . M B (σ )0 B hi = λi B hi für i = 1, . . . , n.
18.2 Hermitesche Sesquilinearformen 727
−36
x2 Seite 229, die Komponenten des Ortsvektors p −o bezüglich
−25 2 der Basis B.
−16 Übrigens wird in der Literatur oft gar kein eigenes Symbol für
−9 1 den affinen Raum verwendet wird; so bezeichnet Rn häufig
9
sowohl den reellen Vektorraum, als auch den reellen affinen
4
h2
h1 x1 Raum. In diesem Sinn wurde im Kapitel 7 vom Anschauungs-
−1 0
−3 −2 0 1 2 raum R3 gesprochen; eigentlich war dabei der affine Raum
−1 A (R3 ) gemeint. Wir wollen in diesem Kapitel nun doch kon-
1
−1 −9 Vektorraum V verwenden.
9
−16
−2 −25
−36 Von den quadratischen Formen zu
quadratischen Funktionen
Abbildung 18.5 Niveaulinien der quadratischen Form ρ(x) = x12 +
2x1 x2 − 5x22 mit der orthonormierten und gleichzeitig diagonalisierenden Basis
H = (h1 , h2 ). Um quadratische Formen bildlich darstellen zu können, ha-
ben wir in den Abbildungen 18.1, 18.2 und 18.3 die Niveau-
Die Abbildung 18.5 mit den Niveaulinien von ρ(x) verdeut- linien von quadratischen Formen ρ : R2 → R dargestellt.
licht den Unterschied zwischen der nunmehr orthonormierten Das waren die von den Punkten x mit
Basis und den früher verwendeten diagonalisierenden Basen
in der Abbildung 18.4. ρ(x) = c = konst.
Ein weiteres Zahlenbeispiel zur Hauptachsentransformation gebildeten Kurven, die Fasern der Abbildung ρ . In den
einer quadratischen und einer hermiteschen Form findet sich genannten Abbildungen traten als Niveaulinien Hyperbeln,
im Kapitel 17 auf Seite 695. Ellipsen und Geradenpaare auf. Wir hatten dort übrigens be-
reits von Punkten x gesprochen, also stillschweigend bereits
Wie auf Seite 722 erwähnt, erfordert die Bestimmung diago-
die affine Ebene A (R2 ) verwendet.
nalisierender Basen deutlich weniger Aufwand als jene der
Hauptachsen. Für einige Fragen müssen die Hauptachsen gar Wir verallgemeinern diese Punktmengen, indem wir neben
nicht bestimmt werden, so z. B. bei jener nach dem Typ einer der quadratischen Form ρ und der Konstanten c auch noch
Quadrik (siehe Seite 733). eine Linearform ϕ einfügen.
V (siehe Abschnitt 12.9). Die quadratische Funktion hat also In Verallgemeinerung der eingangs genannten Niveaulinien
die Koordinatendarstellung einer quadratischen Form interessieren wir uns nun für die-
jenigen Punkte x des affinen Raums A (V ), welche die Glei-
ψ(x) = (o;B) x 0 A (o;B) x + 2 a 0 (o;B) x + a (18.8) chung ψ(x) = 0 erfüllen, also für die Nullstellenmenge
ψ −1 (0) der quadratischen Funktion.
mit A0 = A. Dies bedeutet ausführlich:
!
n !
n
ψ(x) = aij xi xj + 2 ak xk + a bei aj i = aij . Definition einer Quadrik
i,j k=1
Ist ψ : A (V ) → K eine von der Nullfunktion verschie-
Die xi sind dabei die (o; B)-Koordinaten des Punktes x. Die dene quadratische Funktion, wobei V ein K-Vektorraum
Konstante a ist das Bild ψ(o) des Koordinatenursprungs, ist mit charK = 2, so heißt deren Nullstellenmenge
denn (o;B) o = 0.
Nach der obigen Definition zählt auch die Nullfunktion mit Q(ψ) = ψ −1 (0) = { x | ψ(x) = 0 } ⊂ A (V )
ψ(x) = 0 für alle x ∈ Rn , also mit A als Nullmatrix, a = 0
Quadrik des A (V ).
und a = 0 zu den quadratischen Funktionen.
Es liegt nahe, die n2 Einträge aik von A zusammen mit den n
Koordinaten (a1 , . . . , an ) des Vektors a 0 und der Konstan- Wird die Bedingung ψ(x) = 0 in Koordinaten dargestellt,
ten a in eine symmetrische (n + 1)-reihige Matrix zu packen, so nennt man dies eine Gleichung der Quadrik Q(ψ). Diese
nämlich in ist selbstverständlich abhängig vom verwendeten Koordina-
⎛ ⎞ tensystem. Ist V = Kn , und handelt es sich um kanonische
a a1 . . . an
' ( ⎜ a a Koordinaten (0; E) in A (Kn ), so sprechen wir von der ka-
a a0 ⎜ 1 11 . . . a1n ⎟
⎟
M ∗(o;B) (ψ) = =⎜ . .. .. ⎟ nonischen Gleichung der Quadrik.
a A ⎝ .. . . ⎠
an an1 . . . ann
Beispiel 1. Die Quadrik des A (R2 ) mit der kanonischen
Wir nennen diese symmetrische Matrix aus R(n+1)×(n+1) die Gleichung
erweiterte Darstellungsmatrix der quadratischen Funktion
ψ(x) = x12 + x22 − 1 = 0
ψ. So wie bereits in Abschnitt 7.5 können wir die Koordina-
tenvektoren x der Punkte durch Hinzufügen der nullten Koor-
ist der Einheitskreis.
dinate 1 zu Vektoren x ∗ ∈ Rn+1 erweitern. Dies führt auf die
erweiterte Matrizendarstellung der quadratischen Funktion: 2. Bei ψ(x) = x12 − x22 besteht die Nullstellenmenge Q(ψ)
ψ(x) = ∗0
M ∗(o;B) (ψ) (o;B) x ∗ aus den Geraden mit den Gleichungen x1 ± x2 = 0.
(o;B) x (18.9)
oder ausführlich 3. Bei ψ(x) = x12 ist die Nullstellenmenge eine einzige Ge-
⎛ ⎞⎛ ⎞
a a1 . . . an 1 rade, nämlich die x2 -Achse x1 = 0.
⎜
⎜ a1 a11 . . . a1n ⎟ ⎜ ⎟
⎟ ⎜ x1 ⎟
ψ(x) = (1, x1 , . . . , xn ) ⎜ .. .. .. ⎟ ⎜ .. ⎟ .
⎝ . . . ⎠⎝ . ⎠ 4. Bei ψ(x) = x12 + x22 ist Q(ψ) = {0}, d. h., die Quadrik
an an1 . . . ann xn besteht aus einem einzigen Punkt.
Beispiel Die erweiterte Koeffizientenmatrix der quadrati- Kommentar: Die quadratische Funktion ψ bestimmt
schen Funktion die zugehörige Quadrik Q(ψ) eindeutig. Umgekehrt ist
ψ(x) = 2x12 − x22 + 4x1 x3 − 6x2 − 2x3 + 5, dies nicht der Fall. So haben z. B. die beiden Funktionen
ψ1 , ψ2 : A (R2 ) → R mit den kanonischen Darstellungen
also
⎛ ⎞⎛ ⎞
2 0 2 x1 ψ1 (x) = x12 + x22 und ψ2 (x) = 2 x12 + x22
ψ(x) = (x1 , x2 , x3 )⎝ 0 −1 0 ⎠⎝ x2 ⎠
2 0 0 x3
⎛ ⎞ dieselbe Nullstellenmenge Q(ψ1 ) = Q(ψ2 ) = {0}. Erst über
x1 C ist die zu einer Quadrik gehörige quadratische Funktion bis
+ (0, −6, −2)⎝ x2 ⎠+5
auf einen Faktor eindeutig, außer ψ(x) ist das Quadrat einer
x3
linearen Funktion. Es haben nämlich z. B. die quadratischen
lautet: Funktionen
⎛ ⎞
5 0 −3 −1
⎜ 0 2 0 2 ⎟ ψ1 (x) = x1 und ψ2 (x) = x12
M ∗(0;E) (ψ) = ⎜
⎝ −3
⎟.
0 −1 0 ⎠
−1 2 0 0 selbst in A (C2 ) dieselbe Nullstellenmenge.
730 18 Quadriken – vielseitig nutzbare Punktmengen
Koordinatentransformationen können die Warum genau die Koordinatentransformation (∗) auf diese
Gleichung einer Quadrik vereinfachen einfache Gleichung führt, soll im Folgenden geklärt wer-
den.
Unser Ziel ist es, eine Übersicht über alle möglichen Qua-
driken in reellen affinen Räumen zu bekommen. Wir errei-
chen dies, indem wir durch spezielle Wahl des kartesischen Die Transformation einer Quadrikengleichung
Koordinatensystems die Koordinatendarstellung der quadra- auf Normalform erfolgt in zwei Schritten
tischen Funktion ψ und damit die Q definierende Gleichung
auf eine der auf Seite 733 angegebenen Normalformen brin- Wir beginnen damit, die Auswirkungen eines allgemeinen
gen. Durch einen Basiswechsel gelingt es, die Darstellungs- Koordinatenwechsels auf eine quadratische Funktion zu un-
matrix A = M B (σ ) der enthaltenen quadratischen Form zu tersuchen. Dabei beschränken wir uns weiterhin auf kartesi-
diagonalisieren. Lässt man auch eine Verschiebung des Koor- sche Koordinatensysteme. Wir untersuchen in diesem Sinn
dinatenursprungs zu, so kann in vielen Fällen die enthaltene die euklidische Geometrie der Quadriken und nicht deren
Linearform zum Verschwinden gebracht werden. affine Geometrie.
Ersetzen wir das Koordinatensystem (o; B) durch das Sys-
Beispiel Die quadratische Funktion ψ : A (R2 ) → R mit
tem (o ; B ), so bedeutet dies für die Koordinaten desselben
der kanonischen Darstellung
Punkts x (vergleiche Abschnitt 7.5):
ψ(x) = 9 x12 − 4 x1 x2 + 6 x22 − 32 x1 − 4 x2 + 24
(o;B) x = (o;B) o + B T B (o ;B ) x ,
bestimmt als Nullstellenmenge
√ Q(ψ) eine Ellipse mit den
Achsenlängen 1 und 2 (Abb. 18.6), denn nach Umrechnung wobei die Matrix B T B orthogonal, also (B T B )−1 =
auf die Koordinaten (B T B )0 ist. Wir setzen dies in die Darstellung (18.8)
' ( ' (
x1 1 ' −3 ( 1 ' 2 −1 ( x1 0
= √ −4 +√ (∗) ψ(x) = (o;B) x A (o;B) x + 2 a 0(o;B) x + a
x2 5 5 1 2 x2
wird dieselbe Punktmenge Q(ψ) durch die Gleichung ein, wobei wir kurz T für die Transformationsmatrix B T B
schreiben sowie t statt (o;B) o und x statt (o ;B ) x :
x12 + 1
2 x22 − 1 = 0
ψ(x) = (t 0 + x 0 T 0 )A(t + T x )
beschrieben (siehe Typ 2a auf Seite 734). + 2 a 0 (t + T x ) + a
x2 x2 = x 0(T 0 A T )x
+ t 0 A T x + x 0 T 0A t + 2 a 0 T x
+ t 0 A t + 2 a0 t + a .
x1 x 0 T 0 A t = (x 0 T 0 A t)0 = t 0 A T x .
2 t 0 A T x + 2 a 0 T x = 2 (t 0 A + a 0 ) T x .
Abbildung 18.6 Die Quadrik Q(ψ) mit der kanonischen Gleichung ψ(x) =
9x12 − 4x1 x2 + 6x22 − 32x1 − 4x2 + 24 = 0 ist eine Ellipse.
Lemma
Wir können dies durch Nachrechnen überprüfen. Dazu be- Eine Änderung des kartesischen Koordinatensystems
stimmen wir zunächst die Umkehrtransformation zu (∗). von (o; B) zu (o ; B ) mittels der Transformationsgleichung
Nachdem die dort auftretende 2 × 2 -Matrix orthogonal ist, (o;B) x = t + T (o ;B ) x verändert gleichzeitig die Dar-
ist ihre Inverse die Transponierte, und wir erhalten: stellung ψ(x) = (o;B) x 0 A (o;B) x + 2 a 0(o;B) x + a der
' ( ' (' √ ( quadratische Funktion ψ : A (V ) → R zu
x1 2 1 x1 + 3/√5
= √1
x2 5−1 2 x2 + 4/ 5 ψ(x) = 0
A + 2 a 0 (o ;B ) x + a
' ( ' (' ( (o ;B ) x (o ;B ) x
2 2 1 x1
= + √1 .
1 5 −1 2 x2 mit
Kommentar: Die in der quadratischen Funktion Wenn wir die positiven Eigenwerte λi durch 1/αi2 ersetzen
ψ : A (V ) → R vorkommende quadratische Form ρ : V → R und die negativen durch −1/αi2 bei αi > 0, so folgt als qua-
bleibt unverändert, denn die Darstellungsmatrix A wird dratischer Anteil in der transformierten Darstellung von ψ:
durch eine zu A kongruente Matrix A ersetzt. Die lineare
0 A = λ1 x1 2 + · · · + λr xr 2
Abbildung ϕ hingegen wird verändert, denn der Übergang (o ;B ) x (o ;B ) x
von der einzeilige Darstellungsmatrix a 0 zu a 0 ist bei t = 0 x1 2 xp 2 2
xp+1 xr 2
= + ··· + − − ··· −
keine Äquivalenz mehr. Dies ist deshalb ohne Änderung α12 αp2 2
αp+1 αr2
der quadratischen Funktion ψ möglich, weil nach dem
mit 0 ≤ p ≤ r = rg(A) ≤ n.
Koordinatenwechsel ρ nicht allein auf x, sondern auf x − o
angewendet wird.
2. Schritt: Nach der Beseitigung der gemischten Summan-
Durch die auf Seite 728 definierte quadratische Funktion
den verlagern wir den Ursprung derart, dass die linearen Sum-
ψ : A (V ) → R wird zwar die quadratische Form ρ ein-
manden ai xi weitgehend verschwinden.
deutig festgelegt, nicht aber die lineare Abbildung ϕ sowie
die Konstante a. Letztere ändern sich bei Verlagerung des Um in dem neuen Koordinatensystem (o ; B ) gleichzei-
Ursprungs von A (V ). tig die Linearform zum Verschwinden zu bringen, muss in
(18.10) a = 0 sein. Wegen der Invertierbarkeit von T ist
hierfür notwendig und hinreichend, dass t = (o;B) o das in-
Wenn wir diesen Koordinatenwechsel so wie im Kapitel 7 homogene lineare Gleichungssystem
durch die erweiterte Transformationsmatrix T ∗ beschreiben,
also in der Form A x = −a (18.11)
' ( ' (' ( löst. Hier sind zwei Fälle zu unterscheiden.
∗ 1 1 00 1
x = = = T ∗ x ∗ ,
x t T x
Fall a) Das System (18.11) ist lösbar:
Nach den Ergebnissen von Kapitel 5 wird in diesem Fall der
so erhalten wir die gegenüber M ∗(o;B) (ψ) aus (18.9) neue
Rang nicht größer, wenn zur Koeffizientenmatrix die Abso-
erweiterte Darstellungsmatrix M ∗(o ;B ) (ψ) auch direkt als
lutspalte hinzugefügt wird – auch wenn diese zuvor mit −1
das Matrizenprodukt
multipliziert wird. Also ist
' (' (' (
1 t0 a a0 1 00
M ∗(o ;B ) (ψ) = , rg(A | a) = rg(A) = r .
0 T0 a A t T
Jeder Punkt m, dessen (o; B)-Koordinaten dieses Glei-
wie eine einfache Rechnung mittels blockweiser Matrizen- chungssystem lösen, heißt Mittelpunkt der Quadrik. In dem
multiplikation bestätigt. Der Rang der erweiterten Matrix Koordinatensystem (m; H ) nimmt die Gleichung der Qua-
bleibt bei dieser Transformation unverändert, weil T ∗ inver- drik Q(ψ) die Form
tierbar ist.
2
x1 2 xp 2 xp+1 xr 2
Nun können wir darangehen, durch eine geeignete Wahl der + ··· + − − ··· − + a = 0
α12 αp2 2
αp+1 αr2
Basis B und des Koordinatenursprungs o die Koordinaten-
darstellung der quadratischen Funktion ψ aus (18.10) und an. Die Lösungsmenge dieser Gleichung, also Q(ψ), bleibt
damit die Gleichung der Quadrik Q(ψ) zu vereinfachen. unverändert, wenn wir die Gleichung mit einem von null ver-
schiedenen Faktor multiplizieren. Bei a = 0 können wir
1. Schritt: Wir diagonalisieren die Polarform und eliminie- durch die Multiplikation mit −1/a die Konstante auf −1
ren damit in der Quadrikengleichung alle gemischten Sum- normieren. Bei a = 0 erreichen wir durch eine etwaige
manden aij xi xj , i = j . Multiplikation mit −1, dass die Anzahl der positiven Dia-
gonaleinträge in A nicht kleiner ist als jene der negativen.
Nach der auf Seite 727 erklärten Hauptachsentransformation
Die Bezeichnung Mittelpunkt für die Lösungen von (18.11)
symmetrischer Bilinearformen haben wir als neue orthonor-
ist berechtigt, denn mit x ∈ Q(ψ) ist stets auch −x ∈
mierte Basis B = H eine aus lauter Eigenvektoren von A
Q(ψ), da die (m; H )-Koordinaten x1 , . . . , xn von x alle
zu wählen. Die Transformationsmatrix lautet:
nur im Quadrat vorkommen. Der Punkt m ist also tatsächlich
ein Symmetriezentrum der Quadrik.
B TH = ( B h1 , . . . , B hn ) .
Bei r = rg(A) < n gibt es mehr als einen Mittelpunkt; jeder
Damit wird A zur Diagonalmatrix diag (λ1 , . . . , λn ) mit Punkt aus m + EigA 0 löst das inhomogene Gleichungssys-
den Eigenwerten λi von A. Deren Vorzeichenverteilung er- tem, denn der (n − r)-dimensionale Eigenraum zum Eigen-
gibt sich aus der Signatur (p, r − p, n − r) von A. Wir wert 0 – übrigens das Radikal der Polarform zu quadratischen
können jedenfalls die p positiven Eigenwerte zu Beginn rei- Form ρ in ψ – ist genau die Lösungsmenge des zu (18.11)
hen, anschließend bei r = rg(A) die r − p negativen und gehörigen homogenen Systems A x = 0 (siehe Kapitel 5,
schließlich die n − r Nullen. Seite 183).
732 18 Quadriken – vielseitig nutzbare Punktmengen
Verschwindet die Konstante a in der Quadrikengleichung, mit (a1 , . . . , an ) als H -Koordinaten von a. Das inhomogene
so gehört der Mittelpunkt m gemäß (18.10) der Quadrik an. Gleichungssystem A x = −a aus (18.11) bekommt die Form
In diesem Fall enthält die Gleichung nur quadratische Sum-
manden. Die zugehörige Quadrik heißt kegelig. Mit jedem λ1 x 1 = −a1
.. ..
vom Koordinatenursprung m verschiedenen Punkt mit den . .
(m; H )-Koordinaten (x1 , . . . , xn ) gehört die ganze Verbin- λr xr = −ar
dungsgerade der Quadrik an, denn dann ist 0 = −ar+1
!
r !
r .. ..
. .
λi (t xi )2 = t 2 λi xi = 0 für alle t ∈ R.
2
0 = −an
i=1 i=1
Nun ist die Zerlegung von a in die beiden Komponenten
Fall b) Das System (18.11) ist nicht lösbar, es gibt keinen offensichtlich. Wir setzen
Mittelpunkt: Nun ist r = rg(A) < rg(A | a) ≤ n. ⎛ ⎞ ⎛ ⎞
a1 0
In diesem Fall können nicht alle linearen Summanden ai xi ⎜ . ⎟ ⎜ . ⎟
⎜ . ⎟ ⎜ . ⎟
⎜ . ⎟ ⎜ . ⎟
in der Quadrikengleichung eliminiert werden. Es wird sich ⎜ ⎟ ⎜ ⎟
⎜ ar ⎟ ⎜ 0 ⎟
H a1 = ⎜ 0 ⎟ und H a0 = ⎜a ⎟.
zeigen, dass ein linearer Term 2 xn bestehen bleibt. Dazu ⎜
⎜
⎟
⎟
⎜ r+1
⎜
⎟
⎟
⎜ . ⎟ ⎜ . ⎟
verhilft eine geeignete Zerlegung von a in die Summe zweier ⎝ .. ⎠ ⎝ .. ⎠
zueinander orthogonaler Komponenten. 0 an
Lemma
Ist das lineare Gleichungssystem A x = −a in (18.11) nicht Im parabolischen Fall bleibt ein linearer Term
lösbar, so lässt sich der Vektor a derart in eine Summe in der Quadrikengleichung bestehen
a 0 + a 1 zerlegen, dass einerseits a 0 ein Eigenvektor von A
zum Eigenwert 0 ist und andererseits das System A x = −a 1 Wenn wir in der (o; B)-Darstellung von ψ(x) den Vektor a
lösbar wird. durch die Summe a 0 + a 1 nach (18.12) ersetzen, so entsteht
0
ψ(x) = (o;B) x A (o;B) x + 2 a 0 0
0 (o;B) x + 2 a 1 (o;B) x + a.
Beweis: Für die Lösbarkeit des Systems A x = −a 1 ist
Darin kann der zweite lineare Summand zum Verschwinden
notwendig und hinreichend, dass a 1 im Bild der linearen
gebracht werden, indem als Ursprung o ein Punkt gewählt
Abbildung ϕA : x → A x liegt. Dieser Unterraum Im(ϕA )
wird, dessen (o; B)-Koordinaten das System A x = −a 1
wird wegen A hi = λi hi für i = 1, . . . , n bei λr+1 =
lösen.
· · · = λn = 0 von den ersten r Eigenvektoren h1 , . . . , hr
aufgespannt. Der zur Hülle dieser Eigenvektoren orthogonale Wegen der freien Wahl der letzten n − r orthonormierten
Raum ist die Hülle von hr+1 , . . . , hn , der Eigenraum EigA 0 Basisvektoren hr+1 , . . . , hn innerhalb von EigA 0 dürfen
zum Eigenwert 0. wir den letzten in Richtung von a 0 festsetzen. Dann ist in
H a 0 nur die letzte Koordinate von null verschieden, etwa
Die Zerlegung a = a 0 + a 1 wird durch die Bedingungen
H a 0 = an hn . Es bleibt in der Gleichung der Quadrik nur ein
a 0 ∈ EigA 0 = - hr+1 , . . . , hn . und a 1 ∈ Im(ϕA ) =
einziger linearer Term übrig, nämlich 2 an xn . Wegen r < n
- h1 , . . . , hr . eindeutig. Die beiden Komponenten a 0 bzw.
kommt sicherlich kein xn2 vor.
a 1 entstehen durch orthogonale Projektion von a in den Ei-
genraum EigA 0 bzw. in dessen orthogonales Komplement. Nun können wir noch die Konstante zu null machen, indem
wir den Ursprung o durch ein geeignetes o = o + λ hn
Nachdem die Koordinaten von a bezüglich der Basis H Ska-
ersetzen. Dies bedeutet, wir substituieren xn = xn − λ, wäh-
larprodukte sind (siehe Seite 670), gilt:
rend alle anderen Koordinaten unverändert bleiben. Auf der
!
n !
r linken Seite der Quadrikengleichung folgt:
a0 = (a · hi ) hi , a1 = (a · hj ) hj , (18.12)
i=r+1 j =1 !
r
λi xi2 + 2 an (xn − λ) + a.
wobei nach wie vor a = a 0 + a 1 gilt. Wegen der geforderten i=1
Unlösbarkeit des Systems in (18.11) ist a 0 = 0.
Die Wahl λ = a/2an beseitigt die Konstante.
Angenommen, der erste Schritt ist bereits erledigt. Dann Schließlich können wir noch erreichen (gegebenenfalls nach
ist die Quadrikengleichung bereits auf die aus Eigen- Multiplikation mit −1), dass unter den quadratischen Sum-
vektoren bestehende Basis H umgerechnet, also A = manden die Anzahl der positiven nicht kleiner ist als jene der
diag (λ1 , . . . , λr , 0, . . . , 0), und die Quadrikengleichung negativen. Nach der Division durch |an | wird der Koeffizient
lautet: von xn zu 2 oder −2. Im erstgenannten Fall können wir den
Basisvektor hn noch umorientieren, also xn durch −xn er-
λ1 x12 + · · · + λr xr2 + 2 (a1 x1 + · · · + an xn ) + a = 0 setzen.
18.3 Quadriken und ihre Hauptachsentransformation 733
Damit finden wir für jede Quadrik ein geeignetes Koordina- den Seiten 734 und 738 folgenden Auflistungen der Quadri-
tensystem, in welchem die Gleichung eine der nachstehend ken im R2 bzw. R3 .
angeführten Normalformen annimmt. Die Koordinatenach-
sen sind Achsen der Quadrik. Beispiel Wir bringen die Ellipse aus Abbildung 18.6 mit
der kanonischen Gleichung
Klassifikation der reellen Quadriken
ψ(x) = 9x12 − 4x1 x2 + 6x22 − 32x1 − 4x2 + 24 = 0
Es gibt drei Typen von Quadriken in A (Rn ). Die Nor-
malformen ihrer Gleichungen lauten wie folgt: auf Normalform.
Typ 1 (kegeliger Typ): 0 ≤ p ≤ r ≤ n, p ≥ r − p,
x2
rg(A∗ ) = rg(A | a) = rg(A) = r :
2
x12 xp2 xp+1 xr2
+ ··· + − − ··· − = 0. h2
α12 αp2 2
αp+1 αr2
Q(ψ)
m
Typ 2 (Mittelpunktsquadrik): 0 ≤ p ≤ r ≤ n,
rg(A∗ ) > rg(A | a) = rg(A) = r : h1
2
x12 xp2 xp+1 xr2 o x1
+ ··· + − − ··· − −1 = 0.
α12 αp2 2
αp+1 αr2
Abbildung 18.7 Die Quadrik 9x12 − 4x1 x2 + 6x22 − 32x1 − 4x2 + 24 ist eine
Typ 3 (parabolischer Typ): 0 ≤ p ≤ r < n, √
Ellipse mit den Achsenlängen 1 und 2.
p ≥ r − p, rg(A | a) > rg(A) = r :
2 In der Bezeichnung von (18.8) ist
x12 xp2 xp+1 xr2
+ ··· + − − ··· − − 2 xn = 0 . ' ( ' (
α12 αp2 2
αp+1 αr2 9 −2 −16
A= , a= und a = 24 .
−2 6 −2
Die in diesen Normalformen auftretenden wichtigen Kenn- Als Nullstellen des charakteristischen Polynoms
zahlen p und r ergeben sich aus der Signatur der Darstel- ' (
9 − λ −2
lungsmatrix M B (σ ) = A der in ψ enthaltenen quadratischen det(A − λE2 ) = det = λ2 − 15λ + 50
−2 6 − λ
Form. Diese sind, wie im Abschnitt 18.1 gezeigt wurde, auch
allein durch kombinierte Zeilen- und Spaltenumformungen erhalten wir die Eigenwerte
bestimmbar, also ohne orthogonales Diagonalisieren mittels
Berechnung der Eigenwerte. Auch die Entscheidung, um λ1 = 10, λ2 = 5
welchen Typ es sich handelt, kann ohne die Transformation
und als orthonormierte Basis von Eigenvektoren
auf Hauptachsen getroffen werden, nämlich allein anhand der
' ( ' (
Ränge der Matrizen A, (A | a) und der erweiterten Darstel- 1 2 1 1
h1 = √ , h2 = √ .
lungsmatrix A∗ . 5 −1 5 2
Die auf Normalform gebrachte Quadrik vom Typ 2 schneidet Das Gleichungssystem (18.11)
die Achse m + hi R für i ≤ p in Punkten, für deren i-te
(m; H )-Koordinate gilt: A x = −a
xi2 /αi2 − 1 = 0, also xi = ±αi , für die kanonischen Koordinaten des Mittelpunkts ist eindeu-
wobei λi = 1/αi2 ein positiver Eigenwert von A ist; alle ande- tig lösbar und liefert
ren Koordinaten sind null. Diese Schnittpunkte sind Scheitel ' (
2
der Quadrik. Das αi ist die zugehörigen Achsenlänge, also m= .
1
der Abstand des Mittelpunkts von den Scheiteln.
Die Umrechnung auf das Koordinatensystem (m; H ) gemäß
Die Geraden m + hi R mit i ≤ p heißen auch Hauptachsen
der Quadrik, jene mit p + 1 ≤ i ≤ r Nebenachsen. Die auf ' ( ' (
x1 x1
= E TH +m
Nebenachsen liegenden Schnittpunkte haben rein imaginäre
√ x2 x2
Koordinaten xi = ±i −αi . Bei einem mehrfachen Eigen-
wert λi ist die Achse m + hi R nicht mehr eindeutig. mit E T H = (h1 , h2 ), also
' ( ' (' ( ' (
Warum die Quadriken von Typ 3, also jene ohne Mittelpunkt, x1 1 2 1 x1 2
= √ +
auch parabolisch genannt werden, zeigen die Fälle in der auf x2 5 −1 2 x2 1
734 18 Quadriken – vielseitig nutzbare Punktmengen
bringt die Quadrikengleichung mit (18.10) auf die verein- Typ 2, Mittelpunktsquadriken: Hier bleiben fünf Fälle:
fachte Form x12 x22
2a) (r, p) = (2, 2), ψ(x) = + − 1, Q(ψ) ist eine
α12 α22
λ1 x1 2 + λ2 x2 2 + ψ(m) = 10 x1 2 + 5 x2 2 − 10 = 0 Ellipse,
x12 x22
2b) (r, p) = (2, 1), ψ(x) = − − 1, Q(ψ) ist eine
und nach Division durch 10 auf die Normalform α12 α22
Hyperbel,
x2 x22
x1 2 + 1
2 x2 2 −1=0 2c) (r, p) = (2, 0), ψ(x) = − 12 −
α1 α22
− 1, Q(ψ) = ∅,
√ x12
mit α1 = 1 und α2 = 2. Die in Abbildung 18.7 markierten 2d) (r, p) = (1, 1), ψ(x) = − 1, Q(ψ) besteht aus zwei
α12
Scheitel haben die Koordinaten parallelen Geraden,
' ( x2
2e) (r, p) = (1, 0), ψ(x) = − 12 − 1, Q(ψ) = ∅.
2 1 2 2 α1
2± √ , 1∓ √ , 2± , 1±2 .
5 5 5 5
Eine Ellipse mit α1 = α2 ist natürlich ein Kreis mit dem
Radius α1 . Gilt bei der Ellipse α1 > α2 , so heißt die ers-
te Koordinatenachse Hauptachse und α1 Hauptachsenlänge
Ein Beispiel mit einem parabolischen Typ folgt auf Seite 735. zum Unterschied von der Nebenachse und der Nebenachsen-
länge α2 .
Dieselben Bezeichnungen werden auch bei der Hyperbel
Die Quadriken in der Ebene und im Raum mit der obigen Normalform verwendet, wobei aber nur die
Hauptachse reelle Scheitel trägt. Die durch die Hyperbel-
x x
Wir beginnen mit der Aufzählung aller Quadriken in A (R2 ). mitte gehenden Geraden mit der Gleichung 1 = ± 2 hei-
α1 α2
Diese sind auch noch in der Übersicht auf Seite 737 festge- ßen Asymptoten. Sie bilden die Quadrik mit der Gleichung
x12 x2
halten. 2
− 22 = 0 vom Typ 1b.
α1 α2
Typ 1, kegelig: Die Bedingungen 0 ≤ p ≤ r ≤ 2 und
p ≥ r − p für (r, p) ergeben drei wesentlich verschiedene Typ 3, parabolisch: Als einzige Normalformen bleiben
Nullstellenmengen: x12
3a) (r, p) = (1, 1), ψ(x) = − 2 x2 , Q(ψ)ist eine Para-
α12
x12 x22
1a) (r, p) = (2, 2), ψ(x) = + , Q(ψ) = {0}, bel mit dem Scheitel in 0,
α12 α22
x12 x22
3b) (r, p) = (0, 0), ψ(x) = −x2 , Q(ψ) ist eine Gerade.
1b) (r, p) = (2, 1), ψ(x) = − , Q(ψ) umfasst zwei
α12 α22 Die Konstante α12 in der Parabelgleichung heißt Parameter
Geraden,
(siehe Abbildung 18.8).
1c) (r, p) = (1, 1), ψ(x) = x12 , Q(ψ) ist eine Gerade.
Die Kegelschnitte, also Ellipse, Parabel und Hyperbel, haben
Die quadratische Funktion ψ(x) im Fall 1b ist reduzibel, trotz ihres verschiedenen Aussehens viele Gemeinsamkeiten.
denn So treten sie alle als Lösungskurven des Einkörperproblems
' (' ( auf (siehe Kapitel 20). Die Abbildung 18.11 illustriert, wie
x12 x22 x1 x2 x1 x2 die Bahnen von der Wahl der Anfangsgeschwindigkeit ẋ(t0 )
− 2 = + − .
α12 α2 α1 α2 α1 α2 im gemeinsamen Anfangspunkt x(t0 ) abhängen.
x2 x2 x2
α2
α2
z
f1 α1 x1 f1 α1 x1
f2 f2
f
α12 /2 x1
x
α12 /2
y L α12
Abbildung 18.8 Die Punkte x der Ellipse (links) mit den Achsenlängen α1 > α2 und den Brennpunkten f i = (±e, 0)0 bei e = α12 − α22
erfüllen die Bedingung
x − f 1 + x − f 2 = 2 α1 . Die Punkte y der Hyperbel (Mitte) mit den Achsenlängen α1 , α2 und den Brennpunkten f i = (±e, 0)0 , e = α12 + α22 , sind durch
| y − f 1 − y − f 2 | = 2 α1 gekennzeichnet. Die Punkte z der Parabel (rechts) haben vom Brennpunkt f = (0, α12 /2)0 und von der Leitgeraden L mit der
Gleichung x2 = −α12 /2 dieselbe Entfernung.
18.3 Quadriken und ihre Hauptachsentransformation 735
Problemanalyse und Strategie: Wir gehen wie oben beschrieben vor: ψ(x) ist die Summe aus der quadratischen
Form x 0 A x = x12 +2x1 x2 +x22 , der Linearform 2 a 0 x = 4x1 +2x2 −4x3 und der Konstanten a = −3. Im ersten Schritt
bestimmen wir die Hauptachsen der quadratischen Form. Im zweiten Schritt erweist sich das lineare Gleichungssystem
A x = −a aus (18.11) zur Berechnung eines Mittelpunkts als unlösbar. Daher wird a aufgespaltet in zwei zueinander
orthogonale Komponenten a = a 0 + a 1 mit a 1 ∈ Im(ϕA ) und a 0 ∈ ker(ϕA ) = EigA 0. Der letzte Vektor h3 unserer
Basis entsteht durch Normierung von a 0 . Schließlich wird durch Verschiebung des Ursprungs noch die Konstante zum
Verschwinden gebracht.
x2
x12 x22
Typ 1, Kegelige Quadriken: + =0 ein Punkt
a12 a22 x1
zwei sich
x12 x22 x12
− =0 schneidende =0 eine Gerade
a12 a22 a12
Geraden
x12 x22
Typ 2, Mittelpunktsquadriken: + =1 Ellipse
a12 a22
x12
Typ 3, Parabolische Quadriken: − 2x2 = 0 Parabel
a12
Abbildung 18.12 Der quadratische Kegel (links) mit Hyperbelschnitten, der elliptische Zylinder (mittig) und der hyperbolische Zylinder (rechts) mit seinen
asymptotischen Ebenen (rot schattiert).
folgt: Jeder Wert t ∈ R \ {0} liefert als Schnitt der Ebenen eine Gerade, welche ganz auf dem Hyperboloid liegt. Wenn
mit den Gleichungen wir nämlich die linken Seiten und ebenso die rechten Seiten
dieser Gleichungen miteinander multiplizieren, so erhalten
E1 (t) : t αx11 − αx33 = 1 ∓ αx22 und wir genau die obige Normalform 2b’. Demnach gehört jeder
1 x1 gemeinsame Punkt der Ebenen E1 (t) und E2 (t) auch der
E2 (t) : α + αx33 = 1 ± αx22
t 1 Nullstellenmenge von 2b’ an. Je nachdem, ob wir die oberen
738 18 Quadriken – vielseitig nutzbare Punktmengen
Abbildung 18.14 Das dreiachsige Ellipsoid sowie das ein- und zweischalige Hyperboloid mit achsenparallelen Schnittkurven.
18.3 Quadriken und ihre Hauptachsentransformation 739
x3 x3
x2
x1
x1 x2
Abbildung 18.17 Die Bezeichnung der beiden Paraboloide ergibt sich aus der Art der Schnittkurven mit den Ebenen x3 = konst.
Die beiden Paraboloide 3a’ und 3b’ sind einheitlich als Schieb- Das hyperbolische Paraboloid ist wieder eine Fläche mit zwei
flächen erzeugbar, indem die Schnittparabel P1 mit der Ebene Erzeugendenscharen. Ähnlich wie beim einschaligen Hyper-
x2 = 0 entlang der Schnittparabel P2 mit der Ebene x1 = 0 boloid können wir wieder Ebenenpaare
parallel verschoben wird (Abb. 18.18). Dabei sind im ellipti-
schen Fall diese Schiebparabeln nach derselben Seite offen, E1 (t) : αx11 ± αx22 = t ,
im hyperbolischen Fall nach verschiedenen Seiten, weshalb
hier eine Sattelfläche entsteht. E2 (t) : αx11 ∓ αx22 = 2xt 3
aus der zu k = 0 gehörigen Parabel P1 hervorgeht. Abbildung 18.19 Das hyperbolische Paraboloid trägt so wie das einschalige
Hyperboloid zwei Erzeugendenscharen.
Als Schnittkurven mit den Ebenen x3 = k = 0 treten im
elliptischen Fall Ellipsen auf, im hyperbolischen Fall Hyper- Bei α1 = α2 wird das elliptische Paraboloid zum Drehpa-
beln. Dies ist eine Begründung für die Namensgebung der raboloid, und das hyperbolische Paraboloid heißt in diesem
beiden Paraboloide. Fall orthogonal.
740 18 Quadriken – vielseitig nutzbare Punktmengen
x3
zwei sich
x12 x22 eine
− =0 schneidende x12 = 0
a12 a22 Ebene
Ebenen
zwei
x12 x12 leere
=1 parallele − =1
a12 a12 Menge
Ebenen
18.4 Die Singulärwertzerlegung Es erweist sich allerdings als günstiger, den umgekehrten
Weg einzuschlagen und jene Vektoren x zu betrachten, de-
ren Bildvektoren ϕ(x) Einheitsvektoren sind. Diese liegen
Wir wenden uns noch einmal den linearen Abbildun-
natürlich alle außerhalb des Kerns von ϕ.
gen zwischen endlichdimensionalen Vektorräumen zu. Wel-
che zusätzlichen Eigenschaften einer derartigen Abbildung Wir beginnen mit einem Beispiel: Es sei
ϕ : V → V kann man feststellen, wenn die beteiligten Vek- 2 ' (
R → R2 , 1 1
torräume euklidisch sind? ϕ: mit A =
x → A x 0 1
Das Hauptziel des folgenden Abschnitts ist die Bestimmung
orthonormierter Basen H bzw. H , bezüglich welcher die und damit bijektiv (Abb. 18.20). Welche Vektoren x ∈ V
Darstellungsmatrix H M(ϕ)H möglichst einfach wird, näm- werden durch ϕ auf Einheitsvektoren abgebildet?
lich die Normalform
ϕ(e2 ) ϕ(h1 )
⎛ ⎞
s1 ... 0 0 ... 0 e2 h1 s1 h1
⎜
⎜ .. . . .. .. .. ⎟⎟ ϕ(h2 )
⎜
⎜
. . . . . ⎟
⎟
h2 e1 ϕ s2 h2
→
⎜ .. ⎟
0 . . . sr m×n ϕ(e1 )
H M(ϕ) H = ⎜ .. ⎟∈R (18.13)
⎜
⎜ 0 ... 0 . . ⎟
⎟
k
⎜ .. .. ⎟ k
⎝ . . ⎠
0 ... 0 0 ... 0
Abbildung 18.20 Die orthonormierte Basis (h1 , h2 ) bleibt orthogonal unter
annimmt, bei n = dim V , m = dim V , r = rg(ϕ) und si > 0 der bijektiven linearen Abbildung ϕ : R2 → R2 .
für i = 1, . . . , r. Wir werden diese Normalform kurz mit
diag (s1 , . . . , sr ) bezeichnen, auch wenn die Matrix nicht Die Forderung ϕ(x) = 1 ergibt bei Verwendung des ka-
quadratisch sein sollte. nonischen Skalarprodukts in Matrizenschreibweise:
Dabei ist Folgendes zu beachten: Die im Kapitel 12 be- Ax2 = (Ax)0 (Ax) = x 0 (A0A) x = 1 .
handelte Diagonalisierbarkeit einer linearen Abbildung ϕ :
V → V betraf nur Endomorphismen, also den Fall V = V . Das ist die kanonische Gleichung einer Quadrik k (siehe
Damit waren die Darstellungsmatrizen stets quadratisch, und Abb. 18.20) des A (R2 ), deren quadratische Form die Dar-
es konnte nur eine einzige Basis modifiziert werden, nämlich stellungsmatrix ' (
1 1
jene in V . Dabei stellte sich heraus, dass nicht jeder Endo- A0A =
1 2
morphismus diagonalisierbar ist.
hat. Nachdem in dieser Quadrikengleichung die linearen
Nun ist es anders. Wir können sowohl in V , als auch in V die Summanden fehlen, liegt der Mittelpunkt im Ursprung 0.
Basen der vorliegenden Abbildung ϕ anpassen. Daher gibt Wir transformieren diese Quadrik k auf ihre Hauptachsen.
es stets diagonalisierte Darstellungsmatrizen. Wir werden er-
kennen, dass die Diagonalisierung immer auch mit orthonor- Die Eigenwerte von A0A sind die Nullstellen des charakte-
mierten Basen erreichbar ist. ristischen Polynoms
det(A0A − λE2 ) = λ2 − 3λ + 1 ,
Die Eigenwerte von A0A geben also die Quadrate der zu. Das kanonische Skalarprodukt zwischen Bildvektoren in
extremen
√ Längenverzerrungsverhältnisse an. Wir nennen V bestimmt in V eine symmetrische Bilinearform gemäß
si = λi für i = 1, 2 die Hauptverzerrungsverhältnisse der Gleichung
oder die Singulärwerte von ϕ. Die Achsen von k sind die-
jenigen Geraden, längs derer diese extremen Längenverzer- ϕ(x) · ϕ(y) = (A x)0 (A y) = x 0 (A0A) y , (18.14)
rungen auftreten. Sie bestimmen die Hauptverzerrungsrich-
denn das Matrizenprodukt (A0A) ist symmetrisch.
tungen von ϕ. Vektoren längs der Nebenachse von k werden
am stärksten verlängert, jene längs der Hauptachse von k am Ist rg(A0A) = r, so gibt es r von null verschiedene Eigen-
meisten verkürzt. werte λ1 , . . . , λr von (A0A) und eine orthonormierte Ba-
sis H = (h1 , . . . , hn ) aus Eigenvektoren von V , wobei
Für die orthonormierte Basis H aus Eigenvektoren von A0 A
hr+1 , . . . , hn den Kern von ϕ aufspannen. Aus
wählen wir
' ( ' √ ( (A0 A) hj = λj hj
1 2√ 1 −1 − 5
h1 = , h2 =
w 1− 5 w 2
folgt für alle i, j ∈ {1, . . . , r} nach (18.14):
√ ϕ(hi ) · ϕ(hj ) = h0 0 0
bei w2 = 10 + 2 5. Die zugehörigen Bilder i (A A) hj = hi (λj hj ) = λj (hi · hj ) ,
in der Normalform (18.13) mit den beiden Hauptverzerrungs- sind orthonormiert und lassen sich zu einer orthonormier-
verhältnissen in der Hauptdiagonale. ten Basis von V ergänzen. Dabei ist -h1 , . . . , hr . das Bild
Im(ϕ) ⊂ V und -hr+1 , . . . , hm . orthogonal dazu.
Nachdem die lineare Abbildung ϕ in diesem Beispiel sogar
Wir haben also ϕ(hi ) = si hi für i ∈ {1, . . . , r} und
bijektiv ist, können wir umgekehrt auf analoge Weise fest-
ϕ(hj ) = 0 für j > r. Die H -Koordinaten der Bilder
stellen, dass die Bilder der Einheitsvektoren die Quadriken-
ϕ(hi ) sind die Spaltenvektoren in der Darstellungsmatrix
gleichung
H M(ϕ)H ; somit erhält diese die auf Seite 741 gezeigte Nor-
x 0 (A0 −1 A−1 ) x = x 0 (AA0 )−1 x = 1 malform (18.13).
erfüllen. Dies führt auf die im rechten Bild von Abbil- Die Singulärwerte einer linearen Abbildung
dung 18.20 gestrichelt eingezeichnete Ellipse mit Achsen- Für jede lineare Abbildung ϕ : V → V vom Rang r
längen s1 und s2 , auf welcher die Spitzen von ϕ(e1 ), ϕ(e2 ), zwischen den euklidischen Räumen V und V gibt es
ϕ(h1 ) und ϕ(h2 ) liegen. orthonormierte Basen H von V und H von V derart,
dass die Darstellungsmatrix H M(ϕ)H ∈ Rm×n die Nor-
malform diag (s1 , . . . , sr ) aus (18.13) annimmt mit den
Die Quadrate der Singulärwerte sind die Singulärwerten s1 , . . . , sr von ϕ als von null verschie-
Eigenwerte einer symmetrischen Matrix dene Einträge entlang der Hauptdiagonalen.
Nun wenden wir uns dem allgemeinen Fall einer linearen Angenommen, B und B sind beliebige orthonormierte Basen
Abbildung in V bzw. V und A ist die zugehörige Darstellungsmatrix
von ϕ. Dann ist
V = Rn → V = Rm ,
ϕ:
x → A x A= B M(ϕ)B = B T H H M(ϕ)H H T B ,
18.5 Die Pseudoinverse einer linearen Abbildung 743
und die Transformationsmatrizen H T B ∈ Rn×n und B T H ∈ Jede lineare Abbildung ist aus orthogonalen
Rm×m sind orthogonal. Endomorphismen und einer Skalierung
Jede Matrix A legt als (kanonische) Darstellungsmatrix eine zusammensetzbar
lineare Abbildung ϕ : x → A x fest. Wir ändern die Be-
zeichnung und schreiben D für die Normalform H M(ϕ)H Nun befassen wir uns noch mit der geometrischen Be-
aus (18.13) in Diagonalgestalt und ferner V statt H T B sowie deutung der Singulärwertzerlegung: Die lineare Abbildung
U statt H T B , also U 0 statt B T H . Dann ist U U 0 = Em ϕA : Rn → Rm mit x → A x bei A = U 0 D V ist die
und V V 0 = En . Zusammensetzung dreier linearer Abbildungen, nämlich
ϕA = ϕU 0 ◦ ϕD ◦ ϕV .
Die Singulärwertzerlegung einer Matrix
1. ϕV : Rn → Rn , x → V x ist ein orthogonaler Endo-
Für jede Matrix A ∈ Rm×n gibt es orthogonale Matrizen morphismus, also eine Abbildung, welche Längen und
U ∈ Rm×m und V ∈ Rn×n mit Winkel nicht ändert. Im Abschnitt 17.5 wurden derartige
Abbildungen als Isometrien bezeichnet. Drehungen und
A = U 0 D V bei D = diag (s1 , . . . , sr ) ∈ Rm×n Spiegelungen sind Beispiele dazu.
2. Die Abbildung ϕD : Rn → Rm mit der Darstellungs-
und s1 , . . . , sr > 0. Diese Darstellung heißt Sin-
matrix D = diag (s1 , . . . , sr ) lautet, in Koordinaten aus-
gulärwertzerlegung von A. Die Quadrate der in der
geschrieben:
Hauptdiagonale von D auftauchenden Singulärwerte
s1 , . . . , sr von A sind die von null verschiedenen Eigen- x1 = s1 x1
werte der symmetrischen Matrix A0A. Die Vielfachheit ⎛ ⎞ ⎛ ⎞ . ..
x1 x1 .. .
des Eigenwerts λi gibt an, wie oft der Singulärwert si ⎜ .. ⎟ ⎜ . ⎟ x = sr xr
⎝ . ⎠ → ⎝ .. ⎠ mit r (18.15)
auftritt. xr+1 = 0
xn xm .. ..
. .
xm = 0.
Dass die Matrix A keinesfalls quadratisch zu sein braucht,
soll das folgende Schema der Singulärwertzerlegung illus-
Diese Abbildung heißt Skalierung oder axiale Streckung,
trieren:
denn es werden die Koordinaten lediglich proportional
n verändert. Einzelne Proportionalitätsfaktoren dürfen auch
n m n
null sein.
m = m · · n
3. Die Abbildung ϕU 0 : Rm → Rm , x → U 0 x ist wieder
A = U0 D V eine Isometrie, diesmal im Rm .
Die Abbildung 18.21 zeigt einen Fall m = n = 2. Die li-
Wir fügen noch zwei Bemerkungen an: neare Abbildung ϕA ist zusammengesetzt aus einer Drehung
ϕV , einer axialen Streckung, die den eingezeichneten Kreis
1. Der Satz von der Singulärwertzerlegung gilt sinngemäß in eine Ellipse verwandelt, und einer abschließenden Dre-
auch in unitären Räumen. Wir können somit sagen, dass jede hung ϕU 0 .
Matrix A aus Rm×n oder Cm×n orthogonal- bzw. unitär-
Auf Seite 744 wird die Singulärwertzerlegung bei dem so-
äquivalent ist zu einer Matrix D gleicher Größe, aber in Dia-
genannten Registrierungsproblem eingesetzt und auch beim
gonalgestalt diag (s1 , . . . , sr ) mit reellen, und zwar positi-
Entwurf von interpolierenden Raumbewegungen.
ven si .
2. Die Singulärwerte einer Matrix sind abgesehen von ihrer
Reihenfolge eindeutig. Hingegen sind die Matrizen U und V 18.5 Die Pseudoinverse einer
nur dann eindeutig, wenn alle Singulärwerte einfach sind. Bei
einem mehrfachen Eigenwert λi = si2 sind die orthonormier-
linearen Abbildung
ten Eigenvektoren innerhalb des Eigenraums Eig(A0A) λi frei
wählbar. Wir gehen aus von einer beliebigen linearen Abbildung
ϕ : V → V zwischen endlichdimensionalen euklidischen
? Räumen. Bei dim V = n und dim V = m können wir die
1. Wie lauten die Singulärwerte einer orthogonalen Matrix speziellen orthonormierten Basen H und H mit der Darstel-
A ∈ Rn×n ? Geben Sie Singulärwertzerlegungen von A lungsmatrix H M(ϕ)H = diag (s1 , . . . , sr ) ∈ Rm×n in der
an. Normalform (18.13) benutzen bzw. die ausführlichen Abbil-
dungsgleichungen aus (18.15). Wir erkennen als Kern bzw.
2. Angenommen, ϕ : R3 → R3 ist die orthogonale Projek- Bild von ϕ:
tion auf eine Ebene des R3 . Wie sieht die zugehörige
Diagonalmatrix D mit den Singulärwerten aus? ker(ϕ) = -hr+1 , . . . , hn . ⊂ V ,
Im(ϕ) = -h1 , . . . , hr . ⊂ V .
744 18 Quadriken – vielseitig nutzbare Punktmengen
Gegeben sei eine invertierbare Matrix A ∈ R3×3 . Gesucht Dieser Wert ist minimal, wenn die zu subtrahierende Li-
ist diejenige orthogonale Matrix B ∈ R3×3 , für welche nearkombination
B − A minimal ist. Dabei verwenden wir hier die Fro-
beniusnorm, die für die Matrix C = (c1 , c2 , c3 ), durch s1 r11 + s2 r22 + s3 r33
die Formel
mit fest vorgegebenen positiven Koeffizienten s1 , s2 und s3
C = c1 2 + c2 2 + c3 2
maximal ist. Die rii sind einzelne Koordinaten von Ein-
bestimmt ist. Diese Norm ändert sich nicht, wenn C links heitsvektoren und daher alle ≤ 1. Die minimale Norm
mit einer orthogonalen Matrix multipliziert wird, denn da- liegt also genau dann vor, wenn die Hauptdiagonalele-
bei bleibt die Länge jedes einzelnen Spaltenvektors ci von mente r11 = r22 = r33 = 1 sind. Somit bleibt r i = ei ,
C erhalten. Weil C2 auch gleich der Quadratsumme der also:
Längen aller Zeilenvektoren ist, lässt die Rechtsmultipli-
kation von C mit einer orthogonalen Matrix diese Norm U B V 0 = E3 und weiter B = U 0 V .
ebenfalls invariant.
Wir gehen aus von der Singulärwertzerlegung Man erhält demnach die zu A nächstgelegene orthogonale
Matrix B einfach dadurch, dass in der Singulärwertzerle-
A = U 0 D V mit D = diag (s1 , s2 , s3 )
gung von A alle Singulärwerte gleich 1 gesetzt werden,
mit s1 , s2 , s3 > 0, weil A invertierbar vorausgesetzt ist. also D durch E3 ersetzt wird.
Wir suchen eine Matrix B, für welche die Differenz eine
minimale Norm U 0 D V − B aufweist. Dabei sind die
Kommentar: Dies gilt auch noch, wenn einer der Ei-
Matrizen U , V und B orthogonal. Deshalb ist
genwerte von A0A verschwindet, also etwa bei s3 = 0,
U 0 D V − B = U (U 0 D V − B)V 0 weil r11 = r22 = 1 als dritten Spaltenvektor in der or-
= D − U B V 0 . thogonalen Matrix U B V 0 nur mehr r 3 = e3 zulässt.
Wir setzen an: Erst bei s2 = s3 = 0 ist das optimale B nicht mehr ein-
deutig.
U B V 0 = rik = (r 1 , r 2 , r 3 )
mit r i = 1, weil das Produkt orthogonaler Matrizen
Dies wird im Bereich der Bewegungsplanung angewandt,
wieder orthogonal ist.
z. B. bei der Steuerung von Robotern:
Wegen D = (s1 e1 , s2 e2 , s3 e3 ) mit (e1 , e2 , e3 ) als kano-
Zur Festlegung einer stetigen Bewegung zwischen zwei
nischer Basis folgt:
oder auch mehreren vorgegebenen Raumpositionen wer-
!
3
den zunächst einzelne Punktbahnen unabhängig vonein-
D − U BV 0 2 = (si ei − r i )2
ander interpoliert, etwa jene des Ursprungs und der Ein-
i=1
3
! heitspunkte eines mit dem Raumobjekt starr verbundenen
= si2 e2i − 2 si (ei · r i ) + r 2i Achsenkreuzes. Diese Bahnpunkte bestimmen zu jedem
i=1 Zeitpunkt ein zunächst noch affin verzerrtes Objekt, also
3
! – abgesehen von der Verschiebung – das Bild in einer li-
= si2 − 2 si rii + 1 nearen Abbildung x → A x. Indem nun A nach dem oben
i=1 beschriebenen Verfahren durch eine orthogonale Matrix
!
3 !
3
approximiert wird, werden die Zwischenlagen kongruent
= si2 − 2 si rii + 3.
zur Ausgangslage.
i=1 i=1
18.5 Die Pseudoinverse einer linearen Abbildung 745
1) Normalform äquivalenter Matrizen wenn A eine Basis aus Eigenvektoren besitzt. Die Ein-
Zu jeder Matrix A ∈ Km×n gibt es invertierbare Ma- träge λ1 , . . . , λn in der Diagonalmatrix D sind die Ei-
trizen R ∈ Km×m und S ∈ Kn×n derart, dass genwerte von A, also die Nullstellen des charakteristi-
' ( schen Polynoms χA (X) = det (A − X En ). Matrizen
Er 0
Nr = R −1 A S = A mit dieser Eigenschaft heißen diagonalisierbar. Für
0 0
⎛ ⎞ die Diagonalisierbarkeit von A ist notwendig und hin-
1 ... 0 0 ... 0
⎜ .. . . .. . .. ⎟ reichend,
⎜ . . . .. . ⎟
⎜ ⎟ dass χA (X) in Linearfaktoren zerfällt und
= ⎜ ⎟
0 ... 1
⎜ ⎟ ∈ Km×n für jeden Eigenwert λi von A die algebraische Viel-
⎜ 0 ... 0 ⎟
⎜ .. .. .. .. ⎟
⎝ . . . . ⎠ fachheit ki , also die Vielfachheit als Nullstelle von
0 ... 0 0 ... 0 χA (X), gleich der geometrischen Vielfachheit von
bei r = rg A. Diese Normalform Nr ist durch elemen- λi ist. Letztere ist definiert als Dimension des Eigen-
tare Zeilenumformungen und Spaltenvertauschungen raums EigA (λi ), also der Lösungsmenge des homo-
zu erreichen. genen linearen Gleichungssystems (A−λi En ) x = 0.
D ist ein Spezialfall der Jordan-Normalform (siehe Ab-
1B) Singulärwertzerlegung
schnitt 14.6); alle Jordan-Kästchen sind 1×1-Matrizen.
Für jede Matrix A ∈ Rm×n gibt es orthogonale Matri-
zen U ∈ Rm×m und V ∈ Rn×n , also mit U −1 = U 0 3) Kongruente symmetrische Matrizen
und V −1 = V 0 , derart dass Ist A ∈ Rn×n symmetrisch, also A0 = A, oder
A ∈ Cn×n hermitesch, also A0 = A, so gibt es stets
A = U −1 D r V bei
⎛ ⎞
invertierbare Matrizen T ∈ Rn×n bzw. S ∈ Cn×n und
s.1 . . . 0.
.. .
0. . . . 0. eine zu A kongruente Diagonalmatrix
⎜ .. .. .. ⎟
⎜ . . ⎟ 0
⎜ ⎟ D = T 0A⎛T bzw. D =
⎞
S AS
Dr = ⎜ .. ⎟
0 . . . sr
⎜ .. ⎟ ∈ Rm×n λ1 . . . 0
⎜ 0. . . . 0. . . ⎟
bei D = ⎜
⎜ ⎟ . . . ⎟
⎝ .. .. ⎠ ⎝ .. .. .. ⎠
0 ... 0 0 ... 0 0 . . . λn
und s1 , . . . , sr > 0. Die Quadrate der in der Hauptdia- Die Einträge λ1 , . . . , λn in dieser durch gekoppelte
gonalen von D r angeführten Singulärwerte s1 , . . . , sr Zeilen- und Spaltenumformungen erreichbaren Diago-
von A sind die von null verschiedenen Eigenwerte der nalmatrix D sind nicht eindeutig, wohl aber die An-
symmetrischen Matrix A0A. zahlen p, q der positiven bzw. negativen Werte mit
Dasselbe gilt allgemeiner bei A ∈ Cm×n mit uni- p + q = rg A gemäß dem Trägheitssatz.
0
tären Matrizen U und V , also bei U −1 = U und 3B) Orthogonales Diagonalisieren
0 Ist A ∈ Rn×n symmetrisch oder A ∈ Cn×n hermitesch,
V −1 = V . In diesem Fall sind s12 , . . . , sr2 Eigenwerte
0 so sind alle Eigenwerte λ1 , . . . , λn reell, und es gibt
der hermiteschen Matrix A A.
eine orthonormierte Basis von Eigenvektoren. Zu je-
2) Diagonalisieren von Endomorphismen dem derartigen A gibt es eine orthogonale bzw. unitäre
Zu einer quadratischen Matrix A ∈ Kn×n gibt es nur 0
Matrix S, also mit S −1 = S 0 bzw. S −1 = S , derart
dann eine invertierbare Matrix S ∈ Kn×n mit
⎛⎞ dass
λ1 . . . 0 D = diag (λ1 , . . . , λn ) = S −1 A S.
D = S −1 A S = ⎜
. .. . ⎟
⎝ .. . .. ⎠, Darauf beruht die Hauptachsentransformation quadra-
0 . . . λn tischer oder hermitescher Formen.
746 18 Quadriken – vielseitig nutzbare Punktmengen
V V
b2 x
ϕ(b2 )
0
b1
A = U 0D V in e
ar
ϕ(x)
ϕ : x → A x 0
r −→ e A
A lgeb lge ϕ(b1 )
br
re
inea
a
L Drehung ↓ ϕV Drehung ↑ ϕU 0
ϕD
−→
i n ear
Lin Skalierung
e Alg
ebra
ear
eA
lge
b
Abbildung 18.21 Die geometrische Deutung der Singulärwertzerlegung von A : Die lineare Abbildung ϕ : R2 → R2 , x → A x ist zusammensetzbar aus zwei
Drehungen und einer Skalierung.
Die jeweiligen Orthogonalräume sind In diesem Produkt von linearen Abbildungen ist ν die Or-
thogonalprojektion von V auf den r-dimensionalen Unter-
ker(ϕ)⊥ = -h1 , . . . , hr . ⊂ V , raum ker(ϕ)⊥ (Abb. 18.22). Hingegen ist β eine Bijektion,
Im(ϕ)⊥ = -hr+1 , . . . , hm . ⊂ V . und zwar eine Skalierung. Und schließlich ist τ eine Ein-
bettungsabbildung: Vektoren aus dem r-dimensionalen Bild
Im(ϕ) werden als Vektoren des m-dimensionalen Zielraums
Im(ϕ)⊥ V aufgefasst; die r Koordinaten werden durch Nullen zu m
V
V ker(ϕ) y Koordinaten aufgefüllt.
x
ν
ν
ϕ(x)
Gibt es keine Inverse zu einer linearen
0
Abbildung, so doch eine Pseudoinverse
0
ker(ϕ ) ⊥ ϕ + (y )
)
−→
(ϕ
β
r < m, so ist ϕ nicht invertierbar. Die Menge ϕ −1 (x ) der
Abbildung 18.22 Die lineare Abbildung ϕ ist aus einer Orthogonalprojektion ν, Urbilder von x ∈ V ist nur bei x ∈ Im(ϕ) nichtleer und
der Bijektion β und der Einbettung τ in V zusammensetzbar, die Pseudoinverse dann gleich der Faser β −1 (x ) + ker(ϕ). Mithilfe der obigen
ϕ + aus der Orthogonalprojektion ν im Zielraum, der Inversen β −1 und der
Zerlegung ϕ = τ ◦ β ◦ ν mit dem bijektiven Mittelteil β
Einbettung in V .
bietet sich aber die Möglichkeit einer Ersatz-Inversen von ϕ
Die Verwendung von H -Koordinaten in V und H - an.
Koordinaten in V macht deutlich, dass ϕ wie folgt zusam- Wir setzen die Orthogonalprojektion ν von V auf Im(ϕ)
mensetzbar ist: zusammen mit β −1 und einer Einbettungsabbildung in V
(Abb. 18.22), also ausführlich
ν β τ
V = Rn → ker(ϕ)⊥ → Im(ϕ) → V = Rm
⎛ ⎞ ⎛ ⎞ ν β −1 τ
x1 s1 x1 V = Rm → Im(ϕ) → ker(ϕ)⊥ → V = Rn
⎜ .. ⎟ ⎜ .. ⎟ ⎛ ⎞ ⎛ ⎞
⎛ ⎞ ⎛ ⎞ y1 y1 /s1
⎜ . ⎟ ⎜ . ⎟
⎜ ⎟ x1 s1 x1 ⎜ ⎟ ⎜ .
⎜ .
⎟
⎟ ⎛ ⎞ ⎛ ⎞ ⎜ .
⎜ .
⎟
⎟
⎜ xr ⎟ ν ⎜ . ⎟ β ⎜ . ⎟ τ ⎜ sr xr ⎟ ⎜ . ⎟ y1 y1 /s1 ⎜ . ⎟
⎜ ⎟ → ⎝ . ⎠ → ⎝ . ⎠ → ⎜ ⎟. ⎜ ⎟ ν ⎜ . ⎟ β −1 ⎜ ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ yr ⎟ . ⎟ τ ⎜ yr /sr ⎟
⎜ xr+1 ⎟
. .
⎜ 0 ⎟ ⎜ y
⎜ r+1
⎟
⎟
→ ⎜ . ⎟ →
⎝ . ⎠
⎜
⎝ . ⎟
. ⎠
→ ⎜ 0
⎜
⎟.
⎟
⎜ .. ⎟ xr sr xr ⎜ .. ⎟ ⎜ ⎟
yr ⎜ ⎟
⎝ . ⎠ ⎝ . ⎠ ⎜ .
⎝ .
⎟
⎠
yr /sr ⎜ .
⎝ ..
⎟
⎠
.
xn 0 ym 0
18.5 Die Pseudoinverse einer linearen Abbildung 747
Wir nennen ist die orthogonale Projektion von V auf den r-dime