Sie sind auf Seite 1von 1165

Grundwissen Mathematikstudium

Tilo Arens Rolf Busam Frank Hettlich Christian Karpfinger Hellmuth Stachel

Grundwissen
Mathematikstudium
Analysis und Lineare Algebra mit Querverbindungen

mit Beiträgen von Klaus Lichtenegger

Springer Spektrum
Autoren
Tilo Arens, Karlsruher Institut für Technologie (KIT), tilo.arens@kit.edu
Rolf Busam, Mathematisches Institut, Universität Heidelberg, busam@mathi.uni-heidelberg.de
Frank Hettlich, Karlsruher Institut für Technologie (KIT), frank.hettlich@kit.edu
Christian Karpfinger, Technische Universität München, karpfing@ma.tum.de
Hellmuth Stachel, Technische Universität Wien, stachel@dmg.tuwien.ac.at

ISBN 978-3-8274-2308-5 ISBN 978-3-8274-2309-2 (eBook)


DOI 10.1007/978-3-8274-2309-2

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte biblio-
grafische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

Springer Spektrum
© Springer-Verlag Berlin Heidelberg 2013

Teile des Buches basieren auf Arens, Hettlich, Karpfinger, Kockelkorn, Lichtenegger, Stachel „Mathematik“, ISBN:
978-3-8274-2347-4, das für Anwender der Mathematik konzipiert wurde.

Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Ur-
heberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen,
Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne be-
sondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-
Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften.

Planung und Lektorat: Dr. Andreas Rüdinger, Bianca Alton


Redaktion: Bernhard Gerl
Fotos/Zeichnungen: Thomas Epp und die Autoren
Satz: EDV-Beratung Frank Herweg, Leutershausen
Einbandabbildung: © Jos Leys
Einbandentwurf: deblik, Berlin

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist eine Marke von Springer DE.


Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media.
www.springer-spektrum.de
Vorwort
Herauskristallisieren der diffizilen Unterschiede der Defini-
Ein Mathematikstudium beginnt zumeist mit den zwei tionen erscheint uns für das mathematische Verständnis sehr
großen Vorlesungsblöcken: Analysis und Lineare Algebra. hilfreich.
Beide sind wesentliche Bausteine für die Fundamente der
modernen Mathematik. Die Fächer haben mehr gemein, als Der kurze Abriss zur Geschichte der Mathematik soll Sie
es am Anfang vielleicht scheinen mag. Ihre Verzahnungen neugierig machen, auch diese Aspekte Ihres Fachs zu erfra-
bieten die Gelegenheit, viele Aspekte gleich von Beginn an gen. Denn der modernen und oft sehr eleganten Darstellung
besser zu verstehen. Wir Autoren möchten mit dem vorlie- der Mathematik geht eine fast 3 000-jährige Geschichte vor-
genden neuen Lehrbuch einen Weg in die Mathematik anbie- aus. Die Integration und die Begriffe Gruppe und Vektorraum
ten, der auch diese Verknüpfungen vermittelt. sind schöne Beispiele, wie spannend das Ringen um sinnvolle
Definitionen in der Mathematik war und bis heute ist.
Es ist uns Autoren bewusst, dass ein Einstieg in die Mathe-
Wir wünschen Ihnen mit dem Buch viel Freude und Erfolg
matik nicht leicht ist. Daher haben wir uns entschieden
auf Ihrem Weg in das faszinierende Fach Mathematik.
an unserem Lehrbuch Mathematik von Arens, Hettlich,
Karpfinger, Kockelkorn, Lichtenegger und Stachel anzu- Mit der Fertigstellung eines derart umfangreichen Werks ist
knüpfen und auch für ein Mathematikstudium eine ausführ- auch der Zeitpunkt der Danksagungen gekommen: Unser
liche Einführung anzubieten. Selbstverständlich nehmen in Dank gilt zunächst all den vielen Mathematikern, von de-
einem Lehrbuch für Mathematiker die Beweise eine zentrale nen wir Mathematik erlernen durften bzw. dürfen und die es
Stellung ein. In der gebotenen Breite werden diese erklärt. möglich machen, heute innerhalb eines Lehrbuchs einen sehr
In einigen uns sehr wichtig erscheinenden Fällen werden umfassenden Einstieg zur Mathematik zu bieten. Besonders
Beweise genauer unter die Lupe genommen, um Schwie- bedanken wir uns bei unseren Co-Autoren zum Lehrbuch
rigkeiten, Alternativen und/oder Argumentationen herauszu- Mathematik, Dr. K. Lichtenegger und Prof. Dr. U. Kockel-
arbeiten. Es sei noch angemerkt, dass bei Verwendung der korn, deren Materialien und Anregungen wir hier mit ein-
männlichen Sprachform wie „Mathematiker“, „Leser“, etc. fließen lassen konnten. Ein großer Dank geht auch an Prof.
stets Frauen und Männer gemeint sind. Dr. G. Kemper. Aus seinen Vorlesungen zur linearen Algebra
fanden einige raffinierte Beispiele und kurzweilige Beweise
Die Stoffauswahl orientiert sich am ersten Studienjahr, wobei ihren Weg in dieses Lehrbuch. Ebenso möchten wir uns bei
zur Orientierung die Analysis und die Lineare Algebra farbig Prof. Dr. N. Henze, Prof. Dr. R. Schulze-Pillot, Dipl.-Math.
markiert sind. Neben der Zusammenfassung der beiden Fä- M. Mitschele und M.Sc. T. Rösch für Anregungen und inten-
cher in einem Werk sind wir konzeptionell auch an anderen sives Korrekturlesen von Teilen des Manuskripts bedanken.
Stellen neue Wege gegangen. In Hinblick auf Umstellungen Für ein sorgsames allgemeines Redigieren bedanken wir uns
in den zeitgemäßen Bachelor- und Lehramtsstudiengängen bei Dipl.-Phys. M. Gerl. Perfekte Ausgestaltung vieler Ab-
haben wir etwa die lineare Optimierung und Aspekte der dis- bildungen verdanken wir Herrn Th. Epp. Außerdem hat er,
kreten Mathematik im Curriculum mit aufgenommen. Auch sowie Herr S. Haschler und Herr M. Schlöder Teile des Manu-
das Thema Integration bekommt mehr Raum. Üblicherweise skripts in LATEX umgesetzt. Auch dafür gilt unser Dank. Ganz
wird in einer Vorlesung nur ein Integrationsbegriff vorge- besonders bedanken wir uns für die fachkundige und stets
stellt. Es gibt aber verschiedene Zugänge. Wir stellen den umsichtige Zusammenarbeit mit Frau B. Alton und für die
aus unserer Sicht wichtigsten Begriff ausführlich vor, aber höchst kompetente und kreative Projektleitung durch Herrn
betrachten zudem auch zwei weitere Zugänge. Gerade das Dr. A. Rüdinger von Springer Spektrum.
Die Autoren
PD Dr. Tilo Arens ist als Dozent an der PD Dr. Christian Karpfinger lehrt an der
Fakultät für Mathematik des Karlsruher Technischen Universität München; 2004
Instituts für Technologie (KIT) tätig. Für erhielt er den Landeslehrpreis des Frei-
den Vorlesungszyklus Höhere Mathema- staates Bayern.
tik für Studierende des Maschinenbaus
und des Chemieingenieurwesens erhielt
er 2004 gemeinsam mit anderen Mitglie-
dern seines Instituts den Landeslehrpreis
des Landes Baden-Württemberg.

Dr. Rolf Busam ist Co-Autor eines er- Dr. Dr. h.c. Hellmuth Stachel ist seit mehr
folgreichen Lehrbuchs über Funktionen- als 30 Jahren Professor für Geometrie
theorie und von zwei Prüfungstrainern an der Technischen Universität Wien und
(über Analysis bzw. Lineare Algebra). seit 2011 emeritiert.
Während seiner langjährigen Lehrtätig-
keit als Akademischer Direktor an der Fa-
kultät für Mathematik und Informatik der
Universität Heidelberg liegt sein Interes-
senschwerpunkt in der komplexen Ana-
lysis und der Analytischen Zahlentheo-
rie. Ferner ist ihm die Lehreraus- und
-weiterbildung ein besonderes Anliegen.

PD Dr. Frank Hettlich ist als Dozent an


der Fakultät für Mathematik des Karls-
ruher Instituts für Technologie (KIT) tä-
tig. Für den Vorlesungszyklus Höhere
Mathematik für Studierende des Ma-
schinenbaus und des Chemieingenieur-
wesens erhielt er 2004 gemeinsam
mit anderen Mitgliedern seines Instituts
den Landeslehrpreis des Landes Baden-
Württemberg.
Inhaltsverzeichnis
Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V 5.3 Das Lösungskriterium und die Struktur
der Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
1 Mathematik – eine Wissenschaft für sich 1 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 185
1.1 Über Mathematik, Mathematiker und Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
dieses Lehrbuch . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Die didaktischen Elemente dieses 6 Vektorräume – von Basen
Buchs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 und Dimensionen . . . . . . . . . . . . . . . . . . 189
1.3 Ratschläge zum Einstieg in die 6.1 Der Vektorraumbegriff . . . . . . . . . . . . . . . . . 190
Mathematik . . . . . . . . . . . . . . . . . . . . . . . . . . 10 6.2 Beispiele von Vektorräumen . . . . . . . . . . . . 193
1.4 Eine kurze Geschichte der Mathematik . . . 13 6.3 Untervektorräume . . . . . . . . . . . . . . . . . . . . . 196
6.4 Basis und Dimension . . . . . . . . . . . . . . . . . . 198
2 Logik, Mengen, Abbildungen – 6.5 Summe und Durchschnitt von Unter-
die Sprache der Mathematik . . . . . . . . 27 vektorräumen . . . . . . . . . . . . . . . . . . . . . . . . . 211
2.1 Junktoren und Quantoren . . . . . . . . . . . . . . 28 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 222
2.2 Grundbegriffe aus der Mengenlehre . . . . . 34 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
2.3 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . 40
7 Analytische Geometrie –
2.4 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 58
Rechnen statt Zeichnen . . . . . . . . . . . . . 227
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 7.1 Punkte und Vektoren im
Anschauungsraum . . . . . . . . . . . . . . . . . . . . . 228
3 Algebraische Strukturen – 7.2 Das Skalarprodukt im Anschauungsraum . 232
7.3 Weitere Produkte von Vektoren im
ein Blick hinter die Rechenregeln . . . . 63
Anschauungsraum . . . . . . . . . . . . . . . . . . . . . 238
3.1 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
7.4 Abstände zwischen Punkten, Geraden
3.2 Homomorphismen . . . . . . . . . . . . . . . . . . . . . 71
und Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . 247
3.3 Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7.5 Wechsel zwischen kartesischen
3.4 Ringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Koordinatensystemen . . . . . . . . . . . . . . . . . . 257
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 95
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 268
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
4 Zahlbereiche – Basis der gesamten 8 Folgen – der Weg ins Unendliche . . . . 275
Mathematik . . . . . . . . . . . . . . . . . . . . . . . 101 8.1 Der Begriff einer Folge . . . . . . . . . . . . . . . . . 276
4.1 Der Körper der reelle Zahlen . . . . . . . . . . . . 102 8.2 Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
4.2 Anordnungsaxiome für die reellen Zahlen 106 8.3 Häufungspunkte und Cauchy-Folgen . . . . . 291
4.3 Ein Vollständigkeitsaxiom . . . . . . . . . . . . . . 114 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 299
4.4 Natürliche Zahlen und vollständige Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.5 Ganze Zahlen und rationale Zahlen . . . . . . 127 9 Funktionen und Stetigkeit –
4.6 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . 134 ε trifft auf δ . . . . . . . . . . . . . . . . . . . . . . 303
4.7 Vertiefung: Konstruktiver Aufbau 9.1 Grundlegendes zu Funktionen . . . . . . . . . . 304
der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . 148 9.2 Beschränkte und monotone Funktionen . . 310
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 155 9.3 Grenzwerte für Funktionen und die
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
9.4 Abgeschlossene, offene, kompakte
5 Lineare Gleichungssysteme – Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
ein Tor zur linearen Algebra . . . . . . . . 165 9.5 Stetige Funktionen mit kompaktem
5.1 Erste Lösungsversuche . . . . . . . . . . . . . . . . . 166 Definitionsbereich, Zwischenwertsatz . . . . . . 330
5.2 Das Lösungsverfahren von Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 341
Gauß und Jordan . . . . . . . . . . . . . . . . . . . . . 172 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
VIII Inhaltsverzeichnis

10 Reihen – Summieren bis zum Letzten . 347 14.8 Die Berechnung einer Jordan-Normalform
10.1 Motivation und Definition . . . . . . . . . . . . . . 348 und Jordan-Basis . . . . . . . . . . . . . . . . . . . . . . 532
10.2 Kriterien für Konvergenz . . . . . . . . . . . . . . . 355 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 544
10.3 Absolute Konvergenz . . . . . . . . . . . . . . . . . . 363 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 546
10.4 Kriterien für absolute Konvergenz . . . . . . . 368
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 376 15 Differenzialrechnung –
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 die Linearisierung von Funktionen . . . 551
11 Potenzreihen – Alleskönner unter den 15.1 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . 552
15.2 Differenziationsregeln . . . . . . . . . . . . . . . . . . 560
Funktionen . . . . . . . . . . . . . . . . . . . . . . . 381
15.3 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . 569
11.1 Definition und Grundlagen . . . . . . . . . . . . . 382
15.4 Verhalten differenzierbarer Funktionen . . . 577
11.2 Die Darstellung von Funktionen durch
15.5 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . 583
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . 389
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 593
11.3 Die Exponentialfunktion . . . . . . . . . . . . . . . . 398
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594
11.4 Trigonometrische Funktionen . . . . . . . . . . . 403
11.5 Der Logarithmus . . . . . . . . . . . . . . . . . . . . . . 409
16 Integrale – von lokal zu global . . . . . . 599
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 413
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 16.1 Integration von Treppenfunktionen . . . . . . 600
16.2 Das Lebesgue-Integral . . . . . . . . . . . . . . . . . 604
12 Lineare Abbildungen und Matrizen – 16.3 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . 613
Brücken zwischen Vektorräumen . . . . . 417 16.4 Integrationstechniken . . . . . . . . . . . . . . . . . . 618
12.1 Definition und Beispiele . . . . . . . . . . . . . . . . 418 16.5 Integration über unbeschränkte Intervalle
12.2 Verknüpfungen von linearen Abbildungen 422 oder Funktionen . . . . . . . . . . . . . . . . . . . . . . 622
12.3 Kern, Bild und die Dimensionsformel . . . . 425 16.6 Parameterabhängige Integrale . . . . . . . . . . 633
12.4 Darstellungsmatrizen . . . . . . . . . . . . . . . . . . 432 16.7 Weitere Integrationsbegriffe . . . . . . . . . . . . 637
12.5 Das Produkt von Matrizen . . . . . . . . . . . . . . 442 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 649
12.6 Das Invertieren von Matrizen . . . . . . . . . . . 446 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650
12.7 Elementarmatrizen . . . . . . . . . . . . . . . . . . . . 451
12.8 Basistransformation . . . . . . . . . . . . . . . . . . . 455 17 Euklidische und unitäre Vektorräume –
12.9 Der Dualraum . . . . . . . . . . . . . . . . . . . . . . . . 458 orthogonales Diagonalisieren . . . . . . . . 655
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 462 17.1 Euklidische Vektorräume . . . . . . . . . . . . . . . 656
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464 17.2 Norm, Abstand, Winkel, Orthogonalität . . 662
13 Determinanten – Kenngrößen 17.3 Orthonormalbasen und orthogonale
Komplemente . . . . . . . . . . . . . . . . . . . . . . . . . 668
von Matrizen . . . . . . . . . . . . . . . . . . . . . . 469
17.4 Unitäre Vektorräume . . . . . . . . . . . . . . . . . . 678
13.1 Die Definition der Determinante . . . . . . . . . 470
17.5 Orthogonale und unitäre Endomorphismen 681
13.2 Determinanten von Endomorphismen . . . . 475
17.6 Selbstadjungierte Endomorphismen . . . . . . 691
13.3 Berechnung der Determinante . . . . . . . . . . 476
17.7 Normale Endomorphismen . . . . . . . . . . . . . 697
13.4 Anwendungen der Determinante . . . . . . . . 483
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 705
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 492
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494

14 Normalformen – Diagonalisieren 18 Quadriken – vielseitig nutzbare


und Triangulieren . . . . . . . . . . . . . . . . . . 497 Punktmengen . . . . . . . . . . . . . . . . . . . . . 713
14.1 Diagonalisierbarkeit . . . . . . . . . . . . . . . . . . . 498 18.1 Symmetrische Bilinearformen . . . . . . . . . . . 714
14.2 Eigenwerte und Eigenvektoren . . . . . . . . . . 501 18.2 Hermitesche Sesquilinearformen . . . . . . . . . 724
14.3 Berechnung der Eigenwerte und 18.3 Quadriken und ihre Hauptachsen-
Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . 503 transformation . . . . . . . . . . . . . . . . . . . . . . . . 728
14.4 Algebraische und geometrische 18.4 Die Singulärwertzerlegung . . . . . . . . . . . . . . 741
Vielfachheit . . . . . . . . . . . . . . . . . . . . . . . . . . 510 18.5 Die Pseudoinverse einer linearen
14.5 Die Exponentialfunktion für Matrizen . . . . 519 Abbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743
14.6 Das Triangulieren von Endomorphismen . . 521 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 753
14.7 Die Jordan-Normalform . . . . . . . . . . . . . . . . 526 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 754
Inhaltsverzeichnis IX

19 Metrische Räume – Zusammenspiel 23 Vektoranalysis – im Zentrum steht


von Analysis und lineare Algebra . . . . 759 der Gauß’sche Satz . . . . . . . . . . . . . . . . 951
19.1 Metrische Räume und ihre Topologie . . . . 760 23.1 Kurven im Rn . . . . . . . . . . . . . . . . . . . . . . . . 952
19.2 Konvergenz und Stetigkeit in 23.2 Das Kurvenintegral . . . . . . . . . . . . . . . . . . . . 960
metrischen Räumen . . . . . . . . . . . . . . . . . . . 768 23.3 Flächen und Flächenintegrale . . . . . . . . . . . 968
19.3 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . 783 23.4 Der Gauß’sche Satz . . . . . . . . . . . . . . . . . . . 980
19.4 Zusammenhangsbegriffe . . . . . . . . . . . . . . . 792 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 1002
19.5 Vollständigkeit . . . . . . . . . . . . . . . . . . . . . . . . 797 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1003
19.6 Banach- und Hilberträume . . . . . . . . . . . . . . 803
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 817 24 Optimierung – aber mit
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 819 Nebenbedingungen . . . . . . . . . . . . . . . . 1007
24.1 Lineare Optimierung . . . . . . . . . . . . . . . . . . . 1008
20 Differenzialgleichungen – 24.2 Das Simplex-Verfahren . . . . . . . . . . . . . . . . . 1017
Funktionen sind gesucht . . . . . . . . . . . . 823 24.3 Dualitätstheorie . . . . . . . . . . . . . . . . . . . . . . . 1026
20.1 Begriffsbildungen . . . . . . . . . . . . . . . . . . . . . 824 24.4 Differenzierbare Probleme . . . . . . . . . . . . . . 1035
20.2 Elementare analytische Techniken . . . . . . . 833 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 1042
20.3 Existenz und Eindeutigkeit . . . . . . . . . . . . . 841 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1043
20.4 Grundlegende numerische Verfahren . . . . . 848 25 Elementare Zahlentheorie –
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 854
Teiler und Vielfache . . . . . . . . . . . . . . . . 1047
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855
25.1 Teilbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1048
25.2 Der euklidische Algorithmus . . . . . . . . . . . . 1049
21 Funktionen mehrerer Variablen –
25.3 Der Fundamentalsatz der Arithmetik . . . . . 1053
Differenzieren im Raum . . . . . . . . . . . . 859
25.4 ggT und kgV . . . . . . . . . . . . . . . . . . . . . . . . . 1054
21.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . 860 25.5 Zahlentheoretische Funktionen . . . . . . . . . . 1057
21.2 Differenzierbarkeitsbegriffe: 25.6 Rechnen mit Kongruenzen . . . . . . . . . . . . . . 1063
Totale und partielle Differenzierbarkeit . . . 861 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 1070
21.3 Differenziationsregeln . . . . . . . . . . . . . . . . . . 875 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1071
21.4 Mittelwertsätze und Schrankensätze . . . . . 883
21.5 Höhere partielle Ableitungen und der 26 Elemente der diskreten Mathematik –
Vertauschungssatz von H. A. Schwarz . . . 885 die Kunst des Zählens . . . . . . . . . . . . . . 1075
21.6 Taylor-Formel und lokale Extrema . . . . . . . 889 26.1 Einführung in die Graphentheorie . . . . . . . 1076
21.7 Der lokale Umkehrsatz . . . . . . . . . . . . . . . . . 895 26.2 Einführung in die Kombinatorik . . . . . . . . . 1090
21.8 Der Satz über implizite Funktionen . . . . . . 901 26.3 Erzeugende Funktionen . . . . . . . . . . . . . . . . 1097
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 905 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 1101
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 908 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1103

22 Gebietsintegrale – das Ausmessen Hinweise zu den Aufgaben . . . . . . . . . . . . . . 1107


von Mengen . . . . . . . . . . . . . . . . . . . . . . 913
22.1 Definition und Eigenschaften . . . . . . . . . . . 914 Lösungen zu den Aufgaben . . . . . . . . . . . . . 1125
22.2 Die Berechnung von Gebietsintegralen . . . 922
Bildnachweis . . . . . . . . . . . . . . . . . . . . . . . . . . 1141
22.3 Die Transformationsformel . . . . . . . . . . . . . . 931
22.4 Wichtige Koordinatensysteme . . . . . . . . . . . 937 Symbolglossar deutsch/englisch . . . . . . . . . . 1143
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . 945
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 946 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1161
Verzeichnis der Übersichten
Erkenntnisgewinn durch Abstraktion . . . . . . . . . . . . . . 809 Integrale über reguläre Flächen . . . . . . . . . . . . . . . . . . . 981
Approximation von Funktionen (kapitelübergreifend) 1037 Jacobi-Matrix und Differenzierbarkeit . . . . . . . . . . . . . 869
Eigenschaften der Determinante . . . . . . . . . . . . . . . . . . 482 Bestimmung einer Jordan-Basis . . . . . . . . . . . . . . . . . . 540
Differenzialgleichungen in den Anwendungen . . . . . 831 Rechenregeln zu den komplexen Zahlen . . . . . . . . . . . 139
Typen von Differenzialgleichungen erster Ordnung . 842 Konvergenzkriterien für Reihen . . . . . . . . . . . . . . . . . . 372
Differenzialoperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . 1001 Kurven und Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . 963
Differenziationsregeln und Ableitungsfunktionen . . . 566 Die linearen Abbildungen ϕA : v → A v mit einer
Verhalten differenzierbarer Funktionen . . . . . . . . . . . 586 Matrix A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456
Beziehungen zwischen den verschiedenen Logik – Junktoren und Quantoren . . . . . . . . . . . . . . . . . 34
Differenzierbarkeitsbegriffen . . . . . . . . . . . . . . . . . 872 Mathematische Objekte . . . . . . . . . . . . . . . . . . . . . . . . . 79
Eigenschaften und Begriffe euklidischer bzw. Diagonalisieren einer Matrix . . . . . . . . . . . . . . . . . . . . . . 515
unitärer Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . 682 Die gemeinsamen Eigenschaften ähnlicher Matrizen 543
Euler’sche Formel und trigonometrische Die verschiedenen Klassen von Matrizen . . . . . . . . . . 701
Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 Diagonalisieren von Matrizen . . . . . . . . . . . . . . . . . . . . . 745
Exponentialfunktion und Logarithmus . . . . . . . . . . . . 403 Die natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Folgen und Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . 298 Potenzreihen und Taylorreihen . . . . . . . . . . . . . . . . . . . . 592
Transformationen und Kombinationen von Primale und duale Probleme . . . . . . . . . . . . . . . . . . . . . 1033
Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 Quadriken im A (R2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 737
Stetige Funktionen und Unstetigkeiten . . . . . . . . . . . . . 318 Quadriken in A (R3 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 740
Sätze über Funktionen mit kompaktem Ratschläge für das Studium Mathematik . . . . . . . . . . . 12
Definitionsbereich und Gegenbeispiele . . . . . . . . . . 337 Körperaxiome für die reellen Zahlen . . . . . . . . . . . . . . 104
Eigenschaften von Gebietsintegralen . . . . . . . . . . . . . . 917 Die Axiome der reellen Zahlen . . . . . . . . . . . . . . . . . . . 118
Grenzwerte von Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . 290 Reell versus komplex . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705
Gruppen, Ringe und Körper . . . . . . . . . . . . . . . . . . . . . 86 Wichtige Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
Homo-, Mono-, Epi-, Iso-, Endo-, Automorphismen 419 Relationen und Abbildungen . . . . . . . . . . . . . . . . . . . . 55
Eigenschaften des Integrals . . . . . . . . . . . . . . . . . . . . . . . 611 Tabelle einiger Stammfunktionen . . . . . . . . . . . . . . . . . 617
Einige bestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . 632 Produkte von Vektoren im R3 . . . . . . . . . . . . . . . . . . . . . 248
Mathematik – eine
Wissenschaft für sich 1
Was bedeutet der Begriff
Mathematik ?
Was sind die Inhalte des ersten
Studienjahres?
Seit wann gibt es Mathematik ?

1.1 Über Mathematik, Mathematiker und dieses Lehrbuch . . . . . . 2


1.2 Die didaktischen Elemente dieses Buchs . . . . . . . . . . . . . . . . . . . 8
1.3 Ratschläge zum Einstieg in die Mathematik . . . . . . . . . . . . . . . . 10
1.4 Eine kurze Geschichte der Mathematik . . . . . . . . . . . . . . . . . . . . 13
2 1 Mathematik – eine Wissenschaft für sich

In der Mathematik, eine der ältesten Wissenschaften überhaupt, Wir mischen uns in den Streit nicht ein. Wir behaupten nicht,
geht es darum, Aussagen auf ihren Wahrheitsgehalt hin zu dass Mathematik eine Natur- oder eine Geisteswissenschaft
überprüfen und allgemeingültige Aussagen zu beweisen und ist, sondern sehen Mathematik als eine Formalwissenschaft
diese als mathematische Sätze zu formulieren. Mathematik ist an. Zu den Formalwissenschaften gehören genau jene Wis-
eine exakte Wissenschaft, ist ein Satz bewiesen, so gilt dieser senschaften, die sich mit formalen Systemen beschäftigen.
für immer und ewig. Neben der Mathematik sind die Logik oder die theoretische
Informatik Beispiele solcher Formalwissenschaften.
Mit dem vorliegenden Buch wenden wir uns an Mathematik-
studierende der ersten Semester. Wir stellen die Themen des Auf jeden Fall aber ist die Mathematik eine Wissenschaft
ersten Studienjahrs, die in den Vorlesungen üblicherweise bei für sich. Während in den Geisteswissenschaften oder Na-
verschiedenen Dozenten gehört werden, in einer einheitlichen turwissenschaften frühere Erkenntnisse durch einen neuen
Schreibweise dar und zeigen die Zusammenhänge der verschie- Zeitgeist oder durch neue Experimente relativiert werden,
denen Gebiete auf. Dabei liegt das Augenmerk nicht nur auf sind mathematische Erkenntnisse ein für allemal korrekt. Die
einer vollständigen Beweisführung, wir versuchen auch oft Mo- Mathematik ist eine exakte Wissenschaft. Mathematische Er-
tivationen und Alternativen zu den gegebenen Beweisen und kenntnisse sind kulturunabhängig und prinzipiell von jedem
Vorgehensweisen anzugeben. Wir schildern auch stets Zusam- nachvollziehbar.
menhänge zu bereits behandelten und noch zu behandelnden
Ein wesentliches Merkmal der Mathematik ist es, dass ihre
Themen.
Inhalte streng aufeinander aufbauen. Jeder einzelne Schritt
Die Teilgebiete der Mathematik können in reine und ange- ist im Allgemeinen leicht zu verstehen, im Ganzen betrachtet
wandte Mathematik unterschieden werden, wenngleich bei aber ist die Mathematik ein außerordentlich komplexes und
manchen Teilgebieten eine solche Zuordnung sicherlich willkür- großes Gebiet. Es wurde im Laufe der vergangenen ca. 6000
lich erscheinen mag. Aber auf jeden Fall sind die Analysis und die Jahren von vielen Menschen zusammengetragen. Aber dazu
lineare Algebra grundlegend für jedes Teilgebiet. So ist es schon mehr in einem kurzen geschichtlichen Ausflug ab Seite 13.
lange an den verschiedenen Universitäten üblich, dass im ersten
Studienjahr vor allem diese beiden Gebiete den Großteil des
Studiums ausmachen. Die Inhalte dieser beiden, üblicherweise Was ist neu an diesem Lehrbuch?
zwei Semester andauernden Vorlesungen nehmen den meisten
Raum des vorliegenden Buches ein. Mathematiker sind in ihrem Sprachgebrauch oftmals etwas
Im ersten Kapitel sprechen wir über Mathematik und ihre Rolle . . . na ja sonderbar. Wir Autoren, allesamt Mathematiker,
unter den Wissenschaften. Wir geben auch einen Einblick in ihre haben im Interesse der Studierenden – also insbesondere in
rund 6000-jährige Geschichte, und selbstverständlich wollen Ihrem Interesse – versucht, uns von dieser sonst üblichen
wir auch die didaktischen Elemente vorstellen, die dieses Werk etwas kargen und nüchtern zweckorientierten Sprechweise
gegenüber anderen Lehrbüchern auszeichnen. zu distanzieren. Wir haben – so weit wie möglich – Formeln
und abstrakte Dinge in Worte gefasst. Das ist neu; aber nicht
nur das.

1.1 Über Mathematik, Schwierige Aufgabenstellungen gibt es zuhauf in der Mathe-


matik. Wir haben uns stets bemüht, komplexe, undurchsich-
Mathematiker und tige und schwierige mathematische Zusammenhänge aufzu-
dieses Lehrbuch lösen und Schritt für Schritt zu erklären. Wir schildern, stellen
dar, gliedern und liefern Beispiele für nicht leicht zu verste-
hende Dinge. Begreift man nämlich die Zusammenhänge in
„Mathematik“ ist jedem ein Begriff, vielen flößt er Respekt der Mathematik, so mag es vielleicht noch nicht unbedingt
ein, manche bekommen weiche Knie, aber nur wenige kön- zu einer Karriere in der mathematischen Forschung reichen,
nen den Begriff richtig einordnen. Was bedeutet „Mathema- aber zu einem erfolgreichen Abschluss des ersten Studien-
tik“, und zu welcher Art Wissenschaft gehört die Mathema- jahrs allemal. In dem vorliegenden Lehrbuch nehmen Erklä-
tik? rungen viel Platz ein. Das ist neu, aber es gibt noch mehr.
Mathematik ist eine vielschichtige Wissenschaft, man unter-
Mathematik ist eine Formalwissenschaft scheidet Algebra, Analysis, Geometrie, Numerische Mathe-
matik, Optimierung, Variationsrechnung, Wahrscheinlich-
Man unterscheidet verschiedene Typen von Wissenschaften. keitstheorie und viele weitere Fachrichtungen. „Mathematik
Es gibt Naturwissenschaften, Geisteswissenschaften, Sozial- zu treiben“ bedeutet jedoch immer ein- und dasselbe, nämlich
wissenschaften, Ingenieurwissenschaften usw. Man könnte lernen (griech. μαθ ηματ ικ ή τ έχνη, Mathematik = Kunst
streiten, ob Mathematik eine Naturwissenschaft oder eine des Lernens). Insofern ist vielleicht der Ansatz, Mathema-
Geisteswissenschaft ist. Der Streit ist so alt wie derjenige, ob tik nicht nach Fachrichtungen, sondern nach dem jeweiligen
Mathematik gefunden oder erfunden wird, oder die Frage: Wissenstand zu erlernen, sinnvoll. Wir versuchen das im vor-
„Gäbe es Mathematik auch ohne den Menschen?“ liegenden Werk, indem wir nicht die zwei Hauptgebiete des
1.1 Über Mathematik, Mathematiker und dieses Lehrbuch 3

ersten Studienjahrs, nämlich Analysis und lineare Algebra, Situation ist in der Tat noch verworrener: Kurt Gödel zeigte,
nacheinander bzw. getrennt voneinander, sondern ineinan- dass die vermutete Widerspruchsfreiheit innerhalb des be-
der verwoben und teils gegenseitig aufeinander aufbauend trachteten Axiomensystems weder bewiesen noch widerlegt
behandeln. Die Zusammenhänge der Gebiete und die Ähn- werden kann.
lichkeit der mathematischen Schlüsse werden so klarer. Und
Man ist in der Mathematik bemüht, Theorien und Strukturen
auf einem solchen Fundament, das Analysis und lineare Al-
auf ein Minimum an notwendigen und jedem einleuchtenden
gebra miteinander verbindet, kann die weitere Mathematik
Axiomen aufzubauen. Das Ersetzen eines einzelnen Axioms
der folgenden Studienjahre sicher aufgebaut werden. Das ist
durch ein anderes wird im Allgemeinen zu einer deutlich
neu, aber es gibt noch mehr.
anderen Theorie führen. Ein berühmtes Beispiel ist das fünfte
Bei den meisten Studierenden der Mathematik geht nach den Postulat, beschrieben auf Seite 4.
ersten Wochen des Studiums der Überblick über den in den
Die Festlegung auf ein bestimmtes Axiomensystem ist nicht
Vorlesungen behandelten Stoff verloren, da das Tempo übli-
absolut zu sehen. Es gibt stets gleichwertige andere Formu-
cherweise enorm ist und für Motivationen und Zielsetzungen
lierungen, und man kann ohne Weiteres auf verschiedenen
in der Vorlesung oft nur wenig Zeit bleibt. Bei den Studieren-
Ebenen in eine mathematische Theorie einsteigen. So wer-
den entwickelt sich schnell ein (evtl. auch durchaus berech-
den wir etwa in diesem Buch in Kapitel 4 die reellen Zahlen
tigtes) Gefühl dafür, dass die Wissenschaft „Mathematik“
axiomatisch einführen, das Induktionsaxiom aus obigem Bei-
unendlich ist. Tatsächlich aber ist der Stoffumfang des ersten
spiel ergibt sich dann als Folgerung aus den Axiomen über
Studienjahrs an den meisten Universitäten sehr ähnlich und
reelle Zahlen. Ebenso kann man aber auch bei einer axio-
im Allgemeinen in Modulkatalogen festgehalten. Wir haben
matischen Definition der natürlichen Zahlen beginnen und
versucht, einen Konsens dieser Themen in einem einzigen
die weiteren Zahlensysteme darauf aufbauen. Dann ist das
Buch zu fixieren. Die Inhalte des vorliegenden Buches soll-
Induktionsaxiom ein notwendiges Axiom.
ten alle Themen, mit denen Sie im ersten Studienjahr kon-
frontiert werden, enthalten. Insofern haben wir für Sie einen Ausgehend von einem Axiomensystem versuchen Mathe-
greifbaren Horizont geschaffen (nämlich die letzte Seite die- matiker weitere Wahrheiten abzuleiten. Eine solche abge-
ses Buches). leitete Wahrheit nennt man in der Mathematik oft Satz oder
Theorem.

Die Mathematik basiert auf Axiomen Die wichtigsten Bausteine und Schritte zum Formulieren ma-
thematischer Sachverhalte lassen sich in drei Typen untertei-
Die Mathematik im Sinne einer Wissenschaft zu beschreiben, len, in Definition, Satz und Beweis. Bevor wir uns in ein
ist gar nicht so einfach, und es gibt auch keine allgemein an- Meer von Begriffen, Aussagen und Beweisen stürzen, bietet
erkannte Definition. Will man es unbedingt in Worte fassen, es sich an, zunächst einige grundlegende logische Aspekte,
so könnte man die Mathematik vielleicht auffassen als eine Sprechweisen und Notationen herauszustellen.
Wissenschaft, die von Grundwahrheiten ausgehend versucht,
weitere Wahrheiten zu ermitteln.
Definitionen liefern den Rahmen
Diese Grundwahrheiten sind die sogenannten Axiome, nach
älterer Sprechweise auch Postulate genannt. Durch Definitionen werden die Begriffe festgelegt, mit de-
nen man später arbeiten kann. Auch Notationen, auf die man
Darunter verstehen wir Aussagen, die nicht beweisbar sind,
sich einigt bzw. die üblich sind, gehören im weiteren Sinne
die wir aber als gültig voraussetzen. Die Gesamtheit der
in diese Kategorie. Definitionen können weder wahr noch
Axiome ist das Axiomensystem.
falsch sein, wohl aber mehr oder weniger sinnvoll. Auf je-
den Fall muss eine Definition wohldefiniert sein, das heißt,
Beispiel Man kann die natürlichen Zahlen durch ein Sy-
die Beschreibung beinhaltet eine eindeutige Festlegung und
stem von Axiomen einführen. Eines davon ist das sogenannte
führt nicht auf Widersprüche. Außerdem sollte bei allen ver-
Induktionsaxiom, welches in einer Formulierung besagt:
wendeten Begriffen klar sein, worauf diese sich beziehen.
Jede nichtleere Menge natürlicher Zahlen besitzt ein kleinstes Bei dem folgenden Beispiel gehen wir davon aus, dass wir
Element. bereits wissen, was eine Funktion ist.
Kaum einer wird das bezweifeln, aber tatsächlich ist diese
Beispiel Wir definieren die Wurzelfunktion f durch: „Die
Aussage nicht beweisbar, wir nehmen sie als allgemeingül-
Wurzelfunktion ist die Funktion, die jeder nicht negativen re-
tiges Gesetz an, also als Axiom. 
ellen Zahl x die nicht negative reelle Lösung y der Gleichung
x = y 2 zuordnet.“
Eigentlich haben die Mathematiker im Laufe der Jahre
verschiedene Axiomensysteme entwickelt. Natürlich ist es Würde man auf die Einschränkung positiv verzichten, so ist
wichtig, dass sich diese Vereinbarungen nicht widersprechen. die Beschreibung nicht mehr wohldefiniert. Erlauben wir
Man versuchte, die Widerspruchsfreiheit der gängigen Axio- etwa negative Werte für y, so gibt es zwei Werte, ±y, die
mensysteme zu beweisen. Das ist aber nicht gelungen. Die jedem x zugeordnet werden können. Die Definition würde
4 1 Mathematik – eine Wissenschaft für sich

Hintergrund und Ausblick: Das fünfte Postulat


Ein historisches Beispiel, das die Bedeutung von Axiomen deutlich macht, ist das fünfte Postulat in Euklids Schrift Elemente.
Modifikationen dieses Axioms führen auf sogenannte nichteuklidische Geometrien. Ersetzen des Postulats ist also durchaus
sinnvoll und führt widerspruchsfrei auf andere Geometrien, die sich zunächst der gewohnten Intuition entziehen.

Etwa um 300 v. Chr. sammelte der griechische Mathe- Im ersten Fall führt die Annahme, dass es keine paral-
matiker Euklid das geometrische Wissen seiner Zeit und lele Gerade gibt, auf die sogenannte elliptische Geometrie.
bewies in seiner Schrift Elemente alle Ergebnisse auf der Diese kann man sich auf einer Kugeloberfläche vorstellen,
Grundlage von fünf Postulaten: wobei „Geraden“ durch Großkreise, also Kreise mit ma-
ximalem Radius, und „Punkte“ durch gegenüberliegende
1. Zwei Punkte lassen sich stets durch eine Strecke ver-
Antipoden gegeben sind.
binden.
2. Eine gerade Linie kann endlos als gerade Linie verlän-
gert werden. Ersetzt man hingegen das fünfte Postulat durch die An-
3. Um jeden Punkt lässt sich ein Kreis mit beliebigem nahme, dass es mehr als eine parallele Gerade gibt, so
Radius ziehen. landet man in der hyperbolischen Geometrie, die man auf
4. Alle rechten Winkel sind einander gleich. einer Sattelfläche illustrieren kann (Abbildung). Die Un-
5. Wenn beim Schnitt einer geraden Linie mit zwei weite- terschiede in diesen Geometrien sind elementar. So ist
ren geraden Linien die Summe der auf derselben Seite etwa im Gegensatz zur euklidischen Geometrie die Win-
liegenden Innenwinkel kleiner als zwei rechte Winkel kelsumme im Dreieck in der elliptischen Geometrie größer
ist, dann schneiden sich die beiden Geraden auf der als 180◦ und in der hyperbolischen kleiner als 180◦ .
Seite, auf der die beiden Winkel liegen.
Nichteuklidische Geometrien sind zumindest formal zur
gewohnten euklidischen Geometrie völlig gleichwertig,
β auch wenn Punkte und Geraden nicht mehr dem entspre-
α chen, was wir anschaulich darunter verstehen. Die mathe-
matischen Minimalanforderungen, um von einer Geome-
g2 trie zu sprechen, sind in allen drei Fällen gewährleistet.
g1

Beim Beweis der ersten 28 Sätze in den Elementen hat


Euklid das fünfte Postulat nicht benötigt. Er hätte daher
sicher gerne diese fünfte Aussage bewiesen und sie nicht
als Axiom vorausgesetzt. Aber es fand sich kein Beweis
und auch nachfolgende Generationen waren erfolglos. Erst
im 19. Jahrhundert wurde klarer, warum kein Beweis zu
finden ist. Das fünfte Postulat ist gleichwertig zum Paral-
lelenaxiom:

Zu einer Geraden und einem nicht auf ihr liegenden Punkt


gibt es eine und nur eine Gerade, die durch diesen Punkt
verläuft und die erste Gerade nicht schneidet.

Nimmt man nun an, dass dieses Postulat nicht gilt, so


gibt es zwei Alternativen: Entweder es gibt keine paral-
lele Gerade oder es gibt mehrere. (siehe auch Seite 18 und
Seite 266)
1.1 Über Mathematik, Mathematiker und dieses Lehrbuch 5

nicht auf eine eindeutige Zuordnung, also nicht auf eine Erst der Beweis macht einen Satz zum Satz
Funktion, führen. Genauso ist die Definition nicht wohlde-
finiert, wenn für x negative Werte zugelassen sind, da die Von jeder Aussage, die als Satz, Lemma oder Korollar infrage
Forderung nach reellen Zahlen für y dazu im Widerspruch kommen soll, muss klar sein, dass sie wahr ist. Sie muss sich
steht.  beweisen lassen. Tatsächlich ist das Führen der Beweise zu-
gleich die wichtigste und die anspruchsvollste Tätigkeit in der
Neben diesen Kriterien sollte eine Definition allerdings noch Mathematik – der Kern unserer Wissenschaft. Einige grund-
ein weiteres erfüllen – sie sollte zweckmäßig sein. Also letzt- legende Techniken, Sprech- und Schreibweisen wollen wir
endlich sollte eine Definition die sich anschließenden Über- hier vorstellen. In späteren Kapiteln werden weitere folgen,
legungen und Kalküle sinnvoll stützen und strukturieren. All wie zum Beispiel das Prinzip der vollständigen Induktion.
diese Bedingungen sind nicht trivial. Bei manchen wichtigen Betonen wir zunächst allerdings noch den formalen Rahmen,
Begriffen, etwa den komplexen Zahlen, hat es lange gedau- an den man sich beim Beweisen im Idealfall halten sollte. Da-
ert, bis eine saubere und zweckmäßige Definition gefunden bei werden zunächst einmal die Voraussetzungen festgehal-
war. ten, anschließend wird die Behauptung formuliert, und erst
Wenn wir im vorliegenden Buch einen Begriff definieren, dann beginnt der eigentliche Beweis. Ist der Beweis gelun-
so schreiben wir ihn fett. Manchmal sind zu definierende gen, so lassen sich die Voraussetzungen und die Behauptung
Begriffe sehr suggestiv, wir verwenden ihn dann gelegentlich zur Formulierung eines entsprechenden Satzes zusammen-
schon vor seiner Definition oder auch in den einleitenden stellen. Außerdem ist es meistens angebracht, auch den Be-
Absätzen zu den Kapiteln. In diesem Fall schreiben wir ihn weis nochmal zu überdenken und schlüssig zu formulieren.
dann kursiv. Ist ein Begriff aber erst einmal definiert, so ist Da das Ende eines Beweises für Außenstehende nicht immer
dieser im weiteren Text nicht mehr besonders hervorgehoben. auf den ersten Blick zu erkennen ist, kennzeichnet man es
häufig mit „qed“ (quod erat demonstrandum) oder einfach
mit einem Kästchen „“. Insgesamt haben wir stets folgende
Sätze formulieren zentrale Ergebnisse Struktur, an die Sie sich auch bei Ihren eigenen Beweisfüh-
rungen halten sollten:
Aussagen, die nicht nur wahr sind, sondern auch weitrei- Voraussetzungen: . . .
chende Konsequenzen haben, werden in der Mathematik gern Behauptung: . . .
als Sätze bezeichnet. Beweis: . . . 

Allgemein ist die oben angegebene Reihenfolge kein Dogma.


Beispiel Der Satz des Pythagoras ist ein Musterbeispiel:
Auch in diesem Buch werden manchmal Aussagen hergelei-
„In jedem ebenen rechtwinkligen Dreieck ist die Summe der
tet, also letztendlich die Beweisführung bzw. die Beweis-
Quadrate der Längen der Katheten gleich dem Quadrat der
idee vorweg genommen, bevor die eigentliche Behauptung
Länge der Hypotenuse.“
komplett formuliert wird. Dies kann mathematische Zusam-
Diese Aussage über alle ebenen rechtwinkligen Dreiecke menhänge verständlicher machen. Aber die drei Elemente,
hat zahllose Anwendungen in Mathematik, Technik und den Voraussetzung, Behauptung und Beweis, bei Resultaten zu
Naturwissenschaften. Hingegen besitzt eine Aussage wie identifizieren, bleibt trotzdem stets wichtig, um Klarheit über
„1 < 2“, obwohl sie zweifellos richtig ist, nicht genug Trag- Aussagen zu bekommen.
weite, um üblicherweise als Satz bezeichnet zu werden. 

O. B. d. A. bedeutet
Sätze werden die Werkzeuge sein, mit denen wir ständig um-
gehen. Die Kenntnis zu vermitteln, welche grundlegenden ohne Beschränkung der Allgemeinheit
mathematischen Sätze in der Analysis und der linearen Al-
gebra zur Verfügung stehen, wie sie bewiesen werden können Mathematiker haben manchmal etwas gewöhnungsbedürf-
und wie man sie anwendet, ist ein wesentliches Ziel dieses tige Sprechweisen. Zu diesen gehört auf jeden Fall das, was
Buchs. sich hinter o.B.d.A verbirgt. O.B.d.A steht für „Ohne Be-
schränkung der Allgemeinheit“, manchmal sagt man statt-
Die zentralen Aussagen einer Theorie werden als Satz oder dessen auch o.E.d.A., also „ohne Einschränkung der Allge-
als Theorem bezeichnet. Dient ein Satz aber in erster Linie meinheit“ oder ganz kurz o.E., d. h. „ohne Einschränkung“.
dazu eine oder mehrere folgende und weitreichendere Aussa- Solche Formulierungen benutzt man beim Beweis von Aus-
gen zu beweisen, wird er oft Lemma (Plural Lemmata, grie- sagen. Will man z. B. die Aussage
chisch für Weg) oder schlicht Hilfssatz genannt. Hingegen
bezeichnet man mit Korollar oder Folgerung Konsequen- Jede natürliche Zahl n > 1 wird von einer Primzahl geteilt
zen, die sich aus zentralen Sätzen ergeben. beweisen, so kann man sich auf ungerade Zahlen beschrän-
ken, da im Fall, dass n gerade ist, natürlich die Zahl 2 ein
Teiler von n ist. Mathematiker würden hier also den Beweis
6 1 Mathematik – eine Wissenschaft für sich

mit der folgenden Sprechweise beginnen: O. E. sei n > 1 modernen Mathematik ist. Diese Sichtweise von Mathematik
eine ungerade natürliche Zahl . . . . Kann man dann die Be- ist übrigens noch nicht alt und hat sich erst zu Beginn des
hauptung für jede ungeraden Zahlen zeigen, so hat man die zwanzigsten Jahrhunderts etabliert. Die Logik ist schon seit
Behauptung für jede natürliche Zahl n > 1 gezeigt. der Antike eine philosophische Disziplin, die wir hier nicht
ausführlich behandeln wollen. Wir werden uns nur auf die
Mit diesem o. E., etwas ausführlicher o.B.d.A, schließt man
Aspekte der Logik konzentrieren, die in Hinblick auf das
mögliche Fälle aus, für die die Aussage klar ist. Man kann
Beweisen grundlegend sind.
aber auch Fälle ausschließen, die analog gezeigt werden kön-
nen: Das Grundprinzip der Logik, dass alle verwendeten Aus-
Jede beschränkte monotone Folge (an ) reeller Zahlen kon- drücke eine klare, scharf definierte Bedeutung haben müs-
vergiert. sen, sollte selbstverständlich sein für alle wissenschaftlichen
Betrachtungen. Das Prinzip bekommt aber gerade in der Ma-
Den Beweis dieser Aussage könnte man mit O. E. sei (an ) thematik ein ganz zentrales Gewicht. Daher ist die aus gutem
monoton steigend . . . beginnen. Den zweiten Fall nämlich, Grunde nicht mit Symbolen geizende Sprache der Mathe-
also der Fall, dass (an ) monoton fallend ist, kann man analog matik am Anfang sicher gewöhnungsbedürftig. Sie unter-
behandeln. scheidet sich von der Alltagssprache durch eine sehr genaue
Meistens aber sind es vereinfachende Annahmen, die man Beachtung der Semantik.
mit dem Voranstellen von o. E. trifft. Durch die vereinfachte
Annahme wird der Beweis leichter oder übersichtlicher, der
allgemeine Fall wird aber dennoch mitbehandelt. Abstraktion ist eine Schlüsselfähigkeit
Beispiel Die folgende Aussage können wir unter verein-
In der Mathematik stößt man immer wieder auf das Phäno-
fachten Annahmen beweisen:
men, dass unterschiedlichste Anwendungsprobleme durch
Jedes Polynom a x 3+b x 2+c x+d mit a, b, c, d ∈ R, a  = 0, dieselben oder sehr ähnliche mathematische Modelle be-
hat eine Nullstelle in R. schrieben werden. Zum Beispiel beschreibt ein und dieselbe
Differenzialgleichung die Schwingung eines Pendels und
Wir dürfen o. E. voraussetzen, dass a = 1 gilt und begründen
die Vorgänge in einem Stromkreis aus Spule und Konden-
die Aussage für das Polynom
sator.
x3 + b x2 + c x + d . Die Fähigkeit, das Wesentliche eines Problems zu erkennen
und bei unterschiedlichen Problemen, Gemeinsamkeiten aus-
Ist diese Aussage für diese speziellen Polynome vom Grad 3
zumachen, die für die Lösung zentral sind, nennt man die
aber erst einmal begründet, so hat man die Aussage auch für
Fähigkeit zur Abstraktion. Für Mathematiker ist Abstrak-
alle Polynome vom Grad 3 begründet, da man wegen a  = 0
tion eine Selbstverständlichkeit, ein Studienanfänger hinge-
a x3 + b x2 + c x + d = a p gen hat, wie wir sehr wohl wissen, anfänglich seine Schwie-
rigkeiten damit. Aber Abstraktion ist nun mal unabdingbarer
mit einem Polynom p vom speziellen Typ, für den die Aus- Bestandteil mathematischen Denkens. Daher haben wir viel
sage bereits bewiesen ist, schreiben kann.  Wert darauf gelegt, Ihnen den Zugang zur Abstraktion mit
vielen Beispielen zu erleichtern.
Bei jeder Verwendung von o.B.d.A bzw. o.E. mache man
sich stets klar: Man begründet nur einen Spezialfall der zu Beispiel In der Abbildung 1.1 sehen Sie 16 Kinder. Sie
begründenden Aussage, aber jeder andere Fall wird damit können dieses Bild ausschneiden. Vertauscht man nun die
auch begründet, da jeder andere Fall offenbar gültig oder oberen beiden Teile des Puzzles, so sind wieder Kinder zu
ähnlich zu behandeln ist oder auf den speziellen Fall zurück- sehen. Jetzt sind es aber nur noch 15! Wie kommt das zu
führbar ist; es ist also keine Einschränkung der Allgemeinheit Stande?
gegeben. Als Schreiber oder Lehrender überträgt man beim
Benutzen der Floskel o. E. somit die Aufgabe an den Leser Das Problem ist schwer zu durchschauen, weil die Kinder mit
oder Hörer, sich sorgsam zu vergewissern, dass tatsächlich ihrem komplizierten Erscheinungsbild von den wesentlichen
der allgemeine Fall begründet wird. Aspekten ablenken. Man kann verstehen, was passiert, indem
man das Puzzle selber nachbildet. Zeichnen Sie auf ein Stück
Papier ein identisches Schema von drei Rechtecken. Nun aber
Logische Aussagen strukturieren Mathematik abstrahieren Sie von den Kindern: Statt der komplizierten Fi-
guren zeichnen Sie einfach senkrechte Striche. Nun, in dieser
In den Beschreibungen des Terminus Satz haben wir schon abstrakten Version, kann man viel besser verstehen, wie sich
an einigen Stellen von Aussagen gesprochen. Letztlich sind die unterschiedlichen Teile der Kinder/Striche verteilen und
nahezu alle mathematischen Sachverhalte wahre Aussagen wieso die unterschiedliche Anzahl zustande kommt. Versu-
im Sinne der Aussagenlogik, die somit ein Grundpfeiler der chen Sie, es sich selbst zu erklären.
1.1 Über Mathematik, Mathematiker und dieses Lehrbuch 7

Abbildung 1.1 Kopieren Sie die Seite, schneiden Sie das Puzzle aus und vertauschen Sie die beiden oberen Puzzleteile. Zählen Sie die Kinder. Eines scheint
verschwunden zu sein . . . (mit freundlicher Genehmigung, © Mathematikum Gießen).

Sie haben nun vom Werkzeug der Abstraktion Gebrauch ge- schrieben wird, um dessen Verhalten testen und den Entwurf
macht, um ein schwieriges Problem auf seine wesentliche damit weiter optimieren zu können.
Struktur zu reduzieren und so zu vereinfachen. 
Viele Rechenroutinen können heute bequem mit Computer-
Erkennt ein Mathematiker bei unterschiedlichen Problemen algebrasystemen (CAS) erledigt werden. Man kann Rechen-
gleiche Strukturen, so versucht er, diese Strukturen zu isolie- aufgaben aus unterschiedlichen Bereichen der Mathematik
ren und für sich zu beschreiben. Er löst sich dann von dem lösen. Dabei können solche Systeme nicht nur mit Zahlen
eigentlichen Problem und untersucht stattdessen die isolierte umgehen wie etwa auch ein Taschenrechner, ein Computeral-
abstrakte Struktur. Durch diesen Prozess wird es möglich, mit gebrasystem rechnet auch mit Variablen, Funktionen oder
ein und derselben mathematischen Theorie unterschiedliche Matrizen. Solche Systeme können im Allgemeinen
Probleme gleichzeitig zu lösen. lineare Gleichungssysteme lösen,
Heutzutage ist beispielsweise der Begriff des (abstrakten) Zahlen und Polynome faktorisieren,
Vektorraums aus keiner mathematischen Grundvorlesung Funktionen differenzieren und integrieren,
wegzudenken. Trotzdem hat es bis ins 20. Jahrhundert gedau- Stammfunktionen zu Funktionen angeben,
ert, bis die wenigen wichtigen Prinzipien erkannt und isoliert zwei- oder dreidimensionale Graphen zeichnen,
waren, die ihm zugrunde liegen. Das Prinzip der Abstraktion Differenzialgleichungen lösen,
und die damit verbundene Kraft der mathematischen Argu- analytisch nicht lösbare Integrale oder Differenzialglei-
mentation kennenzulernen, erachten wir als ein wesentliches chungen näherungsweise lösen uvm.
Lernziel. Auf der Internetseite www.matheweb.de finden sich Mate-
rialien, die Ihnen beispielhaft zeigen, welche Möglichkeiten
Computeralgebrasysteme bieten. Sie finden zu verschiede-
Computer beeinflussen die Mathematik nen Themen Arbeitsblätter, die erläutern, wie mathematische
Konzepte im Computeralgebrasystem Maple umgesetzt wer-
den.
Die Verbreitung des Computers hat die Bedeutung der Mathe-
matik ungemein vergrößert. Mathematik wirkt heute prak- In der numerischen Mathematik, kurz auch Numerik genannt,
tisch in allen Lebensbereichen, angefangen von der Tele- entwickelt und analysiert man Algorithmen, deren Anwen-
kommunikation, Verkehrsplanung, Meinungsbefragung, bis dungen (näherungsweise) Lösungen von Problemen mithilfe
zur Navigation von Schiffen oder Flugzeugen, dem Auto- von Computern liefern. Oftmals, vor allem in der Praxis, ist es
mobilbau, den neuen bildgebenden Verfahren der Medizin nämlich so, dass man z. B. Gleichungen erhält, die nicht exakt
oder der Weltraumfahrt. Es gibt kaum ein Produkt, das nicht lösbar sind oder deren Lösungen nicht in analytischer Form
vor seinem Entstehen als virtuelles Objekt mathematisch be- angegeben werden können. Hier schafft die numerische Ma-
8 1 Mathematik – eine Wissenschaft für sich

thematik Abhilfe. Im Gegensatz zu Computeralgebrasyste- 1.2 Die didaktischen Elemente


men arbeitet ein numerisches Verfahren stets mit konkreten
Zahlenwerten, nicht mit Variablen oder anderen abstrakten dieses Buchs
Objekten. Computeralgebrasysteme benutzen die Algorith-
men, die in der numerischen Mathematik entwickelt wurden. Dieses Lehrbuch weist eine Reihe didaktischer Elemente auf,
die Sie beim Erlernen des Stoffes unterstützen. Diese Ele-
Mit der numerischen Mathematik kommt man im Mathema- mente haben sich bereits in dem Buch „Mathematik“, das
tikstudium meist erst ab dem dritten Semester in Berührung. beim gleichen Verlag erschienen ist, bewährt und wurden für
Für das Verständnis der numerischen Mathematik ist ein fun- das vorliegenden Werk angepasst. Auch wenn diese didak-
diertes Wissen aus der Analysis und linearen Algebra unab- tischen Elemente eigentlich selbsterklärend sind, wollen wir
dingbar. kurz schildern, wie sie zu verstehen sind und welche Hinter-
gedanken wir dabei verfolgen.

Was macht man im ersten Studienjahr? Farbige Überschriften geben den


Kerngedanken eines Abschnitts wieder
Es hat sich als sehr sinnvoll erwiesen, dass man von den
vielen Gebieten der Mathematik im ersten Studienjahr vor Der gesamte Text ist durch farbige Überschriften geglie-
allem Analysis und lineare Algebra unterrichtet. Diese bei- dert. Eine solche Überschrift fasst den Kerngedanken des
den Gebiete sind fundamental: Sie schlagen eine Brücke von folgenden Abschnitts zusammen. In der Regel kann man
der Schulmathematik zur Hochschulmathematik, da Bekann- eine farbige Überschrift mit dem dazugehörigen Abschnitt
tes aus der Schulzeit behandelt wird und zugleich Wissen als eine Lerneinheit betrachten. Machen Sie nach dem Le-
geschaffen wird, das grundlegend für weitere Gebiete der sen eines solchen Abschnitts eine Pause und rekapitulieren
Mathematik ist. Sie die Inhalte dieses Abschnitts – denken Sie auch darüber
nach, inwieweit die zugehörige Überschrift den Kerngedan-
Üblicherweise haben es Mathematikstudierende, meist von
ken fasst. Bedenken Sie, dass diese Überschriften oftmals nur
einem Nebenfach abgesehen, erst mal mit Ana und LA zu tun
kurz und prägnant gefasste mathematische Aussagen sind,
(um gleich mal die Sprache der Studierenden zu benutzen).
die man sich gut merken kann, jedoch keinen Anspruch auf
In den Vorlesungen hört man beide Gebiete getrennt und üb-
Vollständigkeit haben – es kann hier auch manche Vorausset-
licherweise auch bei verschiedenen Dozenten. In unserem
zung weggelassen sein.
Buch liegen beide Gebiete ineinander verzahnt vor.
Im Gegensatz dazu gibt es die gelben Merkkästen. Sie be-
In der Analysis geht es um Funktionen und ihre Eigenschaf- inhalten meist Definitionen oder wichtige Sätze bzw. For-
ten. Für Konzepte wie Stetigkeit, Differenzierbarkeit oder meln, die Sie sich wirklich merken sollten. Bei der Suche
Integrierbarkeit ist der Begriff des Grenzwerts von zentraler nach zentralen Aussagen und Formeln dienen sie zudem als
Bedeutung. Den Themen aus diesem Bereich sind die Kapitel Blickfang. In diesen Merkkästen sind in der Regel auch alle
8, 9, 10, 11, 15, 16, 20, 21, 22, 23 dieses Buchs gewidmet. Voraussetzungen angegeben.
Die lineare Algebra ist die Theorie der Vektorräume. In die-
sen Bereich gehören die linearen Gleichungssysteme, die Definition einer Folge
Matrizen und viele Fragen der Geometrie. Wir stellen die- Eine Folge ist eine Abbildung der natürlichen Zahlen in
sen Bereich in den Kapiteln 5, 6, 7, 12, 13, 14, 17, 18 vor. eine Menge M, die jeder natürlichen Zahl n ∈ N ein
Sowohl lineare Algebra als auch die Analysis bauen auf Element xn ∈ M zuordnet.
grundlegenderen Überlegungen auf, die üblicherweise als
Abbildung 1.2 Gelbe Merkkästen heben das Wichtigste hervor.
Grundstrukturen bezeichnet werden. Dazu gehören etwa
die Mengen, Abbildungen, algebraische Strukturen und das
Von den vielen Fallstricken der Mathematik können wir Do-
Zahlensystem. Außerdem gibt es übergreifende Themen, die
zenten ein Lied singen. Wir versuchen Sie davor zu bewah-
sowohl auf der Analysis als auch auf der linearen Algebra
ren und weisen Sie mit einem roten Achtung auf gefährliche
aufbauen. Diesen Aspekten sind die Kapitel 2, 3, 4, 19, 24,
Stellen hin.
25, 26 gewidmet.

Die Zugehörigkeit der Kapitel zu den verschiedenen Gebie- Achtung: Man achte wieder auf die grundsätzlich ver-
ten erkennen Sie auch an den Kapiteleingangsseiten, den schiedenen Bedeutungen der Additionen, die wir mit ein und
Überschriften oder den Seitenzahlen: Die Kapitelnummern, demselben +-Zeichen versehen. Man unterscheide genau:
Überschriften und Seitenzahlen sind bei den Kapiteln zur f + g bezeichnet die Addition in KM und f (x) + g(x) jene
Analysis grün, bei den Kapiteln zur linearen Algebra blau in K.
und bei den grundlegenden und übergreifenden Kapiteln Abbildung 1.3 Mit einem roten Achtung beginnen Hinweise zu häufig ge-
braun. machten Fehlern.
1.2 Die didaktischen Elemente dieses Buchs 9

Um neue Begriffe, Ergebnisse oder auch Rechenschemata Unter der Lupe: Der Zwischenwertsatz
mit Ihnen einzuüben, haben wir zahlreiche Beispiele im Text Die Funktion f : [a, b] → R soll stetig sein und besitzt daher eine Minimalstelle x − und eine Maximalstelle x + auf [a, b]. Es
gibt dann für jedes y ∈ [f (x − ), f (x + )] eine Zahl x̂ ∈ [a, b] mit
integriert. Diese (kleinen) Beispiele erkennen Sie an der f (x̂) = y.

blauen Überschrift Beispiel, das Ende eines solchen Beispiels Verdeutlichung der Aussage: Die Aussage ist leicht am
Graphen einer stetigen Funktion wie dem in der Abbildung
Da a ∈ A liegt, ist diese Menge garantiert nichtleer. Au-
ßerdem ist die Menge beschränkt, denn offensichtlich ist
markiert ein kleines blaues Dreieck. einzusehen. Die Niveaulinie zu y muss bei einer stetigen
Funktion offensichtlich den Graphen schneiden. Genau an
A ⊆ [a, b]. Somit hat A ein Supremum, das wir mit x̂
bezeichnen.
einer solchen Stelle liegt die gesuchte Stelle x̂.
Was wissen wir über den Funktionswert von f an der Stelle
x̂ ? Wenn wir eine gegen x̂ konvergente Folge (xn ) aus A
Beispiel f (x)
betrachten, so folgt aufgrund der Stetigkeit von f , dass

⎛ En ∈ K
Die Einheitsmatrix n×n ist symmetrisch. f (x + )
⎞ f (x̂) = f ( lim xn ) = lim f (xn ) ≤ y
n→∞ n→∞

√1 2 i y ist.

Die Matrix A = ⎝ 2 −1 2 i + 1⎠ ∈ C3×3 ist nicht f (x − )


Nun müssen wir noch zeigen, dass f (x̂) = y gilt, d. h.,
wir müssen f (x̂) < y ausschließen. Dazu bietet es sich
i+1 3 11 a A x̂ x+ x− b x
an, einen Widerspruch zu konstruieren. Nehmen wir an,
f (x̂) < y. Dann muss wegen der Stetigkeit von f auch in
symmetrisch.  einer hinreichend kleinen Umgebung von x̂ diese Abschät-
zung gelten. Insbesondere existieren Stellen x zwischen x̂
Diskussion der Beweisidee: Da wir für eine beliebige und x + , für die f (x) < y ist. Dies ist aber ein Widerspruch
stetige Funktion die Stelle x̂ sicher nicht explizit ange- dazu, dass x̂ das Supremum von A ist. Für den formalen
Abbildung 1.4 Kleinere Beispiele sind in den Text integriert ben können, müssen wir abstrakter argumentieren, um die Beweis ist diese Argumentation sauberer zu formulieren.
Existenz einer solchen Stelle zu zeigen. Es bieten sich auf Mit der ε-δ-Beschreibung der Stetigkeit wird im Beweis
Grundlage des bisher Bewiesenen zwei Möglichkeiten an, eine Zahl x̃ ∈ [x̂, x + ] konstruiert, für die f (x̃) < y gilt.
die beide wesentlich auf dem Vollständigkeitsaxiom auf- Somit ist x̃ ein Element von A, aber größer als x̂.
Neben diesen (kleinen) Beispielen gibt es – meist ganzsei- bauen. Entweder konstruieren wir explizit eine Folge (xn ),
zu der wir Konvergenz in [a, b] zeigen können, und ver- Mit diesen Überlegungen haben wir den Fall f (a) < y

tige – (große) Beispiele. Diese ausführlich geschilderten Bei- suchen die Stetigkeit von f zu nutzen, um zu beweisen,
dass im Grenzfall gerade der Funktionswert y angenom-
vollständig erledigt. Für den Fall f (x̂) > y können wir
den Graphen von f an der Niveauline f (x) = y spiegeln.
Dies entspricht dem Betrachten von g(x) = y − f (x),
spiele behandeln meist komplexere oder allgemeinere Pro- men wird. Alternativ können wir versuchen, die Stetigkeit
zu nutzen, um eine Teilmenge von [a, b] zu finden, deren x ∈ [a, b]. Im Fall f (a) = y haben wir mit a schon
die Zwischenstelle gefunden. Insgesamt haben wir einen
bleme, deren Lösung mehr Raum einnimmt. Manchmal wird Supremum gerade die gesuchte Stelle ist. In beiden Fällen
besteht ein Beweis aus zwei Teilen. Man muss die Existenz vollständigen Beweis erarbeitet.
von x̂ sicherstellen und sich überlegen, dass f (x̂) = y gilt.
auch eine Mehrzahl prüfungsrelevanter Einzelbeispiele über- Im Haupttext wurde die zweite Möglichkeit für den Be- Bemerkungen:
weis gewählt. Ein erster rigoroser Beweis des Zwischenwertsat-
sichtlich in einem solchen Kasten untergebracht. Ein solcher zes wurde vom Mathematiker Bernard Bolzano
(1781–1848) in einer Arbeit aus dem Jahre 1817 ausge-
Umsetzung der Idee: Wir beschränken uns zunächst auf
Kasten trägt einen Titel, einen blau unterlegten einleiten- den in der Abbildung dargestellten Fall, dass f (a) < y
führt. Unabhängig erschien vier Jahre später ein Beweis
durch Augustin Louis Cauchy (1789–1857).
ist. Anschaulich ist klar, dass es zwischen a und x + min-
den Text, der die Problematik schildert, einen Lösungshin- destens einen Schnittpunkt mit der Niveaulinie f (x) = y
Das Vollständigkeitsaxiom wird nicht nur im Be-
weis verwendet, es ist auch fundamental dafür, dass
gibt. Um diesen zu konstruieren, definieren wir die Menge
weis, in dem das Vorgehen zur Lösung kurz erläutert wird, A durch
die Aussage überhaupt gilt. Konstruieren Sie selbst
ein Gegenbeispiel im Fall einer stetigen Funktion
A = {x ∈ [a, x + ] | f (x) ≤ y} . f : [a, b] ∩ Q → Q.
und schließlich den ausführlichen Lösungsweg (siehe Abbil-
dung 1.5).
Abbildung 1.6 Sätze bzw. deren Beweise, die von großer Bedeutung sind,
betrachten wir in einer sogenannten Unter-der-Lupe-Box genauer.
Beispiel: Betrag und Argument komplexer Zahlen
Gesucht sind die Beträge und die Argumente der Zahlen
z1
z1 , z2 , z1 + z2 ,

und
z2 sollten Sie die Frage beantworten können. Nutzen Sie diese
mit z1 = −1 + i und z2 = 1 + 3i.
Fragen als Kontrolle, ob Sie noch am Ball sind. Sollten Sie die
Problemanalyse und Strategie: Zunächst berechnen wir Betrag und Argument von z1 und z2 . Danach nutzen wir
die Rechenregeln, um die weiteren Beträge und Argumente zu bestimmen. Antworten nicht kennen, so empfehlen wir Ihnen, den vor-
 
Lösung: arg(z1 ) = arctan
−1
1
+π =−
π
4
+π =

4
hergehenden Text ein weiteres Mal durchzuarbeiten. Kurze
Beginnen wir mit den Beträgen der angegebenen Zahlen:
Wir berechnen

und √  Lösungen zu den Selbsttests („Antworten der Selbstfragen“)
√ √ 3 π
|z1 | = (−1)2 + 12 = 2 und |z2 | = 1 + 3 = 2 . arg(z2 ) = arctan = ,
1

3 finden Sie am Ende der jeweiligen Kapitel.
Für die Summe folgt weiter 3/2 √
√ wobei die Identität sin(π/3)/ cos(π/3) = 1/2 = 3
|z1 + z2 | = | − 1 + i + 1 + 3i| verwendet wurde. Das Argument der Summe berechnen
 √ √
?
wir direkt zu
= (1 + 3)2 = 1 + 3 √ π
arg(z1 + z2 ) = arg((1 + 3)i) = .
2
Den Betrag des Quotienten berechnen wir aus
   
 z1   z1 z2  1 1 1
Für den Quotienten folgt mit den Rechenregeln
   
Bestimmen Sie die beiden Lösungen der Gleichung z2 = i.
 = 
 z   |z |2  = 4 |z1 | |z2 | = 4 |z1 | |z2 | = √2 . arg
z1
= arg
z1 z2
2 2
z2 |z2 |2
Die Hauptwerte der Argumente von z1 und z2 lassen = arg(z1 z2 )
sich entweder aus einer Skizze der Zahlen in der Zah-
= arg(z1 ) + arg(z2 )
Abbildung 1.7 Selbsttests ermöglichen eine Verständniskontrolle.
lenebene ersehen oder wir berechnen diese mithilfe der
Wertetabelle für die trigonometrischen Funktionen auf 3 1 5
= arg(z1 ) − arg(z2 ) = π− π= π.
Seite 104 4 3 12
Im Allgemeinen werden wir Ihnen im Laufe eines Kapitels
Abbildung 1.5 Größere Beispiele stehen in einem Kasten und behandeln viele Sätze, Eigenschaften, Merkregeln und Rechentechni-
komplexere Probleme. ken vermitteln. Wann immer es sich anbietet, formulieren wir
die zentralen Ergebnisse und Regeln in sogenannten Über-
Manche Sätze bzw. ihre Beweise sind so wichtig, dass wir sie sichten. Neben einem Titel hat jede Übersicht einen einlei-
uns genauer unter die Lupe nehmen. Dazu dienen die Boxen tenden Text. Meist sind die Ergebnisse oder Regeln stich-
Unter der Lupe. Zwar sind diese Sätze mit ihren Bewei- punktartig aufgelistet. Eine Gesamtschau der Übersichten
sen stets auch im Fließtext ausführlich dargestellt, in diesen gibt ein Verzeichnis im Anschluss an das Inhaltsverzeich-
zugehörigen Boxen jedoch geben wir weitere Ideen und An- nis – die Übersichten dienen in diesem Sinne also auch als
regungen, wie man auf diese Aussagen bzw. ihre Beweise eine Art Formelsammlung (siehe Abbildung 1.8).
kommt. Wir geben oft auch weiterführende Informationen
Hintergrund und Ausblick sind oft ganzseitige Kästen, die
zu Beweisalternativen oder mögliche Verallgemeinerungen
eine Thematik behandeln, die weiterführenden Charakter hat.
der Aussagen (siehe Abbildung 1.6).
Meist kann das Thema wegen Platzmangels nur angerissen,
Ein sehr häufig eingesetztes Element ist das des Selbsttests. also keinesfalls erschöpfend behandelt werden. Die Gestal-
Meist enthält dieser Selbsttest eine Frage an Sie. Sie erkennen tung dieser Kästen ist analog zu jener von Übersichten. Die
dieses Merkmal an dem Fragezeichen. Mit dem Gelesenen Themen, die hier angesprochen werden, sind vielleicht nicht
10 1 Mathematik – eine Wissenschaft für sich

Übersicht: Die Klassifizierung der Folgen


Zum Ende eines jeden Kapitels haben wir Ihnen die wesent-
In diesem Kapitel wurden Eigenschaften bestimmter Klassen von Folgen genauer Untersucht. Hier werden diese Eigenschaften
und die Zusammenhänge zwischen ihnen noch einmal gesammelt dargestellt.
lichen Inhalte, Ergebnisse und zentralen Vorgehensweisen
Im folgenden Venn-Diagramm sind die Eigenschaften von Beispiel: Betrachten wir die Folge (an ) mit
in einer Zusammenfassung dargelegt. Die hier dargestell-
Folgen, die wir näher untersucht haben, und ihre Zusam-
menhänge als Teilmengen der Menge aller Folgen darge- 1
ten Zusammenhänge sollten Sie nachvollziehen können, und
an = 1 + , n ∈ N.
stellt. Zu jeder Klasse ist auch ein typischer Vertreter mit
angegeben.
n mit den geschilderten Rechentechniken, und Lösungsansät-
Da, für alle n ∈ N, 0 ≤ 1/n ≤ 1 ist, folgt auch 1 ≤ an ≤ 2.
Die Folge ist beschränkt und gehört zur gelben Menge. zen sollten Sie umgehen können.
alle Folgen Ferner ist

an+1 − an =
1 1
− =−
1
≤ 0.
Die erlernten Techniken können Sie an den zahlreichen Auf-
beschränkte Folgen n+1 n n (n + 1)
 konvergente


Folgen (n) gaben zum Ende eines jeden Kapitels erproben. Wir unter-
(−1)n 1 Die Folge ist monoton fallend und gehört damit zur blauen

n
(−1)n
n
monotone Folgen Menge im Diagramm. Das Monotoniekriterium besagt scheiden zwischen Verständnisfragen, Rechenaufgaben und
nun, dass die Schnittmenge der blauen und der gelben

(−1)n n
Menge, also gerade der grüne Bereich im Diagramm, nur Beweisaufgaben – jeweils in drei verschiedenen Schwierig-
aus konvergenten Folgen besteht. Somit ist (an ) konver-
gent. keitsgraden. Versuchen Sie sich zuerst selbstständig an den
Aufgaben. Erst wenn Sie sicher sind, dass Sie es alleine nicht
Abbildung 1.8 In Übersichten werden verschiedene Begriffe oder Rechenregeln
schaffen, sollten Sie die Hinweise am Ende des Buches zurate
zu einem Thema zusammengestellt.
ziehen oder sich an Kommilitonen wenden. Zur Kontrolle
finden Sie hier auch die Resultate. Sollten Sie trotz Hinwei-
unmittelbar grundlegend für das erste Studienjahr, sie sollen sen nicht mit der Aufgabe fertig werden, finden Sie auf der
Ihnen aber die Vielfalt und Tiefe verschiedener mathemati- Website www.matheweb.de die Lösungswege.
scher Fachrichtungen zeigen und auch ein Interesse an diesen
Themen wecken (siehe Abbildung 1.9).
1.3 Ratschläge zum Einstieg in
die Mathematik
Sie als Studienanfänger werden sich bald in der Situation
befinden, in der sich bereits Tausende vor Ihnen befunden
haben und sich auch noch Tausende nach Ihnen befinden
werden: Es ist oftmals gar nicht so schwierig, die Beweise aus
der Vorlesung nachzuvollziehen, es scheint aber manchmal
schier unmöglich, selbstständig einen Beweis zu formulieren.
Aber das Beweisen von Sätzen ist das A und O in der Ma-
thematik. Und da es kein allgemeingültiges Schema gibt, das
Ihnen einen Weg vorgibt, wie Sie beim Beweisen von Aussa-
gen vorzugehen haben, ist es – vor allem zum Studienbeginn –
so schwierig, überhaupt auch nur Ansätze zu finden, die zu
einem Beweis einer Aussage führen können.
Eine Regel aber gilt auf jeden Fall: Die Erfahrung macht den
Meister! Kennt man viele unterschiedliche Beweise, so hat
man ein ganzes Sammelsurium an Ideen, die schon einmal
zu Lösungen geführt haben; und die richtige Idee zu haben,
ist oftmals das Entscheidende zum Beweis eines Satzes.

Zu Studienbeginn sieht man bei großen


Beweisen zu und führt selbst nur kleine
Beweise

In der Vorlesung geht es gleich zu Beginn meist hoch her. Man


Abbildung 1.9 Ein Kasten Hintergrund und Ausblick gibt einen Einblick in ein rührt in den Grundlagen der Mathematik, spricht meist über
weiterführendes Thema. das Induktionsprinzip und das Wohlordnungsprinzip und be-
weist die Gleichwertigkeit dieser Prinzipien. Kein Mensch
Bitte beachten Sie, dass Sie weder die Hintergrund-und- erwartet dabei von Ihnen, dass Sie auf diesen Beweis inner-
Ausblicks-Kästen noch die Unter-der-Lupe-Kästen kennen halb kurzer Zeit selbst kommen sollten. Sie sollten solche Be-
müssen, um den sonstigen Text des Buchs verstehen zu kön- weise erst einmal nur nachvollziehen können. Die Beweise,
nen. Diese beiden Elemente bringen also nur zusätzlichen die man von Ihnen erwartet, sind deutlich einfacherer Natur.
Stoff, im restlichen Text wird nicht auf die vertiefenden Ele- In Ihren Übungen beweisen Sie anfangs zum Beispiel Unglei-
mente Bezug genommen. chungen, die Sie oftmals durch rechnerische Umformungen
1.3 Ratschläge zum Einstieg in die Mathematik 11

Abbildung 1.10 In dem Beweis des Satzes zur Primeigenschaft wird auf die Voraussetzungen und auf bekannte Ergebnisse zurückgegriffen.

erhalten. An das Formulieren von umfangreichen und kom-


plizierten Beweisen muss man langsam herangeführt werden.
Dazu gehört, dass Sie die Beweise aus den Vorlesungen ana-
lysieren, d. h.:
auf Korrektheit prüfen,
in Teilschritte gliedern,
überprüfen, wo die Voraussetzungen eingehen,
mit Beweisen ähnlicher Aussagen vergleichen,
alternative Beweise der gleichen Aussage vergleichen,
überprüfen, ob Modifikationen der Aussage (Verschär-
fung, Verallgemeinerung, Abschwächung) unter modifi-
zierten Voraussetzungen beweisbar sind.
Abbildung 1.11 In einer Vorlesung führt man Beweise gerne kurz und knapp.
Wir betrachten das an einem Beispiel (siehe Abbildung 1.10). Zum Verständnis sind die gesprochene Worte des Dozenten oft unablässig.
In einer Vorlesung sind die Beweise meist nicht so ausführlich
wie in einem Buch. Die Tafelanschrift ist dort viel knapper,
Schwierigkeiten und so sind viele „Beweise“ von Studienan-
aber dafür gibt es in einer Vorlesung noch die erklärenden
fängern unvollständig oder fehlerhaft.
Worte des Dozenten. Es ist wichtig, bei den Erklärungen am
Ball zu bleiben (Abb. 1.11). Sie können ihre eigene Beweisführungskompetenz schärfen,
indem Sie

Mit Kommilitonen und viel Hintergrundwissen unvollständige und/oder falsche Argumente in Beweisen
ist es leichter entdecken,
unvollständige Beweise komplettieren,
Man lernt sehr viel dabei, wenn man sich mit Kommilitonen falsche Beweise korrigieren oder durch Gegenbeispiele
zusammentut und die Beweisführungen zu den verschiede- widerlegen,
nen Aufgaben, die im Laufe des Studiums gestellt werden, anhand von Beweisversuchen unscharfe Hypothesen prä-
miteinander vergleicht. Natürlich hat man als Anfänger zisieren.
12 1 Mathematik – eine Wissenschaft für sich

Übersicht: Ratschläge für das Studium Mathematik


Es gibt hierfür keine allgemeingültigen Regeln. Wir geben Ratschläge, die wir im Laufe vieler Jahre gesammelt haben.

Zur Vorlesung Das konkrete Lösen von Aufgaben


– Denken und schreiben Sie mit. Durch das Schreiben – Lesen Sie die Aufgabenstellung genau: Ist nach einer
prägt sich der Stoff besser ein. Lösung oder einer Lösungsmenge gefragt? Im zwei-
– Es ist üblich, dass man nicht alle Inhalte einer Vorle- ten Fall sollten Sie auch eine Menge angeben.
sung sofort versteht; versuchen Sie aber stets am Ball – Ist Ihr Ergebnis plausibel? Stimmen die Einheiten?
zu bleiben. – Notieren Sie in Ihren Lösungen, wo Sie welche Er-
– Stellen Sie an den Dozenten Fragen, falls Sie etwas gebnisse der Vorlesung oder Übung benutzen; wie-
nicht verstanden haben. derholen Sie bei dieser Gelegenheit diese benutzten
– Auch Dozenten machen Fehler, weisen Sie ihn darauf Ergebnisse.
hin, falls Sie dies bemerken. – Was sind die Voraussetzungen in der Aufgabenstel-
Hausaufgaben und Nachbearbeitung der Vorlesung lung? Welche Begriffe der Aufgabenstellung kennen
– Planen Sie mehrere Stunden für Hausaufgaben und Sie aus der Vorlesung oder anderen ähnlichen Auf-
Nachbearbeitung der Vorlesungsinhalte ein. gabenstellungen?
– Erinnern Sie sich an die Themen, zentralen Defini- – Seien Sie nicht demotiviert, wenn Sie eine Aufgabe
tionen, Sätze und Regeln? nicht lösen können – auch beim Lösungsversuch
– Arbeiten Sie die Vorlesungsinhalte anhand der Auf- lernt man.
gaben nach. – Bearbeiten Sie viele Aufgaben, Übung macht den
– Machen Sie sich Begriffe und Notationen an eigenen, Meister.
einfachen Beispielen klar. – Wenn Sie bei einer Aufgabe nicht weiterkommen,
– Lernen Sie nicht stur auswendig, versuchen Sie, die sollten Sie überlegen, ob eine ähnliche Aufgabe in
Zusammenhänge zu verstehen. einer Tutor-/Zentralübung besprochen worden ist.
– Bilden Sie Arbeits- und Lerngruppen mit Kommili- Wie wurde sie dort gegebenenfalls gelöst?
tonen, mit denen Sie gut zusammenarbeiten können. – Auch wenn Sie einen (korrekten) Lösungsweg ge-
– Versuchen Sie sich an den Aufgaben zuerst selbst und funden haben, ist es manchmal sinnvoll über andere,
gehen Sie nicht unvorbereitet in Ihre Arbeitsgruppe. eventuell kürzere Wege nachzudenken.
Holen Sie sich erst dann Hinweise, wenn Sie nach in- Häufige Fehler
tensiver Beschäftigung mit einer Aufgabe nicht wei-
– Wird eine Voraussetzung nicht benutzt, so ist das Er-
terkommen.
gebnis selten richtig.
– Erklären Sie Ihren Kommilitonen den Stoff.
– Geben Sie an, woher ihre Variablen sind – so haben
– Formulieren Sie Ihre Lösungen so, dass jemand an-
Sie immer die Kontrolle über Ihre Elemente.
deres Ihre Gedankengänge verstehen und nachvoll-
– f −1 (x) ist oft zweideutig; Stichwort Umkehrfunk-
ziehen kann.
tion und Urbildmenge – beachten Sie das vor allem
– Haben Sie in Ihrer Vorlesungsmitschrift alle Fehler
auf Ihrem Taschenrechner.
ausgemerzt?
– Wenn Sie durch x − a teilen, müssen Sie den Fall
Übungsgruppen
x = a gesondert betrachten – teilen Sie nicht durch
– Stellen Sie Fragen.
null!
– Nutzen Sie die Möglichkeit zum Vorrechnen.
– Achten Sie auf Vorzeichen beim Ziehen von Wurzeln.
– Besuchen Sie jede Woche möglichst die gleiche
– Reflektieren Sie Ihre Rechnungen und Ergebnisse.
Übungsgruppe.
Seitenlangen Umformungen bei Haus- oder Klausur-
– Machen Sie sich mit den Aufgaben vor der Übung
aufgaben gehen oft Rechenfehler oder unpassende
vertraut – verstehen Sie alle Begriffe?
Ansätze voraus. Auch sehr große, rechenaufwendige
Der Umgang mit einem Lehrbuch
Zahlen deuten auf Fehler hin.
– Lesen Sie langsam.
– Gilt tatsächlich ⇔ oder doch nur ⇒ bzw. ⇐?
– Beachten Sie bei Sätzen alle Voraussetzungen. Suchen
Sie bei Herleitungen nach den Stellen, an denen die Prüfungsvorbereitung
Voraussetzungen benutzt werden. Achten Sie auf Ge- – Ständiges Mitarbeiten spart viel Prüfungsvorberei-
neralvoraussetzungen, wie etwa „X ist eine Menge“. tung.
– Gedankenstriche könnten fälschlicherweise auch als – Formulieren Sie die zentralen Definitionen, Sätze
Minuszeichen interpretiert werden. und Regeln separat in einer ausführlichen Zusam-
– Wenn Sie am Ende einer Zeile oder Seite etwas nicht menfassung.
verstehen, gucken Sie in die nächste Zeile bzw. Seite. – Machen Sie sich einen Spickzettel mit einer eige-
– Bedenken Sie, dass in einem Buch auch Druckfehler nen, stichwortartigen Gliederung: Was Sie notieren,
sein können. werden Sie wissen.
1.4 Eine kurze Geschichte der Mathematik 13

Beim Lösen von Aufgaben sollten Sie Hintergrundwissen Auswahl sein und ist auch durch die Vorlieben des Verfas-
benutzen, beachten Sie das folgende Beispiel. sers bestimmt. Eine kulturgeschichtliche Zeitreise vermittelt
die Lektüre „6000 Jahre Mathematik“ (Band 1 und Band 2)
Beispiel Wir betrachten erneut den Satz zur Primeigen- von Hans Wußing (Springer-Verlag 2008/2009). Von diesen
schaft und begründen auf eine andere Art und Weise wie beiden Bänden hat der Verfasser dieser „kurzen Geschichte
oben geschehen, dass jede Primzahl p die folgende, soge- der Mathematik“ zahlreiche Anregungen erhalten. Dankens-
nannte Primeigenschaft erfüllt: werterweise konnten auch einige Abbildungen übernommen
werden.
p | a b ⇒ p | a oder p | b, wobei a, b ∈ N .

Einen naheliegenden Beweisansatz findet man wie folgt:


p | a b bedeutet doch gerade, dass es ein c ∈ N gibt mit: Am Anfang war die Zahl

pc = ab. (1.1)
Zahlen, in allen Kulturen schon in einem frühen Stadium der
Nun denken wir an den Fundamentalsatz der Arithmetik, der Entwicklung zum Zählen, Rechnen und Vergleichen verwen-
hoffentlich vielen aus der Schulzeit bekannt ist. Dieser Satz det, spielen auch in unserem Alltagsleben eine nicht wegzu-
besagt, dass jede natürliche Zahl n > 1, von der Reihen- denkende Rolle. Ob Telefonnummern, Kontostände, Preise,
folge der Faktoren abgesehen, eindeutig als ein Produkt von Zinsen und Zeitangaben, Zahlen sind allgegenwärtig. Man
Primzahlen geschrieben werden kann, d. h.: kann sagen, dass die Geschichte der Mathematik mit der
Erfindung von Symbolen als Stellvertreter für Zahlen be-
ginnt. Ein ca. 25.000 altes Zeugnis hierfür ist der Ishango-
n = p1 · · · pr mit Primzahlen p1 , . . . , pr .
Knochen aus Zaire mit Strichmustern, die stellvertretend für
Zahlen stehen. Jüngeren Datums sind Tontafeln mit Keil-
Damit können wir obige Aussage begründen: Zerlegt man a b
schriftzeichen aus Mesopotamien. Die Babylonier verwende-
in ein Produkt von Primzahlen (was nach dem Fundamental-
ten ihr Zahlensystem, das auf der Basis 60 beruhte, nicht nur
satz der Arithmetik möglich ist), so taucht laut Gleichung
für Handel und zur Buchführung, sondern auch zu astrono-
(1.1) die Primzahl p als ein Faktor in dieser Zerlegung von
mischen Rechnungen. Auf dem berühmten Täfelchen√YBC
a b auf. Damit muss aber die Primzahl p Teiler einer der
7289 findet sich in Keilschrift ein Näherungswert für 2 auf
Faktoren a oder b sein, evtl. sogar von beiden. 
sechs Stellen genau (Abb. 1.12).

Das Beispiel zeigt, dass man Aussagen mit bekannten Tatsa-


chen oftmals schnell beweisen kann. Bedenken Sie also stets
beim Beweisen:

Gibt es bekannte Aussagen oder Sätze, die anwendbar


sind?
Gibt es Abhängigkeiten oder Ähnlichkeiten der zu zeigen-
den Aussage zu bekannten Aussagen?

Weitere Ratschläge finden Sie in der Übersicht auf Seite 12.


Abbildung 1.12 Täfelchen YBC 7289 mit Näherungswert für 2 auf sechs
Stellen genau (1 + 24/60 + 51/602 + 10/603 ≈ 1.414213).

1.4 Eine kurze Geschichte der Das Positionssystem der Babylonier mit der Grundzahl 60
Mathematik war sehr leistungsfähig und allen Zahlensystemen der Antike
(etwa dem der Griechen und Römer) überlegen.

Die Anfänge der Mathematik reichen weit in die Geschichte Unser geläufiges Stellensystem mit der Basis 10 und den
zurück. Höhlenmalereien aus Südfrankreich, Spanien und Ziffern 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ist indischen Ursprungs und
Nordafrika bereits um 13.000 v. Chr. weisen einen bemer- kam über die Araber nach Europa. Um ca. 500 v. Chr. führten
kenswerten Sinn für Formeln auf. Schon in der älteren Stein- die Inder ein Zeichen für „Nichts“ (auf lateinisch „nullus“)
zeit finden sich Zeugnisse für Vorstufen des Zählens und ein, nämlich „0“. So konnten sie Zahlen wie 25 = 2 · 101 +
Rechnens in Form von Ritzen auf den Höhlenwänden und 5 · 100 und 2050 = 2 · 103 + 0 · 102 + 5 · 101 + 0 · 100
Kanten in Stöcken oder Knochen (30.000 bis 20.000 v. Chr.). unterscheiden. Bis zur endgültigen Klärung des Begriffs der
Die folgende kurze Geschichte der Mathematik kann nur eine „reellen Zahl“ hat es ziemlich lange gedauert. Dieser Prozess
14 1 Mathematik – eine Wissenschaft für sich

war erst gegen Ende des 19. Jahrhunderts (G. Cantor (1883), ten, die Berechnung des Verpflegungsbedarfs für Soldaten
R. Dedekind (1888) ) abgeschlossen. etc. Dass in einem rechtwinkligen Dreieck mit den Katheten
a und b und der Hypotenuse c die Gleichung

a 2 + b2 = c2
Mesopotamien (ab ca. 3300 v. Chr. bis ca.
100 v. Chr.) gilt (sogenannter Satz des Pythagoras) war in Mesopotamien
bekannt. Das spezielle Zahlentripel 3, 4, 5 mit 32 +42 = 52
und ähnliche Zahlentripel waren bekannt. Solche Tripel wur-
Es ist wohl kein Zufall, dass sich die frühen Hochkulturen den von den Harpedonapten (Seilspannern) verwendet, um
um den sogenannten „fruchtbaren Halbmond“ am Nil, an rechte Winkel bei der Vermessung zu erzeugen (denn es gilt
Euphrat und Tigris (Mesopotamien) und den Indus und in auch die Umkehrung des Satzes des Pythagoras!).
China um den Huanghe entwickelten. Aus den Nomaden-
kulturen wurden sesshafte Bauernkulturen. Die Bedeutung Den Babyloniern war die Methode der quadratischen Er-
der Jagd nahm ab, weil es gelang Schafe, Schweine, Ziegen gänzung geläufig, und sie entwickelten Näherungsverfahren
und Rinder zu züchten. So konnten Teile der Bevölkerung zur Bestimmung von Quadratwurzeln aus natürlichen Zah-
von der unmittelbaren Nahrungsproduktion befreit werden. len, falls diese Zahlen keine Quadratzahlen waren. Es sind
Es konnten sich spezialisierte Berufsgruppen in Handwerk, Tabellen mit Quadratzahlen überliefert. Kam eine natürli-
Technik, Verwaltung, Kultur und Militär herausbilden. So che Zahl a, deren Wurzel zu berechnen war, in den Tabellen
entstand ab ca. 3000 v. Chr. in Mesopotamien, dem Zwei- nicht vor, so suchte man eine nächstkleinere Quadratzahl x02
stromland zwischen Euphrat und Tigris (heute politisch zum und rechnete mit ε := a − x02 die Wurzel von a nach der
Irak gehörig), eine blühende Kulturlandschaft, die von ver- Formel
schiedenen Völkerschaften (Sumerer, Akkader, Assyrer) be- √ 
ε
siedelt wurde. Städte wie Babylon, Ninive, Nippur, Uruk und a = x02 + ε ≈ x0 + .
2x0
Ur sind heute noch ein Begriff. Herrscher wie Hammurapi
√ B. erhält man2 für a = 27 = 25 + 2 den Näherungswert
(1728–1686 v. Chr.) und Nebukadnezar II (605–567 v. Chr.) Z.
sind vielleicht in Erinnerung (letzterer wohl auch durch die 27 ≈ 5 + 2 · 5 = 5.2 . Ob die Babylonier das Verfah-
grausame Behandlung von Gefangenen während seiner Herr- ren iteriert haben ist nicht bekannt, aber wahrscheinlich. Den
schaft). Unter Nebukadnezar begann auch die babylonische Griechen war die obige Näherungsformel ebenfalls bekannt;
Gefangenschaft des jüdischen Volkes. sie wird fälschlicherweise häufig nach dem griechischen
Mathematiker Heron von Alexandria (≈ 62 u. Z.) benannt.
Das Zahlsystem in Mesopotamien hatte in ausgereiftem Zu-
Durch Iteration erhält man einen Spezialfall des Newton-
stand zwei Keilschriftzeichen (den Keil für die Eins und den
Verfahrens.
Winkelhaken für zehn). Es war ein Positionssystem mit der
Basis 60 (Sexagesimalsystem), wegen des Winkelhakens für Auch die Methode der „quadratischen Ergänzung“ zur Lö-
die Zahl zehn hatte es eine dezimale Komponente. So ist etwa sung einer quadratischen Gleichung war den Babyloniern ge-
in Abbildung 1.13 die Zahl 42 = 4 · 10 + 2 in Keilschriftzei- läufig: Um etwa die Gleichung
chen zu sehen.
x 2 + 2x − 8 = 0

zu lösen, addierten die Babylonier 8 auf beiden Seiten:

x 2 + 2x = 8 .

Abbildung 1.13 Die Zahl 42 in Keilschriftzeichen.


Dann wird auf beiden Seiten das Quadrat der Hälfte von 2,
also 12 = 1, addiert, und man erhält:
Ein inneres Lückenzeichen (die Null) wurde aufgrund indi-
schen Einflusses um 500 v. Chr. eingeführt. Relikte dieses x 2 + 2x + 1 = 8 + 1 = 9
Zahlensystems finden sich heute noch bei der Einteilung des
Vollkreises in 360°, der Einteilung von Minuten in Sekun- oder
den. Die Tatsache, dass die Grundzahl 60 relativ viele Teiler
hat, vereinfacht das Rechnen mit Brüchen. (x + 1)2 = 9

Die mesopotamische Mathematik ist mit praktischen Proble- und damit x + 1 = ±3, d. h., x1 = −4 und x2 = 2 sind
men verbunden: Berechnung von Dämmen mit meist trapez- die Lösungen der Ausgangsgleichung. Der in der Bibel ge-
förmigem Querschnitt, Berechnung von Tempelfundamen- schilderte Turmbau zu Babel (Genesis 11.1–11.9) fällt auch
1.4 Eine kurze Geschichte der Mathematik 15

in diese Periode. Zusammenfassend kann man sagen, dass in schrittliche Technik ging einher mit Kenntnissen in Mathe-
Mesopotamien, speziell in Babylon, eine auf dem Sexage- matik und Astronomie.
simalsystem basierende leistungsfähige Mathematik (Geo-
Auch die chinesische Mathematik erlebte schon früh eine
metrie und Arithmetik) entwickelt wurde; allerdings fehlten
Blütezeit. Besonders erwähnenswert sind die „Neun Bü-
noch Lehrsätze und Beweise, deshalb kann man noch nicht
cher arithmetischer Technik“ (300–500 v. Chr.), eine Samm-
von Mathematik als Wissenschaft sprechen.
lung von 246 Aufgaben aus den Bereichen Landvermes-
sung, Landwirtschaft, Steuern, Handelserträge, Technik, Lö-
sung von Gleichungen, insbesondere lineare Gleichungen
Die Mathematik im alten Ägypten (die sogenannte Fang-Cheng-Methode zum Lösen von linea-
(ca. 3000 v. Chr. bis ca. 300 v. Chr.) ren Gleichungssystemen entspricht dem Gauß-Algorithmus),
simultane Kongruenzen (chinesischer Restsatz). Die Chine-
Ähnlich wie im Zweistromland hatten auch die ägyptischen sen verwendeten im Wesentlichen ein Dezimalsystem mit
Siedlungen am Flussufer des Nils mit jährlichen Über- Null. Im Übergang vom 7. ins 8. Jahrhundert wurden die indi-
schwemmungen zu kämpfen. Die Überflutungen waren je- schen Ziffern übernommen. Um 300 u. Z. findet sich die recht
doch entscheidend für die Landwirtschaft und damit das gute Näherung 3.14159 für die Kreiszahl π . Das 13. Jahr-
gesamte Leben in Ägypten. Wie der griechische Historiker hundert war ein „Goldenes Zeitalter“ für die chinesische
Herodot in seinem großen Epos über die Perser-Kriege be- Mathematik (Zitat Wußing a. a. O.). Das Pascal’sche Drei-
richtet, wurde „geometria“ von den Ägyptern benutzt, um eck zur Berechnung von Binomialkoeffizienten war ihnen
nach den Überflutungen das Ackerland neu zu vermessen. geläufig, ebenso wie Interpolationsformeln und Summenfor-
Dabei musste man rechte Winkel erzeugen können. Die meln und Berechnungsverfahren für Quadrat- und Kubik-
Ägypter verwendeten die gleiche Methode wie die Mesopo- wurzeln.
tamier. Pythagoräische Zahlentripel waren das wesentliche
Hilfsmittel.
Während aus Mesopotamien zahllose Tontafeln überliefert Die Mathematik der Maya
sind, sprudeln die Informationsquellen zur antiken ägypti-
schen Mathematik nicht so reichlich. Die ersten beiden Ur- Die verblüffenden intellektuellen Leistungen der Maya und
kunden sind Beispielsammlungen von 84 bzw. 25 Aufgaben, Azteken und der Inka in Südamerika bezüglich Bauwesen
die meist praxisorientiert waren und etwa die Verteilung von (Errichtung von Palästen, Gärten etc.) und insbesondere die
Löhnen auf mehrere Arbeiter, die Berechnung des Bedarfs Kalenderrechnung und die langfristige Voraussage von Son-
an Mehl zum Backen einer bestimmten Menge von Broten nenfinsternissen seien hier nur am Rande erwähnt. Die Maya
oder die Berechnung von Raum- und Flächeninhalten betra- verwendeten ein Positionssystem mit der Basis 20 und einer
fen. So konnten sie etwa den Materialbedarf für den Bau ihrer „Null“.
beeindruckenden Pyramiden berechnen. Für die Kreiszahl π,
das Verhältnis von Umfang und Durchmesser eines Kreises,
 2
verwendeten sie die brauchbare Näherung 16 ≈ 3.1605. Antike
9

Die Ägypter verwendeten ein etwas umständliches Dezimal- Im Zuge der sogenannten dorischen Wanderung besiedelten
system. Für jede Zehnerpotenz gibt es ein eigenes Zeichen in die Griechen die Inseln der Ägäis und die Westküste Kleinasi-
Gestalt einer Hieroglyphe, das entsprechend häufig wieder- ens. Um 900 v. Chr. beginnt die Entwicklung einer gemeinsa-
holt wird: men eigenständigen Kultur der griechischen Stämme (die ihr
Land Hellas und sich selbst Hellenen nennen). Homer schrieb
die Epen „Ilias“ und „Odyssee“ in der zweiten Hälfte des 8.
vorchristlichen Jahrhunderts. Im Jahr 776 v. Chr. fanden in
Olympia die ersten olympischen Spiele statt. Um diese Zeit
breitete sich die hellenistische Zivilisation und Kultur weit
im Mittelmeerraum aus. Es entstanden Kolonien in Unter-
italien und Sizilien, am Bosporus und am Schwarzen Meer.
Die Griechen hatten im Gegensatz zu den Mesopotamiern
Indische (ca. 1000 v. Chr. bis 1000) und chine- und Ägyptern, für die praktische Anwendungen im Vorder-
sische Mathematik (ca. 1000 v. Chr. bis 1300) grund standen, ein philosophisches Interesse an der Mathe-
matik. Als erster bedeutender Naturphilosoph wird Thales
In Indien entwickelten sich im Industal und in der Ganges- Milet (624–548 v. Chr.) angesehen. Auf häufigen Geschäfts-
ebene ca. 3000 v. Chr. Stadtkulturen (Mohenjo-Daro, Har- reisen kam er nach Ägypten, wo er die ägyptische Geome-
appa, Dehli). Es gab in den Städten rechtwinklig aufgebaute trie kennenlernte und die Bekanntschaft mit Erkenntnissen
Straßen, Häuser mit Badezimmern, wohldurchdachte Ab- der Babylonier machte. Es soll Thales angeblich gelungen
wassersysteme und Zitadellen. Diese vergleichsweise fort- sein, mithilfe babylonischer Tafeln die Sonnenfinsternis am
16 1 Mathematik – eine Wissenschaft für sich

28. Mai 585 v. Chr. vorherzusagen. Damit soll er dem lydi- die ersten „theoretischen Mathematiker“, da Anwendungen
schen König Krösus geholfen haben eine Schlacht zu gewin- für sie nicht im Vordergrund standen.
nen, da seine Feinde – von der Sonnenfinsternis überrascht
Die Begriffe „gerade Zahl und ungerade Zahl“ waren ih-
– erschrocken die Flucht ergriffen. Zahlreiche geometrische
nen geläufig.
Sätze werden Thales zugeschrieben, ob die Beweise von ihm
Sie kannten sogenannte „figurierte Zahlen“ wie Dreiecks-
stammen, ist wegen mangelnder Zeugnisse nicht sicher. Sätze
zahlen, also:
die Thales zugeschrieben werden, sind u. a.:
Jeder Peripheriewinkel über einen Durchmesser eines n(n + 1)
1 + 2 + 3 + ... + n = ,
Kreises ist ein rechter. 2
Der Durchmesser eines Kreises halbiert die Kreisfläche.
Viereckszahlen:
In einem gleichschenkligen Dreieck sind die Basiswinkel
gleich.
1 + 3 + 5 + ... + 2n − 1 = n2
Der Scheitelwinkelsatz: Schneiden sich zwei Geraden, so
sind die Scheitelwinkel gleich.
etc.
Zwei Dreiecke sind kongruent, wenn sie in einer Seite und
Sie kannten Beispiele von vollkommenen Zahlen, z. B.:
anliegenden Winkeln übereinstimmen.
Thales gilt als erster Mathematiker, der für seine Sätze auch 6=1+2+3
Beweise angab. Er war einer der Ersten, der aus der Mathe-
matik heraus neue Fragestellungen und Probleme formuliert oder
hat. Für viele Wissenschaftshistoriker beginnt mit solchen 28 = 1 + 2 + 4 + 7 + 14 .
Fragestellungen die Mathematik als Wissenschaft, während
vorher meist Anwendungen im Mittelpunkt standen. Dabei heißt eine natürliche Zahl n vollkommen, wenn sie
Summe ihrer Teiler ist, die kleiner als n sind.
Sie kannten eine Formel, um sogenannte pythagoräische
Zahlentripel, d. h. natürliche Zahlen x, y, z mit
Von den Pythagoräern bis zu Diophant
x 2 + y 2 = z2
Pythagoras von Samos (≈ 560–480 v. Chr.) gründete nach
Reisen nach Ägypten und einer Gefangenschaft in Babylon zu erzeugen.
im Jahr 529 v. Chr. in Kroton (Unteritalien) eine Art Or- Der sogenannte „Satz des Pythagoras“, dass nämlich in
den, also eine religiöse Gemeinschaft, deren Mitglieder nach einem rechtwinkligen Dreieck mit den Katheten a, b und
strengen Regeln leben mussten. der Hypotenuse c gilt:

a 2 + b2 = c2 ,

war jedoch schon den Babyloniern, Chinesen und Indern


lange vor Pythagoras bekannt.
Das Wahrzeichen der Pythagoräer war das „Pentagramm“
(auch „Drudenfuß genannt). Es ist ein fünfzackiger Stern,
der im regelmäßigen 5-Eck durch dessen Diagonalen erzeugt
wird. Es zeigt sich, dass die Länge der Seite a zur Diagonalen
x im Verhältnis des „goldenen Schnitts“ steht:

a : x = x : (a − x) .

Hieraus folgerte der Pythagoräer Hippasos, dass Seite und


Diagonale eines regelmäßigen 5-Ecks nicht kommensurabel
Abbildung 1.14 Pythagoras (≈ 560–480 v. Chr.). sind. In unserer heutigen Terminologie bedeutet dies, dass

das Verhältnis xa = 5−1 2 ≈ 0.618034 keine rationale Zahl
Die Pythagoräer glaubten an die Unsterblichkeit der Seele,
darstellt, also irrational ist. Der goldene Schnitt tritt in der
die Seelenwanderung und waren überzeugt, dass die Göt-
Natur beim Wachstum von Pflanzen (Phyllotaxis) auf und
ter die Welt nach Zahlen und Zahlenverhältnissen geordnet
wird in der bildenden Kunst von der Antike (römische Säulen
haben. Ihr Motto war „Alles ist Zahl“. Sie bewiesen mathe-
und Tempeln) bis heute oft verwendet.
matische Sätze auf der Basis von Postulaten (Axiomen) und
Definitionen. Ihre Formulierungen waren häufig abstrakt und Die Existenz solcher irrationalen Zahlen störte das Selbst-
vielfach ohne Bezug auf die Realität. Die Pythagoräer waren verständnis der Pythagoräer gewaltig und war der Grund,
1.4 Eine kurze Geschichte der Mathematik 17

Bevölkerung von der Pest befreit werde. Mathematisch ist das


Problem einfach zu formulieren: Hat der gegebene Würfel
die Seitenlänge a, dann ist ein Würfel mit der Seitenlänge
x gesucht, für den x 3 = 2a 3 gelten muss. Die Konstruktion
x
mit Zirkel und Lineal ist nicht möglich, was aber erst im
19. Jahrhundert exakt bewiesen werden konnte.

Platon waren auch die fünf sogenannten platonischen Kör-


per bekannt: Würfel, Tetraeder, Oktaeder, Dodekaeder und
Ikosaeder. Sie sind dadurch gekennzeichnet, dass ihre Ober-
fläche durch regelmäßige n-Ecke begrenzt wird.
a
Platonische Körper (reguläre Polyeder)
Tetraeder 4 Dreiecke Feuer
Würfel (Hexaeder) 6 Quadrate Erde
Oktaeder 8 Dreiecke Luft
Abbildung 1.15 Die Längen der Seite a und der Diagonalen x stehen im regel- Dodekaeder 12 Fünfecke Welt

mäßigen 5-Eck im Verhältnis des goldenen Schnitts xa = 5−1
2 ≈ 0.618034, Ikosaeder 20 Dreiecke Wasser
einer irrationalen Zahl.

Die in der rechten Spalte stehenden Elemente wurden von


warum sich die Griechen nicht weiter um die Entwicklung Platon jeweils den geometrischen Objekten zugeordnet, wo-
des Zahlenbegriffs bemühten. Die Ausnahme war lediglich bei das Dodekaeder als Grundform für die Welt erschien.
Eudoxos.

Eudoxos von Knidos (≈ 400–350 v. Chr.) war Mathemati-


ker, Astronom, Arzt, Philosoph und Geograf. Er studierte in
Tarent und in Sizilien und dann in Athen bei Platon. Um ca.
500 v. Chr. gab es in Athen einen Neuaufschwung in Politik
und Wirtschaft bedingt durch politische und wirtschaftliche
Reformen.

Der Sokratesschüler Platon (427–347 v. Chr.) begründete


387 v. Chr. die „Akademie“ in Athen, eine einzigartige Philo-
sophenschule. Über dem Eingang zur Akademie stand: „Nie- Abbildung 1.16 Die fünf platonischen Körper.
mand trete ein, der nicht der Geometrie kundig ist“. Platon
hatte großen Einfluss auf die Mathematiker, und umgekehrt
Aristoteles (384–322 v. Chr.) war der wichtigste Schüler Pla-
wurde er stark von den Mathematikern beeinflusst. Ein be-
tons. Er war eher Philosoph und Biologe als Mathematiker.
sonderes Anliegen von Platon war die Reinheit der Methoden
Die von ihm entwickelte formale Logik ist jedoch schon
in der Mathematik. Als Konstruktionsprinzip in der Geome-
ganz auf mathematische Schlüsse gestützt. Seine Lehren be-
trie soll er „lediglich Zirkel und Lineal“ erlaubt haben. Drei
herrschten fast 2000 Jahre die Wissenschaftstheorie. Seine
Probleme waren es insbesondere, mit denen sich die griechi-
Diskussion des „potentiell und aktual Unendlichen“ kann
sche Mathematik auseinandersetzte:
man als Vorstufe von Cantors Mengenlehre und damit Aristo-
die Quadratur des Kreises, teles als Vorläufer der modernen Grundlagenforschung anse-
die Würfelverdopplung, hen. Aristoteles war auch einer der Erzieher Alexander des
die Dreiteilung eines Winkels. Großen.

Die Quadratur des Kreises besteht in dem Problem, eine Nach dem Tod von Alexander dem Großen (323 v. Chr.)
Kreisfläche in ein flächengleiches Quadrat zu verwandeln. sank die politische Macht Griechenlands und zugleich seine
Dass dieses Problem mit Zirkel und Lineal nicht zu lösen führende Stellung im Bereich der Wissenschaften. Neues
ist, bewies als erster 1882 F. Lindemann, indem er nachwies, wissenschaftliches Zentrum wurde die von Alexander dem
dass die Kreiszahl π eine transzendente Zahl ist. Es hat jedoch Großen am Nildelta gegründete Stadt Alexandria mit der Uni-
zu allen Zeiten brauchbare Näherungskonstruktionen gege- versität (dem Museion) und der größten Bibliothek der Welt.
ben. Hier wirkte nun 300 v. Chr. Euklid von Alexandria (seine Le-
bensdaten sind nicht genau bekannt, man geht davon aus,
Zu Platons Zeiten soll ein Orakelsprecher die Verdopplung dass er um 340 v. Chr. bis 270 v. Chr. gelebt hat und seine
des würfelförmigen Altars in Deli gefordert haben, damit die Hauptwirkungszeit um 300 v. Chr. lag).
18 1 Mathematik – eine Wissenschaft für sich

In den „Elementen“, die aus 17 Büchern (Kapiteln) bestehen, über schwimmende Körper (er hat das Auftriebsgesetz ent-
ist das mathematische Wissen der Vorgänger zusammenge- deckt), über Hebelgesetze und Schwerpunkte, ferner hat er
fasst, geordnet und gleichzeitg auch erweitert. Im Laufe der sich mit der Konstruktion von Flaschenzügen und Wasser-
Jahrhunderte sind unzählige Ausgaben erschienen. Die Ele- schrauben beschäftigt.
mente sind nach einer strengen Systematik aufgebaut. Sie
Unter weiteren Mathematikern der Alexandrinischen Peri-
enthalten: Definitionen, Postulate, Axiome, Probleme mit
ode ist vielleicht Aristarch von Samos (≈ 310–230 v. Chr.)
Lösungen, Sätze, Hilfssätze und deren Beweise. Das Axio-
zu nennen. Er war der Vertreter eines heliozentrischen Sy-
mensystem hat viele Schwächen und Inkonsistenzen, jedoch
stems, die Erde und die anderen Planten bewegen sich in
hat man es bei den Elementen wohl mit der ersten axiomatisch
Kreisbahnen um die Sonne (eine Vorstellung, die sogar von
aufgebauten Theorie zu tun. Wir wenden unser Augenmerk
Archimedes abgelehnt wurde). Ferner sei Eratosthenes von
auf das 5. Postulat:
Kyrene (≈ 276–195 v. Chr.) erwähnt, der den Erdumfang
5. „Und dass, wenn eine gerade Linie bei einem Schnitt mit durch Bestimmung des Sonnenwinkels in Assuan und Alex-
zwei geraden Linien bewirkt, dass innen auf derselben Seite andria mit ca. 46 000 km bestimmt hat (tatsächlicher Wert ca.
entstehende Winkel kleiner als zwei Rechte werden, dann die 40 075 km). Von Eratosthenes stammt auch das sogenannte
zwei geraden Linien bei Verlängerung ins Unendliche sich Sieb des Eratosthenes, eine Methode, alle Primzahlen bis zu
treffen auf der Seite, auf der die Winkel liegen, die zusammen einer vorgegebenen Schranke zu bestimmen.
kleiner als zwei Rechte sind“.
Als letzten dieser Reihe nennen wir Apollonios von Perge
Aus dem 5. Postulat folgt das berühmte Parallelenaxiom: Zu (265–170 v. Chr.), der sich umfassend mit Kegelschnit-
jeder Geraden g und einem Punkt P existiert (in der durch g ten beschäftigt hat und der auch durch den sogenannten
und P bestimmten Ebene) genau eine Gerade h, die durch P „Apollonios-Kreis“ bekannt ist. Mit Apollonios erlebte die
geht und zur Geraden g parallel ist. griechische Mathematik einen gewissen Abschluss, weil sich
der Machtmittelpunkt nach Rom verlagerte und die Weiter-
Vom Erscheinen der Elemente bis ins 19. Jahrhundert ha-
entwicklung der Wissenschaft kein zentrales Anliegen Roms
ben sich Mathematiker mit der Frage beschäftigt, ob man
war. Bedeutende mathematische Einzelleistungen in den Fol-
das Parallelenaxiom auch ohne Verwendung des 5. Postulats
gezeiten stammen von Hipparch von Nicäa (190–126 v. Chr.),
(das zum Parallelenaxiom gleichwertig ist) aus den übrigen
Heron von Alexandria (≈ 100 u. Z.) sowie Ptolemäus, der in
Axiomen folgern kann. Die Antwort ist „Nein“ und sie er-
seinem „Almagest“ die Lehren und Beobachtungen von sei-
folgte im 19. Jahrhundert unabhängig von
nem ptolemäischen Weltsystem zusammenfasste (Erde im
János Bolyai (1802–1860) und Mittelpunkt des Weltalls, Sonne, Planeten und Mond bewe-
Nikolai Lobatschewksi (1793–1856). gen sich auf Kreisbahnen um die Erde). Einer der bedeu-
tendsten Mathematiker des Altertums war ohne Zweifel Dio-
Sie gelten als Begründer der „nichteuklidischen“ (hyperbo-
phant von Alexandria (≈ 250 u. Z.). Sein Hauptwerk „Ma-
lischen) Geometrie.
thematika“ hatte starke Ausstrahlung auf die Neuzeit („Dio-
Die Beweisform von Euklid, die Aufteilung in Vorausset- phanti’sche Gleichungen“). Als letzten bedeutenden Mathe-
zung, Behauptung, Beweis, ist noch heute üblich. Der Satz matiker der Antike wird Pappus von Alexandria (≈ 320 u. Z.)
20 in Buch IX lautet: „Es gibt mehr Primzahlen als jede vor- betrachtet, dessen Hauptwerk die „mathematische Samm-
gelegte Anzahl von Primzahlen“. In unserer heutigen Ter- lung“ ist. Hypatia von Alexandria (um 400), die erste be-
minologie drücken wir das so aus: „Es gibt unendlich viele kannte Mathematikerin, erlitt ein tragisches Schicksal: Als
Primzahlen“. Nach Einschätzung von Experten sind die „Ele- Mitglied der neuen platonischen Schule geriet sie in Kon-
mente“ das einflussreichste Werk in der gesamten mathema- flikt mit fanatischen Christen und wurde von ihnen grausam
tischen Literatur. ermordet.
Der bedeutendste Mathematiker und das größte naturwissen- 395 (u. Z.) kam es zur Teilung des römischen Reiches in
schaftliche Genie der sogenannten Alexandrinischen Peri- Westreich (Ende 476) und Ostreich (Ende 1455). 529 wurde
ode (bis ≈ 150 n. Chr.) war jedoch Archimedes von Syrakus die platonische Akademie in Athen durch den römischen
287–212 v. Chr.). Er stammte aus Syrakus, studierte vermut- Kaiser Justinian gewaltsam geschlossen. Nachdem die Ma-
lich in Alexandria und wurde 212 in Syrakus von einem rö- thematikschule in Alexandria bereits um 415 erloschen war,
mischen Legionär ermordet. Er berechnete die Fläche von kennzeichnet das Jahr 529 den Untergang der antiken Mathe-
Kreisen, Ellipsen, Parabeln, die Volumina von Zylindern, matik in Griechenland, deren Tradition jedoch bis ca. 1400
Kegeln und Kugeln. Die geometrische Summenformel war in Byzanz gepflegt wurde.
ihm in einem Spezialfall geläufig. Er bewies die Ungleichung
630 zieht Mohammed (570–623) in seine Heimatstadt Mekka
3 10 10
71 < π < 3 70 . ein, seine Lehren begründen den Islam. Um 800 behandelt al-
Bei Archimedes finden sich erste Ansätze von Grenzwerten. Hwârâzmî aus Choraren (Gebiet um den Aralsee) als erster
Er entwickelte für die Armee von Syrakus technische Hilfs- islamischer Autor in seiner „Algebra“ Verfahren zur Auflö-
mittel, sodass Syrakus lange dem kriegerischen Ansturm der sung von Gleichungen (vorzugsweise lineare und quadrati-
Römer standhalten konnte. Archimedes verfasste Schriften sche Gleichungen).
1.4 Eine kurze Geschichte der Mathematik 19

Mittelalter Johannes von Gmunden (≈ 1384–1442),


Georg von Feuerbach (1423–1461),
Das Jahr 529 u. Z. markiert mit der Schließung der Philo- Johannes Müller (1436–1476) (genannt Regiomontanus).
sophenschule in Athen das Ende der hellenistischen Periode
und den Beginn der mittelalterlichen Periode der Mathema- Die Hauptleistungen dieser Mathematiker liegen auf dem Ge-
tik im europäisch-abendländischen Raum. Nach Ende des biet der Astronomie und der dafür notwendigen mathemati-
römischen Reiches versuchte die katholische Kirche die kul- schen Hilfsmittel, speziell der Trigonometrie.
turelle Tradition des römischen Reiches zu bewahren. In den
Mit dem beginnenden 16. Jahrhundert nahm die Zunft
Klöstern wurden Schriften vergangener Jahrhunderte, ins-
der Rechenmeister (Cossisten) einen enormen Aufschwung.
besondere die der Araber, ins Lateinische übersetzt und so
Adam Ries aus Staffelstein bei Bamberg veröffentlichte 1524
einem größerem Kreis von Lesern zugänglich gemacht, wo-
sein Algebralehrbuch „Coß“. Bedürfnisse des täglichen Le-
bei sich der französische Mönch Gerbert (940–1003), der
bens (Einkäufe auf dem Markt, kaufmännische Buchhaltung,
spätere Papst Sylvester II, besondere Verdienste erwarb. Von
Zinsrechnungen, etc.) machten es erforderlich, dass größere
ihm stammt auch die erste bekannte Abschrift des Abakus-
Bevölkerungskreise wenigstens mit den Grundrechenarten
Redmens. Im 12. und 13. Jahrhundert entwickelten italieni-
vertraut waren. Speziell diese wurden von den Rechenmei-
sche Städte wie Pisa, Florenz, Venedig, Mailand und Genua
stern gelehrt. Das Algebrabuch von Adam Ries erlebte 108
Handelsbeziehungen bis in den Nahen und Fernen Osten.
Auflagen und wurde bis ins 17. Jahrhundert nachgedruckt.
Wachsender Handel, Buchhaltung und Lagerhaltung erfor-
derten exakte Rechnungen. Mathematik, insbesondere in
Form von Rechnen und Messen, hatte wieder Konjunktur.
In Bologna (1119) und Padua (1222) wurden die ersten Uni-
versitäten gegründet, es folgten u. a. die Universitäten in Paris
(1214), Cambridge (1231), Prag (1348), Wien (1356), Hei-
delberg (1386), Köln (1388) und Erfurt (1392). Als bedeu-
tender Mathematiker dieser Periode ist Leonardo von Pisa
(≈ 1179–1250) zu nennen (genannt „Fibonacci“ = Sohn des
Bonacci). In seinem „liber abaci“ gibt er einen Überblick
über den Stand der Arithmetik und Algebra seiner Zeit. Er
rechnete systematisch mit arabischen Ziffern. Sein Werk bil-
dete die Grundlage für alle Rechenmeister und Algebraiker
der Folgezeit. In seinem „Practica Geometria“ behandelt Fi-
bonacci auch kubische Gleichungen. In diesem Werk treten Abbildung 1.17 Adam Ries.
auch die sogenannten „Fibonacci-Zahlen“ auf:

1, 1, 2, 3, 5, 8, 13, 21, . . . Ein weiterer bedeutender Rechenmeister in Deutschland war


Michael Stifel (≈ 1487–1567), sein Hauptwerk „Arithmetica
Jede Fibonacci-Zahl ist die Summe der beiden vorhergehen-
integra“ erschien 1544 in Nürnberg. Im Jahr 1545 erschien
den, die rekursive Definition lautet damit f1 = 1, f2 = 1 und
das von Gerolamo Cardano (1501–1576) verfasste Werk „Ars
fn+1 = fn + fn−1 (n ≥ 1). Die Fibonacci-Zahlen stehen in
magna sive de Regulis Algebraicis“. Es enthält Strategien zur
enger Verbindung zum „goldenen Schnitt“ (siehe Kapitel 8
Lösung von Gleichungen dritten und vierten Grades, die auf
und 14.)
Ergebnissen von Nicolo Tartaglia (≈ 1506–1559) und Sci-
pione del Ferro (≈ 1465–1525) zurückgehen. Rafael Bom-
Renaissance belli (1526–1572) rechnete unbefangen mit Wurzeln aus ne-
gativen Zahlen und stellte Regeln für das Rechnen mit ihnen
Die Zeit ab ca. 1400 nennt man in Europa Renaissance. auf. Man kann seine Regeln als Vorstufe des Rechnens mit
Es war tatsächlich nicht nur eine Wiedergeburt der wis- komplexen Zahlen betrachten (vgl. auch die Hintergrundbox
senschaftlichen und kulturellen Werke der Antike, sondern auf Seite 144 in Kapitel 4).
neue Technologien und Theorien wurden entwickelt. Dabei
Zu einer Revolution des astronomischen Weltbildes kam es
spielte die Erfindung der Buchdruckkunst durch Gutenberg
1543 mit der Veröffentlichung von „De Revolutionibus Or-
(um 1445) eine wesentliche Rolle. Sie ermöglichte eine we-
bium Coelestium“, dem Hauptwerk von Nikolaus Koperni-
sentlich schnellere Verbreitung von Information. Doch bis
kus (1423–1543). Aufgrund von Rechnungen und Beobach-
die ersten mathematischen Werke in Druck gingen, dauerte
tungen kam Kopernikus zum Schluss, dass sein heliozen-
es noch Jahrzehnte.
trisches System (die Sonne ist Mittelpunkt des Planetensy-
In der Frühzeit der Renaissance war die Universität Wien das stems) mit der Realität wesentlich besser vereinbar ist als
Weltzentrum der Mathematik. Im 15. Jahrhundert wirkten das geozentrische System des Ptolomäus. Er schloss damit
dort drei bedeutende Gelehrte: an Vorstellungen von Aristarchos von Samos (≈ 310–230
20 1 Mathematik – eine Wissenschaft für sich

v. Chr.) an. Das Werk von Kopernikus wurde 1616 von der meln beschrieb und sie rational zu erklären versuchte, und
katholischen Kirche auf den Index gesetzt. analog Johannes Kepler (1571–1630) die Himmelsmecha-
nik.
François Viète (1540–1603) (lat. Franciscus Vieta) propa-
gierte im Anschluss an die Cardani’schen Formeln das Rech- In die beschriebene Periode fällt auch die Entwicklung von
nen mit Buchstaben. Bekannt ist der nach ihm bekannte Rechenhilfsmitteln, z. B. die für die Navigation und Astro-
„Wurzelsatz“: Hat die Gleichung x 2 + px + q = 0 die Lö- nomie außerordentlich nützlichen Logarithmen u. a. durch
sungen (Wurzeln) x1 und x2 , dann ist p = −(x1 + x2 ) und John Napier (1550–1617), Michael Stifel (ca. 1487–1567)
q = x1 x2 . Hiervon gibt es Verallgemeinerungen auf Poly- und Henry Briggs (1561–1630).
nome höheren Grades. In die Barockzeit (ca. 1570–1770) fallen auch die Untersu-
Das x in Gleichungen geht auf René Descartes (1596–1650) chungen von Pierre de Fermat (1607–1665) zur Zahlentheo-
zurück. rie. Fermat beschäftigte sich intensiv mit Diophants „Arith-
metica“. Fermat war von Beruf Jurist, aber leidenschaftlicher
Hobby-Mathematiker. Er vermutete, dass Zahlen der Gestalt
n
Fn = 22 + 1, n ∈ N, stets Primzahlen sind. Das trifft für
F0 = 3, F1 = 5, F2 = 17, F3 = 257 und F4 = 65537
tatsächlich zu, aber bis jetzt wurde kein weiteres n gefunden,
für das Fn eine Primzahl ist. Zahlreiche Sätze und Methoden
der „Elementaren Zahlentheorie“ gehen auf Fermat zurück,
z. B. der sogenannte kleine Fermat’sche Satz, dass für eine
ganze Zahl a, die nicht durch die Primzahl p teilbar ist, stets
p ein Teiler von a p−1 − 1 ist. Bekannt für eine größere Öf-
fentlichkeit wurde Fermat, als 1994 von Andrew Wiles sein
„letzter Satz“ bewiesen wurde: Für n ∈ N, n ≥ 3 besitzt die
Gleichung
x n + y n = zn
Abbildung 1.18 René Descartes (1596–1650) nach einem Gemälde von Franz
Hals, 1648. keine Lösungen x, y, z ∈ N. Von der Aufstellung der Ver-
mutung, dass der Satz richtig sein könnte, bis zum Beweis
Er gilt als Begründer der neuzeitlichen Philosophie. Er kom- hat es ca. 350 Jahre gedauert. Fermat gilt neben Blaise Pascal
binierte Algebra mit Geometrie und begründete die „ana- (1623–1663) auch als einer der Begründer der Wahrschein-
lytische Geometrie“. Kartesische Koordinaten haben beson- lichkeitstheorie.
ders angenehme Eigenschaften. Mit seiner Existenzphiloso-
phie stellte er sich in einen krassen Gegensatz zu den Leh-
ren der katholischen Kirche. Er wurde von dieser und später Aufklärung
auch von der evangelischen Kirche massiv befehdet. Auch
seine Übersiedlung in die als liberal geltenden Niederlande Während Galileo Galilei noch im Jahr 1633 durch die Inqui-
(1628/29) stand unter keinem guten Stern. Nachdem Galilei sition verurteilt wurde, war das 17. Jahrhundert geprägt von
durch die katholische Kirche zum Widerruf gezwungen wor- einem fortschreitenden Rationalismus. Der Glaube an kirch-
den war, wurde auch in den Niederlanden Kopernikus’ Schrift liche und staatliche Autoritäten wurde immer stärker hinter-
auf den Index gesetzt und die Verbreitung des kopernikani- fragt. Das heliozentrische Weltbild setzte sich durch. Fort-
schen Weltbildes untersagt. Die Philosophie von Descartes schritte auf dem Gebiet der Mathematik und Physik waren
wurde 1642 von einem Expertengremium verworfen, weil sie dabei wesentlich. Man beachte aber, dass das 17. Jahrhun-
im Gegensatz zur offiziellen Theologie stehen würde. Seine dert ein „dunkles Jahrhundert“ war. Der dreißigjährige Krieg
Schriften wurden 1667 von der katholischen Kirche auf den (1618–1648), den die europäischen Staaten auf deutschem
Index gesetzt. Im Oktober 1649 folgte Descartes einem Ruf Territorium austrugen, die Kriege Ludwigs XIV, die Tür-
der für die Wissenschaften aufgeschlossenen schwedischen kenkriege (1683–1689), der englisch-niederländische Krieg
Königin Christine an den Königshof in Stockholm. Das Pro- (1665–1667) boten nicht gerade ideale Voraussetzungen für
jekt, in Stockholm eine Akademie der Wissenschaften zu die Weiterentwicklung der Mathematik und der Naturwissen-
gründen, konnte er nicht mehr realisieren, da er bereits am schaften. Daher ist es umso erstaunlicher, dass im Zeitraum
11. Februar 1650 verstarb. von 1620/30 bis etwa 1730/40 eine quasi revolutionäre Ent-
wicklung und ein Umschwung stattfand, der sowohl die Ziele
Der mehr als Maler denn als Mathematiker bekannte Albrecht als auch die Methoden betraf.
Dürer (1471–1528) verfasste ein Lehrbuch über die Perspek-
Man kann René Descartes und Pierre de Fermat schon zu die-
tive, in der sich viele Elemente der „projektiven Geometrie“
ser Epoche rechnen, die Hauptleistung war aber zweifelsohne
finden.
die Entstehung und der Ausbau des „Calculus“, des forma-
Galileo Galilei (1564–1642) begründete die Experimental- len Apparats der Differenzial- und Integralrechnung („Infi-
physik, indem er Naturphänomene mit mathematischen For- nitesimalrechnung“). Aufbauend auf schon auf Archimedes
1.4 Eine kurze Geschichte der Mathematik 21

zurückgehende Überlegungen und auf Vorarbeiten von Kep- Lösung einer Differenzialgleichung. Sein berühmtes, für die
ler und Cavalieri (≈ 1598–1647), John Wallis (1616–1703) Physik grundlegendes, Werk „Philosophiae Naturalis Prin-
und Isaac Barrow (1630–1677) schufen unabhängig von- cipia Mathematica“ (London 1687) macht jedoch von der
einander Isaac Newton (1643–1727) und Gottfried Wilhelm Fluenten- und Fluxionsrechnung keinen Gebrauch.
Leibniz (1646–1716) den „Calculus“. Mit der Beherrschung
Um 1685 kam es zwischen Newton und Leibniz zu einem
von Grenzprozessen konnte man eine große Fülle mathe-
heftigen Prioritätenstreit um die Entdeckung der Infinitesi-
matischer, naturwissenschaftlicher und praktischer Probleme
malrechnung. Leibniz kam auf die Integralrechnung bei der
lösen, manchmal auch nur mit Mühen.
Berechnung von Flächeninhalten von ebenen Figuren und
auf die Differenzialrechnung durch das Problem, Tangen-
ten
an gegebene Kurven zu berechnen. Das Integralsymbol
„ “ stammt von Leibniz, es erinnert an ein Summenzeichen.
Experten gehen heute davon aus, dass Newton und Leib-
niz die Infinitesimalrechnung unabhängig voneinander ent-
wickelt haben. Als Aufseher und Direktor der Münze in Lon-
don wurde Newton zum Schrecken der Geldfälscher. 1703
wurde Newton Präsident der berühmten Royal Society. Die-
ses Amt hatte er bis zu seinem Tod im Jahr 1727 inne.
Leibniz gilt als einer der letzten Universalgelehrten. Er war
nicht nur Mathematiker, sondern auch Philosoph, Theologe,
Biologe, Physiker und Techniker. Sein Wahlspruch für die
Mathematik war „Theoria cum Praxi“, sein Wahlspruch für
die Philosophie „Nihil sine Ratione“. Seine Vielseitigkeit be-
Abbildung 1.19 Isaac Newton (1643–1727). wies er mit der Entwicklung einer Rechenmaschine. Er war
ein Verfechter des Dualsystems (Zahldarstellung mit der Ba-
sis 2) und er konstruierte wichtige produktionsverbessernde
Maschinen für den Bergbau. Auf das Betreiben von G. W.
Leibniz wurde 1700 die „Berliner Societät der Wissenschaf-
ten“ gegründet, aus der die Berliner Akademie der Wis-
senschaften hervorgegangen ist. Seine Beiträge zur Deter-
minantentheorie lernen Studierende der Mathematik im er-
sten Semester kennen (Leibniz’sche Determinantenformel).
Durch persönlichen Kontakt mit dem russischen Zaren Peter I
(1672–1725) hatte Leibniz auch einen wesentlichen Einfluss
auf die Gründung der Akademie der Wissenschaften in St.
Petersburg (1724).
Zum weiteren Ausbau des Calculus trugen die Mitglieder
der Baseler Mathematikerfamilie Bernoulli wesentlich bei,
insbesondere die Brüder Jakob (1655–1705) und Johann
Abbildung 1.20 Gottfried Wilhelm Leibniz (1646–1716).
(1667–1748). Beide lieferten auch wichtige Beiträge zur
Wahrscheinlichkeitsrechnung. Johann Bernoulli war außer-
1665/1666 war der Süden Englands von einer Pestepidemie
dem Lehrer von Leonard Euler (1707–1783), der alle über-
betroffen, allein in London starben fast 50 000 Menschen.
ragende Mathematiker der Blütezeit der Aufklärung. Mit
Newton verbrachte diese Zeit in seinem Geburtsort Woolst-
20 Jahren verließ er seine Heimatstadt Basel, um einen Ruf
horpe nahe der Stadt Grantham an der Ostküste Mitteleng-
an die Akademie in St. Petersburg anzunehmen. Euler war
lands. Während dieser Zeit entdeckte er die binomische
ungemein produktiv, im Jahr soll er etwa 800 Seiten ge-
Reihe, die Grundideen der Differenzialrechnung, das 1/r 2 -
schrieben haben. Von 1741–1764 wirkte Euler an der Ber-
Gesetz der Gravitation und die Spektralzerlegung des Lichts.
liner Akademie, kehrte aber wegen Differenzen mit Fried-
Unter dem Titel „Methodus Fluxionum et Serierum Infinita-
rich II (dem Großen) wieder nach St. Petersburg zurück.
rum“ veröffentlichte er 1671 eine schon relativ ausgefeilte
Durch eine Augenkrankheit erblindete er vollkommen, dik-
Darstellung der Differenzial- und Integralrechnung, in der
tierte aber dann seine Arbeiten einem Schreiber.
er erkannt hat, dass Differenziation und Integration Um-
kehroperationen voneinander sind. Fluenten sind physika- Euler war äußerst vielseitig, er vertiefte fast alle Zweige der
lische Größen, die von der Zeit abhängen, Fluxionen ihre Mathematik, insbesondere aber die Analysis und Zahlen-
Geschwindigkeiten. Die Fluxion einer Fluxion ist also die theorie. Die Basis e ≈ 2.718 281 828 (Euler’sche Zahl) der
Beschleunigung. Das Problem, eine Fluente zu einer gege- natürlichen Logarithmen berechnete er schon bis auf 23 Stel-
ben Fluxion zu bestimmen entspricht der Integration bzw. der len. Er propagierte das Rechnen mit komplexen Zahlen (wenn
22 1 Mathematik – eine Wissenschaft für sich

1826 hatte er die Nichtauflösbarkeit der allgemeinen Glei-


chung 5. Grades bewiesen. Er hatte erkannt, dass durch die
Umkehrung elliptischer Integrale doppeltperiodische Funk-
tionen entstehen (C. F. Gauß hat dies auch entdeckt, aber nicht
publiziert). Aus der Analysis geläufig ist der abelsche Grenz-
wertsatz und aus der Theorie der elliptischen Funktionen das
„abelsche Theorem“. Abelsche Gruppen sind so selbstver-
ständlich, dass man gar nicht mehr an N. H. Abel denkt, son-
dern „abelsch“ mit „kommutativ“ gleichsetzt. Die Verallge-
meinerung des Begriffs der elliptischen Funktion auf Funk-
tionen mehrerer Variablen führt auf den Begriff der abelschen
Funktion.
Évariste Galois (1811–1832) konnte die Lösungen seiner Po-
lynomgleichungen in Zusammenhang bringen mit Permuta-
Abbildung 1.21 Leonard Euler (1707–1783). tionen der Lösungen, die eine Gruppe bilden, die sogenannte
Galois-Gruppe. Damit war der Begriff der Gruppe geboren.
Neben den Arbeiten von Abel und Galois, der 1832 im Alter
ihm dabei auch manchmal Fehler√ unterliefen), er führte 1777 von nicht mal 21 Jahren bei einem Duell ums Leben kam,
für das bis dahin gebrauchte −1 die Bezeichnung i ein beeinflussten vor allem die 1801 erschienenen Disquisitio-
(i2 = −1). Seine Untersuchungen zur Kombinatorik und nes Arithmeticae von C.F. Gauß die weitere Entwicklung der
Wahrscheinlichkeitstheorie sind heute noch Grundlage für Mathematik, wobei es auch viele vergebliche Versuche gab,
die Berechnung von Lebensversicherungen. die Fermat’sche Vermutung aus dem Jahre 1637 zu beweisen.
Als Zeitgenossen von Euler seien noch der französische
Mathematiker Rond d’Alembert (um 1750) und die „drei
großen L“:
Joseph Louis Lagrange (1736–1813),
Pierre Simon Laplace (1749–1827) und
Adrien Marie Legendre (1752–1833)
genannt. Lagrange gilt als einer der Begründer der Variati-
onsrechnung, er lieferte wichtige Beiträge zur Infinitesimal-
rechnung, zur Himmelsmechanik, er propagierte die Benut-
zung von Potenzreihen. Laplace lieferte Beiträge zur Theorie
der partiellen Differenzialgleichungen (Laplace-Operator), Abbildung 1.22 C. F. Gauß(1777–1855).

zur Theorie der Kugelfunktionen, zur Integraltransforma-


Schon zu seinen Lebzeiten galt C. F. Gauß (1777–1855) als
tionen (Laplace-Transformation) und zur Wahrscheinlich-
„Fürst der Mathematiker“ („Princeps Mathematicorum“). Er
keitstheorie („Laplace’scher Dämon“). Von Legendre stam-
vermutete im Alter von 14 Jahren, dass die Anzahl der Prim-
men wichtige Beiträge zur Himmelsmechanik, Variations-
zahlen unterhalb einer natürlichen Zahl durch logn n approxi-
und Ausgleichsrechnung, sowie zur Theorie der elliptischen
miert werden kann, wenn n hinreichend groß ist. Er lieferte
Integrale, zu Grundlagen der Geometrie und Zahlentheorie
mehrere Beweise des Fundamentalsatzes der Algebra, er cha-
(„Legendre-Symbol“).
rakterisierte die natürlichen Zahlen, für welche das regelmä-
ßige n-Eck mit Zirkel und Lineal konstruierbar ist. Mit dem
Das 19. Jahrhundert Erscheinen des „Disquisitiones Arithmeticae“ wurde Gauß
weltberühmt. Er entwickelte die Methode der Ausgleichs-
Mit Lagrange, Laplace und Legendre haben wir die Schwelle gleichung, mit deren Hilfe es gelang, den Planetoiden Ceres
zum 19. Jahrhundert überschritten und sind in die Welt der wiederzuentdecken. Es gibt kaum ein Gebiet in der Mathe-
mathematischen Abstraktion eingetreten. Die Arbeit von La- matik, das er nicht beherrschte, und zu zahlreichen Gebieten
grange über algebraische Gleichungen wurde von dem nor- hat er wegweisende Beiträge geleistet. Jedem Studierenden
wegischen Mathematiker Nils Henrik Abel (1802–1829) ver- sind die komplexen Zahlen und ihre Veranschaulichung in der
sehentlich erweitert. Seine Lebensgeschichte war eher tra- Gauß’schen Zahlenebene geläufig. Er führte 1831 den Begriff
gisch, er war ständig von Krankheit, Armut und unglückli- „komplexe Zahl“ ein. Die volle Akzeptanz der komplexen
chen Umständen verfolgt. Als es A. L. Crelle, dem Begrün- Zahlen in der Mathematik ist sicherlich auch sein Verdienst.
der des „Journals für die reine und angewandte Mathematik“, Sei Motto war „Die Theorie zieht die Praxis an, wie der Ma-
endlich gelungen war, für N. H. Abel eine Dauerstelle an der gnet das Eisen“. Die Gauß’sche Normalverteilung und das
Berliner Universität durchzusetzen, war Abel wenige Tage Bild von Gauß findet sich auf den bis 2001 gültigen 10-DM-
zuvor an Tuberkulose gestorben. Scheinen (Abb. 1.22). Er erfand mit Weber einen Telegrafen
1.4 Eine kurze Geschichte der Mathematik 23

und verbesserte die Konstruktion von Fernrohren. Auf seinen tionen“ genannt, später wurde die Bezeichnung umgedreht.
bei der Vermessung des Königreichs Hannover entstanden Die Reihendarstellung für die Weierstraß’sche ℘-Funktion
geometrische Überlegungen entwickelte er die Anfänge der findet sich schon 1847 bei G. Eisenstein (1823–1852).
Differenzialgeometrie. C. F. Gauß hat mit seinen „Disquisi-
Die weitere Entwicklung der komplexen Analysis im
tiones Arithmeticae“ die Mathematik des 19. Jahrhunderts,
19. Jahrhundert steht in engem Zusammenhang mit Proble-
insbesondere die Zahlentheorie, in der man auch unentwegt
men der Zahlentheorie. Die von A. M. Legendre und C. F.
versuchte, die Fermat’sche Vermutung aus dem Jahr 1637 zu
Gauß vermutete Formel
beweisen, wesentlich beeinflusst.
π(n)
War bis dato das Lösen von Gleichungen der Hauptgegen- lim n =1
n→∞
stand der Algebra, so entwickelte sich die Algebra zu einem log n
Gebiet, in welchem algebraische Strukturen wie Gruppen,
für die Anzahl π(n) der Primzahlen unterhalb n wurde 1896
Ringe, Körper, Vektorräume und Moduln im Mittelpunkt des
von dem französischen Mathematiker Jacques Hadamard
Interesses standen.
(1865–1963) und dem belgischen Mathematiker Charles De
Wir haben schon darauf hingewiesen, dass Euklids Paralle- la Vallée Poussin (1866–1962) unabhängig voneinander be-
lenaxiom (das fünfte Postulat) nicht aus den vier anderen wiesen. Bernhard Riemann war in seiner berühmten Arbeit
Axiomen abgeleitet werden kann. Der russische Mathemati- „Über die Anzahl der Primzahlen unter einer gegebenen Grö-
ker Nikolai Ivanowitsch Lobatschewski (1793–1856) und der ße“ nahe an einem Beweis. Die von Riemann aufgestellte Ver-
ungarische Mathematiker János Bolyai (1802–1860) stellten mutung, dass die Nullstellen der nach ihm benannten Zeta-
um 1830 Modelle für Geometrien vor, die nicht das fünfte Funktion in der rechten Halbebene alle den Realteil 21 haben,
Postulat erfüllten. Gauß war ein solches Modell vermutlich ist bis heute unbewiesen (siehe auch Millenniumprobleme).
auch geläufig. Bernhard Riemann (1826–1866) entwickelte
Richard Dedekind (1831–1916) war bei der Vorbereitung
die Ideen – aufbauend auf den Ideen von Gauß – weiter und
einer Vorlesung über Infinitesimalrechnung im Herbst 1858
begründete nach der Pionierarbeit von Gauß damit die Diffe-
am damaligen eidgenössischen Polytechnikum Zürich (heute
renzialgeometrie. Felix Klein (1849–1925) verwendete 1872
ETH) aufgefallen, dass eigentlich noch niemand die Existenz
den Gruppenbegriff zur Klassifikation der verschiedenen Ar-
der reellen Zahlen bewiesen hatte. Mit seinen beiden Schrif-
ten von Geometrien. David Hilbert (1862–1943) begründete
ten „Stetigkeit und irrationale Zahlen“ (1872) und „Was sind
die euklidische Geometrie in seinem Buch „Grundlagen der
und was sollen die Zahlen“ (1887) leistete er wesentliche
Geometrie“ (1899) axiomatisch.
Beiträge zur logisch arithmetischen Konstruktion der reellen
Das 19. Jahrhundert war gekennzeichnet durch die Exak- Zahlen (ohne Gebrauch der Intuition). Fast zeitgleich mit De-
tifizierung der Begriffe der Analysis. Bernhard Bolzano dekind lieferten K. Weierstraß, Charles Méray (1835–1911)
(1781–1848) formulierte als erster das heute als Cauchy- und Georg Cantor (1845–1918) entsprechende Konstruktio-
Kriterium bekannte Konvergenzkriterium für die Konvergenz nen der reellen Zahlen. Cantors Arbeit zur Theorie von un-
von (Funktionen-)Folgen. Er formulierte 1817 den nach ihm endlichen Mengen um die Wende vom 19. zum 20. Jahrhun-
benannten Nullstellensatz für stetige Funktionen und gab als dert war auch ein wichtiger Meilenstein für die Analysis.
erster eine auf ganz R definierte stetige Funktion an, die in
Kennzeichnend für die Mathematik des 19. Jahrhunderts war
keinem Punkt differenzierbar ist. Dagegen glaubte der be-
vielleicht auch ihre Anwendungsbezogenheit. Die Theorie
kanntere französische Mathematiker Augustin-Louis Cauchy
der Wärmeausbreitung in Festkörpern wurde von Joseph
(1789–1857) noch, dass jede stetige Funktion auf R auch
Fourier (1768–1830) in seinem „Théorie de la chaleur“ 1807
differenzierbar ist. Seine formalen Definitionen zum Konver-
entwickelt. Fourier schuf die Grundlage der Theorie, die man
genzbegriff für Folgen und Reihen und zum Stetigkeitsbegriff
heute „Fourieranalyse“ nennt. Im Zusammenhang mit Ar-
finden sich in seinem berühmten „Cours d’Analyse“ aus dem
beiten in der Hydrodynamik und Elektrodynamik bewies der
Collège de France um 1820. Ein expliziter ε-δ-Beweis findet
englische Mathematiker und Physiker George Gabriel Stokes
sich lediglich beim Beweis des Mittelwertsatzes der Diffe-
(1819–1903) um 1850 den berühmten Stokes’schen Integral-
renzialrechnung. Cauchy ist jedoch ein Wegbereiter für die
satz.
neue Strenge in der Analysis. Eine exakte arithmetische Be-
gründung für das Rechnen mit Grenzwerten ist der Verdienst Eine Fülle neuer Ideen und mathematischer Methoden ent-
von Karl Weierstraß (1815–1897). wickelte Laplace um 1812. Fehlertheorie, statistische Mecha-
nik und Versicherungsmathematik sind Weiterentwicklungen
Cauchy und Weierstraß gelten als Begründer der „komplexen
der ursprünglich nur auf die Analyse von Glücksspielen kon-
Analysis“, die man im deutschen Sprachraum auch „Funk-
zentrierten Überlegungen von Laplace.
tionentheorie“ nennt. Zu deren Stammvätern ist auch Bern-
hard Riemann (1826–1866) zu zählen, der im Wettstreit mit Der norwegische Mathematiker Sophus Lie (1842–1899) be-
Carl Gustav Jacob Jacobi (1804–1851) auch die Theorie der gründete in seinen Arbeiten über Differenzialgleichungen die
elliptischen Integrale entwickelt hat. Die Umkehrung der el- heute nach ihm benannte Theorie der Lie-Gruppen, die z. B.
liptischen Integrale sind elliptische Funktionen. Historisch bei der Klassifikation von Elementarteilchen von Bedeutung
hat man zuerst die elliptischen Integrale „elliptische Funk- sind.
24 1 Mathematik – eine Wissenschaft für sich

Die Mathematik im 20. Jahrhundert ganz Deutschland wurden Mathematiker und Mathematike-
rinnen mit jüdischen Wurzeln entlassen oder zur vorzeiti-
Auf dem internationalen Mathematikerkongress in Paris im gen Emeritierung gezwungen. Besonders schwer traf es die
Jahr 1900 stellte David Hilbert seine 23 Probleme vor, wel- Universität Göttingen, an der auch David Hilbert seit 1895
che die Entwicklung der Mathematik im 20. Jahrhundert we- ordentlicher Professor war. Emmy Noether, Emil Artin, Her-
sentlich beeinflussen sollten. Nicht alle diese Probleme sind mann Weil, Richard Courant, Paul Bemays, Carl Ludwig Sie-
bis heute gelöst. Der entsprechende Wikipedia-Artikel gibt gel emigrierten ins Ausland, meist in die USA. Der Zahlen-
einen guten Überblick. Ostwalds Klassiker der exakten Wis- theoretiker Edmund Landau wurde seiner Ämter enthoben.
senschaften Band 252 „Die Hilbert’schen Probleme“ ist eine
hervorragende Referenz. Hilberts Traum, die gesamte Mathematik auf logischen Axio-
men aufzubauen, wurde endgültig durch den Unvollständig-
Wir gehen auf einige dieser Probleme etwas näher ein: Die keitssatz von Gödel (1931) und die Ergebnisse von Paul Co-
Fragestellung im 1. Hilbert’schen Problem lautet: Gibt es eine hen (1960/61) zerstört. Sowohl die Kontinuumshypothese als
Teilmenge von R, die überabzählbar ist und deren Mächtig- auch das sogenannte Auswahlaxiom, das in viele mathema-
keit (Kardinalitätszahl) echt kleiner ist als die der reellen tische Konstruktionen und Ergebnisse einfließt, können we-
Zahlen? Dass es eine solche Teilmenge nicht gibt, bezeich- der aus den Axiomen der von S. Zermelo und Paul Fraenkel
net man als Kontinuumshypothese (vergl. die Ausführungen entwickelten Mengenlehre bewiesen noch widerlegt werden.
in Kap. 4). Kurt Gödel hat 1938 gezeigt, dass die Verneinung Das ZF-System (ZF steht für Zermelo-Fraenkel) ist unvoll-
der Kontinuumshypothese nicht aus den üblichen Axiomen ständig und wird durch Hinzunahme des Auswahlaxioms
der Mengenlehre, dem ZFC-Axiomensystem beweisbar ist. zum ZFC-System (C für Axiom of Choice) ergänzt. Hilbert
1963/64 bewies P. Cohen (1934–2007), dass auch die Konti- beschäftigte sich von den philosophischen Grundlagen der
nuumshypothese selbst nicht aus dem ZFC-Axiomensystem Mathematik mit fast allen Fragen der Mathematik und ihren
beweisbar ist. Das Problem hängt unmittelbar zusammen mit Anwendungen, insbesondere in der Physik. Der Begriff des
dem 2. Hilbert’schen Problem: Sind die Axiome der Arith- „Hilbert-Raums“ ist für die Mathematik und ihre Anwendun-
metik widerspruchsfrei? gen von fundamentaler Bedeutung und sein Name sozusagen
Das 6. Problem stellt die Frage: Wie kann die Physik axio- verewigt.
matisiert werden? Gewisse Teilgebiete der Physik, z. B. die
Obwohl der zweite Weltkrieg (1939–1945) unendliches Leid
Quantenmechanik können axiomatisch behandelt werden,
über viele Völker der Welt gebracht hat, trug er auch zum
eine allgemeine axiomatische Darstellung der gesamten Phy-
Fortschritt der Wissenschaften bei. Alan Turing (1912–1954)
sik ist aber in weiter Ferne.
konnte mithilfe der von ihm entwickelten Automaten- und
Das 7. Hilbert’sche Problem stellt die Frage: Ist α β immer Algorithmentheorie universell einsetzbare Automaten (heute
transzendent, wenn α algebraisch (α  = 0, α  = 1) und β Turingmaschinen) entwickeln. Mit ihrer Hilfe gelang es
irrational und algebraisch ist? Alexander Gelfond (1934) und ihm und anderen Wissenschaftlern, den Verschlüsselungs-
Theodor Schneider

(1935 ) beantworteten die Frage mit „ja“, code der deutschen Verschlüsselungsmaschine Enigma ab
so ist z. B. 2 2 eine transzendente Zahl. 1943 zu knacken, der insbesondere auch in der Kommuni-
kation mit U-Booten eingesetzt wurde. Manche Historiker
Das 8. Hilbert’sche Problem enthält die von Bernhard Rie- sind der Meinung, dass die Entschlüsselung des Enigma-
mann (1826–1866) gestellte Frage, ob die Nullstellen der Codes ein wichtigen Beitrag zur Beendigung des zweiten
Riemann’schen ζ -Funktion in der Halbebene Re (s) > 0 alle Weltkriegs war. Nachdem Konrad Zuse (1910–1995) 1936
den Realteil 21 haben. Bekannte Nullstellen in dieser Halb- den ersten mechanischen Computer gebaut hatte, wurden
ebene haben den Realteil 21 . Mit Computereinsatz hat man im Zusammenhang mit dem Bau der ersten Atombombe
auch Zahlen 21 +it, t ∈ R, t < 1012 , getestet und nachgewie- (sog. „Manhattan-Projekt“) auch erste leistungsfähige elek-
sen, dass die Riemann’sche Vermutung für diese Zahlen rich- tronische Röhrenmaschinen entwickelt, mit denen die am
tig ist. Ein allgemeiner Beweis steht aber nach wie vor aus. Manhattan-Projekt beteiligten Mathematiker umfangreiche
Von den 23 Hilbert’schen Problemen hat die Clay-Foundation Simulationsrechnungen durchführen konnten.
die „Riemann’sche Vermutung“ in die sieben Millennium-
Probleme aufgenommen (siehe 21. Jahrhundert). Große Fortschritte während des 20. Jahrhunderts konnten
die klassischen mathematischen Gebiete Algebra, Geometrie
Die Wahrscheinlichkeitstheorie wurde 1933 von dem rus-
und Analysis aufweisen, die sich in viele, manchmal sehr ab-
sischen Mathematiker A. N. Kolmogorov axiomatisiert, was
strakte Richtungen weiterentwickelten. Die theoretische Ma-
bereits von Hilbert angemahnt worden war. Die Modellierung
thematik erhielt u. a. wesentliche Impulse durch die Entwick-
des Zufalls nimmt heute insbesondere in den Anwendungen
lung der Garbentheorie, der Kategorien und Funktoren, der
ein bedeutende Rolle ein.
Theorie der Faserbündel, der homologischen Algebra und der
War bis 1933 die Universität Göttingen ein Weltzentrum der Kohomologietheorie. Die von John von Neumann und Os-
Mathematik – vielleicht sogar das Weltzentrum der Mathe- car Morgenstern entwickelte Spieltheorie fand wichtige An-
matik – so änderte sich die Situation nach der Machtergrei- wendungen, z. B. in der Ökonomie. Die Optimierungstheo-
fung der Nationalsozialisten im Jahr 1933 schlagartig. In rie wurde wesentlich weiterentwickelt. Große Fortschritte
1.4 Eine kurze Geschichte der Mathematik 25

gab es auf dem Gebiet der partiellen Differenzialgleichun- Primzahlen – früher für viele ein exotisches Gebiet der theo-
gen und dynamischen Systeme. Wichtige Fortschritte gab es retischen Mathematik – gewannen an Bedeutung für die Ge-
auch in den Bereichen Wahrscheinlichkeitstheorie und Sta- winnung optimaler Codes und für die Kryptographie.
tistik. Immer wieder fand man auch unbekannte Zusammen-
hänge zwischen abstrakten mathematischen Theorien und
physikalischen Anwendungen, z. B. der abstrakt entwickel-
ten Theorie der Topologie vierdimensionaler Mannigfaltig-
keiten und der Theorie der Elementarteilchen (Quarks, Eich-
Theorien, Yang-Mills-Gleichung). Durch diese Zusammen-
hänge wurde ab 1980 ein reger Austausch zwischen Mathe-
matik und theoretischer Physik eingeleitet.

Dem Computereinsatz kam eine immer größere Bedeutung


zu. Der Beweis des sogenannten Vier-Farben-Satzes durch
Appel und Haken im Jahr 1976 ist ein solches Beispiel. Von
zahlreichen Mathematikern wurde der Beweis aber nicht an-
erkannt, weil die Reduzierung auf spezielle Konfigurationen
Fehler aufwies. 1996 lieferten Daniel P. Sanders, Paul Sey-
mour und Robin Thomas einen transparenteren Beweis des Abbildung 1.23 Andrew Wiles (geb. 1953).
Vier-Farben-Satzes. Auch bei der Klassifikation der endli-
chen einfachen Gruppen war der Computer ein unersetzliches Kennzeichnend für die Mathematik im 20. Jahrhundert war
Hilfsmittel. Über 40 Jahre haben sich über 100 Mathemati- vielleicht, dass trotz großer Weiterentwicklung in Richtung
ker mit diesem Problem beschäftigt, aber es hat von 1980 bis Abstraktion tiefliegende Zusammenhänge zwischen einzel-
2004 gedauert, bis der Beweis letztlich akzeptiert wurde. nen Teilgebieten der Mathematik und der theoretischen Phy-
sik entdeckt wurden. So erhielten Atiyah und Singer 2004 den
Obsthändler wussten schon immer, wie man optimal Oran- Abelpreis für ihre Arbeiten. Der Abelpreis, der 2003 anläs-
gen stapelt, sehr früh wussten auch Militärs, wie man Ge- slich des 200. Geburtstages von N. H. Abel gestiftet wurde,
schosskugeln platzsparend lagert. In seinem Buch „Vom ist die höchstdotierte Auszeichnung (≈ 750.000 Euro) für au-
sechseckigen Schnee“ hat Johannes Kepler eine pyrami- ßergewöhnliche wissenschaftliche Leistungen auf dem Ge-
denförmige Anordnung der Kugeln beschrieben, die genau biet der Mathematik. Als „Nobelpreis der Mathematik“ gilt
π
√ ·100 Prozent des Gesamtvolumens der Pyramide ausma- jedoch die Fields-Medaille, die als einziger Deutscher bisher
3 2
chen (das bedeutet ≈ 74.048 Prozent). Dass es keine dichtere Gerd Faltings (geb. 1954) im Jahr 1986 für seinen Beweis der
Kugelpackung gibt, ist die sogenannte Kepler’sche Vermu- Mordell’schen Vermutung für diophantische Gleichungen er-
tung, deren mögliche Lösung 1998 von Tom Hales ange- halten hat. Der Preisträger darf nicht älter als 40 Jahre sein,
kündigt wurde. Der Knackpunkt war wieder der Computer- Wiles hatte 1994 diese Altersgrenze gerade überschritten.
einsatz zur Untersuchung vieler Fallunterscheidungen. Der
theoretische Teil des Beweises von Hales wurde in der Zwi-
schenzeit von einem Gutachtergremium für richtig befunden.
Ausblick ins 21. Jahrhundert
Hales schätzt, dass die formale Überprüfung des gesamten
Beweises noch ca. 20 Jahre dauern wird.
Das Jahr 2000 war das Weltjahr der Mathematik. In bewus-
Völlig ohne Computereinsatz konnte jedoch Andrew Wi- ster Anknüpfung an die 23 Hilbert’schen Probleme aus dem
les (geb. 1953) im Jahr 1993 die Fermat’sche Vermutung Jahr 1900 benannte im Mai 2000 das Clay Mathematics In-
(siehe Seite 20) beweisen, seither spricht man von „Fermat’s stitute (CMI) auf einer Tagung in Paris sieben bis dato unge-
Last Theorem“ (der endgültige Beweis wurde 1995 veröf- löste mathematische Probleme, für deren Lösung jeweils ein
fentlicht). Der Beweis der Fermat’schen Vermutung nach Preisgeld von einer Million Dollar ausgelobt wurde. Diese
ca. 350 Jahren war sicherlich das Highlight der Mathematik Millenniumprobleme stammen aus den Bereichen Zahlen-
des 20. Jahrhunderts. Der Beweis der Fermat’schen Vermu- theorie, Topologie, mathematische Physik und theoretische
tung war eigentlich ein „Abfallprodukt“ aus einem Beweis Informatik. Das erste Millenniumproblem wurde schon bei
der Taniyama-Weil-Shimura-Vermutung. Diese macht tief- Hilberts 23 Problemen genannt: die Riemann’sche Vermu-
liegende strukturelle Aussagen über elliptische Kurven und tung, dass die Nullstellen der Riemann’schen Zetafunktion in
Galois-Gruppen. Nur durch das Zusammenspiel verschie- der rechten Halbebene alle den Realteil 21 haben. Das siebte
dener mathematischer Disziplinen (z. B. algebraische Geo- war die Poincaré’sche Vermutung für die Dimension 3: Jede
metrie, Zahlentheorie, elliptische Kurven, Modulformen) kompakte dreidimensionale Mannigfaltigkeit, auf der jede
konnte Wiles sein Resultat erzielen, aus dem die Lösung des Schleife auf einen Punkt zusammengezogen werden kann,
über 350 Jahre alten Fermat’schen Problems der Zahlentheo- ist homöomorph zur Sphäre S 3 . Einen Beweis hierfür gab im
rie folgt. Die Zahlentheorie erhielt durch den Wiles’schen Jahr 2003 der russische Mathematiker Gregori Perelmann.
Beweis wesentliche Impulse. Hierfür wurde ihm die Fields-Medaille zugesprochen. So-
26 1 Mathematik – eine Wissenschaft für sich

wohl die Annahme der Fields-Medaille als auch das Millen- wirtschaft, Logistik, Versicherungswirtschaft, Banken und
niumpreisgeld lehnte er allerdings ab. Börsen, Finanzdienstleistungsindustrie). Ungeheure Daten-
mengen können nur mit Computerhilfe analysiert werden. In
Bereits im April 2002 wurde von dem rumänischen Mathe-
dem im Jahr 2008, dem Jahr der Mathematik in Deutsch-
matiker Preda Mihailescu (geb. 1955) die sogenannte Cata-
land, erschienenen Band Mathematik – Motor der Wirtschaft
lan’sche Vermutung bewiesen, die besagt: Die einzige ganz-
(Springer-Verlag) schreibt die Bundesministerin für Bil-
zahlige Lösung der Gleichung x p −y q = 1 mit x, p, y, q > 1
dung und Forschung, Annette Schavan, in einem Grußwort
lautet x = 3, p = 2, y = 2, q = 3.
u. a.:
Zahlreiche weitere Vermutungen, die zum Teil auch leicht
zu verstehen sind, harren noch der Lösung, so z. B. die Gold- „Hightech gibt es nicht ohne Mathematik. ,Mathematik. Al-
bach’sche Vermutung (Goldbach schrieb 1742 in einem Brief les was zählt‘ ist unser Leitsatz für das Wissenschaftsjahr
an Euler: Jede gerade natürliche Zahl n ≥ 4 lässt sich als 2008, das ,Jahr der Mathematik‘. Er unterstreicht, wie wich-
Summe von zwei Primzahlen darstellen). 1985 formulierten tig die Mathematik im Leben ist und wie sie unseren Alltag
Masser und Oesterlé die abc-Vermutung: Sind a, b, c paar- durchdringt.“
weise teilerfremde natürliche Zahlen mit a + b = c (daher Das Jahr der Mathematik hat sicher dazu beigetragen, die
der Name!) und ist rad(abc) < c1−ε für jedes ε > 0, dann Diskrepanz zwischen dem Ansehen der Mathematik in der
gibt es nur endlich viele

solcher Tupel (a, b, c). Dabei ist Öffentlichkeit und ihrer wahren Bedeutung zu verkleinern.
für n ∈ N rad(n) := p | n p das Produkt aller Primzahlen, Vielfach ist einer breiten Öffentlichkeit nicht bewusst, wie
die n teilen. So ist z. B. rad(10) = 2 · 5 = 10, rad(18) = 6 viel Mathematik in der Verkehrsplanung (etwa bei der Deut-
und rad(65 536) = 2. Im August 2012 veröffentlichte Shini- schen Bahn AG), in einem Handy oder Navigationsgerät, in
chi Mochizuki, der 1992 bei Gerd Faltings promoviert hatte, einem Computertomographen, einer Geldkarte oder einem
einen möglichen Beweis der abc-Vermutung, dessen Kor- Scanner an der Kasse eines Supermarkts steckt.
rektheit bis zur Drucklegung dieses Werks noch nicht ab-
schließend geprüft war. Sind die abc-Vermutung und gewisse Auch die Mathematik des 21. Jahrhunderts wird gekenn-
Verallgemeinerungen auf Polynomringe richtig, ergeben sich zeichnet sein durch die Pole „Theorie“ und „Anwendungen“,
wesentlich einfachere Beweise z. B. für die Mordell’sche Ver- gemäß dem Leibniz’schen Wahlspruch „Theoria cum praxi“,
mutung oder Sätze von C. L. Siegel und Th. Schneider über und der Feststellung von C. F. Gauß: „Die Theorie zieht die
diophantische Gleichungen. Der kanadische Mathematiker Praxis an wie der Magnet das Eisen“. Es gibt zahlreiche ma-
Robert P. Langlands entwickelte bereits 1966/67 eine Reihe thematische Herausforderungen sowohl auf theoretischer als
von Vermutungen über tiefliegende Zusammenhänge mathe- auch praktisch anwendbarer Ebene. Die Mathematik ist we-
matischer Theorien, die als „Langlands-Programm“ bezeich- gen ihrer universellen Anwendbarkeit zu einer Schlüsseltech-
net werden und an deren Lösung weltweit gearbeitet wird und nologie geworden. Mit einem Zitat von Eberhard Zeidler zur
das durch die Erfolge von Andrew Wiles und Richard Taylor Bedeutung der Mathematik sollen die Schnappschüsse aus
einen gewaltigen Schub erhalten hat. der Geschichte der Mathematik beendet werden:

Waren bis nicht vor allzu langer Zeit die Naturwissenschaf- „Die Mathematik ist ein wundervolles zusätzliches Erkennt-
ten, die Technik und die Wirtschaftswissenschaften die klas- nisorgan des Menschen, ein geistiges Auge, das ihn etwa
sischen Anwendungsgebiete der Mathematik, so haben in in der modernen Elementarteilchenphysik, der Kosmologie
der Zwischenzeit mathematische Methoden in den Lebens- und der Hochtechnologie in Bereiche vorstoßen lässt, die
wissenschaften (Biologie, Medizin), Sozialwissenschaften ohne Mathematik nicht zu verstehen sind, weil sie von un-
und auch Geisteswissenschaften Eingang gefunden. Auch serer Erfahrungswelt extrem weit entfernt sind.“ (Eberhard
die Industrie bedient sich zunehmend mathematischer Me- Zeidler in Wußing, 6000 Jahre Mathematik, Springer-Verlag
thoden (z. B. Verkehrsplanung, Energiewirtschaft, Material- 2009).
Logik, Mengen,
Abbildungen – die 2
Sprache der Mathematik
Wie führt man einen
Widerspruchsbeweis?
Wie lassen sich Mengen
beschreiben?
Was ist eine Abbildung?
Wodurch ist eine
Äquivalenzrelation
gekennzeichnet?

2.1 Junktoren und Quantoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28


2.2 Grundbegriffe aus der Mengenlehre . . . . . . . . . . . . . . . . . . . . . . 34
2.3 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.4 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
28 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Mathematik kann man als eine Sprache auffassen. Das Voka- Aussagen lassen sich mittels Junktoren
bular basiert auf der Mengenlehre, und die Logik übernimmt verbinden
die Rolle der Grammatik. Die Begriffe und Symbole der Men-
genlehre und der Logik werden dabei als eine Art Stenografie Meist ist man nicht nur an einzelnen Aussagen interessiert,
verwendet, um Definitionen, Sätze und Beweise prägnant und sondern will diese verknüpfen. Das geschieht wie in der All-
klar formulieren zu können. tagssprache mit Bindewörtern wie nicht, und oder oder. In
der formalen Logik nennt man diese Bindewörter Junktoren.
In diesem einführenden Kapitel stellen wir die für uns wesent-
lichen Begriffe und Symbole der Logik und Mengenlehre zusam- Wir bezeichnen im Folgenden Aussagen mit einzelnen Groß-
men. Da die präzise Einführung dieser Begriffe und Symbole buchstaben, etwa A, B, C. Dann notieren wir die Negation
für die Analysis und lineare Algebra, also im Wesentlichen für (NICHT-Verknüpfung) einer Aussage A durch ¬A. In der
das erste Studienjahr, nebensächlich ist, können wir auf einen Literatur finden sich auch die Notationen ∼A oder A für die
axiomatischen Aufbau verzichten. Wir benutzen einen intuitiven Negation.
Zugang zur Logik und Mengenlehre. Dieses Vorgehen, das auch
Wie man es erwartet, ist die Negation so definiert, dass
bei Anfängervorlesungen in der Mathematik üblich ist, hat sich
¬A dann falsch ist, wenn A wahr ist und umgekehrt. Mit-
bewährt. Man kann somit nach relativ kurzer Einführung schnell
hilfe einer Wahrheitstafel lassen sich derartige Sachverhalte
zu den Inhalten der Analysis und linearen Algebra kommen. Im
übersichtlich darstellen, indem man alle möglichen Kombi-
Laufe seines Studiums aber sollte sich jeder Mathematikstudent
nationen auflistet. WAHR und FALSCH werden wir dabei
mit einigen wenigen Inhalten der axiomatischen Mengenlehre
durch w und f abkürzen. Für die Negation erhalten wir
bzw. der mathematischen Logik vertraut machen.
A ¬A
Zur Mengenlehre gehören Abbildungen zwischen Mengen und
w f
Relationen auf Mengen. Bei der Einführung dieser Begriffe
f w
legen wir ein Augenmerk auf präzise Anwendungen der Be-
griffe und Symbole der Logik und der bis dahin entwickelten
Mengenlehre. Das erscheint einem Neuling in der Mathematik Beispiel Für eine reelle Zahl x ist etwa die Negation der
schnell pedantisch oder unnötig abstrakt. Tatsächlich aber ist Aussage „x < 5“ durch die Aussage „x ≥ 5“ gegeben. Die
das korrekte und genaue Anwenden des Formalismus eine un- Negation ist durch „x ist nicht kleiner 5“ gegeben und da es
abdingbare Notwendigkeit, um den Weg in die Gedankenwelt für reelle Zahlen drei Möglichkeiten gibt, kleiner, gleich oder
der Mathematik zu meistern. größer, bedeutet die Verneinung der Aussage „x ist größer
oder gleich 5“. 

?
2.1 Junktoren und Quantoren Geben Sie die Negationen der folgenden Aussagen an:
Die Sonne scheint.
Schwäne sind nicht schwarz.
In der Mathematik geht es darum, Aussagen auf ihren Wahr- 17
Es gibt eine natürliche Zahl, die größer als 8 und kleiner
heitsgehalt hin zu überprüfen. Eine Aussage fassen wir dabei
als 23
8 ist.
als einen feststellenden Satz auf, dem genau einer der Wahr-
heitswerte WAHR oder FALSCH zugeordnet werden kann.
Eine wahre Aussage wird in der Mathematik oft als Satz be- Neben der Negation haben wir noch die Konjunktion zweier
zeichnet. Den Nachweis der Wahrheit dieser Aussage nennt Aussagen, die UND-Verknüpfung, die durch das Symbol ∧
man einen Beweis des Satzes. Bevor wir uns aber an das ausgedrückt wird, und die Disjunktion, die ODER-Verknüp-
Beweisen von Sätzen machen, befassen wir uns mit einigen fung, mit dem Zeichen ∨. Eine Wahrheitstafel liefert uns die
Grundbegriffen der Aussagenlogik, um Aussagen kurz und verschiedenen Werte für die beiden Verknüpfungen:
prägnant formulieren zu können. Dabei betreiben wir eine
naive Logik, in der wir unterschwellig die sprachliche Vor- A B A∧B A∨B
stellung benutzen. Die mathematische Logik funktioniert auf w w w w
einem anderen formalen Niveau. w f f w
f w f w
Junktoren und Quantoren sind sogenannte Operatoren der f f f f
Logik. Mit Junktoren werden Aussagen verbunden, Quanto-
ren hingegen binden Variable; dabei verstehen wir unter einer
Variablen vorläufig ein Zeichen, für das beliebige Ausdrücke Beachten Sie, dass in der Logik die Disjunktion stets ein ein-
einer bestimmten Art eingesetzt werden können. schließendes ODER bezeichnet, im Gegensatz zur Umgangs-
sprache, in der oft nur aus dem Zusammenhang deutlich wird,
ob es sich nicht vielleicht um ein „entweder . . . oder“ han-
delt. Formal können wir mit den gegebenen Symbolen auch
2.1 Junktoren und Quantoren 29

ein ausschließendes ODER beschreiben durch wenn A wahr und B falsch ist. Ist also A von vornherein
falsch, dann ist die Gesamtaussage A ⇒ B immer wahr.
(A ∨ B) ∧ ¬(A ∧ B) .
A B A⇒B
In der Literatur wird für diese Verknüpfung die Bezeichnung w w w
XOR mit der Notation AX B genutzt. w f f
f w w
Ein weiterer Junktor, der neben dem XOR genutzt wird, ist f f w
die Verknüpfung NAND, die als

¬(A ∧ B) Beispiel Wir untersuchen das Produkt zweier ganzer Zah-


len m und n und betrachten die Implikation „Für alle natür-
geschrieben wird. Als Notation findet sich häufig A ↑ B. lichen Zahlen m und n gilt: Wenn m gerade ist, dann ist auch
Die Bedeutung der NAND-Operation liegt darin, dass sich das Produkt m · n gerade.“ In der Aussagen-Notation liest
Negation, Konjunktion und Disjunktion allein durch diese sich das als
Operation ausdrücken lassen.
A: „m ist gerade“,
B: „m · n ist gerade“,
? und zu untersuchen ist die Aussage, dass für alle natürlichen
Stellen Sie die Wahrheitswerte für die NAND- und die XOR-
Zahlen A ⇒ B gilt.
Verknüpfungen zusammen und beschreiben Sie die NAND-
Verknüpfung in Worten. Da es keine weiteren Einschränkungen gibt, haben wir vier
mögliche Fälle zu unterscheiden.
1. m und n sind beide gerade: Gerade Zahlen kann man in
Nicht nur die Festlegung auf ein einschließendes ODER
der Form m = 2 k, n = 2 l schreiben, wobei k und l
unterscheidet die logischen Junktoren von ihren umgangs-
natürliche Zahlen sind. Für das Produkt erhalten wir in
sprachlichen Gegenstücken. Wir verbinden mit den Worten
diesem Fall
und/oder oft einen zeitlichen oder gar kausalen Zusammen-
hang. m · n = 2 k · 2 l = 4 k l = 2 · (2 k l) .

ganze Zahl
Beispiel In der Alltagssprache gibt es einen Unterschied
zwischen „Otto wurde krank und der Arzt verschrieb ihm Sowohl Bedingung A als auch die Folgerung B sind wahre
Medikamente“ und „Der Arzt verschrieb ihm Medikamente Aussagen.
und Otto wurde krank.“ Im Rahmen der Aussagenlogik gibt 2. m ist gerade und n ungerade: Wenn n ungerade ist, gibt
es zwischen diesen beiden Sätzen hingegen keinerlei Unter- es eine natürliche Zahl l mit n = 2 l + 1, und es folgt:
schied. 
m · n = 2 k · (2 l + 1) = 4 k l + 2 k = 2 · (2 k l + k) .

Die Aussagenlogik macht solche Unterscheidungen nicht, ganze Zahl
kausale Zusammenhänge werden bei mathematischen Aus- Das Produkt ist wieder eine gerade Zahl. Auch hier sind
sagen und Beweisen stets explizit beschrieben. sowohl Bedingung A als auch Folgerung B wahre Aus-
sagen.
3. m ist ungerade und n gerade: In diesem Fall gibt es na-
Implikationen sorgen für klare Beziehungen türliche Zahlen k und l, sodass m = 2 k + 1 und n = 2 l
ist, und wir erhalten:
Eine weitere logische Verknüpfung, die für die Mathematik
ganz zentral ist, ist die Implikation. Diese WENN-DANN- m · n = (2 k + 1) · 2 l = 4 k l + 2 l = 2 · (2 k l + l) .

Verknüpfung wird manchmal auch als Subjunktion bezeich- ganze Zahl
net. Es geht um die Logik des mathematischen Folgerns der
Art „Wenn A wahr ist, so ist auch B wahr“ oder kurz gesagt Nun ist die Bedingung A falsch, aber die Folgerung B
„Aus A folgt B.“ hingegen wahr.
4. m und n sind ungerade, jetzt gilt:
Bei der Definition dieser Verknüpfung von Aussagen geht
man einen auf den ersten Blick recht seltsamen Weg. Ge- m · n = (2 k + 1) · (2 l + 1) = 4 k l + 2 k + 2 l + 1 =
nauso wie oben bei der UND-Verknüpfung beschrieben, be- = 2 · (2 k l + k + l) +1,
zeichnet die Implikation weder einen zeitlichen noch einen 
ganze Zahl
kausalen Zusammenhang zwischen den Aussagen, was uns
aber umgangssprachlich durch die Formulierungen „wenn ... mit entsprechenden Zahlen k und l. Wir bekommen ein
dann“ bzw. „folgt“ suggeriert wird. Die Aussage „A impli- ungerades Produkt. Hier sind also sowohl Bedingung A
ziert B“, formal notiert durch A ⇒ B, ist nur dann falsch, als auch Folgerung B falsch.
30 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Zusammenfassend erhalten wir stets, dass, wenn A wahr ist, Gehen wir direkt vor und zeigen unmittelbar, dass, wenn A
auch B wahr ist. Bei falschem A sind beide Wahrheitswerte gilt, auch folgt, dass B richtig ist, so nennen wir den Be-
für B möglich. Für die Implikation A ⇒ B erhalten wir somit weis einen direkten Beweis und können dieses Vorgehen lo-
in allen vier Fällen den Wahrheitswert wahr. Die Situation A gisch durch A ⇒ B angeben. Im Gegensatz dazu können
wahr und B falsch tritt nicht auf. Also ist die Aussage A ⇒ B wir auch indirekt argumentieren. Dann zeigen wir: Wenn
richtig.  B nicht gilt, folgt, dass auch A nicht wahr ist. Diesen in-
direkten Beweis können wir formal durch die Implikation
Kommentar: In der Aussagenlogik gilt das Prinzip ex ¬B ⇒ ¬A beschreiben. Eine dritte Möglichkeit der Be-
falso quodlibet, – aus Falschem folgt Beliebiges. Mit einer weisführung, die uns häufiger begegnen wird, ist der Wider-
einzigen falschen Grundannahme kann man, zumindest prin- spruchsbeweis. Bei dieser Argumentation starten wir mit
zipiell, jede beliebige Aussage beweisen. der Annahme, dass A und ¬B wahr sind, und führen diese
Annahme auf einen Widerspruch. Mit den Notationen der
Aussagenlogik heißt dieses Vorgehen, dass wir zeigen, dass
Im Zusammenhang mit der Implikation werden zwei Sprech-
die Aussage ¬(A ∧ ¬B) wahr ist.
weise häufiger genutzt. Hat man eine wahre Implikation
A ⇒ B vorliegen, so sagt man, „A ist hinreichend für B“; Alle drei Varianten, einen Beweis zu führen, sind gleichwer-
denn, wenn die Implikation A ⇒ B wahr ist, so folgt aus tig. Dies machen wir uns anhand einer Wahrheitstafel klar
A wahr, dass auch B wahr ist. Oder die Situation wird aus
anderem Blickwinkel beschrieben durch „B ist notwendig A B (A ⇒ B) ¬B ⇒ ¬A ¬(A ∧ ¬B)
für A“, da wir die wahre Implikation auch so lesen können, w w w w w
dass A nur wahr sein kann, wenn B gilt. w f f f f
f w w w w
Im obigen Beispiel heißt dies, die Bedingung, dass m gerade f f w w w
ist, ist hinreichend dafür, dass m · n gerade ist. Oder eben
anders ausgedrückt, m kann nur gerade sein, wenn auch m · n Wir sehen, dass die Wahrheitswerte der drei Aussagen stets
gerade ist, d. h. die Bedingung „m · n gerade“ ist notwendig, gleich sind. Wir können uns also je nach Situation eine der
damit die Aussage „m ist gerade“ gilt. drei Varianten aussuchen, um einen Beweis zu führen. Im
Beispiel „Unter der Lupe“ auf Seite 31 sind die drei Varianten
der Beweisführung zu einer Aussage gegenübergestellt.
?
Für eine gegebene natürliche Zahl n stellen wir die drei Aus- Beispiel Wir beweisen ein berühmtes Ergebnis, das von
sagen Euklid stammt. Es handelt sich um die Aussage: „Es gibt
A: n ist durch 12 teilbar unendlich viele Primzahlen, also Zahlen, die nur durch eins
B: n ist durch 3 teilbar und sich selbst teilbar sind.“
C: 2 n ist durch 6 teilbar Den Beweis führen wir mittels Widerspruch. Man nimmt an,
gegenüber. Welche „notwendigen“ und „hinreichenden“ Be- es gäbe nur endlich viele Primzahlen. Dann muss es eine
ziehungen bestehen zwischen diesen Aussagen? größte geben, die wir mit p bezeichnen wollen. Nun bildet
man das Produkt aller Primzahlen von zwei bis p und addiert
eins:
Mit der Implikation haben wir die wichtigste logische Ver- r = 2 · 3 · 5 · 7 · 11 · . . . · p + 1
knüpfung von Aussagen für das Beweisen formuliert. Letzt- Diese neue Zahl r ist durch keine der Primzahlen von zwei
endlich sind mathematische Sätze, Lemmata und Folgerun- bis p teilbar, bei der Division bleibt immer ein Rest von eins.
gen meistens in Form von wahren Implikationen formuliert, Es gibt also nur zwei Möglichkeiten: Entweder es gibt eine
und Beweisen heißt, dass man begründet, warum eine Impli- Primzahl, die größer ist als p und durch die r teilbar ist, oder
kation wahr ist. Dabei zerfallen die Beweise üblicherweise in r ist selbst eine Primzahl. In beiden Fällen erhalten wir einen
einzelne kleine Beweisschritte, die für sich genommen wie- Widerspruch zur Annahme, dass p die größte Primzahl ist.
derum wahre Implikationen sein müssen.
Formal wurden in diesem Beweis die beiden Aussagen
A: p ist eine Primzahl
B: Es gibt eine Primzahl p̃ mit p̃ > p
Varianten der Beweisführung – direkt,
betrachtet und die Implikation A ⇒ B durch einen Wider-
indirekt und durch Widerspruch spruch gezeigt. 

Bei den Begriffen hinreichend und notwendig deutete sich


schon an, dass wir verschieden argumentieren können, um Äquivalenz heißt genau dann, wenn
einen Beweis einer Aussage in der Form A ⇒ B, also „aus
A folgt B“, zu führen. Drei logische Varianten werden häufig Die drei oben aufgeführten Möglichkeiten eine Implikation
genutzt. zu formulieren sind gleichwertig, die entsprechenden Spalten
2.1 Junktoren und Quantoren 31

Unter der Lupe: Beweistechniken


Es soll eine Behauptung auf drei Arten – direkt, indirekt und mittels Widerspruch – bewiesen werden. Die Behauptung lautet,
dass für zwei positive Zahlen a und b aus a 2 < b2 die Ungleichung a < b folgt.

Damit wir uns die logische Struktur der Argumente deut- Wir können diese Ungleichung etwa mit a multiplizieren:
lich machen können, geben wir zunächst den beiden Teilen
der Behauptung Namen, a2 ≥ a b

A : a 2 < b2 und ebenso auch mit b:


B: a < b.
a b ≥ b2 .
Generell sei bei beiden Aussagen noch vorausgesetzt, dass
a und b irgendwelche positive reelle Zahlen bezeichnen.
Damit haben wir aber schon die gesuchte Beziehung; denn
Beweisen sollen wir, dass die Implikation A ⇒ B wahr
kombinieren wir beide Ungleichungen, so gilt:
ist, wobei zur Beweisführungen nur elementare Eigen-
schaften der reellen Zahlen genutzt werden sollen.
a 2 ≥ ab ≥ b2 .
1. direkt: A ⇒ B ist wahr.
Dies ist genau ¬A. Also haben wir gezeigt: Wenn a < b
Beweis: Wir setzen
nicht gilt, dann kann auch a 2 < b2 nicht gelten. 

a 2 < b2 Als letzte Variante argumentieren wir mithilfe eines Wi-


derspruchs.
als wahr voraus. Um aus Ungleichungen Schlüsse zu zie-
hen, ist es oft nützlich, die Ungleichung so zu formulieren, 3. Widerspruch: (¬B) ∧ A ist falsch.
dass Ausdrücke positiv oder negativ sind. Deswegen bietet Beweis: Beim Widerspruchsbeweis versuchen wir, die
sich an, auf beiden Seiten −a 2 zu addieren. Dies liefert:
Annahme, dass ¬B und A gleichzeitig gelten können,
0 < b2 − a 2 .
d. h.,
Den Ausdruck auf der rechten Seite kann man mit einer b≤a und a 2 < b2 ,
binomischen Formel in zwei Faktoren zerlegen:
zu einem Widerspruch zu führen. Wir zeigen also, dass
0 < (b − a) (b + a). die Aussage A ∧ ¬B falsch ist. Zuerst multiplizieren wir
(¬B) mit a und erhalten a b ≤ a 2 . Zusammen mit der
Diese Darstellung der Ungleichung hilft uns nun weiter.
Annahme, dass A wahr ist, ergibt sich die Ungleichung
Da nach Voraussetzung a und b positiv sind, ist auch
b + a > 0, und wir dürfen durch (b + a) dividieren, ohne
a b ≤ a 2 < b2 .
dass es Probleme mit dem Ungleichheitszeichen gibt. Wir
erhalten
Nun multiplizieren wir (¬B) mit b und erhalten b2 ≤ a b.
0 < (b − a),
Die Ungleichungskette, mit diesem Ergebnis ergänzt, lau-
und damit ist a < b.  tet nun
a b ≤ a 2 < b2 ≤ a b.
Versuchen wir nun einen indirekten Beweis zu derselben
Implikation. Dies bedeutet a b < a b, was nicht sein kann. Wir ha-
ben also die Annahme, (¬B) ∧ A könnte gelten, zu einem
2. indirekt: (¬B) ⇒ (¬A) ist wahr. Widerspruch geführt. 

Beweis: Beim indirekten Beweis gehen wir von ¬B aus,


Kommentar: Wir haben mit dieser Aussage auf drei ver-
also von schiedenen Argumentationswegen gezeigt, dass die Wur-
a ≥ b. zelfunktion monoton steigend ist.

in der Wahrheitstafel liefern dieselben Werte. Aussagen, die Die Gesamtaussage A ⇔ B ist wahr, wenn A und B ent-
diese Eigenschaft haben, nennt man äquivalent. Äquivalenz, weder beide wahr oder beide falsch sind. Ist eine der beiden
die GENAU-DANN-WENN-Verknüpfung von Aussagen, ist Aussagen wahr, die andere falsch, so ist auch A ⇔ B falsch.
der logische Gleichheitsbegriff für Aussagen. Sie wird durch
einen Doppelpfeil ⇔ zwischen den Aussagen symbolisiert
und wird gelesen als „es gilt genau dann A, wenn B gilt“.
32 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Die zugehörige Wahrheitstabelle lautet: dass ln x > 0 ist, und somit x > 1 gelten muss. Wir haben
C ⇒ A bewiesen und somit die Kette geschlossen. Wegen
A B A⇔B
dieser Beweisstruktur A ⇒ B ⇒ C ⇒ A spricht man auch
w w w von einem Ringschluss. 
w f f
f w f
f f w
Symbole müssen inhaltlich gelesen werden
Manchmal wird für die Äquivalenz zweier Aussagen auch
die Formulierung verwendet, dass Aussage A „notwendig Zur Formulierung mathematischer Aussagen werden oft
und hinreichend“ für Aussage B ist. Symbole eingesetzt. Diese ermöglichen, sinnvoll eingesetzt,
Wir haben schon gesehen, dass Äquivalenz zwischen A und eine effiziente und übersichtliche Beschreibung von Sach-
B vorliegt, wenn der Spezialfall eintritt, dass die Implikation verhalten in der Mathematik. Man beachte aber auch, dass
zweier Aussagen in beide Richtungen wahr ist. Genauer be- ein Symbol je nach Zusammenhang für verschiedene Dinge
deutet die Beobachtung, dass die beiden Aussagen A ⇔ B stehen kann.
und ((A ⇒ B) ∧ (A ⇐ B)) äquivalent sind.
Beispiel Das simple Zeichen 0 kann z. B. – je nach Zu-
Im Sinne einer Beweisführung heißt dies, dass wir Äqui-
sammenhang – die Zahl Null, den Nullvektor, eine identisch
valenz von zwei Aussagen zeigen können, indem wir ge-
verschwindende Funktion, die Nullmatrix oder allgemein das
trennt beweisen, dass die beiden Implikationen gelten. Die-
neutrale Element einer additiv geschriebenen Gruppe bedeu-
sen Weg werden wir bei komplizierteren Äquivalenzbewei-
ten, und damit sind die Möglichkeiten bei Weitem noch nicht
sen sehr häufig nutzen. Der Vorteil dabei liegt darin, dass sich
erschöpft.
so unterschiedliche Beweistechniken nutzen lassen, etwa die
eine Richtung durch einen direkten Beweis und die andere In manchen Fällen kann hier eine zusätzliche Kennzeich-
Richtung durch einen Widerspruch. nung, etwa Fettdruck bei Vektoren, ein wenig helfen, aber
auch damit ist das Problem nicht aus der Welt geschafft. Man
? muss sich von Fall zu Fall überlegen, was die Null in diesem
Stellen Sie eine Wahrheitstafel auf, die die Äquivalenz von Zusammenhang bedeuten soll. 
A ⇔ B und ((A ⇒ B) ∧ (A ⇐ B)) belegt.
Diese Verwendung von Symbolen steht nicht im Widerspruch
zur oben verlangten Eindeutigkeit der Begriffe. Aber es be-
Beispiel Wir machen uns das Vorgehen bei Äquivalenz- deutet eine gewisse Herausforderung sowohl für Autoren als
beweisen an einem einfachen Beispiel klar. Für eine reelle auch für Leser von mathematischen Texten. Es ist die Auf-
positive Zahl x betrachten wir drei Aussagen gabe desjenigen, der einen mathematischen Text verfasst,
sicherzustellen, dass bei jedem Symbol klar ist, was es in
A : x > 1, B : x 2 > 1, C : ln x 2 > 0 . diesem Kontext bedeutet. Umgekehrt bleibt es Aufgabe des
Lesers mathematischer Texte, nicht nur rein formal zu lesen,
Um die Äquivalenz von A und B zu zeigen, könnten wir fol- sondern die jeweilige Bedeutung der abkürzenden Notatio-
gendermaßen argumentieren. Zunächst zeigen wir A ⇒ B: nen im Hinterkopf zu haben.
Wenn x > 1 gilt, so folgt, indem wir die Ungleichung mit x
multiplizieren, die Ungleichungskette x 2 = x · x > x > 1.
Lesen von Symbolen
Also ergibt sich x 2 > 1. Andererseits gilt B ⇒ A. Dazu
wählen wir einen indirekten Beweis; denn aus der Annahme Bei jedem in einer mathematischen Aussage vorkom-
x ≤ 1 folgt x 2 ≤ x und somit x 2 < 1. Also gilt x 2 > 1 menden Symbol muss man sich bewusst machen, was
impliziert x > 1. dieses Symbol hier bedeutet, um die Aussage verstehen
und verwenden zu können.
Nun könnten wir die Äquivalenz zwischen A und C zeigen.
Damit hätten wir die Äquivalenz aller drei Aussagen bewie-
sen. Häufig bietet sich aber bei mehreren Äquivalenzen eine In diesem Sinne werden wir versuchen, in diesem Werk die
Kette von Implikationen an. Statt die Äquivalenzen separat Verwendung von Symbolen auf ein angenehmes Maß zu be-
zu beweisen, zeigen wir schränken. Zwei häufig in der Literatur genutzte, abkürzende
Notationen im Zusammenhang mit der Formulierung von
A ⇒ B, B⇒C und C ⇒ A. Aussagen müssen wir aber noch ansprechen.
Die erste dieser drei Implikationen haben wir oben gezeigt. Oft will man Aussagen über eine ganze Klasse von Objekten
Wir setzen nun voraus, dass wir bereits wissen, dass ln 1 = 0 machen, etwa „Zu jeder reellen Zahl x gibt es eine natürliche
ist und dass der natürliche Logarithmus monoton steigend Zahl n, die größer ist als x.“
ist. Damit folgt direkt B ⇒ C. Als Letztes ergibt sich aus
In den meisten Fällen werden wir dabei mit den beiden Phra-
0 < ln(x 2 ) = 2 ln x , sen „es gibt“ und „für alle“ völlig auskommen.
2.1 Junktoren und Quantoren 33

Beispiel nur wohldefiniert, wenn wir vorher gezeigt haben, dass es


überhaupt eine solche Zuordnung gibt, also die Existenz der
Es gibt eine gerade Zahl, die durch drei teilbar ist.
Wurzelfunktion bewiesen haben, und zweitens sichergestellt
Für alle natürlichen Zahlen n gilt:
haben, dass es nur eine Funktion mit dieser Eigenschaft gibt,
n(n + 1) also die Eindeutigkeit der Definition. Ein weiterer wichtiger
1 + 2 + ··· + n = .  Aspekt bei mathematischen Sätzen sind die Voraussetzun-
2
gen. Wir fragen uns oft, sind die Voraussetzungen „scharf“
Mit „es gibt“ machen wir eine Existenzaussage und mit „für im Sinne von notwendig oder sind sie nur hinreichend für die
alle“ eine Allaussage. Aussage. Verallgemeinerungen von Voraussetzungen führen
uns oft zu neuen mathematischen Aspekten, etwa in unserem
Um Existenz- oder Allaussagen machen zu können, benö-
Beispiel der Wurzelfunktion auf die komplexen Zahlen, die
tigen wir eine Beschreibung A(x) des Sachverhalts in Ab-
wir später besprechen werden.
hängigkeit einer oder mehrerer Variablen. Dabei wird A(x)
zu einer Aussage, wenn spezifiziert wird, was mit der Varia- Quantoren, Variablen und Junktoren werden von nun an mit-
blen x gemeint ist. Solche Ausdrücke nennt man Aussage- einander zu vielfältigen Aussagen zusammengesetzt. Sehr oft
formen. hat man es dabei auch mit Verschachtelungen zu tun, deren
Abhängigkeiten unbedingt zu beachten sind.
So ist im obigen Beispiel die Gleichung

n(n + 1) Beispiel Wir betrachten die Aussage „Zu jeder reellen


1 + 2 + ... + n =
2 Zahl x gibt es eine natürliche Zahl n, die größer als x ist.“
Hier haben wir zunächst eine Allaussage, der eine Existenz-
eine Aussageform A(n). Erst zusammen mit der Festlegung aussage folgt, also formal
„für alle natürlichen Zahlen n“ oder einer Festlegung der
Form „für n = 5“ wird daraus eine Aussage. ∀ x ∈ R ∃ n ∈ N: x < n .

Die Gesamtaussage ist in diesem Fall wahr.


Quantoren erlauben knappes Hinschreiben
Würde man einfach naiv die Reihenfolge der Aussagen um-
von Existenz- und Allaussagen
stellen, so erhielte man „Es gibt eine natürliche Zahl n, die
größer ist als jede reelle Zahl x.“ Das ist eine ganz andere
Für diese beiden Formen von Aussagen gibt es formale
Aussage. In diesem Fall ist sie zudem falsch. Die Reihen-
Schreibweisen, die wir wegen ihrer weiten Verbreitung nicht
folge der Quantoren spielt fast immer eine entscheidende
verschweigen wollen. Man nutzt dazu Quantoren, die die
Rolle. 
Gültigkeit von Aussagen quantifizieren sollen. Die beiden
hier angesprochenen sind
Existenz- und Allaussagen lassen sich natürlich auch negie-
Existenzquantor ∃ ren, dabei ändert sich ihr Charakter von Grund auf. Sagen
„∃ x : A(x)“ ist gleichbedeutend mit wir, eine Aussage A trifft nicht auf alle x zu, so muss es
„Es existiert ein x, für das A(x) wahr ist“. zumindest ein x geben, für das A nicht gilt. Umgekehrt ver-
Allquantor ∀ neinen wir, dass es ein x gibt, für das A gilt, so muss A für
„∀ x : A(x)“ ist gleichbedeutend mit alle x falsch sein.
„Für alle x ist A(x) wahr“.
Kurz, die Verneinung einer Allaussage ist eine Existenzaus-
Wobei jeweils A(x) eine Aussageform bezeichnet. sage, die Verneinung einer Existenzaussage ist eine Allaus-
sage. In formaler Notation liest sich das als
Achtung: Eine Existenzaussage von der Form „Es gibt ¬ (∀ x : A(x)) ist äquivalent zu ∃ x : ¬A(x),
ein x, für das A gilt,“ bedeutet, dass zumindest ein derarti-
ges x existiert. A darf aber auch für mehrere oder sogar alle ¬ (∃ x : A(x)) ist äquivalent zu ∀ x : ¬A(x).
möglichen x wahr sein. Meinen wir, dass es genau ein ent-
Betrachten Sie mit diesem Wissen nochmal die letzten bei-
sprechendes Objekt geben soll, also eines und nur eines, so
den Selbstfragen auf Seite 28. Abschließend weisen wir noch
müssen wir das dazusagen. Wie auch überall sonst in Mathe-
auf zwei weitere Beweistechniken hin, die man leicht überse-
matik und Logik müssen wir die Sprache ernst nehmen und
hen kann. Um eine Existenzaussage zu zeigen, genügt es ein
sauber einsetzen.
konkretes Beispiel anzugeben, bei dem die betreffende Aus-
sageform zur wahren Aussage wird. Genauso ist es ausrei-
Fragen nach Existenz, „gibt es . . . ?“, und nach der Eindeu- chend, ein Gegenbeispiel anzugeben, um eine Allaussage zu
tigkeit, „gibt es höchstens ein . . . ?“ sind zentral in der Ma- widerlegen. Natürlich gibt es kein Rezept, wie man im Einzel-
thematik und werden uns sehr oft begegnen. Schon der ein- fall ein Beispiel bzw. Gegenbeispiel findet. Ein erfolgreiches

fache Versuch, die Wurzelfunktion zu definieren (als x  → x, Ausprobieren erfordert im Allgemeinen ein weitreichendes

wobei x diejenige Zahl ist, deren Quadrat x ergibt), ist Verständnis des betrachteten Problems.
34 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Übersicht: Logik – Junktoren und Quantoren


Wir fassen hier die wichtigsten Junktoren und Quantoren noch einmal kurz zusammen.

Wichtige Junktoren Einige wichtige logische Äquivalenzen


¬ Negation (NICHT) (A ⇔ B) ⇔ ((A ⇒ B) ∧ (B ⇒ A))
∧ Konjunktion (UND)
∨ Disjunktion (ODER) (A ⇒ B) ⇔ ¬(A ∧ ¬B) (Widerspruchsbeweis)
⇒ Implikation (WENN-DANN) (A ⇒ B) ⇔ (¬B ⇒ ¬A) (indirekter Beweis)
⇔ Äquivalenz (GENAU-DANN-WENN)
A B ¬A A ∧ B A ∨ B A ⇒ B A ⇔ B (A ∨ B) ⇔ ¬(¬A ∧ ¬B)
w w f w w w w (A ∧ B) ⇔ ¬(¬A ∨ ¬B)
w f f f w f f
f w w f w w f Quantoren
f f w f f w w ∃ Existenzquantor („es gibt ein . . . “)
∀ Allquantor („für alle . . . “)
Außerdem werden gelegentlich verwendet:
↑ (NAND) mit A ↑ B ⇔ ¬(A ∧ B) Verneinen von Quantoren
X (XOR) mit AX B ⇔ ((A ∨ B) ∧ ¬(A ∧ B)) ¬(∀x : A(x)) ist äquivalent zu ∃x : ¬A(x)
¬(∃x : A(x)) ist äquivalent zu ∀x : ¬A(x)

Beispiel Wir können die Aussage „Es gibt eine ganzzah- Diese Definition ist so nicht sinnvoll, sprich keine Definition:
lige Lösung der Gleichung x 4 −2x 3 −11x 2 +12x +36 = 0,“ Der zu definierende Begriff Menge wird durch einen unde-
dadurch beweisen, dass wir eine Lösung, nämlich x = 3, an- finierten Begriff Zusammenfassung erklärt. Und tatsächlich
geben. kamen kurz nach Cantors Definition einer Menge die ersten
Beispiele, die Cantors Mengenlehre zum Einsturz brachten
Genauso lässt sich die Aussage „Für alle reellen Zahlen (siehe Seite 35). Aber für unsere Zwecke innerhalb der li-
x gilt x 2 + 23 x + 32
17
≥ 0, “ dadurch widerlegen, indem nearen Algebra und Analysis, also insbesondere im ersten
3
man x = − 4 einsetzt. Man erhält dann nämlich den Wert Studienjahr, ist der intuitive Begriff einer Menge im Sinne
 2
3
− 23 · 43 + 32
17 1
= − 32 .  einer Zusammenfassung von wohlunterschiedenen Objekten
4
zu einem Ganzen völlig ausreichend. Eine präzise Definition
einer Menge ist möglich. Dies erfordert aber einen erhebli-
chen Aufwand, der üblicherweise in Spezialvorlesungen zur
2.2 Grundbegriffe aus der Mengenlehre betrieben wird. Wir verzichten auf eine sol-
che präzise Definition und beschreiben Mengen durch ihre
Mengenlehre Eigenschaften.

Auch wenn wir schon erste (mathematische) Formeln be-


trachtet haben, so haben wir bisher nur über Mathematik ge- Mengen sind durch ihre Elemente gegeben
sprochen und eigentlich noch keine Mathematik gemacht –
wir haben die Grammatik der Sprache Mathematik geschil- Ist M eine Menge, so werden die wohlunterschiedenen Ob-
dert. Nun kommen wir zum Alphabet der Mathematik – der jekte x von M die Elemente von M genannt.
Mengenlehre. Wir werden uns nun mit Definitionen, Sät- Der Grundbegriff der Mengenlehre ist die Elementbeziehung,
zen und Beweisen auseinandersetzen und dabei in den tiefen wir schreiben
Gründen der Mathematik graben. Dabei berühren wir gleich
ein Thema, das Komplikationen mit sich bringt – der Begriff x ∈ M, falls x ein Element der Menge M ist, und
der Menge. Georg Cantor, der Begründer der Mengenlehre, x ∈ M, falls x nicht Element der Menge M ist.
definierte diesen Begriff wie folgt: Dabei sind für x ∈ M Sprechweisen wie „x ist Element von
M“ oder „x liegt in M“ üblich. Analog sagt man „x ist nicht
Element von M“ oder „x liegt nicht in M“ für x ∈ M.
Der Mengenbegriff nach Cantor
Mengen lassen sich auf zwei verschiedene Arten angeben:
Unter einer Menge verstehen wir jede Zusammenfas-
Man kann die Elemente einer Menge explizit auflisten oder
sung M von bestimmten, wohlunterschiedenen Objekten
man beschreibt die Elemente durch ihre Eigenschaften. Die
x unserer Anschauung oder unseres Denkens zu einem
explizite Angabe der Elemente ist vor allem bei kleinen Men-
Ganzen.
gen sinnvoll.
2.2 Grundbegriffe aus der Mengenlehre 35

Beispiel Die Mathematiker betrachten die Zahlenmengen nicht als von


Die Menge M aller Primzahlen, die kleiner als 10 sind, ist Gott gegeben. Durch mathematische Prozesse können aus N0
die Zahlenmengen Z, Q, R und C Schritt für Schritt gewon-
M = {2, 3, 5, 7} . nen werden. Auf diese Prozesse gehen wir im Kapitel 4 ein.
Auch die Menge N0 kann durch einen mathematischen Pro-
Die (unendliche) Menge N der natürlichen Zahlen kann zess konstruiert werden. Dazu geht man mengentheoretisch
wie folgt beschrieben werden: vor. Man erhält die natürlichen Zahlen sukzessive aus der
Null durch folgende Festlegungen:
N = {1, 2, 3, . . .} . 
0 = ∅, 1 = {∅}, 2 = {∅, {∅}}, 3 = {∅, {∅}, {∅, {∅}}, . . .
Neben dieser expliziten Angabe der Elemente einer Menge
Man beachte, es ist z. B. 3 = {0, 1, 2}, . . . In diesem Sinne
kann man die Elemente einer Menge auch durch ihre Eigen-
sind die natürlichen Zahlen Mengen, deren Elemente Mengen
schaften erklären: Ist E eine Eigenschaft, so ist
sind.
M = {x | E (x)}
Achtung: Die Begriffe Element und Menge sind somit
die Menge aller Elemente x, die die Eigenschaft E haben. relativ. Bildet man z. B. die Menge aller oben aufgeführten
Dabei wird der senkrechte Strich | gesprochen als Mengen, also

„für die gilt“ oder „mit der Eigenschaft“ . M = {N, N0 , Z, Q, R, C, ∅} ,

Eine eventuelle Grundmenge, aus der die Elemente x sind, so ist etwa Z einerseits Menge (von ganzen Zahlen), zugleich
wird oft vor dem Strich | festgehalten. aber auch Element (nämlich der Menge M).

Beispiel Kommentar: Wir haben hier einen Sachverhalt angespro-


M = {x ∈ N | x > 2 , x ≤ 9} = {3, 4, 5, 6, 7, 8, 9}. chen, dem man in der Mathematik wiederholt begegnet: Man
M = {x | x ist eine gerade natürliche Zahl} = {2, 4, 6, kann eine mathematische Struktur durch ein (widerspruch-
. . .} = {x ∈ N | ∃ k ∈ N mit x = 2 k}.  freies) Axiomensystem festlegen oder aus grundlegenderen
Strukturen konstruieren. Das Musterbeispiel hierfür ist die
Wir geben im Folgenden gesammelt die sogenannten Zah- Menge der reellen Zahlen, die einerseits durch ein Axiomen-
lenmengen an. Diese sind den meisten Lesern aus der Schul- system festgelegt werden kann, andererseits über Zwischen-
zeit gut vertraut. Wir werden diese Mengen immer wieder in stufen aus der leeren Menge konstruiert werden kann. Wir
Beispielen zu allen möglichen Mengenoperationen heranzie- behandeln dieses Beispiel ausführlich im Kapitel 4.
hen, die wir in den folgenden Abschnitten behandeln werden.
Diese Zahlenmengen werden wir im Kapitel 4 ausführlich
diskutieren.
Zwei Mengen sind gleich, wenn sie
N = {1, 2, 3, . . .} – die Menge aller natürlichen Zahlen, Teilmengen voneinander sind
N0 = {0, 1, 2, . . .} – die Menge aller natürlichen Zahlen
mit der Null, Wir nennen eine Menge A eine Teilmenge einer Menge B,
Z = {0, 1, −1, 2, −2, . . .} – die Menge aller ganzen falls jedes Element von A auch ein Element von B ist und
Zahlen, schreiben dafür A ⊆ B oder B ⊇ A, d. h.,
Q = {m n | n ∈ N, m ∈ Z} – die Menge aller rationalen
Zahlen, A ⊆ B ⇔ Für alle x ∈ A gilt x ∈ B .
R – die Menge aller reellen Zahlen,
C = {a + i b | a, b ∈ R} – die Menge aller komplexen Die Teilmengenbeziehung ⊆ wird Inklusion genannt, und
Zahlen. man sagt auch „die Menge A ist in B enthalten“ oder „die
Menge B umfasst A“.
Kommentar: Die reellen Zahlen, also die Elemente von Dass A keine Teilmenge von B ist – wir schreiben dafür
R, können auch explizit angegeben werden. Dazu sind aber A ⊆ B oder B ⊇ A – bedeutet, dass es in A ein Element
weitere Begriffe nötig, die wir erst in den folgenden Kapiteln gibt, das nicht in B ist.
entwickeln werden.
Wir halten nun unsere erste beweisdürftige Aussage fest:
Es ist auch sinnvoll, von einer Menge zu sprechen, die keine
Elemente enthält – die leere Menge ∅. Auch die Schreibweise Die leere Menge ist Teilmenge jeder Menge
{} ist für die leere Menge üblich. Wir können die leere Menge Für jede Menge M gilt:
des Weiteren durch Eigenschaften beschreiben:
∅ ⊆ M und M ⊆ M .
∅ = {x ∈ N | x < −1} .
36 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Hintergrund und Ausblick: Die Russell’sche Antinomie


Cantors Mengenbegriff führt zu Widersprüchen. Folglich ist seine Beschreibung einer Menge keine Definition im mathematischen
Sinne. Wir geben dazu ein Objekt an, das nach Cantors Definition eine Menge sein müsste, aber sich nicht mit den Regeln der
Mathematik vereinbaren lässt.
Die Bildung von Mengen, die nur endlich viele Elemente Beginn des 20. Jahrhunderts die von Cantor und ande-
enthalten, ist unproblematisch. Schwierigkeiten können ren entwickelte Mengenlehre ad absurdum geführt und
aber auftreten bei der Bildung gewisser unendlicher Men- die Entwicklung axiomatischer Mengenlehren eingeleitet
gen. Die Mengen N, Z, Q, R, C sind unendliche Men- und mitbestimmt.
gen, aber dennoch so klein, dass auch sie unproblema-
Der intuitive Hintergrund für den in der Antinomie (griech.
tisch sind. Wir brauchen Zusammenfassungen, die noch
Unvereinbarkeit von Gesetzen) auftretenden Widerspruch
viel größer sind.
ist der: Das oben definierte Gebilde M = {x | x ∈ x} ist
Für Mengen A dürfte A  ∈ A wohl der Normalfall sein; riesengroß. Viel zu viele Objekte haben die Eigenschaft,
Mengen, die sich selbst als Element enthalten, scheinen nicht Element von sich selbst zu sein. Also ist festzuhalten:
etwas suspekt zu sein. Aber auch A ∈ A ist vorstellbar, Es ist Vorsicht geboten bei der Bildung allzu großer (un-
man denke etwa an einen Verein, der Mitglied bei sich endlicher) Mengen. Für den Inhalt der Mathematik des
selbst ist. ersten Studienjahres soll der Hinweis reichen, dass alle
hier auftretenden Mengen und Mengenbildungen im Rah-
Wir definieren eine Zusammenfassung, die nach Cantors
men der gebräuchlichen Mengenlehre akzeptabel sind –
Definition eine Menge ist:
aber mit etwas Mutwillen kann man auch hier Schaden
M = {x | x  ∈ x} . anrichten: Sprechen Sie nie von der Menge aller Vektor-
räume oder Gruppen oder Körper, ... – eine solche gibt es
Nun fragen wir, ob M ein Element der Menge M ist, oder
nicht.
ob das nicht der Fall ist. Es muss ja laut Logik gelten:
Die Antinomie von Russell hat eine berühmte Veranschau-
Entweder ist M ∈ M oder es ist M  ∈ M .
lichung, die wir nicht vorenthalten wollen:
Genau eine der beiden Aussagen ist richtig, genau eine
falsch. Der Barbier eines Ortes, der genau die Bewohner des Or-
tes barbiert, die sich nicht selbst barbieren, barbiert der
Angenommen, es ist M ∈ M. Dann hat M die Eigen- sich selbst?
schaft M ∈ M – ein Widerspruch.
Angenommen, es ist M  ∈ M. Dann hat M die Eigen- Im Rahmen der axiomatischen Mengenlehre werden allge-
schaft M ∈ M – ein Widerspruch. meinere Objekte – die sogenannten Klassen – eingeführt.
Mengen sind dann spezielle Klassen. Die Vorstellung, dass
Zusammen: Sowohl M ∈ M als auch M  ∈ M sind falsch. Mengen kleine Klassen sind, ist dabei äußerst nützlich.
Mit diesem Beispiel von Russell brach die naive Mengen-
lehre von Cantor zusammen. Literatur
Was lässt sich daraus schließen? So naiv darf man Men- U. Friedrichsdorf, A. Prestel, Mengenlehre für den Mathe-
gen nicht bilden. Diese Konstruktion von Russell hat zu matiker, Vieweg, 1985

Beweis: Die erste Inklusion begründen wir durch einen Achtung: Man beachte, dass die Schreibweise A ⊆ B
Widerspruchsbeweis. Dazu nehmen wir an, es existiert eine nicht falsch ist, falls sogar A  B gilt.
Menge M, für die gilt ∅  ⊆ M. Hiernach gibt es in ∅ ein
Element, das nicht in M liegt. Dies ist ein Widerspruch. Somit Beispiel Es gelten die folgenden (echten) Inklusionen
stimmt die Annahme nicht: Es existiert keine Menge M mit bzw. Negationen von Inklusionen:
∅ ⊆ M, anders ausgedrückt: ∅ ⊆ M für jede Menge M. Die
{1}  {1, 2} und {1} ⊆ {1, 2} und {1, 2} ⊆ {1, 2}.
Aussage M ⊆ M gilt aufgrund der Tatsache, dass für jedes
{1, 2}  ⊆ {1, 3} und {1, 2} ⊆ {11, 4}.
Element m aus M offensichtlich m ∈ M gilt. 
N  N0 ⊆ Z  Q ⊆ R  C. 

Wenn A ⊆ B, aber B ⊆ A gilt, so heißt A echte Teilmenge ?


Formulieren Sie A ⊆ B und A  B mithilfe von Quantoren.
von B. Wir schreiben dafür A  B oder B  A. Dass A eine
echte Teilmenge von B ist, bedeutet: Jedes Element von A
ist ein Element von B, in B aber gibt es mindestens noch ein Wir sagen, die zwei Mengen A und B sind gleich, wenn
weiteres Element, das nicht in A ist. sie die gleichen Elemente enthalten. Mithilfe der Inklusion
können wir das wie folgt formal ausdrücken:
2.2 Grundbegriffe aus der Mengenlehre 37

Gleichheit von Mengen Die Menge


Die Mengen A und B sind gleich, in Zeichen A = B,
A ∪ B = {x | x ∈ A ODER x ∈ B}
wenn jedes Element von A ein Element von B ist und
jedes Element von B eines von A ist, kurz:
heißt die Vereinigung von A und B.
A = B ⇔ ((A ⊆ B) ∧ (B ⊆ A)) .
A B
Um zu beweisen, dass zwei Mengen A und B gleich sind,
geht man also wie folgt vor:
Wähle ein beliebiges Element x in A und zeige, dass x in Abbildung 2.2 Die Vereinigung A ∪ B enthält alle Elemente, die in A oder B
B liegt. Das zeigt A ⊆ B. enthalten sind.

Wähle ein beliebiges Element x in B und zeige, dass x in


A liegt. Das führt zur zweiten Inklusion B ⊆ A. Und schließlich nennt man die Menge

Oftmals lassen sich beide Inklusionen in einem Schritt zei- A \ B = {x | x ∈ A UND x ∈ B}


gen:
A = B ⇔ ((x ∈ A) ⇔ (x ∈ B)) . die Differenz von A und B.
In der Analysis beweist man die Gleichheit zweier reeller
Zahlen a und b manchmal ganz ähnlich: Man zeigt a ≤ b A B
und b ≤ a.
Auf den folgenden Seiten folgen mehrere Beispiele, in denen
wir die Gleichheit von Mengen begründen. Abbildung 2.3 Die Differenz A \ B enthält alle Elemente von A, die kein
Element von B sind.

Kommentar: Unsere Definition der Gleichheit von Men- Gilt A ∩ B = ∅, so heißen A und B disjunkt oder auch
gen ist extensional: Zwei Mengen sind gleich, wenn sie die- elementfremd.
selben Elemente enthalten. Der juristische Gleichheitsbegriff
von Vereinen ist nicht extensional; zwei Vereine, die diesel- Für die Durchschnitts- und Vereinigungsbildung gelten Re-
ben Mitglieder haben, sind nicht unbedingt gleich. Der Sän- chengesetze, die von den ganzen Zahlen her bekannt sind.
gerverein Frohsinn und der Schützenverein Ballermann von
Entenhausen sind verschieden, obwohl sie dieselben Mitglie-
Rechengesetze für Durchschnitts- und Vereinigungs-
der haben, der eine Verein ist steuerbegünstigt, der andere
bildung
nicht. Dass zwei gleiche Objekte auch stets gleiche Eigen-
schaften besitzen, sagt das auf Leibniz zurückgehende Er- Für beliebige Mengen A, B und C gelten
setzbarkeitstheorem aus, dessen Gültigkeit wir axiomatisch die Assoziativgesetze:
voraussetzen.
A ∩ (B ∩ C) = (A ∩ B) ∩ C und
A ∪ (B ∪ C) = (A ∪ B) ∪ C ,

Mengen kann man vereinigen, miteinander die Kommutativgesetze:


schneiden, voneinander subtrahieren, und A ∩ B = B ∩ A und A ∪ B = B ∪ A ,
manchmal kann man auch das Komplement
betrachten die Distributivgesetze:

Für zwei Mengen A und B heißt die Menge A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) und


A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) .
A ∩ B = {x | x ∈ A UND x ∈ B}

der Durchschnitt von A und B.


Beweis: Es gilt:
A B
A ∩ (B ∩ C) = A ∩ {x | x ∈ B ∧ x ∈ C}
= {x | x ∈ A ∧ x ∈ B ∧ x ∈ C}
= {x | x ∈ A ∧ x ∈ B} ∩ C
Abbildung 2.1 Der Durchschnitt A ∩ B enthält alle Elemente, die sowohl in A
als auch in B enthalten sind. = (A ∩ B) ∩ C
38 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

und Beweis: Wir zeigen das erste Gesetz, das zweite beweist
man analog. Weil die Komplemente stets bezüglich derselben
A ∩ B = {x | x ∈ A ∧ x ∈ B} großen Menge M gebildet werden, verwenden wir die Kurz-
= {x | x ∈ B ∧ x ∈ A} schreibweise Ac , B c für die Komplemente. Die Gleichheit
= B ∩ A. der Mengen (A ∪ B)c und Ac ∩ B c ergibt sich aus:

x ∈ (A ∪ B)c ⇔ x ∈ M \ (A ∪ B)
Das Assoziativ- und Kommutativgesetz für die Vereinigung
begründet man analog. Zu begründen sind noch die Distri- ⇔ x ∈ (M \ A) ∩ (M \ B)
butivgesetze. Es gilt: ⇔ x ∈ Ac ∩ B c .

Dabei liefert ⇒ die Inklusion (A ∪ B)c ⊆ Ac ∩ B c und ⇐


x ∈ A ∩ (B ∪ C) ⇔ x ∈ A ∧ (x ∈ B ∨ x ∈ C)
die Inklusion Ac ∩ B c ⊆ (A ∪ B)c . Insgesamt folgt damit
⇔ (x ∈ A ∧ x ∈ B) ∨ (x ∈ A ∧ x ∈ C) (A ∪ B)c = Ac ∩ B c . 

⇔x ∈A∩B ∨ x ∈A∩C
⇔ x ∈ (A ∩ B) ∪ (A ∩ C) . Die Inklusion A ⊆ B lässt sich mit den eingeführten Men-
genoperationen kennzeichnen, offenbar gelten
Somit sind die beiden Mengen A ∩ (B ∪ C) und (A ∩ B) ∪
(A ∩ C) gleich, beachte hierzu die Bemerkung nach der De- (i) mit der Vereinigung:
finition der Gleichheit von Mengen auf Seite 37. Um das
A⊆B ⇔A∪B =B,
zweite Distributivgesetz zu zeigen, geht man analog vor. 
(ii) mit dem Durchschnitt:
Ist A eine Teilmenge von B, A ⊆ B, so heißt die Menge A ⊆ B ⇔ A ∩ B = A,

CB (A) = B \ A (iii) mit der Differenz:

das Komplement von A bzgl. B. A ⊆ B ⇔ A \ B = ∅.

?
Begründen Sie kurz diese Äquivalenzen.
B A

Das kartesische Produkt zweier Mengen A


Abbildung 2.4 Das Komplement CB (A) enthält alle Elemente von B, die nicht und B ist die Menge aller geordneten Paare
Element von A ⊆ B sind.

In einer euklidischen Ebene E lässt sich jeder Punkt p be-


Z. B. gilt
züglich eines kartesischen Koordinatensystems durch zwei
CZ (N) = {0, −1, −2, . . .} und CN (N) = ∅ . reelle Zahlen a und b beschreiben, und umgekehrt bestimmt
jedes geordnete Paar (a, b) zweier reeller Zahlen a und b
einen Punkt der Ebene. Wir können somit die euklidische
Achtung: Auch die Schreibweise Ac ist für das Komple- Ebene E als die Menge aller geordneten Paare auffassen
ment der Menge A üblich. Bei dieser Schreibweise muss aber (siehe Abb. 2.5):
klar sein, bezüglich welcher Menge das Komplement gebil- R2 = R × R = {(a, b) | a, b ∈ R} .
det wird. Beachte das obige Beispiel für Nc .
Im Allgemeinen gilt (a, b) = (b, a), z. B. ist
Das Komplement einer Vereinigung ist der Schnitt der Kom-
plemente, und das Komplement eines Schnittes ist die Ver- (2, 1) = (1, 2) .
einigung der Komplemente, das besagen die Regeln von De
Morgan: Solche Mengen geordneter Paare kann man mit beliebigen
Mengen A, B bilden. Die Menge

Die Regeln von De Morgan A × B = {(a, b) | a ∈ A, b ∈ B}


Für beliebige Mengen A, B ⊆ M gelten die Regeln: heißt kartesisches Produkt oder Produktmenge von A und
B. Dabei ist A = B erlaubt, für A × A schreiben wir kurz
CM (A ∪ B) = CM (A) ∩ CM (B) ,
A2 . Für zwei Elemente (a, b), (c, d) ∈ A × B gilt:
CM (A ∩ B) = CM (A) ∪ CM (B) .
(a, b) = (c, d) ⇔ a = c , b = d .
2.2 Grundbegriffe aus der Mengenlehre 39

y Die Menge
{(x, 0) ∈ R2 | x ∈ R}
ist die x-Achse und

b p {(0, y) ∈ R2 | y ∈ R}

ist die y-Achse in der Ebene R2 . 

Zur Darstellung eines Punkts des dreidimensionalen eukli-


dischen Raumes benötigt man drei reelle Zahlen. Weil bei
vielen Problemstellungen, z. B. aus der Physik, auch drei
Dimensionen nicht ausreichen, definieren wir allgemein für
endlich viele Mengen A1 , A2 , . . . , An mit n ∈ N

a x 
n
Ai = A1 × · · · × An
Abbildung 2.5 Der Punkt p = (a, b) hat die Koordinaten a und b.
i=1
= {(a1 , . . . , an ) | a1 ∈ A1 , . . . , an ∈ An }
D. h. zwei geordnete Paare sind genau dann gleich, wenn sie
komponentenweise gleich sind. das kartesische Produkt von A1 , . . . , An . Das Element
(a1 , . . . , an ) heißt ein (geordnetes) n-Tupel. Für zwei
Kommentar: Wir sind bei der Einführung der kartesischen n-Tupel (a1 , . . . , an ), (b1 , . . . , bn ) ∈ A1 × · · · × An gilt
Produkts einer intuitiven Auffassung gefolgt und haben eine
Definition des Begriffs geordnetes Paar vermieden. Sind A (a1 , . . . , an ) = (b1 , . . . , bn ) ⇔ a1 = b1 , . . . , an = bn .
und B Mengen, so ist nach K. Kuratowski das geordnete Paar
(a, b) für a ∈ A und b ∈ B (mengentheoretisch) definiert als Falls alle Mengen gleich einer Menge A sind, d. h. A = A1 =
· · · = An , so schreibt man kürzer An für A × · · · × A. Im
(a, b) = {{a}, {a, b}} . Fall A = R und n = 3 erhält man so den (dreidimensionalen)
Anschauungsraum
Es macht keine große Mühe nachzuweisen, dass die obige
Gleichheit für geordnete Paare tatsächlich gilt. R3 = {(a1 , a2 , a3 ) | a1 , a2 , a3 ∈ R} .

Beispiel
{a, b, c}×{1, 2} = {(a, 1), (a, 2), (b, 1)(b, 2), (c, 1), (c, 2)} Die Potenzmenge einer Menge M ist die
Menge aller Teilmengen von M
und
A × ∅ = ∅. Ist M eine Menge, so heißt
Die (Anschauungs-)Ebene kann man als R2 = R × R be-
schreiben. Sind A und B endliche Intervalle in R, so kann P (M) = {A | A ⊆ M}
man die Menge
die Potenzmenge von M. Ihre Elemente sind sämtliche Teil-
A × B = {(a, b) | a ∈ A , b ∈ B} mengen von M; man beachte, dass nach dem Satz auf Seite
35 für jede Menge M die leere Menge ∅ und M Elemente
als rechteckige Fläche zeichnen, siehe Abbildung 2.6. von P (M) sind. Für die Potenzmenge von M ist auch die
Schreibweise 2M gebräuchlich.

Beispiel Für die Potenzmenge der leeren Menge M = ∅


erhalten wir
P (M) = {∅} .
A A×B Man beachte den Unterschied: ∅ ist eine Menge, die kein Ele-
ment enthält, aber {∅} ist eine Menge, die genau ein Element,
nämlich die leere Menge ∅, enthält; es gilt:

∅ ⊆ ∅ und ∅ ∈ {∅} .

B Die Potenzmenge der Menge M = {1} lautet:


Abbildung 2.6 Darstellung des kartesischen Produkts A × B als Rechtecks-
fläche. P (M) = {∅, {1}} .
40 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Die Potenzmenge der Menge M = {1, 2} ist: Achtung: Einer vorgegebenen Menge ist zuweilen nicht
anzusehen, ob sie endlich ist oder nicht. Es ist bis heute nicht
P (M) = {∅, {1}, {2}, {1, 2}} . bekannt, ob die Mengen
M = {n ∈ N | 2n − 1 ist Primzahl} und
Und schließlich gilt für die Potenzmenge der Menge M =
{1, 2, 3}: F = {n ∈ N | 2n + 1 ist Primzahl}
endlich oder unendlich sind.
P (M) = {∅, {1}, {2}, {3}, {1, 2},
{2, 3}, {1, 3}, {1, 2, 3}} .  Wir formulieren einige Aussagen für die Mächtigkeiten end-
licher Mengen:
Man sieht, dass die Anzahl der Elemente der Potenzmenge
Mächtigkeiten und Mengenoperationen
von M mit der Anzahl der Elemente von M zunimmt. Im
nächsten Abschnitt werden wir dies genauer erläutern. Tat- Für endliche Mengen A, B und C gilt:
sächlich enthält die Potenzmenge einer unendlichen Menge (i) |A ∪ B| + |A ∩ B| = |A| + |B|.
M auch mehr Elemente als die bereits (unendliche) Menge (ii) |A × B| = |A| · |B|.
M. Das ist zwar schwer vorstellbar, man kann es aber bewei- (iii) |P (A)| = 2|A| .
sen (siehe Aufgabe 2.18).
Wir verallgemeinern Durchschnitt und Vereinigung auf be- Beweis: (i) Es ist |A| + |B| die Gesamtzahl der Elemente
liebige nichtleere Teilmengen X von P (M). Für ∅  = X ⊆ aus A und B. Elemente, die sowohl in A als auch in B auf-
P (M), d. h. X ist eine nichtleere Menge von Teilmengen von tauchen – das sind genau die Elemente in A ∩ B – werden in
M, ist der Menge A ∪ B aber nur einmal gezählt. Daher ergibt sich
  die Formel in (i).
X= A = {x ∈ M | ∀ A ∈ X : x ∈ A}
(ii) Die Anzahl der Möglichkeiten geordnete Paare (a, b) mit
A∈X
a ∈ A und b ∈ B zu bilden ist genau |A| · |B|.
der Durchschnitt von X und (iii) Gilt A = ∅, so erhalten wir P (A) = {∅} und somit die
  gewünschte Formel
X= A = {x ∈ M | ∃ A ∈ X : x ∈ A}
A∈X
1 = |P (A)| = 2|A| = 20 .
Wir bestimmen nun im Fall A  = ∅, etwa A = {a1 , . . . , an },
die Vereinigung von X. die Anzahl der Möglichkeiten, eine Teilmenge M von A zu
wählen. Das Element a1 kann in M liegen oder eben nicht, das
sind zwei Möglichkeiten, das Element a2 kann ebenfalls in M
Die Mächtigkeit einer Menge M ist die Anzahl liegen oder eben nicht, das sind erneut zwei Möglichkeiten.
der Elemente von M Das setzt man fort bis zum Element an und erhält genau
2n = 2|A| Möglichkeiten, eine Teilmenge M von A wählen
Eine präzise Definition einer endlichen Menge werden wir zu können. 

auf Seite 45 nachreichen. Für die nächsten Betrachtungen


reicht die Vorstellung aus, dass eine endliche Menge M da- Kommentar: Wir haben |M| = ∞ für jede unendliche
durch gegeben ist, dass M nur endlich viele Elemente enthält. Menge M gesetzt. Tatsächlich ist das für viele Zwecke un-
Wir nennen genau. So gibt es z. B. mehr reelle Zahlen, als es natürliche
 Zahlen gibt, und noch größer als R ist die Potenzmenge P (R).
|M| =
n , falls M endlich ist und n Elemente enthält, Diese quantitativen Unterschiede kann man mit einer feine-
∞ , falls M nicht endlich ist ren Definition von Kardinalzahlen erfassen, für die man auch
eine Addition + und Multiplikation · in sinnvoller Weise er-
die Mächtigkeit oder Kardinalzahl von M, z. B. gilt: klären kann. Es ist bemerkenswert, dass die obigen drei For-
meln auch für beliebige unendliche Kardinalzahlen gelten.
|{2, 3, 5, 7}| = 4 , |∅| = 0 , |{7, 7}| = 1 , |R| = ∞ .

2.3 Abbildungen
Kommentar: Neben |M| sind auch die Schreibweisen
Oftmals wird der Begriff Abbildung von einer Menge X in
card(M) und #M eine Menge Y als eine Vorschrift erklärt, die jedem x in X
genau ein y in Y zuordnet. Wir sind etwas genauer und ver-
für die Mächtigkeit von M üblich. meiden eine Definition durch einen nicht definierten Begriff.
2.3 Abbildungen 41

Eine Abbildung f ist durch Definitionsmenge, Wir werden für die Abbildung f = (X, Y, Gf ) meist deut-
Wertemenge und Graph gegeben licher
f : X → Y, x → f (x)
Man beachte, dass bei der folgenden Definition X = Y und schreiben oder 
auch X = ∅ oder Y = ∅ zugelassen sind. X → Y,
f:
x → f (x).
Definition einer Abbildung Man beachte die beiden verschiedenen Pfeile. Jener ohne
Querstrich zeigt von der Definitionsmenge X zur Werte-
Gegeben seien zwei Mengen X und Y . Eine Abbildung
menge Y von f , jener mit Querstrich steht zwischen den
f von X in Y ist ein Tripel
Elementen der Paare (x, f (x)) ∈ Gf .
f = (X, Y, Gf ) , wobei Gf ⊆ X × Y
Achtung: In der Definition einer Abbildung wird verlangt,
die Eigenschaft hat, dass es zu jedem x ∈ X genau ein dass jedes x ∈ X genau ein Bild y ∈ Y besitzt. Es wird nicht
y ∈ Y gibt mit (x, y) ∈ Gf . verlangt, dass jedes y ∈ Y (genau) ein Urbild x ∈ X besitzt
Für das durch x eindeutig bestimmte Element y schrei- (vgl. auch Abbildung 2.7).
ben wir f (x). Anstelle von „f ist eine Abbildung von X in Y “ sagt man
Die Menge X heißt Definitionsmenge von f , Y heißt auch „f ist eine Abbildung von X nach Y “. Wir bevorzugen
Wertemenge von f und Gf der Graph von f . in, da dies deutlicher macht, dass nicht jedes Element in der
Wertemenge auch Bild eines Elements aus der Definitions-
menge zu sein braucht.
Bei der Definitionsmenge spricht man auch vom Definitions-
bereich, und anstelle von Wertemenge sagt man auch Wer-
tebereich. Der Graph Gf ⊆ X × Y ist meist nicht explizit Sind X und Y endliche Mengen, so kann man sich Abbildun-
angegeben, sondern durch die Vorschrift, wie man f (x) aus gen auch mithilfe von Pfeilen veranschaulichen (Abb. 2.7).
x gewinnt.
Wir haben Abbildungen als ein Tripel (X, Y, Gf ) von Men-
gen definiert, weil damit verständlich wird, dass zwei Abbil-
dungen nur dann gleich sind, wenn ihre Definitionsmengen,
ihre Wertemengen und ebenso ihre Graphen übereinstimmen.
So ist zum Beispiel für jede echte Teilmenge X   X oder
Y  Y

g = (X , Y, Gg ⊆ X ×Y ) oder h = (X, Y  , Gh ⊆ X ×Y  )


X Y
etwas anderes als
Abbildung 2.7 Von jedem x ∈ X muss genau ein Pfeil ausgehen, und der darf
bei einem beliebigen y ∈ Y enden.
f = (X, Y, Gf ⊆ X × Y ) ,
Beispiel
obwohl es durchaus sein kann, dass die Graphen Gf , Gg Für jede Menge X ist
und Gh jeweils die gleichen sind; man beachte das folgende 
Beispiel. X → X,
x → x
Beispiel Die drei Abbildungen
eine Abbildung von X in sich. Sie heißt die Identität auf
(1) g = (R, R, 2
{(x, x ) | x ∈ R}) , X und wird mit idX oder IdX bezeichnet.

(2) h = (R≥0 , R, {(x, x 2 ) | x ∈ R≥0 }) ,


Es ist 
R>0 → R,
f:
(3) k = (R, R≥0 , {(x, x 2 ) | x ∈ R}) x → x 2 + x − 1
eine Abbildung von R>0 in R. Abbildungen von Teilmen-
sind verschieden, obwohl die Graphen Gg und Gk gleich gen von Rn bzw. Cn in Teilmengen von Rm bzw. Cm nennt
sind. Es gilt nämlich man auch Funktionen und wählt gerne die Schreibweise

(1) Gg = {(x, x 2 ) | x ∈ R} ⊆ R × R , f : R>0 → R , f (x) = x 2 .


(2) Gh = {(x, x 2 ) | x ∈ R≥0 } ⊆ R≥0 × R , Nur dann, wenn aus dem Kontext die Wertmenge und
(3) Gk = {(x, x 2 ) | x ∈ R} ⊆ R × R≥0 .  der Definitionsbereich einer Funktion klar erkennbar
42 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

sind, sprechen wir gelegentlich kurz von der Funktion Wir dehnen diese Begriffe auf naheliegende Art und Weise
y = f (x) oder f (x) = x 2 . auf Teilmengen von X bzw. Y aus.
Es ist  Ist f : X → Y eine Abbildung, so heißt für jede Teilmenge
P (N) → N0 ∪ {∞}, A ⊆ X und B ⊆ Y die Menge
g:
x → |x|
eine Abbildung von der Potenzmenge von N in N0 ∪ {∞}. f (A) = {f (a) | a ∈ A} ⊆ Y
Daher ist x eine Teilmenge von N und |x| ihre Mächtigkeit.
die Bildmenge von A unter f oder das Bild von A unter f
Eine Abbildung a von der Menge der natürlichen Zahlen und die Menge
N in R 
N → R,
a: f −1 (B) = {x ∈ X | f (x) ∈ B} ⊆ X
n  → a(n)
nennt man auch eine reelle Folge, anstelle von a(n) die Urbildmenge von B unter f oder das Urbild von B unter
schreibt man an und für die Abbildung a kurz (an )n∈N . f . Im Fall einer einelementigen Menge Y , d. h. Y = {b}, gilt
Folgen spielen eine zentrale Rolle in der Mathematik, wir
haben ihnen das Kapitel 8 gewidmet. f −1 ({b}) = {x ∈ A | f (x) = b} .
Etwas allgemeiner als reelle Folgen sind Familien. Sind I
und X beliebige Mengen, so nennt man jede Abbildung Beispiel Wir betrachten die Abbildung
 
I → X, P (N) → N0 ∪ {∞},
x: g:
i  → xi = x(i) x → |x|.

eine Familie von Elementen aus X. Für die Abbildung x Die Bildmenge von A = {∅, {2}, {56}} ⊆ P (N) ist g(A) =
schreibt man kurz (xi )i∈I – die Definitionsmenge I der {0, 1}, und die Urbildmenge von {2} ⊆ N0 ∪ {∞} ist die
Familie x dient also als Indexmenge. Die Bilder der Indizes Menge aller zweielementigen Teilmengen von N. 
i sind die Elemente xi ∈ X. Wir schreiben für die Familie
x auch kurz
Achtung: Bei einer einelementigen Menge B = {b} ⊆ Y
x = {(i, xi ) | i ∈ I } . schreibt man gerne einfacher f −1 (b) anstelle f −1 ({b}),
Im Fall I = N und X = R erhalten wir die reellen Fol-
gen zurück. Sind die Elemente xi von X wiederum Men- f −1 (b) = {x ∈ X | f (x) = b} ⊆ X .
gen, so nennt man die Familie (xi )i∈I auch ein Mengen-
Diese Schreibweise ist aber mit Vorsicht zu genießen. Man-
system. 
che Abbildungen f haben eine sogenannte Umkehrabbil-
dung. Für diese Umkehrabbildung ist die Schreibweise f −1
? üblich. Es ist dann f −1 (y) das Bild von y unter der Abbil-
Für die Menge aller Abbildungen f von X in Y ist auch dung f −1 , insbesondere also ein Element der Bildmenge der
die Schreibweise Y X üblich. Zeigen Sie, dass im Falle Abbildung f −1 . Bei obiger Schreibweise ist aber f −1 (y) =
|X|, |Y | ∈ N gilt: f −1 ({y}) eine Teilmenge der Definitionsmenge von f . Wir
werden die etwas umständlichere Schreibweise f −1 ({y}) be-
|Y X | = |Y ||X| . vorzugen, um solche Verwirrungen gar nicht aufkommen zu
lassen.

Sowohl Elemente als auch Teilmengen können Zwei Abbildungen sind gleich, wenn sie die
Bilder und Urbilder haben gleiche Definitions- und Wertemenge haben
und die Bilder jeweils gleich sind
Ist f : X → Y eine Abbildung, so heißt y = f (x) ∈ Y das
Bild von x unter der Abbildung f – es ist y durch f eindeu-
Eine Abbildung ist f dann vollständig definiert, wenn ihre
tig bestimmt. Und das Element x ∈ X heißt ein Urbild des
Definitionsmenge X, ihre Wertemenge Y und ihr Graph
Elements y ∈ Y – das Element x ist durch f und y nicht
notwendig eindeutig bestimmt.
Gf = {(x, f (x)) | x ∈ X} ⊆ X × Y
y = f (x)
angegeben sind. In den folgenden Beispielen wird der Graph
↑ ↑ Gf häufig implizit durch die Abbildungsvorschrift x →
das Bild von x ein Urbild von y f (x) angegeben.
2.3 Abbildungen 43

Beispiel Die Abbildungen Man beachte, dass f |A = (A, Y, Gf |A ) mit


 
R → R, N → N,
f: und g: Gf |A = {(x, f (x)) | x ∈ A} ⊆ A × Y
x → x 2 x → x 2

haben identische Abbildungsvorschriften, nämlich x  → x 2 ; natürlich wieder eine Abbildung ist. Im Fall A = X gilt
man schreibt bei der expliziten Angabe der Vorschrift auch f |A = f .
f (x) = x 2 . Aber die Abbildungen haben sehr verschiedene
Beispiel Die Restriktion der Funktion
Eigenschaften:
√ √ 
y = 2 hat unter f die zwei Urbilder 2 und − 2; R → R,
f:
y = 2 hat unter g kein Urbild.  x → x 3
Sind f und g zwei Abbildungen von X nach Y , etwa
auf N, das ist die Abbildung
Gf = {(x, f (x)) | x ∈ X} und Gg = {(x, g(x)) | x ∈ X} , 
N → R,
so folgt unmittelbar aus der Gleichheit von Mengen und jener f |N : ,
n  → n3
von geordneten Paaren:
ist die reelle Folge (n3 )n∈N . 
Gleichheit von Abbildungen
Für zwei Abbildungen f, g : X → Y gilt:
?
f = g ⇔ f (x) = g(x) ∀x ∈ X. Geben Sie eine Funktion f : A → B an, sodass f |A dasselbe
Bild wie f hat, obwohl A eine echte Teilmenge von A ist.
Beispiel Es seien f und g Abbildungen von N nach N0 ,
wobei
f (x) = kleinster nicht negativer Rest bei ganzzahliger Divi- Kommentar: In der Mathematik steht man oft vor dem
sion von x durch 3. umgekehrten Problem, dem sogenannten Fortsetzungspro-
blem: Gegeben ist eine Abbildung f : A → Y und eine A
g(x) = kleinster nicht negativer Rest bei ganzzahliger Divi- umfassende Menge X, d. h. A ⊆ X. Das Problem lautet: Gibt
sion von x 3 durch 3. es eine Abbildung f˜ : X → Y mit f˜|A = f , die eine gewisse
Die beiden Abbildungsvorschriften sind verschieden, aber es geforderte Eigenschaft besitzt.
gilt:
f (1) = 1 = g(1) , f (2) = 2 = g(2) , f (3) = 0 = g(3) .
Allgemein erhält man f (x) = g(x) für alle x ∈ N. Das liegt Das Auswahlaxiom garantiert die Existenz
daran, dass n3 − n = (n − 1) n (n + 1) ein Vielfaches von 3
einer Auswahlfunktion
ist. Die Abbildungen f und g sind somit gleich. 

Wir haben in einem Abschnitt auf Seite 38 das kartesische


Die Restriktion einer Abbildung f ist eine Produkt für endlich viele Mengen A1 , . . . , An eingeführt. Es
Teilmenge von f macht keinerlei Schwierigkeiten, das Produkt auf beliebige
Mengensysteme auszudehnen: Ist I eine beliebige (Index-)
Wir werden sowohl in der Analysis wie auch in der linea- menge und (Xi )i∈I ein Mengensystem, so nennt man
ren Algebra häufig Abbildungen einschränken, d. h. wir be-  
trachten eine gegebene Abbildung f : X → Y nur auf einer  
Xi = f : I → Xi | f (i) ∈ Xi für alle i ∈ I
Teilmenge A ⊆ X. Weil wir den Definitionsbereich ändern,
i∈I i∈I
betrachten wir eine neue Abbildung, für diese müssen wir ein
neues Symbol einführen. das kartesische Produkt von (Xi )i∈I . Man beachte zwei
spezielle Fälle:
Definition der Restriktion einer Abbildung
Ist I = {1, . . . , n}, so stimmt die Definition mit dem be-
Ist f : X → Y eine Abbildung, so nennt man für jede
reits definierten (endlichen) kartesischen Produkt überein:
Teilmenge A ⊆ X die Abbildung
  
n
A → Y, Xi = Xi .
f |A :
x  → f (x) i∈I i=1

die Restriktion oder Einschränkung von f auf A.

Ist Xi = ∅ für ein i ∈ I , so ist i∈I Xi = ∅.


44 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Etwas Ähnliches hat man bei dem Produkt von Zahlen: Ist im Je zwei verschiedenen Elementen aus X sind auch zwei
Produkt a1 · · · an ein Faktor ai = 0, so ist a1 a2 · · · an = 0. verschiedene Elemente aus Y zugeordnet und
jedes Element aus Y wird einem x zugeordnet,
Was aber passiert, wenn Xi  = ∅ ist für alle i ∈ I ? Solange die
Menge I endlich ist, z. B. |I | = n, ist alles unproblematisch: die eine Abbildung haben kann, Namen:
Das kartesische Produkt ist dann nichtleer, da Elemente des
kartesischen Produkts explizit in der Form (x1 , . . . , xn ) mit Definition von Injektivität, Surjektivität und Bijek-
xi ∈ Xi angegeben werden können. Falls I unendlich ist, so tivität
sagt das Auswahlaxiom der Mengenlehre:
Eine Abbildung f : X → Y heißt
injektiv, falls aus f (x1 ) = f (x2 ) für x1 , x2 ∈ X
Das Auswahlaxiom folgt x1 = x2 ,
Ist I = ∅ eine Menge und (Xi )i∈I ein Mengensystem surjektiv, falls zu jedem y ∈ Y ein x ∈ X existiert
nichtleerer

Mengen Xi , so ist auch das kartesische Pro- mit f (x) = y,
dukt i∈I Xi nichtleer, bijektiv, falls f injektiv und surjektiv ist.

Xi  = ∅ . Wir können die Definitionen auch anders formulieren, es gilt
i∈I nämlich offenbar:
Eine Abbildung f : X → Y ist genau dann injektiv, wenn
Achtung: Das Auswahlaxiom ist ein Axiom. Die Aussage für x1 = x2 aus X stets f (x1 ) = f (x2 ) folgt.
des Axioms ist nicht beweisbar, wir erkennen sie dennoch als Eine Abbildung f : X → Y ist genau dann injektiv, wenn
gültig an (vgl. Seite 3). Wir werden stets deutlich machen, zu jedem y ∈ Y höchstens ein x ∈ X mit f (x) = y
wann wir von dem Axiom Gebrauch machen. existiert.
Eine Abbildung f : X → Y ist genau dann surjektiv, wenn
Nach dem Auswahlaxiom gibt es eine Auswahlfunktion f (X) = Y gilt.
 Eine Abbildung f : X → Y ist genau dann surjektiv, wenn
f:I → Xi mit f (i) ∈ Xi ∀ i ∈ I , zu jedem y ∈ Y mindestens ein x ∈ X mit f (x) = y
i∈I existiert.
d. h. eine Abbildung f , die aus jeder der Mengen Xi genau Eine Abbildung f : X → Y ist genau dann bijektiv, wenn
ein Element, nämlich f (i), auswählt. zu jedem y ∈ Y genau ein x ∈ X mit f (x) = y existiert.
Wir verdeutlichen die Problematik an einem Beispiel. Alle diese Kennzeichnungen sind wichtig, man sollte sich
diese daher gut einprägen. Die bijektiven Abbildungen sind
Beispiel Gegeben seien unendlich viele Paare von Schu- gerade jene Abbildungen, die man umkehren kann, auf diese
hen, das sind unsere unendlich vielen nichtleeren Mengen Kennzeichnung kommen wir bald zu sprechen.
Xi , |I | = ∞, mit |Xi | = 2. Gibt es eine Auswahlvorschrift
Für endliche Mengen kann man sich die Begriffe an einer
(eine Funktion), die (simultan) aus jedem Paar von Schuhen
Skizze veranschaulichen (siehe Abb. 2.8).
genau ein Element, d. h. genau einen Schuh, auswählt? Ja! –
z. B. die folgende: Eine injektive bzw. surjektive bzw. bijektive Abbildung nennt
man oft auch kürzer Injektion bzw. Surjektion bzw. Bijek-
f ordnet jedem Paar von Schuhen den linken Schuh des Paa-
tion.
res zu.
Nun dasselbe für Socken statt Schuhe. Gibt es eine Aus- Beispiel
wahlvorschrift, die aus jedem Sockenpaar genau eine Socke Ist M die Menge aller Menschen und bezeichnet |KH(m)|
auswählt? Wie könnte eine solche Vorschrift lauten? die Anzahl der Kopfhaare von m ∈ M, so ist die Abbil-
dung 
Das Auswahlaxiom besagt, dass es eine Auswahlfunktion
M → N0 ,
gibt; das ist eine schwache Existenzaussage. Bei den Schuhen f:
m → |KH(m)|
hatten wir mehr, nämlich die explizite Angabe einer solchen
Auswahlfunktion.  weder injektiv noch surjektiv. Es gibt nämlich minde-
stens zwei (verschiedene) Menschen m1 und m2 , die keine
Wir kommen in Kürze erneut auf das Auswahlaxiom zu spre- Kopfhaare haben, d. h. |KH(m1 )| = |KH(m2 )|, sodass f
chen. nicht injektiv ist. Und es gibt sicherlich keinen Menschen,
der 1010 ∈ N Kopfhaare hat. Folglich ist f auch nicht sur-
jektiv.
Injektiv plus surjektiv ist bijektiv Die Abbildung

Bei einer Abbildung f : X → Y ist jedem x ∈ X genau ein N → N,
f:
y ∈ Y zugeordnet. Wir geben den zusätzlichen Eigenschaften n → n + 1
2.3 Abbildungen 45

injektiv, injektiv,
surjektiv nicht surjektiv ?
Ist die Abbildung

N → N0 ,
f:
n → n − 1

injektiv, surjektiv oder bijektiv ?

nicht injektiv, nicht injektiv,


Kommentar: Man kann zu jeder injektiven Abbildung f
surjektiv nicht surjektiv durch Einschränkung der Wertemenge auf das Bild von f
eine bijektive Abbildung erklären: Ist

f:X→Y

injektiv, so ist die Abbildung



X → f (X)
f˜ :
x → f (x)

Abbildung 2.8 Illustration der Eigenschaften injektiv und surjektiv. Nur die bijektiv.
Abbildung links oben ist sowohl injektiv als auch surjektiv, also bijektiv.

ist injektiv, da gilt:


Zwei Mengen sind gleichmächtig, wenn es
n + 1 = f (n) = f (m) = m + 1 impliziert n = m . eine Bijektion zwischen ihnen gibt

Die Abbildung f ist nicht surjektiv, da das Element 1 ∈ N Wir werden nun Mengen nach ihrer Größe klassifizieren. Da-
nicht als Bild auftritt: bei werden uns injektive, surjektive und bijektive Abbildun-
gen als Maßstab dienen.
 n ∈ N mit f (n) = 1 .
Gleichmächtige Mengen
Da f nicht surjektiv ist, ist f auch nicht bijektiv.
Die Abbildung Zwei Mengen A und B heißen gleichmächtig, wenn es
eine bijektive Abbildung f : A → B gibt. Wir schreiben

N → {±1}, dann
f: A ∼ B oder |A| = |B| .
n  → (−1)n

ist surjektiv (f (1) = −1 und f (2) = 1), aber nicht injek- Man schreibt weiterhin
tiv (f (1) = f (3)) und somit auch nicht bijektiv.
Für jede Menge X ist die Abbildung idX : X → X, |A| ≤ |B| ,
idX (x) = x eine Bijektion.
Für die Abbildungen wenn es eine injektive Abbildung von A in B gibt, und
 
R → R, R≥0 → R, |A| < |B|
f1 : f2 :
x → x 2 , x → x 2 ,
  für
R → R≥0 , R≥0 → R≥0 ,
f3 : f4 : |A| ≤ |B| , jedoch |A|  = |B| ;
x → x 2 , x → x 2
d. h., es gibt eine injektive Abbildung von A in B, aber keine
gilt: bijektive. In dieser Situation sagt man auch „A hat eine klei-
 f1 ist weder surjektiv (−1  ∈ f (R)) noch injektiv nere Mächtigkeit als B“ oder „B hat eine größere Mächtigkeit
(f (−1) = f (1)). als A“.
 f2 ist nicht surjektiv (−1  ∈ f (R)) aber injektiv
Im Fall
(f (x) = f (y) ⇒ x = y).
√ |A| = |{1, 2 . . . , n}| ,
 f3 ist surjektiv (y ∈ R≥0 ⇒ f ( y) = y) aber nicht
injektiv (f (−1) = f (1)). d. h., es gibt eine Bijektion von A in {1, 2 . . . , n}, setzt man
 f4 ist sowohl surjektiv (siehe f3 ) als auch injektiv |A| = n und nennt A endlich, wenn es ein n ∈ N0 gibt mit
(siehe f2 ).  |A| = n.
46 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Bei Abbildungen zwischen endlichen und gleichmächtigen gilt für jedes n ∈ N:


Mengen folgt die Bijektivität aus der Injektivität bzw. Sur-
jektivität, es gilt nämlich: |Z| = |n Z| .

Lemma Die Mengen N0 und Z sind gleichmächtig, |N0 | = |Z|,


Für jede Abbildung f : A → B zwischen endlichen und das folgt aus der Bijektivität der Abbildung
gleichmächtigen Mengen A und B, d. h. |A| = |B| ∈ N0 ,

sind äquivalent: N0 → Z,
f: 1
(i) f ist injektiv, n → 4 (1 − (−1) (2n + 1)).
n

(ii) f ist surjektiv, Es gilt f (0) = 0. Für alle ungeraden n ∈ N, n = 2 k − 1


(iii) f ist bijektiv. mit k ∈ N gilt f (2 k − 1) = k, und für alle geraden n ∈ N,
n = 2 k mit k ∈ N gilt f (2 k) = −k. Folglich ist f surjek-
tiv. Die Abbildung f ist auch injektiv, denn aus f (n) =
Beweis: (i) ⇒ (ii): Die Abbildung f : A → B sei injektiv. f (m) folgt zunächst (−1)n (2n + 1) = (−1)m (2m + 1).
Dann gilt Aus Vorzeichengründen folgt weiter, dass n und m beide
|f (A)| = |A| = |B| . gerade oder beide ungerade sind. Daraus wiederum folgt
Aus f (A) ⊆ B folgt damit f (A) = B. Somit ist f surjektiv. 2n + 1 = 2m + 1 und somit n = m. Also ist f tatsächlich
bijektiv.
(ii) ⇒ (iii): Die Abbildung f : A → B sei surjektiv. Ange- Das Intervall (−1, 1) = {x ∈ R | −1 < x < 1} ist
nommen, es gibt a, a  ∈ A mit a  = a  und f (a) = f (a  ). gleichmächtig zu R. Es ist nämlich
Dann folgt:
|f (A)| < |A| = |B| . ⎧
⎨(−1, 1) → R,
Das ist ein Widerspruch zu f (A) = B. Damit ist begründet, f: x
⎩ x →
dass f injektiv und somit bijektiv ist. 1 − x2
(iii) ⇒ (i): Falls f bijektiv ist, so ist f auch injektiv. 
eine Bijektion. Den Nachweis hierfür haben wir als
Übungsaufgabe gestellt. 
Im Fall |A| = |N| heißt A abzählbar; es gibt dann eine bi-
jektive Abbildung i → xi von N auf A – man kann also die Jede endliche Menge hat weniger Elemente als die unend-
Elemente von A abzählen: x1 , x2 , x3 . . . Die unendlichen liche Menge N. Die unendliche Menge N hat wiederum we-
Mengen A kann man durch |N| ≤ |A| charakterisieren, d. h., niger Elemente als die unendliche Menge R. Wir zeigen nun,
eine Menge A ist genau dann unendlich, wenn es eine injek- dass sich diese Folge von größer werdenden Mengen beliebig
tive Abbildung von N in A gibt. Auf Seite 122 zeigen wir: fortsetzen lässt. Die Potenzmenge einer Menge hat nämlich
immer eine echt größere Mächtigkeit als die zugrunde lie-
|Q| = |N × N| = |N| gende Menge. Folglich gibt es beliebig große Mengen.
– abzählbar mal abzählbar bleibt abzählbar.
Mit dem Intervallschachtelungsprinzip oder dem berühmten Die Mächtigkeit der Potenzmenge
Cantor’schen Diagonaltrick kann man Für jede Menge A gilt |A| < |P (A)|.

|N| < |R|


Beweis: Die Abbildung ι : A → P (A), a → {a} ist in-
begründen (siehe Seite 123). Somit ist die nicht endliche jektiv, sodass |A| ≤ |P (A)| gilt. Wir begründen, dass keine
Menge R nicht abzählbar. Eine nicht endliche Menge, die surjektive Abbildung von A auf P (A) existiert.
nicht abzählbar ist, nennt man überabzählbar. Bei solchen
Angenommen, es gibt eine surjektive Abbildung f : A →
Mengen kann man die Elemente nicht mehr mit den natür-
P (A). Für jedes a ∈ A ist dann f (a) ⊆ A. Wir betrachten
lichen Zahlen durchnummerieren. Die Menge R ist ein Bei-
die Menge B = {a ∈ A | a ∈ f (a)} ∈ P (A). Weil f
spiel einer überabzählbaren Menge.
surjektiv ist, gibt es ein a ∈ A mit f (a) = B.
Beispiel 1. Fall: a ∈ B. Dann ist a ∈ A und a ∈ f (a) = B, ein
Für jede natürliche Zahl n ist die Abbildung Widerspruch.

Z → n Z, 2. Fall: a ∈ B. Dann ist a ∈ A und a ∈ B = f (a), also doch
f:
z → n z a ∈ B, ein Widerspruch.
injektiv (aus f (z1 ) = f (z2 ) folgt z1 = z2 ) und surjektiv Da in beiden Fällen ein Widerspruch eintritt, muss die An-
(das Element n z ∈ n Z ist Bild von z ∈ Z unter f ). Daher nahme falsch sein. 
2.3 Abbildungen 47

Man kann Abbildungen hintereinander Der Fall X = Y = Z ist besonders interessant. Sind f und
ausführen, falls die Bildmenge der einen im g zwei Abbildungen von einer Menge X in sich,
Definitionsbereich der anderen liegt f : X → X und g : X → X ,
Sind f eine Abbildung von X in Y und g eine Abbildung so ist auch g ◦ f eine Abbildung von X in sich. Dadurch ist
von Y in Z, eine Multiplikation auf der Menge aller Abbildungen von
f : X → Y und g : Y → Z , X nach X erklärt. Diese Multiplikation hat ein sogenanntes
Einselement, die identische Abbildung:
so können wir die beiden Abbildungen hintereinander aus-
führen, d. h., wir bilden aus den beiden Abbildungen f und idX ◦f = f und f ◦ idX = f .
g das Produkt g ◦ f :
Man beachte, dass diese Multiplikation nicht kommutativ ist,
Die Komposition von Abbildungen im Allgemeinen gilt:
Es seien f : X → Y und g : Y → Z Abbildungen. Dann f ◦ g = g ◦ f .
ist 
X → Z,
g◦f:
x  → g(f (x)) Beispiel Gegeben sind die Abbildungen
eine Abbildung von X nach Z. Diese heißt die Kompo-  
sition oder Hintereinanderausführung oder Verket- R → R, R → R,
f: und g : .
tung von f und g. x → x 2 x → 2 x + 1

Dann gilt:
Das Bild (g ◦ f )(x) von x unter der Abbildung g ◦ f entsteht
durch Anwenden von g auf das Bild f (x) von x unter f . g(f (x)) = 2 x 2 + 1 und f (g(x)) = 4 x 2 + 4x + 1 .
Achtung: Nicht immer können zwei Abbildungen f und g Folglich gilt g ◦ f = f ◦ g. 
zu einer Abbildung g ◦ f zusammengesetzt werden. Möglich
ist das genau dann, wenn das Bild von f im Definitionsbe- Aber – und das ist wichtig! – diese Multiplikation ist asso-
reich von g liegt (siehe Abb. 2.9). ziativ:

g Die Komposition ist assoziativ


Dg
Gegeben seien drei Abbildungen:
f
f1 : X1 →X2 , f2 : X2 →X3 , f3 : X3 →X4 .
Wg◦f
f (Df )
Df Dann sind f3 ◦ (f2 ◦ f1 ) und (f3 ◦ f2 ) ◦ f1 Abbildungen
von X1 nach X4 , und es gilt:

Wf f3 ◦ (f2 ◦ f1 ) = (f3 ◦ f2 ) ◦ f1 .
g◦f

Abbildung 2.9 Eine Verkettung von Abbildungen ist nur dann möglich, wenn
Beweis: Sowohl f3 ◦ (f2 ◦ f1 ) als auch (f3 ◦ f2 ) ◦ f1 sind
der Bildbereich der ersten im Definitionsbereich der zweiten enthalten ist. Abbildungen von X1 nach X4 . Zu zeigen ist daher nur, dass
für jedes x ∈ X1 beide Abbildungen dasselbe Element in X4
Beispiel Die beiden Abbildungen liefern, und das sieht man ganz einfach durch Auswerten der
  Abbildungen für ein (beliebiges) x ∈ X1 :
N → R, R≥0 → R≥0 ,
f: und g : √
n → n1 x → x (f3 ◦ (f2 ◦ f1 ))(x) = f3 ((f2 ◦ f1 )(x)) = f3 (f2 (f1 (x))) ,
können zu ⎧ ((f3 ◦ f2 ) ◦ f1 )(x) = (f3 ◦ f2 )(f1 (x)) = f3 (f2 (f1 (x))) .
⎨N → R≥0 ,
g◦f: 
⎩ n → 1 Somit sind die beiden Abbildungen gleich. 
n
verkettet werden. Hingegen ist das für Bei dieser Multiplikation von Abbildungen tauchen Ähnlich-
  keiten zu Zahlenmengen auf. Wir betrachten die Menge M
N → R, R≥0 → R≥0 ,
f: und g : √ aller Abbildungen f einer Menge X in sich mit der Mul-
n → − n1 x → x
tiplikation ◦ – man schreibt dafür (M, ◦). Wir vergleichen
nicht möglich, weil Quadratwurzeln im Reellen nur für po- diese algebraische Struktur (M, ◦) z. B. mit (Z, +). In bei-
sitive Argumente definiert sind.  den Strukturen gilt das Assoziativgesetz und beide enthalten
48 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

ein Einselement, in (M, ◦) ist das idX , in (Z, +) lautet es Daher können wir zu jedem bijektiven f eine weitere Abbil-
0. Die Verknüpfung ◦ in M ist nicht kommutativ, die Ver- dung g : Y → X definieren: Wir setzen
knüpfung + in Z hingegen schon. Es ist ein wesentlicher
und notwendiger Abstraktionsschritt, sich daran zu gewöh- g(y) = x für das (eindeutige) x mit f (x) = y .
nen, dass man mit Abbildungen rechnen kann als wären es
Zahlen. Die Abbildungen f : X → Y und g : Y → X können wir
hintereinander ausführen, wir können sowohl f ◦ g wie auch
g ◦ f bilden, da die Bildmenge von f bzw. g in der De-
Genau die bijektiven Abbildungen sind finitionsmenge von g bzw. f liegt. Wir werten nun diese
Abbildungen
umkehrbar
g ◦ f : X → X und f ◦ g : Y → Y
Wir zeigen, dass sich die bijektiven Abbildungen umkehren
lassen. Wir stellen diesem wichtigen Satz von der Umkehr- für x ∈ X und y ∈ Y aus:
abbildung ein Lemma voran.
g ◦ f (x) = g(f (x)) = g(y) = x = idX (x) und
Lemma f ◦ g(y) = f (g(y)) = f (x) = y = idY (y) .
Für Abbildungen f : X → Y und g : Y → X gelte:
Mit dem Satz zur Gleichheit von Abbildungen auf Seite 43
f ◦ g = idY . folgt nun g ◦ f = idX und f ◦ g = idY , wir halten fest:
Dann sind f surjektiv und g injektiv.
Satz von der Umkehrabbildung
Beweis: Wir zeigen zuerst, dass f surjektiv ist: Es sei Ist f : X → Y eine bijektive Abbildung, so existiert
y ∈ Y gegeben. Wegen f ◦ g = idY gilt: genau eine Abbildung g : Y → X mit

f (g(y)) = y . g ◦ f = idX und f ◦ g = idY .

Somit ist y das Bild des Elements x = g(y) ∈ X unter f . Man nennt g die Umkehrabbildung oder die zu f in-
verse Abbildung. Man bezeichnet sie üblicherweise mit
Nun begründen wir, dass g injektiv ist: Dazu sei g(y1 ) = f −1 . Die Abbildung f −1 ist ebenfalls bijektiv und hat
g(y2 ) für y1 , y2 ∈ Y angenommen. Nun wenden wir die die Umkehrabbildung
Abbildung f an und erhalten
(f −1 )−1 = f .
f (g(y1 )) = f (g(y2 )) .

Wegen der Voraussetzung folgt y1 = y2 . 


Beweis: Die Existenz der Umkehrabbildung haben wir
schon gezeigt. Wir begründen die Eindeutigkeit von g: Ist
Falls also g ◦ f = idX und f ◦ g = idY gilt, so besagt dieses auch g  : Y → X eine Abbildung mit
Lemma, dass f und g injektiv und surjektiv sind.
f ◦ g  = idY und g  ◦ f = idX ,
Folgerung
Sind f : X → Y und g : Y → X zwei Abbildungen so folgt:
mit den Eigenschaften
g  = idX ◦g  = (g ◦ f ) ◦ g  = g ◦ (f ◦ g  ) = g ◦ idY = g .
g ◦ f = idX und f ◦ g = idY ,
Schließlich zeigt obige Folgerung, dass die Abbildung g, d. h.
so sind g und f bijektiv. f −1 , bijektiv ist. Und die beiden Gleichungen

Wir wollen diese Aussage nun umkehren, d. h., wir erklären f ◦ f −1 = idY und f −1 ◦ f = idX
zu einer bijektiven Abbildung f : X → Y eine neue Abbil-
dung g : Y → X, sodass die beiden Gleichheiten g◦f = idX zeigen wegen der bewiesenen Eindeutigkeit der Umkehrab-
und f ◦ g = idY erfüllt sind. bildung, dass f die Umkehrabbildung von f −1 ist, d. h.

Ist f : X → Y eine bijektive Abbildung, so existiert zu jedem f = (f −1 )−1 . 

y ∈ Y genau ein x ∈ X mit f (x) = y (beachte die Definition


auf Seite 44), d. h.
Existiert zu f eine Umkehrabbildung f −1 , so sagt man auch
−1
|f ({y})| = 1 für jedes y ∈ Y . kurz f ist umkehrbar oder f ist invertierbar.
2.4 Relationen 49

Achtung: Ist f : X → Y bijektiv und B ⊆ Y , so hat das Die Abbildung g ◦ f ist surjektiv: Zu jedem z ∈ Z existiert
Zeichen f −1 (B) nun zwei Bedeutungen: wegen der Surjektivität von g ein y ∈ Y mit g(y) = z. Zu
diesem y ∈ Y wiederum existiert wegen der Surjektivität
A1 = f −1 (B) = {x ∈ X | f (x) ∈ B}
von f ein x ∈ X mit f (x) = y. Insgesamt erhalten wir mit
ist die Urbildmenge von B unter f , und diesen x und y:

A2 = f −1 (B) g ◦ f (x) = g(f (x)) = g(y) = z ,

ist die Bildmenge von B unter f −1 . Das macht aber nichts, sodass das Element z ∈ Z ein Urbild x ∈ X bezüglich der
es gilt nämlich A1 = A2 . Das sieht man wie folgt: Abbildung g ◦ f hat. 

x ∈ A1 ⇔ f (x) = b ∈ B
⇔ x = f −1 (b) ∈ f −1 (B)
⇔ x ∈ A2 .
2.4 Relationen
Man beachte auch die grundverschiedenen Bedeutungen von Wir können aus jeder injektiven Abbildung eine bijektive Ab-
−1 −1 bildung machen. Dazu ist es nur notwendig, die Wertemenge
f (x) und (f (x)) .
einzuschränken, siehe den Kommentar auf Seite 45. Ist es
Das Element (f (x))−1 ist das Inverse von f (x) aber f −1 (x) auch möglich, aus einer surjektiven Abbildung eine bijek-
ist das Bild von x unter der Abbildung f −1 . tive zu machen? Die Antwort ist ja, wir zeigen das in diesem
Abschnitt. Wir werden dazu den Begriff der Gleichheit ver-
Beispiel gröbern. Wir werden Elemente einer Menge als äquivalent
Für jede Menge X ist id−1
X = idX .
bezeichnen, wenn sie gewisse vorgegebene gleiche Eigen-
Die Abbildung schaften haben. Diese zueinander äquivalenten Elemente fas-
 sen wir dann in Mengen zusammen und behandeln diese
N → N0 , Mengen wieder als Elemente einer Menge. Das hat eine Ähn-
f:
n → n − 1 lichkeit mit Schubläden – zueinander äquivalente Elemente
ist bijektiv, ihre Umkehrabbildung lautet werden in Schubläden gesteckt, und es wird dann mit den
 Schubläden anstelle der Elemente weitergearbeitet.
−1 N0 → N,
f : . Wir betrachten also erneut Mengen, wobei nun Elemente
n → n + 1
einer Menge zueinander in einem Verhältnis stehen. Ein sol-
ches Verhältnis, wir werden das als Relation bezeichnen, defi-
In der Analysis werden wir den Logarithmus
nieren wir zuerst sehr allgemein. Wir werden dann Ordnungs-
ln : R>0 → R , y  → ln y und Äquivalenzrelationen betrachten.
als die Umkehrabbildung der (bijektiven) Exponentialab-
bildung Eine Relation auf X ist eine Teilmenge von
exp : R → R>0 , x  → ex X×X
definieren. 
Es seien X und Y beliebige Mengen. Jede Teilmenge ρ ⊆
Die Hintereinanderausführung g ◦ f zweier Abbildungen f X × Y heißt (binäre bzw. zweistellige) Relation auf X × Y .
und g von einer Menge X in sich ist wieder eine Abbildung Wir werden nur binäre Relationen betrachten und sprechen
von X in sich. Sind g und f bijektiv, so ist auch g ◦f bijektiv. von nun an kurz von Relationen. Der Graph Gf einer Ab-
bildung f von X in Y ist eine Relation auf X × Y mit der
Die Komposition von bijektiven Abbildungen ist bi- zusätzlichen Eigenschaft, dass es zu jedem x aus X genau
jektiv ein y aus Y gibt.
Sind f : X → Y und g : Y → Z bijektiv, so ist auch
g ◦ f : X → Z bijektiv.
?
Vornehm ausgedrückt spricht man beim Graph einer Abbil-
dung f von einer linkstotalen und rechtseindeutigen Relation
auf X × Y – warum wohl ?
Beweis: Die Abbildung g ◦ f ist injektiv: Aus
Außerdem nennt man den Graph einer injektiven Abbildung
g(f (x)) = g(f (y)) auch linkseindeutig und den einer surjektiven auch rechtstotal
– warum wohl ?
mit x, y ∈ X folgt wegen der Injektivität von g
f (x) = f (y) .
Im Fall X = Y , das werden wir im weiteren stets vorausset-
Aus der Injektivität von f folgt nun x = y. zen, spricht man auch kurz von einer Relation auf X.
50 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Man beachte, dass eine Relation ρ auf X eine Menge von ge- jedes x ∈ R. Wir fassen die für uns wichtigen Eigenschaften,
ordneten Paaren aus X × X ist. Durch die Teilmenge ρ wer- die eine Relation haben kann, zusammen:
den ganz bestimmte Paare aus X ×X ausgezeichnet, nämlich
genau diejenigen, die zueinander in der Relation ρ stehen. Reflexiv, symmetrisch, antisymmetrisch und transitiv
Anstelle von (x, y) ∈ ρ schreibt man auch x ρ y und benutzt Eine Relation ρ auf der Menge X heißt:
die Sprechweise „x steht in Relation zu y“, reflexiv, wenn für alle x ∈ X gilt x ρ x,
symmetrisch, wenn für alle x, y ∈ X mit x ρ y gilt
x ρ y ⇔ (x, y) ∈ ρ . y ρ x,
antisymmetrisch, wenn für alle x, y ∈ X mit x ρ y
und y ρ x gilt x = y,
Beispiel
transitiv, wenn für alle x, y, z ∈ X mit x ρ y und
Auf der Menge N ist die Teilbarkeit | eine Relation. Dabei
y ρ z gilt x ρ z.
sagt man, eine natürliche Zahl a teilt eine natürliche Zahl
b, wenn es ein c ∈ N gibt mit a c = b. Als Schreibweise
verwendet man dafür a | b. Es gilt: Wir sehen uns erneut die letzten Beispiele an und erhalten:

| = {(a, b) ∈ N × N | a | b} . Beispiel
Die Relation | auf N ist reflexiv, antisymmetrisch und tran-
Zum Beispiel gilt (3, 3), (3, 9), (12, 36) ∈ | . sitiv.
Auf der Menge X aller Geraden der Ebene ist die Paral- Die Relation  auf der Menge X aller Geraden einer Ebene
lelität  eine Relation. Es gilt: ist reflexiv, symmetrisch und transitiv.
Die Relation ≤ auf R ist reflexiv, antisymmetrisch und
 = {(g, h) ∈ X × X | g  h} . transitiv.
Die Relation ≡ (mod n) auf Z ist reflexiv, symme-
Auf der Menge R der reellen Zahlen ist die Anordnung
trisch und transitiv. Wir weisen die Transitivität nach: Es
≤ eine Relation. Es gilt:
gelte a ≡ b (mod n) und b ≡ c (mod n). Folglich gilt
n | a − b und n | b − c. Hieraus erhalten wir
≤ = {(a, b) ∈ R × R | a ≤ b} .
a − b = r n und b − c = s n
Wir definieren eine Relation ρ auf der Menge Z der ganzen
Zahlen. Es seien n ∈ N und a, b ∈ Z. Wir sagen, a ist für ganze Zahlen r und s. Eine Addition dieser beiden
kongruent zu b modulo n, falls n die Zahl a − b teilt, Gleichungen liefert
kurz: a − c = (a − b) + (b − c) = (r − s) n ,
aρb ⇔ n | a −b.
d. h. n | a − c. Damit ist gezeigt a ≡ c (mod )n.
Für n = 3 gilt z. B. (5, 2), (−2, 1), (4, 4) ∈ ρ. Für Die Gleichheit = auf X ist reflexiv, symmetrisch, anti-
diese Relation ρ schreibt man üblicherweise ≡, genauer symmetrisch und transitiv.
≡ (mod n), d. h., Die Inklusion ⊆ auf P (X) ist reflexiv, antisymmetrisch
und transitiv. 
a≡b (mod n) ⇔ n | a − b .

Auf jeder Menge X ist die Gleichheit = eine Relation. Kommentar: Die Relation ist besser auf der Menge der
Auf der Potenzmenge P (X) jeder Menge X ist die Inklu- Gegenstände des täglichen Lebens ist sicherlich als eine tran-
sion ⊆ eine Relation.  sitive Relation zu verstehen. Findet man etwa, dass Schoko-
lade besser ist als ein Apfel und dass ein Apfel besser ist
als Spinat, so wird man sicher auch der Meinung sein, dass
Kommentar: Eigentlich ist eine Relation ρ auf X × Y ein Schokolade besser ist als Spinat.
Tripel ρ = (X, Y, Rρ ), wobei Rρ ⊆ X × Y . In diesem Sinne
ist eine Abbildung eine spezielle Relation.

Eine Ordnungsrelation ist reflexiv,


antisymmetrisch und transitiv
Relationen können reflexiv, symmetrisch,
antisymmetrisch oder transitiv sein Wir sind es gewohnt, die natürlichen Zahlen anzuordnen,
dabei betrachten wir für beliebige a, b, c ∈ N die folgenden
Regeln als selbstverständlich:
Eine Relation ρ auf einer Menge X ist nichts weiter als eine
Menge von Paaren aus X×X. Betrachten wir z. B. die Menge a ≤ a,
X = R der reellen Zahlen. Hier haben wir die bekannte Rela- aus a ≤ b und b ≤ a folgt a = b,
tion ≤. Diese Relation ≤ hat z. B. die Eigenschaft x ≤ x für aus a ≤ b und b ≤ c folgt a ≤ c.
2.4 Relationen 51

Diese Regeln sind genau die Reflexivität, Antisymmetrie und a ≮ a für alle a ∈ X (Irreflexivität),
Transitivität. aus a < b und b < c folgt a < c (Transitivität).
Eine solche Ordnungsrelation < ist genau dann linear, wenn
Ordnungsrelation, geordnete Menge
für alle a, b ∈ X gilt
Eine Relation ρ auf einer Menge X heißt eine Ord-
nungsrelation auf X, wenn sie reflexiv, antisymme- a < b oder a = b oder b < a (Trichotomie),
trisch und transitiv ist. Man nennt dann (X, ρ) eine aus a < b und b < c folgt a < c (Transitivität).
geordnete Menge. Tatsächlich liefert diese (lineare) Ordnungsrelation nichts
Neues: Ist nämlich ≤ eine (lineare) Ordnungsrelation in un-
Wir erhalten sofort einfache Beispiele: serem Sinne auf X, so liefert die Relation <, die man erhält
durch die Vereinbarung
Beispiel
Da ≤ eine Ordnungsrelation auf der Menge R der reellen a < b :⇔ a ≤ b und a = b ,
Zahlen ist, ist (R, ≤) eine geordnete Menge.
Da die Teilbarkeit | auf N eine Ordnungsrelation ist, ist eine (lineare) Ordnungrelation auf X wie eben geschildert.
(N, | ) eine geordnete Menge. Und es gilt auch die Umkehrung: Ist < eine (lineare) Ord-
Die Potenzmenge jeder Menge X ist mit der Ordnungsre- nungsrelation auf X wie eben geschildert, so ist die Relation
lation ⊆ eine geordnete Menge (P (X), ⊆).  ≤, die man erhält durch die Vereinbarung

Man beachte, dass man bei einer Ordnungsrelation nicht ver- a ≤ b :⇔ a < b oder a = b,
langt, dass jedes x zu jedem y in Relation steht, z. B. kann
eine (lineare) Ordnungsrelation auf X in unserem Sinne.
man die Teilmengen {1, 2} und {3} von X = {1, 2, 3} nicht
miteinander vergleichen, es gilt:

{1, 2}  ⊆ {3} und {3} ⊆ {1, 2} .


Ein maximales Element muss kein größtes
Das ist beim Beispiel mit den reellen Zahlen ganz anders. Element sein
Man kann für beliebige x und y aus R entscheiden, ob
Ist ≤ eine Ordnungsrelation auf einer Menge X, so können
x≤y oder y≤x
wir die Elemente der Menge X größenmäßig erfassen. Bei
gilt. Diese zusätzliche Eigenschaft einer Ordnungsrelation einer linearen Ordnungsrelation können wir sogar von je zwei
bekommt einen eigenen Namen: Elementen a, b ∈ X entscheiden, welches von beiden größer
bzw. kleiner ist. Insbesondere kann man bei einer endlichen
Eine Ordnungsrelation ρ einer geordneten Menge (X, ρ) Menge sogar entscheiden, welches das größte bzw. kleinste
heißt lineare oder totale Ordnungsrelation, wenn für je zwei Element ist. Eventuell haben auch unendliche Mengen ein
Elemente x, y ∈ X gilt größtes oder ein kleinstes Element, allgemein definiert man:
x ρ y oder y ρ x . Ein Element a ∈ X heißt größtes Element von X, falls
für alle x ∈ X gilt a ≥ x.
Ein Element a ∈ X heißt kleinstes Element von X, falls
? für alle x ∈ X gilt x ≥ a.
Ist die Ordnungsrelation | auf N linear?
Das kleinste und das größte Element ist, falls es denn existiert,
eindeutig.
Ist (X, ρ) eine geordnete Menge und Y ⊆ X, so erhält man
durch Einschränkung von ρ auf Y eine Ordnung auf Y – Lemma
die von X auf der Teilmenge Y induzierte Ordnung. Der Es sei (X, ≤) eine geordnete Menge. Falls in X ein
Einfachheit halber verwendet man oft für die neue Relation, größtes oder kleinstes Element existiert, so ist dieses
nämlich für die Einschränkung von ρ wieder dasselbe Zei- eindeutig bestimmt.
chen ρ.

Beispiel Die Ordnungsrelation ≤ auf der Menge R der


Beweis: Sind a, b ∈ X größte Elemente, so gilt
reellen Zahlen induziert auf der Teilmenge Q ⊆ R eine Ord-
nungsrelation ≤.  a ≥ b , da a ≥ x ∀ x ∈ X und
b ≥ a , da b ≥ x ∀ x ∈ X ,
Kommentar: In manchen Lehrbüchern wird eine Ord-
nungsrelation < auf einer Menge X als irreflexive und tran- folglich gilt a = b. Analog zeigt man die Behauptung für das
sitive Relation eingeführt: kleinste Element. 
52 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Beispiel {1, 2} {1, 3} {2, 3}


Die Menge N hat bezüglich der üblichen Ordnung das
kleinste Element 1, aber kein größtes Element. Die Men-
gen Z und R haben bezüglich der üblichen Ordnungen
weder ein größtes noch ein kleinstes Element.
Wir betrachten die Potenzmenge P ({1, 2}) mit der Ord-
{1} {2} {3}
nungsrelation ⊆:

P ({1, 2}) = {∅, {1}, {2}, {1, 2}} . Abbildung 2.10 Die eingezeichneten Pfeile symbolisieren die Inklusion. Es gibt
maximale und minimale Elemente, aber kein größtes und kein kleinstes Element.
Wegen {1} ⊆ {2} und {2} ⊆ {1} sind die Elemente {1} und
{2} nicht miteinander vergleichbar, sodass die Ordnungs- Im Gegensatz zu größten und kleinsten Elementen sind maxi-
relation nicht total ist. male und minimale Elemente im Allgemeinen keineswegs
Das Element {1, 2} ist das größte Element, das Element eindeutig bestimmt. Aber es gilt:
∅ das kleinste.
Nun betrachten wir die folgende Teilmenge X der Potenz- Lemma
menge von M = {1, 2, 3}: Jedes größte Element von (X, ≤) ist ein maximales
X = {{1}, {2}, {3}, {1, 2}, {2, 3}, {1, 3}} , Element.
Jedes kleinste Element von (X, ≤) ist ein minimales
die aus allen ein- und zweielementigen Teilmengen von M Element.
besteht. Die Menge X ist mit der Inklusion ⊆ nicht linear
geordnet. Es gibt weder ein größtes noch ein kleinstes Beweis: Ist a ∈ X ein größtes Element, so folgt aus a ≤ x
Element.  für ein x ∈ X sogleich a ≥ x und somit a = x. Analog zeigt
man die Behauptung für das kleinste Element. 
Endliche linear geordnete Mengen haben stets ein größtes
und ein kleinstes Element. Das letzte Beispiel zeigt, dass
dies für endliche nicht linear geordnete Mengen nicht richtig Man beachte auch die Abbildung 2.11.
sein muss. Und trotzdem gilt etwa

{1} ⊆ {1, 3} , {1, 2}

sodass man doch auch wieder sagen kann, dass {1, 3} größer
ist als {1}, und es gibt in X kein Element, das größer ist als
{1, 3} und auch keines, das kleiner ist als {1}. Dies erfasst {1} {2}
man mit den Begriffen minimales und maximales Element:
Ist ≤ eine Ordnungsrelation auf der Menge X, so sagt man:
Ein Element a ∈ X heißt maximales Element von X, falls
für alle x ∈ X gilt: Aus a ≤ x folgt a = x. ∅
Ein Element a ∈ X heißt minimales Element von X, falls
für alle x ∈ X gilt: Aus x ≤ a folgt x = a. Abbildung 2.11 Die eingezeichneten Pfeile symbolisieren wieder die Inklusion.
Das maximale Element {1, 2} ist das eindeutig bestimmte größte Element.
Ein Element ist also genau dann maximal, wenn es kein Ele-
ment gibt, das noch echt größer ist und minimal, wenn es
kein Element gibt, das noch echt kleiner ist. Wir greifen das
letzte Beispiel noch einmal auf. Das Zorn’sche Lemma garantiert die Existenz
Beispiel Die Menge
maximaler Elemente

X = {{1}, {2}, {3}, {1, 2}, {2, 3}, {1, 3}} Das Zorn’sche Lemma liefert eine ganz wesentliche Beweis-
methode für die Existenz maximaler Elemente. Für eine
versehen mit der Inklusion ⊆ ist geordnet, aber nicht linear
knappe Formulierung dieses Lemmas führen wir einen wei-
geordnet. Jedes der Elemente
teren Begriff ein.
{1}, {2}, {3}
Eine geordnete Menge (M, ≤) heißt induktiv geordnet,
ist ein minimales Element, und jedes der Elemente wenn jede linear geordnete Teilmenge X ⊆ M eine obere
Schranke in (M, ≤) besitzt, d. h., wenn ein s ∈ M existiert
{1, 2}, {2, 3}, {1, 3} mit x ≤ s für alle x ∈ X.

ist ein maximales Element (vgl. Abbildung 2.10).  Das Zorn’sche Lemma besagt:
2.4 Relationen 53

Lemma von Zorn


Jede induktiv geordnete nichtleere Menge (M, ≤) be-
8
sitzt ein maximales Element. >
>
>>
>
>
>
>
>
>
>
>
Das Lemma von Zorn ist ein Axiom der Mengenlehre. Man >>
>
>
>>
kann zeigen, dass es zum Auswahlaxiom äquivalent ist. Die- >
>
>
>
>
>
ser Nachweis, der in einer Vorlesung zur Mengenlehre ge- >
>
>>
>
>u
führt wird, ist nicht ganz einfach. Wir werden das Lemma [u] <

von Zorn benutzen, um zu beweisen, dass jeder Vektorraum >
>
>>
>
>
eine Basis besitzt (siehe Seite 207). >
>
>
>
>
>
>>
>
>
>>
>
>
>
>
>
>
Eine Äquivalenzrelation ist reflexiv, >
>
>>
>
>
:
symmetrisch und transitiv
|
Während Ordnungsrelationen antisymmetrisch sind, sind
Äquivalenzrelationen symmetrisch. {z g
[g ]

}
Äquivalenzrelation
Eine Relation ρ auf einer Menge X heißt Äquivalenz-
Abbildung 2.12 Die zueinander parallelen Geraden bilden eine Äquivalenz-
relation, wenn ρ reflexiv, symmetrisch und transitiv ist. klasse – es gibt unendlich viele verschiedene Äquivalenzklassen mit jeweils
unendlich vielen Elementen.

In unserem Sammelsurium aus Beispielen auf Seite 50 finden


wir Äquivalenzrelationen: Zahlen b, die zu a kongruent modulo n sind:

Beispiel a≡b (mod n) ⇔ n | a − b


Die Parallelität  auf der Menge der Geraden X in der ⇔ a − b = n c für ein c ∈ Z
Ebene ist eine Äquivalenzrelation. ⇔ b ∈ {a + n c | c ∈ Z} = a + n Z .
Für jedes n ∈ N ist die Relation ≡ (mod n) eine Äqui-
valenzrelation auf der Menge Z.  Somit gilt:
[a]≡ = a + n Z . 
Ist ρ eine Äquivalenzrelation auf einer Menge X, so schreibt
man anstelle von (x, y) ∈ ρ oft x ∼ y und spricht dies als ?
„x ist äquivalent zu y“ aus. In dieser Schreibweise bedeuten Es ist sehr leicht, sich Beispiele für Äquivalenzrelationen
die Axiome einer Äquivalenzrelation: aus dem täglichen Leben zu konstruieren: Bezeichnet M die
Menge aller Menschen und |KH(m)| die Anzahl der Kopf-
x ∼ x für alle x ∈ X (ρ ist reflexiv),
haare von m ∈ M, so erklären wir zwei Menschen als äqui-
aus x ∼ y folgt y ∼ x (ρ ist symmetrisch),
valent, wenn sie gleich viele Kopfhaare haben, d. h.,
aus x ∼ y, y ∼ z folgt x ∼ z (ρ ist transitiv).
Ist ∼ eine Äquivalenzrelation auf der Menge X, so nennt man m1 ∼ m2 ⇔ |KH(m1 )| = |KH(m2 )| .
für jedes x ∈ X die Teilmenge Begründen Sie, dass ∼ eine Äquivalenzrelation auf M ist und
beschreiben Sie die Äquivalenzklassen von ∼.
[x]∼ = {y ∈ X | x ∼ y} ⊆ X

die Äquivalenzklasse von x bezüglich ∼. In der Äquivalenz-


klasse [x]∼ sind somit alle Elemente aus X enthalten, die zu Die Menge aller Äquivalenzklassen wird auch als Quotien-
x äquivalent sind. tenmenge bezeichnet. Dabei ist das Symbol X/∼ für diese
Menge üblich:
Beispiel X/∼ = {[x]∼ | x ∈ X} .
Bei der Parallelität  auf der Menge X der Geraden einer
Ebene E enthält die Äquivalenzklasse [g]∼ von g ∈ X Die Elemente der Menge X/∼ sind die Äquivalenzklassen
die Menge aller zu g parallelen Geraden. bezüglich der Relation ∼. Insofern sind also in X/∼ die zu-
Bei der Äquivalenzrelation ≡ (mod n), n ∈ N, besteht einander äquivalenten Elemente zu einem Element [x]∼ zu-
die Äquivalenzklasse [a]∼ von a ∈ Z aus all jenen ganzen sammengefasst. In dieser Sichtweise kann man die Menge
54 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Beispiel: Vergröberung des Definitionsbereiches einer Abbildung


Es seien X, Y Mengen und f : X → Y eine Abbildung. Begründen Sie: Durch

x ∼ y ⇔ f (x) = f (y)

wird eine Äquivalenzrelation auf X definiert. Für ein x ∈ X sei [x] ∈ X/∼ die Äquivalenzklasse von x bezüglich ∼ .
Zeigen Sie weiter, dass durch f∗ : X/∼ → f (X), [x]  → f (x) eine bijektive Abbildung erklärt wird.

Problemanalyse und Strategie: Wir zeigen, dass die Relation ∼ reflexiv, symmetrisch und transitiv ist. Um zu zeigen,
dass durch f∗ eine Bijektion gegeben ist, ist erst einmal zu begründen, dass f∗ tatsächlich eine Abbildung ist, dann erst
prüfen wir die Abbildung auf Bijektivität.

Lösung: zes) den Wert zuordnet, die die Abbildung f jedem Ele-
Wegen f (x) = f (x) für jedes x ∈ X gilt x ∼ x für jedes ment der Äuivalenzklasse zuordnet:
x ∈ X (Reflexivität). 
Es gelte x ∼ y mit x, y ∈ X. Dann gilt f (x) = f (y), X/∼ → f (X),
f∗ :
d. h. f (y) = f (x). Es folgt y ∼ x (Symmetrie). [x] → f (x).
Nun gelte x ∼ y und y ∼ z, x, y, z ∈ X. Dann gilt
Es ist zu erwarten, dass diese Abbildung nun injektiv ist,
f (x) = f (y) und f (y) = f (z), d. h. f (x) = f (z). Es
wir haben ja gerade die Nichtinjektivität beseitigt. Be-
folgt x ∼ z (Transitivität).
vor wir aber dieses f∗ auf Injektivität und Surjektivi-
Damit ist bereits begründet, dass ∼ eine Äquivalenzrela-
tät überprüfen, müssen wir uns überlegen, ob f∗ über-
tion ist.
haupt eine Abbildung von X/∼ in f (X) ist, d. h., ob
In der Äquivalenzklasse
f∗ ⊆ (X/∼) × f (X) mit der Eigenschaft, dass es zu
[x] = {y ∈ X | x ∼ y} = {y ∈ X | f (x) = f (y)} jedem Element [x] genau ein Element aus f (X) gibt.
Weil wir einer Äquivalenzmenge [x] einen Wert zuordnen,
liegen alle Elemente aus X, die unter der Abbildung f den nämlich f (x), der vom Repräsentanten x abhängt, müs-
gleichen Wert in Y annehmen. sen wir sicherstellen, dass dieser Wert unabhängig von
Ist die Abbildung f injektiv, so ist jede Äquivalenzklasse der Wahl des Repräsentanten ist: Würde nämlich für ein
einelementig, da im Falle der Injektivität aus f (x) = f (y) y ∈ X mit [x] = [y] gelten f (x) = f (y), so wäre durch
die Gleichheit x = y folgt. f∗ keine Abbildung gegeben, da einem Element [x] = [y]
Ist die Abbildung f nicht injektiv, so gibt es (mindestens) der Definitionsmenge verschiedene Werte f (x) = f (y)
eine Äquivalenzklasse, die mehr als ein Element enthält. zugeordnet werden würden.
Die folgende Abbildung deutet die Zerlegung von X in die Wir begründen, dass das bei unserer Abbildung f∗ nicht
Äquivalenzklassen an. der Fall ist: Es sei y ∈ X mit [x] = [y] gewählt. Es
gilt dann x ∼ y. Nach der Definition besagt dies aber
f (x) = f (y). Folglich ist f∗ eine Abbildung. Man sagt,
X/∼
dass die Abbildung wohldefiniert ist.
Die Abbildung f∗ ist injektiv: Aus f∗ ([x]) = f∗ ([y])
folgt f (x) = f (y) und damit x ∼ y. Dies besagt gerade
[x] = [y].
Die Abbildung f∗ ist surjektiv: Das Element f (x) ∈
f (X), x ∈ X, ist Bild des Elements [x] ∈ X/∼.
Damit ist gezeigt, dass die Abbildung f∗ bijektiv ist.
X Y
Kommentar: Ist die Abbildung f bereits injektiv, so
Wir vergröbern die Abbildung f nun. Wir unterscheiden bestehen die Äquivalenzklassen [x] aus genau einem Ele-
nicht mehr zwischen zueinander äquivalenten Elementen, ment, [x] = {x}. Die Quotientenmenge X/∼ = {[x] |
sondern fassen diese zu einem Element zusammen, d. h., x ∈ X} ist dann eine Menge von einelementigen Teilmen-
wir betrachten eine Abbildung, die auf den Äquivalenz- gen von X. Strenggenommen muss man also schon noch
klassen definiert ist und jeder Äquivalenzklasse (als Gan- zwischen f und f∗ unterscheiden.

X/∼ als eine Vergröberung der Gleichheit auf X betrach- In dem ausführlichen Beispiel auf dieser Seite vergröbern wir
ten – zueinander äquivalente Elemente in X werden in X/∼ den Definitionsbereich X einer Abbildung f zu X/∼. Die
nicht mehr unterschieden. Abbildung f∗ , die auf dieser gröberen Menge X/∼ erklärt
werden kann, ist dann injektiv.
2.4 Relationen 55

Übersicht: Relationen und Abbildungen


Es seien X und Y Mengen. Eine Relation ρ auf X ist eine Teilmenge von X × X, und der Graph Gf einer Abbildung f von X
in Y ist eine Teilmenge von X × Y . Wir verschaffen uns einen Überblick über die behandelten Eigenschaften von Relationen
und Abbildungen.

Eine Relation ρ auf X heißt Ordnungsrelation auf X, falls ρ reflexiv, antisymme-


trisch und transitiv ist,
reflexiv, falls für alle x ∈ X gilt x ρ x,
lineare Ordnungsrelation auf X, falls ρ eine Ord-
symmetrisch, falls für alle x, y ∈ X mit x ρ y gilt
nungsrelation ist mit der zusätzlichen Eigenschaft
y ρ x,
antisymmetrisch, falls für alle x, y ∈ X mit x ρ y und ∀ x, y ∈ X : xρy oder yρx .
y ρ x gilt x = y, Eine Abbildung f : X → Y heißt
transitiv, falls für alle x, y, z ∈ X mit x ρ y und y ρ z injektiv, falls für alle x1 = x2 , x1 , x2 ∈ X, gilt
gilt x ρ z. f (x1 ) = f (x2 ),
Eine Relation ρ auf X heißt surjektiv, falls es zu jedem y ∈ Y ein x ∈ X gibt mit
f (x) = y,
Äquivalenzrelation auf X, falls ρ reflexiv, symme- bijektiv, falls es zu jedem y ∈ Y genau ein x ∈ X gibt
trisch und transitiv ist, mit f (x) = y.

Relation g ⊆ X × X Relation f ⊆ X × Y

reflexiv linkstotal rechtseindeutig

reflexive Relation Abbildung

symmetrisch transitiv linkseindeutig rechtstotal

reflexive symmetrische reflexive transitive Injektion Surjektion


Relation Relation

transitiv symmetrisch antisymmetrisch rechtstotal linkseindeutig

..
Aquivalenzrelation Ordnungsrelation Bijektion

linear

lineare Ordnungsrelation

Eine Äquivalenzrelation zerlegt die Menge X 


(a) X = x∈X [x]∼ .
in nichtleere, disjunkte Äquivalenzklassen (b) [x]∼ = ∅ für alle x ∈ X.
(c) [x]∼ ∩ [y]∼ = ∅ ⇔ x ∼ y ⇔ [x]∼ = [y]∼ .
Die Bedeutung einer Äquivalenzrelation auf einer Menge X
liegt darin, dass man die Menge X mit der Äquivalenzrela-
Beweis: (a), (b) Aufgrund der Reflexivität gilt x ∈ [x]∼ .
tion in die disjunkten, nichtleeren Äquivalenzklassen zerle-
Somit ist jede Äquivalenzklasse nichtleer. Außerdem ist je-
gen kann und ferner, dass Äquivalenz auf X, d. h. x ∼ y, zur
des Element von X in einer Äquivalenzklasse enthalten. Das
Gleichheit in X/∼, d. h. [x]∼ = [y]∼ , führt. Es gilt nämlich:
begründet bereits die ersten beiden Aussagen.

Die Aussage in (c) beweisen wir durch einen Ringschluss


Äquivalenzrelationen zerlegen die Grundmenge in (Seite 32).
ihre nichtleeren Äquivalenzklassen
Ist X eine nichtleere Menge und ∼ eine Äquivalenzre- (c) Es sei [x]∼ ∩[y]∼ = ∅ vorausgesetzt. Für u ∈ [x]∼ ∩[y]∼
lation auf X, so gilt: gilt x ∼ u, y ∼ u. Wegen der Symmetrie und der Transitivität
von ∼ folgt x ∼ y.
56 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Nun sei x ∼ y vorausgesetzt. Wir wählen ein u ∈ [x]∼ . Jedes Paar {a, b} mit einem weiblichen a ∈ M und männ-
Wegen x ∼ u und x ∼ y folgt mit der Symmetrie und Tran- lichen b ∈ M ist ein Repräsentantensystem dieser Äqui-
sitivität y ∼ u, d. h. u ∈ [y]∼ bzw. [x]∼ ⊆ [y]∼ . Analog valenzrelation ∼.
zeigt man [y]∼ ⊆ [x]∼ , sodass [x]∼ = [y]∼ . Wir betrachten die Potenzmenge P (N). Nennt man zwei
Elemente A, B ∈ P (N) äquivalent, in Zeichen A ∼ B,
Es gelte nun [x]∼ = [y]∼ . Wenn die Klassen gleich sind, ist
wenn sie gleich viele Elemente enthalten, so ist ∼ offenbar
ihr Durchschnitt natürlich nichtleer.
eine Äquivalenzrelation. Die Äquivalenzklassen enthalten
Damit sind die drei Äquivalenzen in (c) bewiesen.  jene Teilmengen von N mit je gleich vielen Elementen,
z. B.:
 [∅]∼ = {∅}.
Nach diesem Satz liefern die Äquivalenzklassen von X eine
 [{1}]∼ = {{1}, {2}, . . .} – die einelementigen Teilmen-
Partition der Menge X, d. h., X ist disjunkte Vereinigung
gen von N.
nichtleerer Teilmengen, nämlich ihrer Äquivalenzklassen.
 [{1, 2}]∼ = {{1, 2}, {2, 3}, . . .} – die zweielementigen
Anstelle von einer Partition spricht man auch von einer Zer-
Teilmengen von N.
legung.
 [N]∼ – die unendlichen Teilmengen von N (z. B. N, 2N,
2N + 1). 

Wir betrachten ausführlich ein weiteres Beispiel, das nicht


nur im ersten Studienjahr eine fundamentale Rolle spielt, die
Restklassen modulo n.

Die Restklassen modulo n zerlegen Z in


n Äquivalenzklassen

Wir kommen erneut auf das schon wiederholt betrachtete


Beispiel der Äquivalenzrelation ≡ kongruent modulo n,
Abbildung 2.13 Eine Partition der Menge X ist eine Zerlegung von X in
disjunkte nichtleere Teilmengen – im Allgemeinen sind weder die Teilmengen
n ∈ N, zurück. Für jedes n ∈ N ist ≡ auf der Menge der
noch die Anzahl der Teilmengen endlich. ganzen Zahlen Z eine Äquivalenzrelation: Zwei ganze Zah-
len a und b sind äquivalent, falls n die Differenz a − b teilt:
Ist ∼ eine Äquivalenzrelation auf einer Menge X, so nennt
man jedes Element a ∈ [x]∼ einer Äquivalenzklasse einen a≡b (mod n) ⇔ n | a − b .
Repräsentanten oder Vertreter der Äquivalenzklasse [x]∼ ,
Für jedes a ∈ Z ist nach dem Beispiel auf Seite 53
jeder Repräsentant vertritt nämlich seine Klasse, denn es gilt
nach obigem Satz: [a]≡ = a + n Z
a ∈ [x] ⇔ [a]∼ = [x]∼ . die Äquivalenzklasse von a. Folglich zerfällt Z in disjunkte
Äquivalenzklassen. Um sämtliche Äquivalenzklassen kon-
Man nennt R ⊆ X ein Repräsentanten- oder Vertreter-
kret und übersichtlich angeben zu können, führen wir eine
system von ∼, falls R aus jeder Äquivalenzklasse genau
andere Beschreibung der Äquivalenzrelation ein. Dazu be-
einen Repräsentanten enthält, d. h.
nötigen wir die Division mit Rest.
|R ∩ [a]∼ | = 1 für jedes a ∈ X .
Division mit Rest
Beispiel Gegeben sei n ∈ N. Zu jeder ganzen Zahl a ∈ Z gibt es
Bezeichnen M die Menge aller Menschen und g(m) ∈ genau ein Paar ganzer Zahlen q, r mit
{weibl., männl.} das Geschlecht von m ∈ M, so erklären
wir zwei Menschen als äquivalent, wenn sie das gleiche a = q n + r und 0 ≤ r < n .
Geschlecht haben, d. h., für m1 , m2 ∈ M gilt:
Man nennt r den Rest von a bei Division mit Rest
m1 ∼ m2 ⇔ g(m1 ) = g(m2 ) . durch n.

Die Menschheit M zerfällt bezüglich dieser Äquivalenz-


Beispiel Wir teilen die ganze Zahl 21 durch 4 mit Rest:
relation in die zwei Äquivalenzklassen der männlichen
und weiblichen Bevölkerungsgruppen, und es gilt: 21 = 5 · 4 + 1 .
[Angela Merkel]∼ = [Hillary Clinton]∼ sowie Die Zahl 21 hat somit den Rest 1 bei Division mit Rest
[Nigel Kennedy]∼ = [Boris Becker]∼ . durch 4. 
2.4 Relationen 57

Kommentar: Tatsächlich sind die Existenz und Eindeu- Die Restklassen modulo n
tigkeit der Zahlen q und r zu beweisen. Wir tun das auf
Für jedes n ∈ N sind
Seite 129.
0 + n Z , 1 + n Z , . . . , (n − 1) + n Z
Nun können wir die Kongruenz modulo n mithilfe der Divi-
sion mit Rest charakterisieren: sämtliche verschiedene Restklassen modulo n. Es ist so-
mit R = {0, 1, . . . , n − 1} ein Repräsentantensystem
Charakterisierungen der Kongruenz modulo n
– dabei haben wir aus jeder Restklasse den kleinsten
Es sei n eine natürliche Zahl. Für zwei ganze Zahlen a positiven Repräsentanten gewählt.
und b sind äquivalent:
a ≡ b (mod n).
n | a − b. Anstelle von a + n Z schreibt man oft auch kurz a; manch-
a + n Z = b + n Z. mal lässt man selbst den Querstrich weg und identifiziert die
a und b haben bei Division mit Rest durch n den Restklasse a mit seinem Repräsentanten a.
gleichen Rest.
Beispiel
Im Fall n = 1 gibt es genau eine Restklasse
Beweis: Dass die ersten drei Aussagen gleichwertig sind,
wurde bereits gezeigt. Wir zeigen die Gleichwertigkeit der
0 = 0 + 1Z = Z.
dritten und vierten Aussage. Dazu teilen wir zwei ganze Zah-
len a und b mit Rest durch n:
Es sind je zwei ganze Zahlen äquivalent, da die Differenz
a = q1 n + r1 , b = q2 n + r2 mit 0 ≤ r1 , r2 < n . beliebiger Zahlen stets von 1 geteilt wird.
Im Fall n = 2 gibt es genau zwei Restklassen
Man beachte:
r1 − r2 ∈ {−(n − 1), . . . , −1, 0, 1, . . . , n − 1} . 0 = 0 + 2 Z = {0, ±2, ±4, . . .} ,

Damit gilt: 1 = 1 + 2 Z = {±1, ±3, ±5, . . .} .

a + n Z = b + n Z ⇔ a − b = n c für ein c ∈ Z Die Menge Z wird aufgeteilt in die geraden und ungeraden
⇔ (q1 − q2 ) n + (r1 − r2 ) = n c, c ∈ Z ganzen Zahlen.
Im Fall n = 6 gibt es genau sechs Restklassen
⇔ r1 − r2 = n d für ein d ∈ Z
⇔ r1 = r2 , 0 = 0 + 6 Z = {. . . , −12, −6, 0, 6, 12, . . .} ,
da wegen der obigen Größeneinschränkung von r1 − r2 nur 1 = 1 + 6 Z = {. . . , −11, −5, 1, 7, 13, . . .} ,
der Fall d = 0 möglich ist. Die zwei Zahlen a, b sind somit
2 = 2 + 6 Z = {. . . , −10, −4, 2, 8, 14, . . .} ,
genau dann kongruent mod n, wenn sie denselben Rest bei
Division durch n haben.  3 = 3 + 6 Z = {. . . , −9, −3, 3, 9, 15, . . .} ,
4 = 4 + 6 Z = {. . . , −8, −2, 4, 10, 16, . . .} ,
Wegen der Charakterisierung der Kongruenz mit den Resten
nennt man die Äquivalenzklassen der Kongruenz modulo n 5 = 5 + 6 Z = {. . . , −7, −1, 5, 11, 17, . . .} .
auch Restklassen modulo n.
Es ist Z = 0 ∪ 1 ∪ 2 ∪ 3 ∪ 4 ∪ 5, und es ist R =
Wir erhalten nun eine sehr einfache Beschreibung der Rest-
{0, 1, 2, 3, 4, 5} ein Repräsentantensystem. Ebenso gut
klassen modulo n. Für jedes a ∈ Z gilt
können wir natürlich auch R  = {12, −5, 8, −9, 16, 5}
[a]≡ = a + n Z = r + n Z , als Repräsentantensystem wählen. 

wobei r ∈ {0, 1, . . . , n − 1} der Rest bei Division von a


durch n mit Rest ist. Im nächsten Kapitel werden wir auf der Menge Zn =
{0, 1, . . . , n − 1} der Restklassen modulo n, n ∈ N, eine
Folglich liegt jedes a ∈ Z in einer der Restklassen Addition und eine Multiplikation erklären. Es wird so mög-
lich, mit den Äquivalenzklassen k umzugehen wie z. B. mit
0 + n Z , 1 + n Z , . . . , (n − 1) + n Z .
den ganzen Zahlen. Der Fall, dass n sogar eine Primzahl ist,
Und da je zwei der hier angegebenen Restklassen verschieden wird ein besonderes Augenmerk verdienen. In diesem Fall
sind (die Differenz zweier Repräsentanten ist nicht durch n kann man jedes von 0 verschiedene Element sogar inver-
teilbar), erhalten wir: tieren.
58 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Zusammenfassung

Die Grundlagen der Mathematik sind die Logik und die Definition einer Abbildung
Mengenlehre. Es ist zu Beginn des Mathematikstudiums üb-
Gegeben seien zwei Mengen X und Y . Eine Abbildung
lich, Logik und Mengenlehre nicht axiomatisch, sondern naiv
f von X in Y ist ein Tripel
zu betreiben. Wir betrachten Aussagen, Variable, Junktoren
und Quantoren als das, was man sich darunter vorstellt und f = (X, Y, Gf ) , wobei Gf ⊆ X × Y
verzichten gelegentlich auf präzise Definitionen, die uns zu
lange davon abhalten würden, grundlegende mathematische die Eigenschaft hat, dass es zu jedem x ∈ X genau ein
Sachverhalte aus der linearen Algebra und Analysis zu disku- y ∈ Y gibt mit (x, y) ∈ Gf .
tieren. Mithilfe der Junktoren UND, ODER, NICHT, WENN-
Für das durch x eindeutig bestimmte Element y schrei-
DANN und GENAU-DANN-WENN und Variablen und den
ben wir f (x).
Quantoren ∃ und ∀ bilden wir aus einfachen Aussagen kom-
plexe Aussagen, die wir auf ihren Wahrheitsgehalt hin unter- Die Menge X heißt Definitionsmenge von f , Y heißt
suchen. Wertemenge von f und Gf der Graph von f .

Der naive Umgang mit dem Begriff der Menge als eine
Wir schreiben für die Abbildung f = (X, Y, Gf ) oft ein-
Zusammenfassung wohlunterschiedener Objekte führt zu
facher
Widersprüchen in der Mathematik, man vergleiche etwa die
f : X → Y, x → f (x) .
Russell’sche Antinomie. Solange man aber mit kleinen Men-
gen hantiert, ist diese nicht präzise definierte Vorstellung Abbildungen ordnen jedem Element der Definitionsmenge
einer Menge durchaus sinnvoll. Im ersten Studienjahr kom- ein Element der Wertemenge zu. Eine Abbildung heißt in-
men wir zumindest mit der Vorstellung aus, dass Mengen jektiv, falls je zwei verschiedene Elemente der Definitions-
durch die Angabe ihrer Elemente gegeben sind. menge auch zwei verschiedene Bilder haben und surjektiv,
falls jedes Element der Wertemenge Bild eines Elements der
Wir werden nicht nur im ersten Studienjahr sehr oft vor dem
Definitionsmenge ist. Eine Abbildung, die injektiv und sur-
Problem stehen, dass wir von zwei Mengen zeigen müssen,
jektiv ist, nennt man bijektiv. Bei einer bijektiven Abbildung
dass sie gleich sind, das tut man, indem man zeigt, dass die
gehört zu jedem Element x der Definitionsmenge genau ein
beiden Mengen ineinander enthalten sind:
Element f (x) der Wertemenge. Daher ist es sinnvoll, zwei
Mengen als gleichmächtig zu bezeichnen, wenn es eine Bi-
Gleichheit von Mengen jektion zwischen diesen Mengen gibt.
Die Mengen A und B sind gleich, in Zeichen A = B,
Ist f eine Abbildung von X nach Y und g eine solche von
wenn jedes Element von A ein Element von B ist und
Y nach Z, so kann man die Abbildungen hintereinander aus-
jedes Element von B eines von A ist, kurz:
führen und erhält die Komposition
A = B ⇔ ((A ⊆ B) ∧ (B ⊆ A)) . 
X → Z,
g◦f: .
x → g(f (x))
Die üblichen Operationen mit Mengen sind teils aus der
Schule bekannt: Man kann Mengen vereinigen, A∪B, schnei- Es ist sehr wichtig zu wissen, dass diese Komposition ◦ von
den, A ∩ B, man kennt die Mengendifferenz A \ B, das Kom- Abbildungen eine assoziative Verknüpfung ist, d. h., es gilt
plement CB (A) einer Menge in einer Obermenge und das
kartesische Produkt A × B von Mengen. Und natürlich kennt h ◦ (g ◦ f ) = (h ◦ g) ◦ f
man auch die Mächtigkeit einer Menge |A|, das ist (wieder
für Abbildungen f, g, h mit passenden Definitions- und
etwas naiv gesprochen) die Anzahl der Elemente der Menge.
Wertemengen. In der linearen Algebra etwa werden wir die
Naiv deswegen, da man von der Anzahl ja eigentlich nur dann
Assoziativität der Matrizenmultiplikation mithilfe der Asso-
sprechen kann, wenn diese endlich ist. Eine präzisere Defini-
ziativität dieser Komposition begründen.
tion der Mächtigkeit ist mit einem anderen Begriff möglich,
und zwar mit dem Begriff der Abbildung. Ist X eine Menge, so nennt man die Abbildung idX von X
in sich, die jedem x sich selbst zuordnet, die Identität von X,
Der Begriff der Abbildung ist zentral in der Mathematik. In
idX (x) = x für alle x ∈ X. Nun kann es natürlich sein, dass
der Analysis geht es vor allem darum, Abbildungen von Men-
für zwei Abbildungen f : X → Y und g : Y → X gilt
gen von reellen oder komplexen Zahlen (später auch von kar-
tesischen Produkten reeller oder komplexer Zahlen) in eben- g ◦ f = idX und f ◦ g = idY .
solche Mengen zu untersuchen, man spricht in der Analysis
auch von Funktionen; in der linearen Algebra sind die soge- Dann nennt man f bzw. g umkehrbar oder invertierbar und g
nannten linearen Abbildungen Kern der Untersuchungen. bzw. f die Umkehrabbildung oder das Inverse zu f bzw. g.
Zusammenfassung 59

Tatsächlich sind es genau die bijektiven Abbildungen, die


antisymmetrisch, wenn für alle x, y ∈ X mit x ρ y
umkehrbar sind:
und y ρ x gilt x = y,
transitiv, wenn für alle x, y, z ∈ X mit x ρ y und
Satz von der Umkehrabbildung y ρ z gilt x ρ z.
Ist f : X → Y eine bijektive Abbildung, so existiert
genau eine Abbildung g : Y → X mit Eine Relation ρ auf einer Menge X heißt eine
g ◦ f = idX und f ◦ g = idY . Ordnungsrelation auf X, wenn sie reflexiv, antisymme-
Man nennt g die Umkehrabbildung oder die zu f in- trisch und transitiv ist und
verse Abbildung. Man bezeichnet sie üblicherweise mit Äquivalenzrelation auf X, wenn sie reflexiv, symmetrisch
f −1 . Die Abbildung f −1 ist ebenfalls bijektiv und hat und transitiv ist.
die Umkehrabbildung Hat man auf X eine Ordnungsrelation ρ gegeben, so kann
−1 −1
(f ) =f. man die Elemente von X größenmäßig erfassen, es kann
sein, dass größte und kleinste, minimale und maximale Ele-
mente existieren. Während kleinste und größte Elemente
Da wir begründet haben, dass die Komposition von bijektiven
einer Menge im Falle der Existenz eindeutig bestimmt sind,
Abbildungen wieder bijektiv ist, haben wir mit der Komposi-
ist das bei minimalen und maximalen Elementen keineswegs
tion eine Verknüpfung auf der Menge G aller bijektiven Ab-
so.
bildungen einer Menge X in sich erhalten: Die Komposition
je zweier Bijektionen von X ist wieder eine Bijektion, wei- Viele Sätze in der Mathematik benötigen die Existenz von
terhin ist die Komposition assoziativ, die Identität idX ist eine maximalen Elementen bezüglich einer Ordnungsrelation.
Bijektion von X mit der Eigenschaft idX ◦f = f = f ◦ idX Das Lemma von Zorn garantiert die Existenz eines maxima-
für jede Bijektion f von X; und für jede Bijektion ist auch len Elementes unter der Bedingung, dass die Ordnungrelation
deren Inverses eine solche. In der Sprechweise von Kapitel 3 induktiv ist und die Menge nichtleer ist. Dieses Lemma von
heißt dies, dass (G, ◦) eine Gruppe ist. Zorn ist aber kein übliches Lemma, sondern ein Axiom der
Mathematik.
Für jede Menge X nennt man jede Teilmenge ρ ⊆ X×X eine
Relation auf X. Dieser Begriff ist sehr allgemein. Interessant Neben den Ordnungsrelationen spielen die Äquivalenzrela-
sind zwei spezielle Relationen, nämlich die Ordnungsrelation tionen eine wichtige Rolle. Eine Äquivalenzrelation ρ auf
und die Äquivalenzrelation. Zuerst erwähnen wir die für das X zerlegt die Menge X in disjunkte, nichtleere Äquivalenz-
Weitere nötigen zusätzlichen Eigenschaften, die eine Rela- klassen. Dabei liegen in einer Äquivalenzklasse eben ge-
tion haben kann. nau all jene Elemente, die zueinander in der Relation ρ ste-
hen. In gewisser Weise wird bei einer Äquivalenzrelation die
Reflexiv, symmetrisch, antisymmetrisch und transitiv Gleichheit von Elementen aufgeweicht zu einer Ähnlichkeit
Eine Relation ρ auf der Menge X heißt: von Elementen und alle zueinander ähnlichen Elemente zu
reflexiv, wenn für alle x ∈ X gilt x ρ x, der Äquivalenzklasse zusammengefasst. Im nächsten Kapi-
symmetrisch, wenn für alle x, y ∈ X mit x ρ y gilt tel werden wir zeigen, dass es durchaus auch sinnvoll sein
y ρ x, kann zwischen Äquivalenzklassen Verknüpfungen einzufüh-
ren und damit zu rechnen.
60 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen Unter der Annahme, dass die Unschuldigen die Wahrheit ge-
sagt haben, finde man den Täter bzw. die Täterin.
2.1 • Welche der folgenden Aussagen sind richtig?
Für alle x ∈ R gilt:
2.7 •• Es seien A eine Menge und F eine Menge von
(a) „x > 1 ist hinreichend für x 2 > 1.“
Teilmengen von A. Beweisen Sie die folgenden (allgemeine-
(b) „x > 1 ist notwendig für x 2 > 1.“
ren) Regeln von De Morgan:
(c) „x ≥ 1 ist hinreichend für x 2 > 1.“
(d) „x ≥ 1 ist notwendig für x 2 > 1.“  
 
A\ B = (A\B) und
2.2 •• Wie viele unterschiedliche binäre, also zwei Aus- B∈F B∈F
sagen verknüpfende Junktoren gibt es?  
 
A\ B = (A\B) .
Rechenaufgaben B∈F B∈F

2.3 • Beweisen Sie die Äquivalenzen:


(A ∨ B) ⇔ ¬(¬A ∧ ¬B), 2.8 •• Es seien A, B Mengen, M1 , M2 ⊆ A, ferner
(A ∧ B) ⇔ ¬(¬A ∨ ¬B). N1 , N2 ⊆ B und f : A → B eine Abbildung. Zeigen Sie:
(a) f (M1 ∪ M2 ) = f (M1 ) ∪ f (M2 ),
2.4 •• Zeigen Sie die Transitivität der Implikation, also (b) f −1 (N1 ∪ N2 ) = f −1 (N1 ) ∪ f −1 (N2 ),
die Aussage (c) f −1 (N1 ∩ N2 ) = f −1 (N1 ) ∩ f −1 (N2 ).
((A ⇒ B) ∧ (B ⇒ C)) ⇒ (A ⇒ C) . Gilt im Allgemeinen auch f (M1 ∩ M2 ) = f (M1 ) ∩ f (M2 )?

Beweisaufgaben 2.9 •• Es seien A, B nichtleere Mengen und f : A → B


2.5 √•• Zeigen Sie durch einen Widerspruchsbeweis, eine Abbildung. Zeigen Sie:
dass 2 keine rationale Zahl ist. Formulieren Sie dazu zu- (a) f ist genau dann injektiv, wenn eine Abbildung
nächst die beiden Aussagen, g: B → A mit g ◦ f = idA existiert.
A: „x ist die positive Lösung der Gleichung x 2 = 2“ (b) f ist genau dann surjektiv, wenn eine Abbildung
und g: B → A mit f ◦ g = idB existiert.
B: „Es gibt keine Zahlen a, b ∈ Z mit x = ab .“

2.6 •• Geheimrat Gelb, Frau Blau, Herr Grün und 2.10 •• Es seien A, B, C Mengen und f : A → B,
Oberst Schwarz werden eines Mordes verdächtigt. Genau g : B → C Abbildungen.
einer bzw. eine von ihnen hat den Mord begangen. Beim (a) Zeigen Sie: Ist g ◦ f injektiv, so ist auch f injektiv.
Verhör sagen sie Folgendes aus: (b) Zeigen Sie: Ist g ◦ f surjektiv, so ist auch g surjektiv.
Geheimrat Gelb: Ich war es nicht. Der Mord ist im Salon (c) Geben Sie ein Beispiel an, in dem g ◦ f bijektiv, aber
passiert. weder g injektiv noch f surjektiv ist.

Frau Blau: Ich war es nicht. Ich war zur Tatzeit mit Oberst 2.11 •• Es seien A, B Mengen und f : A → B eine
Schwarz zusammen in einem Raum. Abbildung. Die Potenzmengen von A bzw. B seien A bzw. B.
Herr Grün: Ich war es nicht. Frau Blau, Geheimrat Gelb und Wir betrachten die Abbildung g : B → A, B  → f −1 (B  ).
ich waren zur Tatzeit nicht im Salon. Zeigen Sie:
Oberst Schwarz: Ich war es nicht. Aber Geheimrat Gelb war (a) Es ist f genau dann injektiv, wenn g surjektiv ist.
zur Tatzeit im Salon. (b) Es ist f genau dann surjektiv, wenn g injektiv ist.
Antworten der Selbstfragen 61

2.12 •• Begründen Sie die Bijektivität der auf Seite 46 2.16 •• Auf einer Menge A seien zwei Äquivalenzrela-
angegebenen Abbildung tionen ∼ und ≈ gegeben. Dann heißt ∼ eine Vergröberung
⎧ von ≈, wenn für alle x, y ∈ A mit x ≈ y auch x ∼ y gilt.
⎨(−1, 1) → R,
(a) Es sei ∼ eine Vergröberung von ≈. Geben Sie eine sur-
f: x
⎩ x → . jektive Abbildung
1 − x2 f : A/≈ → A/∼
an.
2.13 •• Geben Sie für die folgenden Relationen auf Z (b) Für m, n ∈ N sind durch
jeweils an, ob sie reflexiv, symmetrisch oder transitiv sind. x ∼ y ⇔ m | (x − y)
Welche der Relationen sind Äquivalenzrelationen? und
x ≈ y ⇔ n | (x − y)
(a) ρ1 = {(m, n) ∈ Z × Z | m ≥ n}, Äquivalenzrelationen auf Z definiert.
(b) ρ2 = {(m, n) ∈ Z × Z | m · n > 0} ∪ {(0, 0)},
Bestimmen Sie zu n ∈ N die Menge aller m ∈ N, sodass
(c) ρ3 = {(m, n) ∈ Z × Z | m = 2n},
∼ eine Vergröberung von ≈ ist.
(d) ρ4 = {(m, n) ∈ Z × Z | m ≤ n + 1},
(e) ρ5 = {(m, n) ∈ Z × Z | m · n ≥ −1}, (c) Geben Sie die Abbildung f aus Teil (a) für m = 3 und
(f) ρ6 = {(m, n) ∈ Z × Z | m = 2}. n = 6 explizit an, indem Sie für sämtliche Elemente von
Z/≈ das Bild unter f angeben.
2.14 •• Wo steckt der Fehler in der folgenden Argumen-
2.17 •• Es sei ρ eine reflexive und transitive Relation
tation?
auf einer Menge A. Zeigen Sie:
Ist ∼ eine symmetrische und transitive Relation auf einer (a) Durch
Menge M, so folgt für a, b ∈ M mit a ∼ b wegen der Sym- x ∼ y ⇔ ((x, y) ∈ ρ und (y, x) ∈ ρ)
metrie auch b ∼ a. Wegen der Transitivität folgt aus a ∼ b
wird eine Äquivalenzrelation auf A definiert.
und b ∼ a auch a ∼ a. Die Relation ∼ ist also eine Äquiva-
(b) Für x ∈ A sei [x] ∈ A/∼ die Äquivalenzklasse von x
lenzrelation.
bezüglich ∼ . Durch
[x]  [y] ⇔ (x, y) ∈ ρ
2.15 •• Zeigen Sie, dass die folgenden Relationen
wird eine Ordnungsrelation auf A/∼ definiert.
Äquivalenzrelationen auf A sind. Bestimmen Sie jeweils die
Äquivalenzklassen von (2, 2) und (2, −2). 2.18 •• Es seien A eine Menge und P (A) die Potenz-
(a) A = (a, b) ∼ (c, d) ⇔
R2 , a2 =+ b2 c2 + d 2. menge von A. Zeigen Sie:
(b) A = R2 , (a, b) ∼ (c, d) ⇔ a · b = c · d. (a) Es gibt eine injektive Abbildung A → P (A).
(c) A = R2 \{(0, 0)}, (a, b) ∼ (c, d) ⇔ a · d = b · c. (b) Es gibt keine surjektive Abbildung A → P (A).

Antworten der Selbstfragen

S. 28 S. 30
Die Negationen lauten: Offensichtlich ist A hinreichend für B; denn, wenn die Zahl
Die Sonne scheint nicht. durch 12 teilbar ist, ist sie sicher auch durch 3 teilbar. Also
Es gibt mindestens einen schwarzen Schwan. ist die Implikation A ⇒ B wahr. Das bedeutet gleichzeitig,
Alle natürlichen Zahlen sind entweder kleiner oder gleich dass B eine notwendige Bedingung für A ist.
17 23
8 oder größer oder gleich 8 . Genauso ist A hinreichend für C und somit C notwendig für
A. Bei der Beziehung zwischen B und C beobachten wir,
S. 29 dass B sowohl notwendig als auch hinreichend für C ist.
Die Wahrheitstabelle ist Diese Beziehung zwischen Aussagen wird äquivalent ge-
nannt, wie wir noch sehen werden.
A B A ↑ B AX B
w w f f S. 32
w f w w
A B A ⇔ B A ⇒ B B ⇒ A (A ⇒ B)
f w w w
∧(B ⇒ A)
f f w f
w w w w w w
Die NAND-Verknüpfung können wir etwa so beschreiben: w f f f w f
A ↑ B ist genau dann falsch, wenn die Aussagen A und B f w f w f f
beide wahr sind. f f w w w w
62 2 Logik, Mengen, Abbildungen – die Sprache der Mathematik

S. 36 S. 45
Es gilt Aus f (n) = f (m) folgt n − 1 = m − 1 und somit n = m.
A ⊆ B ⇔ ∀ x ∈ A: x ∈ B Damit ist f injektiv. Ist n ∈ N beliebig, so gilt mit n + 1 ∈ N
und offenbar f (n+1) = n. Damit ist f auch surjektiv. Schließlich
ist f bijektiv.
A  B ⇔ (∀ x ∈ A : x ∈ B) ∧ (∃ y ∈ B : y  ∈ A) .
S. 49
S. 38 Der Graph Gf einer Abbildung f ist eine linkstotale Rela-
Es sind jeweils die zwei Implikationen ⇒ und ⇐ zu zei- tion, da es zu jedem x ∈ X ein y ∈ Y mit (x, y) ∈ Gf gibt
gen. Beim Nachweis von ⇒ wird die Aussage links davon – das x steht links. Der Graph ist rechtseindeutig, da es zu
vorausgesetzt und die Aussage rechts davon begründet, bei jedem x ∈ X genau ein y ∈ Y mit (x, y) ∈ f gibt – das y
Nachweis von ⇐ ist es genau umgekehrt: steht rechts.
(i) ⇒: A ∪ B = {x | x ∈ A ∨ x ∈ B} = {x | x ∈ B} = B. Bei einer injektiven Abbildung f ist für jedes y ∈ Y das
⇐: x ∈ A ⇒ x ∈ B. x ∈ X mit (x, y) ∈ Gf eindeutig bestimmt – das x steht
links. Bei einer surjektiven Abbildung f gibt es zu jedem
(ii) ⇒: A ∩ B = {x | x ∈ A ∧ x ∈ B} = {x | x ∈ A} = A. y ∈ Y ein x ∈ X mit (x, y) ∈ Gf – das y steht rechts.
⇐: x ∈ A ⇒ x ∈ B.
S. 51
(iii) ⇒: A \ B = {x | x ∈ A ∧ x  ∈ B} = ∅. Nein, z. B. sind die beiden natürlichen Zahlen 3 und 7 nicht
⇐: x ∈ A ⇒ x ∈ B. miteinander vergleichbar, es gilt weder 3 | 7 noch 7 | 3.

S. 42 S. 53
Ist X = {x1 , . . . , xn }, so gilt für jedes f ∈ Y X Jeder Mensch hat genauso viele Kopfhaare wie er selbst, d. h.,
m ∼ m für jedes m ∈ M. Und wenn m1 genauso viele Kopf-
f = {(x1 , f (x1 )) . . . , (xn , f (xn ))} . haare wie m2 hat, so hat m2 genauso viele wie m1 , d. h.
m1 ∼ m2 ⇒ m2 ∼ m1 . Analog begründet man m1 ∼ m2
Für jedes f (xi ) hat man |Y | viele Möglichkeiten, damit gibt und m2 ∼ m3 impliziert m1 ∼ m3 . In der Äquivalenz-
es genau |Y |n verschiedene Abbildungen f von X in Y . klasse
[m]∼ = {n ∈ M | m ∼ n}
S. 43
Z. B. f : R → R, f (x) = x 2 . Die Restriktion f |R≥0 der liegen all jene Menschen, die gleich viele Kopfhaare haben
Funktion f auf die nichtnegativen reellen Zahlen hat dasselbe wie m.
Bild wie f .
Algebraische Strukturen
– ein Blick hinter die 3
Rechenregeln
Was bedeuten Gruppen, Ringe
und Körper in der Mathematik?
Was versteht man unter der
Symmetriegruppe eines
Ornaments?
Was ist der euklidische
Algorithmus?

3.1 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2 Homomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.3 Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.4 Ringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
64 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Die Tätigkeit, die umgangssprachlich mit „Rechnen“ bezeichnet Ausdrücke an und erhalten einen eindeutigen Ausdruck der-
wird, ist ein zielorientiertes Hantieren mit Symbolen und mit selben Art wie die Ausgangswerte. Im Sinne von Kapitel 2
Regeln, die man einfach weiß, ohne sie immer extra aufzulisten. liegt eine Abbildung von Elementepaaren auf ein einzelnes
Im Rahmen der Schulmathematik sind die Symbole Zahlen, Element vor. Das vierte Beispiel schieben wir vorerst bei-
Unbestimmte, aber auch Mengen oder Funktionen. Auch die seite, denn das „Ergebnis“ ist schließlich ein Bruch, also von
Rechenoperationen wie Addition, Subtraktion, Multiplikation, anderer Art als die Eingangselemente.
Vereinigung, Durchschnitt, Differenziation und Integration wer-
Wir verallgemeinern: Weil das Operationssymbol alles mög-
den durch Symbole ausgedrückt.
liche bedeuten kann, schreiben wir dafür ∗, ohne zu erklären,
In diesem Kapitel wollen wir genauer klären, was man eigentlich was damit gemeint ist. Wir legen uns auch nicht fest, worauf
klarstellen sollte, bevor man mit dem „Rechnen“ beginnt. Ganz wir die Operation anwenden; wir sprechen in der folgenden
im Sinne des Bestrebens der Mathematik, das Gemeinsame Definition lediglich von den Elementen a, b einer Menge.
bei verschiedenartigen Problemstellungen aufzudecken und da- Bei dieser Allgemeinheit können wir natürlich nichts über
mit zu abstrahieren, werden wir gewisse Grundeigenschaften das Ergebnis der Operation sagen. Wir wissen nur, dass es
von Rechenoperationen kennenlernen. Dabei unterscheiden wir eindeutig ist und bezeichnen es mit dem Symbol a ∗ b.
diese nicht nach den Objekten, auf welche diese Operationen
anzuwenden sind, sondern einzig nach den Regeln, welche für Definition einer Verknüpfung
diese Operationen gelten. Nur so ist der Blick auf das Wesent- Ist M eine nichtleere Menge, so heißt eine Abbildung
liche möglich.

M × M → M,
Zudem werden wir einzelne, häufig auftretende Grundtypen ∗:
algebraischer Strukturen kennenlernen, in welchen gewisse (a, b) → a ∗ b
Regeln gleichzeitig erfüllt sein müssen. Dazu gehören jedenfalls
Verknüpfung auf M.
die Gruppen, Ringe und Körper, aber noch viele andere, die in
diesem Rahmen außer Acht bleiben.
Beispiel
Wir bauen im Folgenden auf einfachen Kenntnissen der Schul- Die Addition zweier ganzer Zahlen a, b zu a + b sowie
mathematik auf und nutzen die Grundbegriffe und logischen deren Multiplikation zu a · b, aber auch die Subtraktion
Schlussweisen aus Kapitel 2. Bei den reellen und komplexen zu a − b sind Verknüpfungen auf Z.
Zahlen legen wir unser Hauptaugenmerk auf deren algebraische Ebenso stellen die Addition zweier reeller Zahlentripel
Eigenschaften; die Ordnungseigenschaften folgen im nächsten gemäß
Kapitel. Wir werden aber nicht nur mit Zahlen „rechnen“, (a1 , a2 , a3 ) + (b1 , b2 , b3 ) =
sondern auch Mengen oder Abbildungen miteinander „multipli- (a1 + b1 , a2 + b2 , a3 + b3 )
zieren“. Diese Stufe der Abstraktion stellt für Studienanfänger oder auch die Bildung des Vektorprodukts
eine klare Hürde dar, ist aber unumgänglich für ein tieferes
(a1 , a2 , a3 ) × (b1 , b2 , b3 ) =
mathematisches Verständnis.
(a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 )
Verknüpfungen auf R3 dar.
3.1 Gruppen Für je zwei Mengen M1 , M2 sind die Mengen M1 ∩ M2 ,
M1 ∪ M2 und M1 \ M2 wohldefiniert. Handelt es sich
Werden zwei Geldbeträge addiert, so ist das Ergebnis wohl- bei M1 und M2 um Teilmengen einer Menge G, so sind
bestimmt und wieder ein Geldbetrag. Dasselbe gilt, wenn wir auch M1 ∩ M2 , M1 ∪ M2 und M1 \ M2 Teilmengen von
von dem ersten Geldbetrag den zweiten subtrahieren, doch G. Somit bedeuten ∩, ∪ und \ Verknüpfungen auf der
erwarten wir dabei ein anderes Ergebnis. Wir können ande- Potenzmenge P (G) (siehe Kapitel 2, Seite 37) 
rerseits (a +b) mit (a −b) multiplizieren und für das Produkt
Das Ergebnis einer Verknüpfung ∗ auf M ist wiederum ein
(a 2 − b2 ) schreiben. Dagegen steht uns für das Ergebnis der
Element von M. Die Verknüpfung führt also nicht aus der
Division (a + b) : (a − b) kein neuer Ausdruck zur Ver-
Menge heraus. Wir sagen: M ist abgeschlossen gegenüber
fügung; wir können das Ergebnis höchstens noch als Bruch
a+b der Verknüpfung ∗ .
a−b darstellen; aber „ausgerechnet“ haben wir dabei eigent-
lich nichts. ?
Welche der folgenden Operationen stellt eine Verknüpfung
Was ist das Gemeinsame dieser verschiedenen Operationen?
auf der Menge N der natürlichen Zahlen dar: Addition, Sub-
traktion, Multiplikation, Division?
Addition und Subtraktion sind Beispiele einer
Verknüpfung In der obigen Definition einer Verknüpfung wird nicht ver-
langt, dass das Ergebnis a ∗ b von der Reihenfolge unab-
Bei den ersten drei Beispielen wenden wir eine Rechenopera- hängig ist – im Gegenteil, M × M ist ja die Menge der ge-
tion, die Addition, Subtraktion oder Multiplikation, auf zwei ordneten Paare und daher (a, b) = (b, a), sofern a = b
3.1 Gruppen 65

ist. Die Subtraktion ganzer Zahlen ist offensichtlich ein Bei- Element mit dieser Eigenschaft. Das zu a linksinverse Ele-
spiel einer Verknüpfung, bei der die Reihenfolge wesentlich ment ist −a, denn (−a) + a = 0. (N, +) und (N0 , +) sind
ist. Wir werden dies als Normalfall betrachten und verstehen keine Gruppen, denn es fehlen die inversen Elemente.
a ∗ b = b ∗ a als Zusatzbedingung. (Q, ·) ist keine Gruppe. Zwar gibt es das linksneutrale
Element 1, und etwa zu 2 gibt es das Linksinverse 21 , denn
Ist ∗ eine Verknüpfung auf der Menge M, so gilt für a, b, 1
c ∈ M: 2 · 2 = 1. Aber es gibt kein linksinverses Element zu
0, also keine rationale Zahl a mit a · 0 = 1. Jedoch ist
a =b ⇒ a∗c =b∗c und c∗a = c∗b. (3.1) (Q \ {0}, ·) eine Gruppe, und ebenso ist (R \ {0}, ·) eine
kommutative Gruppe. 

Beweis: a ∗ c bezeichnet das Bild des Paares (a, c) unter der In den bisher vorgestellten Beispielen war das neutrale Ele-
Abbildung ∗ : (M ×M) → M. Im Falle der Gleichheit a = b ment eindeutig. Auch waren die Gruppen kommutativ, und
gilt (a, c) = (b, c); also müssen auch deren Bilder überein- natürlich ist dann ein linksneutrales Element zugleich rechts-
stimmen. Aus demselben Grund hat a = b die Gleichheit der neutral, d. h., a ∗ e = a, und das linksinverse Element a  zu
Paare (c, a) = (c, b) zur Folge und weiter c ∗ a = c ∗ b . a ist auch rechtsinvers, d. h., a ∗ a  = e. Der folgende Satz
Wir können (3.1) auf folgende Weise in Worte fassen: Die wird zeigen, dass dies nicht nur auf kommutative Gruppen
in einer Gleichung ausgedrückte Übereinstimmung zwischen beschränkt bleibt, sondern allgemein der Fall ist.
der linken und der rechten Seite bleibt bestehen, wenn man Man hätte demnach so wie in manchen Lehrbüchern im
beide Seiten von rechts mit demselben Element verknüpft. Axiom (G2) gleich die Existenz eines einzigen neutralen Ele-
Dasselbe gilt für eine Verknüpfung von links. mentes fordern können sowie in (G3) zu jedem Element a
die Existenz eines links- und gleichzeitig rechtsinversen Ele-
ments. Es ist aber das Bestreben in der Mathematik, in den
Gruppen sind durch drei Axiome Definitionen möglichst wenig zu fordern. Deshalb wird hier
gekennzeichnet der Mehraufwand in Form des folgenden Satzes samt zuge-
hörigem Beweis in Kauf genommen.
Je nach Art der Regeln, die für eine Menge M mit einer
Verknüpfung ∗ gelten, lassen sich verschiedene Begriffe de- Satz vom neutralen und vom inversen Element
finieren. Wir beginnen mit einem, der in unterschiedlchsten In jeder Gruppe (G, ∗) gibt es genau ein neutrales Ele-
Bereichen der Mathematik auftritt und dessen Rechenregeln ment e mit e ∗ x = x ∗ e = x für alle x ∈ G.
uns vom Rechnen mit Zahlen sehr vertraut sind.
Ferner gibt es zu jedem a ∈ G genau ein inverses Ele-
ment a −1 mit der Eigenschaft
Definition einer Gruppe
Die Menge G mit der Verknüpfung ∗ heißt Gruppe, a ∗ a −1 = a −1 ∗ a = e .
wenn die folgenden Eigenschaften erfüllt sind:
(G1) Für alle a, b, c ∈ G gilt: (a ∗ b) ∗ c = a ∗ (b ∗ c), Das inverse Element a −1 ist somit gleichzeitig links-
d. h., die Verknüpfung ∗ ist assoziativ. und rechtsinvers.
(G2) Es existiert ein linksneutrales Element e ∈ G mit
e ∗ a = a für alle a ∈ G. Beweis: Wir zeigen dies in vier Schritten, indem wir je-
(G3) Zu jedem a ∈ G existiert ein hinsichtlich e links- weils ein wichtiges Zwischenergebnis formulieren und dann
inverses Element a  ∈ G mit a  ∗ a = e. begründen:
Wir sprechen kurz von der Gruppe (G, ∗).
Gilt stets a ∗ b = b ∗ a, so heißt die Gruppe kommutativ (i) In einer Gruppe ist das hinsichtlich e zu a linksinverse
oder abelsch – nach dem norwegischen Mathematiker Element a  zugleich rechtsinvers. Somit gilt auch a ∗ a  = e .
Niels H. Abel (1802–1829). Beweis: Nach der Definition einer Gruppe gibt es zu a ein
a  mit a  ∗ a = e und ferner zu a  ein a  mit a  ∗ a  = e.
Folglich gilt nach den einzelnen Punkten der Gruppendefini-
? tion
Wir betrachten auf der Menge P (M) aller Teilmengen von
M = {1, 2, 3} die Verknüpfungen ∩, ∪ und \. Welche sind e
(G3) (G2) (G3)
= a  ∗ a  = a  ∗ (e ∗ a  ) = a  ∗ (a  ∗ a) ∗ a 
assoziativ? Für welche existiert ein linksneutrales Element? (G1) (G3) (G2)
Gibt es linksinverse Elemente? = (a  ∗ a  ) ∗ (a ∗ a  ) = e ∗ (a ∗ a  ) = a ∗ a  .
(ii) Das linksneutrale Element e ist zugleich rechtsneutral,
daher stets auch a ∗ e = a.
Beispiel Beweis: Es ist
Offensichtlich ist (Z, +) eine kommutative Gruppe. Da-
a ∗ e = a ∗ (a  ∗ a) = (a ∗ a  ) ∗ a = e ∗ a = a.
(G3) (G1) (i) (G2)
bei ist 0 linksneutral, denn 0 +a = a, und 0 ist das einzige
66 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Nun fehlt noch der Nachweis der Eindeutigkeit sowohl von bei der Verknüpfung nicht ohne Weiteres vertauschen. Dies
e als auch von a −1 . gilt z. B. auch bei der folgenden, in allen Gruppen gültigen
Formel:
(iii) In einer Gruppe ist das neutrale Element e eindeutig be-
(a ∗ b)−1 = b−1 ∗ a −1 . (3.3)
stimmt. Der Hinweis „hinsichtlich e“ bei den inversen Ele-
menten kann somit entfallen.
?
Beweis: Angenommen, e ist ebenfalls ein neutrales Element. Wie kann (3.3) bewiesen werden?
Dann gilt:
e = e ∗ e = e .
(ii) (G2)
Gruppen sind in vielen Bereichen der Mathematik anzutref-
Somit ist e eindeutig bestimmt. fen. Wir beginnen mit den geläufigen Beispielen:

(iv) In einer Gruppe ist das inverse Element a  zu a ∈ G Beispiel


eindeutig bestimmt. Auf Seite 65 wurde bereits gezeigt, dass die ganzen Zah-
len Z hinsichtlich der Addition eine kommutative Gruppe
Beweis: Angenommen, a  ist ebenfalls ein inverses Element bilden mit 0 als neutralem Element und (−x) als inver-
zu a. Dann gilt: sem Element zu x. Dasselbe gilt für die Gruppen (Q, +),
(R, +) und (C, +).
a  = a  ∗ e = a  ∗ (a ∗ a  ) = (a  ∗ a) ∗ a  = a  .
(ii) (i) (G1) (G3)
Die auf Seite 64 vorgestellte elementweise Addition reel-
ler Zahlentripel ergibt die Gruppe (R3 , +) mit dem neu-
Somit ist a  eindeutig bestimmt. tralen Element (0, 0, 0). Natürlich gibt es die analogen
Damit ist nun aber der oben aufgestellte Satz vom neutralen Gruppen (Rn , +) und (Cn , +), n ∈ N.
und inversen Element vollständig bewiesen.  Neben den additiven Gruppen gibt es die multiplikativen
(Q \ {0}, ·), (R \ {0}, ·) und (C \ {0}, ·). Sie sind eben-
falls kommutativ; das neutrale Element ist 1, und 1/x ist
Wir bezeichnen von nun an das eindeutig bestimmte Inverse invers zu x. Wir schreiben statt x · y −1 einfacher xy . Übri-
von a mit a −1 , sofern die Verknüpfung keine Addition ist. gens, in nicht kommutativen Gruppen wäre diese Bruch-
Bei einer additiven Verknüpfung schreiben wir −a für das zu darstellung nicht sinnvoll, denn man könnte nicht zwi-
a inverse Element. Wir halten weiterhin fest: schen x ∗ y −1 und y −1 ∗ x unterscheiden.
Die auf Seite 64 vorgestellte Verknüpfung zweier Zahlen-
Die Kürzungsregeln tripel zu dem Vektorprodukt ergibt hingegen keine Gruppe,
In Gruppen gelten die beiden Kürzungsregeln: denn „ד ist nicht assoziativ. Dies zeigt das folgende Bei-
spiel mit e1 = (1, 0, 0), e2 = (0, 1, 0) und e3 = (0, 0, 1):
a ∗ b = a ∗ c ⇒ b = c,
(3.2) (e1 × e1 ) × e2 = (0, 0, 0), hingegen
b ∗ a = c ∗ a ⇒ b = c.
e1 × (e1 × e2 ) = e1 × e3 = (0, −1, 0).
Hier gibt es übrigens auch kein neutrales Element, also
Beweis: Wir verknüpfen beide Seiten der Gleichung a ∗ kein Tripel e mit e × (x1 , x2 , x3 ) = (x1 , x2 , x3 ) für alle
b = a ∗ c von links mit dem Inversen a −1 von a. Dann folgt (x1 , x2 , x3 ) ∈ R3 . 
mit (3.1) a −1 ∗ (a ∗ b) = a −1 ∗ (a ∗ c) und weiter wegen der
Assoziativität e ∗ b = e ∗ c, also b = c.  Handelt es sich bei der Gruppenverknüpfung nicht ausdrück-
lich um eine Addition, so spricht man gerne neutral von der
? Gruppenmultiplikation und nennt das Ergebnis auch Produkt.
Wie lässt sich die zweite Kürzungsregel beweisen?

Die bijektiven Abbildungen einer Menge auf


Mithilfe der Kürzungsregeln (3.2) erkennen wir z. B. sich bilden eine Gruppe
a∗b =a ⇒ b =e sowie a ∗ b = b ⇒ a = e. Eine neue Art von Verknüpfung tritt in dem folgenden Bei-
spiel auf, und diesmal handelt es sich um eine nicht kommu-
tative Gruppe:
?
Warum gilt in einer Gruppe (G, ∗) stets (y −1 )−1 = y für G sei die Menge der bijektiven Abbildungen einer Menge
y ∈ G? M auf sich, also der Permutationen von M. Wie gewohnt,
bezeichnet das Symbol ◦ die Hintereinanderausführung. Da-
mit ist ◦ eine Verknüpfung auf G, denn sind f und g zwei
Die bisher vorgestellten Regeln für Gruppen wirken vertraut; Bijektionen von M, so gilt:
man kennt sie alle aus der Schulmathematik. Nur bei der
f g
Reihenfolge muss man achtgeben; man darf die Reihenfolge g ◦ f : x → f (x) → g ◦ f (x) = g (f (x)) für x ∈ M,
3.1 Gruppen 67

und g ◦ f ist wieder bijektiv (Seite 49). Wir zeigen, dass aus den Kürzungsregeln (3.2) folgt
(G, ◦) eine Gruppe ist, die Permutationsgruppe von M.
(a ◦ c = b ◦ c oder c ◦ a = c ◦ b) ⇒ a = b.
Die Verknüpfung ◦ ist assoziativ, denn bei f, g, h ∈ G ist
Dass die Permuationsgruppe (G, ◦) von M nicht kommutativ
g ◦ f : x → g(f (x)), h ◦ (g ◦ f ) : x  → h (g(f (x))) , ist, zeigt ein Vergleich der Produkte
h ◦ g : x → h(g(x)), (h ◦ g) ◦ f : x  → h (g(f (x))) . g ◦ i : 1 → 2, 2 → 1, 3 → 3, g ◦ i = h,
also
i ◦ g : 1 → 1, 2 → 3, 3 → 2, i ◦ g = f.
Dies gilt nicht nur für Bijektionen, sondern für alle hinter-
einander ausführbaren Abbildungen, wie bereits in Kapi- Somit gilt:
tel 2 festgestellt worden ist. g ◦ i = i ◦ g.
Neutrales Element ist die identische Abbildung Die Bijektion i rückt jede Zahl zyklisch um 1 weiter; zyklisch
idM : x → x für alle x ∈ M. heißt 1 → 2 → 3 → 1. Damit wird klar, warum i −1 = j ist,
Zu jeder Bijektion f von M existiert nach Kapitel 2 denn j macht dasselbe in der entgegengesetzten Richtung.
(Seite 48) die Umkehrabbildung f −1 ∈ G mit f −1 ◦ f =
idM . Die Gruppe der Permutationen einer Menge von n Elementen
heißt symmetrische Gruppe und wird üblicherweise mit Sn
bezeichnet. Demnach behandeln wir in diesem Beispiel die
Satz von der Permutationsgruppe
symmetrische Gruppe S3 .
Die bijektiven Abbildungen einer nichtleeren Menge M
auf sich bilden hinsichtlich der Hintereinanderausfüh- ?
rung ◦ eine Gruppe, die Permutationsgruppe von M. Ergänzen Sie in der obigen Gruppentafel die fehlenden Ele-
mente.
Nun sei M = {1, 2, 3}: Dann umfasst die Permutations-
gruppe G von M die folgenden Bijektionen: Bei einer genaueren Analyse der obigen Gruppentafel kann
man feststellen, dass die Teilmenge {i, j, e} abgeschlossen
e: 1 → 1, 2  → 2, 3  → 3,
ist unter ◦, denn die Produkte i ◦ i = j , i ◦ j = j ◦ i = e
f: 1 → 1, 2  → 3, 3  → 2,
und j ◦ j = i wie auch alle jene mit e haben als Ergebnis
g: 1 → 3, 2  → 2, 3  → 1,
wieder ein Element aus dieser Teilmenge. Diese Teilmenge
h: 1 → 2, 2  → 1, 3  → 3,
von nur 3 Permutationen bildet für sich eine Gruppe. Dafür
i: 1 → 2, 2  → 3, 3  → 1,
gibt es ein Fachwort:
j: 1 → 3, 2  → 1, 3  → 2.

Offensichtlich ist e = idM . Jede der Bijektionen f, g, h bil-


Untergruppen sind Teilmengen einer Gruppe,
det genau ein Element von M auf sich ab, d. h. lässt dieses
fix. Es ist f (1) = 1, g(2) = 2 und h(3) = 3. die selbst wieder Gruppen sind

Wie die durch Hintereinanderausführung entstehenden Pro- Ist (G, ∗) eine Gruppe, und hat eine Teilmenge H von G die
dukte aussehen, zeigt in übersichtlicher Form die folgende Eigenschaft, hinsichtlich der von G stammenden Verknüp-
Tabelle. Offensichtlich könnten die oberste Zeile und die fung eine Gruppe zu sein, so heißt H Untergruppe von G.
Spalte links vom Doppelstrich auch weggelassen werden,
Wir verwenden für die Verknüpfung auf H einfachheitshal-
nachdem die dort aufgelisteten Faktoren bei Multiplikation
ber dasselbe Symbol ∗ wie in G, sprechen also von der
mit dem neutralen Element e erneut als Produkte auftreten.
Gruppe (H, ∗), obwohl mit der „von G stammenden Ver-
Der verbleibende und hier gelb schattierte Teil der Tabelle
knüpfung“ eigentlich die Einschränkung ∗|H ×H von ∗ : G ×
rechts vom vertikalen und unter dem horizontalen Doppel-
G → G auf H × H gemeint ist.
strich heißt Gruppentafel von G.
Hat man festzustellen, ob eine gegebene Teilmenge H eine
◦ e f g h i j Untergruppe der Gruppe (G, ∗) ist, so müssen nicht alle
e◦ e f g h i j Gruppenaxiome überprüft werden. Das folgende Kriterium
f◦ f e zeigt, dass es ausreicht, in H die Abgeschlossenheit gegen-
g◦ g e h über ∗ und die Existenz der inversen Elemente nachzuweisen.
h◦ h e
i◦ i f j e Untergruppenkriterium
j◦ j e i Sind (G, ∗) eine Gruppe und H eine Teilmenge von G,
so ist H dann und nur dann eine Untergruppe von G,
Absichtlich sind in dieser Gruppentafel noch einige Felder wenn gilt:
frei gelassen worden, um Sie zu aktiver Mitarbeit anzuregen: (U1) H ist nicht die leere Menge.
(U2) Für alle x ∈ H ist zugleich x −1 ∈ H .
Jedes der 6 Elemente e, . . . , j muss in jeder Spalte und in (U3) Aus x, y ∈ H folgt stets (x ∗ y) ∈ H .
jeder Zeile der Gruppentafel genau einmal vorkommen, denn
68 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Beweis: Die Formulierung „dann und nur dann“ erfordert, Beweis mithilfe des Untergruppenkriteriums:
dass wir zweierlei zeigen müssen: Zu (U1): H ist nichtleer, weil die identische Abbildung
(i) Ist H eine Untergruppe, so gelten die im Untergruppen- idM jedenfalls N fix lässt, also zu H gehört.
kriterium geforderten Aussagen (U1), (U2) und (U3).
Zu (U2): Bildet die Bijektion f ∈ G die Teilmenge N auf
(ii) Treffen umgekehrt diese drei Aussagen zu, so ist H eine
sich ab, so trifft dasselbe auf die Umkehrabbildung f −1
Untergruppe von G, also (H, ∗) eine Gruppe.
zu. Also liegt auch f −1 in H .
Zu (i): Nach (G2) muss H ein neutrales Element enthalten; Zu (U3): Wenn schließlich neben f auch g die Teilmenge
also ist H nichtleer und damit (U1) bestätigt. N auf sich abbildet, so tut dies auch g ◦ f .
So können wir z. B. für den Sonderfall M = {1, 2, 3}
Als Gruppe enthält H gemäß (G3) mit jedem Element a auch
mit der Gruppentafel von Seite 67 sofort erkennen, dass
das Inverse a −1 . Somit ist auch (U2) erfüllt.
{e, f } eine Untergruppe von (G, ◦) ist, denn e und f sind
Nachdem (H, ∗) eine Gruppe ist, muss nach der Definition die einzigen Permutationen von M, die das Element 1 fix
einer Verknüpfung auf Seite 65 mit x, y ∈ H auch stets x ∗ y lassen. Ebenso sind {e, g} und {e, h} Untergruppen. 
in H liegen. Also gilt (U3).
Weitere Beispiele von Untergruppen werden in dem Essay
Zu (ii): Wegen (U3) ist H bezüglich der von G stammenden auf Seite 70 vorgeführt. Dort geht es um bijektive Selbstab-
Verknüpfung ∗ abgeschlossen. Also liegt eine Verknüpfung bildungen unendlicher Punktmengen.
auf H vor.
Wir zeigen im Folgenden, dass jede Untergruppe H von
Die Verknüpfung ∗ auf H ist assoziativ, denn dies ist in ganz (G, ∗) Anlass für eine Äquivalenzrelation ∼H auf der Menge
G garantiert. G ist. Wir definieren
Wegen der Forderung H = ∅ in (U1) gibt es mindestens ein
g2 ∼H g1 ⇐⇒ g1−1 ∗ g2 ∈ H.
Element a ∈ H . Nach (U2) liegt das Inverse a −1 in H und
wegen (U3) auch das Produkt a ∗ a −1 = e. Also gibt es in Offensichtlich ist g2 genau dann hinsichtlich ∼H äquivalent
H ein neutrales Element. zu g1 , wenn g1−1 ∗ g2 = h, also g2 = g1 ∗ h ist mit einem
Das letzte Gruppenaxiom (G3) ist schließlich mit der Forde- h ∈ H . Die Menge der zu g1 äquivalenten Elemente lautet
rung (U2) identisch.  also
g1 ∗ H = {(g1 ∗ h) | h ∈ H }.

Eine ausführliche Diskussion des Untergruppenkriteriums Dass die Relation ∼H auf G tatsächlich reflexiv, symmetrisch
wird in der Box auf Seite 69 präsentiert. und transitiv ist, ergibt sich nun einfach aus den Untergrup-
peneigenschaften von H . Damit sind die Mengen g ∗ H für
Nun wenden wir uns einigen Beispielen von Untergruppen g ∈ G Äquivalenzklassen. Wir nennen sie Linksnebenklas-
zu: sen von H . Auch H = e ∗ H gehört dazu.
Beispiel Alle Linksnebenklassen sind gleich mächtig, denn die Ab-
Jede Gruppe (G, ∗) mit neutralem Element e enthält die bildung
Untergruppen {e} und G. Man nennt diese Untergruppen H → g ∗ H mit h → g ∗ h
die trivialen Untergruppen von G. Wenn wir von einer
echten Untergruppe H sprechen, so meinen wir damit, ist eine Bijektion. Nachdem die Linksnebenklassen als
dass H keine triviale Untergruppe von G ist. Damit ist H Äquivalenzklassen zu einer Partition von G führen (siehe
sicherlich eine echte Teilmenge von G. Seite 55), also jedes Element von G in genau einer Linksne-
Offensichtlich ist in der Folge der Gruppen (Z, +), (Q, +), benklasse vorkommt, erhalten wir im Falle endlicher Grup-
(R, +) und (C, +) jede eine echte Untergruppe der folgen- pen die Anzahl |G| der Elemente von G, wenn wir |H | mit
den. Dasselbe trifft auf die Folge (Q \ {0}, ·), (R \ {0}, ·) der Anzahl der Linksnebenklassen von H in G multiplizie-
und (C \ {0}, ·) zu. Da das Produkt zweier positiver Zah- ren. Damit haben wir das folgende Resultat hergeleitet.
len und auch der Kehrwert einer positiven Zahl stets wie-
der positiv sind, ist (R>0 , ·) eine echte Untergruppe von Satz von Lagrange:
(R \ {0}, ·). Ist H Untergruppe der endlichen Gruppe G, so ist die
Wie im Beispiel auf Seite 66 sei (G, ◦) die Gruppe der Anzahl |H | der Elemente von H ein Teiler von |G|.
Permutationen einer Menge M, und es sei N ⊆ M eine
Teilmenge von M. Mit H sei die Menge derjenigen Bijek-
Wenn wir unsere Relation abwandeln zu
tionen f ∈ G bezeichnet, die die Teilmenge N von M auf
sich abbilden und damit N als Ganzes fix lassen. Damit ist g2 ∼H g1 ⇔ g2 ∗ g1−1 ∈ H,
gemeint, dass jedes f ∈ H die Forderung f (x) ∈ N er-
füllt für alle x ∈ N , was wir kurz als f (N) ⊆ N schreiben so entsteht erneut eine Äquivalenzrelation. Diesmal fungie-
können. Dann ist H eine Untergruppe von G. ren die Rechtsnebenklassen H ∗ g als Äquivalenzklassen.
3.1 Gruppen 69

Unter der Lupe: Untergruppenkriterium


Gegeben sind eine Gruppe (G, ∗) sowie eine Teilmenge H von G. Das Untergruppenkriterium gibt notwendige und
hinreichende Bedingungen dafür an, dass H eine Untergruppe ist, also selbst eine Gruppe hinsichtlich der von G auf H
induzierten Verknüpfung.
Will man ganz exakt sein, so muss man die Verknüpfungen in G und H auch verschieden bezeichnen. Schreiben wir also
vorübergehend ∗ für die Beschränkung von ∗ auf H × H . Dann stehen die beiden Gruppen (G, ∗) und (H, ∗ ) zur Diskussion.

Neutrale Elemente: Äquivalente Bedingungen:


Nach (G2) muss H ein neutrales Element enthalten. Die- Manchmal werden die beiden Bedingungen (U2) und (U3)
ses neutrale Element e von H ist die eindeutige Lösung in einer einzigen Forderung zusammengefasst, nämlich in:
der Gleichung a ∗ x  = a für ein a ∈ H . Nun stimmen (U4) Aus x, y ∈ H folgt stets (x ∗ y −1 ) ∈ H .
für a, e ∈ H ⊂ G die Produkte überein, ob diese bei-
Wir zeigen im Folgenden, dass die drei Bedingungen (U1),
den Elemente nun in H oder in G verknüpft werden, also
(U2) und (U3) zusammengenommen äquivalent sind zu
a ∗ e = a ∗ e . Daher ist e gleichzeitig eine Lösung
(U1) und (U4):
der in G eindeutig lösbaren Gleichung a ∗ x = a in G.
Dies beweist, dass das neutrale Element e von (H, ∗ ) „(U1,U2,U3) ⇒ (U1,U4)“:
gleichzeitig neutrales Element e von (G, ∗) ist. Damit ist Ist (H, ∗ ) eine Untergruppe, treffen also (U1), (U2) und
auch sichergestellt, dass für a ∈ H das inverse Element (U3) zu, so folgt aus x, y ∈ H mit (U2) auch y −1 ∈ H
a −1 unabhängig davon ist, ob wir die Gruppen (G, ∗) oder und nach (U3) weiter x ∗ y −1 ∈ H .
(H, ∗ ) meinen.
„(U1,U4) ⇒ (U1,U2,U3)“:
Ist (G, ∗) eine Gruppe, und treffen auf die Teilmenge
Zur Notwendigkeit von (U2):
H ⊂ G die Bedingungen (U1) und (U4) zu, so gibt es
Dass (U1) und (U3) allein nicht ausreichen als Kennzeich-
ein x ∈ H , und wir können in (U4) y = x setzen. Da-
nung einer Untergruppe, zeigt die Multiplikation auf der
mit liegt auch x ∗ x −1 = e in H , und e ist das neutrale
Menge der ganzen Zahlen. Z \ {0} ist zwar abgeschlossen
Element in ganz G.
unter der in der Gruppe Q \ {0} definierten Multiplika-
Setzen wir andererseits in (U4) x = e, so ist mit y ∈ H
tion, aber deshalb noch keine Untergruppe, nachdem in Z
auch e ∗ y −1 = y −1 ∈ H . Also gilt (U2).
inverse Elemente fehlen.
Schließlich erkennen wir, dass H abgeschlossen ist be-
züglich ∗ : Aus x, y ∈ H folgt y −1 ∈ H und weiter
mit (U4) x ∗ (y −1 )−1 = x ∗ y ∈ H .

Gruppen lassen sich oft aus gewissen Operationen r und s anwenden. Es wird sich herausstellen,
Grundelementen erzeugen dass lediglich 6 verschiedene Werte als Ergebnisse auftreten:
Durch Anwendung von r entsteht aus 3 der Kehrwert
Am Ende dieses Abschnitts wenden wir uns einem Beispiel r(3) = 13 ; durch s geht 3 in s(3) = 1 − 3 = −2 über.
zu, das deshalb etwas schwerer zu erfassen ist, weil die Ele- Wenn wir auf die neuen Werte wiederum r oder s anwen-
mente der Gruppe Bijektionen einer unendlichen Menge sind. den, so entstehen 1 − 13 = 23 und − 21 , oder wir kehren zum
Das Beispiel ist aber recht instruktiv, denn es bereitet künftige
Ausgangswert 3 zurück. Ferner ist r( 23 ) = 23 , und ebenso ist
Begriffe wie Erzeugendensystem und Isomorphie vor.
s(− 21 ) = 23 . Weder r, noch s führen 23 in Werte über, die bis-
her noch nicht aufgetreten sind. Also bleibt es bei der Menge
Beispiel Ausgangspunkt ist die Gruppe (G, ◦) mit G als
der Bilder:  
Menge der Bijektionen von R \ {0, 1} auf sich. Allerdings
1 2 1 3
beschränken wir uns auf diejenigen Bijektionen, welche aus 3, , −2, , − , .
den folgenden zwei Abbildungen zusammensetzbar sind: 3 3 2 2
Wir werden erkennen, dass es auch für andere x ∈ R nie
1
r : x → und s : x  → 1 − x; mehr als sechs verschiedene Bilder gibt. Hinter diesem Phä-
x nomen steckt nämlich eine nur sechs Elemente umfassende
r bedeutet den Übergang zum Reziprokwert; hier muss x = 0 Untergruppe H , welche trotzdem alle möglichen Produkte
ausgeschlossen werden. s kann als Spiegelung an x = 21 der Bijektionen r und s enthält.
bezeichnet werden; hier muss x = 1 ausgeschlossen werden,
weil dessen Bild x = 0 fehlt. Nach (U3) enthält H neben r und s auch

Wir wollen zunächst nur die Zahl 3 ∈ R herausgreifen und r 1 r 1


r ◦ r : x → → 1 = x,
auf diese wiederholt und in beliebiger Reihenfolge die beiden x x
70 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Hintergrund und Ausblick: Symmetriegruppe eines Ornaments aus der Alhambra


Welche Bewegungen bringen das unten links ausschnittsweise gezeigte und eigentlich unbegrenzt vorzustellende Ornament
F mit sich zur Deckung?
Wir verzichten hier auf die genaue Definition des Begriffs Bewegung; diese folgt in Kapitel 7. Uns genügt die folgende
anschauliche Vorstellung: Wir kopieren den vorliegenden Ausschnitt auf eine Folie und versuchen, diese auf verschiedene
Arten derart über das Original zu legen, dass die Kopie des Ornaments genau das darunterliegende Ornament F überdeckt.
Ausgehend von der randgetreuen Lage kann beispielsweise durch eine geeignete Verschiebung der Kopie nach rechts eine
neuerliche Überdeckung der Ornamente erreicht werden. Die Folie darf auch umgedreht werden.

Mit jeder deckungsgleichen Position ist eine Abbildung diesem Fall nur mehr Drehungen. Wir sagen, die Quadrat-
der Punkte des Originals F auf die jeweils darüberliegen- mitte ist ein vierzähliges Drehzentrum.
den Punkte der Kopie verbunden. Wenn wir die Kopie
als mit dem Original identisch auffassen und deren Trä-
gerebene als R2 interpretieren, so liegt jeweils eine bijek-
tive Punktabbildung R2 → R2 vor, und diese nennen wir
eine Deckbewegung des Ornaments F . Die vorhin als Bei-
spiel erwähnte Verschiebung nach rechts ist eine derartige
Deckbewegung.
Alle Deckbewegungen bilden eine Gruppe, die Symme-
triegruppe von F , denn offensichtlich sind alle drei An-
forderungen aus dem Untergruppenkriterium erfüllt. Nun kehren wir zurück zu dem kompletten Ornament F .
Bei allen Überlegungen müssen wir voraussetzen, dass der Offensichtlich bringen die Drehungen durch ganzzahlige
gezeigte Ausschnitt soweit typisch ist für das unbegrenzte Vielfache von 90◦ um die Quadratmitten nicht nur die
Ornament F , dass eine Übereinstimmung der Kopie mit Teilfigur F1 mit sich zur Deckung, sondern das ganze Or-
dem Original innerhalb des Ausschnitts auch eine Über- nament. Dazu kommen nun noch alle Translationen, also
einstimmung außerhalb garantiert. Parallelverschiebungen, welche ein Quadratzentrum in ein
anderes überführen. Alle diese vierzähligen Zentren sind
im Gesamtbild links durch kleine rote Quadrate markiert.
Die Symmetriegruppe von F wird damit unendlich groß.
Sie umfasst auch die Drehungen durch ganzzahlige Viel-
fache von 90◦ um die zwischen den Quadratzentren lie-
genden Kreuzungspunkte, die in der Abbildung links blau
markiert sind. Schließlich gehören auch noch weitere Dre-
hungen durch 180◦ dazu. Deren Zentren heißen zweizäh-
lig, und sie sind links durch grüne Rauten gekennzeichnet.

Beginnen wir mit der rechts oben gezeigten quadratischen


Teilfigur F0 von F . Man kann die Figur F0 durch Dre-
hungen um das Zentrum durch 90◦ , 180◦ oder 270◦ mit
ihrer Ausgangslage zur Deckung bringen. Dasselbe trifft
auch auf die Spiegelungen an den unter 0◦ , 45◦ , 90◦ oder
135◦ geneigten Quadratdurchmessern zu. So entsteht zu- Es gibt übrigens 17 verschiedene ebene Symmetriegrup-
sammen mit der identischen Abbildung eine insgesamt 8 pen, welche Translationen in verschiedenen Richtungen
Elemente umfassende Gruppe, die Symmetriegruppe die- enthalten. Man nennt diese Gruppen auch ebene kristal-
ser quadratischen Teilfigur. lografische Gruppen. Die dem obigen Beispiel zugrunde
Betrachten wir nun einen größeren Ausschnitt F1 des Or- liegende Symmetriegruppe wird üblicherweise mit p4 be-
naments; nehmen wir zur quadratischen Figur F0 auch zeichnet.
noch die davon ausgehenden Linien dazu (Abbildung Literatur
rechts unten). Für F1 sind die Spiegelungen keine Sym- E. Quaisser: Diskrete Geometrie. Spektrum Akademischer
metrieoperationen mehr. Die Symmetriegruppe umfasst in Verlag, Heidelberg 1994
3.2 Homomorphismen 71

also r ◦ r = e mit e als identischer Abbildung, und ebenso lich nicht von der gleichfalls 6 Elemente umfassenden sym-
metrischen Gruppe S3 aus dem Beispiel von Seite 67 unter-
s s 
s ◦ s : x → 1 − x  → 1 − (1 − x) = x. scheidet.

Damit gilt r −1 = r und s −1 = s. Abbildungen, die diese


Eigenschaft erfüllen und von der identischen Abbildung 3.2 Homomorphismen
verschieden sind, heißen übrigens selbstinvers oder involu-
torisch.
Wir beziehen uns zunächst auf das obige Beispiel. Die von r
Der Untergruppe H müssen aber auch die Produkte und s erzeugte Gruppe (H, ◦) umfasst die 6 Elemente

1 x−1 1 H = {e, r, s, r ◦ s, s ◦ r, r ◦ s ◦ r}.


s ◦ r : x → 1 − = und r ◦ s : x →
x x 1−x
Dabei ist r ◦ r = s ◦ s = e. Aber auch das letzte Element
angehören. Dabei ist nach (3.3) r ◦ s ◦ r ist involutorisch.
Zum Vergleich betrachten wir nochmals die Gruppentafel der
(r ◦ s)−1 = s −1 ◦ r −1 = s ◦ r.
symmetrischen Gruppe S3 aus Beispiel 3 (Seite 66), wobei
diesmal die Farben verdeutlichen sollen, dass in jeder Zeile
Nun fehlen noch r ◦ s ◦ r und s ◦ r ◦ s. Die beiden sind gleich,
und in jeder Spalte alle 6 Elemente vorkommen:
denn
s◦r x − 1 r x ◦ e f g h i j
r ◦ (s ◦ r) : x  → → ,
x x−1 e◦ e f g h i j
f◦ f e i j g h
r◦s 1 s 1 x
s ◦ (r ◦ s) : x → → 1 − = . g◦ g j e i h f
1−x 1−x x−1
h◦ h i j e f g
Auch r ◦ s ◦ r = s ◦ r ◦ s ist involutorisch, denn nach zwei- i◦ i h f g j e
maliger Anwendung der Kürzungsregeln (3.3) folgt: j◦ j g h f e i

(r ◦ s ◦ r)−1 = r −1 ◦ s −1 ◦ r −1 = r ◦ s ◦ r.
Hier sind die Elemente f und g involutorisch, denn f ◦ f =
g ◦ g = e. Aber auch h hat diese Eigenschaft.
Verknüpft man r ◦ s ◦ r = s ◦ r ◦ s rechts mit r oder s, so ist
die neue Abbildung gleich r ◦ s oder s ◦ r. Die folgende Bijektion ψ : H → S3 bildet die Elemente von
H auf jene von S3 ab:
Ebenso ist ein Produkt von mehr als vier r- und s-Abbil-
dungen auf eines von höchstens 3 Abbildungen reduzierbar: ψ : e → e, r → f, s → g, r ◦ s → i,
Wann immer nämlich in diesem Produkt zwei gleiche Abbil-
s ◦ r → j, r ◦ s ◦ r → h.
dungen aufeinanderfolgen, kann man diese weglassen. Hier-
auf kann man die Tripel r ◦ s ◦ r und s ◦ r ◦ s wegen de-
Dabei hat ψ eine besondere Eigenschaft, die sich erst bei
ren Gleichheit gegeneinander austauschen, wodurch an den
genauem Hinsehen offenbart. Es ist z. B.
Anschlussstellen wiederum zwei gleiche aufeinanderfolgen
können, die dann wegzulassen sind. Dies geht so lange, bis
ψ(r ◦ s) = i = f ◦ g = ψ(r) ◦ ψ(s),
nur mehr ein Produkt von höchstens 3 Abbildungen vorliegt.
ψ(s ◦ r) = j = g ◦ f = ψ(s) ◦ ψ(r)
Dies beweist: Führt man endlich oft die Bijektionen r oder
s hintereinander aus, so entstehen keine neuen Abbildungen und
gegenüber den bisherigen sechs. Die Menge
ψ(r ◦ s ◦ r) = h = f ◦ g ◦ f = ψ(r) ◦ ψ(s) ◦ ψ(r).
H = {e, r, s, r ◦ s, s ◦ r, r ◦ s ◦ r}
Tatsächlich bekommt man in allen Fällen das ψ-Bild eines in
ist abgeschlossen unter ◦, und zudem ist zu jeder Abbildung H gelegenen Produkts von r- und s-Abbildungen, indem man
auch die Inverse enthalten. Nach dem Untergruppenkriterium zunächst jeden einzelnen Faktor mittels ψ abbildet und dann
ist H eine Untergruppe von G. Weil jedes Element aus H ein die Multiplikation nach der obigen Gruppentafel vornimmt.
Produkt von endlich vielen r- und s-Abbildungen ist, sagen
wir, diese Untergruppe wird von r und s erzeugt, oder r und In diesem Abschnitt widmen wir uns generell derartigen ver-
s bilden ein Erzeugendensystem von H . knüpfungstreuen Abbildungen, denn sie ermöglichen es, bei
verschiedenen Gruppen gemeinsame Strukturen zu erken-
Wir werden im nächsten Abschnitt erkennen, dass sich diese nen. Dabei beschränken wir uns aber nicht nur auf bijektive
Gruppe (H, ◦) trotz ihrer etwas mühsamen Herleitung eigent- Abbildungen.
72 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Bei einem Homomorphismus ist das Bild eines Die zu Beginn dieses Abschnitts gezeigte Bijektion zwi-
Produkts stets gleich dem Produkt der Bilder schen der Gruppe H aus dem Beispiel von Seite 69 und
der Permutationsgruppe S3 zeigt, dass (H, ◦) isomorph ist
zur symmetrischen Gruppe S3 . 
Definition eines Homomorphismus
Eine Abbildung ψ : G → G der Gruppe (G, ∗) in die Das Beispiel in der Box auf Seite 73 zeigt mithilfe eines Ho-
Gruppe (G , ∗ ) heißt Homomorphismus, wenn für alle momorphismus, dass man zwischen geraden und ungeraden
a, b ∈ G die Eigenschaft Permutationen unterscheiden kann.

ψ(a ∗ b) = ψ(a) ∗ ψ(b)


Ein Homomorphismus G → G weist
gilt. Ist ψ bijektiv, so heißt ψ Isomorphismus und ins-
besondere bei G = G Automorphismus.
bestimmte Gesetzmäßigkeiten auf
Zwei Gruppen heißen isomorph, wenn zwischen ihnen Wir stellen nun einige Eigenschaften von Homomorphismen
ein Isomorphismus existiert. zusammen:

Ist ψ ein Homomorphismus, so kommt es nicht darauf an, Lemma


ob zwei Elemente a, b ∈ G zuerst verknüpft werden und (i) Der Homomorphismus ψ : G → G bildet das neutrale
dann deren Produkt durch ψ abgebildet wird, oder ob die Element e von G auf das neutrale Element e von G ab.
Elemente zuerst einzeln durch ψ abgebildet und dann deren (ii) Der Homomorphismus ψ : G → G bildet das inverse
Bilder in G verknüpft werden. Die Abbildung ψ ist mit den Element von a auf das inverse Element des Bildes ψ(a)
Verknüpfungen vertauschbar oder kurz: ab, also ψ(a −1 ) = [ψ(a)]−1 .
(iii) Ist ψ : G → G ein Homomorphismus, so ist die Bild-
Das Bild des Produkts ist gleich dem Produkt der Bilder. menge ψ(G) eine Untergruppe von G .
Die unterschiedlichen Verknüpfungssymbole ∗ und ∗ sollen
Beweis: (i) Für alle a ∈ G gilt a = a ∗ e, daher auch
verdeutlichen, dass die Verknüpfungen in G und G ganz
ψ(a) = ψ(a) ∗ ψ(e) und somit ψ(e) = e .
unterschiedlich sein können.
(ii) Aus a ∗ a −1 = e folgt
Es folgen einige Beispiele:
ψ(a ∗ a −1 ) = ψ(a) ∗ ψ(a −1 ) = ψ(e) = e
Beispiel
Hinter den Vorzeichenregeln für die Produkte positiver und somit ψ(a −1 ) = [ψ(a)]−1 .
oder negativer reeller Zahlen verbirgt sich ein Homomor-
phismus: Die Abbildung (iii) Wir verwenden das Untergruppenkriterium von Seite 67:
Es ist ψ(G) = ∅, da e unter den Bildelementen vorkommen
 muss. Die Abgeschlossenheit der Bildmenge gegenüber der
1 für x > 0,
ψ : R \ {0} → {1, −1}, x  → ψ(x) = Multiplikation ∗ ist gegeben, denn aus ψ(a), ψ(b) ∈ ψ(G)
−1 für x < 0
folgt
ist ein surjektiver Homomorphismus von (R \ {0}, · ) auf ψ(a) ∗ ψ(b) = ψ(a ∗ b) ∈ ψ(G).
({1, −1}, · ), denn stets ist
Schließlich ist für jedes ψ(a) ∈ ψ(G) das inverse Element
wegen (ii) gleich ψ(a −1 ) und daher gleichfalls ein Bildele-
ψ(x · y) = ψ(x) · ψ(y) .
ment. 

Die Abbildung
Der folgende Satz, welcher Arthur Cayley (1821–1895) zu-
ψ : Z → Q >0 , x → 2 ,x geschrieben wird, unterstreicht die Wichtigkeit der Permuta-
tionsgruppen für die Theorie endlicher Gruppen.
also z. B. 0 → 1, 1  → 2, 2  → 4, −1  → 21 , −2  → 41 ,
ist ein injektiver Homomorphismus (Z, +) → (Q >0 , · ), Der Satz von Cayley
denn
Jede Gruppe (G, ∗) mit n Elementen ist isomorph zu
x+y x y einer Untergruppe der symmetrischen Gruppe Sn .
ψ(x + y) = 2 = 2 · 2 = ψ(x) · ψ(y).

? Beweis: Dieser Satz basiert auf einer Beobachtung, auf


Ist ψ : x → 2x ein Homomorphismus der Gruppe (Z, +) die bereits auf Seite 67 hingewiesen wurde: In jeder Zeile
auf sich oder der Gruppe (R \ {0}, · ) auf sich? der Gruppentafel von G muss jedes der n Elemente genau
einmal vorkommen; nur die Reihenfolge variiert. Genauer:
3.2 Homomorphismen 73

Beispiel: Signum einer Permutation


Eine Permutation σ ∈ Sn der Zahlen 1, . . . , n ändert deren Reihenfolge ab auf die Folge (σ (1), σ (2), . . . , σ (n)).
Wir sprechen von einem Fehlstand von σ , wann immer in der Folge der Bildelemente eine größere Zahl vor einer kleineren
steht, wenn also σ (i) > σ (j ) ist bei i < j .
σ
So weist z. B. die Permutation σ ∈ S5 mit (1, 2, 3, 4, 5) → (3, 2, 4, 5, 1) fünf Fehlstände auf, nämlich (3, 2), (3, 1),
(2, 1), (4, 1) und (5, 1), denn rechts steht 3 vor 2 und 1, 2 vor 1, und ebenso befinden sich 4 und 5 vor 1.
Weist die Permutation σ ∈ Sn genau f Fehlstände auf, so heißt sgn σ = (−1)f Signum der Permutation σ . Die Permutation
σ heißt gerade, wenn sgn σ = 1 ist, sonst ungerade. Wir wollen den folgenden Satz beweisen, der später auch noch bei
den Determinanten im Kapitel 13 eine Rolle spielen wird.
Satz vom Signum einer Permutation
Die Abbildung sgn : Sn → {−1, 1} mit σ  → sgn σ = (−1)f ist ein Homomorphismus (Sn , ◦) → ({−1, 1}, · ), denn es
gilt: sgn(σ2 ◦ σ1 ) = sgn σ2 · sgn σ1 .

Problemanalyse und Strategie: Im Beweis verwenden wir für das Signum der Permutation σ die Formel
 σ (j ) − σ (i)
sgn σ = . (∗)
j −i
i<j

Dabei ist das Symbol für ein Produkt. Im konkreten Fall wird über alle möglichen Paare (i, j ) aus {1, . . . , n} mit
i < j multipliziert. Diese Formel ergibt etwa für das obige Beispiel, nämlich für σ ∈ S5 , den Ausdruck
(2 − 3)(4 − 3)(4 − 2)(5 − 3)(5 − 2)(5 − 4)(1 − 3)(1 − 2)(1 − 4)(1 − 5)
sgn σ = = −1.
(2 − 1)(3 − 1)(3 − 2)(4 − 1)(4 − 2)(4 − 3)(5 − 1)(5 − 2)(5 − 3)(5 − 4)

Lösung: Das rechte Produkt ist offensichtlich gleich sgn σ1 .


Zur Begründung dieser Produktformel beachten wir, dass Wir zeigen, dass das linke mit sgn σ2 übereinstimmt. Dazu
in den Faktoren des Nenners alle ungeordneten Paare (i, j ) ändern wir die Bezeichnung; wir setzen darin i  = σ1 (i)
verschiedener Elemente vorkommen, die aus {1, . . . , n} und j  := σ1 (j ). Es entsteht:
ausgewählt werden können. Dabei steht immer das grö-
ßere Element vor dem kleineren, weshalb das Produkt über  σ2 (j  ) − σ2 (i  )
.
alle Differenzen im Nenner positiv ist. j  − i
i<j
Im Zähler treten ebenfalls alle möglichen Paare auf, denn
Permutationen sind bijektiv. Daher stimmt der Absolut- Dies stimmt aus folgenden Gründen mit sgn σ2 überein:
betrag des im Zähler auftretenden Produkts mit jenem aus Wenn (i, j ) alle möglichen Paare verschiedener Zahlen
dem Nenner überein. Allerdings führt jeder Fehlstand we- aus {1, . . . , n} durchläuft, so tut dies auch (i  , j  ), denn σ1
gen σ (i) > σ (j ) zu einer negativen Differenz. Also liefert ist eine Bijektion. Wegen
die Produktformel (∗) tatsächlich den geforderten Wert
(−1)f . σ (j ) − σ (i) σ (i) − σ (j )
=
j −i i−j
Beweis des obigen Satzes:
ist es in der obigen Formel für sgn σ gleichgültig, ob das
Aus der eben bewiesenen Formel folgt für das Produkt
einzelne Paar (i, j ) im Zähler und Nenner in der Reihen-
sgn(σ2 ◦ σ1 ) zweier Permutationen:
folge (i, j ) oder (j, i) verwendet wird. Damit bleibt, wie
 σ2 ◦σ1 (j ) − σ2 ◦σ1 (i) behauptet,
sgn(σ2 ◦ σ1 ) = .
j −i
i<j sgn(σ2 ◦ σ1 ) = sgn σ2 · sgn σ1 ,

Wir

erweitern nun Zähler und Nenner mit dem Produkt und sgn ist als surjektiver Homomorphismus bestätigt. 

i<j (σ1 (j ) − σ1 (i)) und gruppieren um, indem der Zäh-


ler des linken Produkts mit dem Nenner des rechten kom- ?
biniert wird und umgekehrt. Dies ergibt: Warum ist das Produkt zweier ungerader Permutationen
 σ2 ◦σ1 (j ) − σ2 ◦σ1 (i)  σ1 (j ) − σ1 (i) aus Sn eine gerade Permutation? Warum hat σ −1 dasselbe
sgn(σ2 ◦ σ1 ) = · Signum wie σ ?
i<j
σ1 (j ) − σ1 (i) i<j
j −i
74 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Steht in der zum neutralen Element g1 = e gehörigen Zeile


von links nach rechts die Folge (g1 , g2 , . . . , gn ), so steht in
der Zeile, die zu gi gehört die Folge (gi , gi ∗g2 , . . . , gi ∗gn ).
Wir ordnen nun dem Element gi ∈ G diejenige Permutation e f g h i j
zu, welche (g1 , g2 , . . . , gn ) auf (gi , gi ∗ g2 , . . . , gi ∗ gn ) Abbildung 3.1 Darstellung der symmetrischen Gruppe S3 = {e, . . . , j } als
abbildet. Dies führt zur Abbildung Untergruppe der Permutationsgruppe S6 . Dabei sind die zu permutierenden 6
Elemente diesmal auf einem Kreis angeordnet. Die einzelnen Permutationen
ψ : G → Sn , gi  → ψ(gi ) mit ergeben sich aus den Zeilen der Gruppentafel auf Seite 71.
ψ(gi )
(g1 , g2 , . . . , gn )  −→ (gi , gi ∗ g2 , . . . , gi ∗ gn ).

Für die Permutation ψ(gi ) gilt also e = g1  → gi = gi ∗ e, Sind zwei Gruppen isomorph, so ist man geneigt zu sagen, es
g2 → gi ∗ g2 , . . . , gn → gi ∗ gn , somit kurz: handele sich um „dieselbe“ Gruppe, denn in beiden Gruppen
bestehen dieselben Relationen zwischen den einzelnen Ele-
ψ(gi ) : gk → gi ∗ gk für k = 1, . . . , n. menten. Wie die Gruppenelemente aussehen, ist aus struk-
tureller Sicht nebensächlich. Üblicherweise sagt man auch
ψ ist injektiv, denn ψ(gi ) = ψ(gj ) bedeutet zu zwei isomorphen Gruppen, dass sie bis auf Isomorphie
gleich sind.
(gi , gi ∗ g2 , . . . , gi ∗ gn ) = (gj , gj ∗ g2 , . . . , gj ∗ gn ),

und schon die jeweils ersten Elemente zeigen, dass daraus


gi = gj folgt. Im Kern sind viele Informationen über den
Wir beweisen als Nächstes, dass ψ ein Homomorphismus ist: Homomorphismus enthalten
Die dem Produkt gi ∗ gj zugeordnete Permutation lautet:
Mit jedem Homomorphismus ψ : G → G ist auch eine Un-
ψ(gi ∗ gj ) : gk → (gi ∗ gj ) ∗ gk = gi ∗ (gj ∗ gk ) tergruppe von G verbunden.
für k = 1, . . . , n. Dabei ist gj ∗ gk das Bild von gk unter der
Permutation ψ(gj ), und dieses geht durch ψ(gi ) in gi ∗ (gj ∗ Der Kern eines Homomorphismus
gk ) über. Also gilt, wie behauptet:
Ist ψ : G → G ein Homomorphimus, so heißt die
ψ(gi ∗ gj ) = ψ(gi ) ◦ ψ(gj ). Menge der Urbilder des neutralen Elements e von G
Kern des Homomorphismus ψ. Wir bezeichnen diese
Nach dem obigen Lemma ist die Bildmenge ψ(G) eine Un- Menge mit ker ψ.
tergruppe der Permutationsgruppe Sn . Somit gibt es einen Demnach ist ker ψ = {a ∈ G | ψ(a) = e }.
injektiven Homomorphismus von G auf diese Untergruppe,
also einen Isomorphismus.
Lemma
Übrigens kann die injektive Abbildung ψ : G → Sn bei
Der Kern des Homomorphismus ψ : G → G ist eine
n > 2 niemals surjektiv sein. Dazu brauchen wir nur die
Untergruppe von G.
Anzahlen der Elemente zu vergleichen: Die Gruppe G ent-
hält n Elemente. Die symmetrische Gruppe Sn umfasst
Beweis: Das Lemma auf Seite 72 sagt unter (i), dass
n! = n · (n − 1) . . . 2 · 1 das neutrale Element e von G im Kern vorkommt. Also ist
ker ψ = ∅.
Permutationen σ : (1, 2, . . . , n)  → (k1 , k2 , . . . , kn ), denn Aus a, b ∈ ker ψ folgt ψ(a) = ψ(b) = e und somit weiter
für k1 ∈ {1, . . . , n} gibt es n Möglichkeiten; für k2 ∈
{1, . . . , n} \ {k1 } bleiben n − 1, für k2 ∈ {1, . . . , n} \ {k1 , k2 } ψ(a ∗ b) = ψ(a) ∗ ψ(b) = e ∗ e = e ,
n − 2 Möglichkeiten und so weiter.
Wegen n! > n bei n > 2 ist somit die Bildmenge ψ(G) eine also auch (a ∗ b) ∈ ker ψ.
echte Untergruppe von Sn .  Schließlich folgt aus a ∈ ker ψ, also ψ(a) = e :

−1
ψ(a −1 ) = [ψ(a)]−1 = e
(ii)
Die Abbildung 3.1 zeigt als Beispiel zu dem Satz von Cay- = e ,
ley, dass die symmetrische Gruppe S3 mit der Gruppentafel
auf Seite 71 isomorph ist zu einer Untergruppe von S6 . Da- also a −1 ∈ ker ψ. Mithilfe des Untergruppenkriteriums ist
bei sind die zu permutierenden sechs Elemente diesmal als somit ker ψ als eine Untergruppe von G nachgewiesen. 
Ecken eines regulären Sechsecks dargestellt, und die Pfeile
zeigen, wie diese Ecken durch die Permutationen transfor- Beispiel Wir betrachten nochmals die obigen Beispiele
miert werden. von Homomorphismen und bestimmen die jeweiligen Kerne.
3.2 Homomorphismen 75

Bei dem auf der Seite 72 vorgestellten Homomorphismus Beweis: Die Aussage ψ(a) = ψ(b) ist äquivalent zu
ψ von R \ {0} auf {1, −1} enthält der Kern genau alle [ψ(a)]−1 ∗ ψ(b) = e , also nach der Homomorphieeigen-
positiven reellen Zahlen, also ker ψ = R>0 . schaft (ii) ψ a −1 ∗ b = e , und genau dann ist x = a −1 ∗ b
Bei dem injektiven Homomorphismus ψ : x  → 2x von im Kern enthalten und b = a ∗ x. Dafür schreiben wir kurz
Seite 72 ist ker ψ = {0}, denn 0 ist neutrales Element von
(Z, +). b ∈ (a ∗ ker ψ) = {a ∗ x | x ∈ ker ψ}.
Das Beispiel auf Seite 72 behandelt den Isomorphismus Auf analoge Weise lässt sich die Äquivalenz zwischen (1) und
von H auf die symmetrische Gruppe S3 . Auch hier ent- (3) begründen: Die Aussage ψ(a) = ψ(b) ist auch äquivalent
hält ker ψ nur das neutrale Element, also die identische zu ψ(b) ∗ [ψ(a)]−1 = e , und dies gilt genau dann, wenn
Abbildung aus H . b = y ∗ a mit y ∈ ker ψ, also b ∈ ker ψ ∗ a. 
In dem Beispiel auf Seite 73, der homomorphen Abbil-
dung der Permutationen σ ∈ Sn auf deren Signum, um-
fasst der Kern genau die geraden Permutationen von Sn ,
also jene mit sign (σ ) = 1. Diese bilden nach obigem Satz Jeder Homomorphismus von G nach G
eine Untergruppe von (Sn , ◦), die alternierende Gruppe bestimmt eine Zerlegung von G in Klassen
An vom Grad n. So ist z. B. die auf Seite 67 vorge-
von Elementen mit jeweils gleichem Bild
stellte Untergruppe {e, i, j } der S3 gleich der alternierende
Gruppe A3 , denn die Permutationen e, i und j sind gerade,
Die Fasern des Homomorphismus ψ haben die Form
wie die Abzählung ihrer Fehlstände zeigt. 
Bereits im Beispiel auf Seite 53 wurde darauf hingewiesen, a ∗ ker ψ = ker ψ ∗ a. (3.4)
dass jede Abbildung ϕ : M → N in der Definitionsmenge Man nennt sie Nebenklassen von ker ψ. Nach Seite 68 sind
M eine Äquivalenzrelation festlegt, wenn Elemente mit dem- sie gleichzeitig Links- und Rechtsnebenklassen des Kerns
selben Bild als zueinander äquivalent definiert werden. Die ker ψ.
zugehörigen Äquivalenzklassen sind die Fasern der Abbil-
dung ϕ. Die Gleichung a ∗ ker ψ = ker ψ ∗ a bedeutet nicht, dass
G kommutativ ist, sondern nur, dass zu jedem u ∈ ker ψ ein
x3 u ∈ ker ψ existiert mit a ∗ u = u ∗ a sowie ein u ∈ ker ψ mit
eine Faser von ϕ
u ∗ a = a ∗ u. Der Kern ist damit eine Untergruppe von G
mit der besonderen Eigenschaft, dass jede Linksnebenklasse
gleichzeitig eine Rechtsnebenklasse ist. Eine derartige Un-
tergruppe U von G heißt Normalteiler von G: In diesem Fall
R3 gilt für alle a ∈ G

x a ∗ U = U ∗ a.
ϕ
Folgerung (D)
er Kern ker ψ des Homomorphismus ψ : G → G ist
ϕ (R 3) ein Normalteiler von G.
x2
x1 ϕ (x )
Man kann übrigens beweisen, dass sich diese Folgerung auch
umkehren lässt: Zu jedem Normalteiler U von G gibt es einen
Abbildung 3.2 Die Fasern der Abbildung ϕ : R3 → R3 mit (x1 , x2 , x3 ) →
Homomorphismus ψ mit ker ψ = U .
(x1 , x2 , 0) sind Geraden parallel zur x3 -Achse.
?
Dies gilt insbesondere für Homomorphismen ψ : G → G . Wir haben festgestellt, dass zu jedem u ∈ ker ψ ein u ∈ ker ψ
Eine spezielle Faser ist dabei der Kern ker ψ als Menge existiert mit u ∗ a = a ∗ u.
der Urbilder des neutralen Elements e ∈ G . Das folgende
Lemma führt auf eine einheitliche Darstellung aller Fasern. (1) Warum ist für ein fest gewähltes a ∈ G die Abbildung

ψa : G → G, u → u = a −1 ∗ u ∗ a
Lemma
Ist ψ : G → G ein Homomorphismus, so sind die folgen- ein Isomorphismus von (G, ∗) auf sich, also nach Seite 72
den Aussagen zueinander äquivalent: ein Automorphismus? Man nennt ψa einen inneren Automor-
phismus von G.
(1) Die Elemente a, b ∈ G haben dasselbe Bild ψ(a) =
ψ(b); (2) Warum bildet ψa jeden Normalteiler U von G auf sich
(2) Es gibt ein x ∈ ker ψ mit b = a ∗x, also b ∈ (a ∗ker ψ); ab?
(3) Es gibt ein y ∈ ker ψ mit b = y ∗a, also b ∈ (ker ψ ∗a).
76 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Beispiel Wir bestimmen für zwei Homomorphismen die Als Fasern des Homomorphismus ψ sind die Nebenklassen
Nebenklassen des Kerns. von ker ψ gleichzeitig Äquivalenzklassen. Daher ermögli-
chen sie eine Partition von G. Jedes Element von G gehört
Bei dem Homomorphismus ψ von (R \ {0}, · ) auf
genau einer Nebenklasse an. Die folgende Tabelle zeigt in der
({1, −1}, · ) aus dem ersten Beispiel auf Seite 72 ist
linken Spalte die Menge der Nebenklassen, die mit G/ ker ψ
ker ψ = R>0 . Die zweite Nebenklasse, das Urbild von
bezeichnet wird, und rechts die jeweiligen Bildelemente.
−1, lautet im Sinne von (3.4):
G/ ker ψ ψ(G)
R<0 = (−1) · R>0 = R>0 · (−1).
ker ψ e
a ∗ ker ψ = ker ψ ∗ a ψ(a)
Bei der homomorphen Abbildung sgn der Permutationen b ∗ ker ψ = ker ψ ∗ b ψ(b)
auf deren Signum (Seite 73) umfasst ker sgn = An die ge- .. ..
raden Permutationen von Sn . Nachdem das Produkt einer . .
geraden und einer ungeraden Permutation ungerade ist,
kann die zweite Nebenklasse, die Menge aller ungeraden Wir können uns die Nebenklassen als „Ablagefächer“ vor-
Permutationen, mithilfe einer beliebigen ungeraden Per- stellen, in die wir alle Elemente von G je nach Bild einsortiert
mutation σ  im Sinne von (3.4) als σ  ◦ An oder auch als haben. Dann ist es weniger überraschend, wenn wir dem-
An ◦ σ  geschrieben werden.  nächst auf der Menge der Nebenklassen eine Verknüpfung
definieren. Dann rechnen wir statt mit Zahlen oder Abbil-
dungen eben mit den Fächern, indem wir je zwei Fächern ein
? „Produktfach“ zuordnen.
Warum ist die Menge der ungeraden Permutationen keine
Untergruppe von (Sn , ◦)?

Auch Nebenklassen können miteinander


Alle Nebenklassen des Kerns ker ψ sind gleich groß, ge- verknüpft werden
nauer formuliert, sie sind mit dem Kern gleichmächtig. Es
gibt nämlich die bijektive Abbildung Wir definieren auf der Menge G/ ker ψ der Nebenklassen
 von ker ψ – sie stehen in der linken Spalte der obigen Tabelle
ker ψ → a ∗ ker ψ, – eine Verknüpfung ". Dabei halten wir uns an das Produkt
f:
x  → a ∗ x. der jeweils in der rechten Spalte stehenden Elemente, wenn
wir definieren:
?
Warum ist diese Abbildung f bijektiv? (a ∗ ker ψ) " (b ∗ ker ψ) = (a ∗ b) ∗ ker ψ.

Die Produkt-Nebenklasse steht in derjenigen Zeile der Ta-


Der Kern eines Homomorphismus ψ spielt nicht nur eine belle, in welcher rechts das Produkt der Bilder steht.
Rolle bei der Beschreibung aller Fasern, sondern an ihm ist
G/ ker ψ ψ(G)
auch die Injektivität von ψ erkennbar.
··· ···
 a ∗ ker ψ ψ(a) 
Kennzeichnung eines injektiven Homomorphismus
" b ∗ ker ψ ψ(b) ∗
Der Homomorphismus ψ : G → G ist genau dann in- (a ∗ b) ∗ ker ψ ψ(a) ∗ ψ(b)
jektiv, wenn ker ψ = {e} ist mit e als neutralem Element
··· ···
von G.

Wir können die Verknüpfung " aber auch wie folgt be-
Beweis: Ist ψ injektiv, so wird nach (i) lediglich das neu- schreiben: Um das Produkt zweier Nebenklassen zu be-
trale Element e ∈ G auf das neutrale Element e von G kommen, wählen wir aus beiden Klassen ein Element aus,
abgebildet. Ist umgekehrt ker ψ = {e}, so umfassen alle Ne- also einen Repräsentanten a bzw. b. Anschließend verknüp-
benklassen jeweils nur ein Element. Dies bedeutet, zu jedem fen wir die beiden und erklären diejenige Nebenklasse zur
Bildelement in ψ(G) gibt es nur ein Urbild in G; also ist ψ Produkt-Nebenklasse, in welcher a ∗ b liegt.
injektiv. 
Ist der Homomorphismus nicht injektiv, so ist der Reprä-
sentant einer Nebenklasse nicht eindeutig. Wir müssen da-
Ein Beispiel für einen injektiven Homomorphismus ist her noch zeigen, dass " tatsächlich eine Verknüpfung auf
ψ : (Z, +) → (Q >0 , · ) mit x  → 2x von Seite 72. Wir ha- G/ ker ψ ist. Dies erfordert den Nachweis, dass die Produkt-
ben bereits festgestellt, dass hier der Kern nur ein Element Nebenklasse unabhängig ist von der Wahl der Repräsentan-
enthält, nämlich ker ψ = {0}. ten. Also ersetzen wir a durch a  ∈ (a ∗ ker ψ) und b durch
3.2 Homomorphismen 77

b ∈ (b ∗ ker ψ), d. h. a  = a ∗ u und b = b ∗ v mit


ψ(G)
u, v ∈ ker ψ, und wir prüfen nach, in welcher Klasse jetzt a
das Produkt liegt: a ∗ker ψ ψ e
b∗ker ψ ker ψ ψ(a)
e
a  ∗ b = (a ∗ u) ∗ (b ∗ v) = a ∗ (u ∗ b) ∗ v.
b

..
···

.
ψ(b)
G
Nun wissen wir wegen der Normalteiler-Eigenschaft des
Kerns, dass zu u ∈ ker ψ ein u ∈ ker ψ existiert mit ϕ
u ∗ b = b ∗ u. Daher folgt:
b∗ker ψ
a  ∗ b = a ∗ (b ∗ u) ∗ v = (a ∗ b) ∗ (u ∗ v),
. G/ ker ψ
.
.
ker ψ
a ∗ker ψ
und dieses liegt in (a ∗ b) ∗ ker ψ, denn mit u, v ∈ ker ψ
gehört wegen der Untergruppeneigenschaft auch u ∗ v dem
Abbildung 3.3 Illustration zum Homomorphiesatz: Der Homomorphismus
Kern an. ψ : G → G induziert einen Isomorphismus ϕ zwischen der Faktorgruppe
G/ ker ψ (unten) und der Bildmenge ψ(G) (rechts oben).
Diese kurze Rechnung hat bestätigt: Die Produkt-Neben-
klasse ist tatsächlich unabhängig von der Auswahl der Re-
präsentanten. Kommentar: (a) Die zwei Abbildungen im Homomor-
phiesatz sind streng auseinanderzuhalten: ψ ist die Abbil-
Die Faktorgruppe G/ ker ψ dung der Elemente von G in G , während ϕ jene der Neben-
klassen, also der Elemente von G/ ker ψ, auf die Bildmenge
Ist ψ : G → G ein Homomorphismus, so ist
ψ(G) ⊆ G ist.
(G/ ker ψ, ") eine Gruppe. Man nennt (G/ ker ψ, ")
die Faktorgruppe von G nach dem Kern von ψ. (b) Ist ψ nicht surjektiv, so ist ψ(G) eine echte Untergruppe
von G . Stattzu sagen, die Faktorgruppe (G/ ker ψ, ") ist
isomorph zu ψ(G), ∗ , hätten wir auch sagen können, die
Beweis: Das oben definierte Produkt " ist bereits als Ver- Abbildung G/ ker ψ → G mit a ∗ ker ψ → ψ(a) ist ein
knüpfung auf G/ ker ψ nachgewiesen worden. Die Assozia- injektiver Homomorphismus.
tivität ist gesichert, denn
Beweis: des Homomorphiesatzes: Die Abbildung ϕ ist
(a ∗ ker ψ " b ∗ ker ψ) " c ∗ ker ψ = (a ∗ b ∗ c) ∗ ker ψ injektiv, weil der Kern von ϕ, also die Urbildmenge von e ∈
= a ∗ ker ψ " (b ∗ ker ψ " c ∗ ker ψ). G , lediglich die Nebenklasse e ∗ ker ψ = ker ψ umfasst.
Die Verknüpfungstreue von ϕ folgt direkt aus der Definition
Die Nebenklasse ker ψ = e ∗ ker ψ ist neutrales Element für von ", denn
diese Multiplikation, denn
ϕ : (a ∗ ker ψ) " (b ∗ ker ψ) → ψ(a) ∗ ψ(b),
(e ∗ ker ψ) " (a ∗ ker ψ) = a ∗ ker ψ. wobei

Schließlich ist (a −1 ∗ ker ψ) invers zu (a ∗ ker ψ), denn ψ(a) = ϕ(a ∗ ker ψ) und ψ(b) = ϕ(b ∗ ker ψ). 

(a −1 ∗ ker ψ) " (a ∗ ker ψ) = (a −1 ∗ a) ∗ ker ψ = ker ψ.



Das Rechnen mit Restklassen erweist sich als
ein Beispiel zum Homomorphiesatz
Die obige Tabelle mit dem Verknüpfungszeichen " auf der
linken und ∗ auf der rechten Seite deutet bereits an, dass die Wir schließen ein wichtiges Beispiel an, in welchem mit
Faktorgruppe aus der linken Spalte isomorph ist zu jener der Nebenklassen gerechnet wird. Der zugrunde liegende Homo-
Bildelemente in der rechten Spalte. Dies ist die Aussage des morphismus zeigt sich hier erst nachträglich; deshalb spre-
folgenden Satzes. chen wir vorerst nur von Äquivalenzklassen.
Zwei ganze Zahlen x und y heißen kongruent modulo 5,
Homomorphiesatz wenn x − y durch 5 teilbar ist. Dies ergibt eine Äquivalenz-
Ist ψ : G → G ein Homomorphismus der Gruppe relation auf der Menge Z, denn sie ist reflexiv, symmetrisch
(G, ∗) in die Gruppe (G , ∗ ), so ist und transitiv, wie in Kapitel 2 auf Seite 56 gezeigt worden ist.
Die Äquivalenzklassen fassen alle diejenigen Zahlen zusam-
ϕ : G/ ker ψ → ψ(G), a ∗ ker ψ  → ψ(a) men, die bei der ganzzahligen Division durch 5 denselben
Rest ergeben. So ist z. B. diejenige Klasse, welcher 1 ange-
ein Isomorphismus
 der Faktorgruppe (G/ ker ψ, ") auf hört, nämlich
die Gruppe ψ(G), ∗ .
1 = {. . . , −14, −9, −4, 1, 6, 11, 16, . . . }
78 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

die Klasse derjenigen ganzen Zahlen, die den Rest 1 haben. Gruppe (Z5 , ⊕) ist genau die Faktorgruppe (Z/{0}, ⊕). Der
Wir können diese Zahlen auch als z = 1 + 5 k mit k ∈ Z im Homomorphiesatz auftretende Isomorphismus ϕ ist die
darstellen. Deshalb ist 1 = 1 + 5 · Z. identische Abbildung.
Nachdem der Rest 0, 1, 2, 3 oder 4 sein kann, gibt es insgesamt In ähnlicher Weise können wir auch eine Multiplikation "
die Klassen von Restklassen erklären: Wir ordnen zwei Restklassen die-
jenige Klasse als Produkt zu, in welcher das Produkt der
0 = 5 · Z, 1 = 1 + 5 · Z, . . . , 4 = 5 · Z + 4. Repräsentanten liegt. Wieder zeigt sich die Unabhängigkeit
von der Wahl der Repräsentanten, denn
Wir nennen sie die Restklassen modulo 5 und bezeichnen
ihre Menge mit Z5 . Also ist Z5 = {0, 1, 2, 3, 4}. (r + 5k) · (s + 5l) = r · s + 5(5kl + rl + ks).
Auf der Menge dieser Klassen erklären wir nun die Verknüp-
fung ⊕ ganz ähnlich wie vorhin die Multiplikation " von Ne- Auch hier hängt die Produkt-Restklasse nur von den Resten
benklassen in der Faktorgruppe: Wir ordnen zwei Restklassen r, s der zwei gegebenen Restklassen ab. Dies ergibt nach Aus-
diejenige Klasse als Summe zu, in welcher die Summe der schluss von 0 die folgende Produkttafel:
Repräsentanten liegt. Wieder zeigt sich die Unabhängigkeit
von der Wahl der Repräsentanten, denn " 1 2 3 4
1" 1 2 3 4
(r + 5k) + (s + 5l) = (r + s) + 5(k + l).
2" 2 4 1 3
Die Summen-Restklasse hängt also nur von den Resten r, s 3" 3 1 4 2
der zwei gegebenen Restklassen ab. Dies ergibt die folgende 4" 4 3 2 1
Verknüpfungstafel:
So ist z. B. 3 " 4 = 2, also 3 · 4 = 2 mod 5.
⊕ 0 1 2 3 4
(Z5 \ {0}, ") ist eine Gruppe, denn in jeder Zeile und jeder
0⊕ 0 1 2 3 4
Spalte der Produkt-Gruppentafel kommt das neutrale Ele-
1⊕ 1 2 3 4 0 ment 1 genau einmal vor.
2⊕ 2 3 4 0 1
3⊕ 3 4 0 1 2 Die Abbildung der ganzen Zahlen auf die jeweilige Rest-
klasse, genauer
4⊕ 4 0 1 2 3
ψ· : Z \ 0 → Z5 \ {0}, z = r + 5k → r, 1 ≤ r < 5,
So ist etwa 2 ⊕ 4 = 1, was zumeist in der Form

2 + 4 ≡ 1 (mod 5) ist ebenfalls ein surjektiver Homomorphismus

geschrieben wird mit dem gewöhnlichen Additionszeichen. ψ· : (Z \ 0, · ) → (Z5 \ {0}, "),

Diese Addition von Restklassen ist kommutativ und asso- und (Z5 \ {0}, ") ist genau die Faktorgruppe dieses Homo-
ziativ, weil dies auch auf die Addition ganzer Zahlen zutrifft. morphismus.
(Z5 , ⊕) ist eine Gruppe, denn 0 ist das neutrale Element, und
in jeder Spalte der obigen Verknüpfungstafel kommt jede der ?
5 Restklassen genau einmal vor. Also gibt es zu jedem rech- −1 −1
ten Summanden genau einen linken Summanden derart, dass Wie lauten 2 und 3 in der multiplikativen Gruppe der
deren Summe 0 ist. Restklassen modulo 5?

Wenn wir jeder ganzen Zahl z ihre Restklasse zuordnen durch


die Abbildung

ψ : Z → Z5 , z = r + 5k  → r bei 0 ≤ r < 5, 3.3 Körper


so entsteht ein surjektiver Homomorphismus
Die rationalen Zahlen bilden hinsichtlich der Addition eine
ψ+ : (Z, +) → (Z5 , ⊕). Gruppe, und sie enthalten auch eine multiplikative Gruppe.
Ebenso stehen bei den reellen und bei den komplexen Zah-
Die Restklassen sind gleichzeitig die Fasern von ψ+ , also len zwei Verknüpfungen zur Verfügung, die Addition und die
die Nebenklassen des Kerns ker ψ+ = {0}. Wir könnten da- Multiplikation, und diese führen jeweils zu Gruppen. Dies ist
her statt Z5 auch Z/ ker ψ+ = Z/{0} schreiben oder noch der Anlass, eine neue wichtige algebraische Struktur einzu-
komplizierter Z/(5 · Z). Die in der obigen Tafel dargestellte führen, die Mengen mit zwei Verknüpfungen betrifft.
3.3 Körper 79

Übersicht: Mathematische Objekte


Während Euklid (∼ 365–300 v. Chr.) noch glaubte definieren zu müssen, was in der Geometrie die Grundbegriffe „Punkt“
und „Gerade“ bedeuten, sind wir seit David Hilbert (1862–1943) bereits vertraut damit, dass Definitionen wie z. B. jene einer
Gruppe nicht sagen, um welche Objekte es sich bei den Gruppenelementen handelt, sondern nur, welche Eigenschaften diese
erfüllen müssen. Dieser Grad der Abstraktion ist zweifellos eine der Stärken der Mathematik, denn damit werden oft völlig
verschieden scheinende Dinge miteinander vergleichbar, und Eigenschaften des einen können direkt auf das andere übertragen
werden.
Die in dieser Übersicht gesammelten Beispiele sollen den Leser damit vertraut machen, dass auch Mengen, Äquivalenzklassen
oder Abbildungen mathematische Objekte sind, mit denen man so wie mit Zahlen rechnen kann. Es ist ein Ziel in der
Mathematik, hinter verschiedenen Strukturen das gemeinsame abstrakte Konzept erkennen zu können.

Gruppen Räume
Der Gruppenbegriff ist einer der weitreichendsten inner- Liegt in einer kommutativen Gruppe zusätzlich eine ska-
halb der Mathematik. Nachstehend eine kleine Auswahl lare Multiplikation vor, anschaulich die Möglichkeit,
von Beispielen mit verschiedenartigen Objekten. Elemente zu strecken oder zu stauchen, so ergibt sich
eine erheblich stärkere algebraische Struktur, der Vektor-
a) Gruppen von Zahlen: raum.
In (Z, +), (R3 , +), (Q \ {0}, · ) oder (C \ {0}, · ) sind
die Gruppenelemente Zahlen oder Zahlentripel. Die Ad- a) Der Anschauungsraum:
dition und Multiplikation modulo einer Primzahl p führt Der Anschauungsraum, die Idealisierung unseres physika-
zu Gruppen (Zp , +) und (Zp \ {0}, ·). Auch hier werden lischen Raumes, enthält Punkte als Grundobjekte. Daraus
„nur“ Zahlen miteinander verknüpft. entwickeln wir im Kapitel 7 den dreidimensionalen Vek-
torraum R3 , dessen Grundobjekte als Äquivalenzklassen
b) Mengen als Gruppenelemente: geordneter Punktepaare oder auch als Pfeile mit einem ge-
Wenn wir die Elemente 0, . . . , 4 von Z5 als Restklas- meinsamen Anfangspunkt aufzufassen sind. Der R3 wird
sen auffassen, also 0 = {. . . , −10, −5, 0, 5, 10, . . . }, im Kapitel 12 zum Begriff des K-Vektorraums verallge-
1 = {. . . , −9, −4, 1, 6, 11, . . . } usw., dann sind die meinert, und dessen Elemente heißen Vektoren.
Gruppenelemente Mengen, sogar unendliche Mengen. So-
bald aber jede einzelne Menge durch ein Symbol gekenn- b) Funktionen als Vektoren:
zeichnet ist, ist man wieder zurück beim Rechnen mit In Kapitel 19 lernen wir Banach- und Hilbert-Räume ken-
Symbolen. nen. Dabei werden Funktionen mit bestimmten Eigen-
Liegt ein Homomorphismus ψ : G → G vor, so sind der schaften wie Stetigkeit, Differenzierbarkeit oder Integrier-
Kern und dessen Nebenklassen die Elemente der Faktor- barkeit zu Vektorräumen zusammengefasst, so dass die al-
gruppe G/ ker ψ . Auch in dieser Gruppe wird mit Men- gebraische Struktur eines linearen Raums erhalten bleibt
gen „gerechnet“. Dabei sind Verknüpfungen von Mengen und Resultate aus dem Anschauungsraum ihre Entspre-
nicht ungewöhnlich, denn die Vereinigung oder der Durch- chung finden.
schnitt von Mengen führen ja wieder zu Mengen; nur ist
dabei keine Rede von Gruppeneigenschaften. c) Vektorraumhomomorphismen und Funktionale:
Wir werden erkennen, dass auch die linearen Abbildun-
c) Gruppen von Abbildungen: gen zwischen zwei K-Vektorräumen V und V  einen
In der so wichtigen Gruppe (Sn , ◦) der Permutationen der Vektorraum Hom(V , V  ) bilden. Die Vektoren sind also
n-elementigen Menge M sind die Gruppenelemente bi- in diesem Fall Vektorraumhomomorphismen. Der Dual-
jektive Selbstabbildungen von M, und die Verknüpfung raum V ∗ zu V ist der Raum Hom(V , K); dessen Vektoren
ist die Hintereinanderausführung. Bei den Symmetrieope- sind Linearformen. Die Linearformen, die mit einem
rationen eines Ornamentes handelt es sich um bijektive Abstandsbegriff im Vektorraum verträglich sind, heißen
Selbstabbildungen einer unendlichen Menge, nämlich der Funktionale bzw. allgemeiner Operatoren. Auch auf dieser
Ebene, wobei zudem Längen und Winkelmaße unverän- Abstraktionsstufe spielen die Vektorraumeigenschaften
dert bleiben. Derartige Abbildungen gehören zur Gruppe eine wesentlicher Rolle.
der ebenen Bewegungen.
80 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

In Körpern gibt es zwei Verknüpfungen und es Wir erkennen, dass (Z5 , ⊕, ") ein Körper ist, denn
gelten drei Axiome (Z5 , ⊕) ist eine Gruppe und es gelten (K2) und (K3) mit 0
als Nullelement und 1 als Einselement. (Z5 , ⊕, ") heißt
Restklassenkörper modulo 5 .
Definition eines Körpers
Wir werden demnächst erfahren, dass es nicht nur zu 5,
Eine Menge K mit den zwei Verknüpfungen,
sondern zu jeder Primzahl p einen Restklassenkörper Zp
der Addition
gibt. Hingegen liefert z. B. Z4 = {0, 1, 2, 3} keinen Kör-
−1
+ : K × K → K, (x, y)  → x + y per. In Z4 fehlt nämlich ein 2 , denn für jedes ganz-
zahlige k ist das Produkt 2 · k geradzahlig; es kann dem-
und der Multiplikation nach niemals bei ganzzahliger Division durch 4 den Rest
1 haben. 
· : K × K → K, (x, y)  → x · y,
Wir wollen uns nun schrittweise einige Aussagen über Kör-
heißt Körper (K, +, · ), wenn die folgenden Eigenschaf- per erarbeiten, die ähnlich wie bei den Gruppen zum Teil
ten erfüllt sind: bereits in die Definition übernommen hätten werden können
(K1) (K, +) ist eine Gruppe. Das neutrale Element 0 – wie etwa die anschließend bewiesene Kommutativität der
heißt Nullelement; das zu a ∈ K inverse Element Addition (iii). Aber wir bleiben dabei, in die Definitionen nur
wird mit −a bezeichnet. das unbedingt Notwendige aufzunehmen.
(K2) Die Teilmenge K = K \ {0} ist bezüglich der Ein-
(i) Wegen 1 ∈ K = K \ {0} gilt 1 = 0.
schränkung · von · auf K × K eine kommutative
Gruppe mit dem Einselement 1 als neutralem Ele- Ein Körper K enthält also mindestens zwei Elemente. Wir
ment. werden tatsächlich einen Körper mit nur zwei Elementen
(K3) Es gilt das Distributivgesetz: kennenlernen.

a · (b + c) = (a · b) + (a · c). In Körpern gilt ferner:


(K3) (3.2)
Wird statt (K2) gefordert, dass (K , · ) eine nicht kommu- a · 0 = a · (0 + 0) = a · 0 + a · 0 $⇒ 0 = a · 0
tative Gruppe ist, und zudem (K3) noch durch das zweite Auf dieselbe Weise folgt mithilfe der Kürzungsregel (3.2)
Distributivgesetz auch 0 · a = 0, also insgesamt:
(a + b) · c = (a · c) + (b · c) (ii) Für alle a ∈ K ist a · 0 = 0 · a = 0.
ergänzt, so heißt K Schiefkörper. Für das Rechnen mit 0 gelten also in beliebigen Körpern K
dieselben Regeln wie in Q oder R.
Die Regel „Punktrechnung geht vor Strichrechnung“ macht
die Klammern auf der rechten Seite des Distributivgesetzes Obwohl in (K2) das Assoziativgesetz für die Multiplikation
entbehrlich. Häufig wird in Körpern der Punkt als Multipli- nur in K \ {0} gefordert ist, gilt es auch unter Einschluss des
kationszeichen überhaupt weggelassen. Nullelements, denn es ist z. B. (a · b) · 0 = a · (b · 0) = 0.

Beispiel ?
1. Offensichtlich sind (Q, +, · ) und (R, +, · ) Körper. Da- Warum muss das Nullelement bei der multiplikativen Gruppe
gegen ist (Z, +, · ) kein Körper, denn in Z gibt es z. B. von K ausgeschlossen werden?
kein Element 2−1 mit 2 · 2−1 = 1.
2. In Abschnitt 3.2 haben wir uns bereits mit den Restklassen
modulo 5 befasst, also mit Aus (ii) kann man folgern, dass die von Q und R her ver-
trauten Vorzeichenregeln in allen Körpern K gelten. So ist
Z5 = {0, 1, 2, 3, 4}, wobei z. B.

0 := {. . . , −10, −5, 0, 5, 10, . . . } = 5 · Z, 0 = 0 · b = (a + (−a)) · b = a · b + (−a) · b


1 := {. . . , −9, −4, 1, 6, 11, . . . } = 5 · Z + 1, ⇒ −(a · b) = (−a) · b.
2 := {. . . , −8, −3, 2, 7, 12, . . . } = 5 · Z + 2 usw.
Dabei ist −(a · b) bezüglich der Addition invers zu (a · b).
Auch haben wir bereits eine Addition ⊕ und eine Mul- Analog gilt −(a · b) = a · (−b) sowie (−a) · (−b) = a · b.
tiplikation " von Restklassen eingeführt mit der Eigen- Statt a + (−b) schreiben wir ab jetzt kürzer a − b.
schaft, dass die Abbildung
Nun berechnen wir (1 + 1) · (a + b) auf zwei Arten:
z = r + 5k  → r bei 0 ≤ r < 5
(1 + 1) · (a + b) = 
zu Homomorphismen bezüglich der Addition und der 1 · (a + b) + 1 · (a + b) = a + b + a + b
Multiplikation führt. (1 + 1) · a + (1 + 1) · b = a + a + b + b
3.3 Körper 81

Mithilfe der Kürzungsregel (3.2) bezüglich der Addition er- bei 1 < r, s < p nicht unbedingt in einer der Restklassen
gibt sich daraus die folgende Aussage. 1, . . . , p − 1 vorkommen muss. Sobald nämlich p = rs ist
mit r, s > 1, liegt das Produkt in 0; r und s wären Nullteiler
(iii) Für alle a, b ∈ K gilt b + a = a + b, d. h. die Addition
dieser Multiplikation.
in Körpern ist stets kommutativ.
Angenommen, es gelten gleichzeitig a · b = 0 und a  = 0. Ist hingegen p eine Primzahl, besitzt p also nur 1 und p als
Dann existiert a −1 , und es ist Teiler, so kann rs kein ganzzahliges Vielfaches von p sein,
weil r und s kleiner als p und daher nicht durch p teilbar sind.
b = (a −1 · a) · b = a −1 · (a · b) = a −1 · 0 = 0. Also ist " eine Verknüpfung auf Zp \ {0}. Sie ist assoziativ
und kommutativ; es gibt das neutrale Element 1.
Das bedeutet:
Wir zeigen, dass zur Restklasse r bei 1 < r < p ein x mit
(iv) In einem Körper folgt aus a · b = 0 stets a = 0 oder 1 < x < p existieren muss mit r " x = 1. Dabei verwenden
b = 0. wir die Abbildung
Man kann auch sagen: In Körpern gibt es keine Nullteiler, 
also keine Elemente x, y ∈ K \ {0} mit x · y = 0. Dies folgt Zp \ {0} → Zp \ {0},
λr :
schon deshalb, weil „·“ eine Verknüpfung in K = K \ {0} x → r " x,
ist, also wegen der Abgeschlossenheit bei x, y ∈ K auch
x · y ∈ K sein muss. bei welcher jede Klasse links mit r multipliziert wird. Diese
Abbildung ist injektiv, denn bei r " a = r " b unterscheiden
Wir fassen die eben hergeleiteten Aussagen noch einmal zu- sich ra und rb durch ein Vielfaches von p, d. h., p teilt r(a −
sammen: b). Wegen 1 < r < p muss p ein Teiler von a − b sein und
daher a = b.
Körpereigenschaften
Ein Körper enthält mindestens die zwei verschiedenen Also durchlaufen die p−1 Produkte r"1, r"2, . . . , r"p − 1
Elemente 0 und 1. In einem Körper ist die Addition stets alle p − 1 Restklassen aus Zp \ {0}. Darunter muss unbedingt
kommutativ. Ein Körper ist frei von Nullteilern. auch 1 vorkommen.
Die notwendige Bedingung, dass p eine Primzahl ist, erweist
Man könnte meinen, dass ebenso wie die Kommutativität der sich somit als hinreichend. Sie garantiert, dass (Zp \ {0}, ")
Addition auch jene der Multiplikation bereits aus den übri- eine Gruppe ist. Nachdem auch die distributiven Gesetze gel-
gen Körpereigenschaften hergeleitet werden kann. Dass dies ten, weil sie ja in Z erfüllt sind und durch den Homomorphis-
nicht möglich ist, beweist das auf Seite 83 gezeigte Beispiel mus (r + kp) → r nicht zerstört werden, ist die folgende
eines Schiefkörpers. Aussage bewiesen:
Vorerst folgen aber noch zwei weitere Beispiele von Körpern.
Satz vom Restklassenkörper
Ist p eine Primzahl, so ist
Zu jeder Primzahl p > 1 gibt es einen
 
Restklassenkörper Zp = {0, 1, . . . , p − 1}, ⊕, "

Oben haben wir den Restklassenkörper modulo 5 betrachtet. ein Körper, der Restklassenkörper modulo p.
Wie sieht es aus, wenn wir 5 durch eine andere natürliche
Zahl p > 1 ersetzen, also die Menge der Restklassen
Der kleinste Körper ist Z2 = {0, 1}. In ihm ist 0 + 1 = 1 und
Zp = {0, 1, . . . , p − 1} 1 + 1 = 0. Das „kleine Einmaleins“ besteht überhaupt nur
aus der trivialen Regel 1 · 1 = 1.
betrachten? Führen die Addition und Multiplikation von
Restklassen aus Zp ebenfalls zu Gruppen? In Zukunft werden wir auch in Restklassenkörpern die Ad-
dition und Multiplikation wie gewohnt mit + und · be-
Die Summe
zeichnen statt mit ⊕ und ", und auch die Querstriche zur
(r + kp) + (s + lp) = (r + s) + (k + l)p, 0 ≤ r, s < p, Kennzeichnung der Restklassen lassen wir meist weg. Statt
(a ⊕ b) " c = d schreiben wir einfach (a + b)c = d.
liegt bei r + s < p in der Restklasse r + s, andernfalls in
r + s − p. Das Ergebnis hängt also nur von den Klassen r
und s ab. Somit ist ⊕ eine Verknüpfung auf Zp , und wie bei ?
Z5 lässt sich begründen, dass (Zp , ⊕) eine Gruppe ist. Berechnen Sie im Restklassenkörper modulo 7 den Wert
4−6
Bei der Multiplikation ist zu beachten, dass x = (4 − 6) · (1 − 6)−1 , den man auch als Bruch
1−6
schreiben könnte.
(r + kp) · (s + lp) = rs + (klp + ks + rl)p
82 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Die Restklassenkörper sind an sich interessant, weil sie end- Folgerung (D)
liche Körper sind. Darüber hinaus spielen sie in der Zahlen- ie Menge
theorie, in der Kryptographie und in der Codierungstheorie
eine wichtige Rolle. Letztlich gäbe es ohne den kleinsten C = {z = a + i b | (a, b) ∈ R2 }
Körper Z2 keine Digitalisierung und keine Computer.
bildet einen Körper (C, +, · ) mit 0 = 0 + i 0 als Nullelement
und 1 = 1+i 0 als Einselement, den Körper der komplexen
Der Körper der komplexen Zahlen ist Zahlen.
eine echte Erweiterung des Körpers
der reellen Zahlen Wir widmen uns den algebraischen Eigenschaften von C.
Auf Seite 64 wurde die elementeweise Addition von reellen
Zahlentripeln eingeführt und im Anschluss daran gezeigt, Die Konjugation ist ein Automorphismus
dass (R3 , +) eine Gruppe ist. Dasselbe ist natürlich auch Die Abbildung
mit Zahlenpaaren (a, b) ∈ R2 möglich. Man kann aber auch 
eine Multiplikation von Zahlenpaaren erklären, sodass nach C → C,
:
Ausschluss von (0, 0) eine Gruppe entsteht. z = a + i b → z = a − i b
Das ist zunächst überraschend, wird aber nach den folgen- ist bijektiv und heißt Konjugation. Sie ist additiv und
den Betrachtungen gleich klar: Wir notieren das Zahlenpaar multiplikativ, d. h., es gilt:
(a, b) in der Form
z = a +ib z1 + z2 = z1 + z2 und z1 · z2 = z1 · z2 .
und nennen jedes solche z eine komplexe Zahl (in Kapitel 4
werden die komplexen Zahlen ausführlich behandelt). Dabei
ist i die imaginäre Einheit, welche der Regel i2 = −1 ge- Beweis: Es seien z1 = a1 + i b1 und z2 = a2 + i b2
nügt. Die reelle Zahl a heißt Realteil Re z und die reelle Zahl komplexe Zahlen mit a1 , a2 , b1 , b2 ∈ R. Dann gilt:
b Imaginärteil Im z. Statt z = a + i b schreiben wir auch
z1 + z2 = (a1 + a2 ) + i(b1 + b2 ) = (a1 + a2 )−i(b1 + b2 )
z = a + b i. Wir nennen die komplexen Zahlen mit Im z = 0
reell, jene mit Re z = 0 rein imaginär. = z1 + z2 .

Wie bereits betont, wird die Summe der beiden komplexen und
Zahlen z1 = a1 + i b1 und z2 = a2 + i b2 elementeweise
gebildet, z1 · z2 = (a1 a2 − b1 b2 ) + i (b1 a2 + b2 a1 )
z1 + z2 = (a1 + a2 ) + i(b1 + b2 ). = (a1 a2 − b1 b2 ) − i (b1 a2 + b2 a1 )

Es werden also die Realteile addiert und ebenso die Imagi- = (a1 − i b1 ) (a2 − i b2 ) = z1 · z2 . 

närteile. Beim Produkt gehen wir „distributiv“ vor, nutzen


die Gleichung i = −1 und setzen wie bei der Multiplikation Man nennt eine Abbildung ψ von einem Körper K in sich
reeller Zahlen mit i die Assoziativität und die Kommutativität mit der Eigenschaft
voraus:
ψ(a + b) = ψ(a) + ψ(b) und ψ(a b) = ψ(a) ψ(b)
z1 · z2 = (a1 + i b1 )(a2 + i b2 )
= a1 a2 + i a1 b2 + i b1 a2 + i2 b1 b2 für alle a, b ∈ K einen Körperautomorphismus. Offenbar
= (a1 a2 − b1 b2 ) + i (a1 b2 + a2 b1 ) ist ein Körperautomorphismus ein Automorphismus von K
bezüglich der Addition und ebenso ein Automorphismus von
Damit ist die Multiplikation komplexer Zahlen kommutativ, K \ {0} bezüglich der Multiplikation.
d. h., z1 z2 = z2 z1 . Zudem ist die Multiplikation assoziativ,
d. h., (z1 z2 )z3 = z1 (z2 z3 ), wie man durch Nachrechnen Nach obigem Satz ist die Konjugation ein Körperautomor-
bestätigen kann. Gibt es auch ein z−1 ? phismus von C. Mehr über die komplexen Zahlen erfahren
Sie im Kapitel 4.
Die zu z = a + i b konjugiert komplexe Zahl ist z = a − i b,
und es gilt:
z · z = (a + i b) · (a − i b) = a 2 + b2 ∈ R. So wie Untergruppen gibt es auch
Unterkörper
Hieraus erhalten wir für das Inverse von z = a + i b bei
(a, b) = (0, 0)
Der Körper C ist eine Erweiterung des Körpers R. Man kann
−1 −1 a −ib 1 umgekehrt auch sagen, dass R ein Unterkörper von C ist.
z = (a + i b) = 2 = z.
a +b 2 z·z Allgemeiner definiert man:
3.3 Körper 83

Ist (K, +, · ) ein Körper und L eine Teilmenge von K, wobei ist definiert als
(L, +, · ) hinsichtlich der von K stammenden Verknüpfun-
gen ebenfalls ein Körper ist, so heißt L Unterkörper oder q1 + q2 = (a1 + a2 ) + i(b1 + b2 ) + j(c1 + c2 ) + k(d1 + d2 ).
Teilkörper von K.
Damit ist (H, +) eine kommutative Gruppe mit dem Nullele-
Offensichtlich ist (Q, +, · ) ein Unterkörper von (R, +, · ) ment 0 = 0 + i 0 + j 0 + k 0. Offensichtlich ist die additive
und dieser Unterkörper von (C, +, · ) und weiter vom Schief- Gruppe (H, +) isomorph zu (R4 , +) (vergleiche das Beispiel
körper (H, +, · ), der gleich genauer vorgestellt wird. auf Seite 64).
Bei den bisherigen Beispielen war die Multiplikation stets Bei dem Produkt der beiden Quaternionen q1 , q2 gehen wir
kommutativ, d. h., es galt: analog zu C vor: Jeder Summand von q1 wird mit jedem
Summanden von q2 multipliziert, wobei für die Produkte der
a b = b a für alle a, b ∈ K .
Quaternioneneinheiten die folgenden Regeln gelten:
Das folgende Beispiel beweist, dass es auch Schiefkörper
i · i = j · j = k · k = −1
gibt. Der folgende Körper spielt auch in der analytischen
Geometrie eine Rolle, wie das Kapitel 7 zeigen wird.
und
i · j = k , j · k = i , k · i = j,
j · i = −k , k · j = −i , i · k = −j .
Die Quaternionen bilden einen Schiefkörper
Die erste Zeile zeigt, dass die Quadrate der Quaternionen-
Jede komplexe Zahl ist eine Zusammenfassung zweier reeller einheiten übereinstimmen mit dem Quadrat der imaginären
Zahlen mithilfe der imaginären Einheit i. Bei den Quater- Einheit. Die Formeln für die gemischten Produkte von i, j
nionen sind es vier reelle Zahlen, und es gibt drei Quater- oder k lassen sich wie folgt zusammenfassen:
nioneneinheiten i, j, k. Die Quaternionen wurden 1843 von
Hamilton entdeckt (siehe Abbildung 3.4). Die Menge der j
Hamilton’schen Quaternionen lautet:
k
H = { q = a + i b + j c + k d | (a, b, c, d) ∈ R4 }.

Eine Quaternion q mit c = d = 0 sieht wie eine komplexe i


Zahl aus, jene mit b = c = d = 0 wie eine reelle Zahl. Somit Abbildung 3.5 Regel für die gemischten Produkte der Quaternioneneinheiten
gilt H ⊇ C ⊇ R, und die nachstehend definierten Verknüp- i, j und k.
fungen in H enthalten die Addition und die Multiplikation
der reellen sowie der komplexen Zahlen als Sonderfälle. Folgen die zwei Faktoren in zyklischer Reihe aufeinander
(siehe Pfeilrichtung in Abbildung 3.5), so ist das Produkt
gleich der dritten Einheit. Andernfalls ist das Produkt gleich
dem Negativen der dritten Einheit.
Das Produkt zweier Quaternionen lautet somit:

(a1 + i b1 + j c1 + k d1 ) · (a2 + i b2 + j c2 + k d2 )
= (a1 a2 − b1 b2 − c1 c2 − d1 d2 )
+ i (a1 b2 + b1 a2 + c1 d2 − d1 c2 )
+ j (a1 c2 − b1 d2 + c1 a2 + d1 b2 )
+ k (a1 d2 + b1 c2 − c1 b2 + d1 a2 ).

1 = 1 + i 0 + j 0 + k 0 ist ein Einselement. Analog zu C heißt


die Quaternion q := a − i b − j c − k d konjugiert zu q.
Das Produkt q1 · q2 bei a2 = a1 , b2 = −b1 , c2 = −c1 und
d2 = −d1 ergibt:
Abbildung 3.4 Gedenktafel für Sir Hamilton, den Entdecker der Quaternionen, q · q = a 2 + b 2 + c 2 + d 2 ∈ R.
an der Brougham-Bridge in Dublin: „Here as he walked by on the 16th of October
1843 Sir William Rowan Hamilton in a flash of genius discovered the fundamental
formula for quaternion multiplication i2 = j2 = k 2 = ijk = −1 & cut it on a Somit existiert bei q = 0 die inverse Quaternion
stone of this bridge“.
1 1
q −1 = q= q
Die Summe der beiden Quaternionen a 2 + b2 + c2 + d 2 q ·q

q1 = a1 + i b1 + j c1 + k d1 , q2 = a2 + i b2 + j c2 + k d2 mit q · q −1 = (q · q)/(q · q) = 1.
84 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Alle Produkte von je drei Quaternioneneinheiten sind as- Ein wichtiges Beispiel ist dazu R; wir können ja die Grö-
soziativ, wie man durch einzelnes Nachrechnen bestätigen ßen von je zwei reelle Zahlen vergleichen. In der folgenden
kann, z. B. Definition werden gewisse Anordnungseigenschaften von R
als Axiome verwendet. Die Eigenschaften dieser Anordnung
(i · j) · k = k · k = −1 = i · (j · k). von R werden in Kapitel 4 ausführlich behandelt.
Damit ist aber auch die Multiplikation von Quaternionen as-
Ein Körper K heißt angeordnet, wenn er einen Positivitäts-
soziativ.
bereich enthält, das ist eine Teilmenge P von K mit folgen-
Die Multiplikation ist allerdings nicht kommutativ, denn z. B. den Eigenschaften:
i · j = −j · i. Aber es gelten die beiden Distributivgesetze,
woraus folgt: 1. P ∪ (−P ) = K,
2. P ∩ (−P ) = {0},
3. P + P ⊆ P,
Quaternionenschiefkörper 4. P · P ⊆ P.
(H, +, · ) ist ein Schiefkörper.
Dabei bedeuten −P = {−x ∈ K | x ∈ P } und P + P ⊆ P
bzw. P · P ⊆ P , dass mit x, y ∈ P stets auch die Summe
Nun folgen noch einige Begriffe, die beim Umgang mit Kör-
x + y bzw. das Produkt x · y in P liegen.
pern eine Rolle spielen.
Man nennt die Elemente aus P \{0} positiv und jene aus
−P \{0} negativ.
Die Charakteristik eines Körpers ist null oder
eine Primzahl Ist K ein angeordneter Körper mit dem Positivitätsbereich
P \{0}, so wird durch die Definition
Werden in einem Körper K der Reihe nach die Summen 1,
1 + 1, 1 + 1 + 1, 1 + 1 + 1 + 1, . . . gebildet, so sind we- x ≤ y ⇐⇒ y − x ∈ P
gen x + 1 = x (Kürzungsregel) aufeinanderfolgende Werte
stets verschieden. Es ist aber möglich, dass in der Folge der eine lineare Ordnungsrelation auf der Menge K erklärt.
Summen Wiederholungen auftreten, dass also etwa
?
y + (1 + 1 + · · · + 1) = y Begründen Sie das.
ist, woraus (1 + 1 + · · · + 1) = 0 folgt. In einem endlichen
Körper muss das so sein, denn es stehen ja nur endlich viele
Ist x ∈ K positiv, d. h. x ∈ P \{0}, so ist wegen x 2 = x·x ∈ P
Werte als Summen zur Verfügung. Die kleinste Anzahl n > 0
auch x 2 positiv. Und ist x negativ, d. h. x ∈ −P \{0}, so ist
mit der Eigenschaft, dass die Summe von n Einsen null ergibt,
wegen −x ∈ P das Element −x positiv und damit wegen
heißt Charakteristik char K des Körpers K. Gibt es hingegen
x 2 = (−x) · (−x) ∈ P auch x 2 positiv. Da K = P ∪ (−P )
kein derartiges n, so wird char K = 0 definiert.
gilt, haben wir damit gezeigt, dass jedes von O 2 verschiedene
So ist z. B. die Charakteristik von Z2 = {0, 1} gleich 2, denn Quadrat in einem angeordneten Körper positiv ist. Insbeson-
1 + 1 = 2 ∈ 0. Analog ist char Zp = p. Aber Zp ist nicht dere ist 1 = 1 · 1 positiv, 1 ∈ P , und damit ist −1 ∈ −P
der einzige Körper mit dieser Charakteristik. Andererseits ist negativ.
char Q = char R = char C = 0.
Der Körper R hat den Positivitätsbereich
Wir werden der Körpercharakteristik später vor allem dann
begegnen, wenn bei Aussagen gewisse Werte der Charakte- P = R≥0 = {x ∈ R | x ≥ 0}
ristik ausgeschlossen werden müssen. So muss z. B. immer
dann, wenn in einem Körper durch 2 dividiert wird, der Fall und ist damit ein angeordneter Körper. Der Körper C hinge-
char K = 2 ausgeschlossen werden, weil dort 2 = 0, d. h. gen nicht, denn dann wäre das Quadrat −1 = i · i positiv,
−1 = 1 ist und eine Division durch 0 wegen des Fehlens von daher 1 = −(−1) negativ – im Widerspruch zur vorhin be-
0−1 nicht möglich ist. wiesenen Aussage.

?
In manchen Körper kann man die Elemente in Begründen Sie, dass ein angeordneter Körper die Charakte-
ihrer Größe unterscheiden ristik null hat.

Unter den verschiedenen Relationen wurden in Kapitel 2


auch Ordnungsrelationen behandelt. Es gibt auch Körper, Neben den Gruppen und Körpern, die wir ausführlich behan-
auf welchen eine Ordnungsrelation definiert ist, die in ge- delt haben, spielen in der Algebra die im folgenden Abschnitt
wisser Weise mit den Körperverknüpfungen verträglich ist. behandelten Ringe eine wesentliche Rolle.
3.4 Ringe 85

3.4 Ringe erfüllen. So gewinnt man die reellen Nullstellen der Funk-
tion f . Betrachten wir konkret das Polynom
Die von Körpern geforderten Bedingungen lassen sich auf f (x) = x 2 + 1 .
verschiedene Weise abschwächen. So kann man ja auch
ganze Zahlen addieren und multiplizieren; (Z, +) ist eine Das Polynom hat in R keine Nullstellen, da die Gleichung
kommutative Gruppe und es gibt 0 und 1. Aber es fehlen x 2 + 1 = 0 in R nicht lösbar ist, in R sind Quadrate stets po-
inverse Elemente. sitiv. Analytisch ist man fertig, die Funktion f hat in ihrem
Definitionsbereich keine Nullstelle. Aber algebraisch ist die
Definition eines Ringes Auflösung der Gleichung noch längst nicht erledigt: Es trifft
Eine Menge R mit zwei Verknüpfungen + und · heißt zwar zu, dass es keine reellen Nullstellen gibt, aber kann es
Ring, wenn gilt: nicht sein, dass es einen R umfassenden Körper gibt, in dem
1. (R, +) ist eine kommutative Gruppe. eine Nullstelle von f liegt? Und tatsächlich liegt in C  R
2. Die Multiplikation · ist assoziativ. die komplexe Zahl i mit i2 = −1; damit sind i und −i zwei
3. Es gelten die Distributivgesetze (a + b) · c = (a · c) verschiedene Nullstellen von f , die für die analytische Dis-
+ (b · c) und a · (b + c) = (a · b) + (a · c). kussion der Funktion f : R → R ohne Belange sind, für
algebraische Zwecke aber zur Auflösung der Gleichung füh-
Hat ein Ring (R, +, ·) die zusätzlichen Eigenschaften: ren.

die Multiplikation ist kommutativ, Es hat sich für die Algebra als sehr zweckmäßig erwiesen,
es existiert ein neutrales Element 1  = 0 bezüglich der Polynome in einem anderen Licht darzustellen, als dies in
Multiplikation, der Analysis üblich ist. Wir betrachten in der Algebra das x
in R gibt es keine Nullteiler nicht als eine reelle Zahl, wir fassen es als eine Unbestimmte
auf, in die wir z. B. Zahlen einsetzen können. Man verwen-
so nennt man den Ring R einen Integritätsbereich. det in der Algebra sogar gerne ein anderes Symbol für die
Unbestimmte als in der Analysis – wir werden X schreiben
Beispiel – und verwenden eigentlich genauer die Bezeichnungen
Jeder kommutative Körper ist ein Integritätsbereich.
(Z, +, ·) ist ein Integritätsbereich. Es gibt nämlich keine Polynom in der Algebra und
Nullteiler. Polynomfunktion in der Analysis.
Die Menge der Restklassen modulo 12 Diese Bezeichnungen werden aber keineswegs konsequent
Z12 = {0, 1, . . . , 11} benutzt. Auch wir werden in der Analysis oftmals wieder
von Polynomen sprechen, obwohl wir Polynomfunktionen
ergibt einen Ring (Z12 , ⊕, "). Dieser ist nicht nullteiler- meinen.
frei, denn wegen 3 · 4 = 12 ist 3 " 4 = 0, obwohl 3, 4  = 0
Wir beginnen nun bei „Adam und Eva“ und erklären, was ein
gilt. 
Polynom ist. Man tut gut daran, vorläufig zu vergessen, was
es mit den oben erwähnten Polynomfunktionen auf sich hat.
Wir vertiefen die Ringtheorie nicht weiter und behandeln
Wir kommen auf diese nach der Einführung der Polynome
nur ausführlich ein für uns wichtiges Beispiel eines Rings,
wieder zurück.
nämlich den Polynomring.
Weil wir in der Mathematik darauf achten, dass Definitionen
Die klassische Algebra ist die Lehre von der Auflösung von
sinnvoll sind, müssen wir erklären, was eine Unbestimmte
Gleichungen der Form
ist. Das ist gar nicht so einfach, es sind dazu einige Vorbe-
a n x n + · · · + a1 x + a 0 = 0 trachtungen nötig.

mit Koeffizienten an , . . . , a0 aus einem Körper. Die linke


Seite dieser Gleichung assoziiert man als Student des ersten Folgen, die nur endlich viele Folgenglieder
Semesters im Allgemeinen mit einem Polynom, also mit einer ungleich 0 haben, sind fast überall 0
reellen Funktion der Form
Der Ausdruck a0 + a1 X + · · · + an X n ist durch seine Koef-
f : R → R , f (x) = an x n + · · · + a1 x + a0 ,
fizienten a0 , . . . , an und 0 = an+1 = an+2 = · · · eindeutig
wobei die Koeffizienten a0 , . . . , an reelle Zahlen sind. Und gegeben:
beim Element x hat man in etwa im Hinterkopf, dass x die Für jedes i ∈ N0 gilt: Vor Xi steht ai .
reellen Zahlen durchläuft. Will man die Nullstellen des Poly-
noms f bestimmen, so steht man vor der Aufgabe, die Zahlen Aber das ist nichts anderes als die folgende Abbildung
x ∈ R zu bestimmen, die die Gleichung 
N0 → R ,
a: mit ai = 0 für alle i > n .
f (x) = an x n + · · · a1 x + a0 = 0 i  → ai
86 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Übersicht: Gruppen, Ringe und Körper


Wir stellen die Axiome für Gruppen, Ringe und Körper zusammen. Dabei ersetzen wir bei den Gruppen bewusst die ursprünglich
etwas schwächeren Forderungen nach einem linksneutralen und linksinversen Element durch äquivalente, aber übersichtlichere
Bedingungen. Auch bei den Körpern gibt es geringfügige Abweichungen gegenüber früher: Wir schreiben alle Bedingungen
aus, um sie leichter mit jenen bei Ringen vergleichen zu können.

Gruppe: (6) a (b + c) = a b + a c und (a + b) c = a c + b c.


Es sei G eine nichtleere Menge mit einer Verknüpfung
∗ : (G × G) → G. Es heißt (G, ∗) eine Gruppe, wenn
Körper:
für alle a, b, c ∈ G gilt:
Es sei K eine Menge mit den beiden Verknüpfungen
(1) (a ∗ b) ∗ c = a ∗ (b ∗ c).
+ : (K × K) → K und · : (K × K) → K. Es heißt (K, +, ·)
(2) Es existiert ein Element e ∈ G mit e ∗ a = a = a ∗ e.
ein Körper, wenn für alle a, b, c ∈ K gilt:
(3) Zu jedem a ∈ G existiert ein a −1 ∈ G mit a −1 ∗ a =
(1) a + b = b + a.
e = a ∗ a −1 .
(2) a + (b + c) = (a + b) + c.
Ring: (3) Es gibt ein Element 0 (Nullelement) in K mit
Es sei R eine Menge mit den beiden Verknüpfungen 0 + a = a.
+ : (R×R) → R und · : (R×R) → R. Es heißt (R, +, ·) (4) Zu jedem a ∈ K gibt es −a ∈ K (inverses Element)
ein Ring, wenn für alle a, b, c ∈ R gilt: mit a + (−a) = 0.
(1) a + b = b + a. (5) a (b c) = (a b) c.
(2) a + (b + c) = (a + b) + c. (6) Es gibt ein Element 1 = 0 (Einselement) in K mit
(3) Es gibt ein Element 0 (Nullelement) in R mit 0 + a = 1 · a = a = a · 1.
a. (7) Zu jedem a ∈ K \ {0} gibt es a −1 ∈ K (inverses
(4) Zu jedem a ∈ R gibt es −a ∈ R (inverses Element) Element) mit a a −1 = 1 = a −1 a.
mit a + (−a) = 0. (8) a b = b a.
(5) a (b c) = (a b) c. (9) a (b + c) = a b + a c.

Wir haben hierbei ai anstelle von a(i) geschrieben. Die Ab- wählen wir ab jetzt einen beliebigen kommutativen Ring R
bildung a wiederum können wir durch die endlichen vie- mit 1. Man gewinnt dadurch viel; und man kann sich für R
len von null verschiedenen Bilder eindeutig festlegen, man stets einen der vertrauten Ringe Z oder R denken.
schreibt
Vielleicht ist es auch sinnvoll, an dieser Stelle darauf hin-
a = (a0 , a1 , . . . , an , 0, . . .)
zuweisen, dass, egal wie abstrakt das Folgende erschei-
und nennt die Abbildung a auch eine Folge mit den Folgen- nen mag, wir doch wieder bei der vertrauten Darstellung
gliedern ai (in Kapitel 8 werden wir Folgen ausführlich dis- a0 + a1 X + · · · an X n für Polynome landen werden. Dann
kutieren). Von den endlichen vielen möglichen Ausnahmen wird aber X ein wohldefiniertes Objekt sein, an dem nichts
a0 , . . . , an abgesehen sind alle Folgenglieder null. Man be- „Unbestimmtes“ haften wird.
achte, dass es auch zugelassen ist, dass manche oder alle der
endlichen vielen Zahlen a0 , . . . , an ebenfalls null sind. Weil
die Anzahl der endlich vielen Elemente a0 , . . . , an mehr
Der Polynomring R[X] besteht aus allen
oder weniger nichts ist im Vergleich zu der Anzahl der Ele-
mente von N, hat sich die folgende Sprechweise eingebürgert: Folgen mit der Eigenschaft, dass fast alle
Man sagt Folgenglieder null sind
ai = 0 für fast alle i ∈ N0 Wir betrachten nun die Gesamtheit aller Abbildungen von N0
und meint damit, dass ai  = 0 für nur endlich viele i ∈ N0 . nach R, die die Eigenschaft haben, dass fast alle Bilder den
Wert null haben. Wir bezeichnen diese Gesamtheit mit dem
? Symbol R[X]:
Können Sie eine Abbildung g : N0 → R angeben, die nicht
für fast alle i ∈ N0 und dennoch unendlich oft den Wert 0
Die Polynome über R
hat?
Wir nennen jede Abbildung a : N0 → R mit a(i) = 0
für fast alle i ∈ N0 ein Polynom. Die Menge
Wir erklären nun Polynome als Folgen, die fast überall den
Wert 0 haben. Dabei wollen und müssen wir uns keineswegs R[X] = {a : N0 → R | a(i) = 0 für fast alle i ∈ N0 }
auf reelle Folgen festlegen. Wir lassen als Wertemenge sol- ist die Menge aller Polynome über R.
cher Abbildungen einen Ring zu. Anstelle des Körpers R
3.4 Ringe 87

Ein Polynom ist eine Folge in R, die nur an endlichen vielen cr = 0 für alle r > max{m, n},
Stellen aus N0 einen von null verschiedenen Wert annimmt. ds = 0 für alle s > m + n.

Beispiel Es sind Beispiel Gegeben seien die reellen Polynome a = (1, 2,


0, 3, 0, . . .) und b = (0, 1, 1, 0, . . .). Dann gilt:
(1, 1, 1, 1, . . . , 1, 0, 0, . . .) und (0, . . . , 0, 1, 0, 0, . . .)
a + b = (1, 3, 1, 3, 0, . . .),
Polynome über jedem kommutativen Ring R mit 1 – dabei
a · b = (0, 1, 3, 2, 3, 3, 0, . . .) . 
stehen jeweils die ersten Auslassungspunkte . . . für endlich
viele ausgelassene Werte. 

Die Menge der Polynome bildet mit der


Polynome werden komponentenweise Addition + und der Multiplikation · einen
addiert, die Multiplikation erfolgt durch kommutativen Ring (R[X], +, ·)
Summation über die Produkte mit gleicher
Indexsumme Für die Menge R[X] der Polynome über R gilt mit den eben
definierten Verknüpfungen + und ·:
Wir erklären auf der Menge R[X] aller Polynome eine Ad-
dition und eine Multiplikation. Es seien Satz vom Polynomring
Für jeden kommutativen Ring R mit 1 ist (R[X], +, ·)
a = (a0 , . . . , an , 0, . . .) , b = (b0 , . . . , bm , 0, . . .)
ein kommutativer Ring mit 1.
zwei Polynome aus R[X]. Wir definieren nun die Addition
und Multiplikation durch:
 Beweis: Es sind im Einzelnen nachzuweisen: (i)
N0 → R, (R[X], +) ist eine kommutative Gruppe, (ii) die Multipli-
a + b:
k  → a k + bk , kation · ist assoziativ, (iii) die Multiplikation ist kommutativ,

N0 → R, (iv) es gibt ein Einselement und (v) es gilt das Distributivge-
a · b:
k  → i+j =k ai bj . setz.

Die Addition ist also komponentenweise erklärt, die Multi- Es seien a = (a0 , a1 , a2 , . . .), b = (b0 , b1 , b2 , . . .) und
plikation sieht etwas ungewohnt aus, wir geben explizit die c = (c0 , c1 , c2 , . . .) Polynome aus R[X].
ersten Folgenglieder an: (i) Dass + eine Verknüpfung auf R[X] ist, haben wir schon
festgestellt. Die Addition ist auch assoziativ, da die Addition
(a0 , a1 , a2 , a3 , . . .) + (b0 , b1 , b2 , b3 , . . .)
in R assoziativ ist:
= (a0 + b0 , a1 + b1 , a2 + b2 , a3 + b3 , . . .)
    (a + b) + c = (a0 + b0 + c0 , a1 + b1 + c1 ,
=c0 =c1 =c2 =c3
a2 + b2 + c2 , . . .)
und
= a + (b + c) .
(a0 , a1 , a2 , a3 , . . .) · (b0 , b1 , b2 , b3 , . . .)
Die Verknüpfung ist wegen
= (a0 b0 , a0 b1 + b0 a1 , a0 b2 + a1 b1 + a2 b0 ,
   a + b = (a0 + b0 , a1 + b1 , a2 + b2 , . . .)
=d0 =d1 =d2
= (b0 + a0 , b1 + a1 , b2 + a2 , . . .) = b + a
a0 b3 + a1 b2 + a2 b1 + a3 b0 , . . .) .

=d3 auch kommutativ. Das neutrale Element ist die Nullfolge
0 = (0, 0, . . .) ∈ R[X], es gilt nämlich
Bei der Multiplikation beachte man, dass die Summe der
Indizes der Summanden des k-ten Folgenglieds stets k ergibt. 0 + a = (0 + a0 , 0 + a1 , 0 + a2 , . . .) = a .

Offenbar sind Summe und Produkt zweier Folgen, bei de- Und schließlich gibt es zu jedem Element ein Inverses in
nen fast alle Folgenglieder null sind, erneut solche Folgen. R[X], denn für −a = (−a0 , −a1 , −a2 , . . .) ∈ R[X] gilt
Genauer kann man sagen: offenbar a + (−a) = 0. Somit ist (i) gezeigt.
Es seien a = (a0 , a1 , a2 , . . .) und b = (b0 , b1 , b2 , . . .) (ii) Wir zeigen, dass das Assoziativgesetz der Multiplikation
Polynome aus R[X] mit ak = 0 für alle natürlichen k > n gilt:
und bl = 0 für alle natürlichen l > m, d. h.,
(a b) c = (d0 , d1 , d2 , . . .) mit
⎛ ⎞
a = (a0 , . . . , an , 0, . . .), b = (b0 , . . . , bm , 0, . . .) . ! ! !
dl = ⎝ ai bj ⎠ ck = (ai bj ) ck .
Dann gilt für die Folgenglieder cr der Summe a + b und für
r+k=l i+j =r i,j,k∈N0
die Folgenglieder ds des Produkts a b: (i+j )+k=l
88 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Nun klammern wir anders: Der Ring R ist ein Teilring von R[X]
a (b c) = (d0 , d1 , d2 , . . .) mit
⎛ ⎞ Völlig analog zu einem Teilkörper erklärt man den Begriff
! ! ! Teilring: Eine Teilmenge S eines Rings R heißt ein Teilring
dl = ai ⎝ bj ck ⎠ = ai (bj ck ) .
von R, wenn S mit den von R induzierten Verknüpfungen
i+s=l j +k=s i,j,k∈N0
i+(j +k)=l selbst wieder einen Ring bildet. Die sogenannten trivialen
Da beide Male dasselbe Element herauskommt, in R gilt näm- Teilringe sind der Nullring {0} und der ganze Ring R. Wir
lich das Assoziativgesetz, gilt das Assoziativgesetz auch in zeigen nun, dass wir den Ring R stets als Teilring des Poly-
R[X]. nomrings R[X] auffassen können. Hierbei ist eine Feinheit
zu berücksichtigen: Natürlich ist der Ring R selbst niemals
(iii) Die Multiplikation ist kommutativ, da sie in R kommu- Teilmenge von R[X] – die Menge R[X] ist eine Menge von
tativ ist: ⎛ ⎞ Folgen, deren Folgenglieder aus R sind; und die Elemente
! ! ! aus R sind nicht von dieser Form, daher gilt:
ab = ⎝ ai bj , ai bj , ai bj , . . .⎠
i+j =0 i+j =1 i+j =2 R  R[X],
⎛ ⎞
! ! !
=⎝ bj ai , bj ai , bj ai , . . .⎠ und es hat eigentlich keinen Sinn bei R von einem Teilring
j +i=0 j +i=1 j +i=2 von R[X] zu sprechen. Aber wir betten nun den Ring R in
den Polynomring R[X] ein. Dabei meint man, dass man eine
= ba.
injektive, additive und multiplikative Abbildung angibt, die
den Ring R in den Polynomring R[X] einbettet. Eine additive
(iv) Das Einselement ist die Folge 1 = (1, 0, 0, . . .) ∈
und multiplikative Abbildung zwischen Ringen bezeichnet
R[X], es gilt nämlich für jedes a ∈ R[X]:
man auch als Ringhomomorphismus:
1 a = (1, 0, . . .) (a0 , a1 , a2 , . . .) = (a0 , a1 , a2 , . . .) = a .

(v) Wir begründen das Distributivgesetz. Es gilt: Ringhomomorphismus


(a + b) c Eine Abbildung ϕ : S → S  zwischen Ringen S und
⎛ S  nennt man einen Ringhomomorphismus oder kurz
! ! Homomorphismus, wenn für alle r, s ∈ S gilt:
=⎝ (ai + bi )cj , (ai + bi )cj ,
ϕ(r + s) = ϕ(r) + ϕ(s),
i+j =0 i+j =1
⎞ ϕ(r s) = ϕ(r) ϕ(s).
!
(ai + bi )cj , . . .⎠
Wir können einen solchen Ringhomomorphismus von R in
i+j =2
⎛ R[X] angeben:
! ! 
=⎝ ai cj + bi cj , ai cj + bi cj , R → R[X],
ι:
i+j =0 i+j =1 r → (r, 0, 0, . . .).

!
ai cj + bi cj , . . .⎠ . Jedem Ringelement r ∈ R wird die Folge a ∈ R[X] mit
i+j =2 a0 = r und ai = 0 für i = 0 zuordnet. Nun zeigen wir:

Und nun berechnen wir


Lemma
ac+bc Für jeden kommutativen Ring R ist die Abbildung
⎛ ⎞
! ! ! 
=⎝ ai cj , ai cj , ai cj , . . .⎠ R → R[X],
ι:
i+j =0 i+j =1 i+j =2 r → (r, 0, 0, . . .)
⎛ ⎞
! ! !
+⎝ bi cj , bi cj , bi cj , . . .⎠ ein injektiver Ringhomomorphismus.
i+j =0 i+j =1 i+j =2

! ! Beweis: Für alle r, s ∈ R gilt:
=⎝ ai cj + bi cj , ai cj + bi cj ,
i+j =0 i+j =1
⎞ ι(r + s) = (r + s, 0, 0, . . .)
! = (r, 0, 0, . . .) + (s, 0, 0, . . .)
ai cj + bi cj , . . .⎠ .
i+j =2 = ι(r) + ι(s) ,
Somit gilt (a + b) c = a c + b c, d. h. es gilt das Distributiv- ι(r s) = (r s, 0, 0, . . .) = (r, 0, 0, . . .) (s, 0, 0, . . .)
gesetz.  = ι(r) ι(s) .
3.4 Ringe 89

Folglich ist ι ein Ringhomomorphismus. wobei a an (n + 1)-ter Stelle steht. Für ein beliebiges
P = (a0 , a1 , a2 , . . . , an , 0, 0, . . .) ∈ R[X] finden wir
Die Abbildung ι ist zudem injektiv: Es gelte ι(r) = ι(s) für
mit unserer Definition der Addition in R[X];
r, s ∈ R, d. h.,

(r, 0, 0, . . .) = (s, 0, 0, . . .) . P = a 0 X 0 + a 1 X + a 2 X 2 + · · · + an X n .

Hieraus folgt r = s.  Wir schreiben kürzer


!
n !
Nach diesem Lemma ist P = ai X i oder P = ai X i .
i=0 i∈N0
ι(R) = {(r, 0, . . .) | r ∈ R} ⊆ R[X]
Man beachte, dass P = i
i∈N0 ai X nur eine andere
isomorph zu R, es ist nämlich die Abbildung Schreibweise für die Abbildung P : N0 → R, P (i) = ai
ist. Daher ist ein Koeffizientenvergleich möglich:
R → ι(R[X]), r  → (r, 0, . . .)

eine Bijektion. D. h., wir können die Elemente (r, 0, . . .) ∈ Der Koeffizientenvergleich
R[X] mit den Elementen r ∈ R identifizieren. Hierbei ersetzt Zwei Polynome i∈N0 ai X i und i∈N0 bi X i sind ge-
man gewissermaßen die Elemente (r, 0, . . .) in R[X] durch nau dann gleich, wenn sie die gleichen Koeffizienten
die entsprechenden Elemente r aus R – daher auch der Begriff haben, d. h.:
einer Einbettung. Übrigens bezeichnet man Einbettungen oft
! !
mit dem griechischen Buchstaben ι (wie Injektion). ai X i = bi X i ⇔ ai = bi für alle i ∈ N0 .
Wir unterscheiden von nun ab die Bilder ι(r) ∈ R[X] und i∈N0 i∈N0
r ∈ R nicht mehr und fassen R als einen Teilring von R[X]
auf. Wir nennen die Elemente r ∈ R auch die Konstanten
von R[X].
?
Wieso ist die folgende Aussage nicht ganz korrekt?
Wir führen nun eine neue Schreibweise ein und erhalten da-
durch für die Elemente aus R[X] die bekannte Darstellung !
n !
m
ai X i = bi X i ⇔ n = m und ai = bi für alle i .
als Polynome in der Form ni=0 ai X i in einer Unbestimmten
i=0 i=0
X, wobei X ein Element von R[X] ist.

Das Polynom (0, 1, 0, . . .) ist die Addition und Multiplikation lauten mit dieser Schreibweise
wie folgt:
Unbestimmte X
⎛ ⎞ ⎛ ⎞
! ! !
Unter der Vielzahl von Polynomen in R[X] wählen wir nun ⎝ ai X i ⎠ + ⎝ bi X i ⎠ = (ai + bi ) Xi ,
ein ganz bestimmtes Polynom aus und geben diesem den i∈N0 i∈N0 i∈N0
Namen X. Die Abbildung ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
⎧ ! ! ! !
⎝ ai X i ⎠ · ⎝ bj X j ⎠ = ⎝ ai bj ⎠ X k .
⎨N0 →  R,
X: 1, falls i = 1, i∈N0 j ∈N 0 k∈N0 i+j =k
⎩ i →
0, falls i  = 1
Wir wiederholen das Beispiel von Seite 87 mit dieser neuen
liegt in R[X], es ist X(k) = 0 für alle k ≥ 2. Ausgeschrieben
Schreibweise für Polynome:
lautet das Element X ∈ R[X]

X = (0, 1, 0, 0, . . .) . Beispiel Gegeben seien die reellen Polynome P = 1 +


2 X + 3 X 3 und Q = X + X 2 . Dann gilt:
Die mysteriöse Unbestimmte X ist damit eine wohlbestimmte
Abbildung von N0 nach R. Für die im Ring R[X] definierten P + Q = 1 + 3 X + X2 + 3 X3 ,
Potenzen X0 = 1, Xn+1 = Xn X folgt: P · Q = (1 + 2 X + 3 X3 ) · (X + X 2 )
X n = (0, 0, . . . , 0, 1, 0, . . .), = X + 3 X2 + 2 X3 + 3 X4 + 3 X5 . 

wobei die 1 an (n + 1)-ter Stelle steht und sonst nur


Nullen vorkommen. Für a ∈ R erhalten wir nun wegen Die Multiplikation der Folgen ist genau so definiert, dass mit
a = (a, 0, 0, . . .) = a X 0 : dieser neuen Schreibweise das bekannte distributive Ausmul-
tiplizieren der einzelnen Summanden von Polynomen funk-
a Xn = (0, . . . , 0, a, 0 . . .), tioniert.
90 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Mit den erklärten Verknüpfungen + und · in R[X] haben wir die bekannten Polynomfunktionen zurück. Aber die (alge-
die Polynome in ihrer vertrauten Form und mit vertrauten braischen) Polynome sind universeller: In späteren Kapiteln
Rechenregeln gewonnen: werden wir in Polynome noch ganz andere Dinge einsetzen,
z. B. kann man Polynome oder Abbildungen oder Matrizen
für X einsetzen.
Darstellungssatz für Polynome
Es ist
⎧ ⎫ Das Einsetzen in Polynome
⎨! ⎬ Es sei R ein kommutativer Teilring des Rings S. Für ein
R[X] = ai X i | ai ∈ R, ai = 0 für fast alle i ∈ N0 Polynom P ∈ R[X],
⎩ ⎭
i∈N0
!
n
ein kommutativer Ring mit Einselement 1. Für das Null- P = ai X i = a0 + a1 X + · · · + an X n
polynom 0 gilt ai = 0 für alle i ∈ N0 . i=0

und jedes Element c ∈ S ist das Element


Man nennt R[X] den Polynomring in der Unbestimmten X
über R. !
n
P (c) = ai ci = a0 + a1 c + · · · + an cn
Beispiel Für die Polynome P = 1 + 2 X + 3 X2 , Q = i=0
X + 2 X 2 ∈ R[X] gilt:
ein Element aus S – man sagt, man setzt in X das Ele-
Im Fall R = Z oder R = R: ment c ∈ S ein.

P + Q = 1 + 3 X + 5 X2 ,
Achtung: Man beachte die grundverschiedenen Bedeu-
P · Q = X + 4 X2 + 7 X3 + 6 X4 .
tungen der Addition und Multiplikation: Bei
Im Fall R = Z6 :
ai · X i + ai+1 · X i+1
P + Q = (1 + 2 X + 3 X2 ) + (X + 2 X2 )
sind + und · die Addition und Multiplikation von Polynomen
= 1 + (2 + 1) X + (3 + 2) X2 aus R[X]. Bei
= 1 + 3 X + 5 X2 , ai · ci + ai+1 · ci+1
2 2
P · Q = (1 + 2 X + 3 X ) · (X + 2 X )
sind + und · die Addition und Multiplikation von Ringele-
= X + (2 + 2) X2 + (2 · 2 + 3 · 1) X3 + 3 · 2 X4 menten aus S.
= X + 4 X2 + X3 . 
Nun können wir alle möglichen Elemente von Ringen, die R
umfassen, in Polynome über R einsetzen:
Das Einsetzen in Polynome ist ein
Homomorphismus Beispiel
Wir können in das Polynom P = 1 + X 2 ∈ R[X] die
Wir haben Polynome als Folgen mit nur endlich vielen komplexe Zahl i ∈ C ⊇ R einsetzen:
von null verschiedenen Folgengliedern eingeführt. Durch die
Festlegung X = (0, 1, 0, . . .) haben wir mithilfe der erklär- P (i) = 1 + i2 = 0 ∈ C .
ten Addition und Multiplikation von Polynomen die vertraute
Gestalt,
In C hat das reelle Polynom eine Nullstelle, in R hingegen
!
n nicht.
ai X i = a0 + a1 X + · · · + an X n Da der Polynomring R[X] den Ring R umfasst, können
i=0 wir Polynome in Polynome einsetzen. Für P = 1+X und
Q = X + X 2 aus R[X] gilt:
zurückgewonnen. Aber immer noch sind die so gewonnenen
Polynome für den Anfänger etwas Ungewohntes – sie wirken P (Q) = 1 + X + X 2 ∈ R[X] . 
abstrakt und haben scheinbar kaum etwas mit den wohlbe-
kannten Polynomfunktionen gemein. Dass dem ganz und gar
nicht so ist, wollen wir als Nächstes begründen. Wir werden Wir betrachten nun den Fall R = S. Hält man ein Polynom
jetzt in Polynome einsetzen, genauer: Wir werden in die Un- P ∈ R[X] fest und setzt in dieses Polynom alle Elemente
bestimmte X z. B. Zahlen einsetzen. So gewinnen wir dann x ∈ R ein, so erhält man eine Abbildung von R nach R:
3.4 Ringe 91

⎛ ⎞
Die Polynomfunktion ! !
c ⎝ ai X + i
bi X i⎠
Für jedes P ∈ R[X] nennt man die Abbildung i∈N0 i∈N0
 ⎛ ⎞
R → R !
P̃ : =c ⎝ (ai + bi ) Xi ⎠
x  → P (x)
i∈N0
die zu P gehörige Polynomfunktion. Ein Ele- ! ! !
= (ai + bi ) ci = ai ci + bi ci
ment c ∈ R heißt Nullstelle von P , falls
i∈N0 i∈N0 i∈N0
P (c) = 0. ⎛ ⎞ ⎛ ⎞
! !
=c ⎝ ai X i⎠
+ c ⎝ bi X i⎠
.
Beispiel i∈N0 i∈N0

Für P = X2 − X + 2 ∈ R[X] ist


Die Abbildung c ist multiplikativ, da
 ⎛ ⎞
R → R,
P̃ : ! !
x → x 2 − x + 2 c ⎝ ai X i bi X i ⎠
i∈N0 i∈N0
die zu P gehörige Polynomfunktion. ⎛ ⎛ ⎞ ⎞
Für P = X2 + X ∈ Z2 [X] ist ! !
=c ⎝ ⎝ ak bl ⎠ X i⎠

 i∈N0 k+l=i
Z2 → Z2 , ⎛ ⎞
P̃ : ! !
x → x 2 + x ⎝
= ak bl ⎠ c i
i∈N0 k+l=i
wegen P (0) = 0 = P (1) die Nullfunktion, obwohl P
nicht das Nullpolynom ist. und
Für P = X2 − 1 ∈ Z8 [X] hat die Polynomfunktion ⎛ ⎞ ⎛ ⎞
! !
 c ⎝ ai X i⎠
c ⎝ bi X i⎠
Z8 → Z8 , i∈N0 i∈N0
P̃ : ⎛ ⎞⎛ ⎞
x → x 2 − 1
! !
=⎝ ai c i ⎠ ⎝ bi c i ⎠
wegen P (1) = P (3) = P (5) = P (7) = 0 die vier Null- i∈N0 i∈N0
stellen 1, 3, 5 und 7.  ⎛ ⎞
! !
= ⎝ ak bl ⎠ ci . 

Das Einsetzen von Elementen c ∈ R in X erklärt eine Abbil- i∈N0 k+l=i


dung: Für jedes c ∈ R ist

R[X] → R,
c : Der Grad eines Polynoms ist der Index des
P  → P (c)
höchsten von null verschiedenen
eine Abbildung vom Ring der Polynome in den Ring R. Wir Koeffizienten
zeigen nun den wichtigen Satz:
Ist P = i∈N0 ai X i ∈ R[X] ein Polynom, so nennt man

Der Einsetzhomomorphismus max{i ∈ N0 | ai = 0}, wenn P = 0,
deg P =
Für jedes c ∈ R ist die Abbildung −∞, wenn P = 0
 den Grad von P und vereinbart für alle n ∈ N0 :
R[X] → R
c :
P  → P (c)
−∞ < n, −∞+n = n+(−∞) = (−∞)+(−∞) = −∞ .
ein Ringhomomorphismus – der Einsetzhomomorphis-
Es sei P = a0 + a1 X + · · · + an X n , an = 0, ein Polynom
mus.
vom Grad n. Dann heißen
a0 das konstante Glied von P ,
Beweis: Es seien i∈N0 ai X i , i∈N0 bi X ∈ R[X]
i an der höchste Koeffizient von P , und es heißt
zwei Polynome. Die Abbildung c ist additiv, da P normiert, wenn an = 1.
92 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Beispiel Es ist Mit Polynomen über Integritätsbereichen können wir ebenso


wie in Z eine Division mit Rest durchführen, dabei entspricht
2 + 3 X 2 + X 5 ∈ Z[X] die Forderung b = 0 der Forderung bn ist invertierbar, wobei
bn der höchste Koeffizient von Q = 0 ist, und die Rolle des
ein Polynom vom Grad 5 mit konstantem Glied 2 und höchs- Betrags | · | übernimmt der Grad deg, genauer:
tem Koeffizienten 1 – das Polynom ist also normiert. 
Division mit Rest
Wir stellen fest:
Es seien P , Q ∈ R[X], Q = 0. Wenn der höchste Koef-
fizient von Q invertierbar in R ist, existieren Polynome
Die Gradformel
S, T ∈ R[X] mit
Für beliebige Polynome P , Q ∈ R[X] gilt:
P = Q S + T und deg T < deg Q .
deg(P + Q) ≤ max{deg(P ), deg(Q)},
deg(P Q) ≤ deg(P ) + deg(Q) .
Beweis: Die Menge M = {P − Q H | H ∈ R[X]} ist
Ist R ein Integritätsbereich, so gilt sogar: nichtleer. Daher gibt es in M ein Polynom T = rn X n +
· · · + r1 X + r0 ∈ M mit minimalem Grad n. Es gilt somit
deg(P Q) = deg(P ) + deg(Q) . T = P − Q S für ein S ∈ K[X].
Wäre n = deg T ≥ m = deg Q, Q = bm X m + · · · + b1 X +
b0 , so bilde das Polynom
Beweis: Ist P oder Q das Nullpolynom, so gelten offenbar
 −1 n−m 
alle Aussagen. Nun seien P und Q von null verschieden. Es T  = T − Q rn bm X ∈M.
seien an der höchste Koeffizient von P und bm der von Q.
Da sich bei der Addition von Polynomen mit gleichem Grad Dieses Polynom T  liegt in M, da es wegen T = P − Q S
die höchsten Koeffizienten zu null addieren können, gilt auf die Form P − Q H hat. Wir berechnen nun:
jeden Fall die erste Ungleichung.
T  = rn X n + rn−1 X n−1 + · · · + r0
Ist R ein Integritätsbereich, so ist das Produkt an bm der von  −1 
− rn X n + rn bm bm−1 X n−1 + · · ·
null verschiedenen höchsten Koeffizienten an und bm wieder  −1 
von null verschieden. Da an bm in diesem Fall der höchste = rn−1 − rn bm bm−1 Xn−1 + (· · · )Xn−2 + · · · .
Koeffizient von P Q ist, gilt die letzte Gleichheit.
Es ist also deg T  < deg T im Widerspruch zur Wahl von
Ist R kein Integritätsbereich, so kann durchaus der Fall T . Das zeigt die Existenz von S und T mit den geforderten
an bm = 0 eintreten. In diesem Fall gilt die Ungleichung Eigenschaften. 

deg(P Q) ≤ deg(P ) + deg(Q). 

Der Beweis ist konstruktiv, wir geben auf Seite 93 ein aus-
Beispiel Im Fall R = Z6 gilt für die Polynome P = führliches Beispiel an.
2 X2 + 1 und Q = 3 X + 1:

P Q = 2 X2 + 3 X + 1, Ein Polynom hat höchstens n Nullstellen

insbesondere also deg(P Q) < deg(P ) + deg(Q).  Nach dem Satz zur Division mit Rest können wir jedes Po-
lynom P ∈ R[X] durch das Polynom Q = X − a mit a ∈ R
vom Grad 1 mit Rest teilen. Es existieren gemäß dem Satz
? zu P ∈ R[X] und a ∈ R Polynome S, T ∈ R[X] mit
Warum definiert man deg 0 = −∞?
P = (X − a) S + T und deg T < deg(X − a) = 1,

d. h., T ∈ R ist eine Konstante. Nun setzen wir a für X ein


Bei der Division von P durch Q bleibt ein Rest und erhalten:
mit Grad kleiner als deg(Q) P (a) = (a − a) S(a) + T = T .

Auf Seite 56 haben wir die Division mit Rest angegeben. Im Ist nun a eine Nullstelle von P , d. h., P (a) = 0, so folgt
Ring Z lässt sich diese Division mit Rest wie folgt formulie- T = 0. Damit ist gezeigt:
ren: Zu je zwei ganzen Zahlen a, b ∈ Z mit b  = 0 existieren
ganze Zahlen q, r mit Folgerung (H)
at ein Polynom P ∈ R[X] eine Nullstelle a ∈ R, so
a = q b + r und 0 ≤ r < |b| . existiert ein S ∈ R[X] mit P = (X − a) S.
3.4 Ringe 93

Beispiel: Division von Polynomen mit Rest


Wir teilen das Polynom

P = 4 X5 + 6 X3 + X + 2 ∈ Z[X] durch Q = X2 + X + 1 ∈ Z[X] und


P = X5 + X 4 − 4 X3 + X 2 − X − 2 ∈ Z[X] durch Q = X2 − X − 1 ∈ Z[X]

mit Rest.
Problemanalyse und Strategie: Wir benutzen die Methode aus dem Beweis des Satzes zur Division mit Rest.

Lösung:
Die Anfangsterme der Polynome P und 4 X3 ·Q stimmen überein, den Rest müssen wir korrigieren; man erhält sukzessive:

(4 X5 + 6 X3 + X + 2) = (X 2 + X + 1) (4 X 3 − 4) X2 + 6 X − 2
−(4 X3 X 2 + 4 X3 X + 4 X 3 1)
− 4 X4 + 2 X3 + X + 2
− (−4 X 2 X 2 − 4 X2 X − 4 X 2 1)
6 X3 + 4 X2 + X + 2
− (6 X 3 + 6 X2 + 6 X)
− 2 X2 − 5 X + 2
− (−2 X 2 − 2 X − 2)
− 3X + 4

Damit ist
4 X 5 + 6 X3 + X + 2 = (4 X3 − 4 X2 + 6 X − 2) (X 2 + X + 1) − 3 X + 4 .
In der Rechnung entspricht das Polynom in der zweiten Zeile dem Polynom b−1 a Xn−k Q und das Polynom unter dem
ersten Strich entspricht P0 . Das Weitere ist eine Wiederholung des Verfahrens.
Nun zum zweiten Beispiel:

(X5 + X 4 − 4 X3 + X 2 − X − 2) = (X 2 − X − 1) (X 3 + 2 X2 − X + 2)
−(X 5 − X 4 − X3 )
2 X4 − 3 X3 + X2
− (2 X4 − 2 X3 − 2 X2 )
− X3 + 3 X2 − X
− (−X 3 + X2 + X)
2 X2 − 2 X − 2
− (2 X 2 − 2 X − 2)
0

Damit ist
X 5 + X 4 − 4 X3 + X 2 − X − 2 = (X 2 − X − 1) (X 3 + 2 X2 − X + 2) .
94 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Wir können hieraus folgern: Kommentar: Im Allgemeinen ist es außerordentlich


schwierig bis unmöglich, die Nullstellen von Polynomen
über R vom Grad 3 und höher zu bestimmen. Aus der Schule
Abspalten von Linearfaktoren
ist man es gewohnt, dass man die Nullstellen von reellen Po-
Es seien R ein Integritätsbereich und P  = 0 ein Polynom lynomen höheren Grades erraten kann, sie sind bei den Bei-
vom Grad n über R. spielen aus der Schule meist ganze Zahlen, die nahe der Null
(a) Sind a1 . . . , ak ∈ R verschiedene Nullstellen von liegen. Das Erraten der Nullstellen scheitert aber schon beim
P , so gilt: Polynom P = X3 − 0.4 X2 + 0.04 X − 1.2 X2 + 0.48 X +
0.048 ∈ R[X]. Tatsächlich ist die Situation wie folgt:
P = (X − a1 ) · · · (X − ak ) Q
Ein Polynom P = a ∈ R[X] \ {0} vom Grad 0 hat keine
für ein Q ∈ R[X]. Nullstelle in R.
(b) Es hat P höchstens n verschiedene Nullstellen in R. Ein Polynom P = a X + b ∈ R[X] vom Grad 1 hat die
(c) Sind S, T Polynome vom Grad ≤ n und gilt Nullstelle − ab in R.
S(ai ) = T (ai ) für n + 1 verschiedene Elemente Ein Polynom P = a X2 +b X +c ∈ R[X] vom Grad 2 hat
a1 . . . , an+1 aus R, so gilt S = T . im Fall D = b2 − 4 a c ≥ 0 die beiden nicht notwendig

verschiedenen Nullstellen −b± 2a
D
in R.
Im Allgemeinen sind alle bekannten Formeln zur (exak-
Beweis: (a) Für k = 1 steht dies in der obigen Folgerung.
ten) Bestimmung der Nullstellen von reellen Polynomen
Es sei k ≥ 2, und die Behauptung sei richtig für k − 1:
vom Grad größer oder gleich 3 zu kompliziert, als dass
man sie tatsächlich zur Bestimmung benutzt. Man benutzt
P = (X − a1 ) · · · (X − ak−1 ) S
vielmehr numerische Verfahren, mit deren Hilfe man die
für ein S ∈ R[X]. Einsetzen von ak liefert mit dem Einsetz- Nullstellen näherungsweise ermittelt.
homomorphismus: Genauere Aussagen zu den Nullstellen von Polynomen vom
Grad 3 und größer und zu den Tatsachen, die dahinter stecken,
0 = P (ak ) = (ak − a1 ) · · · (ak − ak−1 ) S(ak ) können wir an dieser Stelle noch nicht machen. Üblicher-
weise lernt man die Hintergründe zu diesen recht „verzwick-
und damit S(ak ) = 0, weil R nullteilerfrei ist. Mit der obigen ten Sachverhalten“ in einer Vorlesung zur (nichtlinearen)
Folgerung erhalten wir S = (X − ak ) Q für ein Q ∈ R[X], Algebra, die man meist erst ab dem zweiten Studienjahr
also P = (X − a1 ) · · · (X − ak ) Q. besucht.
(b) Hätte ein Polynom P vom Grad n mehr als n Nullstellen,
so könnten wir nach dem Teil (a) mehr als n Linearfaktoren
abspalten. Mit der Gradformel würde dann aber folgen, dass Man sagt, ein Polynom zerfällt in Linear-
der Grad von P auch größer als n ist. Dieser Widerspruch
faktoren, wenn es sich als Produkt von
liefert die Behauptung.
Polynomen vom Grad 1 schreiben lässt
(c) Wegen deg(S − T ) ≤ n und (S − T )(ai ) = 0 für i =
1 . . . , n + 1 folgt S − T = 0 nach der bereits bewiesenen Nach dem Satz über das Abspalten von Linearfaktoren auf
Aussage in (b). Somit gilt S = T .  Seite 94 können wir jedes Polynom P ∈ R[X] über einem
Integritätsbereich R mithilfe seiner Nullstellen in R zerlegen.
Achtung: Das Polynom X 2 − 1 ∈ Z8 [X] vom Grad 2 hat Dazu führen wir eine neue Sprechweise ein. Man sagt, eine
die vier verschiedenen Nullstellen 1, 3, 5, 7 ∈ Z8 ; der Ring Nullstelle a ∈ R des Polynoms P ∈ R[X] hat die Vielfach-
Z8 ist kein Integritätsbereich. heit ν, wenn

P = (X − a)ν Q mit Q(a) = 0


Beispiel
Das Polynom P = X4 − 6 X 3 + 11 X 2 − 6 X ∈ R[X] hat gilt. Sind nun a1 , . . . , ar alle verschiedenen Nullstellen von
wegen P in R der Vielfachheiten ν1 , . . . , νr , so gilt:

P = (X − a1 )ν1 · · · (X − ar )νr Q
X4 − 6 X3 + 11 X2 − 6 X = X (X − 1) (X − 2) (X − 3)
mit einem Polynom Q, das in R keine Nullstelle mehr hat.
die vier verschiedenen Nullstellen 0, 1, 2, 3. Liegen sämtliche Nullstellen von P in R, dann ist Q ∈ R eine
Das Polynom P = X5 − 2 X4 + 2 X3 − 2 X2 + X ∈ R[X] Konstante; in diesem Fall sagt man, das Polynom P zerfällt
hat wegen in Linearfaktoren, es ist dann nämlich ein Produkt einer
Konstanten mit linearen Polynomen, d. h. von Polynomen
X 5 − 2 X4 + 2 X3 − 2 X2 + X = X (X − 1)2 (X 2 + 1) vom Grad 1. Außerdem gilt in diesem Fall:

die zwei verschiedenen Nullstellen 0 und 1.  ν1 + · · · + νr = deg P .


Zusammenfassung 95

? Wir haben in diesem Kapitel Gruppen, Ringe und Körper so


Was ist im Fall r = deg P los? weit dargestellt, wie wir es für unsere Zwecke in der Analy-
sis und der linearen Algebra benötigen werden. Dabei haben
wir nur an der Oberfläche der Theorien dieser algebraischen
Beispiel Strukturen gekratzt. In einer Vorlesung zur (nichtlinearen)
Das Polynom P = X 4 − 6 X 3 + 11 X 2 − 6 X ∈ R[X] Algebra, die man üblicherweise im zweiten Studienjahr hört,
zerfällt wegen werden Gruppen, Ringe und Körper ausführlicher behandelt.
Aber auch in dieser Vorlesung werden nur grundlegende Re-
X4 − 6 X3 + 11 X2 − 6 X = X (X − 1) (X − 2) (X − 3) sultate erarbeitet, und zwar üblicherweise genauso viele wie
nötig sind, um die in einer Algebravorlesung behandelten
über R in Linearfaktoren. Fragen zur Auflösbarkeit von algebraischen Gleichungen zu
Das Polynom P = X5 − 2 X4 + 2 X3 − 2 X2 + X ∈ R[X] klären. Tatsächlich aber ist alleine die Gruppentheorie eine
zerfällt wegen der umfangreichsten mathematischen Theorien überhaupt.
Um nur eine vage Vorstellung davon zu bekommen, erwäh-
X 5 − 2 X4 + 2 X3 − 2 X2 + X = X (X − 1)2 (X 2 + 1) nen wir, dass es in der Gruppentheorie einen Satz gibt, dessen
Beweis etwa 5000 Seiten umfasst; und dabei ist dieser so-
über R nicht in Linearfaktoren, da X 2 + 1 keine Nullstelle
genannte große Satz, der alle endlichen einfachen Gruppen
in R hat. Wegen X 2 + 1 = (X + i) (X − i) ∈ C[X] zerfällt
beschreibt, nur einer von vielen Sätzen. Für das erste Stu-
P aber sehr wohl über C in Linearfaktoren. 
dienjahr aber kommen wir mit unseren wenigen Resultaten
zur Gruppen-, Ring- und Körpertheorie aus.
Kommentar: Der sogenannte Fundamentalsatz der Alge-
bra (siehe Seite 339) besagt, dass jedes Polynom P ∈ C[X]
in Linearfaktoren zerfällt.

Zusammenfassung

Wir betrachten Mengen M mit einer Verknüpfung, also einer Definition eines Homomorphismus
Abbildung ∗ : M × M → M, (a, b)  → a ∗ b.
Eine Abbildung ψ : G → G der Gruppe (G, ∗) in die
Gruppe (G , ∗ ) heißt Homomorphismus, wenn für alle
Definition einer Gruppe a, b ∈ G
(G, ∗) ist eine Gruppe, wenn die Verknüpfung ∗ asso- ψ(a ∗ b) = ψ(a) ∗ ψ(b)
ziativ ist, wenn es ein neutrales Element e ∈ G gibt mit
e ∗ a = a für alle a ∈ G und wenn zu jedem a ∈ G ein ist. Ist ψ bijektiv, so spricht man von einem Isomorphis-
inverses Element a −1 ∈ G existiert mit a −1 ∗ a = e. mus und insbesondere bei G = G von einem Auto-
morphismus.
In jeder Gruppe (G, ∗) ist das neutrale Element e eindeutig
mit e ∗ x = x ∗ e = x, und zu jedem a ∈ G gibt es genau ein
inverses Element a −1 mit a ∗ a −1 = a −1 ∗ a = e. 
Ist ψ : G  → G ein Homomorphismus, so ist das Bild
Ein wichtiges Beispiel einer Gruppe ist die Menge der bijek- ψ(G), ∗ eine Untergruppe von (G , ∗ ). Eine wichtige
tiven Abbildungen einer nichtleeren Menge M auf sich mit Rolle spielt der Kern ker ψ, die Menge der Urbilder des neu-
der Hintereinanderausführung ◦ als Verknüpfung, die Per- tralen Elements von G . Der Kern ist eine Untergruppe von
mutationsgruppe von M. G, und genau bei ker ψ = {e} mit e als neutralem Element
von G ist der Homomorphismus ψ injektiv.
Sind (G, ∗) eine Gruppe und H eine Teilmenge von G, so
heißt H Untergruppe von G, wenn auch H hinsichtlich der Die Fasern des Homomorphismus ψ : G → G , also die
Verknüpfung ∗ eine Gruppe ist. Kennzeichnend dafür ist, Mengen der Urbilder der Elemente ψ(a) ∈ G , sind gleich-
dass H nichtleer ist, mit jedem x zugleich x −1 enthält und zeitig Links- und Rechtsnebenklassen des Kerns, nämlich
x, y ∈ H stets (x ∗ y) ∈ H zur Folge hat. gleich den Mengen a ∗ ker ψ = ker ψ ∗ a.
Ist G endlich und (H, ∗) eine Untergruppe von (G, ∗), so ist Auf der Menge G/ ker ψ aller Nebenklassen von ψ ist durch
nach dem Satz von Lagrange die Anzahl |H | der Elemente (a ∗ ker ψ) " (b ∗ ker ψ) = (a ∗ b) ∗ ker ψ eine Verknüpfung
von H ein Teiler von |G|. definierbar.
96 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Homomorphiesatz 0 ist dabei dem Nullpolynom mit ai = 0 für alle i ∈ N0


zugeordnet.
Ist ψ : G → Gein Homomorphismus der Gruppe
(G, ∗) in die Gruppe (G , ∗ ), so ist Das Polynom mit a(0) = 0, a(1) = 1 und a(i) = 0 für
ϕ : G/ ker ψ → ψ(G), a ∗ ker ψ  → ψ(a) i > 1 wird als Unbestimmte X bezeichnet. Zusammen mit
den Potenzen X0 = 1 und X n+1 = X n · X können wir
ein Isomorphismus
 der Faktorgruppe
 (G/ ker ψ, ") schließlich das Polynom a ∈ R[X] mit a(i) = ai darstellen
auf die Gruppe ψ(G), ∗ der Bilder. als
a 0 X 0 + a 1 X + a 2 X 2 + · · · + an X n .
Ein Körper ist eine Menge K mit zwei Verknüpfungen, der
Addition und der Multiplikation, wobei gilt: Zwei Polynome i∈N0 ai X i und i∈N0 bi X i sind genau
dann gleich, wenn ai = bi ist für alle i ∈ N0 .
(K, +) ist eine kommutative Gruppe mit dem Nullele-
Angenommen, R ist ein kommutativer Teilring des Rings
ment 0 als neutralem Element und −a als zu a inversem
S. Dann kann man jedes c ∈ S in das Polynom P =
Element. n
i=0 ai X ∈ R[X] einsetzen, also das Element P (c) =
i
(K \ {0}, · ) ist eine kommutative Gruppe mit dem Eins- n
i=0 ai c ∈ S berechnen.
i
element 1 als neutralem Element.
Es gilt das Distributivgesetz a · (b + c) = (a · b) + (a · c). Im Fall R = S erhält man für jedes P ∈ R[X]
Wichtige Beispiele sind der Körper (R, +, · ) der reellen P̃ : R → R, x → P (x),
Zahlen sowie (C, +, · ), der Körper der komplexen Zahlen die zu P gehörige Polynomfunktion. Ein Element c ∈ R
z = a + i b mit (a, b) ∈ R . Für jede Primzahl p ist
2
heißt Nullstelle von P , falls P (c) = 0 ist.
Zp = {0, 1, . . . , p−1}, +, · ein Körper, der p Elemente
umfassende Restklassenkörper modulo p.
Der Einsetzhomomorphismus
Die von Körpern geforderten Bedingungen lassen sich auf Für jedes c ∈ R ist die Abbildung
verschiedene Weise abschwächen. (R, +, · ) heißt Ring, c : R[X] → R, P → P (c)
wenn (R, +) eine kommutative Gruppe ist, die Multiplika-
ein Ringhomomorphismus, der Einsetzhomomorphis-
tion assoziativ ist und wenn beide Distributivgesetze erfüllt
mus.
sind.
Ein Ring kann Nullteiler besitzen, also Elemente a, b  = 0 Für P ∈ R[X] \ {0} nennt man den Index des höchsten von
mit a · b = 0. Ist der Ring R nullteilerfrei, ist die Multiplika- null verschiedenen Koeffizienten den Grad deg P von P .
tion kommutativ und existiert ein Einselement, so nennt man
R einen Integritätsbereich. Für beliebige Polynome P , Q ∈ R[X] gilt:

Wichtiges Beispiel eines Rings ist der Polynomring R[X] deg(P + Q) ≤ max{deg(P ), deg(Q)},
in der Unbestimmten X über dem kommutativen Ring R mit deg(P · Q) ≤ deg(P ) + deg(Q).
Einselement. Die folgende Definition der Polynome kommt
ohne den Begriff einer Unbestimmten aus. Ist R ein Integritätsbereich, so gilt deg(P · Q) = deg(P ) +
deg(Q).
Die Polynome über R
Wir nennen jede Abbildung a : N0 → R mit a(i) = 0 für Division mit Rest
fast alle i ∈ N0 ein Polynom. Die Menge aller Polynome Es seien P , Q ∈ R[X], Q = 0. Wenn der höchste Koef-
über R wird mit R[X] bezeichnet. fizient von Q invertierbar in R ist, existieren Polynome
S, T ∈ R[X] mit
Polynome werden komponentenweise addiert; die Multipli- P = Q S + T und deg T < deg Q.
kation erfolgt durch Summation über die Produkte mit glei-
cher Indexsumme. Daraus können wir folgern, dass wir bei einem Polynom P =
0 über einem Integritätsbereich R und mit den Nullstellen
Satz vom Polynomring a1 . . . , ak ∈ R Linearfaktoren abspalten können, es gilt
Für jeden kommutativen Ring R mit 1 ist (R[X], +, · ) somit
ein kommutativer Ring mit 1.
P = (X − a1 ) · · · (X − ak ) Q für ein Q ∈ R[X] .

Nachträglich können wir die Elemente r aus R mit den Poly- Insbesondere hat ein Polynom über einem Integritätsbereich
nomen a mit a(0) = r und a(i) = 0 für i > 0 identifizieren. vom Grad n ≥ 0 höchstens n Nullstellen.
Aufgaben 97

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 3.7 • Untersuchen Sie die folgenden inneren Verknüp-


fungen R × R → R auf Assoziativität, Kommutativität und
3.1 •• Sudoku für Mathematiker. Es sei G =
Existenz von neutralen Elementen.
{a, b, c, x, y, z} eine sechselementige Menge mit einer in-
%
neren Verknüpfung · : G × G → G. Vervollständigen Sie die (a) (x, y) → 3 x 3 + y 3 . (b) (x, y) → x + y − x y.
untenstehende Multiplikationstafel unter der Annahme, dass (c) (x, y) → x − y.
(G, ·) eine Gruppe ist.

· a b c x y z 3.8 •• Es seien die Abbildungen f1 , . . . , f6 : R \


a c b {0, 1} → R \ {0, 1} definiert durch:
b x z
c y 1 x−1
f1 (x) = x , f2 (x) = , f3 (x) = ,
x x 1−x x
y 1 x
f4 (x) = , f5 (x) = , f6 (x) = 1 − x .
z a x x x−1

3.2 • Zeigen Sie: In einer Gruppe sind die Gleichungen Zeigen Sie, dass die Menge F = {f1 , f2 , f3 , f4 , f5 , f6 }
x ∗ a = b und a ∗ y = b eindeutig nach x bzw. y auflösbar. mit der inneren Verknüpfung ◦ : (fi , fj ) → fi ◦ fj , wobei
fi ◦ fj (x) = fi (fj (x)), eine Gruppe ist. Stellen Sie eine
3.3 •• Es sei K = {0, 1, a, b} eine Menge mit 4 veschie- Verknüpfungstafel für (F, ◦) auf.
denen Elementen. Füllen Sie die folgenden Tabellen unter der
Annahme aus, dass (K, +, ·) ein Schiefkörper (mit dem neu- 3.9 •• Bestimmen Sie alle Untergruppen von (Z, +).
tralen Element 0 bezüglich + und dem neutralen Element 1
bezüglich ·) ist. Begründen Sie Ihre Wahl.
3.10 •• Verifizieren Sie, dass G = {e, a, b, c} zusam-
+ 0 1 a b · 0 1 a b men mit der durch die Tabelle
0 0 · e a b c
1 1 e e a b c
a a a a e c b
b b b b c e a
c c b a e
3.4 • Kann ein Polynomring K[X] ein Körper sein?
definierten Verknüpfung · : G × G → G eine abelsche
3.5 • In welchen Ringen gilt 1 = 0? Gruppe ist, und geben Sie alle Untergruppen von G an.

Man nennt (G, ·) die Klein’sche Vierergruppe.


Rechenaufgaben
3.6 • Untersuchen Sie die folgenden inneren Verknüp- 3.11 • In Q[X] dividiere man mit Rest:
fungen N × N → N auf Assoziativität, Kommutativität und
Existenz von neutralen Elementen. (a) 2 X4 − 3 X3 − 4 X2 − 5 X + 6 durch X 2 − 3 X + 1.
(b) X 4 − 2 X3 + 4 X2 − 6 X + 8 durch X − 1.
(a) (m, n) → mn .
(b) (m, n) → kgV(m, n).
(c) (m, n) → ggT(m, n). 3.12 •• √ Bestimmen
√ Sie ein Polynom P ∈ Z[X] mit der
(d) (m, n) → m + n + m n. Nullstelle 2 + 3 2.
98 3 Algebraische Strukturen – ein Blick hinter die Rechenregeln

Beweisaufgaben Verknüpfungen + und ·, die für P , Q ∈ R[[X]] wie folgt


erklärt sind:
3.13 •• Es seien U1 und U2 Untergruppen einer Gruppe
G. Zeigen Sie: (P + Q)(m) = P (m) + Q(m) , (P Q)(m)
!
(a) Es ist U1 ∪U2 genau dann eine Untergruppe von G, wenn = P (i) Q(j ) ,
U1 ⊆ U2 oder U2 ⊆ U1 gilt. i+j =m
(b) Aus U1 = G und U2  = G folgt U1 ∪ U2  = G.
(c) Geben Sie ein Beispiel für eine Gruppe G und Unter- ein kommutativer Erweiterungsring mit 1 von R[X] ist –
gruppen U1 , U2 an, sodass U1 ∪ U2 keine Untergruppe der Ring der formalen Potenzreihen oder kürzer Potenz-
von G ist. reihenring über R. Wir schreiben P = i∈N0 ai X i oder

i=0 ai X (also P (i) = ai ) für P ∈ R[[X]] und nennen
i
3.14 •• Es sei G eine Gruppe. Man zeige: die Elemente aus R[[X]] Potenzreihen. Zeigen Sie außer-
(a) Ist die Identität Id der einzige Automorphismus von G, dem:
so ist G abelsch. (a) R[[X]] ist genau dann ein Integritätsbereich, wenn R ein
(b) Ist a → a 2 ein Homomorphismus von G, so ist G Integritätsbereich ist.
abelsch. (b) Eine Potenzreihe P = i∈N0 ai X i ∈ R[[X]] ist genau
(c) Ist a → a −1 ein Automorphismus von G, so ist G dann invertierbar, wenn a0 in R invertierbar ist.
abelsch. (c) Bestimmen Sie in R[[X]] das Inverse von 1 − X und
1 − X2 .
3.15 ••• Es sei R ein kommutativer Ring mit 1. Zeigen
Sie, dass die Menge R[[X]] = {P | P : N0 → R} mit den

Antworten der Selbstfragen

S. 64 des Axioms (G1) lässt sich (b−1 ∗ a −1 ) als eine Lösung der
Addition und Multiplikation ja, denn Summe und Produkt Gleichung x ∗ (a ∗ b) = e bestätigen.
zweier natürlicher Zahlen liegen wieder in N. Hingegen sind
S. 67
Subtraktion und Division keine Verknüpfungen auf N, denn ◦ e f g h i j
z. B. die Differenz 2−3 und der Quotient 2/3 sind keine natür-
e◦ e f g h i j
lichen Zahlen mehr. Die Subtraktion wäre eine Verknüpfung
auf Z, die Division eine auf Q \ {0}. f◦ f e i j g h
g◦ g j e i h f
S. 65 h◦ h i j e f g
∩ und ∪ sind assoziativ, \ nicht, wie das Beispiel
i◦ i h f g j e
({1, 2} \ {1}) \ {2} = ∅, {1, 2} \ ({1} \ {2}) = {2} j◦ j g h f e i

zeigt. Linksneutral hinsichtlich ∩ ist die Gesamtmenge S. 72


{1, 2, 3}; hinsichtlich ∪ ist die leere Menge ∅ linksneutral. Es ist ψ(x + y) = 2(x + y) = 2x + 2y = ψ(x) + ψ(y).
Wegen (M1 ∩ M2 ) ⊆ M2 gibt es nur zur Gesamtmenge ein Daher ist ψ ein Homomorphismus (Z, +) → (Z, +). Dage-
Linksinverses bezüglich ∩. Wegen (M1 ∪ M2 ) ⊇ M2 gibt gen ist ψ(x · y) = 2(x · y) = (2x) · (2y) = 4xy. Daher liegt
es nur zu ∅ ein Linksinverses bezüglich ∪. Die Potenzmenge kein Homomorphismus von (R \ {0}, · ) auf sich vor.
P (M) ist somit für keine der genannten Verknüpfungen eine S. 73
Gruppe. sgn(σ2 ◦σ1 ) = (−1)·(−1) = 1. Ferner ist sgn(σ −1 )·sgn σ =
S. 66 sgn e = 1, sofern mit e das neutrale Element von Sn , also
Beide Seiten der Gleichung b ∗ a = c ∗ a werden von rechts die identische Abbildung bezeichnet ist.
mit dem Inversen a −1 von a multipliziert. S. 75
S. 66 (1) Es gibt die Umkehrabbildung (ψa )−1 = ψa −1 , und
Das inverse Element zu y ist eindeutig. Andererseits ist
ψa (u ∗ v) = a −1 ∗ (u ∗ v) ∗ a
y −1 ∗ y = e . Somit ist y das Inverse zu y −1 .
= a −1 ∗ u ∗ (a ∗ a −1 ) ∗ v ∗ a
S. 66 = (a −1 ∗ u ∗ a) ∗ (a −1 ∗ v ∗ a)
Das inverse Element zu (a ∗ b) ist eindeutig, und mithilfe = ψa (u) ∗ ψa (v).
Antworten der Selbstfragen 99

Bei kommutativem G ist ψa für alle a ∈ G gleich der Iden- S. 84


tität, und jede Untergruppe von G ist ein Normalteiler. Die Relation ≤ ist

(2) Wegen a ∗ U = U ∗ a gibt es für alle u ∈ U ein u ∈ U reflexiv, da für jedes x ∈ K wegen x − x = 0 ∈ P folgt
mit x ≤ x,
ψa (u) = a −1 ∗ u ∗ a = a −1 ∗ a ∗ u = u, antisymmetrisch, da aus x ≤ y und y ≤ x sogleich
y − x, x − y ∈ P folgt, und wegen x − y = −(y − x)
und u → u ist eine Bijektion U → U . Somit ist ψa (U ) = U . bedeutet dies y − x ∈ P ∩ (−P ) = {0}, d. h., x = y,
reflexiv, da aus x ≤ y und y ≤ z zum einen y − x ∈ P
S. 76 und zum anderen z − y ∈ P folgt; wegen P + P ⊆ P
Diese Menge ist nicht abgeschlossen gegenüber ◦, denn das folgt nun (y − x) + (z − y) = z − x ∈ P , d. h., x ≤ z,
Produkt zweier ungerader Permutationen ist gerade. Oder linear, da für alle x, y ∈ K wegen K = P ∪ (−P ) die
noch kürzer: Diese Menge enthält kein neutrales Element. Differenz y − x in P oder in −P liegt, d. h., es gilt x ≤ y
oder y ≤ x.
S. 76
Es gibt die inverse Abbildung f −1 : a ∗ ker ψ → ker ψ mit S. 84
a ∗ x = y → a −1 ∗ y = a −1 ∗ a ∗ x = x. Die Summe 1+1+· · ·+1 kann in einem angeordneten Körper
niemals null werden, da Summen von positiven Elementen
stets positiv sind.
S. 78
−1
2 = 3, denn 2 " 3 = 1 oder einfach 2 · 3 ≡ 1 mod 5.
−1 S. 86
Damit ist umgekehrt 3 = 2, also 2 · 3 ≡ 1 mod 5. Die Abbildung g, die jeder geraden natürlichen Zahl die 0
und jeder ungeraden natürlichen Zahl die 1 zuordnet.
S. 80
Es gibt hinsichtlich der Multiplikation in K kein inverses S. 89
Element zu 0, also kein x ∈ K mit x · 0 = 1, denn nach (ii) Man betrachte etwa die zwei Polynome 1 + X und
ist dieses Produkt stets 0. 1 + X + 0 X 2 . Diese Polynome sind gleich, obwohl m = n.

S. 81 S. 92
Wir rechnen modulo 7. Es ist Weil dann die Gradformel für alle Polynome stimmt.

(4 − 6) · (1 − 6)−1 ≡ 5 · 2−1 ≡ 5 · 4 ≡ 6 (mod 7), S. 95


Dann haben alle Nullstellen die Vielfachheit 1, d. h., das Poly-
nachdem 2 · 4 ≡ 1 (mod 7) ist. nom hat lauter verschiedene Nullstellen.
Zahlbereiche – Basis der
gesamten Mathematik 4
3,
Was ist eine reelle, was ist eine
komplexe Zahl?
141592
86208 653
Worin liegen die Unterschiede
6 4062 99 5 zwischen einer rationalen und
1
7 8 7 2 553953 3 4 4 6 1 228844 8 1 18 6
94081 einer irrationalen Zahl?

8 03 2841027019 7 7
1 6 6 6072602491 75

97 48
7 7 0 9 3 0 3 8 109465 4434 2 8 8 1 2 2 0

2 7 4 5 3 7 8 6 7 80 3 1 6 5 2 7 8 5 8
Warum ist eigentlich
5 3 9 30 3 6 0 0 1 1 3 3 0 5 4 1 2 6
58 3

8 0
4 4 9 4861 17153 2664 09 3

1 8 2 3 2 4 5 8 7605 2 1636 0 6 3 1 1 2 2
0 844609550 2

3 9 1 1 5
2 + 3 = 6?

93 534211 383
30
6 8 7

81932611
2 5 1 1 7938 3 3 6 7 3 3 6 2 47 9 3 1 5
59

4 7 46
530 7 1

7 8 2 54807446237 69 8
6 1 2 31767523846 406
5 03 540 95919 436 2

3 0

238462643
2 0 3 6 9 1 2 2 729737 0851 8 3 0 1 2 1 9

9 9 4 5 1 14 3 0 8 690420 5113 9 4 9 4 9 9 5
0974944

9 8

74
8
3 1 8

78721468
6 2 6 3 7119 6 0 8 6 4 0 3 4 44 4 0 9 8
0 6 66
896 7 4

5 8 4 6 2 4 9 5 394737 4071 4 6 5 4 0 5 9

3 0 2 2 8 1 6 0 9 6 3185 181
7 4 8 437 27577 921 9

2
6 7
6 5 7 7 2 3 5 4 280014 9999 5 6 1 1 9 1 7

1 12 1362 53469 7130 95 6

9 3
0 1

95
8 8 9 7 297 11881 5105 21 7

38752886
1 7 1 3 7283 5 3 7 8 7 5 9 3 75 8 7 5 0
0 8 45

8
5 8 3 6 19 3 87311 7101 97 2

5 4 4 5 0 8 3 8 174728 0056 1 7 1 7 2 6 6

3 8 8 52572010654 519
9 9
9 5 2 5546 92164 5956 00 3

2 2 85

3 9 85
3 87 9590 89957 2019 28 0

91249721
8 0 4 1 3883 8 1 7 5 4 6 3 7 47 7 5 2 8
3 7 7 8 7 8 8 6 519531 5651 5 3 3 8 1 2 6
3
73 8 6

5 3 2 7913 50604 7485 18 2

9 0 9 4 7 1 0 1 819429 649
1 1 8 5 1 6 8 6 117620 3758 5 5 8 8 2 5 3

6 4 25

5 0
62 9

55
0 3 1 5836 46462 6370 90 9

69491293
0 1 2 5 9706 4 0 2 4 7 4 9 6 43 1 3 6 5
8 9 3 1 9 8 9 4 697165 2718 3 7 4 4 7 7 4
3 9
3 2 8 47 5 3 12533 0804 76 7

3 1 98

4 5 8 5 0 3 0 2 8 61829 732
1
82 6 6

9 7 0 2 1 4 1 9 992873 8256 0 4 2 6 2 1 4

5 1 74
6 8
0 0 1 9 4 1 7 2 196340 2192 1 9 9 2 0 0 8

87202755
6 3 3 4 4496 7 2 8 9 0 9 7 7 79 6 0 2 5
7 9 74
43 6
55 4 3

6 5 7 0 8 0 6 6 5 4694 7901 1 9 8 8 4 5 2

5 5 7 136 11573525 727


3 6
0 0 7 9 4 2 5 2 7 8464 1295 5 1 8 1 1 1 8

5 4 081 60 1 8

7 6
32 5

52
1 6 5 5 0 1 4 16 8 6 2 5 7 3 5 6 8 4 6

62099219
8 1 4 8 5453 8 3 8 2 7 9 6 7 92 2 2 1 1
3 3 8 0 7 5 7 4 1082 45 4924 6 8 4 3 6 1 3
6 0
2 23 624 1 72327 1898 85 1

9 4 55

9 7 8 86 269456042 766
91 3 4

3 4 2 7 5 4 1 0 0 9251 0368 8 3 7 8 7 6 2

5 8 41
3 2
4 4 9 8 1 7 3 9 2 97 81 3478 9 6 0 8 6 0 6

84 3643
71917287
8 4 022 61 6 7

9
78 5

46
0 1 123 86 4 8

77
8 5 2 85 7 5 7 3 9 6 2

6
1 5
09 2

6 6
96 1
5

6
4
7 7 62

56 8 4
5 7

18 3
0 504
7 8
5 3 50

88 5

05 9 6
63 6
4
1 0 51

67
0

9
01 8

04 9 0

0 4 94
1 9 5 4 2 7 8 6 2 20391 252
9 7

3 3 7 9 0046 8 0 0 6 4 2 2 5 14 6 6 8 5
49 9

00 7 2

34
4 3

94601653
2 1 96

5 2
4 24 39073941433 147
75 4

8 5 7 9 7971 9 2 1 7 3 2 1 7 28 0 7 4 2
32 7 4
92 2

2 8 53566369 27
2 7 9 69269956909 360
08 9 8
1 2

8 2 0 5 6697 8 2 3 5 4 7 8 1 60 3 8 1 1
1

66024058 47
2 09 134

1 5
2 6 7 5 3 7 9 7 7 47268 240
32 6 6
7
0

7 9 4 5 4111 3 9 0 0 9 8 4 8 88 2 9 5 3
30 9

50695950 35
6 92 575

6 6
9 8 0 82303019520 766
6

84 5 0
9

00 3

2 14 66130019278 904
0 5 2 73035982534 850
5 3 5 1 8273 0 8 2 5 3 3 4 4 69 9 9 9
14 5

92 07211349
2

7 68 710 81
5 2 50792279 27
2 2 2 7 1452635608 798

7
8

1 7 4 47371907021 527
5 3

8 1 9 4 195516 7 3 5 1 8 835370 5 7 22 8 0
3 9
5

19 748 16094
6 2
96
1 1 0 9 1 48 1 5 2 0 9 2606 9 2 3 48 9
1

2 0 56485 4
3 9 5 1 4 8505 5 9 6 4 4 6 2 2 93 0 6 6
9 86513282 028
939 8419716

4.1 Der Körper der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102


4.2 Anordnungsaxiome für die reellen Zahlen . . . . . . . . . . . . . . . . . 106
4.3 Ein Vollständigkeitsaxiom für die reellen Zahlen . . . . . . . . . . . . 114
4.4 Natürliche Zahlen und vollständige Induktion . . . . . . . . . . . . . . 117
4.5 Ganze Zahlen und rationale Zahlen . . . . . . . . . . . . . . . . . . . . . . . 127
4.6 Komplexe Zahlen: Ihre Arithmetik und Geometrie . . . . . . . . . . . 134
4.7 Vertiefung: Konstruktiver Aufbau der reellen Zahlen . . . . . . . . 148
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
102 4 Zahlbereiche – Basis der gesamten Mathematik

Zahlen stellen eine wichtige Grundlage der gesamten Mathe- Geläufig sind die Darstellungen reeller Zahlen durch Dezi-
matik, speziell aber der Analysis dar. malzahlen,
Man kann den Standpunkt von R. Dedekind und L. Kronecker 1/2 = 0.500000000000000000 . . .
einnehmen und die reellen Zahlen ausgehend von den na- 1/7 = 0.142857142857142857 . . .
türlichen Zahlen über die ganzen und die rationalen Zahlen √
2 = 1.414213562373095049 . . .
konstruieren. Doch stellt sich gleich die Frage: „Was ist eine
natürliche Zahl?“. Nach dem Vorbild von G. Peano (1889) und π = 3.141592653589793238 . . .
R. Dedekind (1888) lassen sich die natürlichen Zahlen mittels e = 2.718281828459045235 . . .
der sogenannten Peano-Axiome charakterisieren. Aus diesen
Dabei steht π für die Kreiszahl und e für die Euler’sche Zahl.
Grundannahmen leiten sich alle Aussagen über das Rechnen
Man könnte die Menge der reellen Zahlen als die Menge
mit natürlichen Zahlen ab, so wie man es aus der Schule ge-
aller Dezimalzahlen definieren, stößt dabei aber offenkundig
wohnt ist. Mit relativ einfachen algebraischen Mitteln lassen
sofort auf Probleme. Während im Falle von 1/7 die Bedeu-
sich aus den natürlichen Zahlen die ganzen Zahlen und die ra-
tung der Punkte „. . .“ noch erkennbar ist, bleibt unklar, was
tionalen Zahlen konstruieren. Der Übergang von den rationalen
die Punkte bei π und e bedeuten. Bei der Dezimaldarstellung
Zahlen zu den reellen Zahlen erfordert jedoch kompliziertere
von π + e und π · e treten weitere Schwierigkeiten auf.
Begriffsbildungen aus der Analysis bzw. der Algebra.
Die Grundzahl 10 des Dezimalsystems ist zwar kulturhisto-
Wir werden daher hier nicht so vorgehen, sondern den Stand- risch bedeutsam. Aus mathematischer Sicht ist sie jedoch
punkt einnehmen, dass jeder intuitiv weiß, was reelle Zahlen durch keine besondere Eigenschaft ausgezeichnet. Man kann
sind, und die reellen Zahlen axiomatisch einführen. Die natür- jede natürliche Zahl g, die größer oder gleich 2 ist, als Grund-
lichen, die ganzen und die rationalen Zahlen werden wir als zahl für die g-al-Entwicklung reeller Zahlen wählen. Für die
Teilmengen der reelle Zahlen definieren. In dem Vertiefungsab- Darstellung reeller Zahlen im Computer sind besonders die
schnitt 4.7 gehen wir auf den oben skizzierten konstruktiven Grundzahlen g = 2 und g = 16 praktisch. Nach der Beschäf-
Aufbau der reellen Zahlen ausgehend von den Peano-Axiomen tigung mit Reihen gehen wir auf die Darstellung reeller Zah-
für die natürlichen Zahlen ein. len durch g-al-Entwicklungen ein (siehe auch Kapitel 10).

Die reellen Zahlen sind die Basis der Analysis


4.1 Der Körper der reellen Um uns nicht gleich zu Beginn mit den oben geschilder-
Zahlen ten Problemen bei den Dezimalentwicklungen reeller Zahlen
auseinandersetzen zu müssen, wählen wir hier einen axioma-
tischen Zugang zu den reellen Zahlen. Wir setzen dabei ihre
Zahlen – in allen Kulturen schon in einem frühen Stadium Existenz voraus. Es sollte an dieser Stelle bemerkt werden,
zum Zählen und Rechnen verwendet – spielen in unserem dass die Erweiterung und Präzisierung des Zahlbegriffs das
Alltagsleben eine nicht wegzudenkende Rolle. Ob Hausnum- Ergebnis einer fast viertausendjährigen Entwicklung war, die
mern, Telefonnummern, Kontostände, Preise, Zinsen, Zeitan- erst gegen Ende des 19. Jahrhunderts abgeschlossen wurde.
gaben usw., überall sind Zahlen gegenwärtig. Zahlen erregen Unsere Vorgehensweise stellt die historische Entwicklung
selten Emotionen, aber die Verschuldung der Bundesrepublik quasi auf den Kopf.
bringt manche oder manchen zum Nachdenken. „6 Richtige“
im Lotto erregen dagegen freudige Gefühle. Kaum vorstell- Um eine tragfähige Basis für den Aufbau der Analysis zu
bar kleine Zahlen, wie etwa das Planck’sche Wirkungsquan- schaffen, fixieren wir den Begriff der reellen Zahl, indem
tum h = 6.626069... · 10−34 mit der Einheit Joulesekunden wir Axiome für die reellen Zahlen angeben. Dies sind Grund-
spielen in der modernen Physik eine fundamentale Rolle. eigenschaften, die wir als wahr betrachten und nicht weiter
Während nach dem Motto der Schule des Pythagoras (etwa hinterfragen, aus denen sich aber alle weiteren Aussagen über
5. bis 3. Jh. v. Chr.) noch galt: reelle Zahlen ableiten lassen.

„Alles ist Zahl!“, Axiome der reellen Zahlen


Es gibt drei Serien von Axiomen für die reellen Zahlen:
stellte R. Dedekind in seiner fundamentalen Arbeit aus dem
(K) die Körperaxiome
Jahre 1888 die Frage:
(AO) die Anordnungsaxiome
„Was sind und was sollen die Zahlen?“ (V) ein Vollständigkeitsaxiom

Zwei Jahre vorher hatte L. Kronecker auf der Berliner Na- Wir machen dabei die folgende Grundannahme:
turforscherversammlung den Standpunkt vertreten:
Es gibt eine Menge R, die den obigen Axiomen genügt. Wir
„Die ganzen Zahlen hat der liebe Gott gemacht, alles nennen R die Menge der reellen Zahlen. Was das im Ein-
andere ist Menschenwerk.“ zelnen bedeutet, wird im Folgenden erklärt.
4.1 Der Körper der reellen Zahlen 103

Kommentar: Die Frage nach der Existenz bleibt zunächst Genauso verfährt man für die Gleichung a · x = b, wenn
offen! Auch ist an dieser Stelle noch nicht klar, ob es nur eine a = 0 ist. Man ersetzt einfach das Pluszeichen durch ein
Menge gibt, die den obigen Axiomen genügt. Malzeichen und das Inverse der Addition −a durch das In-
verse der Multiplikation a −1 , das wegen der Voraussetzung
Statt „a ist eine reelle Zahl‘‘ schreiben wir „a ∈ R“ und a = 0 existiert. Auch wird das neutrale Element der Addition
sagen „a ist Element von R‘‘. 0 durch das neutrale Element der Multiplikation 1 ersetzt. 

Die Körperaxiome begründen das Rechnen


Aus den Axiomen lassen sich alle weiteren
Wir beginnen mit den Grundeigenschaften, die zur Begrün- Rechenregeln ableiten
dung des Rechnens, d. h. der Addition, der Subtraktion, der
Multiplikation und der Division, ausreichen. In den Axiomen
Da bereits in Abschnitt 3.3 ähnliche Überlegungen behandelt
kommen nur Addition und Multiplikation vor, Subtraktion
wurden, vergleiche man die folgenden Ausführungen damit.
und Division werden aus diesen abgeleitet.
Die in der Übersichtsbox auf Seite 104 aufgeführten Kör- Folgerung
peraxiome (K) besagen, dass die reellen Zahlen R mit den Für alle a ∈ R gilt −(−a) = a.
Verknüpfungen der Addition und Multiplikation einen Kör-
per bilden, wenn man darunter eine Menge K versteht, in Beweis: Zum Beweis beachten wir, dass −(−a) die ein-
welcher je zwei Elementen eine Summe a + b und ein Pro- deutig bestimmte Lösung x der Gleichung (−a) + x = 0
dukt a ·b so zugeordnet sind, dass für die Elemente von K die ist. Es gilt weiterhin (−a) + a = 0, und daher folgt die Be-
(A1) bis (A4), (M1) bis (M4) und (D) entsprechenden Regeln hauptung aus der Eindeutigkeit der Lösbarkeit der Gleichung
gelten. Ein Körper ist eine algebraische Struktur, die in Ka- (−a) + x = 0. 

pitel 3 eingeführt wurde. Später werden wir sehen, dass das


System der obigen Axiomen (K), (AO) und (V) die reellen Eine analoge Aussage gilt natürlich auch für die Multipli-
Zahlen im Wesentlichen, d. h. bis auf Isomorphie, eindeutig kation. Da dazu nur das „+“ durch ein „·“ zu ersetzen ist,
festlegt. verläuft auch der Beweis völlig analog.
Erfahrungsgemäß bereitet der Umgang mit Axiomen Stu-
Folgerung
dienanfängern Schwierigkeiten. Wir stellen einige sicher gut
Für alle a ∈ R, a = 0, gilt (a −1 )−1 = a.
bekannte Aussagen vor, um zu sehen, wie sich diese Folge-
rungen aus den Axiomen ergeben. Wir benutzen dabei die
Beweis: Die Zahl x = (a −1 )−1 ist Lösung der Gleichung
eindeutige Lösbarkeit von Gleichungen.
(a −1 )x = 1. Ebenfalls löst x = a diese Gleichung. Daher ist
nach der Eindeutigkeit der Lösung der Gleichung (a −1 )x = 1
Eindeutige Lösbarkeit elementarer Gleichungen wirklich (a −1 )−1 = a. 

Für die Gleichung a + x = b mit reellen Zahlen


a, b existiert genau eine reelle Zahl x, welche diese
Die nächste Folgerung ist ein Ausdruck mit zwei reellen Zah-
Gleichung löst, nämlich x = b + (−a) = b − a.
len und somit etwas komplizierter. Aber auch hier läuft der
Zu je zwei reellen Zahlen a, b, wobei a  = 0 gilt,
Beweis auf ein schlichtes Anwenden der Axiome hinaus.
gibt es genau ein x ∈ R mit ax = b, nämlich x =
a −1 b. Für a −1 b schreiben wir auch den Bruch ab und Folgerung
nennen ihn den Quotienten von b und a. Für alle a, b ∈ R, a, b = 0, gilt (ab)−1 = b−1 a −1 .
Wegen der Vertauschbarkeit von Faktoren (M1) lässt sich
der letzte Ausdruck auch als a −1 b−1 schreiben.
Beweis: Dass x = b +(−a) die Gleichung a +x = b löst,
überprüft man durch Einsetzen: Da die Existenz des inversen Beweis: Die inverse Zahl (ab)−1 ist die eindeutig be-
Elements (−a) gesichert ist, folgt mit dem Kommutativge- stimmte Lösung der Gleichung (ab)x = 1. Andererseits wird
setz: die Gleichung auch von b−1 a −1 gelöst, da (ab)(b−1 a −1 ) =
a +[b+(−a)] = a +b+(−a) = a +(−a)+b = 0+b = b , a(bb−1 )a −1 = aa −1 = 1. Dies zeigt die Identität beider
Zahlen. 

wobei wir noch die Eigenschaft des neutralen Elements 0 zur


Addition genutzt haben. Umgekehrt folgt aus der Gleichung Der folgende Satz von der Nullteilerfreiheit scheint selbstver-
a + x = b durch beidseitiges Addieren von −a die Identität ständlich, ist aber ebenso eine Konsequenz aus den Axiomen.
a +x +(−a) = b +(−a). Mit dem Kommutativgesetz erhält
man für die linke Seite a + x + (−a) = a + (−a) + x = Folgerung (Nullteilerfreiheit der reellen Zahlen)
0 + x = x. Also ist x = b + (−a) die einzige Lösung der Für alle a, b ∈ R gilt ab = 0 genau dann, wenn a = 0 oder
Gleichung. b = 0 ist.
104 4 Zahlbereiche – Basis der gesamten Mathematik

Übersicht: Körperaxiome für die reellen Zahlen


Wir stellen die Körperaxiome aus Kapitel 3 noch einmal ausführlich für die reellen Zahlen zusammen. Je zwei reellen Zahlen a
und b ist genau eine weitere reelle Zahl a + b, die Summe von a und b, und genauso eine weitere reelle Zahl a · b, das Produkt
von a und b, zugeordnet. Diese Zuordnungen heißen Addition und Multiplikation, und sie erfüllen die zusammengestellten
Eigenschaften.

(A1) Für alle a, b ∈ R gilt a + b = b + a. Kommutativgesetz


bezüglich „+“

(A2) Für alle a, b, c ∈ R gilt (a + b) + c = a + (b + c). Assoziativgesetz


bezüglich „+“

(A3) Es gibt eine Zahl 0 ∈ R, sodass a + 0 = a für alle a ∈ R gilt. Existenz eines neutralen
Elements bezüglich „+“

(A4) Zu jedem a ∈ R gibt es eine Zahl (−a) ∈ R mit a + (−a) = 0. Existenz eines inversen
Elements bezüglich „+“

(M1) Für alle a, b ∈ R gilt a · b = b · a. Kommutativgesetz


bezüglich „·“

(M2) Für alle a, b, c ∈ R gilt (a · b) · c = a · (b · c). Assoziativgesetz


bezüglich „·“

(M3) Es gibt eine Zahl 1 ∈ R (1  = 0), sodass a · 1 = a für alle a ∈ R gilt. Existenz eines neutralen
Elements bezüglich „·“

(M4) Zu jedem a ∈ R (a  = 0) gibt es ein a −1 ∈ R, für das a · (a −1 ) = 1 gilt. Existenz eines inversen
Elementes bezüglich „·“

(D) Für alle a, b, c ∈ R gilt a · (b + c) = (a · b) + (a · c). Distributivgesetz

Die Axiome (A1) bis (A4) besagen, dass die reellen Zah- bestimmt. Geläufige Rechenregeln, wie (−a)(−b) = ab,
len R bezüglich der Addition eine abelsche Gruppe (mit speziell (−1)(−1) = 1 oder (a − b)(a + b) = a 2 − b2
dem neutralen Element 0) bilden. Mit (M1) bis (M4) sind lassen sich aus den obigen Axiomen ableiten. Zur Ver-
die von Null verschiedenen Elemente aus R eine abelsche einfachung der Schreibweise notieren wir statt a · b oft
Gruppe (mit dem neutralen Element 1  = 0) bezüglich der einfach ab und halten uns an die Regel Punktrechnung
Multiplikation. Beide Verknüpfungen sind über das Dis- geht vor Strichrechnung. Diese Vorfahrtsregel erspart uns
tributivgesetz (D) miteinander verbunden. Die neutralen viele Klammern. Das Distributivgesetz schreibt sich dann
Elemente 0 bzw. 1 sowie die inversen Elemente (−a) bzw. so:
a −1 sind wie in jeder abelschen Gruppe jeweils eindeutig a(b + c) = ab + ac .

Beweis: Wie auf Seite 81 bereits gesehen, folgt mit b = 0 Algebraische Strukturen, in denen der Nullteilersatz nicht
aus gilt, wurden in Kapitel 3 angesprochen. Ein Beispiel ist der
a · 0 = a · (0 + 0) = a · 0 + a · 0 Restklassenring Z6 , in dem 2 · 3 = 6 = 0 gilt, wobei aber
und der eindeutigen Lösbarkeit der Gleichung a·0+x = a·0, 2 = 0 und 3 = 0 sind. Wir werden weitere wichtige Bei-
dass a · 0 = 0 ist. Genauso gilt für a = 0 die Gleichung spiele, wie den Ring der stetigen Funktionen auf R (siehe
0 · b = 0. Kap. 9) oder der Ring der n × n-Matrizen für n ≥ 2 (siehe
Seite 445 in Kap. 12) kennenlernen, für welche das Pro-
Sei umgekehrt a · b = 0. Dann ist zu zeigen: a = 0 oder dukt von zwei vom Nullelement verschiedenen Elementen
b = 0. Wäre b = 0, dann braucht nichts bewiesen werden. das Nullelement ergibt.
Also nehmen wir b = 0 an. Nach Axiom M4 existiert das
Inverse b−1 , und es folgt:
0 = (a · b) · b−1 = a(b · b−1 ) = a · 1 = a. 
4.1 Der Körper der reellen Zahlen 105

? ?
Beweisen Sie Beweisen Sie noch den zweiten Teil der ersten Aussage, dass
(−1)(−1) = 1, für jedes x ∈ R mit x = 0 und a, b ∈ R, b = 0 die Gleichung
indem Sie von 1 + (−1) = 0 ausgehen. Können Sie das a ax
Ergebnis auf =
b bx
(−a)(−b) = ab
gilt.
für a, b ∈ R verallgemeinern?

Als letztes Beispiel betrachten wir noch einen komplizier-


teren aber wohlbekannten mathematischen Ausdruck, einen
Die Regeln der Bruchrechnung folgen aus den Spezialfall der binomischen Formeln. Wie üblich nutzen wir
Körperaxiomen die Notationen 2 = 1 + 1 und x 2 = xx für x ∈ R.

Ein weiteres Beispiel für die Anwendung der Axiome ist die Folgerung
für das Rechnen mit Zahlen grundlegende Bruchrechnung. Für alle a, b ∈ R gilt die binomische Formel

Folgerung (a + b)2 = a 2 + 2ab + b2 .


Für alle a, b, c, d ∈ R, b  = 0, d  = 0 gilt:
Erweitern und Kürzen Beweis: Wir geben in jedem Beweisschritt die verwende-
a c ax a ten Axiome kurz ohne weitere Kommentierung an.
= ⇔ ad = bc und für 0  = x ∈ R : = .
b d bx b
(a + b)2 = (a + b)(a + b) nach Def.
Addieren bzw. Subtrahieren von Brüchen = (a + b)a + (a + b)b nach (D)
a c ad ± bc = a(a + b) + b(a + b) nach (M1)
± = .
b d bd = (aa + ab) + (ba + bb) nach (D)
Für b = d muss man die Erweiterung nicht durchführen. = ((aa + ab) + ba) + bb nach (A2)
Im Fall b = d wird bd der gemeinsame Nenner genannt. = (aa + (ab + ab)) + bb nach (A2), (M1)
= (aa + (ab · 1 + ab · 1)) + bb nach (M3)
Multiplizieren von Brüchen
= (aa + ab(1 + 1)) + bb nach (M3), (D)
a c ac = aa + (1 + 1)ab + bb
· = . nach (M1)
b d bd
= a 2 + 2ab + b2 nach Def.

Division von Brüchen, d. h. Doppelbrüche
a
b ad Im weiteren Verlauf des Kapitels werden wir die Körper-
Ist zusätzlich c  = 0, dann gilt c = .
d bc axiome häufig ohne großen Kommentar verwenden. Dies
sollte Sie jedoch nicht dazu verleiten, schnell darüber hin-
wegzugehen. Die mathematische Fachsprache kann sehr kurz
Beweis: Exemplarisch beweisen wir die erste Aussage.
und prägnant sein, sie ist aber gerade deswegen auch kompli-
Zunächst zeigen wir die Hinrichtung. Multiplizieren wir die ziert. Machen Sie sich daher als kleine Übung jeden Schritt
linke Gleichung mit bd, dann erhalten wir mit der Kommu- im vorangegangenen Beweis klar!
tativität die folgenden Äquivalenzen:
Wenn auch bis jetzt nur Altbekanntes – wie z. B. die Vorzei-
−1 −1 chenregeln, ein Spezialfall der binomischen Formel oder die
(ab )(bd) = (cd )(bd)
−1 Regeln der Bruchrechnung – herausgekommen ist, hat die
⇔ a(b b)d = c(d −1 d)b axiomatische Methode den Vorteil, dass die aus den Körper-
⇔ a·1·d =c·1·b axiomen abgeleiteten Regeln für alle Körper gelten.
⇔ ad = cb . Davon gibt es – wie schon bemerkt – sehr viele, z. B. bilden
die rationalen Zahlen oder die komplexen Zahlen Körper be-
Für die Rückrichtung gilt nach Division der Gleichung züglich der jeweils dort definierten Operationen der Addition
ad = bc durch bd = 0 die Gleichung: und der Multiplikation.
ad bc a c Im dritten Kapitel ist uns schon ein „skurriler“ Körper mit
= oder = . 
bd bd b d nur zwei Elementen 0̄ und 1̄ begegnet. Wir erinnern an die
106 4 Zahlbereiche – Basis der gesamten Mathematik

Additions- und Multiplikationstabelle dieses Körpers Z2 : Ordnungsrelationen auf den reellen Zahlen

+ 0̄ 1̄ · 0̄ 1̄ Man definiert für a, b ∈ R die Relationen


a < b bzw. b > a genau dann, wenn b − a ∈ R>0
0̄ 0̄ 1̄ 0̄ 0̄ 0̄ ist, und
1̄ 1̄ 0̄ 1̄ 0̄ 1̄ a ≤ b bzw. b ≥ a genau dann, wenn a < b oder
a = b gilt.
In der Literatur findet man statt Z2 auch die Bezeichnungen
F2 , Z/2Z oder GF(2), wobei GF für Galois Field steht. Dieser
Körper ist das einfachste Beispiel aus der Serie der Restklas- Im ersten Fall sagen wir a kleiner b bzw. b größer a und
senringe Z/p Z, p prim, die jeweils Beispiele für Körper mit im zweiten Fall a kleinergleich b bzw. b größergleich a.
p Elementen sind (siehe Abschnitt 3.3). Beziehungen der Form

Dass auch in R die Gleichung a<b oder a ≤ b

nennt man Ungleichungen oder in manchen Zusammenhän-


1+1=0
gen auch Abschätzungen.
gilt, können wir bisher nicht ausschließen. Erst mit den An-
ordnungsaxiomen wird sich ergeben, dass in R diese Glei-
Die Relation „<“ ist transitiv und
chung nicht erfüllt sein kann.
translationsinvariant

Einige zentrale Eigenschaften dieser Relationen stellen wir


4.2 Die Anordnungsaxiome für zusammen und geben ausführliche Begründungen, wie diese
aus den Axiomen folgen.
die reellen Zahlen
Folgerung (Trichotomiegesetz)
Die Anordnungsaxiome, welchen wir uns nun zuwenden Für je zwei reelle Zahlen a, b gilt genau eine der drei
wollen, stellen die Grundlage für das Rechnen mit Unglei- Aussagen:
chungen und für Abschätzungen dar.
a < b oder a = b oder a > b.

Ungleichungen sind in der Analysis Beweis: Man muss nur die Definition einsetzen:
mindestens so wichtig, wie Gleichungen
a < b bedeutet b − a ∈ R>0 ,
in der Algebra a = b bedeutet b − a = 0,
a > b bedeutet a − b = −(b − a) ∈ R>0 .
Im dritten Kapitel auf Seite 84 wurde der Begriff des an-
geordneten Körpers eingeführt. Die reellen Zahlen bilden Nach (AO1 ) tritt für die reelle Zahl b − a genau eine dieser
einen angeordneten Körper, d. h., in R ist eine Teilmenge Fälle ein. 

R>0 , die positiven Zahlen, ausgezeichnet, sodass folgende


Axiome gelten. Für Ungleichungsketten ist die nächste Folgerung von ent-
scheidender Bedeutung.
Anordnungsaxiome der reellen Zahlen
(AO1 ) Für jede reelle Zahl a gilt genau eine der Aus- Folgerung (Transitivität)
sagen: Für beliebige Zahlen a, b, c ∈ R gilt, dass aus a < b
und b < c die Ungleichung a < c folgt.
a ∈ R>0 oder a = 0 oder (−a) ∈ R>0 .
Beweis: Aus a < b, d. h., b − a ∈ R>0 und b < c, d. h.,
(AO2 ) Für beliebige a, b ∈ R>0 gilt a + b ∈ R>0 . c −b ∈ R>0 folgt nach (AO2 ) sofort (c −b)+(b −a) ∈ R>0 .
(AO3 ) Für beliebige a, b ∈ R>0 gilt a · b ∈ R>0 . Damit ist (c − a) ∈ R>0 , und es gilt a < c. 

Statt „a ∈ R>0 “ sagen wir auch, dass a positiv ist und ver-
wenden dafür die Abkürzung a > 0. Ist −a ∈ R>0 , dann Gleichsinnige Ungleichungen darf man
heißt a negativ . Wir schreiben kurz a < 0.
addieren
Eine reelle Zahl ist nach (AO1 ) entweder positiv oder negativ
oder gleich null. Durch Auszeichnung der positiven reellen Natürlich sollten sich die Anordnungsaxiome mit denen der
Zahlen kann man nun zwei reelle Zahlen der Größe nach Addition und der Multiplikation vertragen. Dies wird im Fol-
vergleichen. genden nachgewiesen. Wir beginnen mit der Addition.
4.2 Die Anordnungsaxiome für die reellen Zahlen 107

Folgerung (Translationsinvarianz) Die fünfte Aussage folgt durch zweimaliges Anwenden der
Für a, b, c, d ∈ R gilt, dass aus a < b und c ≤ d ersten Aussage. Man setzt zuerst c = a −1 = a1 und erhält
die Ungleichung a + c < b + d folgt: a · a1 < b · a1 bzw. 1 < ab . Nun wendet man mit c = b−1 = b1
Insbesondere ergibt sich aus a < b für c ∈ R: die erste Aussage erneut an und erhält 1 · b1 < ab · b1 . Diese
Ungleichung ist identisch mit b1 < a1 . 
a+c <b+c

Beweis: Wir behandeln zunächst den Fall c < d. Es gelten


dann (b − a) ∈ R>0 und (d − c) ∈ R>0 . Nach (AO2 ) ist auch Beim Invertieren von positiven reellen Zahlen
(b − a) + (d − c) ∈ R>0 . Da aber dreht sich das <-Zeichen der Ungleichung um
(b − a) + (d − c) = b + d − (a + c) Mit der Umkehrung der letzten der obigen Aussagen kann
man sagen, dass sich beim Invertieren von positiven reellen
gilt, folgt a + c < b + d. Für c = d schließt man analog:
Zahlen das „<“-Zeichen in der Ungleichung umdreht. Wir
Die Ungleichung a + c < b + c ist gleichbedeutend mit
beweisen diese Aussage, indem wir diese Umkehrung zeigen.
(b + c) − (a + c) ∈ R>0 , und es ergibt sich:

(b + c) − (a + c) = (b − a) + (c − c) = (b − a) + 0 Folgerung
1 1
Ist ab > 0, so gilt a < b genau dann, wenn < ist.
= b − a ∈ R>0 .  b a

Beweis: Als Hilfsgröße betrachten wir


Ein wenig mehr müssen wir aufpassen, wenn wir die Ver-
träglichkeit mit der Multiplikation untersuchen. 1 1 b−a
− = .
a b ab
Folgerung (Verträglichkeit mit der Multiplikation)
Für beliebige a, b, c ∈ R mit c  = 0 gelten folgende „⇐‘‘: Ist a < b, dann ist b − a > 0. Weiter ist nach Voraus-
Aussagen: setzung (ab)−1 > 0. Der rechte Bruch ist somit positiv, und
es gilt:
Aus a < b und c > 0 folgt ac < bc. 1 1 1 1
Aus a < b und c < 0 folgt ac > bc. − > 0 oder < .
a b b a
Aus 0 ≤ a < b und 0 ≤ c < d folgt 0 ≤ ac < bd.
a > 0 ist gleichbedeutend mit a −1 > 0. „⇒‘‘: Ist die linke Seite positiv, so muss wegen ab > 0 auch
Aus 0 < a < b folgt 0 < b1 < a1 . b − a > 0 gelten, und es ist a < b. 

Beweis: Für die erste Aussage sei c > 0. Dann ist zu In Kapitel 9 werden wir hierfür sagen, dass die Funk-
zeigen, dass aus a < b die Ungleichung ac < bc bzw. tion f : R>0 → R mit f (x) = x1 streng monoton fällt,
bc − ac ∈ R>0 folgt. da für wachsendes x die Kehrwerte immer kleiner werden
(Abb. 4.1).
Setzen wir a < b, d. h. b − a ∈ R>0 voraus. Mit (AO3 ) folgt
für c > 0 auch (b − a)c ∈ R>0 . Der Ausdruck (b − a)c ist f (x)
nach (D) identisch zu bc − ac. Also gilt bc − ac ∈ R>0 , d. h.
ac < bc. 7

Der Beweis der zweiten Aussage verläuft analog. 6


Die dritte Aussage folgt aus der ersten Aussage. Mit a < b
5
gilt auch ac < bc. Beachten wir, dass mit dem ersten Teil
bc < bd ist, nur dass hier der Ausdruck c < d mit b erweitert 4
wird, so gilt ac < bc < bd und somit auch ac < bd.
Für die vierte Aussage folgern wir mit dem Nullteilersatz 3
aus a > 0, dass a −1  = 0 gilt, da a · a −1 = 1  = 0 ist.
2
Wäre a −1 = a1 < 0, dann folgt aa −1 = 1 < 0, was im 1
f (x) =
Widerspruch zur Aussage 1 = 12 > 0 steht, die aus (AO3 ) 1 x

folgt. Also ist a −1 = a1 > 0.


Die Umkehrung a −1 > 0 impliziert a > 0 gilt natürlich 0 1 2 3 4 5 6 7 x
auch. Man verwendet den gleichen Schluss und beachtet
Abbildung 4.1 Die durch f : (0, ∞) → (0, ∞), f (x) = 1/x gegebene
(a −1 )−1 = a. Ungleichungen zwischen nicht negativen Zah- Hyperbel ist ein Beispiel einer Abbildung, die mit wachsendem x streng monoton
len darf man also multiplizieren. fällt.
108 4 Zahlbereiche – Basis der gesamten Mathematik

? Diese Eigenschaft wird häufig verwendet, um die Gleichheit


Weisen Sie nach, dass bei Ungleichungen zwischen positiven zweier reeller Zahlen zu zeigen.
Zahlen das Quadrieren und das Wurzelziehen die Relation
erhalten bleibt, d. h., für a, b ∈ R>0 ist Beispiel Sei M ⊆ R eine nichtleere und nach oben be-
schränkte Teilmenge von R, d. h., es gibt eine Konstante
a < b ⇔ a 2 < b2 . c > 0 mit x ≤ c für alle x ∈ M. Die kleinste mögliche
obere Schranke wird Supremum genannt. Eine Definition des
Supremums werden wir auf Seite 114 betrachten. Hier wol-
Wie Ihnen bereits bekannt sein wird, dreht sich beim Mul- len wir zeigen, dass diese reelle Zahl s = sup M eindeutig
tiplizieren einer Ungleichung mit einer negativen Zahl das bestimmt ist.
„<“-Zeichen um. Man nennt dieses Verhalten die Spiege-
lungseigenschaft, die wir ebenfalls aus den Axiomen ablei- Für den Beweis der Aussage nutzen wir die Antisymmetrie
ten. aus. Ist &
s ∈ R ebenfalls kleinste obere Schranke der Menge
M. Dann gilt & s ≤ s, da &s eine kleinste obere Schranke und s
Folgerung (Spiegelungseigenschaft) auch eine obere Schranke ist. Andererseits ist auch s klein-
Für a, b ∈ R gilt a < b genau dann, wenn −a > −b. ste obere Schranke, und so muss s ≤ & s gelten. Insgesamt
folgt s = &s, d. h., die kleinste obere Schranke ist eindeutig
Beweis: Aus a < b folgt nach Addition von −2a auf bestimmt. 
beiden Seiten −a < b − 2a. Wegen a < b ist aber
b − 2a < b − 2b = −b. Die folgende Aussage zeigt eine erste Grenze der Lösbarkeit
von Gleichungen in den reellen Zahlen auf.
Die Rückrichtung erhalten Sie, wenn Sie auf beiden Sei-
ten der Gleichung −a > −b die Zahl b + a addieren. Es Beispiel Für a ∈ R mit a = 0 ist auch a 2 > 0, insbeson-
ist −a + (b + a) > −b + (b + a), und nach Weglas- dere ist 1 = 12 > 0, und mit −1 < 0 folgt −1 = x 2 für alle
sen der Klammern und Umsortieren der einzelnen Summan- x ∈ R.
den, was wegen der Kommutativität möglich ist, erhält man
Den ersten Teil des Arguments, dass a 2 > 0 ist, müssen wir
(−a + a) + b > (−b + b) + a. Dies bedeutet b > a bzw.
noch begründen. Ist a > 0, so folgt a 2 > 0 nach (AO3 ).
a < b. 
Ist hingegen a < 0, so ist (−a) > 0, und deswegen gilt
(−a)(−a) > 0. Damit erhalten wir
Die Menge R der reellen Zahlen lässt sich als die Punkte
auf einer Geraden veranschaulichen, auf der zwei verschie- a 2 = aa = −(−(aa)) = −(a(−a)) = (−a)(−a) > 0 . 
dene Punkte 0 und 1 als Wahl eines Ursprungs bzw. Null-
punkts und als Maßeinheit markiert sind. Dabei liegt übli- Der letzte Teil der Aussage zeigt, dass die Gleichung
cherweise 1 rechts von 0, sodass die positiven Zahlen rechts x 2 + 1 = 0 keine reelle Lösung x ∈ R besitzen kann. Die
vom Nullpunkt, die negativen links davon sind. Von zwei komplexen Zahlen, mit denen wir uns am Ende des Kapi-
Zahlen ist diejenige größer, die weiter rechts liegt. Addition tels beschäftigen werden, liefern eine Erweiterung der reellen
einer Zahl bedeutet eine Verschiebung, eine Translation. Der Zahlen, in der auch diese Gleichung lösbar wird. Beim Über-
Übergang von a zu −a bedeutet eine Spiegelung am Null- gang von den reellen zu den komplexen Zahlen lassen sich
punkt (Abb. 4.2). allerdings die Anordnungseigenschaften nicht mehr beibe-
−b −a 0 1 a b halten. Auch der endliche Körper Z2 , an den wir im vorange-
q q a a q q gangenen Abschnitt erinnert haben, lässt sich nicht anordnen.
Wegen 1̄ = 0̄ müsste die Alternative 0̄ < 1̄ oder 1̄ < 0̄ gel-
Abbildung 4.2 Diese Skizze veranschaulicht die Spiegelung am Nullpunkt, bei
der die „<“-Relation (a < b) zur „>“-Relation (−a > −b) wird. ten. Durch Addition von 1̄ zur linken Ungleichung folgt aber
1̄ = 0̄ + 1̄ < 1̄ + 1̄ = 0̄. Dies ist ein Widerspruch, da nicht
gleichzeitig 0̄ < 1̄ und 1̄ < 0̄ gelten kann. Völlig analog
Mit Antisymmetrie lässt sich Gleichheit schließt man den Fall 1̄ < 0̄ aus.
beweisen Erst mit den Anordnungsaxiomen zeigt sich, dass R mehr
Zahlen als nur die Zahlen 0 und 1 enthält, denn definiert man
Eine besonders wichtige Eigenschaft der „≤“-Relation bei 2 = 1 + 1, 3 = 2 + 1, . . . , so folgt 0 < 1, 1 < 1 + 1 = 2,
reellen Zahlen a, b ∈ R ist die Antisymmetrie : 2 = 1 + 1 < 2 + 1 = 3, etc. Wir finden so sogar unendlich
viele Elemente in dieser Menge. Der Begriff der unendlichen
Aus a ≤ b und b ≤ a folgt a = b. Menge wurde auf Seite 121 eingeführt (siehe auch Seite 122).

? R hat unendlich viele Elemente


Können Sie mit dem Tipp, das Trichotomiegesetz zu verwen- R enthält mindestens alle Zahlen, die man durch sukzes-
den, die Aussage beweisen? sive Addition von 1 zu 0 erhält.
4.2 Die Anordnungsaxiome für die reellen Zahlen 109

Kommentar: Wegen 1  = 0 und 1 = 12 gilt stets 1 + 1 + Sind a, b ≥ 0, so können wir hierfür unter der Verwendung
. . . + 1 > 0. R hat deswegen die Charakteristik null (siehe der Existenz von Quadratwurzeln aus nicht negativen Zahlen
Abschnitt 3.3). (vgl. Existenzsatz für Quadratwurzeln auf Seite 115) auch
√ a+b
Gelegentlich werden wir auch Ungleichungen verketten. G(a, b) = ab ≤ = A(a, b)
2
Statt a ≤ b ∧ b ≤ c schreiben wir kurz a ≤ b ≤ c. Glei-
ches gilt für die <-Relation; wir notieren beispielsweise für schreiben und erhalten eine Abschätzung zwischen dem geo-
0 < x ∧ x < 1 einfach 0 < x < 1. metrischem Mittel, G(a, b), und dem arithmetischem Mittel
A(a, b).

Achtung: Nur gleichsinnige Ungleichungen lassen sich


so verketten. Bei längeren Umformungen, die Ungleichun- Ungleichungen helfen beim Abschätzen von
gen enthalten, sollte man diese als Kette lesen, da man sonst
Fehlern
schnell zu falschen Ergebnissen kommt.
Häufig verwendet man in physikalischen Anwendungen Nä-
herungswerte und steht dann vor dem Problem, den relativen
Fehler bezogen auf den wahren Wert oder den Näherungs-
Aus den Anordnungsaxiomen ergeben sich
wert abzuschätzen.
wichtige Ungleichungen
Beispiel Für kleines x wird anstelle des Ausdrucks
Mit der folgenden Ungleichung ist garantiert, dass zwischen 1
zwei verschiedenen reellen Zahlen stets weitere reelle Zahlen y= häufig der Näherungswert
1+x
liegen.
y0 = 1 − x
Lemma (arithmetisches Mittel)
Für alle a, b ∈ R mit a < b gilt: verwendet. Für die Differenz

a+b 1 1 − x2 1 x2
a< <b. y0 − y = 1 − x − = − =−
2 1+x 1+x 1+x 1+x

Die Zahl a+b


heißt das arithmetische Mittel von a und b. gilt für alle x > −1 die Ungleichung:
2

y0 − y ≤ 0 .
Beweis: Aus a < b folgt a + a < a + b und a + b < b + b
1 1
also auch Für alle x ∈ R mit − 10 ≤x≤ 10 gilt:
a +a < a +b < b+b.
1
100 1
Damit ist 0 ≥ y0 − y ≥ − 1
=− .
a(1 + 1) < a + b < b(1 + 1) 1− 10
90

bzw. mit 2 = 1 + 1 > 0 Der relative Fehler bezogen auf den wahren Wert y ist für
alle x ∈ R
a+b y0 − y
a< < b.  = −x 2 ≤ 0 ,
2 y
1 1
und für alle x ∈ R mit − 10 ≤x≤ 10 gilt:
Eine weitere wichtige Ungleichung für a, b ∈ R ergibt sich
aus y0 − y 1
≥− . 
y 100
0 ≤ (a − b)2 = a 2 − 2ab + b2 bzw. 2ab ≤ a 2 + b2

und damit ist


a 2 + b2
ab ≤ .
2 Das Fundamental-Lemma hilft, Sätze über
Addiert man in der mittleren der drei Ungleichungen auf bei- Grenzwerte zu beweisen
den Seiten 2ab, folgt:
' (2 Das folgende Prinzip, das manchmal Fundamental-Lemma
2 2 2 a+b der Analysis genannt wird, hat in der Grenzwerttheorie zahl-
4ab ≤ a +2ab +b = (a +b) oder ab ≤ .
2 reiche Anwendungen.
110 4 Zahlbereiche – Basis der gesamten Mathematik

Fundamental-Lemma der Analysis Die Bezeichnungen „abgeschlossenes“, „offenes“, . . . , In-


tervall sind im Augenblick nur Namen. In Kapitel 9 werden
Ist a ∈ R, und gilt für jede positive reelle Zahl ε die
Begründungen für diese Bezeichnungen gegeben. In den er-
Ungleichung
sten sechs Fällen heißt  = b − a die Länge des jeweiligen
a ≤ ε,
Intervalls.
dann gilt a ≤ 0. Ist zusätzlich a ≥ 0, dann muss a = 0
sein. Die häufig vorkommenden Intervalle [0, ∞) bzw. (0, ∞)
werden auch mit R≥0 bzw. R>0 bezeichnet.

Angaben wie 3.14 < π < 3.15 oder 1.414 < 2 <√1.415
Beweis: Wir führen einen klassischen Widerspruchsbe-
a bedeuten, dass π im Intervall (3.14, 3.15) bzw. dass 2 im
weis. Wir nehmen an, dass a > 0 gilt, dann ist ε = eben- Intervall (1.414, 1.415) liegt. Der Unterschied zwischen dem
2
falls positiv und eine zulässige Wahl. Da die Ungleichung abgeschlossenen Intervall [a, b] und dem offenen Intervall
a ≤ ε für alle positiven Zahlen ε > 0 gilt, ist sie insbeson- (a, b) besteht darin, dass im ersten Fall die beiden Rand-
dere auch für ε = a2 erfüllt und damit 2a ≤ a oder a ≤ 0 im punkte a und b zum Intervall gehören, im zweiten Fall aber
Widerspruch zur Annahme a > 0.  nicht zum Intervall gerechnet werden.

?
Mithilfe der Anordnung der reellen Zahlen lassen sich wich- Warum ist die Vereinigung von zwei Intervallen i.A. kein
tige Teilmengen von R definieren, die Intervalle. Die meisten Intervall?
reellen Funktionen, die wir später betrachten werden, haben
Intervalle als Definitionsbereich, oder die Definitionsberei-
che setzen sich aus Intervallen zusammen.

Der Betrag ignoriert das Vorzeichen einer


Bei Intervallen unterscheidet man bis zu elf reellen Zahl
verschiedene Typen
Mithilfe der Anordnung von R können wir einen wichtigen
Jede der in der folgenden Liste aufgeführten Teilmengen von Begriff der Analysis einführen, den Betrag. Gleichzeitig er-
R heißt Intervall . halten wir ein Beispiel für eine wichtige Abbildung.

Abgeschlossene Intervalle
Der Betrag einer reellen Zahl
1. Für a, b ∈ R mit a < b sei [a, b] = {x ∈ R | a ≤ x ≤ Ist a ∈ R, so heißt die Zahl
b}.

2. Für a = b sei [a, a] = {a}. ⎨ a, falls a > 0 ,
|a| = 0, falls a = 0 ,
Offene Intervalle ⎩
−a, falls a < 0
3. (a, b) = {x ∈ R | a < x < b} (mit a < b)
der Betrag von a.
4. Im Fall a = b ist (a, a) = ∅, wir fassen die leere Menge
also auch als Intervall auf.

Halboffene Intervalle Ordnet man jeder reellen Zahl x ihren Betrag |x| zu, erhält
man eine Funktion | | : R → R≥0 mit x → |x|, deren
5. [a, b) = {x ∈ R | a ≤ x < b} Graph in der Abbildung 4.3 gezeigt ist.
6. (a, b] = {x ∈ R | a < x ≤ b}

Abgeschlossene Halbstrahlen
f (x)
7. [a, ∞) = {x ∈ R | x ≥ a}
8. (−∞, b] = {x ∈ R | x ≤ b} 2

Offene Halbstrahlen f (x) = |x|


1
9. (a, ∞) = {x ∈ R | x > a}
10. (−∞, b) = {x ∈ R | x < b}
−2 −1 0 1 2 x
Die Zahlengerade
Abbildung 4.3 Der Graph der Betragsfunktion || : R → R≥0 , x → |x|, die
11. (−∞, ∞) = R. das Vorzeichen einer reellen Zahl ignoriert.
4.2 Die Anordnungsaxiome für die reellen Zahlen 111

? Der Betrag einer Zahl ist nach den ersten beiden Regeln nie
Zeigen Sie, dass für alle a ∈ R die Gleichheit |a| = | − a| negativ und genau dann gleich null, wenn a = 0 ist. Die dritte
gilt. Regel besagt, dass der Betrag eines Produkts gleich dem Pro-
dukt der Beträge ist. Definiert man als Abstand von a, b ∈ R
die Zahl d(a, b) = |a − b|, dann besagt die Dreiecksunglei-
Der Betrag ignoriert das Vorzeichen einer reellen Zahl, das chung für Abschätzungen nach unten, dass der Abstand von a
man durch die Signumfunktion, und b mindestens so groß ist, wie der Abstand ihrer Beträge.
Diese Aussage sowie die eigentliche Dreiecksungleichung

⎨ 1, falls a > 0, werden wir häufig verwenden.
sign (a) = 0, falls a = 0,

−1 falls a < 0
Beweis:
erhält. Die ersten beiden Regeln ergeben sich aus der Definition
des Betrags.
? Die zweite Regel gilt, denn wegen |ab| ≥ 0 und |a| |b| ≥ 0
Drücken sie die Betragsfunktion mithilfe der Signumfunk- gilt stets |ab| = ±ab = |a| |b|.
a
tion sign (a) aus. Die vierte Regel folgt mit · b = a aus der Multiplikati-
b
vität.
Aus −|a| ≤ a ≤ |a| und −|b| ≤ b ≤ |b| folgt −(|a| + |b|)
Im Zusammenhang mit dem Betrag ist eine schlichte Aussage ≤ a + b ≤ |a| + |b|, und mit unserem Hilfssatz ergibt sich
wichtig. |a + b| ≤ |a| + |b|.
Ersetzt man b durch −b in |a + b| ≤ |a| + |b|, so erhalten
Lemma wir |a − b| ≤ |a| + | − b| = |a| + |b|.
Für ε, x ∈ R, ε > 0, ist |x| < ε gleichbedeutend Die letzte Regel lässt sich mit der eben bewiesenen Drei-
−ε < x < ε. ecksungleichung zeigen: Es gilt |a| = |(a − b) + b| ≤
|a − b| + |b|, daher ist |a| − |b| ≤ |a − b|. Vertauscht man
Beweis: Für x = 0 ist |x| = 0, und 0 < ε ist nach die Rollen von a und b, so folgt |b|−|a| ≤ |b−a| = |a−b|
Voraussetzung erfüllt. und daher: ) )
) )
Es folgt der Beweis der Hinrichtung, „⇒“: )|a| − |b|) ≤ |a − b|.
) )
Sei |x| < ε. Wir müssen zwei Fälle unterscheiden. Denn ist
x > 0, so ist |x| = x, also −ε < 0 < x = |x| < ε. Gilt Ersetzt man b durch −b, so folgt auch:
andererseits x < 0, so ist |x| = −x, also −ε < −|x| =
x < 0 < ε. ) ) )) )
)
) ) )
)|a| − |b|) =)|a| − | − b|)) ≤ |a − (−b)| = |a + b|. 

Da der obige Hilfssatz eine äquivalente Aussage formuliert,


müssen wir noch die Rückrichtung, „⇐“ zeigen.
Sei jetzt also −ε < x < ε. Ist x > 0, so ist |x| = x < ε. Auch in höheren Dimensionen, wie z. B. im Rn (n ≥ 2),
Gilt x < 0, so ist |x| = −x also −|x| = x > −ε. Durch gilt die Dreiecksungleichung. In diesen Fällen kann man von
Multiplikation mit (−1) folgt daher |x| < ε.  Abständen zwischen Punkten reden. Wir notieren dabei
den Abstand der beiden Punkte A und B mit d(A, B). Eine
? geometrische Interpretation im R2 ist, dass zwei Seiten eines
Zeigen Sie, dass stets −|x| ≤ x ≤ |x| gilt. Dreiecks zusammen immer mindestens so lang sind wie die
dritte Seite (siehe Abb. 4.4). Hierdurch wird der verwendete
Begriff „Dreiecksungleichung“ erst verständlich.
Eigenschaften des Betrags Ein Körper K zusammen mit einer Abbildung | | : K → R
Für a, b ∈ R gilt: mit den folgenden Eigenschaften:
|a| ≥ 0.
|a| ≥ 0 für alle a ∈ K und |a| = 0 genau dann, wenn
|a| = 0 ⇔ a = 0.
a = 0 ist,
|a b| = |a| |b| , d. h., der Betrag ist multiplikativ. Spe-
|a b| = |a| |b| für alle a, b ∈ K und
ziell ist | − a| = |a|.
) a ) |a| |a + b| ≤ |a| + |b| für alle a, b ∈ K
) )
) )= , falls b  = 0
b |b| heißt bewerteter Körper. R ist also ein bewerteter Körper.
)|a ± b| ≤ |a| ) + |b|, die Dreiecksungleichung. Wir werden sehen, dass der Körper der komplexen Zahlen
) )
) |a| − |b| ) ≤ |a ± b|, die Dreiecksungleichung für kein angeordneter Körper, aber immerhin ein bewerteter Kör-
) )
Abschätzungen nach unten. per ist. Bezüglich dieser Bewertung und der damit verbun-
denen Anordnung ist Q nicht archimedisch.
112 4 Zahlbereiche – Basis der gesamten Mathematik

Cr Eine Teilmenge M ⊆ R hat genau dann ein Maximum,



S S falls die am Nullpunkt gespiegelte Menge

S

S −M = {x ∈ R | −x ∈ M}

S

S ein Minimum hat. Es ist dann max M = − min(−M).

S Umgekehrt gilt entsprechend min M = − max(−M). 

S

S

S Ein Intervall ohne Maximum kann aber durch eine Zahl be-

Sr schränkt sein. Um die folgenden Begriffe der oberen bzw. der

( (((( B
((( unteren Schranke zu motivieren, betrachten wir das spezielle

( ( (((
( Intervall
r ((

(
A d(A, C) ≤ d(A, B) + d(B, C)
M = {x ∈ R | x < 1} = (−∞, 1).
Abbildung 4.4 Zwei Seiten eines Dreiecks zusammen sind immer mindestens
so lang wie die dritte Seite. M hat kein Maximum, die Zahl 1, die als Kandidat für ein
Maximum ins Auge springt, gehört ja nicht zur Menge M.
Jedoch haben alle Elemente x ∈ M die Eigenschaft, dass
Man kann sich bei Ungleichungen oft eine geometrische Ver-
x < 1 gilt, 1 ist also eine obere Schranke für M im Sinne der
anschaulichung bilden (siehe Seite 113).
folgenden Definition:
Als Vorbereitung für das Vollständigkeitsaxiom führen wir
noch die Begriffe Maximum und Minimum einer Teilmenge Definition von oberer und unterer Schranke
M ⊆ R ein.
Ist M ⊆ R, so heißt eine Zahl s ∈ R obere bzw. untere
Definition von Maximum und Minimum Schranke von M, falls für alle x ∈ M die Ungleichung
Ist M ⊆ R dann heißt eine reelle Zahl c Maximum von
x ≤ s bzw. x ≥ s
M bzw. kurz c = max M, falls c ∈ M ist und für alle
x ∈ M die Ungleichung x ≤ c gilt. gilt.
Völlig analog wird ein Minimum von M definiert mit
der Notation min M.
?
Zeigen Sie, dass, wenn s eine obere Schranke von M ist, auch
Wegen der Antisymmetrie der „≤“-Relation hat jede Teil- jede größere Zahl s  obere Schranke von M ist.
menge M ⊆ R höchstens ein Maximum bzw. Minimum. Die
Bezeichnungen max M und min M sind also sinnvoll.

Beispiel Definition von Beschränktheit


Für alle a ∈ R gilt |a| = max{a, −a}. Eine Menge M ⊆ R heißt nach oben (unten) be-
Für alle a, b ∈ R mit a < b gilt max[a, b] = max(a, b] = schränkt, falls M eine obere (untere) Schranke besitzt.
max(−∞, b] = b. M heißt beschränkt, wenn M sowohl nach oben als
Für alle a, b ∈ R mit a < b gilt min[a, b] = min[a, b) = auch nach unten beschränkt ist.
min [a, ∞) = a.
Das offene Intervall (a, b) besitzt kein Maximum, denn In unserem Beispiel ist die Zahl 1 eine obere Schranke von
zu jedem x ∈ (a, b) gibt es ein y ∈ (a, b) mit y > x,
welches man beispielsweise durch folgende Konstruktion M = { x ∈ R | x < 1 } = (−∞, 1).
erhält:
x+b Sie ist sogar eine besondere obere Schranke, nämlich die
y= .
2 kleinste unter allen oberen Schranken, also das Minimum
Da b ∈ / (a, b) gilt, kann b hier nicht das Maximum sein. in der Menge aller oberen Schranken von M. Wir können
Genauso sieht man, dass die Intervalle unsere Vermutung „Ist s eine obere Schranke von M, dann gilt
s ≥ 1“ durch einen einfachen Widerspruchsbeweis belegen.
[a, b), (−∞, b), [a, ∞), (a, ∞) und (−∞, ∞) = R

kein Maximum und die Intervalle Beweis: Wir nehmen an, es gäbe eine obere Schranke s
von M mit s < 1. Wir betrachten dann das arithmetische
(a, b), (a, b], (a, ∞), (−∞, b], (−∞, b) Mittel x von s und 1:
und (−∞, ∞)
s+1
x= .
kein Minimum haben. 2
4.2 Die Anordnungsaxiome für die reellen Zahlen 113

Beispiel: Gleichungen und Ungleichungen mit Beträgen


In den folgenden Beispielen wird ausführlich gezeigt, wie man Ungleichungen lösen kann, die Beträge enthalten. Einige der
Umformungsschritte sind so elementar, dass sie unkommentiert bleiben. Zu bestimmen sind die Mengen
 ) ) 
)5 )
M = x ∈ R | x  = 0, )) + x ))< 6 , N = { x ∈ R | 2x + 10 < |4 − 3x| } und P = { x ∈ R | x ≥ |2x − 10| } .
x

Ferner sollen M, N und P möglichst einfach mithilfe von Intervallen dargestellt werden.

Problemanalyse und Strategie: Möchte man Gleichungen oder Ungleichungen lösen, in denen Beträge vorkommen,
dann arbeitet man meistens mit Fallunterscheidungen, wodurch man auf die Beträge verzichten kann.

Lösung: fallen die Betragsstriche einfach weg und auch für den
Wir beginnen mit der Menge M. Es gelten folgende Äqui- umgekehrten Fall, nämlich 4−3x < 0 kann man sie durch
valenzen für x ∈ R, x  = 0: eine Minusklammer ersetzen. Der Vorzeichenwechsel fin-
) ) ) ) det bei x = 43 statt. Wir unterscheiden daher die Fälle
)5 ) ) 5 + x2 ) |5 + x 2 |
) ) ) ) x < 43 , x > 43 bzw. x = 43 . Für x < 43 gilt:
x ∈ M ⇔ ) + x) < 6 ⇔ ) ) < 6⇔ < 6.
x ) x ) |x|
6
Hierbei haben wir die beiden Zahlen im Betrag auf ihren 2x + 10 < 4 − 3x ⇔ 5x < −6 ⇔ x < − = −1.2.
5
Hauptnenner x gebracht und danach den Bruch aufgespal-
ten. Jetzt multiplizieren wir mit |x| durch und erhalten: Ist x also kleiner als der Bruch b = 43 , so ist die Gleichung
für x < − 65 erfüllt. Untersuchen wir nun x > 43 :
|5 + x 2 | < 6|x| ⇔ 5 + x 2 < 6|x| ⇔ x 2 − 6|x| + 5 < 0.
2x + 10 < −(4 − 3x) ⇔ 2x + 10 < 3x − 4 ⇐⇒ x > 14.
Nun bereiten wir eine quadratische Ergänzung vor, indem
wir auf beiden Seiten 4 addieren:
Die Bedingung x > 43 ist mit x > 14 schon erfüllt. Wir
) )
|x|2 − 6|x| + 9 < 4 ⇔ (|x| − 3)2 < 22 ⇔ ) |x| − 3 ) < 2. haben noch nicht x = 43 betrachtet. Auch dieser Fall ist
möglich, doch löst er nicht unsere Ungleichung:
Schließlich lösen wir den Betrag auf:
4
2· + 10 < 0
−2 < |x|−3 < 2 ⇔ 1 < |x| < 5 ⇔ x ∈ (−5, −1) ∪ (1, 5). 3

M ist also die Vereinigung der (offenen) Intervalle ist offensichtlich nicht erfüllt. Die Zahlen x < −1.2 sowie
(−5, −1) und (1, 5), siehe Abbildung. die Zahlen x > 14 bilden zusammen die Menge N, die
sich als (−∞, −1.2) ∪ (14, ∞) schreiben lässt.

f (x)
10
Zuletzt untersuchen wir die Menge P . Hier wird die gerade
8 f1 (x) = 5
x +x benutzte Fallunterscheidung für 2x − 10 wieder hilfreich
f2 (x) = 6 sein. Ist x > 5, so gilt:
6
4
2 x ≥ |2x − 10| ⇔ x ≥ 2x − 10 ⇔ 10 ≥ x,

−5 −4 −3 −2 −1 0 1 2 3 4 5 x d. h., wir erhalten x ≤ 10. Hier kommt es zu einer Ver-


−4 schärfung, sodass nur noch Zahlen im Intervall (5, 10] in
−6 der Menge P liegen.
f3 (x) = −6
−8 Betrachten wir den nächsten Fall x < 5:
−10
10
x ≥ −(2x − 10) ⇔ −x ≤ 2x − 10 ⇔ ≤ x,
3
Wenden wir uns nun der Menge N zu. Die Ungleichung * 10 
also x ≥ 10 3 , und damit x ∈ 3 , 5 . Es bleibt noch ein
2x + 10 < |4 − 3x| Kandidat für die Menge P . Der Fall x = 5 ≥ 0 ist wahr,
und so ist die Zahl 5 ein
* Element
 der Menge P , welche * 10 sich+
lässt sich durch eine Fallunterscheidung erheblich verein- als Vereinigung von 10 3 , 5 , {5} und (5, 10] als 3 , 10
fachen. Denn für den Fall, dass 4 − 3x größer null ist, schreiben lässt.
114 4 Zahlbereiche – Basis der gesamten Mathematik

Es gilt s < x < 1, also ist x ∈ M, aber x > s, was ein Deswegen genügt es eigentlich, den folgenden Zusammen-
Widerspruch zur Voraussetzung, dass s obere Schranke von hang nur für Maximum und Supremum zu formulieren.
M ist, darstellt. 

Zusammenhang zwischen Maximum und Supremum


Die Menge Ist M eine Menge von reellen Zahlen, die ein Maximum
besitzt, dann ist
M ={x ∈R|x <1}
max M = sup M ∈ M.
ist somit nach oben beschränkt. M besitzt kein Maximum,
aber die nicht zur Menge gehörende Zahl 1 ist kleinste obere
Schranke von M, d. h. das Minimum in der Menge der oberen Beweis: s0 = max M ist obere Schranke von M, da für
Schranken von M. jedes x ∈ M gilt x ≤ s0 . Wegen s0 ∈ M muss für jede obere
Schranke s von M gelten s0 ≤ s, also ist s0 die kleinste obere
Besitzt jedoch eine Menge M ein Maximum c, so ist c obere Schranke. 
Schranke von M und offensichtlich das Minimum in der
Menge der oberen Schranken von M, also die kleinste obere
Schranke. Dass jede nichtleere nach oben beschränkte Menge ?
reeller Zahlen eine kleinste obere Schranke hat, ist das letzte Formulieren Sie die analoge Aussage über Minimum und
Axiom, das wir über die reellen Zahlen fordern. Infimum einer Menge von reellen Zahlen.

Mithilfe des folgenden Kriteriums kann man in vielen Fällen


das Supremum bzw. Infimum bestimmen.
4.3 Ein Vollständigkeitsaxiom
Satz (Die ε-Charakterisierung von sup bzw. inf)
Ist s0 ∈ R eine obere (untere) Schranke der nichtleeren
Wir formulieren das angekündigte Axiom, welches insbe-
Teilmenge M ⊆ R, dann ist s0 = sup M (bzw. s0 = inf M)
sondere die reellen von den rationalen Zahlen unterscheidet.
genau dann, wenn es zu jedem ε ∈ R mit ε > 0 ein x ∈ M
mit s0 − ε < x (bzw. x < s0 + ε ) gibt.
Ein Vollständigkeitsaxiom
Jede nichtleere, nach oben beschränkte Menge M reeller Beweis: Sei zunächst s0 = sup M, und wir nehmen an,
Zahlen besitzt eine kleinste obere Schranke, d. h., es gibt es gäbe ein ε > 0 mit der Eigenschaft x ≤ s0 − ε für alle
ein s0 ∈ R mit den Eigenschaften: x ∈ M. Dann wäre auch s0 − ε eine obere Schranke von M
für alle x ∈ M ist x ≤ s0 und und wegen s0 − ε < s0 eine kleinere obere Schranke als s0 .
für jede obere Schranke s von M gilt s0 ≤ s. Dies ist ein Widerspruch.
Zum Beweis der Umkehrung (die ε-Bedingung sei erfüllt)
betrachten wir neben s0 eine weitere obere Schranke s von
M. Wäre nun s < s0 , dann gibt es nach Voraussetzung (zu
Kommentar: Wir haben hier bewusst ein Vollständig-
ε = s0 − s > 0) ein x ∈ M mit s < x. Das widerspricht
keitsaxiom geschrieben, da wir weitere, äquivalente Varian-
der Voraussetzung, dass s obere Schranke von M ist. Daher
ten des Vollständigkeitsaxioms auf Seite 119 angeben.
ist s0 ≤ s für jede obere Schranke s von M. s0 ist also das
Supremum von M. 

Ist SM = {s ∈ R | s obere Schranke von M}, so ist


s0 = min SM . Als Minimum einer Menge ist s0 eindeu- Wir werden sehen, dass das Vollständigkeitsaxiom die ratio-
tig bestimmt, d. h., die kleinste obere Schranke einer nicht- nalen Zahlen von den reellen Zahlen unterscheidet. Die ra-
leeren nach oben beschränkten Menge M ⊆ R ist eindeutig tionalen Zahlen, die Standardbezeichnung ist Q, bilden eben-
bestimmt. Wir bezeichnen diese reelle Zahl mit Supremum falls einen angeordneten Körper, in welchem jedoch die Glei-
von M und verwenden die Notation sup M. Die Zahl kann chung
zur Menge M gehören oder auch nicht. Analog spricht man r2 = 2
vom Infimum von M mit der Bezeichnung inf M, wenn die
größte untere Schranke der Menge M gemeint ist. Supremum keine Lösung hat wie wir im Abschnitt 4.6 über die rationalen
und Infimum hängen eng über die Spiegelmenge zusammen. Zahlen sehen werden. In R existiert nach dem Existenzsatz
Ist M ⊆ R nach oben beschränkt, dann ist die am Nullpunkt für Quadratwurzeln
√ eine positive Lösung dieser Gleichung,
gespiegelte Menge −M = {x ∈ R | −x ∈ M} nach unten die wir mit 2 bezeichnen. Eine solche Zahl wird daher auch
beschränkt. irrational genannt.
4.3 Ein Vollständigkeitsaxiom 115

Das Vollständigkeitsaxiom garantiert die eine obere Schranke von M mit s < x. Dies ist ersichtlich
Existenz von Quadratwurzeln aus
 2
2 x2 − a
Wir zeigen als Anwendung des Vollständigkeitsaxioms, dass s = x−
2x
es zu jeder nicht negativen reellen Zahl a eine eindeutig be-
 2
stimmte nicht negative reelle Zahl x gibt, für die x 2 = a x2 − a x2 − a
2
gilt. = x − 2x +
2x 2x

>0
Existenzsatz für Quadratwurzeln
x2 − a
Zu jeder reellen Zahl a mit a ≥ 0 existiert eine eindeutig > x 2 − 2x
2x
bestimmte nicht negative reelle Zahl x mit x 2 = a. Die
√ = x 2 − (x 2 − a) = a.
Zahl x heißt die Quadratwurzel aus a und wird mit a
bezeichnet.
Es folgt für jedes y ∈ M die Ungleichung:

y2 ≤ a < s2
Beweis: Den Beweis unterteilen wir in zwei Abschnitte.
Zunächst betrachten wir den einfachen speziellen Fall a = 0 und hieraus, da y ≥ 0 und s > 0:
und danach den allgemeineren Fall a > 0.
y < s.
Sei a = 0. Die Gleichung x 2 = 0 hat nach der Nullteilerregel
nur die Lösung x = 0. Damit ist Diese Aussage, dass s auch eine obere Schranke für M dar-
stellt, widerspricht der Voraussetzung, dass x die kleinste
√ obere Schranke von M ist. Wir haben damit x 2 > a ausge-
0 = 0.
schlossen, und es gilt bereits x 2 ≤ a.
Als Nächstes nehmen wir x 2 < a an und zeigen, dass x keine
Nun untersuchten wir den Fall a > 0. Zuerst beweisen wir
√ obere Schranke von M ist. Wäre nämlich x 2 < a, dann ist
die Existenz der Quadratwurzel a und anschließend ihre  
Eindeutigkeit. a − x2
δ = min 1 , > 0,
2x + 1
Wir betrachten die folgende Menge:
da der Bruch positiv ist. Weiter gilt:
M = { y ∈ R | y ≥ 0; y 2 ≤ a }. (x + δ)2 = x 2 + 2xδ + δ 2
≤ x 2 + 2xδ + δ (wegen δ ≤ 1)
Wegen 02 = 0 < a ist 0 ∈ M, also ist M  = ∅. Außerdem gilt
für y > a+1 die Abschätzung y 2 > (a+1)2 = a 2 +2a+1 > = x 2 + (2x + 1)δ
a, d. h., a +1 ist eine obere Schranke von M. Mit y ∈ M folgt
a − x2
somit y ≤ a + 1. Die Menge M ist beschränkt und besitzt ≤ x 2 + (2x + 1)
nach dem Vollständigkeitsaxiom ein Supremum: 2x + 1
= x 2 + (a − x 2 )
x = sup M. = a.

Also wäre x + δ ∈ M und x + δ > x. Damit ist x ist nicht


Wir vermuten, dass x > 0 und x 2 = a gilt. Dies müssen wir obere Schranke von M. Somit ist auch x 2 < a unmöglich.
noch zeigen. Es gilt y0 = min{1, a} ∈ M und daher ist ins- Es bleibt nur x 2 = a.
besondere 0 < y0 ≤ x. Wir zeigen weiter x 2 = a, indem wir
Es bleibt die Eindeutigkeit von x zu beweisen. Nehmen wir
die Annahmen x 2 < a und x 2 > a jeweils zu einem Wider-
an, dass für eine weitere positive Zahl x1 > 0 auch x12 = a
spruch führen. Nach dem Trichotomiegesetz muss schließ-
ist. Es folgt:
lich x 2 = a gelten.
(x − x1 )(x + x1 ) = x 2 − x12 = a − a = 0.
Beginnen wir mit x 2 > a und zeigen, dass dann x nicht
kleinste obere Schranke von M sein kann. Denn mit x 2 > a Wegen x + x1 > x > 0 ergibt sich aus der Nullteilerregel:
ist auch
x − x1 = 0, also x = x1 .
x2 − a
s=x− <x √
2x
 Dies beweist den Satz und rechtfertigt die Schreibweise a
>0 für die eindeutig festgelegte Zahl x. 
116 4 Zahlbereiche – Basis der gesamten Mathematik

Rechenregeln für Quadratwurzeln f (x)


Für die Quadratwurzeln gelten folgende Rechenregeln:
Für alle a, b ∈ R, a ≥ 0, b ≥ 0 gilt folgende Iden-
tität: √ √ √ 0 1 2 3 4 x
a b = a b.
Wir nennen diese Eigenschaft die Multiplikativität
der Quadratwurzel. −1
Für alle a, b ∈ R mit 0 ≤ a < b gilt
√ √
0 ≤ a < b.
−2 √
f (x) = − x
Wir nennen dies die Monotonie-Eigenschaft der
Quadratwurzel.

In Übungsaufgabe 4.2 sollen diese Rechenregeln bewiesen Abbildung 4.6 Der Nebenzweig
√ der Quadratwurzel wird durch die Abbildung
f : R≥0 → R≤0 , f (x) = − x vermittelt.
werden.

Ordnet man jeder nicht negativen reellen Zahl ihre Quadrat-


wurzel zu, so erhält man eine Funktion. Man nennt diese den Existenzsatz für k-te Wurzeln
Hauptzweig der Quadratwurzel (siehe Abb. 4.5): Zu jeder nicht negativen reellen Zahl a und zu jeder
natürlichen Zahl k gibt es genau eine nicht negative reelle
√ √ Zahl x, für die x k = a gilt. Die Zahl x heißt k-te Wurzel
: R+ = {x ∈ R | x ≥ 0} → R mit x  → x.
aus a und wird mit
√k
a oder a 1/k
bezeichnet.
f (x)
Der Beweis lässt sich in Analogie zum letzten Satz führen.
√ In der Box auf Seite 117 gehen wir genauer darauf ein.
f (x) = x
2 Mit dem Vollständigkeitsaxiom haben wir die Aufzählung
der Axiome beendet. Sie sind in einer Übersichtsbox auf
Seite 118 zusammengefasst. Zu dem von uns als Vollständig-
1
keitsaxiom bezeichneten Supremumsaxiom gibt es äquiva-
lente Axiome. Einige Varianten sind in der Box auf Seite 119
zusammengestellt. Es gibt aber noch viele weitere Varian-
ten.
0 1 2 3 4 x Bisher haben wir uns auf den Standpunkt gestellt, dass es
die reellen Zahlen wirklich gibt, also dass ein Körper exi-
Abbildung 4.5 Der Hauptzweig
√ der Quadratwurzel wird über die Abbildung
f : R≥0 → R≥0 , f (x) = x definiert.
stiert, der das eben beschriebene Axiomensystem erfüllt. Wir
können rückblickend feststellen, dass bei den Beweisen, die
wir geführt haben, diese Grundannahme keine Rolle gespielt

Achtung: Es gilt x 2 = |x| und nicht etwa x für alle hat. Wir haben ja nur Folgerungen aus den Axiomen gezo-
x ∈ R. gen. Falls die in den Axiomen formulierten Aussagen rich-
tig sind, sind auch die aus ihnen gezogenen Folgerungen
√ richtig.
Die Zahl a ist per Definition eine Lösung der Gleichung

x 2 = a. Aber ihr Negatives − a löst die Gleichung ebenso.
√ √ Wir haben uns nicht mit der Frage beschäftigt, ob es die
Mit a und − a haben wir verschiedene Lösungen der reellen Zahlen gibt und ob die dreizehn aufgeführten Axiome
Gleichung x 2 = a, die nur für a = 0 zusammenfallen. Man und die aus ihnen abgeleiteten Aussagen widerspruchsfrei
kann jeder nicht negativen reellen Zahl a auch die negative
√ sind. Ferner wissen wir noch nicht, ob es von den reellen
Zahl − a zuordnen und erhält ebenfalls eine Abbildung, Zahlen R verschiedene mathematische Strukturen gibt, die
Nebenzweig der Quadratwurzel genannt (Abb. 4.6). ebenfalls alle Axiome erfüllen.
In Verallgemeinerung des eben bewiesenen Satzes gilt ein Die Widerspruchsfreiheit wird durch die Konstruktion eines
völlig analoger Existenzsatz für k-te Wurzeln, wobei 2 ≤ Modells für die reellen Zahlen nachgewiesen. Dabei muss
k ∈ N ist: man allerdings annehmen, dass die klassischen Schlusswei-
4.4 Natürliche Zahlen und vollständige Induktion 117

Unter der Lupe: Existenz der k-ten Wurzel positiver Zahlen


Aus dem Vollständigkeitsaxiom haben wir die Existenz von Quadratwurzeln aus nicht negativen reellen Zahlen gefolgert. Der
Beweis lässt sich ohne große Mühe auf die Existenz von k-ten Wurzeln, k ≥ 2, aus nicht negativen reellen Zahlen übertragen.

Wir formulieren zunächst noch einmal die Behauptung. Dabei ist wegen x k > a > 0 insbesondere x k = 0. Also
Zu jeder nicht negativen reellen Zahl a gibt es genau eine ist a > x k − (x k − a) = a, damit a > a. Dieser Wi-
nicht negative reelle Zahl x mit x k = a für k ∈ N. Die derspruch zeigt, dass die Annahme x k > a falsch ist. Es
√ muss also x k ≤ a gelten. Im nächsten Schritt schließen
Zahl x heißt k-te Wurzel aus a und wird mit x = k a
notiert. wir x k < a aus und folgern so die Existenz von x mit
x k = a.
Da der Fall k = 1 evident ist, setzen wir k ≥ 2 voraus.
Angenommen, es gilt x k < a. Für jedes reelle λ mit
Wir geben einen Beweis an, der einen alternativen Be-  k
weis für den Fall k = 2 enthält. Es müssen sowohl die x
0 < λ < 1 ist x < 1−λ x
und deshalb 1−λ > x k oder
Existenz als auch die Eindeutigkeit der gesuchten Zahl x x k > a(1−λ)k . Mithilfe der Bernoulli’schen Ungleichung
gezeigt werden. Für den Existenzbeweis müssen wir die folgt:
Menge M = {y ∈ R≥0 | y k < a} genauer untersuchen.
Die Eindeutigkeit ergibt sich aus der Tatsache, dass aus x k > a(1 − kλ) = a − kaλ.
0 < x1 < x2 stets x1k < x2k folgt. k
Wählt man speziell die positive Zahl λ = a−x
ka < 1, dann
Ist a = 0, so wählen wir x = 0. Wir setzen also im Fol-
folgt der Widerspruch x k > a − (a − x k ) = x k .
genden a > 0 voraus.
Wir betrachten die Menge M. Wegen 0 ∈ M ist M = Es ist also tatsächlich x k = a. Man notiert für a üblicher-
√ √
∅. M ist nach oben beschränkt durch 1 + a, denn für weise a = k x. Im Fall k = 1 ist a = 1 x = x und

y > 1 + a folgt nach der Bernoulli’schen Ungleichung für k = 2 notiert man nicht a = 2 x, sondern einfach

y k > (1 + a)k ≥ 1 + ka > ka > a. Für y ∈ M ist a = x. Damit haben wir die Existenz der k-ten Wurzeln
daher y ≤ 1 + a, also ist M nach oben beschränkt. Wir von nicht negativen reellen Zahlen bewiesen.
definieren x = sup M und behaupten x k = a. Beweisen
werden wir dies, indem wir x k < a bzw. x k > a zu einem Für die k-te Wurzel gelten in Analogie zur Quadratwurzel
Widerspruch führen. die folgenden Rechenregeln:
Wir nehmen zuerst an, dass x k > a gilt. Für jedes re- √ √ √
für alle a, b ∈ R≥0 gilt k
ab =

k
a k b,
elle λ mit 0 < λ < 1 ist 0 ≤ x(1 − λ) < x und daher √
k
aa
(x(1 − λ))k < a. Mit der Bernoulli’schen Ungleichung für alle a ≥ 0 und b > 0 gilt k
= √k ,
b
√ b
 √ l
folgt a > x k (1 − λ)k ≥ x k (1 − kλ) = x k − kx k λ. k
für alle a ≥ 0 und l ∈ N, l ≥ 2 gilt a l = k a .
Speziell gilt diese Überlegung für die nach Voraussetzung Der Beweis erfolgt vollkommen analog zu Aufgabe 4.2.
positive Zahl Einen weiteren eleganten Beweis für die Existenz k-ter
xk − a xk 1 1 Wurzeln erhält man mithilfe des Zwischenwertsatzes, den
λ= k
< k
= ≤ < 1. wir später in Kapitel 9 betrachten werden.
kx kx k 2

sen der Logik und der Mengenlehre in sich konsistent sind. 3 := 2 + 1, 4 := 3 + 1, usw. und die so erhaltenen Zah-
Bei diesem konstruktiven Aufbau startet man üblicherweise len als natürliche Zahlen in K zu bezeichnen. Das Beispiel
mit den Peano-Axiomen für die natürlichen Zahlen und er- Z/2Z des endlichen Körpers mit zwei Elementen zeigt je-
weitert diese über die ganzen und rationalen Zahlen schließ- doch, dass dieses Verfahren nicht unseren Vorstellungen ent-
lich zu den reellen Zahlen (siehe Vertiefung ab Seite 144). spricht, denn in Z/2Z ist 2 := 1 + 1 = 0. Aufgrund der
Diesen Weg beschreiten wir an dieser Stelle nicht. Wir ge- Anordnungsaxiome in R können jedoch in dem angeordne-
ben stattdessen eine präzise Charakterisierung der natürli- ten Körper R solche „Pathologien“ nicht auftreten. Dies gilt
chen Zahlen als Teilmenge von R. für jeden angeordneten Körper K.
Wir skizzieren im Folgenden, wie man die natürlichen Zah-
len als Teilmenge von R definieren kann. R setzen wir, wie
4.4 Natürliche Zahlen und bereits erwähnt, als gegeben voraus. Als Nebenprodukt er-
vollständige Induktion halten wir das Beweisprinzip der vollständigen Induktion.
Dieses Prinzip ist dann ein beweisbarer Satz und kein Axiom
wie bei anderen Zugängen.
Ein beliebiger Körper K enthält nach Definition die Ele-
mente 0 und 1. Um weitere „Zahlen“ zu definieren, liegt es Unsere Vorstellung von den natürlichen Zahlen ist, dass man
nahe, einfach sukzessive die 1 zu addieren, also 2 := 1 + 1, einen „Anfang des Zählens“ hat, nämlich die 1. Durch Ad-
118 4 Zahlbereiche – Basis der gesamten Mathematik

Übersicht: Die Axiome der reellen Zahlen


In dieser Übersichtsbox stellen wir noch einmal alle Axiome der reellen Zahlen zusammen. Mit den auf ihr definierten
Axiomen der Addition und der Multiplikation sowie dem verknüpfenden Distributivgesetz stellt die Menge der reellen
Zahlen einen Körper dar. Durch die Anordnungsaxiome wird garantiert, dass der Körper der reellen Zahlen unendlich viele
Elemente enthält und Gleichungen wie 1 + 1 = 0 keine Gültigkeit haben. Zuletzt sichert das Vollständigkeitsaxiom, dass
jede nichtleere Teilmenge von R ein Supremum besitzt, woraus beispielsweise die Existenz von Quadratwurzeln folgt, die ein
Hauptunterscheidungsmerkmal von R zur der Menge der rationalen Zahlen Q ist.

Körperaxiome: Es sind zwei Verknüpfungen, Addition und a v


Multiplikation genannt, über die folgenden Axiome definiert: K n o
Axiome der Addition Axiome der Multiplikation ö g l
Assoziativgesetz Assoziativgesetz r e l
Kommutativgesetz Kommutativgesetz p o s
Existenz der Null Existenz der Eins (= 0) e r t.
Existenz des Negativen Existenz des Inversen (zu El. = 0) r d
Distributivgesetz n a
Anordnungsaxiome: Es sind gewisse Elemente als positiv ausge- e n
zeichnet (kurz: x > 0), sodass die folgenden Axiome gelten: t g
Für jedes Element gilt genau eine der Beziehungen: e e
x > 0, x = 0, x < 0 r o
x >0∧y >0⇒x+y >0 r
x > 0 ∧ y > 0 ⇒ xy > 0 K. d.
Vollständigkeitsaxiom: Jede nichtleere nach oben beschränkte Menge
reeller Zahlen besitzt eine kleinste obere Schranke. K.
Durch die Körperaxiome, die Anordnungsaxiome und das digkeitsaxiom erfüllt, zum Körper der reellen Zahlen iso-
Vollständigkeitsaxiom ist das System der reellen Zahlen morph ist und der zugehörige Isomorphismus auch die
bis auf Isomorphie eindeutig festgelegt. Damit ist gemeint, Anordnung respektiert. Dieser Isomorphismus ist zudem
dass jeder angeordnete Körper K, der auch das Vollstän- eindeutig bestimmt (siehe Abschnitt 4.7).

dition der 1 können wir irgendeine noch so große natürliche Definition von Zählmengen
Zahl, sagen wir N konstruiert haben. Es gibt dann immer
Eine Teilmenge Z ⊆ R heißt Zählmenge, induktive
eine größere Zahl, z. B. (N + 1). Die natürlichen Zahlen
Menge oder Nachfolgermenge, falls gilt:
werden „größer und größer‘‘, und die Menge der natürlichen
1 ∈ Z,
Zahlen hat sicher kein Maximum. Aber sind die natürlichen
für alle x ∈ Z ist auch stets (x + 1) ∈ Z.
Zahlen vielleicht doch durch eine reelle Zahl nach oben be-
schränkt?
?
Relativ klar ist auch, dass es unendlich viele natürliche Begründen Sie jeweils die folgenden Aussagen:
Zahlen gibt. Aber was heißt das genau? Wir präzisieren
R selbst ist Zählmenge.
den Begriff der Unendlichkeit in der Vertiefungsbox auf
R≥0 = { x ∈ R | x ≥ 0 } ist eine Zählmenge.
Seite 122.
R\{2} = { x ∈ R | x  = 2 } ist keine Zählmenge.

Die natürlichen Zahlen sind über Zählmengen


Wir führen die natürlichen Zahlen als die kleinste Zählmenge
definiert in R ein.

Die folgende Definition der natürlichen Zahlen mag auf den


Definition der natürlichen Zahlen
ersten Blick merkwürdig erscheinen, hat aber den Vorteil, ex-
akt zu sein, weil die Unbestimmtheit und das zeitliche Mo- Eine reelle Zahl n heißt natürlich, wenn n in jeder Zähl-
ment, wie sie im Begriff der „sukzessiven Addition‘‘ enthal- menge von R enthalten ist. Die Menge
ten sind, vermieden werden. N = {n ∈ R | n natürlich}
wird als Menge der natürlichen Zahlen bezeichnet.
4.4 Natürliche Zahlen und vollständige Induktion 119

Hintergrund und Ausblick: Varianten des Vollständigkeitsaxioms


Es gibt eine ganze Reihe weiterer Eigenschaften, die zu dem angegebenen Vollständigkeitsaxiom äquivalent sind und somit
jeweils die Vollständigkeit von R charakterisieren. Da die einschlägigen Begriffsbildungen hier aber nicht alle zur Verfügung
stehen, weil sie erst in Kapitel 8 eingeführt werden, gehen wir nur auf ein zum Vollständigkeitsaxiom äquivalentes Axiom
genauer ein, das eine Variante des sogenannten Dedekind’schen Schnittaxioms darstellt. Eine wesentliche Rolle spielt dabei
die archimedische Eigenschaft der natürlichen Zahlen, die besagt, dass N nicht nach oben beschränkt ist (siehe Seite 123).

Wir behaupten, dass die Eigenschaft (DED): Wegen M = ∅ gilt auch A  = ∅, und da M nach oben
sind A,B nichtleere Teilmengen von R, und gilt für beschränkt ist, zusätzlich B  = ∅. Da jedes b ∈ B obere
alle a ∈ A und alle b ∈ B die Ungleichung a ≤ b, Schranke von M ist, gilt a ≤ b für alle a ∈ M. Damit ist
dann gibt es eine reelle Zahl t mit a ≤ t ≤ b für alle a ≤ b für alle a ∈ A und alle b ∈ B.
a ∈ A und b ∈ B, Die Voraussetzungen von (DED) sind also gegeben und
zum angegebenen Vollständigkeitsaxiom (V) äquivalent es existiert ein t ∈ R, sodass für alle a ∈ A und für alle
ist. Eine geometrische Interpretation dieser Eigenschaft b ∈ B a ≤ t ≤ b gilt. Wenn wir s = t setzen, so besagt die
ist die „Lückenlosigkeit“ von R, denn zwischen je zwei linke Ungleichung, dass s obere Schranke von M ist. Der
nichtleeren Mengen A, B ⊆ R mit der obigen Eigenschaft rechte Teil der Ungleichung sichert, dass s kleinste obere
kann man, wo A und B zusammenstoßen, stets eine reelle Schranke von M ist. Damit ist s aber gerade das gesuchte
Zahl t finden. Supremum, dessen Existenz hiermit bewiesen ist. Insge-
samt haben wir die Äquivalenz der beiden Eigenschaften
Um die Äquivalenz zu zeigen beginnen wir mit
gezeigt
(V)⇒(DED), d. h., wir müssen aus (V) die Eigenschaft
(DED) folgern. Seien dazu A und B nichtleere Teilmen- Neben diesen beiden Varianten des Vollständigkeits-
gen von R mit der Eigenschaft, dass für alle a ∈ A und axioms gibt es viele weitere, die hier nur erwähnt werden.
für alle b ∈ B die Ungleichung a ≤ b gilt. Dazu kürzen wir die archimedische Eigenschaft (siehe
Wir müssen zeigen, dass es ein t ∈ R gibt mit a ≤ t ≤ b Seite 123) mit (AE) ab.
für alle a ∈ A bzw. b ∈ B. Wegen a ≤ b für alle a ∈ A (AE) und das Intervallschachtelungsprinzip, das be-
ist jedes b ∈ B obere Schranke für A. Dabei ist zu beach- sagt, dass eine Intervallschachtelung (siehe Auf-
ten, dass B = ∅ vorausgesetzt ist. A ist also eine nichtleere gabe 8.21) genau eine reelle Zahl enthält, die in allen
nach oben beschränkte Teilmenge von R und besitzt damit Intervallen enthalten ist.
nach Voraussetzung ein Supremum. Wir setzen t = sup A.
Dann gilt a ≤ t für alle a ∈ A. Jedes b ∈ B ist aber obere (AE) und die Eigenschaft, dass jede Cauchy-Folge
Schranke von A und wegen der Supremumseigenschaft konvergiert.
gilt t ≤ b für alle b ∈ B. Insgesamt gilt für alle a ∈ A und
b ∈ B die Behauptung a ≤ t ≤ b. Das Monotonieprinzip. Es besagt, dass jede monoton
Nun zeigen wir die Umkehrung (DED)⇒(V). Dazu sei wachsende nach oben beschränkte reelle Folge konver-
M ⊆ R eine nichtleere nach oben beschränkte Teil- giert.
menge. Wir wollen aus (DED) folgern, dass ein Supre-
mum s = sup M existiert. Um die Voraussetzungen von Die Bolzano-Weierstraß-Eigenschaft. Sie besagt, dass
(DED) anwenden zu können, setzen wir A = M und jede beschränkte Folge reeller Zahlen eine konvergente
Teilfolge besitzt.
B = SM = {x ∈ R | x ist obere Schranke von M}.

Zunächst halten wir fest, dass N selbst Zählmenge ist. Damit kann man N als die bezüglich ⊆ kleinste Zählmenge
von R charakterisieren, denn nach Definition ist N in jeder
Folgerung Zählmenge enthalten. Mengentheoretisch bedeutet dies:
Die Menge N der natürlichen Zahlen ist eine Zählmenge. 
N= {Z ⊆ R | Z Zählmenge}.

Beweis: Diese Menge enthält damit alle uns vom Zählen her bekann-
Es ist 1 ∈ N erfüllt, da 1 ∈ Z für jede Zählmenge Z gilt, ten natürlichen Zahlen 1, 2, 3, . . . .
und die 1 auch im Schnitt all dieser Mengen enthalten ist.
Ist x eine beliebige reelle Zahl, die in N liegt, so muss
?
Wieso gibt es keine natürliche Zahl n mit 1 < n < 2?
auch (x + 1) in N liegen. Da x ∈ N liegt, muss x in jeder
Zählmenge Z liegen. Da für jede Zählmenge gilt, dass
der Nachfolger (x + 1) vorhanden ist, liegt x + 1 in allen Als beweisbaren Satz erhalten wir nun den wichtigen Induk-
Zählmengen vor, und so gilt auch (x + 1) ∈ N.  tionssatz.
120 4 Zahlbereiche – Basis der gesamten Mathematik

Induktionssatz Folgerung (Peano-Eigenschaften der natürlichen


Zahlen)
Ist M ⊆ N eine Teilmenge, für die gilt:
(P1 ) Die 1 ist eine natürliche Zahl, d. h., 1 ∈ N.
1 ∈ M und
(P2 ) Jede natürliche Zahl n besitzt eine eindeutig bestimmte
für alle n ∈ M folgt n + 1 ∈ M,
natürliche Zahl n = n + 1 als Nachfolger.
dann ist M = N.
(P3 ) Verschiedene natürliche Zahlen haben verschiedene
Nachfolger, d. h., sind n, m ∈ N und ist n = m, dann
Beweis: Nach Voraussetzung ist M ⊆ N. Da N in jeder ist auch n = m .
Zählmenge Z enthalten ist und M eine Zählmenge ist, muss (P4 ) Die 1 ist nicht Nachfolger einer natürlichen Zahl.
N ⊆ M gelten. Das bedeutet insgesamt M = N. 
(P5 ) Ist M ⊆ N mit den zwei Eigenschaften 1 ∈ M, und für
jedes n ∈ M ist n + 1 ∈ M, so gilt M = N.
Auf dem Induktionssatz beruht das angekündigte Beweis-
prinzip der vollständigen Induktion.
?
Machen Sie sich die fünf Eigenschaften anhand von aufge-
stellten Dominosteinen klar.

Zum Aufbau der Zahlbereiche kann man diese fünf Eigen-


schaften der natürlichen Zahlen als Axiome an den Anfang
stellen, wie es R. Dedekind (1888) und G. Peano (1889) ge-
tan haben. Aus den natürlichen Zahlen N lassen sich dann die
ganzen Zahlen Z, die rationalen Zahlen Q und schließlich die
reellen Zahlen R konstruieren (siehe Abschnitt 4.7).
Nach diesem kurzen Ausblick stellen wir einige Eigenschaf-
ten von N zusammen.

Eigenschaften von N
Abbildung 4.7 In der Abbildung wird der „Dominoeffekt“ der vollständigen Für jede natürliche Zahl n gilt n ≥ 1.
Induktion gezeigt. Ist nachgewiesen, dass aus der Vorgängeraussage stets die
Nachfolgeraussage folgt, werden alle wahr, die nach der ersten nachgewiesen
Summe und Produkt natürlicher Zahlen sind wieder
richtigen Aussage folgen. Bei Dominosteinen entspricht das dem korrekten natürliche Zahlen.
Aufstellen der Steine und dem dann folgenden Umstoßen eines der Steine, Falls für zwei natürliche Zahlen n, m ∈ N die Unglei-
meistens des ersten.
chung n > m gilt, so ist die Differenz n − m wieder
eine natürliche Zahl.
Beweisprinzip der vollständigen Induktion Ist n eine beliebige natürliche Zahl, dann gibt es keine
Für jede natürliche Zahl n sei A(n) eine Aussage bzw. natürliche Zahl z mit n < z < n + 1. Zwischen n und
Behauptung. Diese kann wahr oder falsch sein. n + 1 existiert keine weitere natürliche Zahl.
Die Aussagen A(n) gelten für alle n ∈ N, wenn man Ist An = { x ∈ N | x ≤ n } = {1, 2, . . . , n}, dann ist
Folgendes zeigen kann: An+1 = An ∪ {n + 1} = { 1, . . . , n, n + 1 }.
(IA) A(1) ist wahr und
(IS) für jedes n ∈ N gilt A(n) ⇒ A(n + 1). Wohlordnungssatz: Jede nichtleere Teilmenge
Der erste Schritt (IA) heißt Induktionsanfang oder B ⊆ N besitzt ein Minimum.
Induktionsverankerung, und die Implikation A(n) ⇒
A(n + 1) nennt man den Induktionsschritt .
Beweis: Wir beweisen hier nur den Wohlordnungssatz und
Zum Beweis braucht man nur zu beachten, dass die Menge überlassen dem Leser die weiteren Aussagen zur Übung.
M = {n ∈ N | A(n) ist wahr} ⊆ N eine Zählmenge ist und Wir nehmen an, es gebe eine nichtleere Teilmenge B ⊆ N,
daher mit N identisch sein muss. die kein Minimum besitzt und betrachten die folgende Menge
Auf Beispiele für das Beweisprinzip der vollständigen In- von natürlichen Zahlen:
duktion gehen wir in einem späteren Abschnitt ausführlich M = {n ∈ N | für alle k ∈ B ist n ≤ k}.
ein. Zunächst sei angemerkt, dass man aus der Definition der
natürlichen Zahlen die folgenden fünf Peano-Eigenschaften M besteht aus den natürlichen Zahlen, die untere Schranken
der natürlichen Zahlen ableiten kann. von B sind. Es gilt entweder M = ∅ oder 1 ∈ M, denn jede
natürliche Zahl k ist größer oder gleich 1. Da M nichtleer ist,
ist 1 ∈ M.
Ist weiter n ∈ M, dann enthält B nur Zahlen ≥ n. Wäre n in
B enthalten, so wäre n die kleinste Zahl in B. Die Menge B
4.4 Natürliche Zahlen und vollständige Induktion 121

Übersicht: Die natürlichen Zahlen


Die natürlichen Zahlen N = {n ∈ R | n natürlich} sind selbstverständlich elementar für die gesamte Mathematik. Wir stellen
hier einige wesentliche Aussagen zusammen.

Die Peano-Eigenschaften der natürlichen Zahlen: Das Summenzeichen


(P1 ) Die 1 ist eine natürliche Zahl, d. h., 1 ∈ N. !
n
(P2 ) Jede natürliche Zahl n besitzt eine eindeutig be- aj = a1 + a2 + . . . + an
stimmte natürliche Zahl n = n + 1 als Nachfolger. j =1
(P3 ) Verschiedene natürliche Zahlen haben verschiedene
Nachfolger, d. h., sind n, m ∈ N und ist n  = m, dann Ist die Indexmenge, über die summiert wird, leer, so hat
ist auch n = m . dies bezüglich der Addition die gleiche Wirkung, wie
(P4 ) Die 1 ist nicht Nachfolger einer natürlichen Zahl. die Addition von Null.
(P5 ) Ist M ⊆ N mit den zwei Eigenschaften 1 ∈ M und Assoziativität der Summe Ist 1 ≤ m ≤ n, so ist
für jedes n ∈ M ist n + 1 ∈ M, so gilt M = N. !n !m !n
aj = aj + aj
Beweisprinzip der vollständigen Induktion j =1 j =1 j =m+1
Aussagen A(n) gelten für alle n ∈ N, wenn
(IA) A(1) wahr ist und Linearität der Summe Für jedes λ, μ ∈ R gilt, falls
(IS) für jedes n ∈ N gilt A(n) ⇒ A(n + 1). bj , 1 ≤ j ≤ n, weitere gegebene reelle Zahlen sind:
Der Wohlordnungssatz !
n !
n !
n
(λaj + μbj ) = λ aj + μ bj .
Jede nichtleere Teilmenge B ⊆ N besitzt ein Minimum.
j =1 j =1 j =1
Die archimedische Eigenschaft
Die Menge der natürlichen Zahlen ist nicht nach oben be- Umnummerierung der Indizes Ist m ≤ n, so gilt:
schränkt. !
n !
n−m+1

Der Satz von Eudoxos-Archimedes aj = am−1+j .


j =m j =1
Zu a ∈ R>0 und b ∈ R gibt es n ∈ N mit
Das Produktzeichen
na > b.

n
aj = a1 a2 . . . an .
j =1

hat aber nach Voraussetzung kein Minimum. Daher enthält M = {m1 , m2 , . . . , mn } gilt. Jedes m ∈ M kommt in dieser
B nur Zahlen größergleich n + 1, was n + 1 ∈ M bedeutet. Liste vor, da ϕ surjektiv ist, und verschiedene Elemente aus
Damit ist M eine induktive Teilmenge von N und nach dem M erhalten verschiedene Nummern. Denn mit der Injektivität
Induktionssatz gilt M = N. Dann muss B aber leer sein, denn von ϕ folgt aus j = k für 1 ≤ j, k ≤ n auch mj = mk . Mit
mit n ∈ B ist n + 1 ∈/ M = N. Dies steht im Widerspruch einer Induktion nach n lässt sich zeigen, dass n eindeutig
zur Voraussetzung B = ∅.  bestimmt ist. Man nennt die Elementanzahl |M| = n die
die Kardinalzahl oder die Mächtigkeit von M. Statt |M|
? findet sich in der Literatur auch #M oder cardM. Eine nicht
Zeigen Sie, dass aus dem Wohlordnungssatz der Induktions- endliche Menge nennen wir unendlich.
satz abgeleitet werden kann.
?
Zeigen Sie, dass N unendlich ist.
Die Mengen An = {1, 2, . . . , n} sind Prototypen endlicher
Mengen mit genau n Elementen.

Definition endlicher Mengen Die Menge der natürlichen Zahlen ist nicht
Wir nennen eine Menge endlich, wenn M = ∅ ist oder nach oben beschränkt
wenn es ein n ∈ N und eine bijektive Abbildung ϕ :
{1, 2, . . . , n} → M gibt. Für jede natürliche Zahl n ist n + 1 eine größere natürli-
che Zahl und so kann es keine größte natürliche Zahl geben.
Man kann die Elemente einer endlichen Menge M so mit Eine natürliche Zahl kann daher nicht obere Schranke für die
den natürlichen Zahlen 1, 2, . . . , n durchnummerieren, dass Menge N der natürlichen Zahlen sein. Es könnte jedoch eine
122 4 Zahlbereiche – Basis der gesamten Mathematik

Hintergrund und Ausblick: Darf’s ein bisschen mehr sein – abzählbar unendliche Mengen
Was haben die Woche und die Weltwunder gemeinsam? Es gibt 7 Wochentage und 7 Weltwunder. Das Gemeinsame ist,
mathematisch ausgedrückt, die Elementanzahl 7 der jeweiligen Menge. Die betrachteten Beispiele sind endliche Mengen,
wobei dieser Begriff intuitiv klar ist. Was haben die natürlichen Zahlen ohne Null mit denen mit der Null gemeinsam? Auch sie
haben gleich viele Elemente und das mag überraschen. Im folgenden Text geben wir eine kurze Übersicht über den Begriff der
Abzählbarkeit in der Mathematik, und Sie werden sehen, dass es gleich viele natürliche wie rationale Zahlen gibt.

Die Abschnitte An = {x ∈ N | 1 ≤ x ≤ n} (n ∈ N) Gleichmächtigkeit hat die Eigenschaften einer Äquiva-


sind die Prototypen für endliche Mengen mit genau n Ele- lenzrelation:
menten. Wie auf Seite 121 definiert, heißt eine Menge M
es gilt M ∼ M (mit f = idM ),
endlich, wenn es eine bijektive Abbildung f : An → M
aus M ∼ N folgt N ∼ M (da f bijektiv ist),
gibt. Ist f : An → M eine solche Bijektion, und setzt man
aus M ∼ N und N ∼ P folgt M ∼ P , denn eine
aj = f (j ) für 1 ≤ j ≤ n, dann ist M = {a1 , . . . , an }
Verkettung bijektiver Abbildungen ist selbst bijektiv.
und aj = al für j = l: Die Elemente von M sind mit den
natürlichen Zahlen von 1 bis n durchnummeriert. Für alle Mengen, die zu N0 gleichmächtig sind, verwendet
man als Kardinalzahl das Symbol ℵ0 , Aleph Null. Mengen,
Dieses Vorgehen führt nur zu einer exakten Definition,
die zu N0 gleichmächtig sind, nennt man abzählbar un-
wenn man nicht gleichzeitig zwei verschiedene Abschnitte
endlich. Auch die Menge der ganzen Zahlen ist abzählbar
Am und An bijektiv auf M abbilden kann, sprich, wenn die
unendlich, eine Bijektion f zwischen N0 und Z ist
Kardinalzahl eindeutig bestimmt ist. Der folgende Satz si-
chert dies: Gibt es eine bijektive Abbildung f : An → M 
und eine weitere bijektive Abbildung g : Am → M, dann k falls n = 2k − 1
f : N0 → Z, f (n) =
gilt n = m. Dies liegt daran, dass es dann eine bijektive −k falls n = 2k.
Abbildung h : An → Am gibt, die wir als Verkettung von
f mit der Umkehrabbildung von g direkt angeben können, Jede Teilmenge von N0 ist endlich oder abzählbar unend-
h = f ◦ g −1 . lich, also abzählbar. Denn man kann die Teilmenge ordnen
und das kleinste Element auf 0, das zweitkleinste Element
Bei endlichen Mengen M und N, für die |M| > |N| gilt, auf 1 usw. abbilden. Damit findet man, dass jede Teil-
lässt sich das Dirichlet’sche Schubfachprinzip anwen- menge einer abzählbaren Menge wieder abzählbar ist. Als
den, welches garantiert, dass es keine injektive Abbildung Folgerung erhält man: Ist M eine beliebige Menge, so-
M → N geben kann. Die Argumentation ist die, dass dass es entweder eine injektive Abbildung f : M → N0
man für jedes Element von N ein Schubfach hat. Legt oder eine surjektive Abbildung g : N0 → M gibt, so ist
man nun alle Elemente von M in diese Fächer ab, muss M abzählbar. Zum Beweis der ersten Teilaussage beachte
man zwangsläufig mindestens ein Fach mehrfach belegen man, dass f : M → f (M) ⊆ N bijektiv und damit M
(siehe Aufgabe 4.41). abzählbar ist.
Bei den beiden nicht endlichen und somit unendlichen Um zu zeigen, dass die rationalen Zahlen Q abzählbar
Mengen N und N0 vermutet man intuitiv, dass N0 ein Ele- sind, wird zuerst gezeigt, dass N0 × N0 abzählbar ist. Wir
ment mehr enthält als N. Im Sinne von Cantor haben je- geben hierfür die Bijektion g : N0 × N0 → N0 mit
doch beide Mengen gleich viele Elemente. Nach Cantor
(1878) heißen zwei Mengen M, N gleichmächtig, wenn (m + n)(m + n + 1)
es eine bijektive Abbildung zwischen ihnen gibt. Hierfür g(m, n) = n +
2
schreibt man M ∼ N oder |M| = |N| und sagt, M und N
haben die gleiche Kardinalität. an, q = 0. Da Z gleichmächtig zu N0 ist, ist auch Z × Z ab-
zählbar. Ordnet man jedem gekürzten Bruch pq , p, q ∈ Z
Mit dieser Definition und der bijektiven Abbildung f :
(siehe auch Aufgabe 4.42) das Element (p, q) ∈ Z × Z
N0 → N, n  → n + 1 ist wirklich |N0 | = |N|. Ein
zu, erhält man eine Bijektion von Q auf eine unendliche
weiteres Beispiel ist das Galilei-Paradoxon: Die Menge
Teilmenge von Z × Z.
der natürlichen Zahlen ist zur Menge der geraden Zahlen
gleichmächtig. Die Abbildung ordnet hier einer natürli- Eine unendliche Menge, die nicht abzählbar unendlich ist,
chen Zahl n die Zahl 2n zu. In beiden Fällen sind Teil- heißt überabzählbar. Wie Sie in der Box auf der nächsten
mengen gleichmächtig zur Ausgangsmenge! Dies kann Seite sehen, ist die Menge der reellen Zahlen eine überab-
bei endlichen Mengen nicht passieren. zählbare Menge.
4.4 Natürliche Zahlen und vollständige Induktion 123

Hintergrund und Ausblick: Die Mächtigkeit des Kontinuums – R ist überabzählbar


Im Gegensatz zu der Menge der rationalen Zahlen ist bereits das reelle Intervall [0, 1) eine überabzählbare Menge und damit
erst recht R, da [0, 1) ⊆ R gilt.

Grundsätzlich stellt sich die Frage, ob es überhaupt über- Menge der so erhaltenen Dezimalbrüche überabzählbar ist
abzählbare Mengen gibt. und da diese Menge eine Teilmenge der reellen Zahlen ist,
ist R selbst überabzählbar.
Seien M = ∅ und N = {0, 1} und F = Abb(M, N), also
die Menge aller Abbildungen von M nach N. Die Bilder Was wir nebenbei gezeigt haben, ist, dass für jede Menge
der Elemente aus M sind entweder die Zahlen 0 oder 1. M die Potenzmenge P (M) eine größere Mächtigkeit als
M besitzt. Denn definiert man für eine Teilmenge A ⊆ M
Ordnet man jedem m ∈ M die Abbildung fm : M → N
die charakteristische Funktion
zu, die für x = m durch fm (x) = 1 und für x  = m als

fm (x) = 0 definiert ist, so sind M und die Teilmenge 1, falls x ∈ A,
{fm | m ∈ M} gleichmächtig. M ist jedoch nicht zur χA (x) =
0, falls x ∈
/ A,
ganzen Menge F gleichmächtig; denn definiert man die
Abbildung dann ist die Abbildung A → χA eine Bijektion von der

1, falls fm (m) = 0, Menge aller Teilmengen von M, also der Potenzmenge auf
f (m) =
0, falls fm (m) = 1, die Menge Abb(M, {0, 1}) = F . Die Überabzählbarkeit
dann liegt f in F , stimmt aber mit keinem fm überein. von F haben wir bereits mit dem Cantor’schen Diagonal-
Diese Idee ist bekannt als 2. Cantor’sches Diagonalver- verfahren gezeigt.
fahren. Damit ist gezeigt, dass die Menge M und die Aus der Überabzählbarkeit von R folgt auch die Überab-
Menge F nicht gleichmächtig sein können und F eine zählbarkeit der Menge R\Q der irrationalen Zahlen wegen
größere Mächtigkeit als M besitzt. Nimmt man nun für R = Q ∪ (R\Q). Es gibt „viel mehr“ irrationale Zahlen
M = N0 , so ist F die Menge aller Folgen, welche nur die als rationale Zahlen. Für die Mächtigkeit von R wird üb-
Werte 0 oder 1 annehmen. Hier einige Beispiele aus dieser licherweise das Symbol c verwendet.
Menge:
01001000100001000001 . . . Allerdings bleibt die Frage offen, ob für eine unend-
liche Teilmenge M ⊆ R notwendigerweise entweder
01010101010101010101 . . .
|M| = ℵ0 = |N0 | oder |M| = c gilt. Dies ist die Konti-
01011011101111011111 . . . nuumshypothese, welche D. Hilbert 1900 als erstes Pro-
01101101101101101101 . . . blem in seiner Liste von zentralen Fragen der Mathematik
10101010101010101010 . . . aufgenommen hat. K. Gödel hat 1938 gezeigt, dass die
Verneinung der Kontinuumshypothese mit dem üblichen
Diese Menge ist damit überabzählbar. Axiomensystem der Mengenlehre nicht beweisbar ist, und
P. Cohen hat 1963 bewiesen, dass die Kontinuumshypo-
Für die Analysis ist die Überabzählbarkeit der Menge
these selbst nicht beweisbar ist. Dies ist überraschend:
der reellen Zahlen entscheidend. Diese Überabzählbarkeit
wird schon deutlich, wenn man sich auf das Intervall [0, 1) Mit den üblichen Axiomen der Mengenlehre lässt
beschränkt. sich die Kontinuumshypothese grundsätzlich weder
beweisen noch widerlegen.
Ist f = (fn ) ∈ F = Abb(N0 , {0, 1}), dann kann man
diesem f in eindeutiger Weise eine reelle Zahl aus [0, 1) Wie man zeigen kann, haben alle echten Intervalle eben-
zuordnen (Reihen werden in Kap. 10 behandelt): falls die Mächtigkeit von R. Das Cantor’sche Diskonti-

! fk nuum C (siehe Kapitel 9) und erstaunlicherweise alle Rn
f → xf = . mit n ∈ N sind gleichmächtig zu R. Auch die Menge
10k+1
k=0 C (R, R) der stetigen Funktionen f : R → R hat die Mäch-
Die Zahl xf ist ein Dezimalbruch und stellt eine reelle tigkeit von R. Aber die Menge Abb(R, R) aller Abbildun-
Zahl im Intervall [0, 1) dar. Die Zuordnung zeigt, dass die gen von R nach R hat eine größere Mächtigkeit als R.

reelle Zahl aus R \ N geben, die obere Schranke von N ist. Eine alternative Formulierung besagt, dass es zu jeder reellen
Dass das nicht der Fall ist, ergibt sich als wichtige Konse- Zahl x eine natürliche Zahl n gibt mit n > x.
quenz aus dem Vollständigkeitsaxiom.

Die archimedische Eigenschaft von R Beweis: Wenn N nach oben beschränkt wäre, müs-
ste N nach dem Vollständigkeitsaxiom eine kleinste obere
Die Menge der natürlichen Zahlen ist nicht nach oben
Schranke s0 besitzen. Für jedes n ∈ N müsste also n ≤ s0
beschränkt.
gelten.
124 4 Zahlbereiche – Basis der gesamten Mathematik

Andererseits muss es eine natürliche Zahl N mit N > s0 − 1 wollen wir eine exakte Notation einführen. Wir definieren
geben, da sonst s0 − 1 obere Schranke von N wäre, also s0 das Summenzeichen:
nicht die kleinste obere Schranke von N sein könnte.
!
n

Aus N > s0 − 1 folgt aber N + 1 > s0 , im Widerspruch aj = a1 + a2 + . . . + an .


j =1
zur Tatsache, dass s0 obere Schranke von N ist. Daher kann
nicht n ≤ s0 für alle n ∈ N gelten.  In Worten sagt man: „Summe aj für j von 1 bis n“. Eine
rekursive Definition lautet:
Aus diesem Satz ergibt sich eine Folgerung, die schon in der !
1
griechischen Mathematik bekannt war. aj = a1
j =1

Der Satz von Eudoxos-Archimedes und ⎛ ⎞


Zu jeder reellen Zahl a > 0 und jedem b ∈ R gibt es !
n+1 !
n
aj = ⎝ aj ⎠ + an+1 .
eine natürliche Zahl n mit
j =1 j =1

na > b. Mit dem Rekursionssatz (Seite 149) wird allgemein gezeigt,


dass so eine eindeutige Festlegung gegeben ist. Der Lauf-
index j beim Summenzeichen kann selbstverständlich durch
Beweis: Wenn es eine solche natürliche Zahl n nicht geben jeden Buchstaben ersetzt werden, der nicht schon eine andere
würde, müsste für alle natürlichen Zahlen Bedeutung hat.
b
n≤
a  obere Grenze d. Laufindex
n

gelten und der Bruch wäre eine obere Schranke für N im aj ←− Summationsterm
Widerspruch zur gerade formulierten archimedischen Eigen- Laufindex −→ j =1
schaft. 
 untere Grenze d. Laufindex
Abbildung 4.8 Die Bestandteile des Summenzeichens im Einzelnen.
Die letzten beiden Sätze, die eine äquivalente Aussage bein-
halten, bedeuten, dass der Körper der reellen Zahlen archi- Einige offensichtliche Manipulationen mit dem Summenzei-
medisch angeordnet ist. Beachten Sie, dass die archimedi- chen sind nützlich. Diese sind in der Übersicht auf Seite 121
sche Eigenschaft nicht allein aus den Körper- und Anord- zusammengestellt. Als Beispiel betrachten wir eine Umnum-
nungsaxiomen folgt, da auch das Vollständigkeitsaxiom be- merierung, d. h., allgemein gilt mit m ≤ n:
nutzt wird.
!
n !
n−m+1
aj = am−1+j .
Es stellt sich die Frage, ob es angeordnete Körper gibt, die
j =m j =1
nicht archimedisch angeordnet sind. Dies ist tatsächlich der
Fall.
Beispiel Wir betrachten die Identität
Sie werden in der Übungsaufgabe 4.52 sehen, dass die Menge
der rationalen Funktionen !
n
1
k= n(n + 1).
  k=1
2
p(x)
| p, q reelle Polynome, q nicht Nullpolynom
q(x) Nach C. F. Gauß, der diese Summe als siebenjähriger Schüler
im Spezialfall n = 100 bzw. nach anderen Quellen für n =
einen angeordneten Körper bildet, der jedoch nicht archime- 60, berechnet hat, kann man diese Gleichheit sehr einfach
disch angeordnet ist. herleiten.
Ist s = 1 + 2 + · · · + n, so erhält man nach mehrfacher
Anwendung des Kommutativgesetzes s = n + (n − 1) +
Mit Indizes lassen sich Summen exakt angeben · · · + 1. Durch Addition der beiden Gleichungen für s folgt:

Die natürlichen Zahlen treten häufig als Index beim Durch- 2s = (n + 1) + (n + 1) · · · + . . . (n + 1) = n(n + 1),

nummerieren von Elementen der Form aj auf, etwa Koor- n mal
dinaten von Vektoren oder beim Aufsummieren von Zahlen.
Für die dabei genutzte „Pünktchenschreibweise“, wie in bzw. nach Auflösen nach s:
n(n + 1)
s= .
12 + 22 + . . . + 1002 , 2
4.4 Natürliche Zahlen und vollständige Induktion 125

Hintergrund und Ausblick: Die Dedekind’sche Unendlichkeitsdefinition


Wir hatten eine Menge endlich genannt, wenn M = ∅, oder wenn es ein n ∈ N und eine bijektive Abbildung

ϕ : {1, 2, . . . , n} → M mit j → mj

gibt (Seite 121). Die Zahl n ist dann eindeutig bestimmt und heißt Elementanzahl (Kardinalzahl, Mächtigkeit) von M (Abschnitt
4.5). Eine nichtendliche Menge haben wir unendlich genannt. Ein Prototyp für eine unendliche Menge ist die Menge N0 der
natürlichen Zahlen (mit Null). Es gibt noch eine weitere Definition des Unendlichkeitsbegriffs, der auf Dedekind zurückgeht. In
dieser Box werden Sie feststellen, dass dieser zu unserem Unendlichkeitsbegriff äquivalent ist.

Dass N0 eine nach unserer bisherigen Definition unendli- Durch Negation erhält man eine rein mengentheoretische
che Menge ist, ergibt sich z. B. aus folgendem Satz: Definition von endlichen Mengen, die keinen Gebrauch
von den natürlichen Zahlen macht. Das ist die Dede-
Sind A und B Mengen mit B ⊆ A, B  = A, und gilt
kind’sche Endlichkeitsdefinition:
|B| = |A|, dann ist A unendlich.
Eine Menge ist genau dann endlich, wenn sie sich nicht
Denn setzt man A = N0 und B = N = N − {0}, dann
bijektiv auf eine echte Teilmenge abbilden lässt.
findet sich mit der Nachfolgefunktion
Wir müssen lediglich zeigen, dass das Dedekind’sche Un-
ν : N0 → N; n  → ν(n) = n + 1 endlichkeitskriterium auch notwendig für die Unendlich-
keit einer Menge ist:
eine Bijektion. Damit haben beide Mengen gleich viele
Elemente und der vorhergehende Satz ist anwendbar. Beweis: Sei A eine unendliche Menge. Wir definie-
N0 ist also zur (eigenen) echten Teilmenge N gleichmäch- ren eine Abbildung g : N0 → A darüber, dass wir g(0)
tig. Wir erinnern dazu an das Galilei-Paradoxon: Schon mit einem beliebig gewählten (Anfangs-)Element aus A
Galilei hatte 1638 festgehalten, dass N0 und die geraden gleichsetzen und für g(n + 1) ein beliebiges Element aus
natürlichen Zahlen 2N0 die gleiche Mächtigkeit haben, der Menge B = A − {g(0), g(1), . . . g(n)} auswählen. Da
denn die Abbildung ϕ : N0 → 2N0 ; n  → 2n ist bijektiv. A unendlich ist, ist dieses Komplement A nichtleer. g ist
injektiv (wir verzichten mangels Platz auf einen Beweis),
Weil wir wissen, dass jede Teilmenge einer endlichen und für die Bildmenge gilt |N0 | = |g(N0 )| ⊆ A.
Menge wieder endlich ist, folgt ein Umkehrschluss:
Durch die folgende Umkehrabbildung von g
Ist B unendlich und B ⊆ A, dann ist auch A unendlich.

Da N0 unendlich ist, ergibt sich mit diesem Satz, dass die x, falls x ∈ B,
f (x) =
Zahlbereiche Z, Q, R und C unendlich sind. g(g −1 (x) + 1), falls x ∈ g(N0 )

Das Unendlichkeitskriterium des eingangs formulierten wird insgesamt eine Bijektion definiert, und es gilt
Satzes ist – wie Dedekind gezeigt hat – auch hinreichend |A| = |B|. A ist zur echten Teilmenge B gleichmächtig.
für die Unendlichkeit einer Menge; der Satz gilt also in 

beide Richtungen. Dedekind formulierte das Unendlich-


keitskriterium im Jahr 1888 so:
In diesem Beweis haben wir, ohne es zu betonen, das so-
Sind A und B Mengen, dann gilt: A ist unendlich ge- genannte Auswahlaxiom verwendet, welches erstmals von
nau dann, wenn es eine Teilmenge B ⊆ A (B  = A) mit E. Zermelo im Jahr 1904 formuliert wurde. Es ist bis heute
|B| = |A| gibt. unter Mathematikern umstritten.

Mit dem Summenzeichen können wir diesen Gedanken durch Man definiert rekursiv das Produktzeichen durch
eine einfache Umnummerierung mit Index k  = n + 1 − k ⎛ ⎞
wie folgt beschreiben: 
n+1 
n
aj = ⎝ aj ⎠ an+1
!
n !
n !
n
j =1 j =1
k= (n + 1 − k  ) = n(n + 1) − k .
k=1 k  =1 k  =1
0
und legt weiterhin j =1 aj = 1 fest.
Also folgt die Identität, da in der letzten Summe der Index k 
durch den Buchstaben k ersetzt werden kann. 

Analoge Eigenschaften wie für die Summe von n reellen Zah-


len, gelten für das Produkt von n reellen Zahlen a1 , . . . , an .
126 4 Zahlbereiche – Basis der gesamten Mathematik

Hintergrund und Ausblick: Primzahlen als Bausteine der natürlichen Zahlen


Betrachten wir die natürliche Zahl 60, so besitzt sie verschiedene Zerlegungen in ein Produkt von kleineren natürlichen Zahlen
wie beispielsweise 60 = 2 · 30 = 3 · 20 = 5 · 12 = 3 · 4 · 5 = 2 · 5 · 6 = 2 · 2 · 3 · 5. Die letzte Zerlegung besteht aus
Faktoren, die sich nicht mehr als Produkt kleinerer Zahlen schreiben lassen. 2, 3 und 5 sind sogenannte Primzahlen.
Dabei heißt eine natürliche Zahl p > 1 Primzahl, wenn aus p = n1 · n2 mit n1 , n2 ∈ N stets n1 = 1 oder n2 = 1 folgt.
Primzahlen sind genau die natürlichen Zahlen p > 1, welche nur die Teiler 1 und p besitzen.
Die Folge der Primzahlen beginnt mit 2, 3, 5, 7, . . . und bricht nicht ab (siehe Aufgabe 4.47). Eine sehr große Primzahl ist die
Zahl 2431126609 − 1. Sie hat im Dezimalsystem 12978189 Ziffern, was in etwa dem Umfang von vier Exemplaren diese Buches
entspricht. Große Primzahlen spielen in der Kryptologie eine wichtige Rolle, etwa beim RSA-Verfahren.
Man rechnet die Zahl 1 nicht zu den Primzahlen, da sonst der Satz von der eindeutigen Primzahlzerlegung nicht gelten würde,
der wichtiger Bestandteil des Hauptsatzes der elementaren Zahlentheorie ist.

Durch obiges Beispiel motiviert liegt folgende Vermutung alle qj (1 ≤ j ≤ s) größer als p1 sein, sonst wäre n nicht
nahe: Ist n > 1 eine natürliche Zahl, dann ist die kleinste minimal gewesen. Betrachtet man
Zahl t = 1, die n teilt (kurz schreiben wir t|n), eine Prim-
zahl. Für n = 60 gilt t = 2, denn 60 = 2 · 30. Beweisen 
s
n  = n − p1 · qj ,
kann man diese Vermutung, wenn man die Menge T aller
j =2
Teiler t von n, die von 1 verschieden sind, untersucht. T
ist nichtleer, da n ∈ T gilt, und besitzt nach dem Wohl- so gilt auch:
ordnungssatz ein kleinstes Element p. Diese Zahl p muss
prim sein, sonst gäbe es ja noch eine kleinere Zahl als p 
s
in T . n = (q1 − p1 ) · qj .
j =2
Betrachten wir nochmals n = 60 und die Zerlegung
60 = 2 · 30. Für die Zahl 30 finden wir 30 = 3 · 10 und mit Die Zahl n ist wegen der Minimalität von n eindeutig
10 = 2·5 insgesamt 60 = 22 ·3·5. Durch mehrfaches An- in ein Produkt aus Primzahlen zerlegbar, welches nach
wenden unserer Vermutung haben wir 60 in Primzahlen der ersten Formel durch p1 teilbar ist. Wegen der zweiten
zerlegt. Diese Verfahren lässt sich verallgemeinern, und Darstellung von n muss (q1 − p1 ) durch p1 teilbar sein,
so gibt es zu jeder natürlichen Zahl n ≥ 2 Primzahlen denn das hintere Produkt enthält p1 nach Voraussetzung
p1 , . . . , pr , mit denen sich n wie folgt darstellen lässt: gerade nicht. Ist (q1 − p1 ) durch p1 teilbar, so gilt p1
teilt (q1 − p1 ) + p1 . Dies führt auf den Widerspruch, dass

r
p1 die Zahl q1 teilt. Also war unsere Annahme, es gäbe
n = p 1 · . . . · pr = pj .
natürliche Zahlen n ≥ 2 mit nicht eindeutiger Primzahl-
j =1
zerlegung, falsch.
Die Existenz einer Primzahlzerlegung sowie deren Ein- Der Begriff der Primzahl sowie der Existenzsatz über die
deutigkeit, bis auf ihre Reihenfolge, sind im Hauptsatz Primzahlzerlegung findet sich bereits in den Elementen
der elementaren Zahlentheorie oder auch Fundamental- von Euklid (Buch VII und IX). Die Eindeutigkeit wird bei
satz der Arithmetik zusammengefasst: Euklid nicht thematisiert, obwohl eine Kombination eini-
ger von Euklid aufgestellter Propositionen diese ergeben
Jede natürliche Zahl n ≥ 2 besitzt eine Zerlegung in
hätten. Bei Euklid findet sich (Prop. VII.30) diese Aus-
Primzahlen. Diese Zerlegung ist bis auf die Reihen-
sage: Teilt eine Primzahl p ein Produkt ab von natürlichen
folge der Faktoren eindeutig bestimmt.
Zahlen a, b, dann teilt p mindestens einen der Faktoren a
Ein Beweis dieses Satzes findet sich zuerst bei C. F. Gauß bzw. b. Diese Eigenschaft nennt man heute die Primele-
in seinen Disquisitiones Arithmeticae aus dem Jahre 1801. menteigenschaft. Bei Euklid wird sie mithilfe des euklidi-
schen Algorithmus bewiesen. Nach unseren Existenz- und
Zum Beweis dieser Aussage ist lediglich noch zu zeigen,
Eindeutigkeitsbeweisen folgt die Primelementeigenschaft
dass jede natürliche Zahl n ≥ 2 höchstens eine Primfaktor-
aus der Eindeutigkeit der Primzahlzerlegung von ab. Ins-
zerlegung besitzt. Wir geben hier einen indirekten Beweis
gesamt gilt das Primzahlkriterium: Eine natürliche Zahl
an. Angenommen, es gäbe natürliche Zahlen mit nicht
p > 1 ist genau dann prim, wenn für beliebige a, b ∈ N
eindeutigen Primfaktorzerlegungen. Nach dem Wohlord-
aus p|ab stets p|a oder p|b folgt. Die Unzerlegbarkeit und
nungssatz gibt es eine kleinste Zahl n mit dieser Eigen-
die Primelementeigenschaft sind also äquivalent.
schaft. Nach dem Existenzsatz einer Primzahlzerlegung
lässt sich n schreiben als n = p1 · . . . · pr , wobei p1 der Dass die Eindeutigkeit der Primzahlzerlegung nicht selbst-
kleinste Primteiler von n sei. Nach Voraussetzung besitzt verständlich ist, zeigt Übungsaufgabe 4.21. Mehr zu Prim-
n nun aber noch mindestens eine weitere von der obigen zahlen und Teilbarkeit finden Sie in Kapitel 25 „Elemente
verschiedene Zerlegung n = q1 · . . . · qs . Dabei müssen der Zahlentheorie“.
4.5 Ganze Zahlen und rationale Zahlen 127

4.5 Ganze Zahlen und rationale Achtung: Man beachte, dass die Darstellung einer ratio-
nalen Zahl in der Form x = m n , m, n ∈ Z, n  = 0, nicht
Zahlen eindeutig ist. Nach den Regeln der Bruchrechnung gilt für
m m
m , n ∈ Z mit n = 0 die Identität =  genau dann,
Die natürlichen Zahlen haben eine dürftige algebraische n n
wenn mn = nm ist.
Struktur. Zwar ist mit je zwei natürlichen Zahlen m und n
auch m + n und m · n eine natürliche Zahl und für die natür-
liche Zahl 1 gilt 1 · n = n für alle n ∈ N, aber N besitzt kein Diese Tatsache ist ein Beispiel für eine Äquivalenzrelation
neutrales Element bezüglich der Addition, und für n ∈ N ist in Z × Z\{0}, wie sie in Kapitel 2 eingeführt wurde.
(−n) ∈/ N.
?
Daher erweitert man N zunächst durch Hinzunahme der Null Prüfen Sie für obige Paare
zu
(m, n) ∼ (m , n )
N0 = N ∪ {0} = {0, 1, 2, 3, . . . }.
die Eigenschaften einer Äquivalenzrelation nach.
Jetzt ist zwar Null ein neutrales Element bezüglich der Ad-
dition in N0 , aber die Gleichung 2 + x = 0 besitzt immer
noch keine Lösung x ∈ N0 . Um diesem Mangel abzuhelfen,
erweitern wir N0 noch einmal. Kommentar: Die Unterteilung von R in die rationalen
bzw. die irrationalen Zahlen ist nicht die einzige Möglichkeit,
Definition der ganzen Zahlen
die reellen Zahlen sinnvoll aufzuteilen. In Übungsaufgabe 4.7
werden Sie sehen, dass man die reellen Zahlen auch in die
Eine reelle Zahl x heißt ganz, falls x ∈ N oder x = 0 Menge der algebraischen bzw. der transzendenten Zahlen
oder −x ∈ N gilt. Z = {x ∈ R | x ganz} heißt Menge unterteilen kann. Diese Unterteilung ist insbesondere für die
der ganzen Zahlen. Zahlentheorie von großer Bedeutung.

In aufzählender Schreibweise lässt sich Z angeben als


Die Teilmenge Q der reellen Zahlen ist ein
Z = { . . . , −4, −3, −2, −1, 0, 1, 2, 3, 4, . . . }. archimedisch angeordneter Körper
Die auf R erklärte Addition sowie die dort gültige Multiplika- Q ist mit den von R geerbten Operationen Addition und Mul-
tion vererben sich auf Z. Dabei ist Z bezüglich der Addition tiplikation ein angeordneter Körper, in dem auch die archi-
eine abelsche Gruppe mit dem neutralen Element Null und medische Eigenschaft gilt. Wie wir schon früher bemerkt
bezüglich der Addition und Multiplikation ein kommutativer haben, gibt es keine rationale Zahl r mit r 2 = 2. Die Menge
Ring mit den neutralen Elementen 0 und 1. M = {y ∈ Q | y ≥ 0, y 2 ≤ 2} besitzt daher kein Supremum
Ein kommutativer Ring unterscheidet sich von einem Körper s0 in Q, weil für dieses s02 = 2 gelten müsste.

dadurch, dass nicht alle von Null verschiedenen Elemente ein Zum Nachweis der Irrationalität von 2 reproduzieren wir
Inverses bezüglich der Multiplikation besitzen. So sind 1 und an dieser Stelle einen auf R. Dedekind zurückgehenden ein-
−1 die einzigen Elemente in Z, die bezüglich der Multipli- fachen Beweis durch Widerspruch. Für diesen eleganten Be-
kation ein Inverses in Z besitzen. Mit einer weiteren Erwei- weis benötigen√ wir nur die Kenntnis, dass die zu untersu-
terung wird durch Einführung der rationalen Zahlen diesem chende Zahl 2 zwischen 1 und 2 liegt. Dies sehen wir aus
Mangel abgeholfen. √ 2
der Abschätzung 1 = 12 < 2 = 2 < 22 = 4 mit der
Monotonie der Quadratwurzel (Seite 116).
Definition rationaler und irrationaler Zahlen
Lemma√ √
Die Menge
Es gilt 2 ∈ Q, d. h. 2 ist irrational.
 m
Q = x ∈ R | Es gibt m, n ∈ Z, n  = 0, mit x = √
n Beweis: Angenommen 2 ist rational, d. h.:
heißt Menge der rationalen Zahlen. Eine reelle Zahl, √ p
die nicht rational ist, heißt irrational. 2 = , p, q ∈ Z, q > 0.
q

Dann gibt es m ∈ N, sodass 2 · m ∈ N gilt.√Ein Beispiel ist
Als Nenner in der Darstellung x = m n kann man statt der m = q in der obigen Bruchdarstellung von 2.
ganzen Zahl n = 0 stets eine natürliche Zahl wählen, weil
ein Vorzeichen im Nenner in den Zähler verlagert werden Wir
√ wählen die kleinste dieser Zahlen m∗ aus, für die
kann. ∗
2 · m ∈ N gilt. Dies ist möglich, da eine nichtleere Menge
128 4 Zahlbereiche – Basis der gesamten Mathematik

von natürlichen Zahlen immer ein kleinstes Element enthält Durch den eben eingeführten Satz sind die folgenden bei-
(sehen Sie hierzu den Wohlordnungssatz auf Seite 120). den Treppenfunktionen motiviert: Die Funktion [ ] : R →
√ Z, x  → [x] weist x die größte ganze Zahl kleiner oder
Nun setzen wir n√= 2m∗ − m∗ . Auch diese Zahl n muss
gleich x zu. Man verwendet anstelle von p = [x] auch &x'
natürlich sein, da √2m∗ wie auch m∗ natürlich sind, und weil
bzw. floor(x). Sie wird häufig als Gauß-Klammer oder auch
wir wissen, dass 2 > 1 ist. Multiplizieren wir nun n mit
√ Abrundungsfunktion bezeichnet. Ihr Gegenstück, die Auf-
2, so ergibt sich folgendes Produkt
√ √ √ √ rundungsfunktion, wird mit q = (x) = ceil(x) bezeichnet.
n · 2 = ( 2m∗ − m∗ ) · 2 = 2m∗ − 2m∗ . Diese Funktion weist x die kleinste ganze Zahl größer oder
gleich x zu.
Dieses Produkt
√ ∗ist offensichtlich natürlich, denn sowohl
√ 2m∗
wie auch 2m sind natürlich und es gilt 2 > 2. Damit Beispiel
haben wir einen neuen minimalen Kandidaten
√ m = n ge-
funden, der unsere Grundgleichung 2 · m ∈ N erfüllt. Wir [π ] = 3 , [−π ] = −4
√ √
stellen aber fest, dass n = ( 2−1)m∗ < m∗ , da 2−1 < 1 (π ) = 4 , (−π) = −3 ,

ist und dies widerspricht unserer√ Annahme, m = m wäre dabei ist π = 3,14159265 . . . . 
die kleinste natürliche Zahl, die √2 · m ∈ N erfüllt. Damit ist
√ sich die Annahme, 2 ist rational, nicht halten
gezeigt, dass
Mit diesen beiden Rundungsfunktionen ist eine weitere Cha-
lässt und 2 irrational sein muss. 
rakterisierung der ganzen Zahlen möglich:

Eine Verallgemeinerung dieses Beweisprinzips finden Sie ?


in Übungsaufgabe 4.44. Der klassische Irrationalitätsbeweis Warum gilt für x ∈ R die Äquivalenz

von 2 findet sich in Aufgabe 4.45. Trotz dieser Lücken- &x' = (x) ⇐⇒ x ∈ Z?
haftigkeit der rationalen Zahlen lässt sich zeigen, dass Q in
einem gewissen Sinne dicht in R liegt. Dazu benötigen wir
eine weitere Folgerung aus der archimedischen Eigenschaft
von R. Q liegt dicht in R
Sind a, b ∈ R, und gilt a < b, dann gibt es im Intervall
Folgerung (a, b) sowohl rationale als auch irrationale Zahlen.
Zu jedem x ∈ R existieren eindeutig bestimmte ganze
Zahlen p und q mit Aus dem Satz folgt, dass es zu jedem x ∈ R und zu jedem
ε > 0 stets ein r ∈ Q gibt mit |r − x| < ε. In der Sprache
p ≤x <p+1 bzw. q − 1 < x ≤ q.
der konvergenten Folgen (siehe Kapitel 8) bedeutet dies, dass
jede reelle Zahl als Grenzwert einer Folge rationaler Zahlen
Beweis: Wir beweisen nur die erste Aussage. Dazu neh- darstellbar ist. Später in Kapitel 19 werden wir für diese Ei-
men wir zunächst x ≥ 0 an. Nach der archimedischen Ei- genschaft die Bezeichnung dicht einführen.
genschaft gibt es ein n ∈ N mit n > x, und nach dem Wohl-
ordnungssatz existiert
Beweis: Wir wählen nach der archimedischen Eigenschaft
2
m = min{n ∈ N | n > x}. zunächst eine natürliche Zahl n > b−a oder n1 < b−a
2 und
suchen ein m ∈ Z mit
Definiert man p = m − 1, dann gilt p ≤ x < p + 1. Diese
m m+1
ganze Zahl p ist eindeutig bestimmt. Denn, wenn für eine a< < < b.
n n
ganze Zahl q = p auch
Eine geeignete Wahl ist m = [n · a] + 1, also m ∈ Z und
q ≤x <q +1 m − 1 = [n · a] ≤ n · a < m.
gilt, dann können wir ohne Einschränkung der Allgemeinheit Es ist dann
q < p annehmen. Es folgt aber q + 1 ≤ p ≤ x < q + 1, m m+1 m−1 2
also q + 1 < q + 1. Daher muss p = q sein. Den Fall a< < = + < a + (b − a) = b.
n n n n
x < 0 führt man auf den eben behandelten Fall zurück, in
dem man ein geeignetes k ∈ Z zu x addiert, sodass x + k ≥ 0 m m+1
Also liegen die rationalen Zahlen r1 = und r2 =
n n
gilt. Ein solches k existiert wegen der archimedischen Eigen- in (a, b) und damit auch r3 = r1 +r
2 .
2
schaft. 
Die Konstruktion lässt sich weiter fortsetzen, sodass sogar
beliebig viele rationale Zahlen in (a, b) liegen. Sind r1 und
? r2 die obigen rationalen Zahlen, dann ist für jedes k ∈ N
Vervollständigen Sie den Beweis des letzten Satzes durch
r2 − r1
einen Beweis der zweiten Aussage. xk = r1 + √
k 2
4.5 Ganze Zahlen und rationale Zahlen 129


eine irrationale Zahl mit r1 < xk < r2 , weil sonst 2 rational Ziffern 0 und 1 zur Verfügung, denn 0 ≤ zj < g. Es gilt:
wäre.
42 = 32 + 8 + 2
Zwischen je zwei rationalen Zahlen liegen also unend- = 1 · 25 + 0 · 24 + 1 · 23 + 0 · 22 + 1 · 21 + 0 · 20
lich viele irrationale Zahlen, insbesondere liegen wegen
= (101010)2 .
[r1 , r2 ] ⊆ (a, b) unendlich viele irrationale Zahlen im In-
tervall (a, b). 
Die notierte Zerlegung lässt sich übrigens elegant mit-
hilfe des sogenannten euklidischen Algorithmus (siehe Ab-
Wir sind also in der Lage, jede reelle Zahl x eindeutig in der schnitt 25.2) bestimmen. Man nennt dies auch „fortgesetzte
Form Division mit Rest“:
42 = 21 · 2 + 0
x = [x] + ρ , [x] ∈ Z und ρ ∈ R , 0 ≤ ρ < 1
21 = 10 · 2 + 1
darzustellen. Hieraus ergibt sich ein einfacher Beweis eines 10 = 5·2 + 0
wichtigen Satzes der elementaren Zahlentheorie: 5 = 2·2 + 1
2 = 1·2 + 0
Division mit Rest 1 = 0·2 + 1
Zu einer ganzen Zahl n und einer positiven ganzen Zahl
g gibt es eindeutig bestimmte ganze Zahlen q, r mit
Liest man die Reste von unten nach oben, so ergibt sich ge-
n = q · g + r, 0 ≤ r < g. rade die Darstellung (101010)2 . 

r heißt der Rest modulo g.


Mit dem Beweisprinzip der vollständigen
Induktion lassen sich wichtige
Zum Beweis muss man nur in die obige Darstellung x =
Summenformeln beweisen
[x] +  den Ausdruck x = gn einsetzen. Offensichtlich ist
, -
dann q = gn und r = n − qg. Weiter ergibt sich hieraus Wir vervollständigen die Aussagen zu Zahlen durch einige
eine nützliche Aussage zur Darstellung von Zahlen. Beispiele für Beweise mithilfe der vollständigen Induktion.
Wie gesehen, wendet man das Prinzip an, wenn eine Aussage
A(n) für alle natürlichen Zahlen n bewiesen werden soll. Wir
Die g-al-Darstellung natürlicher Zahlen werden dabei auch Varianten des Induktionsprinzips kennen-
Sei g ∈ N, g ≥ 2. Zu jedem a ∈ N gibt es dann eindeutig lernen.
bestimmte natürliche Zahlen n ∈ N0 und z0 , . . . , zn ∈ Beweise von Summenformeln gelten allgemein als Inbegriff
N0 mit 0 ≤ zj < q für 0 ≤ j ≤ n und zn > 0, sodass
des Induktionsbeweises, dabei dienen sie nur zum Einüben
gilt: des Induktionsschemas. Entdeckendes Lernen kann man hier
!
n nicht praktizieren, da die zu beweisenden Formeln bereits ge-
a= zj · g j geben sind, ohne dass klar wird, wie sie gefunden wurden.
j =0 Wir geben ein typisches Beispiel, bei dem wir auch die Sum-
menschreibweise einüben. Weitere Beispiele finden sich auf
= zn · g n + zn−1 · g n−1 + . . . + z1 · g + z0 · g 0 .
Seite 130.
Dabei ist zu beachten, dass für alle Grundzahlen g gilt:
Beispiel Für jedes n ∈ N und q ∈ R\{1} gilt die geome-
g 0 = 1. Als Kurzschreibweise für diese Summendar-
trische Summenformel
stellung schreibt man manchmal:
!n
1 − q n+1
A(n) : qk = .
a = (zn , . . . , z0 )g . 1−q
k=0

Um dies zu zeigen, prüfen wir zuerst


Beispiel Wir betrachten ein einfaches Beispiel, indem wir
(1 − q)(1 + q) = 1 − q 2 = 1 − q 1+1 ,
die Zahl 42 ausführlich zur Basis 10 und zur Basis 2 darstel-
len. Es ist d. h. A(1) gilt. Nun folgt die Behauptung mit dem Indukti-
onsschritt (d. h. wir zeigen A(n) ⇒ A(n + 1)):
42 = 40 + 2 = 4 · 101 + 2(·100 ) = (42)10 , (1 − q)(1 + · · · + q n + q n+1 )

was der gewohnten Kurznotation 42 entspricht. Zur Basis 2 = (1 − q)(1 + · · · + q n ) + (1 − q)q n+1
sieht die Zahl 42 etwas anders aus. Hier haben wir nur die = 1 − q n+1 + q n+1 − q n+2 = 1 − q n+2 .
130 4 Zahlbereiche – Basis der gesamten Mathematik

Beispiel: Vollständige Induktion


Mithilfe des Beweisprinzips der vollständigen Induktion zeige man die folgenden Identitäten:

!
n !
n !
n ' (2 '!
n (2
n(n + 1) n(n + 1)
k= , (2k − 1) = n2 , k3 = = k .
2 2
k=1 k=1 k=1 k=1

Problemanalyse und Strategie: In allen drei Beispielen ist zunächst mit n = 1 der Induktionsanfang zu prüfen.
Die Induktionsschritte ergeben sich relativ direkt durch Anwenden der Induktionsannahme nach Abspalten des letzten
Summanden, wenn die jeweilige Summe bis n + 1 betrachtet wird.

Lösung: Da der letzte Ausdruck gerade (n+1)2 entspricht, folgt


Wir beginnen mit der Summe über die ersten n natür- A(n + 1) aus A(n), und damit gilt auch diese Summen-
lichen Zahlen, d. h., wir zeigen, dass für alle n ∈ N formel für jedes n ∈ N.
gilt:
! n
n(n + 1) Nun betrachten wir noch die letzte Gleichung. Die Aus-
A(n) : k= . sage A(n) ist
2
k=1
Diese Aussage haben wir bereits auf Seite 125 durch !
n ' (2 '!
n (2
n(n + 1)
Indexverschiebung gelöst. Für eine Induktion sehen wir k3 = = k
2
zunächst, dass k=1 k=1
2
1 · (1 + 1) = (1 + 2 + · · · + n) ,
A(1) : 1= =1
2
wahr ist. wobei sich die Umformung aus der ersten Summenfor-
Induktionsschritt: Wir zeigen, dass für jedes n ∈ N mel ergibt.
A(n) ⇒ A(n + 1) gilt. Mit der Induktionsvorausset-
Der Induktionsanfang, die Aussage A(1), ist wahr, we-
zung ist ' (2
1 gen 13 = 1·2
2 = 12 = 1.
1 + 2 + · · · + n +(n + 1) = n(n + 1) + (n + 1)
 2
=n(n+1)/2
'
( Induktionsschritt: Wir zeigen wieder, dass sich aus
1 A(n) die Aussage A(n + 1) ableiten lässt, indem wir
= (n + 1) n+1
2 folgende Umformungen vornehmen:
n+2
= (n + 1)
2 !
n
(n + 1)( (n + 1) + 1 ) k3 +(n + 1)3
= .
2 k=1

Wir haben aus A(n) die Aussage A(n + 1) gefolgert. =n2 (n+1)2 /4
Nach dem Induktionssatz ist somit die Aussage A(n) nach Vor.
für alle n ∈ N wahr. 1 2
= n (n + 1)2 + (n + 1)3
Für jedes n ∈ N soll die Gleichung 4 ' (
2 1 2
!
n = (n + 1) n + (n + 1)
A(n) : (2k − 1) = 1+3+5+· · ·+2n−1 = n2 4
k=1 n2 + 4n + 4
= (n + 1)2
gezeigt werden. 4
2 (n + 2)
2
Der Induktionsanfang A(1) ist offensichtlich wahr, = (n + 1)
4
denn es gilt 1 = 12 . ' (
(n + 1)(n + 2) 2
Für den Induktionsschritt betrachte man = .
2
!
n
(2k − 1) + (2n + 1) = n2 + (2n + 1).
k=1
Aus dem Induktionssatz lässt sich wieder schließen,
 dass die obige Summenformel für alle natürlichen Zah-
=n2 len gültig ist.
nach Vor.
4.5 Ganze Zahlen und rationale Zahlen 131

Für die geometrische Summenformel bietet sich auch ein Auch die binomische Formel folgt mittels
direkter Beweis ohne Induktion an, denn es gilt: Induktion
(1 − q)(1 + q + · · · + q n ) Der Name Binomialkoeffizient ergibt sich aus der allgemei-
= 1 + q + q 2 + · · · + q n − q − q 2 − · · · − q n − q n+1 nen binomischen Formel, wenn α = n ∈ N eine natürliche
Zahl ist.
= 1 − q n+1 .

Hier heben sich alle Summanden bis auf den ersten und den Binomischer Lehrsatz und binomische Formel
letzten, −q n+1 , weg. Man kann sich dies wie das Zusam- Für a, b ∈ R und n ∈ N gilt:
menschieben eines Teleskops veranschaulichen, daher nennt
n ' (
!
man eine solche Summe auch Teleskopsumme.  n
(a + b)n = a n−k bk .
k
k=0
Als letzte Summenformel beweisen wir den wichtigen bino-
mischen Lehrsatz. Dazu sind jedoch einige Vorbereitungen n n
erforderlich. Es sei daran erinnert, dass a 0 = b0 = 0 = n = 1 ist für
a, b ∈ R und n ∈ N.
Definition des Binomialkoeffizienten
Beweis: Wir beweisen diesen Satz wieder induktiv nach
' (α, k ∈ N0 definiert man den Binomialkoeffizienten
Für n. Die Aussage (a + b)1 = a + b für n = 1 ist wahr. Es ist
α
über weiter n ≥ 1, und es gilt A(n), also die Aussage:
k
' ( ' ( ' (
⎧ n n n 0 n n−1 1 n 0 n
' ( ⎨1 für k = 0, (a + b) = a b + a b + ··· + a b .
α 0 1 n
= α(α − 1) . . . (α − k + 1)
k ⎩ für k ≥ 1.
1 · 2 · ... · k Multipliziert man diese Gleichung mit (a +b) und verwendet
das Distributivgesetz, dann folgt:
Diese Definition kann auch auf reelle oder gar komplexe Zah-
(a + b)n+1 = (a + b)(a + b)n = a(a + b)n + b(a + b)n .
len erweitert werden. Es gilt dabei eine für uns nützliche re-
kursive Identität. Wir setzen die Aussage A(n) in beide Summanden ein und
erhalten:
Satz (Additionsformel für Binomialkoeffizienten)
Für alle α, k ∈ N0 gilt: (a + b)n+1
' ( ' ( ' (
' ( ' ( ' ( n n+1 n n n
α+1 α α = a + a b + ··· + abn
= + . 0 1 n
k+1 k k+1 ' ( ' ( ' (
n n n n n n+1
+ a b + ··· + ab + b .
0 n−1 n
α  α  α+1
Beweis: Für k = 0 gilt 0 + 1 = 1+α = α+1 = 0+1 .
Wir wenden nun die Additionsformel an und fassen Sum-
manden
n+1 gleicher
n+1 Potenzen zusammen. Zudem ersetzen wir
Für k ≥ 1 ist =
0 n+1 durch 1. Der obige Ausdruck wird dann zu:
' (
α α(α − 1) . . . (α − 1 − k + 1)(α − k) ' ( ' (
= n+1 n n+1
k+1 1 · 2 · · · · · k · (k + 1) a n+1 + a b + ··· + abn + bn+1 ,
' ( 1 n
α α−k  
= · . =(n0)+(n1) n
=(n−1 )+(nn)
k k+1

Also gilt: was gerade die Aussage A(n + 1) darstellt. 

' ( ' ( ' (' (


α α α α−k Aufgrund des Additionstheorems
  kann man die Binomi-
+ = 1+
k k+1 k k+1 alkoeffizienten nk mithilfe des sogenannten Pascal’schen
' ( Dreiecks visualisieren, benannt nach B. Pascal (1623–1662),
α α+1
= siehe Abbildung 4.9. Das Dreieck entsteht aus den beiden
k k+1
' ( einfachen Regeln
α+1
= ,
k+1 die erste und die letzte Zahl jeder Zeile ist 1.
die (k − 1)-te und die k-te Zahl in der n-ten Zeile haben
und die Behauptung ist für jedes k ∈ N0 bewiesen.  als Summe die k-te Zahl in der (n + 1)-ten Zeile.
132 4 Zahlbereiche – Basis der gesamten Mathematik

 
1 Mit der eben gewonnenen Schreibweise lässt sich nk schrei-
ben als:
' (
n n(n − 1) · · · (n − k + 1)
1 1 =
k 1 · 2···k
n(n − 1) · · · (n − k + 1) (n − k) · · · 1
=
1 2 1 1 · 2···k (n − k) · · · 1
n! n!
= =
k!(n − k)! (n − k)!k!
1 3 3 1 ' (
n! n
= = .
(n − k)!(n − (n − k))! n−k
1 4 6 4 1  
Es gibt eine wichtige kombinatorische Interpretation von nk .
+ Der Ausdruck lässt sich interpretieren als die Anzahl der ver-
1 5 10 10 5 1 schiedenen Teilmengen mit k Elementen in einer Menge mit
n Elementen.

1 6 15 20 15 6 1 Beispiel In der Vorlesung sitzen 10 Studenten. Der Dozent


möchte einen Evaluationsbogen austeilen, hält jedoch nur 8
Abbildung 4.9 Das Pascal’sche Dreieck. Jede Zahl entsteht als Summe der Exemplare vor. Wie viele mögliche Kombinationen gibt es,
beiden darüber stehenden Zahlen. Das Dreieck ist symmetrisch zur vertikalen die 8 Bögen auf die 10 Studenten zu verteilen?
Achse.
Hier ist n = 10 und k = 8:
' (
10 10! 10! 10 · 9
Die erste Eigenschaft
  desPascal’schen
 Dreiecks entspricht = = = = 45.
8 8! (10 − 8)! 8! 2! 2
der Tatsache, dass n0 = nn = 1 gilt. Die zweite Regel ist
gerade das Additionstheorem für die Binomialkoeffizienten.   10
Hier sieht man schnell ein, dass 10
8 = 2 gelten muss, da
Wir beobachten, dass die Zahlen des Pascal’schen Dreiecks man ja auch das Ereignis „Student erhält keinen Bogen“ hätte
„symmetrisch zur Höhe“ sind. Das bedeutet: betrachten können, was natürlich zum gleichen Ergebnis füh-
ren muss.
' ( ' (
n n In Kapitel 25 werden wir uns ausführlicher mit kombinato-
= .
k n−k rischen Fragestellungen dieser Art beschäftigen. 

Um diese Identität Orientiert man sich an (a + b)2 = a 2 + 2ab + b2 bzw.


  einzusehen, schreiben wir die Binomi-
alkoeffizienten nk etwas um. Zunächst definieren wir für (a + b)3 = a 3 + 3a 2 b + 3ab2 + b3 und betrachtet dazu (a +
n ∈ N die Fakultät : b)n = (a + b)(a + b) . . . (a + b), dann wird offensichtlich,

n Faktoren
n! = 1 · 2 · 3 . . . n und 0! = 1. dass (a + b)n eine Summe von Zahlen der Gestalt a n−k bk
ergibt. Jeder dieser Terme taucht genauso oft auf, wie man aus
Man spricht dies „n Fakultät“. n! ist offensichtlich das Pro- dennFaktoren k Faktoren auswählen kann, und diese Anzahl
dukt der ersten n natürlichen Zahlen. ist nk . Das ist auch ein Beweis des binomischen Satzes!

?
? Zeigen Sie folgende weitere Folgerung aus der binomischen
Beweisen Sie für n ∈ N0 die rekursive Definition Formel:
! n ' (
n
= 2n
(n + 1)! = (n + 1)n! k
k=0

mit der Festlegung 0! = 1.


Die entsprechende
n kombinatorische Interpretation von
n
k=0 k = 2 n ist, dass eine Menge mit n Elementen ge-

nau 2n Teilmengen besitzt. Durch die Spezialisierung a = 1,


Während 3! = 3 · 2 · 1 = 6 eine übersichtliche Zahl
b = −1 erhält man aus der binomischen Formel noch die
ist, ist 10! = 3628800 bereits bedeutend größer. 20! =
Identität
2432902008176640000 ist schon eine sehr große Zahl. Man ' ( ' ( ' ( ' (
sieht hier, dass n! sehr schnell wächst. 100! hat z. B. 158 n n n n
− + − · · · + (−1)n = 0.
Dezimalstellen – es ist 100! = 9.3326 . . . · 10157 . 0 1 2 n
4.5 Ganze Zahlen und rationale Zahlen 133

1
Wir betrachten ein weiteres Beispiel zur Anwendung der (b) Setzt man g1 = g, dann ist g1 > 1, und nach Aussage
vollständigen Induktion, die folgende nach Jacob Bernoulli (a) gibt es zu C = 1
ein n ∈ N mit g1n > 1
ε ε. Hieraus
(1655–1705) benannte, aber schon vorher bekannte Unglei- folgt aber sofort:
chung. g n < ε. 

Bernoulli-Ungleichung
Beispiel Als letztes Beispiel stellen wir uns die Frage, für
Ist h ∈ R und h ≥ −1, dann gilt für alle n ∈ N: welche n ∈ N die Ungleichung 2n > n2 gilt.

(1 + h)n ≥ 1 + nh. Wir nähern uns einer Lösung über eine erste Überprüfung von
A(n) für kleine natürlichen Zahlen. Siehe dazu diese Tabelle:
Für h > −1, h = 0 und n ≥ 2 gilt sogar die strikte
Ungleichung n 1 2 3 4 5 6 7 8
n2 1 4 9 16 25 36 49 64
(1 + h)n > 1 + nh.
2n 2 4 8 16 32 64 128 256

Beweis: Auch diese Aussagen lassen sich mit Induktion Offensichtlich stimmt die Ungleichung für einige n ∈ N,
nach n beweisen. Die erste Aussage der Bernoulli’schen Un- speziell für n = 5. Wir stellen die Vermutung auf, dass die
gleichung ist für n = 1 offensichtlich wegen (1 + h)1 = Ungleichung für alle n ≥ 5 gilt, denn 25 = 32 > 25 = 52 .
1 + 1 · h korrekt. Mit anderen Worten müssen wir zeigen, dass für alle n ≥ 5
gilt:
Für den Induktionsschritt gelte für beliebiges n ∈ N die Un- A(n) ⇒ A(n + 1)
gleichung
Durch Multiplikation der Ungleichung 2n > n2 mit 2 folgt:
(1 + h)n ≥ 1 + nh.
Dann folgt durch Multiplikation mit der nicht negativen Zahl 2n+1 = 2 · 2n > 2n2 = n2 + n · n.
1 + h:
Wegen n ≥ 5 ist n · n ≥ 5n > 2n + 1 oder zusammengefasst:
(1 + h)n+1 ≥ (1 + nh)(1 + h) = 1 + (n + 1)h + nh2 .
2n+1 > n2 + 2n + 1 = (n + 1)2 .
Da n und h2 nicht negativ sind, gilt:
Damit ist die Implikation A(n) → A(n + 1) bewiesen. 
2
1 + (n + 1)h + nh ≥ 1 + (n + 1)h. Statt mit der Ungleichungskette n2 ≥ 5n > 2n + 1 zu ar-
gumentieren, kann man mit einer erneuten Induktion direkt
Und damit ist die erste Ungleichung für alle natürlichen Zah-
n2 > 2n + 1 nachweisen. Da eine solche „Induktion in der
len bewiesen. 
Induktion“ häufig vorkommt, zeigen wir diesen alternativen
Weg.
? Wir prüfen A(n) : n2 > 2n + 1 für n = 1 (stimmt nicht
Überlegen Sie sich, wann in der ersten Ungleichung das wegen 1 < 3), für n = 2 (stimmt nicht wegen 4 < 5) und für
Gleichheitszeichen gilt, und führen Sie den Beweis der strik- n = 3 (stimmt wegen 9 > 7). Damit können wir versuchen,
ten Bernoulli-Ungleichung aus. A(n) für n ≥ 3 nachzuweisen. Wir setzen A(n) als wahr
voraus und betrachten A(n + 1) : (n + 1)2 > 2(n + 1) + 1.
Die linke Seite der Ungleichung schätzen wir mit A(n) wie
Folgerung folgt ab:
Sei 0 < g ∈ R.
(n + 1)2 = n2 + 2n + 1 > (2n + 1) + 2n + 1 = 2n + 2 + 2n.
(a) Ist g > 1, dann gibt es zu jedem C ∈ R ein n ∈ N mit
g n > C. Die rechte Seite der Ungleichung von A(n + 1) lässt sich als
(b) Ist 0 < g < 1, dann gibt es zu jedem 0 < ε ∈ R ein 2n + 2 + 1 notieren. A(n + 1) ist somit richtig, wenn 2n > 1
n ∈ N mit g n < ε. gilt, und da n ≥ 3 gilt, ist die Ungleichung n2 > 2n + 1 für
n ≥ 3 bewiesen. Im eigentlichen Beweis gilt n ≥ 5 > 3, und
wir können diese Ungleichung für den eigentlichen Beweis
Beweis: nutzen. 
(a) Sei h = g − 1, dann ist nach Voraussetzung h > 0 und
die Bernoulli’sche Ungleichung liefert g n = (1 + h)n ≥ Abschließend sei noch einmal festgehalten, dass die Induk-
1 + nh. tionsverankerung ein wesentlicher Bestandteil des Beweis-
Nach der archimedischen Eigenschaft von N gibt es ein prinzips der vollständigen Induktion ist. Die Implikation
n ∈ N mit nh > C − 1. Für dieses n ist dann g n > C. A(n) ⇒ A(n + 1) kann für alle n ∈ N richtig sein, aber
134 4 Zahlbereiche – Basis der gesamten Mathematik

die Aussage A(n) gilt für kein einziges n ∈ N, wenn es keine Hier tauchen „Quadratwurzeln aus negativen Zahlen“ auf.
Induktionsverankerung gibt! Solche „Zahlen“ können aber wie bereits gesagt keine reellen
Zahlen sein. Die Frage ist, ob sie sinnvolle Größen darstellen.
Beispiel Hierzu betrachten wir für n ∈ N die Aussage
Beispiel Ein Beispiel einer solchen Lösungsformel ist
!
n
n(n + 1)
A(n) : k= + 2012. die pq-Formel, die normierte quadratische Gleichungen
  der
2 p p 2
k=1 Form x + px + q = 0 zu x1,2 = − 2 ±
2
2 −q
Aus einem früheren Beispiel wissen wir bereits, dass die Aus- löst. Auch unnormierte quadratische Gleichungen der Gestalt
sage falsch ist, obwohl die Implikation ax 2 + bx + c = 0 mit reellen Zahlen a, b, c ∈ R (a = 0)
lassen sich nach Teilen durch a mit der Substitution p = ab
A(n) → A(n + 1) bzw. q = ac in die normierte Gestalt überführen. Diese Lö-
sungsformel gewinnt man direkt mithilfe der sogenannten
für alle n ∈ N richtig ist. Dass die Implikation korrekt ist,
quadratischen Ergänzung, einem Verfahren, das schon den
sieht man wie folgt:
Babyloniern vor über 5000 Jahren bekannt war. Wir wollen
n(n+1)
Gilt nämlich 1 + 2 + · · · + n = 2 + 2012, dann folgt: es für die Gleichung x 2 − 2x + 3 = 0 direkt vorführen:
n(n + 1) x 2 − 2x + 3 = 0 ⇐⇒ x 2 − 2x + 3 + 0 = 0 + 0.
1 + 2 + · · · + n + (n + 1) = + 2012 + (n + 1)
2
n(n + 1) (n + 1)(n + 2) Man addiert auf beiden Seiten der Gleichung eine Null, die
= + n + 1 + 2012 = + 2012, man auf der linken Seite jedoch kompliziert notiert:
2 2
was gerade der Aussage A(n + 1) entspricht. Der Indukti- x 2 − 2x + 3 + (1 − 1) = 0 + 0
onsbeweis versagt hier, weil die Induktionsverankerung A(1)
nicht gilt.  ⇐⇒ x 2 − 2x + 1 + (3 − 1) = 0.

Die Addition von (1 − 1) war in diesem Fall die quadratische


Ergänzung. Sie wirkt unscheinbar, jedoch hat man mit ihrer
4.6 Komplexe Zahlen Hilfe viel gewonnen. Die ersten drei Summanden, x 2 −2x+1,
lassen sich zu (x − 1)2 zusammenfassen, und so ergibt sich
die nächste Umformung:
Wir haben die reellen Zahlen als angeordneten Körper einge-
führt, in dem zusätzlich noch das Vollständigkeitsaxiom (V) (x − 1)2 + 2 = 0 ⇐⇒ (x − 1)2 = −2.
gilt. Letzteres hat uns die Existenz von Quadratwurzeln aus √
nicht negativen reellen Zahlen beschert bzw. allgemeiner die Es muss also x = ± −2 + 1 sein, was man direkt an der
Existenz von k-ten Wurzeln, k ∈ N, k ≥ 2, aus nicht ne- Klammer ablesen kann. 
gativen reellen Zahlen. Diese Eigenschaft unterscheidet den
Körper Q der rationalen Zahlen von den reellen Zahlen, denn ?
in Q ist z. B. die Gleichung x 2 = 2 nicht lösbar. Führen Sie die quadratische Ergänzung für die allgemeine
normierte quadratische Gleichung x 2 + px + q = 0 durch.
Mittels komplexer Zahlen lassen sich in R
unlösbare Gleichungen lösen G. Cardano (1501–1576) stellt in der Ars magna (1545 in
Nürnberg erschienen) folgende Aufgabe:
Aber auch in R haben ganz einfache algebraische Gleichun-
„Zerlege die Zahl 10 so in zwei Summanden, dass ihr
gen wie z. B. x 2 + 1 = 0 oder x 2 − 2x + 3 = 0 keine Lö-
Produkt die Zahl 40 ergibt“.
sungen. Der Grund ist, dass das Quadrat einer reellen Zahl
immer größer oder gleich null ist (siehe Abschnitt 4.2). Nehmen wir an, es gibt solche Zerlegungen und benennen wir
die beiden Summanden mit x bzw. y, so soll also in moderner
? Schreibweise Folgendes gelten:
Skizzieren Sie Graphen der zu den zwei letztgenannten Glei-
chungen gehörenden Funktionen und argumentieren Sie an- 10 = x + y und 40 = xy.
hand dieser Schaubilder, wieso x 2 +1 = 0 bzw. x 2 −2x+3 =
0 keine reellen Lösungen besitzen können. Einsetzen von y = 10 − x in die zweite Gleichung ergibt die
quadratische Gleichung:

Wendet man auf x 2 − 2x + 3 = 0 formal eine Lösungs- x 2 − 10x + 40 = 0


formel für quadratische Gleichungen an, so erhält man diese
Lösungen: welche bei formaler Anwendung die Lösungen
√ √ √ √
x1,2 = 1 ± 1 − 3 = 1 ± −2. x1,2 = 5 ± 25 − 40 = 5 ± −15
4.6 Komplexe Zahlen 135

ergibt, und auch hier treten wieder Wurzeln aus negativen Wenn es überhaupt einen Körper gibt, der die reellen Zahlen
Zahlen auf. Tatsächlich ist x1 + x2 = 10 und x1 · x2 = 40, R als Teilkörper enthält und in welchem es ein Element i mit
wenn man wie mit reellen Zahlen rechnet. i2 = −1 gibt, dann gibt es bezüglich der Teilmengenrela-
tion ⊆ auch einen kleinsten solcher Körper, und diese Er-
Auch bei der Lösung kubischer Gleichungen stießen Car-
weiterung von R ist bis auf Isomorphie eindeutig bestimmt.
dano und seine Zeitgenossen auf Quadratwurzeln aus nega-
Die Operationen der Addition und der Multiplikation und die
tiven Zahlen. Man vergleiche hierzu den historischen Exkurs
Existenz von Inversen von Elementen z = 0 sind durch die
über die Entstehungsgeschichte der komplexen Zahlen auf
folgenden, oben motivierten Formeln
Seite 144.
Um die Konstruktion des Körpers der komplexen Zahlen zu z + w = (a + c) + (b + d)i
motivieren, machen wir die folgende Annahme: Es gibt einen zw = (ac − bd) + (ad + bc)i
Körper K, der den Körper R als Teilkörper enthält und der 1 a −b
ein Element i enthält, für das i2 = −1 gilt. Wie hat man in = 2 + 2 i =& a +&
bi für z = 0
z a +b 2 a + b2
einem solchen Körper zu rechnen?
mit den Operationen auf R verknüpft. Offen geblieben in un-
Als erstes halten wir fest, dass i ∈
/ R gilt. Aufgrund der
serer heuristischen Betrachtung ist die entscheidende Frage.
Körperaxiome enthält K alle „Zahlen“ der Gestalt z = a +bi
mit a, b ∈ R, und die Darstellung von z ∈ K in dieser Form
ist eindeutig. Was ist i?
? Aber die Darstellung z = a + bi mit a, b ∈ R legt nahe,
Weisen Sie diese zwei Aussagen anhand der Körperaxiome
dass als wesentliches Bestimmungsstück der zu definieren-
nach.
den komplexen Zahlen die reellen Zahlen a und b anzusehen
sind, also das Paar (a, b) ∈ R × R. Das folgende Modell
Betrachtet man jetzt die Menge für die komplexen Zahlen geht auf Sir William Hamilton
(1805–1865) zurück, der diese 1831 so eingeführt hat. Al-
C = {a + bi ∈ K | a, b ∈ R}, ternative Einführungen sind möglich und finden sich in der
Box auf Seite 144f. Wir führen die komplexe Zahlen über
so stellt man fest, dass bereits C ein Körper bezüglich der das Standardmodell C = R2 ein.
auf K erklärten Addition und Multiplikation ist. Wir ge-
ben einen unvollständigen Beweis, da wir nicht alle Körpe- Komplexe Zahlen als Paare reeller Zahlen
raxiome nachprüfen. Eine komplexe Zahl ist ein Element aus der Menge

Beweis: Wir zeigen: Für z, w ∈ C gilt auch z ± w ∈ C C = {(a, b) | a ∈ R, b ∈ R} = R × R,


sowie zw ∈ C, und für z  = 0 ist auch z−1 ∈ C enthalten.
also ein geordnetes Zahlenpaar.
Dafür seien z = a + bi und w = c + di mit a, b, c, d ∈ R.
Wir beginnen mit der ersten Aussage:
Definiert man auf C für (a, b) ∈ C und (c, d) ∈ C durch:
z ± w = (a + bi) ± (c + di) = (a + c) ± (b + d)i.
(a, b) + (c, d) = (a + c, b + d)
Und da auch a + c bzw. b + d reelle Zahlen sind, folgt die
Behauptung. Analoges gilt für die zweite Aussage: eine Addition und durch

zw = (a + bi)(c + di) = ac + bic + adi + bdi2 . (a, b) · (c, d) = (ac − bd, ad + bc)

Da i2 = −1 gilt, folgt sofort zw = (ac − bd) + (ad + eine Multiplikation, dann lässt sich folgender Satz formu-
bc)i, und somit liegt auch das Produkt zweier Elemente der lieren:
Menge C wieder in C. Zuletzt betrachten wir das Inverse Eigenschaften von C
eines Elements z aus C mit z  = 0. Aus z = a + bi  = 0 folgt:
(a) (C, +, ·) ist ein Körper, den wir den Körper der
1 a − bi a − bi komplexen Zahlen nennen.
= = 2 , (b) Die Teilmenge
a + bi (a + bi)(a − bi) a + b2

also: CR = {(a, 0) | a ∈ R} ⊆ C
1 a −b
= 2 + 2 a +&
i =& bi
z a + b2 a + b2 ist ein zu R isomorpher Teilkörper von C. Wir iden-
tifizieren daher (a, 0) mit a.
a, &
mit reellen Zahlen & b. Damit gilt 1/z ∈ C. 
136 4 Zahlbereiche – Basis der gesamten Mathematik

Analoges ergibt sich für das Produkt (z2 z3 ); für die Wei-
(c) Für das Element i = (0, 1) ∈ C gilt:
terführung der Rechnung siehe Aufgabe 4.34.
i2 = (0, 1)2 = (−1, 0). Das noch fehlende Distributivgesetz folgt direkt aus dem
Distributivgesetz für R.
Wir nennen i die imaginäre Einheit. (b) Dem Beweis für die zweite Aussage widmen wir den fol-
(d) Jedes z = (a, b) ∈ C ist darstellbar durch genden Abschnitt, dem wir hier nicht vorgreifen wollen.
(c) Wir rechnen direkt nach: (0, 1)2 = (0, 1)(0, 1) = (0 ·
z = (a, b) = (a, 0) + (b, 0)(0, 1) = a + bi. 0 − 1 · 1, 0 · 1 + 1 · 0) = (−1, 0).
(d) Man sieht sofort, dass (a, 0) + (0, b) = (a, b) gilt. Au-
Identifiziert man CR mit R, also speziell (−1, 0) mit −1, so ßerdem gilt offensichtlich a(1, 0) = (a, 0) für reelles
besitzt jede komplexe Zahl z die eindeutige Standarddar- a bzw. b(0, 1) = (0, b) für reelles b. Dann ist aber
stellung z = (a, b) = (a, 0) + (0, b) = a(1, 0) + b(0, 1) und
z = a + bi, a, b ∈ R. somit stimmt Aussage (d). 

Dabei wurde i2 = −1 aus (c) und die Multiplikation von C


verwendet. Dann schreibt sich die Multiplikationsregel auch
als: Die reellen Zahlen lassen sich in C
wiederfinden
(a + bi)(c + di) = (ac − bd) + (ad + bc)i.
In der obigen Standarddarstellung z = a + bi nennt man Wir beschäftigen uns nun ausführlich mit dem Teil (b). C
a den Realteil und b den Imaginärteil zur Zahl z und ver- enthält wie angekündigt als Teilmenge eine Kopie von R. In
wendet üblicherweise die Bezeichnungen a = Re (z) bzw.
b = Im (z). CR = {(a, 0) | a ∈ R}

addieren und multiplizieren sich die enthaltenen Elemente


Beweis: wie die entsprechenden reellen Zahlen. Das bedeutet, es gel-
(a) Man prüft leicht nach, dass (C, +) eine abelsche Gruppe ten mit a, c, a  ∈ R die Gleichungen:
ist mit dem neutralen Element 0 = (0, 0) und dem zu
(a, b) inversen Element, dem Negativen, (−a, −b). (a, 0) + (c, 0) = (a + c, 0),
Dass auch (C\{0}, ·) eine abelsche Gruppe ist, kann (a, 0) · (c, 0) = (ac, 0),
durch Nachrechnen gezeigt werden. Das neutrale Ele-
ment der Multiplikation ist 1 = (1, 0). Bei der Suche (a, 0) = (a  , 0) ⇔ a = a.
des Inversen stößt man auf ein etwas schwierigeres Glei-
Damit ist CR selbst ein Körper, und die Abbildung
chungssystem: Gesucht wird ein (x, y), welches für fe-
j : R → CR mit j (a) = (a, 0) ist ein Körperisomorphismus.
stes (a, b) = (0, 0) folgende Gleichung löst:
Wir identifizieren R mit seiner Kopie CR ⊆ C, schreiben also
(a, b)(x, y) = (1, 0). statt dem Paar (a, 0) einfach a. Ferner ergibt die Multiplika-
tion von (a, b) ∈ C = R2 mit der Zahl (r, 0) ∈ CR das
Man muss dazu das lineare Gleichungssystem ax −by =
Resultat
1 und bx + ay = 0 lösen, wobei a, b  = 0 und somit
(r, 0)(a, b) = (ra, rb),
a 2 + b2 > 0 ist. Es ergibt sich nach kurzem Rechnen das
Inverse von (a, b)  = (0, 0) zu: das mit dem Produkt r · (a, b) = (ra, rb) übereinstimmt, das
' ( man bei der Multiplikation mit Skalaren im R-Vektorraum
a −b
(x, y) = , =: (a, b)−1 . R × R betrachtet (siehe Kapitel 6). Die Multiplikation mit
a 2 + b2 a 2 + b2
Skalaren aus R ist also durch die Multiplikation im Körper
Dieses lässt sich entweder direkt durch Nachrechnen C festgelegt.
oder indirekt durch Einsetzen in die definierende Glei-
chung (a, b)(x, y) = (1, 0) verifizieren. Durch die drei Eigenschaften, nämlich dass C die reellen
Nun werden wir das Assoziativgesetz der Multiplikation Zahlen bis auf Isomorphie als Teilkörper enthält, dass i eine
nachweisen. Gegeben seien drei komplexe Zahlen z1 = Lösung der Gleichung z2 +1 = 0 ist und dass jedes komplexe
(a, b), z2 = (c, d) und z3 = (e, f ). Es muss Folgendes z eine eindeutige Standarddarstellung besitzt, ist C bis auf
gelten: Isomorphie eindeutig bestimmt.
(z1 z2 ) · z3 = z1 · (z2 z3 ).
Beweis: Ist C ein Körper, der einen zu den reellen Zah-
Wir müssen auf beiden Seiten der Gleichung zuerst die
len isomorphen Unterkörper R enthält, und in welchem es
Klammern bestimmen und danach mit der dritten kom-
ein Element i mit i 2 + 1 = 0 gibt und in dem sich je-
plexen Zahl multiplizieren. Anschließend sind beide Er-
des z ∈ C eindeutig in der Form z = a  + b i mit
gebnisse zu vergleichen. (z1 z2 ) bestimmt sich per Defi-
a  , b ∈ R darstellen lässt, dann ist C isomorph zu C. Einen
nition zu:
Isomorphismus ϕ : C → C erhält man durch die Zuordnung
z1 z2 = (a, b)(c, d) = (ac − bd, ad + bc). a + bi → a  + b i . 
4.6 Komplexe Zahlen 137

In C gelten alle in R abgeleiteten Rechen- w = 0 ist. Bei komponentenweiser Multiplikation wäre aber
regeln, bei denen nur die Körper- z. B. (1, 0) ∗ (0, 1) = (1 · 0, 0 · 1) = (0, 0).
eigenschaften benutzt wurden
?
Beispiel Es gilt für alle n ∈ N0 und alle a, b ∈ C die Wieso gibt es außer z = ±i keine weiteren Lösungen der
allgemeine binomische Formel: Gleichung z2 + 1 = 0?
' ( ' (
n n−1 n
(a + b)n = a n + a b + ··· + abn−1 + bn .
1 n−1
Wir haben diese Formel bereits anhand der Körperaxiome in Im Gegensatz zu R lässt C sich nicht anordnen
den reellen Zahlen gezeigt. 
Obwohl C mit R die Körpereigenschaften gemeinsam hat,
Die Formel für die Multiplikation komplexer Zahlen muss gibt es einen Hauptunterschied:
man sich nicht merken, wie man am folgenden Beispiel sehen
kann. Achtung: C lässt sich nicht anordnen!

Beispiel Ist etwa z = 2−6i und w = 1+i, so rechnet man In C gibt es keine Teilmenge P , sodass für P die Axiome
zw mithilfe des Distributivgesetzes und unter Verwendung (AO1 ), (AO2 ) und (AO3 ) gelten (Seite 106). Denn in einem
von i2 = −1 aus und erhält: angeordneten Körper gilt für ein Element z = 0 stets z2 ∈ P .
Insbesondere ist 1 = 12 ∈ P , also −1 ∈ / P . In C gilt aber
zw = (2 − 6i)(1 + i) = 2 · 1 + 2 · i − 6i · 1 − 6i · i
i2 = −1. Wenn sich C anordnen ließe, müsste einerseits
= 2 + 2i − 6i − 6i2 = 2 + 2i − 6i − 6(−1) = 8 − 4i. wegen i = 0 auch i2 ∈ P gelten, andererseits ist i2 = −1 ∈ P .

Wir können uns an dieser Stelle zunächst nur mit wenigen
elementaren geometrischen und algebraischen Eigenschaf-
Die Standarddarstellung für einen Quotienten wie z. B. 2+5i ten von C beschäftigen. Außer der angeführten Motivation,
3−4i den Körper der reellen Zahlen nochmals zu erweitern, gibt es
lässt sich durch Erweiterung mit 3 + 4i, d. h. allgemein mit
dem Komplex-Konjugierten des Nenners, berechnen: zahlreiche weitere innermathematische Gründe. Auch für die
moderne Quantenmechanik sind die komplexen Zahlen un-
2 + 5i (2 + 5i)(3 + 4i) 6 + 15i + 8i − 20 verzichtbar geworden, wenn man an das Vertauschungsaxiom
= =
3 − 4i (3 − 4i)(3 + 4i) 9 + 16 für Orts- und Impuls-Operator, die Schrödinger-Gleichung
−14 + 23i 14 23 oder den Hamilton-Operator denkt. Die komplexe Analysis,
= = − + i. die systematisch auf C aufbaut, heißt im deutschen Sprach-
25 25 25
 4 raum Funktionentheorie.
Gilt es, die Standarddarstellung von z = 8−i
5+i zu bestim-
men, so berechnet man zunächst
Die komplexen Zahlen lassen sich in der
8−i (8 − i)(5 − i) 39 13 3 1 1 Gauß’schen Zahlenebene visualisieren
= = − i = − i = (3 − i)
5+i (5 + i)(5 − i) 26 26 2 2 2
und verwendet dann die binomische Formel: Die komplexen Zahlen sind als Menge die Menge R × R.
Genauso, wie man reelle Zahlen als Punkte einer Zahlen-
1 1  4 
z = (3 − i)4 = 3 − 4 · 33 i + 6 · 32 i2 − 4 · 3i3 + i4 geraden visualisieren kann, kann man komplexe Zahlen als
16 16 Punkte oder Vektoren der Ebene R2 = R × R auffassen.
1 28 − 96i 7 Diese Auffassung wurde von J. Argand (1768–1822) bereits
= (81 − 108i − 54 + 12i + 1) = = − 6i.
16 16 4 vor C.F. Gauß propagiert. Man spricht von der Gauß’schen
Zahlenebene, d. h., man fasst C = R2 = R × R als R-
Die Definition der Multiplikation komplexer Zahlen mag ge- Vektorraum mit der Basis 1 = (1, 0) und i = (0, 1) auf.
künstelt erscheinen, ist aber durch unsere Vorüberlegungen Dass man im Prinzip dieselbe Struktur erhält, wenn man in
motiviert. allen Rechnungen mit komplexen Zahlen i durch −i ersetzt,
wird sich im Folgenden ergeben.
Kommentar: Die komponentenweise Multiplikation
R∼
= R × {0} nennt man die reelle Achse und iR = {0} × R
(a, b) ∗ (c, d) = (ac, bd) die imaginäre Achse. Die Summe z+w von zwei komplexen
Zahlen z und w ist, wie in Abbildung 4.11 zu sehen ist, der
als multiplikative Verknüpfung zu versuchen, scheitert des- vierte Eckpunkt eines Parallelogramms. z+w kann man auch
halb, weil in jedem Körper K die Nullteilerregel gilt, d. h. als den Punkt beschreiben, der durch Translation um w aus
für z, w ∈ K gilt zw = 0 genau dann, wenn z = 0 oder z oder durch Translation um z aus w entsteht.
138 4 Zahlbereiche – Basis der gesamten Mathematik

Im Geometrisch bedeutet der Übergang von z zu z eine Spiege-


lung an der reellen Achse in der komplexen Zahlenebene.

?
−z = −x + iy z = x + iy Zeigen Sie, dass zz ∈ R≥0 gilt.
y

%
Wegen |z| = x 2 + y 2 und nach dem Satz des Pythagoras
ist |z| der Abstand von z zum Nullpunkt (0, 0) (Abb. 4.12).
−x 0 x Re Man sieht sogleich, dass für reelles z, also für y = 0, die neue
Definition mit der Betragsdefinition auf R übereinstimmt.

−y Im
−z = −x − iy z = x − iy z = x + yi = (x, y)

|z| y
Abbildung 4.10 Die komplexen Zahlen z = x+iy, z = x−iy, −z = −x−iy
und −z = −x + iy sind hier in der Gauß’schen Zahlenebene dargestellt. Man
erkennt die hohe Symmetrie der Zahlen, die paarweise durch Spiegelungen
erzeugt werden können.

0 x Re
%
Im Abbildung 4.12 Die Abbildung visualisiert den Betrag |z| = x 2 + y 2 einer
z+w komplexen Zahl z = x + iy.

C lässt sich zwar nicht mehr anordnen, aber durch | | : z  →


|z| ist eine Bewertung auf C definiert. Diese Eigenschaften
w
des Betrags lassen sich direkt folgern.

z
Eigenschaften des Betrags komplexer Zahlen
Für alle z, w ∈ C gilt:
|z| ≥ 0; |z| = 0 ⇔ z = 0. ) ) |z|
0 |zw| = |z| · |w|. Ist w = 0, dann ist ) wz ) = |w| .
Re
|Re z| ≤ |z| und |Im z| ≤ |z|.
Abbildung 4.11 Die Summe z + w von zwei komplexen Zahlen z und w ist der Es gelten diese beiden Dreiecksungleichungen:
vierte Eckpunkt des durch 0, z und w bestimmten Parallelogramms (falls diese
(a) |z + w| ≤ |z| + |w| (für Abschätzungen nach
Punkte nicht alle drei auf einer Geraden liegen und somit kollinear sind).
oben).
(b) |z − w| ≥ ||z| − |w|| (für Abschätzungen nach
Eine geometrische Deutung für das Produkt zw zweier kom- unten).
plexer Zahlen geben wir weiter unten. Die Gleichberechti-
gung von i und −i begründet die Wichtigkeit der Abbildung Beweis: Den Beweis der ersten und dritten Eigenschaft
überlassen wir dem Leser und beweisen hier zuerst den zwei-

: C → C, z = x + yi  → x − yi. ten Punkt (zu zw = z w siehe Abschnitt 3.3):

|zw|2 = (zw)(zw) = (zw)(z w) = (zz)(ww) = |z|2 |w|2 ,


Definition von konjugiert komplexen Zahlen und dem
Betrag und damit folgt |zw| = |z| · |w|.
Sei z = x + yi, x, y ∈ R. Nun zur vierten Eigenschaft. Die erste Dreiecksungleichung
z = x −yi heißt die zu z konjugierte komplexe Zahl (a) gilt wegen
und die Abbildung

: C → C, z  → z |z + w|2 = (z + w)(z + w) = (z + w)(z + w)
die komplexe Konjugation. = zz + wz + zw + ww = |z|2 + 2 · Re (wz) + |w|2
√ %
|z| = zz = x 2 + y 2 heißt Betrag der Zahl z ≤ |z|2 + 2|wz| + |w|2 = |z|2 + 2|w||z| + |w|2
(siehe Seite 78).
= |z|2 + 2|z||w| + |w|2 = (|z| + |w|)2 .
4.6 Komplexe Zahlen 139

Übersicht: Rechenregeln zu den komplexen Zahlen


Wir fassen die wichtigsten Eigenschaften der komplexen Zahlen zusammen. Für die angegebenen Identitäten sind z1 = a + ib
und z2 = c + id komplexe Zahlen mit a, b, c, d ∈ R.

Addition/Subtraktion Der Betrag komplexer Zahlen

z1 + z2 = (a + ib) + (c + id) %
|z| = a 2 + b2
= (a + c) + i(b + d)
|z| = |z|
z1 − z2 = (a + ib) − (c + id)
|z|2 = z z
= (a − c) + i(b − d)
|z1 z2 | = |z1 | |z2 |
Konjugiert komplexe Zahlen |z1 ± z2 |2 = |z1 |2 + |z2 |2 ± 2 Re(z1 z2 )
z = a − ib |z1 + z2 | ≤ |z1 | + |z2 | (Dreiecksungleichung)
z = z (d. h. involutorisch) |z1 − z2 | ≥ |z1 | − |z2 |
z1 + z2 = z1 + z2
z1 z2 = z1 z2
1 Polarkoordinatendarstellung
Re(z) = (z + z)
2
1 z = r(cos ϕ + i sin ϕ)
Im(z) = (z − z)
2i
mit
z = z gilt genau dann, wenn z = a ∈ R ⊆ C
z = −z gilt genau dann, wenn z = ib ∈ iR ⊆ C r = |z| ≥ 0 , ϕ = arg(z) ∈ (−π, π]

Multiplikation und
z1 z2 = (a + ib) (c + id) Re(z) = r cos ϕ , Im(z) = r sin ϕ
= (ac − bd) + i(ad + bc) Für zj = rj (cos ϕj + i sin ϕj ), j = 1, 2 ist
Division  
z1 z2 = r1 r2 cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 )
a + ib z1 z 1 z2 z1 z2
c + id
= = = z1 r1  
z2 z2 z2 |z2 |2 = cos(ϕ1 − ϕ2 ) + i sin(ϕ1 − ϕ2 )
z2 r2
Insbesondere gilt für z = x + iy ∈ C \ {0}  
z1 = r1n cos(nϕ1 ) + i sin(nϕ1 )
n
z x − yi x −y
z−1 = = 2 = 2 + 2 i (Moivre’sche Formel)
|z| 2 x +y 2 x +y 2 x + y2

Speziell gilt für |z| = 1 die Formel z−1 = z̄.

Wir haben insgesamt Die Identität

|z + w|2 ≤ (|z| + |w|)2 |z + w|2 = |z|2 + 2 · Re (wz) + |w|2


= |z|2 + 2 · Re (zw) + |w|2
erhalten. Wegen der Monotonie der reellen Wurzelfunktion
folgt: wollen wir Kosinus-Satz nennen (siehe Seite 146). Außer-
|z + w| ≤ |z| + |w|. dem wurde in der Umformung

Die Dreiecksungleichung für Abschätzungen nach unten be- Re (wz) = Re (wz) = Re (wz) = Re (zw)
weist man wie im reellen Fall. 
verwendet.

? Kommentar: Die im Beweis der Dreiecksungleichung


Beweisen Sie die erste und die dritte Eigenschaft in der Auf- verwendete Ungleichung
zählung.
|Re (wz)| = |Re (zw)| ≤ |z| · |w|
140 4 Zahlbereiche – Basis der gesamten Mathematik

ist die Cauchy-Schwarz’sche Ungleichung für C = R2 . Der Abstand d in C hat die folgenden vier Eigenschaften
Schreibt man nämlich z = x + yi und w = u + vi für (z1 , z2 , z3 ∈ C beliebig):
u, v, x, y ∈ R, dann ist
d(z1 , z2 ) > 0 ⇔ z1 = z2 ,
Re (zw) = Re (zw) = xu + yv, d(z1 , z2 ) = 0 ⇔ z1 = z2 ,
d(z1 , z2 ) = d(z2 , z1 ) (Symmetrie),
und das ist das Standard-Skalarprodukt der Vektoren z = d(z1 , z3 ) ≤ d(z1 , z2 ) + d(z2 , z3 ) (Dreiecksungleichung).
(x, y) und w = (u, v) im R2 (siehe Kap. 7).
?
? Beweisen Sie die ersten drei Eigenschaften für den Ab-
Es gilt folgende Identität: stand d.
' (−1
1+i 1−i
√ = √ . C ist mit der zu d zugehörigen Abstandsfunktion ein soge-
2 2
nannter metrischer Raum. Dieser ist über die eben benann-
Begründen Sie dies anhand der Eigenschaften der komplexen ten vier Eigenschaften definiert. Metrische Räume werden in
Konjugation aus der Übersicht auf Seite 139, und rechnen Sie Kapitel 19 eingehender untersucht.
noch einmal auf herkömmlichem Wege nach.

Mithilfe des Abstands werden wichtige


Der Abstand zweier komplexer Zahlen Teilmengen von C definiert
Für beliebige z, w ∈ C ist der Abstand von z und w
durch Mit dem Betrag der komlexen Zahlen lassen sich Kreise und
d(z, w) = |z − w| Kreislinien in den komplexen Zahlen beschreiben. So ist etwa
durch
definiert. S 1 = {z ∈ C | |z| = 1}

Insbesondere gilt d(z, 0) = |z|, was sich mit der geometri- die Einheitskreislinie gegeben. Die Einheitskreislinie hat die
schen Interpretation deckt. bemerkenswerte Eigenschaft, dass sie bezüglich der Mul-
tiplikation eine Gruppe ist: Sind z, w ∈ S 1 , so gilt auch
Folgerung (Dreiecksungleichung) zw ∈ S 1 und wz ∈ S 1 . Ferner ist z−1 = z ebenfalls Element
Es gilt für beliebige z1 , z2 , z3 ∈ C die Ungleichung in S 1 .

d(z1 , z3 ) ≤ d(z1 , z2 ) + d(z2 , z3 ) Die Einheitskreislinie ist ein Spezialfall des allgemeineren
Begriffs einer zweidimensionalen Sphäre,
und der Name Dreiecksungleichung wird jetzt geometrisch
verständlich (Abb. 4.13). Sε (z0 ) = {z ∈ C | |z − z0 | = ε}

mit einem Mittelpunkt z0 und Radius ε > 0. Für z0 = 0 und


z3
ε = 1 verwendet man wie oben angegeben die Bezeichnung
S 1 = S1 (0).

Definition offener und abgeschlossener Kreisschei-


ben in C
z1 z2 Für z0 ∈ C und ε ∈ R, ε > 0, heißt

Abbildung 4.13 Die Abbildung verdeutlicht die Dreiecksungleichung für drei Uε (z0 ) = {z ∈ C | |z − z0 | < ε}
Punkte der Ebene, die wir mit komplexen Zahlen beschreiben: Der direkte Weg
von z1 zu z3 ist immer kürzer oder höchstens gleich lang wie der Weg über einen
weiteren Punkt z2 .
die offene Kreisscheibe mit Mittelpunkt z0 und Radius
ε oder auch ε-Umgebung von z0 und

Uε (z0 ) = {z ∈ C | |z − z0 | ≤ ε}
Beweis: Wir wählen die spezielle Dreiecksungleichung
für das Dreieck mit den Ecken 0, z und w. Wegen z1 − z3 = die abgeschlossene Kreisscheibe mit Mittelpunkt z0
(z1 − z2 ) + (z2 − z3 ) folgt: und Radius ε.
|z1 − z3 | ≤ |z1 − z2 | + |z2 − z3 |,
Begründungen für die Bezeichnungen offen bzw. abgeschlos-
und dies ist gerade die Folgerung.  sen ergeben sich später in Kapitel 9 und 19.
4.6 Komplexe Zahlen 141

Im
S1 U1 (0) U1 (0) z

0 0 0

z
Abbildung 4.14 Zu sehen sind die im Text definierte Einheitskreislinie S1, die
offene Einheitskreisscheibe U1 (0) und die abgeschlossene Einheitskreisscheibe 0 1
U1 (0) als Spezialfälle von Sphäre und Kreisscheibe. Re
1
z

Wir wollen noch die Abbildung


1
j : C − {0} → C − {0}, z  → ,
z z

die Inversion genannt wird, etwas genauer betrachten. Die


Umformung Abbildung 4.15 Man erhält 1/z durch zwei Spiegelungen: 1) durch Spiegelung
am Einheitskreis, dies liefert z ; 2) durch Spiegelung von z an der reellen Achse.
1 1·z 1
= = 2 ·z
z z·z |z|
die gerade der Multiplikation mit einer komplexen Zahl 
für das Inverse einer komplexen Zahl z  = 0 zeigt, dass 1z
entspricht. Diese Abbildung hat die Eigenschaften
die Richtung von z hat. Wie könnte man 1/z geometrisch
konstruieren? μl (z + z ) = μl (z) + μl (z ) und μl (cz) = cμl (z),

Definition von Spiegelpunkten wobei z, z , c


∈ C sind. In der Sprache der linearen Algebra
bedeutet dies, dass μl eine C-lineare Abbildung von C =
Sind z , z ∈ C\{0}, so heißen z und z Spiegelpunkte
R2  → C = R2 ist.
bezüglich der Einheitskreislinie S 1 , wenn gilt:
(a) z = az mit einem a ∈ R, a > 0 und Wir zerlegen diese Abbildung in zwei Teile: In die Streckung
(b) |z | |z| = 1.
μ|| : C → C, w → || · w

Aussage (a) bedeutet, dass z und z auf demselben von 0 mit dem Zentrum 0 und dem Streckungsfaktor ||. Es ist
ausgehenden Halbstrahl liegen. Setzt man die Gleichung z =
μ = μ|| ◦ μd .
az in (b) ein, so folgt:

Dabei liegt d = || auf der Einheitskreislinie, denn es ist
|z | |z| = |az| |z| = |a| |z|2 = azz = 1. |d| = 1. Die Abbildung μd ist definiert durch:
Also gilt a = 1
zz und damit z = 1
zz z. μd : C → C, z → dz.
Wegen 1z = zz 1
z = z erhält man daher 1/z, indem man

den Punkt z an der reellen Achse spiegelt. Man erhält 1/z In dem kommutativen Diagramm 4.16 sind die drei Funktio-
also durch zwei Spiegelungen: Durch Spiegelung am Ein- nen μ , μ|| und μd dargestellt:
heitskreis, dies liefert z , und dann durch Spiegelung an der Die Abbildung μd ist längentreu bzw. abstandstreu, denn es
reellen Achse. Zum gleichen Resultat kommt man, indem gilt:
man zuerst an der reellen Achse und dann am Einheitskreis
spiegelt. Den Punkt z kann man geometrisch mit verschiede- |μd (z1 ) − μd (z2 )| = |dz1 − dz2 | = |d(z1 − z2 )|
nen Methoden konstruieren, in Abbildung 4.15 ist eine solche = |d| |z1 − z2 | = |z1 − z2 |,
Konstruktion angedeutet.
wegen |d| = 1. Ferner ist die Abbildung μd auch C-linear
und bijektiv. Die Abbildungen z → dz und w → d1 w kehren
Die Multiplikation in C lässt sich geometrisch sich gegenseitig um.
interpretieren ?
Zeigen Sie, dass die beiden Abbildungen
Die geometrische Interpretation der Multiplikation komple-
1
xer Zahlen erfordert etwas mehr Aufwand als die der Ad- z → dz bzw. w → w
dition. Ist  = a + bi ∈ C, a, b ∈ R, und   = 0, dann d
betrachten wir die Abbildung mit z, w, d ∈ C und |d| = 1 zueinander Umkehrabbildungen
darstellen.
μ : C → C, mit μ (z) = z,
142 4 Zahlbereiche – Basis der gesamten Mathematik

z - lz Im
C - C

z @  |l|w
 @
@ @ 
@ z
@
@ @
@ @
@ R
@ r = |z|
@ C
R
@ 
l w
|l| z
ϕ
Abbildung 4.16 In diesem kommutativen Diagramm wird die Abbildung
μl : z → lz zuerst durch die Drehung μd : z  → |l|l z =: w und dann 0 Re
durch die Streckung μ|| : w → |l|w vermittelt.
Abbildung 4.18 Man kann eine komplexe Zahl z = a + bi = 0 auch durch
Angabe eines Polarwinkels ϕ ∈ (−π; π] und durch Angabe ihres Abstands vom
Die Abbildung μd führt die Basisvektoren 1 und i in d · 1 Ursprung 0 < |z| ∈ R eindeutig bestimmen.
und d · i über:

Re (d · 1) = Re d, Im (d · 1) = Im (d),
Polarkoordinaten in C = R2
Re (d · i) = −Im d, Im (d · i) = Re (d). Jedes z ∈ C kann in der Form
μd ist also eine längentreue, orientierungserhaltende lineare z = r(cos ϕ + i sin ϕ)
Abbildung von C = R2 . Eine solche heißt Drehung um den
mit r, ϕ ∈ R, r ≥ 0, dargestellt werden.
Nullpunkt.
r und ϕ nennt man Polarkoordinaten von z.
Zusammengefasst lässt sich sagen, wenn man etwa w =  ∈
C\{0} fest wählt, dass die Abbildung
Dabei ist r = |z| eindeutig bestimmt und ϕ für z = 0 ein-
μ : C → C, mit z  → z deutig bis auf Addition ganzzahliger Vielfacher von 2π. Für
z = 0 ist ϕ beliebig. Die Zahl ϕ ist der im Bogenmaß gemes-
eine Drehstreckung ist, die sich aus einer Drehung um den
sene orientierte Winkel zwischen der positiven reellen Achse
Nullpunkt mit dem Drehwinkel ϕ und einer Streckung mit
und dem Ortsvektor von z(= 0). Dabei gilt für jedes ϕ ∈ R
dem Streckungsfaktor |l| zusammensetzt (Abb. 4.17).
die Eigenschaft cos ϕ + i sin ϕ ∈ S 1 . ϕ ist die Länge des
Bogens vom Punkt (1, 0) zum Punkt (a, b) ∈ S 1 und wird
Im Bogenmaß genannt.
wz = |w|z  Zum Beweis der Polarkoordinatendarstellung benötigt man
Eigenschaften der Funktionen cos und sin, die wir in Ab-
schnitt 11.4 herleiten werden und hier nur kurz zusammen-
w z stellen.
z  = |w|
Additionstheoreme: Für beliebiges ϕ, ψ ∈ R gelten:
sin (ϕ + ψ) = sin ϕ cos ψ + cos ϕ sin ψ,
z cos (ϕ + ψ) = cos ϕ cos ψ − sin ϕ sin ψ.
Die Funktionen sin und cos sind periodisch mit der Peri-
ode 2π , d. h., für beliebiges ϕ ∈ R ist sin(ϕ +2π ) = sin ϕ
bzw. cos(ϕ + 2π ) = cos ϕ.
α
w Zu jedem Punkt (a, b) ∈ R2 mit a 2 +b2 = 1, d. h. a +bi ∈
S 1 , gibt es ein ϕ ∈ R mit a = cos ϕ und b = sin ϕ.
α
Es gilt für ϕ, ϕ  ∈ R die Äquivalenz:
0 Re
(cos ϕ, sin ϕ) = (cos ϕ  , sin ϕ  ) ⇔ ϕ−ϕ  = 2π k, k ∈ Z.
Abbildung 4.17 Die Multiplikation zweier komplexer Zahlen z, w lässt sich
geometrisch als eine Drehstreckung interpretieren.
Wählt man z. B. ϕ im Intervall [0, 2π ) oder im Intervall
Verständlicher wird diese geometrische Interpretation, wenn (−π, π], dann ist ϕ wegen der letzten Eigenschaft eindeutig
man die Multiplikation komplexer Zahlen unter Verwendung bestimmt. Mit diesen Vorbemerkungen zeigen wir nun die
von Polarkoordinaten schreibt. Existenz von Polarkoordinaten von komplexen Zahlen.
4.6 Komplexe Zahlen 143

z
Beweis: Ist z ∈ C, z  = 0, dann liegt |z| auf der Kreislinie wann komplexe Abbildungen betrachten. Dann gibt es für
S 1 , und so gibt es ein ϕ ∈ R mit z
= cos ϕ + i sin ϕ. Daher ϕ ∈ [0, 2π ) Probleme, wie sie beim komplexen Logarith-
|z|
ist mus offenkundig werden. Wählt man nämlich ϕ ∈ [0, 2π ),
z = |z|(cos ϕ + i sin ϕ) = |z|E (ϕ) dann ist der komplexe Logarithmus auf der positiven reellen
Achse nicht stetig.
mit der Abkürzung E(ϕ) = cos ϕ +i sin ϕ. Damit hat man die
Existenz einer Polarkoordinatenstellung für komplexe Zah-
len.
Ist außerdem auch z = r  (cos ϕ  + i sin ϕ  ) mit r  > 0 und
Komplexe Zahlen werden multipliziert, indem
ϕ  ∈ R, dann folgt:
 man ihre Beträge multipliziert und ihre
|z| = r  (cos ϕ  )2 + (sin ϕ  )2 = r  , Argumente addiert.

also r = r  und dann ϕ − ϕ  = 2πk mit k ∈ Z. 


Besonders einfach wird die Multiplikation komplexer Zah-
len, wenn diese jeweils durch eine Polarkoordinatendarstel-
In Kapitel 11 werden wir sehen, dass sich E aus der Fortset- lung gegeben sind.
zung der Exponentialfunktion auf C ergibt, genauer gilt für
ϕ ∈ R die Gleichheit: Multiplikation komplexer Zahlen in Polarkoordina-
E(ϕ) = cos ϕ + i sin ϕ = exp(iϕ). ten
Sind nun z, w ∈ C und z = rE(ϕ) und w = ρE(ψ)
Polarkoordinatendarstellungen von z und w, dann ist
Satz (Eigenschaften von E : R → C)
Für ϕ, ψ ∈ R und E(ϕ) = cos ϕ + i sin ϕ gilt: zw = rρ(E(ϕ) E(ψ)) = rρE (ϕ + ψ).
E(ϕ + ψ) = E(ϕ) · E(ψ),
E(ϕ + 2πk) = E(ϕ) für alle k ∈ Z,
E(ϕ) = 0, Beweis: Der Beweis ergibt sich unmittelbar aus der Tatsa-
|E(ϕ)| = 1, che, dass die Additionstheoreme für Kosinus und Sinus mit
E(−ϕ) = (E(ϕ))−1 . der Gleichung

Durch die Abbildung E : R → S1 = {z ∈ C | |z| = 1} wird E(ϕ + ψ) = E(ϕ)E(ψ)


die reelle Achse auf die Einheitskreislinie S 1 „aufgewickelt“.
äquivalent sind. 

Jedes ϕ ∈ R mit z = rE (ϕ) heißt ein Argument von z.


Eine komplexe Zahl hat wegen der zweiten Eigenschaft von Man beachte jedoch, dass zum Beispiel bei der Verwendung
E viele Argumente. Wenn man Eindeutigkeit erreichen will, des Hauptwerts des Arguments nicht arg(z1 ·z2 ) = arg(z1 )+
wählt man ϕ z. B. im Intervall (−π, π] und spricht dann vom arg(z2 ) gelten muss, linke und rechte Seite können sich um
Hauptwert des Arguments von z. Wir schreiben ϕ = arg z. ein ganzzahliges Vielfaches von 2π unterscheiden.
In der Literatur findet sich manchmal auch die Bezeichnung
Arg für den Hauptwert und allgemein arg für ein Argument
Beispiel Für z1 = i und z2 = −1 gilt:
ohne Einschränkung auf das Bild (−π, π].
Man kann ϕ = arg z für 0  = z = x + iy (x, y ∈ R) explizit π 3π
arg(z1 ) + arg(z2 ) = arg(i) + arg(−1) = +π = .
mit der Umkehrfunktion zum Kosinus angeben: 2 2

x
arccos |z| , falls y ≥ 0, Dieses Ergebnis entspricht arg(−1 + i) + 2π. 
ϕ = arg z = x
− arccos |z| , falls y < 0.
Aus der obigen Formel für die Multiplikation komplexer Zah-
Beispiel Durch Anwendung dieser Fallunterscheidung len ergibt sich die Formel von Euler-de-Moivre.
finden wir
π π Formel von Euler-de-Moivre
arg(i) = , arg(−1) = π, arg(−i) = − und arg(1) = 0.
2 2 Ist z = r E(ϕ) eine Polarkoordinatendarstellung von z =

0, dann gilt für alle n ∈ Z:
Kommentar: Wieso wählt man für ϕ nicht das Intervall
zn = r n E(nϕ).
[0, 2π)? Wie so oft in der Mathematik gibt es tiefer liegende
Gründe, die zu Anfang nicht zu sehen sind. Beginnt man, Speziell ist E(ϕ)n = E(nϕ).
eine komplexe Analysis aufzubauen, so wird man irgend-
144 4 Zahlbereiche – Basis der gesamten Mathematik

Hintergrund und Ausblick: Eine kurze Geschichte der komplexen Zahlen (erster Teil)
Schon in der babylonischen
% Mathematik (2500 bis 100 v. Chr.) wurden Näherungsverfahren zur Berechnung von Quadratwurzeln
r

in der Gestalt a 2 + r ≈ a + 2a (a, r ∈ R>0 ) benutzt. Für 27 erhält man mit a = 5, r = 2 eine brauchbare Näherung:
√ √ 2
27 = 25 + 2 ≈ 5 + 10 = 5.2. Vermutlich wurde dieses Verfahren sogar iteriert und stellt somit eine Vorstufe des
Newton-Verfahrens (s. Kapitel 15.3) dar. Wann zuerst Quadratwurzeln aus negativen reellen Zahlen aufgetreten sind, ist
schwer festzustellen. Der indische Mathematiker Mahavira hat um 580 n. Chr. folgende Schwierigkeit erkannt: „Es liegt in der
Natur der Dinge, dass eine negative Größe nicht eine quadratische Größe ist und deshalb keine Quadratwurzel besitzt.“

Erst die italienischen Mathematiker der Renaissance, Auf dem Umweg über eigentlich nicht existierende Qua-
u. a. Scipio del Ferro (1465–1526), Nicolo Tartarglia dratwurzeln aus negativen Zahlen hat auch Bombelli rich-
(1499–1557), Girolamo Cardano (1501–1576) und Rafael tige Resultate in seinen Rechnungen erhalten. Obwohl
Bombelli (1526–1572), sind wieder auf das Problem von Bombelli systematische Regeln für den Umgang mit Wur-
Quadratwurzeln aus negativen Zahlen gestoßen. Mit sol- zeln aus negativen Zahlen aufgestellt hatte – eine ent-
chen Zahlen gerechnet hat wohl√als erster Cardano. Das
√ Er- spricht der Regel ii = i2 = −1 – stellte 1585 der nie-
staunliche war, dass x1 = 5 + −15 und x2 = 5 − −15 derländische Mathematiker Simon Stevin fest: „Die Sa-
die beiden Forderungen x1 +x2 = 10 und x1 x2 = 40 erfül- che ist noch nicht gemeistert.“ Der flämische Mathema-
len konnten. Cardano rechnete dabei nach für reelle Zahlen tiker Albert Girard (1595–1632) formulierte wohl als er-
gängigen Regeln. Auf Quadratwurzeln aus negativen Zah- ster den sogenannten Fundamentalsatz der Algebra: „Jede
len stießen Cardano und seine Zeitgenossen bei den Lö- algebraische Gleichung hat genauso viele Lösungen wie
sungen kubischer Gleichungen der Form x 3 + px + q = 0 ihr Grad angibt.“ Einen Beweis gibt er nicht, er erläu-
mit p, q ∈ R. Cardano gab 1545 die Cardano’schen For- tert den Satz allerdings an Beispielen. Ferner gibt Gi-
meln für die drei Lösungen dieses Gleichungstyps an: rard den Rat: „Man unterlasse es nicht, die Lösungen
. . zu entwickeln, die unmöglich existieren können.“ Für
q √ q √
√ x − 4x + √ 3 = 0 gibt er als Lösungen
das Beispiel 4
x1 = − + D + 3 − − D ,
3
2 2 1, 1, −1 + −2, −1 − −2 an.
. . Das Wort „imaginär“ (eingebildet) wurde zuerst von René
q √ 2 3 q

x2 =  − + D +  − − D ,
3
Descartes (1596–1650) gebraucht: „Die Wurzeln einer
2 2
Gleichung sind nicht immer reell, sondern manchmal ein-
. .
2 3 q
√ q √ gebildet.“ Descartes schrieb weiter: „Man kann sich bei
x3 =  − + D +  3 − − D , jeder Gleichung soviele Lösungen vorstellen wie ihr Grad
2 2
√ angibt, aber manchmal gibt es keine Größe, die dem ent-
mit D = ( q2 )2 + ( p3 )3 und  = exp( 2πi 1 3
3 ) = − 2 + 2 i,
spricht, was man sich vorstellt!“
wobei  = 1 ist. Bei der Angabe dieser Ausdrücke wurde
3
Im Jahr 1702 führte Johann Bernoulli (1667–1748) Lo-
unsere heutige Bezeichnungsweise verwendet. garithmen aus negativen Zahlen in der Integralrechnung
Nach seinen Formeln ergibt sich für die% Gleichung x 3 − ein, und er lieferte sich mit Gottfried Wilhelm Leibniz
3 √ (1646–1716) zwischen 1700 und 1716 eine denkwürdige
15x
% − 4 = 0 eine Lösung zu x1 = 2 + −121 +
3 √ Kontroverse, ob Logarithmen aus negativen reellen Zahlen
2 − −121, was nur einer komplizierten Darstellung
existieren und ob diese reell oder imaginär sind. Der Streit
der reellen Zahl 4 entspricht, die tatsächlich eine Lösung
wurde 1749 von Leonard Euler (1707–1783) zu Gunsten
der obigen Gleichung ist. Um dies einzusehen, braucht
von Leibniz entschieden.
man die von Bombelli verwendete Gleichung
√ √ √ Euler rechnete meisterhaft mit Wurzeln aus negativen Zah-
(2 ± −1)3 = 2 ± 11 −1 = 2 ± −121 . len, auch wenn ihm dabei einige Fehler unterlaufen sind.
Er bewies 1748/49 die de Moivre’schen Formeln für na-
Hiermit lässt sich die dritte Wurzel in x1 einfach angeben: türliches n:
 √ √
√ √
3
2 ± −121 = 2 ± −1 (cos ϕ + −1 sin ϕ)n = cos(nϕ) + −1 sin(nϕ).

und deshalb ist schließlich Bei Euler finden sich auch die Formeln
√ √ 1 √−1ϕ √
x1 = (2 + −1) + (2 − −1) = 4. cos ϕ = (e − e− −1ϕ )
2
4.6 Komplexe Zahlen 145

Hintergrund und Ausblick: Eine kurze Geschichte der komplexen Zahlen (zweiter Teil)

und äquivalent hierzu tiert.“ Das ist nichts anderes als die Darstellung komple-

−1ϕ
√ xer Zahlen durch Paare reeller Zahlen. Den Fachausdruck
e = cos ϕ + −1 sin ϕ. „komplexe Zahl“ hat Gauß erst 1831 genutzt.
Euler kannte bereits 1728 die Beziehung i log i = − 21 π .
Eine strenge arithmetische Begründung der komplexen
Es bereitete Euler allerdings erhebliche Schwierigkeiten,
Zahlen durch geordnete Paare reeller Zahlen und die
zu erklären, was „imaginäre Zahlen“ sind, was sein De-
Definition der Addition und der Multiplikation solcher
finitionsversuch offenbart: „Eine Größe heißt imaginär,
Zahlenpaare stammt von Sir William Rowan Hamilton
wenn sie weder größer als null ist, noch kleiner null und
(1805–1865) aus dem Jahre 1835.
noch
√ gleich null ist. Das ist etwas
√ Unmögliches wie z. B.
−1 oder allgemeiner a + b −1.“ Euler führte √schließ- Im Jahr 1847 wird von Augustin Louis Cauchy (1789–
lich 1777 die heute geläufige Abkürzung i = −1 ein. 1857) eine algebraische Konstruktion der komplexen Zah-
In der Elektrotechnik wird nach DIN 1302 das Symbol j len als Restklassenring des Polynomrings R[x] nach dem
verwendet. Ideal (X 2 + 1) gegeben. Man dividiert ein Polynom P ∈
R[x] mit Rest durch X 2 + 1, sodass die Reste a + bX
Anfänge einer geometrischen Interpretation der komple-
(a, b ∈ R) genau den komplexen Zahlen entsprechen.
xen Zahlen finden sich bei John Wallis (1616–1703). Die
erste Darstellung von Punkten der Ebene durch kom- Dass sich die komplexen Zahlen dann sehr rasch in der ge-
plexe Zahlen stammt aus dem Jahre 1798 von dem Nor- samten Mathematik und deren Anwendungen etabliert ha-
weger Caspar Wessel (1745–1818). Carl Friedrich Gauß ben, ist sicherlich der wissenschaftlichen Autorität von C.
(1777–1855) benutzte diese Darstellung in seinem ersten F. Gauß zu verdanken. Auch in physikalischen Anwendun-
Beweis des Fundamentalsatzes der Algebra im Jahre 1799. gen werden komplexe Zahlen mit Erfolg verwendet wie
Im Jahr 1811 schreibt er in einem Brief an Bessel: „So wie beim harmonischen Oszillator, der Fourier-Analyse oder
man sich das ganze Reich der reellen Größen durch eine in der Quantenmechanik. Komplexe Zahlen und die auf
unendliche gerade Linie denken kann, so kann man das ihr aufbauende Komplexe Analysis (Funktionentheorie)
ganze Reich aller Größen durch eine unendliche Ebene ist zu einem unentbehrlichen Routinewerkzeug für viele
sinnlich machen, worin jeder Punkt, durch Abszisse a und Bereiche der Mathematik, der Naturwissenschaften und
Ordinate b bestimmt, die Größe a+bi gleichsam repräsen- der Technik geworden.

Beweis: Für n ∈ N0 ergibt sich der Beweis durch Induk- Fundamentalsatz der Algebra
tion nach n, und mit der Definition
Jedes nicht konstante komplexe Polynom besitzt in C
1
z−n = n , n ∈ N, mindestens eine Nullstelle, d. h., sind a0 , . . . , an ∈ C,
z an = 0, n ∈ N, beliebig vorgegebene Zahlen, dann
ergibt sich die Formel für beliebige n ∈ Z. 
besitzt die Gleichung
an zn + an−1 zn−1 + · · · + a0 = 0
Auch die Inversion erhält nun eine einfache Interpretation:
Ist z = rE(ϕ), r > 0, ϕ ∈ R, dann gilt für den Spiegelpunkt mindestens eine Lösung z ∈ C.
z bezüglich der Einheitskreislinie S 1 :
Obwohl der Satz „Fundamentalsatz der Algebra“ heißt, muss
1
z = ρE(ϕ) mit rρ = 1 und z = = ρE(−ϕ). man bei den Beweisen auf Hilfsmittel der Analysis zurück-
z greifen. Ein relativ einfacher Beweis findet sich in Kapitel 9.
? Ein Spezialfall des Fundamentalsatzes ist der folgende Satz
Zeigen Sie, dass cos(4ϕ), ϕ ∈ R, sich als Polynom in cos(ϕ) über die Existenz von n-ten Wurzeln, der sich mithilfe der
mit ganzzahligen Koeffizienten darstellen lässt. Formel von Euler-de-Moivre elementar beweisen lässt.

Existenzsatz für n-te Wurzeln, Einheitswurzeln


Kommentar: Es gilt allgemein, dass cos(nϕ) für n ∈ N Seien n ∈ N und c ∈ C. Ist c = 0, dann hat die Gleichung
ein Polynom in cos(ϕ) mit ganzzahligen Koeffizienten ist. zn = 0 nur die Lösung z = 0. Ist c = 0 und c =
rE(ϕ) eine Polarkoordinatendarstellung von c, dann hat
Wir haben die komplexen Zahlen eingeführt, um die Glei-
die Gleichung
chung z2 + 1 = 0 lösen zu können. Überraschend und fun- zn = c
damental für die Anwendung der komplexen Zahlen ist die genau n paarweise verschiedene Lösungen
Tatsache, dass beliebige algebraische Gleichungen Lösungen ' (
√ ϕ + 2π ν
in C besitzen. Diese Aussage ergibt sich aus dem wichtigen zν = r · E
n
n
Fundamtalsatz der Algebra.
146 4 Zahlbereiche – Basis der gesamten Mathematik

mit 0 ≤ ν ≤ n − 1. Im Spezialfall c = 1 erhält man mit ?


' ( Berechnen Sie alle Lösungen der Gleichung z5 = 1. Nutzen
2πν Sie dabei die Hilfsgleichung
ζν = E (0 ≤ ν ≤ n − 1)
n
z4 + z3 + z2 + z + 1 = (z2 + gz + 1)(z2 − hz + 1),
genau die n verschiedenen Lösungen der Gleichung

zn = 1. Dabei gilt ζν = ζ1ν . Die ζν heißen n-te Ein- wobei g = 1+2 5 und h = g1 sind. Die Zahl g wird goldener
heitswurzeln. Sie bilden die Ecken eines regelmäßigen Schnitt genannt. Begründen Sie die Richtigkeit der obigen
n-Ecks und liegen auf der Einheitskreislinie S 1 , wobei Hilfsgleichung, und dass die fünf Lösungen ein regelmäßiges
eine Ecke in z = 1 liegt. Fünfeck bilden (siehe Abb. 4.19).

Beweis: Zum Beweis beachte man, dass sogar alle zν für


beliebiges ν ∈ Z die Gleichung zn = c erfüllen. Dies folgt
Oft lassen sich mit den komplexen Zahlen
aus der Formel von Euler-de-Moivre durch einfaches Nach-
rechnen: Sachverhalte der Geometrie der Ebene R2
' ' ((n einfach darstellen
√ ϕ + 2πν
zν = n
r ·E = rE(ϕ+2πν) = rE(ϕ) = c.
n Wir kommen nochmal auf den Kosinus-Satz zurück und er-
läutern, warum wir die Gleichung
Speziell ist z0n = c.
|z + w|2 = |z|2 + 2Re (wz) + |w|2
Wählt man für ν lediglich die Zahlen 0, 1, . . . , n − 1, dann
sind die Lösungen z0 , z1 , . . . , zn−1 paarweise verschieden. Kosinus-Satz genannt haben.
Wenn wir dies gezeigt haben, dann sind z0 , z1 , . . . , zn−1 alle
Lösungen der Gleichung zn = c, denn das komplexwertige Sind w = ρE(ψ) und z = rE(ϕ), dann sind z = rE(−ϕ)
Polynom mit p(z) = zn − c hat höchstens n Nullstellen. und wz = |w| |z|E(ψ − ϕ). Für das Produkt ergibt sich:

Wäre aber zν = zν  mit 0 ≤ ν, ν  ≤ n − 1, dann folgt: Re (wz) = |w| |z| cos α,


' ( ' ( wenn α der Winkel zwischen z und w ist. Wegen ϑ + α = π
ϕ + 2πν ϕ + 2πν 
E =E . gilt:
n n
cos α = − cos ϑ
Aus der 2π-Periodizität von E ergibt sich die Existenz eines und somit:
m ∈ Z mit
|z + w|2 = |z|2 + |w|2 − 2|z| |w| cos ϑ
ϕ + 2πν ϕ + 2πν 
= + 2πm. = |z|2 + |w|2 + 2|z| |w| cos α.
n n

Hieraus folgt nach Durchmultiplizieren der Gleichung mit n Im Kosinus-Satz ist im Spezialfall ϑ = π2 , d. h. cos ϑ = 0,
und entsprechendem Kürzen (ν − ν  ) = mn. der Satz des Pythagoras enthalten. Aber wie ist eigentlich
Wegen 0 ≤ ν, ν  ≤ n − 1 kann (ν − ν  ) = mn nur für m = 0 ein Winkel zwischen zwei Vektoren zu definieren und zu
gelten, und damit gilt ν = ν  . 
messen? Bevor man einen Winkel messen kann, muss man
ihn erst einmal definieren! Dazu werden wir uns eingehend
mit Skalarprodukten beschäftigen (siehe Kapitel 7). Im Falle
des Standardvektorraums Rn werden wir dann auch „Winkel
zwischen Vektoren‘‘ definieren können, α = ψ − φ.
Da sich die komplexen Zahlen mit den Punkten des R2 iden-
tifizieren lassen, kann man zahlreiche Probleme der analy-
tischen Geometrie der Ebene komplex formulieren und so
elegant lösen. Wir behandeln als typische Beispiel die Dar-
Abbildung 4.19 Zu sehen sind die n-ten Einheitswurzeln für die Fälle n = 3, stellungen von Geraden und Kreislinien in komplexer Form,
n = 4 bzw. n = 5. Es entstehen regelmäßige n-Ecke, die immer die Zahl z = 1 sodass deren enge Verwandschaft deutlich wird (siehe Bei-
als Eckpunkt enthalten. spielbox auf Seite 147).
Eine weitere interessante Feststellung ist, dass die Inversion
Wegen ζν = ζ1ν mit ζ1 = E( 2π n ) nennt man ζ1 auch eine Kreislinien und Geraden auf Kreislinien und Geraden abbil-
primitive n-te Einheitswurzel. Ihre Potenzen ergeben sämt-
det.
liche n-te Einheitswurzeln.
4.6 Komplexe Zahlen 147

Beispiel: Geraden und Kreise in C


Man zeige, dass sich jede Gerade Ga,b = {a + bt ∈ C | a, b ∈ C; b = 0, t ∈ R} und jede Kreislinie Sr (a) = {z ∈ C |
|z − a| = r} mit 0 < r ∈ R als Lösungsmenge einer Gleichung der Form

A|z|2 + Bz + Bz + C = 0

mit A, C ∈ R, B ∈ C und AC < |B|2 darstellen lässt. Auch ist umgekehrt die Lösungsmenge L einer solchen Gleichung
eine Kreislinie oder eine Gerade.

Problemanalyse und Strategie: Da als Menge C = R2 ist, lassen sich Probleme der analytischen Geometrie in der
Ebene mithilfe komplexer Zahlen häufig relativ einfach formulieren. Einsetzen von x = (z + z)/2 und y = (z − z)/(2i)
für z = x + iy ∈ C in die Darstellungen im R2 führt auf entsprechende komplexe Beschreibungen.

Lösung: 2(ax + by) = (a + bi) z + (a − bi) z = Bz + Bz,


 
Wir beginnen mit den Geraden. Die Gleichung einer all- =: B =B
gemeinen Geraden in R2 ist von der bekannten Gestalt
ax + by + c = 0 (siehe auch Kapitel 7). Dabei sind a 2 + b2 − r 2 =: C (∈ R).
a, b, c ∈ R mit a, b nicht beide null.
Substituiert man x = (z + z)/2 und y = (z − z)/(2i) mit Wir setzen formal A = 1 und erhalten damit die zu
z = x + iy ∈ C, so erhält man die folgende Gleichung:
' ( ' ( (x 2 + y 2 ) − 2(ax + by) + (a 2 + b2 − r 2 ) = 0
z+z z−z
a +b + c = 0.
2 2i äquivalente Gleichung
Wir sortieren nach den beiden Zahlen z und z und erhalten:
Azz − Bz − Bz + C = 0.
1 1
(a + bi) z + (a − bi) z + 
c = 0.
2  2  Ersetzt man in der Bedingung AC < |B|2 die Zah-
=: C
=: B =B
len A durch x 2 + y 2 , B durch a + bi bzw. C durch
a 2 + b2 − r 2 , so wird sie nach Vereinfachungen zu der
Mit den angegebenen Abkürzungen B, B und C lässt sich Bedingung 1(a 2 + b2 − r 2 ) < |a + ib|2 , was zur Bedin-
die obige Gleichung schreiben als: gung r > 0 äquivalent ist, die erfüllt ist.
Bz + Bz + C = 0. Der allgemeinere Fall einer Gleichung
Dabei ist C = c eine reelle Zahl. Bezugnehmend auf die
Azz + Bz + Bz + C = 0
Gleichung

A|z|2 + Bz + Bz + C = 0 mit einem beliebigen Wert von A ∈ R lässt sich sofort auf
die Fälle A = 0 oder A = 1 reduzieren.
setzen wir formal A = 0. Die geforderte Ungleichung
AC < |B|2 ist erfüllt, da AC = 0 und B  = 0 (wegen a, b Ist nämlich A = 0, so können wir in
nicht beide null) gelten.
Azz + Bz + Bz + C = 0
Nun untersuchen wir die Kreislinien. Diese werden in R2
durch (x − a)2 + (y − b)2 = r 2 (a, b, r ∈ R mit r > 0) durch A teilen, um
dargestellt. Dies können wir umformen:

(x 2 + y 2 ) − 2(ax + by) + (a 2 + b2 − r 2 ) = 0. zz + B  z + B z + C  = 0

Wegen z = x + iy ∈ C finden wir folgende Ausdrücke: mit A = A/A = 1, B  = B/A, C  = C/A, zu erhalten.

(x 2 + y 2 ) = |z|2 = zz, Die Ungleichung AC < |B|2 wird dann zu A C  < |B  |2 .


148 4 Zahlbereiche – Basis der gesamten Mathematik

z+w
?
Im Welcher Kreislinie entspricht nach Inversion die Gerade, die
|z| durch Re z = 21 definiert wird?

w |w|
Es sei erwähnt, dass man, wenn man auf die Kommutativität
der Multiplikation verzichtet, zu den hyperkomplexen Zahlen
|z + w|
sowie zu den Quaternionen gelangt. Näheres hierzu findet
ϑ α sich in Abschnitt 3.3. Also ist mit den komplexen Zahlen der
z Aufbau der Zahlbereiche noch nicht beendet.

ϕ 4.7 Vertiefung: Konstruktiver


0
ψ
Re Aufbau der reellen Zahlen
Abbildung 4.20 Die Abbildung veranschaulicht die Definition des Winkels α
über α = ψ − φ. Dieser Winkel kann als Winkel zwischen den beiden Vektoren,
Wir haben in den vorangegangenen Abschnitten die Teilmen-
die durch z bzw. w dargestellt sind, aufgefasst werden. gen der natürlichen, der ganzen und der rationalen Zahlen in
der Menge der reellen Zahlen „wiederentdeckt“. Wie in der
Einleitung erwähnt, ist es auch möglich, umgekehrt zu ver-
Beispiel Die Abbildung fahren.
1 Ausgehend von den natürlichen Zahlen N konstruiert man die
j : C − {0} → C − {0}, z  →
z ganzen Zahlen Z, die rationalen Zahlen Q und schließlich die
bildet Kreislinien und Geraden auf Kreislinien und Geraden reellen Zahlen R. Man spricht dann von „Zahlbereichserwei-
ab. Dies ist eine der Eigenschaften der Möbiustransformatio- terungen“. Eine solche haben Sie im vorigen Abschnitt ken-
nen, zu denen auch die Inversion zählt. nengelernt; hier wurden die reellen Zahlen zur Menge der
komplexen Zahlen erweitert. Im Folgenden starten wir mit
Zum Beweis nehmen wir eine entsprechende Fallunterschei-
wenigen Axiomen für die natürlichen Zahlen und erweitern
dung vor, da bei der Inversion die Zahl z = 0 weder ein Bild
sukzessive bis hin zu den reellen Zahlen.
noch Urbild besitzt. Wir verwenden die Bezeichnung „all-
gemeine Kreislinie“ K(A, B, C) für eine Gerade oder eine
Kreislinie in C mit den Bezeichnungen aus dem Beispiel auf Der konstruktive Weg beginnt bei den
Seite 147 und zeigen die zur Behauptung äquivalente, aber
natürlichen Zahlen
etwas konkretisierte Aussage:
Die allgemeine Kreislinie K(A, B, C), von welcher man den In den ersten Abschnitten dieses Kapitels hatten wir die re-
Ursprung entfernt, falls dieser auf ihr liegt, wird durch die ellen Zahlen R durch Axiome charakterisiert und die natür-
Inversion j auf die allgemeine Kreislinie K(C, B, A) abge- lichen Zahlen N als Teilmenge von R definiert, genauer als
bildet, von welcher man, wenn nötig, ebenso den Ursprung kleinste Nachfolgermenge bzw. Zählmenge (Seite 118).
entfernt. Formal schreibt sich das so:
Nachdem um 1870 die reellen Zahlen unter Verwendung der
j (K(A, B, C) \ {0}) = K(C, B, A) \ {0}, rationalen Zahlen auf verschiedene Weisen erklärt worden
waren, entstand auch das Bedürfnis, die natürlichen Zahlen
für A, C ∈ R, B ∈ C, AC < |B|2 . Dazu sei z ∈ C, z  = 0. axiomatisch zu charakterisieren.
Es sind sukzessive äquivalent:
Ein Ansatz von Gottlob Frege (1848–1925) wurde von Felix
z ∈ K(A, B, C) Hausdorff (1868–1942) und Bertrand Russell (1872–1970)
⇔ Azz + Bz + Bz + C = 0 weitergeführt. Dieser Ansatz betonte die kardinale Eigen-
1 schaft der natürlichen Zahlen: Die natürlichen Zahlen sind
⇔ (Azz + Bz + Bz + C) = 0 die Elementanzahlen endlicher Mengen.
zz
B B C Ein weiterer Ansatz, der den Zählprozess und damit die natür-
⇔A+ + + =0 lichen Zahlen als Zählzahlen in den Vordergrund stellt, der or-
z z zz
⇔ A + B · j (z) + B j (z) + C · j (z)j (z) = 0. dinale Aspekt, findet sich in der berühmten Schrift „Was sind
und was sollen die Zahlen?“ (1887) von Richard Dedekind.
Betrachtet man die letzte Gleichung, stellt man fest, dass sie Dieser Ansatz wurde von John von Neumann (1903–1957)
& B,
j (K(A, & C))
& entspricht mit A & = C, B& = B bzw. C & = A. weiterentwickelt. Einen ähnlichen Ansatz verfolgte der ita-
Insgesamt ergibt sich die Behauptung.  lienische Mathematiker Giuseppe Peano um 1889.
4.7 Vertiefung: Konstruktiver Aufbau der reellen Zahlen 149

Dedekind hatte bereits gezeigt, dass ein Axiomensystem für Häufige Verwendung findet der Rekursionssatz von R. De-
die natürlichen Zahlen kategorisch ist, d. h. verschiedene Mo- dekind:
delle sind isomorph.
Im Gegensatz zum Rest des Buchs wollen wir im Folgenden Rekursionssatz
die Zahl Null, 0, zu den natürlichen Zahlen rechnen. Sei A eine beliebige Menge mit einem Element a ∈ A
und einer Selbstabbildung g : A → A gegeben.
Am 7. Dezember 1873 bewies Georg Cantor, dass die Dann gibt es genau eine Abbildung f : N0 → A mit
Menge R nicht abzählbar ist, sich also nicht in der Form f (0) = a und f ◦ ν = g ◦ f , d. h., also f (ν(n)) =
{r0 , r1 , r2 , . . .} schreiben lässt. Dieser Tag gilt daher für viele g(f (n)) für alle n ∈ N0 .
Mathematiker als die Geburtsstunde der Mengenlehre, die
aber noch einige Geburtswehen und Krisen durchzustehen
hatte. Der ganze Apparat der Mengenlehre, so wie wir ihn Beweis: Die Eindeutigkeit von f folgt mittels Induktion
heute kennen, stand Dedekind und Peano noch nicht zur Ver- nach n.
fügung.
Auch die Existenz von f kann man mittels Induktion zei-
Heutzutage kann man aber mit den Axiomen der Mengen- gen: Durch f (0) = a ist f (0) festgelegt. Wegen f (ν(n)) =
lehre den folgenden Satz zeigen. g(f (n)) gilt f (1) = g(f (0)) = g(a) und mit 2 := ν(1) gilt
f (2) = f (ν(1)) = g(f (1)) = g(g(0)) etc. 

Existenzsatz über natürliche Zahlen


Es gibt eine Menge N0 , die Menge der natürlichen Zah- Die Frage, inwiefern das Tripel (N0 , 0, ν) – wir wollen ein
len, mit folgenden Eigenschaften (Peano-Eigenschaf- solches Tripel Peano-Tripel nennen – eindeutig bestimmt
ten): ist, beantwortet der folgende Satz:
(P1) N0 enthält ein ausgezeichnetes Element 0 ∈ N0
(Null ist eine natürliche Zahl). Insbesondere ist Eindeutigkeitssatz
N0  = ∅ und es ist eine Selbstabbildung (sog.
Sind (N0 , 0, ν) und (N∗0 , 0 , ν  ) zwei Peano-Tripel, dann
Nachfolgerfunktion) ν : N0 → N0 erklärt, so-
gibt es genau eine bijektive Abbildung f : N0 → N∗0
dass gilt:
mit f (0) = 0 und ν  ◦ f = f ◦ ν.
(P2) Ist n ∈ N0 , dann ist auch ν(n) ∈ N0 (mit n ist auch
der Nachfolger ν(n) eine natürliche Zahl).
(P3) Für alle n ∈ N0 ist ν(n)  = 0 (Null ist nicht Nach- Man sagt hierfür auch: (N0 , 0, ν) und (N∗0 , 0 , ν  ) sind kano-
folger einer natürlichen Zahl). nisch isomorph : Beim Rechnen im Modell (N∗0 , 0 , ν  ) er-
(P4) Sind n, m ∈ N0 und gilt n  = m, dann ist auch hält man dieselben Ergebnisse wie beim Rechnen im Modell
ν(n) = ν(m); die Nachfolgerfunktion v(n) ist (N0 , 0, ν). Deshalb kann man sinnvoll von den natürlichen
also injektiv (verschiedene natürliche Zahlen ha- Zahlen sprechen.
ben verschiedene Nachfolger).
(P5) Ist N ⊆ N0 eine Teilmenge mit 0 ∈ N und gilt für
Beweis: Der Beweis des Induktionssatzes ergibt sich aus
alle Elemente n ∈ N, dass auch ν(n) ∈ N, dann
dem Rekursionssatz mit A = N∗0 , a = 0 und g = ν  . Es gibt
ist N = N0 (Induktionsaxiom).
also genau eine Abbildung f : N0 → N∗0 mit f (0) = 0 und
f ◦ ν = ν ◦ f .
Meist wird das Induktionsaxiom (P5) in der folgenden Form
Vertauschung der Rollen von N0 und N∗0 ergibt die Existenz
benutzt:
einer Abbildung h : N0 → N0 mit h(0 ) = 0 und h ◦ ν  =
Sei E(n) eine Eigenschaft, die eine natürliche Zahl n haben ν ◦ h.
kann oder nicht. Gilt dann E(0), und gilt für alle n die Im-
Um h ◦ f = idN0 und f ◦ h = idN∗ nachzuweisen, be-
plikation E(n) ⇒ E(n + 1), dann gilt E(n) für alle n ∈ N0 . 0
nutzt man die Eindeutigkeitsaussage des Rekursionssatzes
mit A = N0 , a = 0 und g = ν. Da sowohl h ◦ f als
Beweis: Zum Beweis braucht man nur die Menge N = auch idN0 Abbildungen ϕ : N0 → N0 mit ϕ(0) = 0 und
{n ∈ N0 ; E(n) gilt } zu betrachten.  ϕ ◦ ν = ν ◦ ϕ sind, muss h ◦ f = idN0 gelten. Analog setzt
man f ◦ h = idN∗ . 
0

Wir werden im Folgenden sehen, wie man aus den Pea-


noeigenschaften alle gewohnten Regeln für das Rechnen mit Wie man die Existenz der natürlichen Zahlen und ihre im
den natürlichen Zahlen ableiten kann. Neue Begriffe wie Satz auf Seite 149 zusammengestellten Eigenschaften (P1)
beispielsweise die Addition werden im Bereich der natür- bis (P5) aus den Axiomen der Mengenlehre ableiten kann,
lichen Zahlen meist rekursiv eingeführt. Man spricht daher findet man z. B. in dem Werk von Friedrichsdorf und Prestel
auch von einer „induktiven Definition“ wie beispielsweise „Mengenlehre für den Mathematiker“ oder in der „Einfüh-
bei 1 := ν(0), 2 := ν(1) = ν(ν(0)) usw. rung in die Mengenlehre“ von Ebbinghaus.
150 4 Zahlbereiche – Basis der gesamten Mathematik

In dem erstgenannten Werk wird das Axiomensystem von


N0 ist wohlgeordnet, d. h., jede nichtleere Teilmenge
von Neumann-Bernays-Gödel (NBG-Axiome) zugrunde ge-
V ⊆ N0 hat ein kleinstes Element (Wohlord-
legt, während Ebbinghaus das Axiomensystem von Zermelo
nungssatz).
und Fraenkel und das Auswahlaxiom (ZFC-Axiome) ver-
(N0 , ≤) ist streng geordnet, d. h., für alle m, n ∈ N
wendet. Glücklicherweise sind beide Axiomensysteme äqui-
gilt m ≤ n oder n ≤ m. Für n, m ∈ N0 gilt genau eine
valent, d. h., in beiden Systemen sind die gleichen Sätze über
der drei Aussagen: n < m, n = m oder n > m, und
Mengen ableitbar.
zu n ∈ N0 gibt es kein k ∈ N0 mit n < k < n + 1.
Für alle m, n ∈ N0 sind folgende Aussagen äquiva-
Im folgenden Satz sind Rechenregeln für die natürlichen Zah- lent:
len zusammengefasst, die alle aus den Peano-Axiomen fol- – m ≤ n.
gen. Sie scheinen, wenigstens teilweise, selbstverständlich – Es gibt eine injektive Abbildung
zu sein. Wir müssen jedoch beachten, dass wir keine Re- f : {1, 2, . . . , m} → {1, 2, . . . , n}.
chenregeln, die vom gewöhnlichen Rechnen bekannt zu sein – Es gibt eine surjektive Abbildung
scheinen, verwenden dürfen, bevor wir diese Regeln nicht aus g : {1, 2, . . . , n} → {1, 2, . . . , m}, oder es ist
den Peano-Axiomen abgeleitet haben. Das Beweisprinzip der m = 0.
vollständigen Induktion und der Rekursionssatz spielen da- Für m, n ∈ N0 gelten m ≤ n ⇔ ml ≤ nl, falls l ∈ N
bei eine wichtige Rolle. bzw. m < n ⇔ ml < nl, falls l ∈ N.

Addition und Multiplikation auf N0 Wir machen zu den Beweisen der einzelnen Aussagen aus
Platzgründen lediglich einige Anmerkungen.
Auf der Menge N0 der natürlichen Zahlen lassen sich in
eindeutiger Weise zwei Verknüpfungen „+“ (Addition) Zur Definition der Addition ist zu sagen, dass für m, n ∈ N0
und „·“ (Multiplikation) definieren: die Addition rekursiv definiert wird:
„+“: N0 × N0 → N0 mit (m, n)  → m + n und
m + 0 := m und m + ν(n) = ν(m + n).
„·“: N0 × N0 → N0 mit (m, n)  → m · n,
wobei Folgendes gilt: Man wendet also den Rekursionssatz an mit A = N0 ,
(N0 , +) ist eine kommutative Halbgruppe mit dem a := m, g := ν und f (n) := m + n. Insbesondere gilt
neutralen Element 0, d. h., es gelten alle Grup- also 1 := ν(0) und m + 1 = ν(m). Der Nachfolger von m ist
penaxiome mit Ausnahme der Existenz eines addi- also m + 1.
tiven Inversen für alle n ∈ N0 .
Die durch die obigen Gleichungen rekursiv definierte Zahl
Die Multiplikation „·“: N0 × N0 → N0 mit (m, n)  →
m + n heißt die Summe von m und n.
m · n ist assoziativ, kommutativ, und 1 := ν(0) ist
neutrales Element bezüglich „·“. Beachtet man die folgende Überlegung:
Ferner ist die Multiplikation distributiv bezüglich der
m + 1 = m + ν(0) = ν(m + 0) = ν(m),
Addition, d. h., für alle l, m, n ∈ N0 gilt:
m + 2 = m + ν(1) = ν(m + 1) = ν(ν(m)) =: ν 2 (m),
(l + m) · n = (l · n) + (m · n). ..
.
0 · n = n · 0 = 0 für alle n ∈ N0 , und ν(n) = n + 1 m + n = m + ν n (0) =: ν n (m),
für alle n ∈ N0 .
so kann man ablesen, dass m + n der n-te Nachfolger von m
Für m, n ∈ N0 gilt m · n = 0 ⇔ m = 0 oder n = 0.
ist.

Neben diesen Rechenregeln sollen die natürlichen Zahlen Zur Multiplikation ist zu sagen, dass man für m, n ∈ N0
über eine Ordnung verfügen, die es erlaubt, natürliche Zahlen m·0 := 0 und m·ν(n) := m·n+m definiert. Man mache sich
der Größe nach zu vergleichen. Bezüglich dieser Ordnung ist klar, dass dies wieder eine Anwendung des Rekursionssatzes
N0 sogar wohlgeordnet, d. h., jede nichtleere Teilmenge von ist.
N0 besitzt ein kleinstes Element. Aus den beiden Definitionen oben folgt 0 · n = 0 und ν(m) ·
n = n + m · n. Nach der ersten Definition gilt 0 + 0 = 0
Ordnung der natürlichen Zahlen und 0 · ν(n) = 0 · n + 0 = 0 + 0 = 0. Das war ein Induk-
In N0 wird durch R = {(m, n) ∈ N0 × N0 | ∃k ∈ tionsbeweis!
N0 mit m+k = n} ⊆ N0 × N0 eine Ordnungsrelation Weiter ist ν(m) · 0 = 0 + 0 = 0 + m · 0 = 0.
definiert. Wir schreiben m ≤ n für (m, n) ∈ R und
m < n, falls m ≤ n und m  = n gilt. Die Relation m < Ferner ist ν(m) · ν(n) = ν(m) · n + ν(m) wegen m · ν(n) =
n ist äquivalent dazu, dass es ein k ∈ N = N0 \{0} mit m · n + m, und nach Induktionsvoraussetzung gilt n + m ·
m + k = n gibt. Durch „≤“ ist N0 total geordnet, und n+ν(m), was nach Definition der Addition ν(n)+m · n+m
es gilt 0 = min(N0 ). entspricht. Schließlich findet man mit der Definition der Mul-
tiplikation ν(n) + m · ν(n).
4.7 Vertiefung: Konstruktiver Aufbau der reellen Zahlen 151

Als weitere Eigenschaft beweisen wir exemplarisch das Dis- Möglichkeiten dargestellt. Wir werden auf eine Wiederho-
tributivgesetz. Es lautet: Für alle k, m, n ∈ N0 gilt: lung verzichten.
(k + m) · n = (k · n) + (m · n). Wir werden bei diesen Schritten in natürlicher Weise weitere
algebraische Begriffsbildungen einführen, z. B.:
Zur Vereinfachung der Schreibweise lassen wir bei der Multi-
plikation den Malpunkt weg und vereinbaren die „Vorfahrts- beim Übergang von N0 zu den ganzen Zahlen Z die Ein-
regel“; dass die Multiplikation stärker bindet als die Addition. bettung einer regulären Halbgruppe in eine Gruppe;
Dann lautet das Distributivgesetz einfach beim Übergang von Z zu den rationalen Zahlen Q die
Konstruktion eines Quotientenkörpers;
(k + m)n = kn + km (k, m, n ∈ N0 ). beim Übergang von Q zu den reellen Zahlen nach dem
Vorbild von G. Cantor einen weiteren Restklassenring.
Beweis: Wir führen den Beweis mittels Induktion nach n:
Es ist (k + m)0 = 0 = 0 + 0 = k · 0 + m · 0, und der Durch Erweiterung von N0 erhält man die
Induktionsanfang ist gesichert.
ganzen und die rationalen Zahlen
Unter der Voraussetzung, dass das Distributivgesetz für ein
beliebiges n ∈ N0 gilt, zeigen wir seine Gültigkeit für Wir wollen die Erweiterung von N0 nach Z so konstruieren,
ν(n) = n + 1. Es ist nach Definition dass sich jede ganze Zahl z als Differenz zweier natürlicher
Zahlen m, n darstellen lässt: z := m−n. Algebraisch gespro-
(k + m)ν(n) = (k + m)n + k + m,
chen wollen wir (N, +) zu einer abelschen Gruppe erweitern
was nach Induktionsvoraussetzung kn + mn + k + m ent- und stellen zunächst folgende heuristische Vorbetrachtung
spricht. Wegen der Kommutativität ist dies gleichbedeutend an:
mit kn + k + mn + m, was nach Definition aber gerade
Gilt sowohl z = m − n als auch z = m − n , dann ist
k(n + 1) + m(n + 1) entspricht.
m − n = m − n äquivalent zu m + n = m + n.


Dass in N0 jede nichtleere Teilmenge ein kleinstes Element Wir definieren daher auf N0 × N0 die folgende Relation:
besitzt, kann man wie im Abschnitt 4.4 vorne beweisen. Wir
R = {((m, n), (m , n )) | m + n = m + n}.
geben hier einen einfachen Beweis an, der lediglich benutzt,
dass jede von 0 verschiedene Zahl n ∈ N0 einen Vorgänger Diese Definition ist eine Äquivalenzrelation auf N0 × N0 . Die
hat, d. h., zu n = 0 gibt es ein n ∈ N0 mit ν(n ) = n. Reflexivität und Symmetrie ist offensichtlich. Die Transiti-
Seien dazu V ⊆ N0 eine nichtleere Teilmenge und m ∈ V vität folgt aus der Kürzungsregel für die natürlichen Zahlen.
ein beliebiges Element, das wir mit m0 := m fixieren. Gibt
es kein m ∈ V mit ν(m ) = m0 , dann ist m0 das kleinste
]

]
N0
4)

3)

2)

1)

0)

0)

0)
Element von V . Gibt es aber ein m ∈ V mit ν(m ) = m0 ,
0,

0,

0,

0,

0,

1,

2,
[(

[(

[(

[(

[(

[(

[(
so definieren wir neu m0 := m . Diesen Prozess iterieren 4
wir, wenn nötig. Nach höchstens m0 Schritten muss dieser
Prozess abbrechen, da wir dann bei der Zahl 0 angekommen 3
sind, und 0 besitzt keinen Vorgänger. Ist 0 ∈
/ V , so bricht der
2
Prozess vorher ab.
1
Erinnern Sie sich (Seite 120), dass der Wohlordnungssatz
und das Beweisprinzip der vollständigen Induktion äquiva-
-4 -3 -2 -1 0 1 2 3 4 5 6 N0
lent sind!
Abbildung 4.21 Veranschaulichung der Äquivalenzrelation R. Es gilt z. B.
Ausführliche Beweise der Eigenschaften von N0 , die wir auf-
[(0, 2)] = {(0, 2), (1, 3), (2, 4), . . . }.
gelistet haben, finden sich in dem schon zitierten Werk von
E. Landau „Grundlagen der Analysis“. Die Lektüre dieses Für ((m, n), (m , n )) ∈ R schreiben wir auch (m, n) ∼
Klassikers sei jedem empfohlen. Dort findet sich im Vorwort (m , n ). Sei [(m, n)] die Äquivalenzklasse von (m, n), d. h.,
von 1929 der folgende bemerkenswerte Satz: [(m, n)] = {(x, y) ∈ Z × Z | (x, y) ∼ (m, n)}, so definieren
„Bitte vergiss alles, was Du auf der Schule gelernt hast; denn wir:
Du hast es nicht gelernt.“
Z = N0 × N0 /R = {[m, n]} mit m, n ∈ N0 .
Der Schritt von den natürlichen Zahlen zu den ganzen Zah-
len ist einfach, genauso wie der folgende Schritt von den In N0 × N0 kann man komponentenweise addieren:
ganzen Zahlen hin zu den rationalen Zahlen. Der Schritt von (m, n) + (m , n ) = (m + m , n + n ).
den rationalen Zahlen zu den reellen Zahlen ist der schwie-
rigste. Der Übergang von R zu den komplexen Zahlen C ist Dabei gelten das Kommutativgesetz und das Assoziativge-
wieder relativ einfach. Im Haupttext wurden hierfür mehrere setz, und (0, 0) ist das neutrale Element.
152 4 Zahlbereiche – Basis der gesamten Mathematik

Diese Addition ist mit der Relation R verträglich, d. h., aus Für [(m, n)] ∈ Z und [(k, l)] ∈ Z sei
(m, n) ∼ (m , n ) und (k, l) ∼ (k  , l  ) folgt (m, n) + (k, l) ∼
(m , n ) + (k  , l  ) für m, n, k, l, m , n , k  , l  ∈ N0 . In Z defi- [(m, n)] · [(k, l)] = [(mk + nl, ml + nk)].
niert man nun eine Addition wie folgt: Seien a, b ∈ Z, dann
wählen wir m, n, k, l ∈ N0 mit a = [(m, n)] und b = [(k, l)] Man weist nach, dass die Multiplikation · : Z × Z → Z ver-
und definieren a + b = [(m, n) + (k, l)]. treterunabhängig ist und dass die Abbildung zudem
assoziativ,
Wir verzichten auf den Nachweis, dass diese Addition nicht
kommutativ und
von der speziellen Vertreterwahl m, n, k, l ∈ N0 abhängt.
distributiv bezüglich „+“ ist.
Folgerung Zudem ist [(1, 0)] =: 1 das neutrale Element bezüglich „·“.
(Z, +) ist eine abelsche Gruppe mit dem neutralen Ele-
Zusammenfassend erhält man als Ergebnis: (Z, +, ·) ist ein
ment 0 = [(0, 0)].
Integritätsring; dies ist ein kommutativer, nullteilerfreier
Ring mit Einselement, der N0 ∼ = ι(N0 ) als Teilmenge ent-
Beweis: Das Assoziativ- wie auch das Kommutativgesetz hält.
übertragen sich von N0 auf N0 × N0 und weiter auf Z. Das
Element 0 ist neutral in N0 , (0, 0) neutral in N0 × N0 , und Z ist der kleinste Ring bezüglich „⊆“, der N0 enthält. Ge-
[(0, 0)] ist neutral in Z. nauer gilt, dass es zu jedem Integritätsring R und zu jedem
injektiven Homomorphismus ϕ : N → R genau einen in-
Inverses Element zu [(m, n)] bezüglich der Addition ist jektiven Homomorphismus  : Z → R mit der Eigenschaft
[(n,m)], da [(m, n)]+[(n, m)] = [(m+n, m+n)] = [(0, 0)]  ◦ ι = ϕ gibt.
gilt.
ϕ
N0 -
Das zu α ∈ Z eindeutig bestimmte inverse Element bezüglich R
der Addition bezeichnen wir mit −α. @ 
@
Durch α − β = α + (−β) (α, β ∈ Z) wird auf Z die Sub- @
traktion eingeführt. 
ι
@ 
@
@
R
@
Wir behaupten, dass die Abbildung
Z

ι : N0 → Z; m → [(m, 0)] Abbildung 4.22 In diesem kommutativen Diagramm wird die Beziehung
 ◦ ι = ϕ für die natürlichen und ganzen Zahlen dargestellt.
injektiv und mit der Addition verträglich ist. Das bedeutet,
dass In Z gilt die Kürzungsregel für die Multiplikation: Aus
mk = nk und k = 0 folgt m = n.
ι(m + n) = [(m + n, 0)] = [(m, 0)] + [(n, 0)] = ι(m) + ι(n)
Beweis: Aus mk = nk folgt (m − n)k = 0, und wegen
erfüllt ist. k = 0 folgt m − n = 0, also m = n. 

Aus ι(m) = ι(n) folgt [(m, 0)] = [(n, 0)] ⇒ 0  = m = n = Wir definieren nun eine Anordnung in Z, welche die Ordnung
0 ⇒ m = n. in N0 fortsetzt. Diese Ordnung für m, n ∈ Z lautet wie folgt:
Wir vereinbaren daher, m mit ι(m) für alle m ∈ N0 zu identi- m ≤ n ⇒ n − m ∈ N0 .
fizieren und können jetzt N0 als Teilmenge von Z auffassen:
Damit ist Z linear total geordnet. Für alle m, n ∈ Z mit m ≤ n
(Z, +) ist eine Erweiterung von (N0 , +) zu einer abelschen gilt m + k ≤ n + k, und falls k > 0, gilt mk ≤ nk.
Gruppe. Jedes Element aus Z hat mit m, n ∈ N0 die Gestalt
In N0 wird die früher definierte Ordnung induziert, denn
[(m, n)] = [(m, 0)] + [(0, n)] = [(m, 0)] + [(−n, 0)] n − m ∈ N0 ist äquivalent mit: Es gibt ein k ∈ N0 mit
= ι(m) − ι(n) = m − n. m + k = n.

Die Differenzdarstellung ganzer Zahlen motiviert die Defi-


nition ihrer Multiplikation. Wir wollen distributiv rechnen Aus Z wird mithilfe von Äquivalenzklassen
können, d. h. es soll Q konstruiert

(m − n)(k − l) = (mk + nl) − (ml + nk) Mit Z haben wir einen Ring gefunden, der N0 bei passen-
der Identifizierung enthält und der in einem gewissen Sinne
gelten für m, n, k, l ∈ N0 . So gelangt man zu folgender De- minimal ist. Aber es hat z. B. die Gleichung 2x = 1 keine
finition der Multiplikation auf Z: Lösung x ∈ Z.
4.7 Vertiefung: Konstruktiver Aufbau der reellen Zahlen 153

ϕ
Um einen Zahlbereich zu konstruieren, der Z enthält und in Z - R
dem Gleichungen wie oben eine eindeutige Lösung besitzen, @ 
betrachtet man &Q = {(a, b) ∈ Z × Z\{0}} und definiert für @
Q und a  , b ∈ &
a, b ∈ & Q: @
ι 
@
   
(a, b) ∼ (a , b ) ⇔ ab = a b. @
@R
@
Man überzeuge sich, dass hierdurch eine Äquivalenzrela-
Q
tion auf &
Q definiert wird, und wir definieren Q = &
Q/∼ als
die Menge der Äquivalenzklassen. Für die Klasse von (a, b) Abbildung 4.23 In diesem kommutativen Diagramm wird die Beziehung
 ◦ ι = ϕ für die ganzen und rationalen Zahlen dargestellt.
schreiben wir ab .
Die Elemente von Q heißen rationale Zahlen. Man beachte,
dass eine rationale Zahl in verschiedener Weise in der Form Ausgangspunkt ist der archimedisch angeordnete Körper Q
a der rationalen Zahlen. In Q existieren Folgen von rationalen
b dargestellt werden kann. Es ist etwa
Zahlen, die Cauchy-Folgen in Q, die in R konvergieren, deren
2 4 6 Grenzwert aber keine rationale Zahl ist.
= = = ...
5 10 15
und die Zahlenpaare (2, 5), (4, 10), (6, 15) usw. repräsentie- Beispiel Ein Beispiel ist die rekursiv definierte Folge
ren alle dieselbe rationale Zahl. Die obige Äquivalenzrelation (xn+1 ) von rationalen Zahlen mit
' (
erlaubt das „Kürzen“ und „Erweitern“ von Brüchen. 1 2
x0 = 2, xn+1 = xn + .
Auf dieser Menge definieren wir erneut eine Addition und 2 xn
eine Multiplikation: √
Sie konvergiert in R gegen 2 und ist√damit eine Cauchy-
Seien ab , dc ∈ Q, dann seien Folge in R und damit auch in Q, aber 2 ist keine rationale
Zahl, wie wir gezeigt haben (Seite 127). 
a c ad + bc
(A): + = und
b d bd Die Konstruktion nach Cantor verläuft wie folgt:
a c ac
(M): · = . Zuerst betrachtet man die Menge aller Cauchy-Folgen von
b d bd
rationalen Zahlen R = {(xn ) | (xn ) ist Cauchy-Folge in Q}.
m
Mit der Abbildung ι : Z → Q, definiert durch m  → 1, gilt Dabei ist der Begriff der Cauchy-Folge in Q wie der der
dann der folgende Satz: Cauchy-Folge in R erklärt, da die betreffenden ε > 0 immer
rational sind. In der Menge R erklärt man eine Relation wie
Die Menge der rationalen Zahlen ist ein Körper folgt:
Die Menge Q der rationalen Zahlen ist mit der wohlde- (xn ) und (yn ) aus R heißen äquivalent, in Zeichen (xn ) ∼
finierten Addition (A) und der wohldefinierten Multipli- (yn ), genau dann, wenn limn→∞ |xn −yn | = 0 gilt; die Folge
kation (M) ein Körper. der Differenzen ist also eine Nullfolge in Q.
Man prüft leicht nach, dass dies eine Äquivalenzrelation auf
Zu ab ist − ab das additive Inverse und falls a  = 0 ist b
a das R ist und definiert
multiplikative Inverse.
/
R = {ξ = (xn ) | (xn ) ∈ R}
Die Konstruktion von Q aus Z ist ein wichtiges Beispiel für
die Konstruktion eines Quotientenkörpers: Q ist die Menge als die Menge der entsprechenden Äquivalenzklassen. Damit
aller Quotienten ab mit ganzen Zahlen a, b und b  = 0. hat man R zunächst als Menge, die man mit einer Addition
und einer Multiplikation versehen muss. Eine Addition bzw.
Q besitzt die folgende universelle Eigenschaft: Zu jedem in- eine Multiplikation in R definiert man über (xn ) + (yn ) =
jektiven Ringhomomorphismus von Z in einen beliebigen (xn + yn ) bzw. (xn ) · (yn ) = (xn · yn ). Dabei muss man
Körper R gibt es eine eindeutig bestimmte injektive Abbil- streng genommen zwei verschiedene „+“- bzw. „·“-Zeichen
dung  mit  ◦ ι = ϕ. verwenden, da die Addition bzw. die Multiplikation in R
jeweils erst durch die rechten Seiten definiert werden.
Cantors Weg von Q zu den reellen Zahlen Auf der Menge R der entsprechenden Restklassen wird dann
führt über Cauchy-Folgen durch
/
(x /
n ) + (y
 /
n ) = (xn + yn ) bzw. (x /
n ) · (x

n ) = (xn · yn )
Zum Schluss skizzieren wir eine Konstruktion der reellen
Zahlen, die von Georg Cantor 1883 publiziert wurde. Wir eine Addition bzw. eine Multiplikation induziert, die unab-
verwenden dabei die Begriffe der konvergenten Folge und hängig von der Auswahl der Restklassenrepräsentanten sind.
der Cauchy-Folge in Vorgriff auf das Kapitel 8 „Folgen“. So wird eine Körperstruktur auf R definiert. Wir verzichten
154 4 Zahlbereiche – Basis der gesamten Mathematik

hier auf die Verifikation der meisten Körperaxiome, da diese x < y ⇔ ϕ(x) < ϕ(y),
leicht nachzuweisen sind. Etwas schwieriger nachzuweisen wobei wir die Kleinerrelation in den beiden Körpern gleich
ist, dass jedes von 0 verschiedene Element (x / n ) ∈ R ein bezeichnet haben.
Inverses besitzt.
Wir behaupten also, dass je zwei archimedisch angeordnete
Zuletzt definiert man noch die Menge der positiven Elemente Körper, in denen jede Cauchy-Folge konvergiert, isomorph
P in R über sind:
P = {(x0n ) ∈ R | ∃ r ∈ Q>0 und ∃N ∈ N mit xn > r ∀n ≥ N}
Satz
Für diese Menge P weist man nach, dass R = P ∪{0}∪(−P ) Je zwei archimedisch angeordnete Körper, in denen jede
gilt, eine disjunkte Vereinigung. Cauchy-Folge konvergiert, sind isomorph.
R ist also ein angeordneter Körper mit P als Menge der posi-
tiven Elemente von R. So kann man Q in R wiederfinden: Für Beweis: Wir geben nur eine Beweisskizze. Es genügt zu
r ∈ Q sei ι(r) die Äquivalenzklasse der konstanten Cauchy- zeigen, dass jeder archimedisch angeordnete Körper K, der
Folgen (r) ∈ R. Die Abbildung ι : Q → R, die mit Summen- vollständig ist, zum oben nach Cantor konstruierten Körper
und Produktbildung verträglich ist, respektiert diese Anord- R isomorph ist.
nung. Da K ein angeordneter Körper ist mit Einselement 1, gilt für
Deshalb macht man keinen Unterschied zwischen r und ι(r). die n-fache Summe:
Nach Definition von P gibt es zu jedem ξ ∈ P ein r ∈ Q mit n = 1 + 1 + ... + 1

0 < r < ξ.
n Summanden
Weiter zeigt man, dass R archimedisch geordnet ist. Man stets n + 1 > n. Insbesondere ist n = 0. Man kann daher die
führt einen Widerspruchsbeweis und nimmt dazu an, dass Menge {0, 1, 1 + 1, . . .} mit der Menge N0 = {0, 1, 2, . . .}
etwa α ∈ R eine obere Schranke von N sei. Nach unserer der natürlichen Zahlen identifizieren und damit als Teilmenge
letzten Überlegung gibt es ein r ∈ Q mit 0 < r < α1 . Mit von K auffassen. Genauso fasst man Z und Q als Teilmengen
1/r = a/b mit 0 = b, a ∈ N erhält man den Widerspruch von K auf. Aus der archimedischen Eigenschaft von K ergibt
α < 1/r = a/b ≤ a ∈ N. sich, dass Q dicht in K ist.

Als nächstes weist man nach, dass ι(Q) dicht in R liegt. Seien Zu jedem x ∈ K gibt es also eine Folge (xn ), xn ∈ Q, mit
dazu ξ = (x/ n ) ∈ R und 0 < ε ∈ Q gegeben. Da (xn ) eine
limn→∞ xn = x.
rationale Cauchy-Folge ist, gibt es zu diesem ε ein N ∈ N Dann ist (xn ) eine Cauchy-Folge in Q, und man definiert:
mit |xn − xm | < ε für alle n, m ∈ N mit n, m > N. Für
/
ϕ : K → R; x → (xn)
m ≥ N bedeutet das aber |ξ − ι(xm )| < ε.
und verifiziert die Unabhängigkeit von der Repräsentanten-
Das bedeutet speziell, dass ι(Q) dicht in R ist. Nun folgt ein
wahl.
Nachweis der Vollständigkeit von R.
ϕ ist auch mit der Summen- und der Produktbildung sowie
mit der Anordnung verträglich. Ist y ∈ K und yn eine Folge
Jede Cauchy-Folge reeller Zahlen konvergiert mit yn ∈ Q und gilt limn→∞ yn = y, so folgt aus x = y
in R unmittelbar:
lim (xn − yn ) = 0
n→∞
Sei (ξj ) eine Cauchy-Folge von R. Nach der vorangegangen
und ϕ(x) = ϕ(y). ϕ ist also injektiv. ϕ ist aber auch surjektiv:
Überlegung gibt es ein rj mit |ξj − rj | < j1 . Damit ist rj also
/ Denn ist ξ = (x/ n ) ∈ R ein beliebig vorgegebenes Element,
eine Cauchy-Folge in Q, und man definiert ξ = (r j ) ∈ R.
so existiert wegen der Vollständigkeit von K der Grenzwert
Es gilt wegen der Dreiecksungleichung |ξ − ξj | ≤ |ξ − rj | + limn→∞ xn =: x ∈ K. Daher ist ϕ(x) = ξ . ϕ ist also bijektiv
|rj − ξ |, und daher folgt limj →∞ |ξ − ξj | = 0. und damit ein Isomorphismus 

Zum Abschluss zeigen wir, dass R durch die Körperaxiome,


die Anordnungsaxiome, das archimedische Axiom und die Dass ϕ im Übrigen eindeutig bestimmt ist, beruht darauf, dass
Vollständigkeit, also die Konvergenz von Cauchy-Folgen in (R, +, ·) als einziger Automorphismus die Identität besitzt.
R, bis auf Isomorphie eindeutig bestimmt ist.
Die Cantor’sche Konstruktion hat gegenüber den anderen
Alle Konstruktionen von R, wie beispielsweise die über De- Konstruktionen von R aus Q den Vorteil, dass sie sich z. B.
dekind’sche Schnitte, führen zum „gleichen Ergebnis“: Die auf metrische Räume übertragen lässt:
entsprechenden Körper K1 und K2 sind algebraisch iso-
Wie wir in Kapitel 19 sehen werden, lässt sich jeder nicht
morph, und der entsprechende Isomorphismus ϕ respektiert
vollständige metrische Raum (X, d) so in einen vollständi-
auch die Anordnung: 0 d)
0 einbetten, dass sein Bild dicht
gen, metrischen Raum (X,
Für x, y ∈ K1 gilt: 0
in X ist.
Zusammenfassung 155

Zusammenfassung

Wir haben das Kapitel mit der axiomatischen Einführung der Die Existenz natürlicher Zahlen garantiert dann ein wichtiges
reellen Zahlen R begonnen: Beweisprinzip in der Mathematik.

Axiome der reellen Zahlen


Beweisprinzip der vollständigen Induktion
Es gibt drei Serien von Axiomen für die reellen Zahlen:
Für jede natürliche Zahl n sei A(n) eine Aussage bzw.
(K) die Körperaxiome,
Behauptung. Diese kann wahr oder falsch sein.
(AO) die Anordnungsaxiome,
(V) ein Vollständigkeitsaxiom. Die Aussagen A(n) gelten für alle n ∈ N, wenn man
Folgendes zeigen kann:
Die Körperaxiome beinhalten die Regeln für die Addition (IA) A(1) ist wahr und
und Multiplikation reeller Zahlen. Sie sind mehrfach aufge- (IS) für jedes n ∈ N gilt A(n) ⇒ A(n + 1).
listet (siehe die Abschnitte 3.3 und 4.4 ), sodass wir hier auf Der erste Schritt (IA) heißt Induktionsanfang oder
eine weitere Auflistung verzichten. Induktionsverankerung, und die Implikation A(n) ⇒
A(n + 1) nennt man den Induktionsschritt .
In der Sprache der Algebra besagen die Axiome: (R, +) ist
eine abelsche Gruppe bezüglich der Addition „+“ mit dem
neutralen Element 0, und (R\{0}, ·) ist eine abelsche Gruppe Dieses Prinzip ist äquivalent zum Wohlordnungssatz: Jede
bezüglich der Multiplikation „·“ mit dem neutralen Element nichtleere Teilmenge der natürlichen Zahlen hat ein kleinstes
1 = 0. Element.

Ferner sind Addition und Multiplikation über das Distribu- Auch die ganzen Zahlen lassen sich in R entdecken.
tivgesetz miteinander gekoppelt.
Die Anordnungsaxiome erlauben es, reelle Zahlen der Größe Definition der ganzen Zahlen
nach zu vergleichen. Sie bilden die Grundlage für Abschät- Eine reelle Zahl x heißt ganz, falls x ∈ N oder x = 0
zungen und das Rechnen mit Ungleichungen. oder −x ∈ N gilt. Z = {x ∈ R | x ganz} heißt Menge
Insbesondere das Vollständigkeitsaxiom (V) ist von großer der ganzen Zahlen.
Bedeutung, sodass wir es hier noch einmal anführen.
Zu guter Letzt findet man mit folgender Definition die ratio-
Ein Vollständigkeitsaxiom nalen Zahlen in R.
Jede nichtleere nach oben beschränkte Menge M reeller
Zahlen besitzt eine kleinste obere Schranke, d. h., es gibt Definition rationaler und irrationaler Zahlen
ein s0 ∈ R mit folgenden Eigenschaften:
Die Menge
Für alle x ∈ M ist x ≤ s0 (s0 ist obere Schranke).
 m
Für jede obere Schranke s von M gilt s0 ≤ s. Q = x ∈ R | Es gibt m, n ∈ Z, n  = 0, mit x =
n
Das Vollständigkeitsaxiom unterscheidet R von Q. heißt Menge der rationalen Zahlen. Eine reelle Zahl,
Es garantiert nicht nur z. B. die Existenz von Quadratwur- die nicht rational ist, heißt irrational.
zeln aus nicht negativen reellen Zahlen, sondern ist auch we-
sentlich für den Isomorphiesatz, der besagt, dass ein ange- Die rationalen Zahlen unterscheiden sich von den reellen
ordneter Körper mit Vollständigkeitsaxiom zum Körper der Zahlen wesentlich dadurch, dass in diesem Zahlbereich das
reellen Zahlen isomorph ist. Vollständigkeitsaxiom nicht gilt.
In den so definierten reellen Zahlen lassen sich die natürli- Eine erstaunliche Tatsache ist diese:
chen Zahlen wiederfinden.

Definition der natürlichen Zahlen Q liegt dicht in R


Eine reelle Zahl n heißt natürlich, wenn n in jeder Zähl- Sind a, b ∈ R, und gilt a < b, dann gibt es im Intervall
menge von R enthalten ist. (a, b) sowohl rationale als auch irrationale Zahlen.
N = {n ∈ R | n natürlich}
Ein großer Unterschied zwischen Q und R besteht auch darin,
wird als Menge der natürlichen Zahlen bezeichnet.
dass Q abzählbar ist, R aber nicht (Box auf S. 123).
156 4 Zahlbereiche – Basis der gesamten Mathematik

Trotz der Existenz von k-ten Wurzeln aus nicht negativen Ein Hauptunterschied zwischen R und C besteht darin, dass
Zahlen gibt es einfache algebraische Gleichungen, die keine sich der Körper der komplexen Zahlen nicht anordnen lässt.
reellen Lösungen besitzen. Das klassische und einfachste Nichts desto trotz sind die Beträge komplexer Zahlen nicht
Beispiel ist x 2 + 1 = 0. negative reelle Zahlen, und diese lassen sich der Größe nach
vergleichen.
Um diesen Mangel zu beheben, definiert man die komplexen
Zahlen. Hier noch einmal deren Eigenschaften. Eine insbesondere für Anwendungen, z. B. die Existenz von
Eigenwerten, wichtige Eigenschaft ist im Fundamentalsatz
Eigenschaften von C der Algebra enthalten.
(a) (C, +, ·) ist ein Körper, den wir den Körper der
komplexen Zahlen nennen.
Fundamentalsatz der Algebra
(b) Die Teilmenge
Jedes nicht konstante komplexe Polynom besitzt in C
CR = {(a, 0) | a ∈ R} ⊆ C mindestens eine Nullstelle:
Sind a0 , . . . , an ∈ C; an = 0, n ∈ N, beliebig vorgege-
ist ein zu R isomorpher Teilkörper von C. Wir iden- bene Zahlen, dann besitzt die Gleichung
tifizieren daher (a, 0) mit a.
(c) Für das Element i = (0, 1) ∈ C gilt: an zn + an−1 zn−1 + · · · + a0 = 0

i2 = (0, 1)2 = (−1, 0). mindestens eine Lösung z ∈ C.

Wir nennen i die imaginäre Einheit.


(d) Jedes z = (a, b) ∈ C ist darstellbar durch:

z = (a, b) = (a, 0) + (b, 0)(0, 1) = a + bi.

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 4.2 • Wir haben gezeigt, dass es zu jeder reellen Zahl


a ≥ 0 eine eindeutig bestimmte reelle Zahl x ≥ 0 gibt, wel-
4.1 • Zeigen Sie, dass für beliebige a, b ∈ R gilt: √
che x 2 = a erfüllt (Bezeichnung: x = a). Zeigen Sie die
1 folgenden Rechenregeln für Quadratwurzeln:
sup{a, b} = max{a, b} = (a + b + |a − b|), (a) Für 0 ≤ a, b ∈ R gilt:
2
√ √ √
1 ab = a b.
inf{a, b} = min{a, b} = (a + b − |a − b|).
2 √ √
(b) Aus 0 ≤ a < b folgt a < b.
Aufgaben 157

4.3 ••• Eine Teilmenge M ⊆ R heißt konvex genau der einzige Körperautomorphismus von C ist mit σ (x) = x
dann, wenn für alle x, y ∈ M, x ≤ y stets [x, y] ⊆ M für alle x ∈ R, der von der Identität idC : z → z verschieden
gilt. Zeigen Sie: M ⊆ R ist genau dann konvex, wenn M ein ist.
Intervall ist.
4.10 •• Zeigen Sie, dass es keine Abbildung
4.4 • Beweisen Sie die folgenden drei Aussagen:
f : C \ {0} → C \ {0}
(a) Sind M eine endliche Menge und N eine Teilmenge von
M (N ⊆ M), dann ist auch N endlich, und es gilt |N| ≤ gibt mit
|M|.
(b) Sind M und N disjunkte endliche Mengen (M ∩N = ∅), (1) f (zw) = f (z)f (w) für alle z, w ∈ C \ {0}.
dann ist auch M ∪ N endlich, und es gilt |M ∪ N | = (2) (f (z))2 = z für alle z ∈ C \ {0}.
|M| + |N|. Mit anderen Worten: es gibt keinen Homomorphismus f :
(c) Sind M und N endliche Mengen, dann ist auch M × N C \ {0} → C \ {0} mit (f (z))2 = z für alle z ∈ C \ {0}.
endlich, und es gilt |M × N| = |M| · |N|.
4.11 •• Zeigen Sie der Reihe nach:
4.5 • Zeigen Sie, dass je zwei abgeschlossene Inter-
valle [α, β] und [a, b] mit α, β ∈ R und α < β bzw. a, b ∈ R (a) M = {1} ∪ {x ∈ R | x ≥ 2} ist induktiv, also N ⊆ M
und a < b gleichmächtig sind. Wieso gilt diese Aussage auch und damit M = N.
für offene Intervalle? (b) Es gibt kein m ∈ N mit 1 < m < 2.
(c) S = {n ∈ N | n − 1 ∈ N0 } ist induktiv, also ist S = N.
4.6 • Seien a, b ∈ R, a < b. Geben Sie eine bijektive (d) T = {n ∈ N | es gibt kein m ∈ N mit n < m < n + 1}
Abbildung ϕ : (−1, 1) → R an und folgern Sie, dass alle ist induktiv, also ist T = N.
offenen Intervalle (a, b) mit a < b die Mächtigkeit von R (e) Sind m, n ∈ N, und gilt m < n, dann ist m + 1 ≤ n.
haben.
4.12 •• Zeigen Sie, dass die Teilmenge
4.7 •• Eine reelle oder komplexe Zahl α heißt algebra- √ √
isch, falls es ein Polynom P  = 0 mit P (α) = 0 gibt. Dabei Q( 2) = {a + b 2 | a, b ∈ Q}
seien die Koeffizienten des Polynoms alle ganz. Existiert für
eine Zahl α kein solches Polynom, nennen wir diese Zahl von R bezüglich der auf R erklärten Addition√ und Multipli-

transzendent. kation ein Körper ist. Liegt die reelle Zahl 3 in Q( 2)?

(a) Zeigen Sie, dass jede rationale Zahl α = m


n , m ∈ Z, n ∈ 4.13 •• Sei Q(i) := {a+bi | a, b ∈ Q}. Zeigen Sie, dass
Z \ {0} algebraisch ist.√ Q(i) bezüglich der in C gültigen Addition und Multiplikation
(b) Zeigen Sie, dass α = 2 algebraisch ist. ein Körper ist.
(c) Zeigen Sie, dass α = i algebraisch ist.
(d) Zeigen Sie, dass A = {α ∈ C | α ist algebraisch} ab- 4.14 •• Ein Seeräuber hinterließ bei seinem unerwar-
zählbar ist. teten Ableben im Alter von 107 Jahren unter anderem eine
(e) Zeigen Sie, dass T = {α ∈ C | α ist nicht algebraisch} Schatzkarte mit eingezeichneter Schatzinsel und folgender
überabzählbar ist. Ein α ∈ T heißt transzendent. Beschreibung:

4.8 • Zur Festigung der Begriffe „rational“ und „irra- Geh’ direkt vom Galgen zur Palme, dann gleich viele
tional“ beantworten Sie folgende Fragen: Schritte unter rechtem Winkel nach rechts – steck’ die erste
Fahne!
(a) Wenn a rational und b irrational sind, ist a + b dann
notwendig irrational? Geh’ vom Galgen zum Hinkelstein, genauso weit unter
(b) Wenn a und b irrational sind, ist a + b dann notwendig rechtem Winkel nach links – steck’ die zweite Fahne!
irrational? Der Schatz steckt in der Mitte zwischen den beiden Fahnen!
(c) Wenn a rational und b irrational sind, ist a · b dann not-
wendig irrational? Die Erben starteten sofort eine Expedition zu der kleinen
(d) Gibt es eine reelle Zahl a, sodass a 2 irrational und a 4 Schatzinsel.
rational sind?
Die Palme und der Hinkelstein waren sofort zu identifizieren.
(e) Gibt es zwei irrationale Zahlen a und b, deren Summe
Vom Galgen war keine Spur mehr zu finden. Dennoch stieß
und Produkt rational sind?
man beim ersten Spatenstich auf die Schatztruhe, obwohl
man die Schritte von einer (zufälligen und sehr wahrschein-
4.9 ••• Zeigen Sie, dass lich) falschen Stelle aus gezählt hatte.
σ : C → C : z → z Wie war das möglich? Wo lag der Schatz?
158 4 Zahlbereiche – Basis der gesamten Mathematik

4.15 ••• Hieronymus B. Einbahn, nach dem in Deutsch- Zeigen Sie ferner, dass d(a, b) ≥ 0 aus den anderen Eigen-
land viele Straßen benannt sind, entdeckte im Jahr 1789 die schaften gefolgert werden kann.
Einbahninsel Sun-Tse mit n Orten (n ∈ N) und genau einem
Weg zwischen zwei Orten. Er wollte eine Route finden, auf 4.20 •• Wie viele Paare (x, y) ∈ Z × Z gibt es, die
der jeder Ort genau einmal vorkommt. Die Wege waren je- x 2 + y 2 = 13 erfüllen? Warum gibt es kein Paar (x, y) ∈
doch so schmal, dass nur in einer Richtung gefahren werden Z × Z mit x 2 + y 2 = 3?
konnte. Daher hat Krao-Se, der Herrscher der Einbahninsel,
nur eine Fahrtrichtung für jede Strecke zwischen zwei Orten
zugelassen. Unter Beachtung dieser Regel gelang es Hierony- 4.21 •• Wir betrachten das auf D. Hilbert zurückge-
mus B. Einbahn jedoch, eine entsprechende Route zu finden. hende Beispiel der Teilmenge H = {3k + 1 | k ∈ N} der
Wie war das möglich? War dies ein Zufall? natürlichen Zahlen. Wir wollen eine Zahl n = 1 aus H H -
Primzahl nennen, wenn 1 und n die einzigen in H gelegenen
4.16 •• Sei 2 := {n ∈ N0 | es gibt x, y ∈ Z mit n = Teiler von n sind.
x 2 + y 2 }. Zeigen Sie, dass 0, 1 und 2 in 2 enthalten sind und (a) Weisen Sie nach, dass diese Menge bezüglich der Mul-
dass mit n, m ∈ 2 auch nm ∈ 2 folgt. Zeigen Sie ferner, tiplikation abgeschlossen ist.
dass 5, 401 und 2005 in 2 liegen. Finden Sie eine konkrete (b) Geben Sie die ersten 8 Folgeglieder der H -Primzahlen
Darstellung von 2005 als Summe von zwei Quadraten ganzer an und weisen Sie nach, dass 100 ∈ H gilt.
Zahlen. (c) Weisen Sie nach, dass sich jede H -Zahl n als ein Produkt
von H -Primzahlen darstellen lässt.
(d) Finden Sie alle in H liegenden Zerlegungen von 100
Rechenaufgaben (Tipp: Es gibt derer zwei) und zeigen Sie damit, dass die
4.17 • Seien a und b positive reelle Zahlen. Man be- Zerlegung nicht eindeutig ist.
zeichnet mit (e) Weisen Sie jetzt nach, dass die Zahl 10 das Produkt aus 4
und 25 teilt, ohne eine der beiden Faktoren zu teilen. Be-
a+b sitzen die H -Primzahlen die Primelementeigenschaft?
A(a, b) := das arithmetische, mit
2

G(a, b) := ab das geometrische, mit 4.22 • Seien c0 , c1 , ..., cn−1 reelle Zahlen (n ∈ N).
2 Zeigen Sie: Gilt für z ∈ C die Gleichung
H (a, b) := 1 1
das harmonische, mit
+
a b zn + cn−1 zn−1 + ... + c1 z + c0 = 0,
1
a 2 + b2
Q(a, b) := das quadratische Mittel. dann gilt sie auch für z. Dies kann man auch so ausdrücken:
2
Wenn z0 ∈ C Lösung einer Polynomgleichung mit reellen
Beweisen Sie die folgende Ungleichungskette für den Fall Koeffizienten ist, so ist auch z0 Lösung derselben Gleichung.
a ≤ b:

a ≤ H (a, b) ≤ G(a, b) ≤ A(a, b) ≤ Q(a, b) ≤ b 4.23 • Zeigen Sie, dass für beliebige reelle Zahlen a, b
gilt:
Wann gilt das Gleichheitszeichen? (a + b)3 = a 3 + 3a 2 b + 3ab2 + b3 ,
4.18 • Bestimmen Sie explizit die folgenden Mengen: dabei ist 3 := 2 + 1, x 3 := xxx für x ∈ R.
(a) L1 := {x ∈ R | |3 − 2x| < 5}
x+4
(b) L2 := {x ∈ R | x = 2 und x−2 < x} 4.24 • Zeigen Sie: Sind a1 , . . . , an reelle Zahlen, dann
(c) L3 := {x ∈ R | x(2 − x) ≥ 1 + |x|} gilt:
und stellen Sie (wenn möglich) L1 , L2 und L3 mithilfe von
Intervallen dar. a12 + a22 + a32 + . . . + an2 = 0 ⇔ aj = 0 für 1 ≤ j ≤ n.

4.19 •• Zeigen Sie, dass der durch d(a, b) = |a − b|


für a, b ∈ R definierte Abstand die folgenden Eigenschaften 4.25 •• Bestimmen Sie explizit – falls existent – Supre-
erfüllt: mum und Infimum der folgenden Mengen und untersuchen
(M1 ) d(a, b) ≥ 0 und d(a, b) = 0 ⇔ a = b (positiv defi- Sie, ob diese Mengen jeweils ein Maximum oder ein Mini-
nit), mum haben.
(M2 ) d(a, b) = d(b, a) (symmetrisch),
(a) M1 = { n1 + m
1
| n, m ∈ N}
(M3 ) d(a, c) ≤ d(a, b) + d(b, c) (Dreiecksungleichung).
(b) M2 = {x ∈ R | x 2 + x + 1 ≥ 0}
Dabei sind a, b, c beliebige reelle Zahlen. (c) M3 = {x ∈ Q | x 2 < 9}
Aufgaben 159

4.26 •• Zeigen Sie mit vollständiger Induktion: Sind p 4.33 • Zeigen Sie, dass für z, w ∈ C gilt:
Primzahl und a ∈ N0 , dann ist p ein Teiler von a p − a.
(a) |z − w|2 = |z|2 − 2Re (zw) + |w|2
Dieser Satz wird kleiner Fermat’scher Satz genannt. Seine
(b) |z + w|2 + |z − w|2 = 2(|z|2 + |w|2 )
klassische Formulierung ist a p−1 ≡ 1 mod p, die gültig ist,
wenn a kein Vielfaches von p ist. Warum nennt man die zweite Gleichung Parallelogramm-
identität?
4.27 •• Seien
4.34 • Zeigen Sie, dass das Assoziativgesetz der Mul-
f1 = 1, f2 = 1, fn+2 = fn+1 + fn für alle n ∈ N. tiplikation in C erfüllt ist. Vervollständigen Sie dazu die be-
reits geführte Rechnung, indem Sie (ac − bd, ad + bc)(e, f )
(a) Zeigen Sie, dass für alle n ∈ N gilt: mit (a, b)(ce − df, cf + de) vergleichen! Verwenden Sie
2 dazu nur die Definition der Multiplikation (a, b)(c, d) :=
√ n  √ n 3
1 1+ 5 1− 5 (ac − bd, ad + bc)!
fn = √ − .
5 2 2
4.35 • Schreiben Sie die folgenden komplexen Zahlen
(b) Die in dieser Aufgabe definierte Folge fn heißt in der Normalform a + bi, a, b ∈ R und berechnen Sie ihre
Fibonacci-Folge. Welchen Größenordnung haben f100 Beträge:
und ff100
101
(  √ 3 '
?
' (
1 1+i 2 1 3 1+i n
, , − + i , √ mit n ∈ N0 .
4.28 •• Versuchen Sie, für die folgenden Summen einen 3 + 7i 1−i 2 2 2
geschlossenen Ausdruck – also eine Summenformel – zu fin-
den und bestätigen Sie diese induktiv oder benutzen Sie ge-
eignete Umformungen bzw. schon bekannte Formeln: 4.36 •• Sei c eine komplexe Zahl ungleich null. Zeigen
1 1 1
Sie durch Zerlegung in Real- und Imaginärteil, dass für z ∈ C
(a) 1·2 + 2·3 + ... +
n·(n+1) die Gleichung
(b) 1 − 4 + 9 − ... + (−1)n+1 n2 z2 = c
(c) 1 · 2 + 2 · 3 + ... + n · (n + 1)
(d) 1 · 2 · 3 + 2 · 3 · 4 + ... + n · (n + 1) · (n + 2) genau zwei Lösungen hat. Für eine der Lösungen gilt:
. .
Für alle Formeln sei n ∈ N. |c| + Re (c) |c| − Re (c)
Re (z) = , Im (z) =  .
2 2
4.29 •• Z[i] = {a + bi | a, b ∈ Z} ist ein kommutativer
Ring (Ring der ganzen Gauß’schen Zahlen) bezüglich der in Dabei ist
C definierten Addition und Multiplikation. Welche Elemente

α ∈ Z[i] besitzen ein multiplikatives Inverses in Z[i]? +1, falls Im c ≥ 0,
 :=
−1, falls Im c < 0.
4.30 •• Zeigen Sie: Die in der vorherigen Aufgabe de-
finierte Menge Z[i] ist mit der durch N(α) = N(a + bi) = Die andere Lösung ist das Negative hiervon.
a 2 + b2 (α ∈ Z[i]) definierten Norm ein euklidischer Ring,
d. h., zu α, β ∈ Z[i], β  = 0, gibt es γ , δ ∈ Z[i] für die 4.37 • Bestimmen Sie alle Quadratwurzeln von
α = γβ + δ und N(δ) < N(β) sind.
i , 8 − 6i , 5 + 12i .
4.31 • Stellen Sie für z = 1 + 2i, w = 3 + 4i die
folgenden komplexen Zahlen in der Form a + bi, a, b ∈ R,
explizit dar: 4.38 • Bestimmen Sie beide Lösungen z1 = x1 +
y1 i, z2 = x2 + y2 i aus C mit x1 , y1 , x2 , y2 ∈ R für die
w + z 1 − iz Gleichung
3z + 4w, 2z2 − zw, , .
w − z 1 + iz z2 + (3 − i)z − 2 − 2i = 0.

4.32 •• Beschreiben Sie geometrisch die folgenden Beweisaufgaben


Teilmengen von C:
4.39 ••• Seien A und B nichtleere Teilmengen von R,
(a) M1 = {z ∈ C | 0 < Re (iz) < 1} und es gelte a ≤ b für alle a ∈ A und für alle b ∈ B.
(b) M2 = {z ∈ C | |z| = Re (z) + 1} Beweisen Sie das Riemann-Kriterium: Es gilt
(c) M3 = {z ∈ C | |z − i| = |z − 1|}
z
(d) M4 = {z ∈ C − {−1} | | z+1 | = 2} sup A = inf B
160 4 Zahlbereiche – Basis der gesamten Mathematik

genau dann, wenn die folgende Bedingung erfüllt ist: 4.47 •• Satz 20 in Buch IX von Euklids „Elementen“
lautet „Es gibt mehr Primzahlen als jede vorgelegte Anzahl
Zu jedem  > 0 gibt es ein a ∈ A und ein b ∈ B, von Primzahlen.“ Beweisen Sie diesen Satz und folgern Sie
daraus, dass es unendlich viele Primzahlen geben muss.

sodass b − a <  gilt. √ √


4.48 •• Zeigen Sie, dass die reelle Zahl x := 2 + 3
nicht rational ist. Geben Sie ein möglichst einfaches Polynom
4.40 • Bestimmen Sie alle n ∈ N, für welche die fol-
p (nicht das Nullpolynom!) mit ganzzahligen Koeffizienten
genden Ungleichungen gelten und beweisen Sie Ihre Behaup-
an, für das p(x) = 0 gilt.
tungen:

(a) 3n > n3
n n 4.49 •• Zeigen Sie, dass die Summe
(b) 32 < 23
(c) 1 · 2 · 33 · ... · nn < nn(n+1)/2
1 2 √ √
3
(d) 3( n3 )n ≤ n! ≤ 2( n2 )n 2+ 2

Für
 dienletzte Ungleichung dürfen Sie die Ungleichung irrational ist.
1 + n1 ≤ 3 ohne Beweis verwenden!

4.50 • Die goldene Zahl g = 1+2 5 ≈ 1.618 genügt
4.41 • Für n ∈ N sei An := {1, 2, 3, ..., n}. Zeigen der Gleichung g 2 − g − 1 = 0. Folgern Sie hieraus, dass g
Sie, dass es für alle n > m ∈ N und für jede Abbildung irrational ist.
 : An → Am zwei verschiedene Zahlen n1 , n2 ∈ An gibt,
für welche gilt:
4.51 ••• Wir betrachten den Körper R(x) der rationalen
(n1 ) = (n2 ). Funktionen in einer Variablen mit reellen Koeffizienten

Folgern Sie, dass es genau dann eine bijektive Abbildung


R(x) :=
gibt, wenn n = m ist.  
p(x)
| p, q reelle Polynome, q nicht Nullpolynom .
q(x)
4.42 • Zeigen Sie, dass das Produkt N × N abzählbar
ist.
Dass diese Menge ein Körper ist, setzen wir an dieser Stelle
voraus. Eine rationale Funktion hat damit die Gestalt
4.43 • Zeigen Sie: Das Produkt A × B zweier abzähl-
barer Mengen ist wieder abzählbar. an x n + an−1 x n−1 + . . . + a0
r(x) =
bm x m + bm−1 x m−1 + . . . + b0
4.44 •• Beweisen Sie folgende Aussage:
mit ai , bj ∈ R und an = 0 bzw. bm = 0. Diese Darstellung
Erfüllt eine rationale Zahl x eine Gleichung der Gestalt ist zwar nicht eindeutig (Erweitern und Kürzen!), aber das
Vorzeichen von am bm , also dem Produkt der beiden Füh-
x n + cn−1 x n−1 + . . . + c1 x + c0 = 0, rungskoeffizienten, hängt nicht von der Darstellung ab.

wobei die Koeffizienten cj (0 ≤ j < n) aus Z sind, dann gilt Man definiert nun:
sogar x ∈ Z.
P := {r(x) ∈ R(x) | an bm > 0}
4.45 •• Es gibt einen weit √ verbreiteten Widerspruchs-
beweis für die Aussage, dass 2 nicht rational ist. Kennen und vergewissert sich, dass entweder r ∈ P oder −r ∈ P gilt,
Sie diesen und können Sie ihn führen? wenn r nicht das Nullpolynom ist, was wir aber mit an = 0
ausgeschlossen haben.

4.46 •• Sei N ∈√N und N keine natürliche Zahl. Fol- Zeigen Sie, dass dieser angeordnete Körper nicht archime-
gern Sie, dass dann N irrational ist. disch angeordnet ist!
Antworten der Selbstfragen 161

Antworten der Selbstfragen

S. 105 S. 111
Ausgehend von 1 + (−1) = 0 folgt (−1) · (1 + (−1)) = Der Beweis ergibt sich, indem wir im vorangegangenen Be-
(−1) · 0 = 0. Durch Anwendung des Distributivgesetzes weis „<“ durch „≤“ bzw. „>“ durch „≥“ ersetzen und
erhält man (−1) · 1 + (−1)(−1) = 0. ε = |x| betrachten.
Da die Gleichung (−1) + x = 0 die eindeutig bestimmte S. 112
Lösung x = 1 besitzt, muss (−1)(−1) = 1 gelten. Gilt s < s  , so gilt auch die Ungleichung x < s < s  bzw.
Eine Verallgemeinerung ist möglich, indem man (−a) = verkürzt x < s  für alle x ∈ M und somit ist auch s  obere
(−1)·a und (−b) = (−1)·b benutzt und die neue Gleichung Schranke von M.
(−1)a · (−1)b = ab zu (−1)(−1) · ab = ab umsortiert und
dann die beiden Faktoren (−1) · (−1) zu 1 zusammenfasst. S. 114
Existieren min M bzw. inf M, und gilt inf M ∈ M, dann ist
min M = inf M. Den Beweis führt man analog zum eben
S. 105
gegebenen Beweis.
Setzt man c = ax und d = bx für x  = 0, so ist die zu be-
weisende Formel ein Spezialfall der Rückrichtung der ersten
S. 118
Formel.
R enthält die 1 und ist abgeschlossen gegenüber der Addi-
tion, insbesondere also auch gegenüber der Addition mit
S. 108
1.
Seien a > 0 und b > 0. Wir beginnen mit a < b und a 2 , für
Gleiches gilt für die nicht negativen reellen Zahlen. Auch
das mit der Transitivität die Ungleichung a 2 = aa < ab <
sie enthalten die 1 als Element, und auch sie sind gegen-
b2 gilt, womit die eine Richtung der Aussage gezeigt ist.
über der Addition abgeschlossen.
Umgekehrt sei a 2 < b2 . Man kann beide Seiten durch a 2 In dieser Menge ist wieder die Zahl 1 enthalten. Nach der
teilen, da a = 0 nach Voraussetzung gilt. Man erhält so zweiten Eigenschaft einer Zählmenge muss auch 1+1 = 2
2
1 < ab2 = ab · ab . Diese Gleichung wird duch b > a bzw. in R\{2} enthalten sein. Dies ist aber nicht so, und daher
stellt diese Menge keine Zählmenge dar.
a < b erfüllt, denn 1 < ab · ab ⇔ ab < ab . Der Bruch ab ist mit
b < a aber kleiner als aa , und man findet ab < aa < ab . 
S. 119
Die Menge M = {1} ∪ {x ∈ R | x ≥ 2} ist induktiv. Daher
S. 108 gilt N ⊆ M und damit ist n = 1 oder n ≥ 2.
Wir müssen zeigen, dass aus a ≤ b und b ≤ a die Gleichung
a = b folgt. a ≤ b bedeutet a = b oder a < b und b ≤ a S. 120
heißt b = a oder b < a. Wegen der Trichotomie können
Ohne (P1 ) gäbe es keinen Startpunkt.
a < b und b < a nicht gleichzeitig gelten, also muss a = b
„Weiterzählen“: Durch (P2 ) werden die Dominosteine in
sein.
einer Reihe aufgestellt. So ist sichergestellt, dass ein Do-
minostein nicht zwei Dominosteine gleichzeitig umstößt.
S. 110 Keine „Schleifen“: Durch (P3 ) wird sichergestellt, dass
Nehmen wir zum Beispiel [0, 1] und [2, 3]. Dann ist die Ver- man nicht zu einem bereits gefallenen Stein zurückkehrt.
einigung von keinem der obigen elf Typen und somit kein Kein „Ring“: Vor dem ersten Stein, 1, steht überhaupt kein
Intervall mehr. Stein.
„Umstoßen“: Die fünfte Eigenschaft bringt uns dazu, den
S. 111 ersten Stein, also die 1, umzustoßen. Fällt dieser erste Do-
Für | − a| gelten nach der Definition drei Fälle: minostein, so fallen auch alle weiteren um. Man erreicht
jede natürliche Zahl.
| − a| = −a für −a > 0,
| − a| = 0 für −a = 0 und S. 121
| − a| = −(−a) = a für −a < 0. Aus dem Wohlordnungssatz ergibt sich die folgende Variante
Vergleichen wir dies mit der Definition zu |a|, so folgt Gleich- des Induktionsprinzips: Ist M ⊆ N mit den zwei Eigenschaf-
heit in allen drei Fällen. ten 1 ∈ M und aus {1, 2, . . . , n} ⊆ M folgt n + 1 ∈ M, dann
ist M = N.
S. 111 Zum Beweis betrachtet man das Komplement A = N\M.
Es gilt der Zusammenhang |a| = a sign(a). Wäre A = ∅, dann hätte A ein kleinstes Element k = min A.
162 4 Zahlbereiche – Basis der gesamten Mathematik

Wegen 1 ∈ M wäre k > 1 und wegen {1, 2, . . . , k − 1} ⊆ S. 132


M ⇒ k ∈ M erhält man einen Widerspruch. n! ist das Produkt der ersten n natürlichen Zahlen, (n+1)! das
Produkt der ersten (n + 1) natürlichen Zahlen. Multipliziert
Aus dieser Variante des Induktionsprinzips folgt das gewöhn-
man an n! den fehlenden Faktor (n + 1), so erhält man eben
liche Induktionsprinzip, denn es ist n ∈ {1, 2, . . . , n} und da-
gerade (n + 1)! Auch ein Induktionsbeweis nach n wäre hier
mit gilt n ∈ M ⇒ n+1 ∈ M. Das Induktionsprinzip und das
erfolgreich.
Wohlordnungsprinzip sind also äquivalente Aussagen. 

S. 132
S. 121
Wenn man vom binomischen Lehrsatz (a + b)n ausgeht und
N ist eine Zählmenge. Nehmen wir an, dass N endlich ist, so
dort a = b = 1 setzt, ergeben sich beide Seiten der Gleichung
gibt es ein Element n, welches größtes Element ist. Dies wi-
direkt: Offensichtlich ist (1 + 1)n = 2n , und da alle Potenzen
derspricht jedoch der zweiten Eigenschaft einer Zählmenge,
von a bzw. b zu 1 werden, steht auch die linke Seite der
mit n auch n + 1 zu enthalten. Damit kann N nicht endlich
Gleichung da.
sein.
S. 133
S. 127
Das Gleichheitszeichen gilt genau in den beiden Fällen n = 1
Zu zeigen sind die Reflexivität:
und h beliebig bzw. n > 1 und h = 0.
(m, n) ∼ (m, n), Der Beweis sieht identisch aus, nur dass man nicht bei n = 1
verankert, sondern bei n = 2. Für n = 1 ist die Aussage ja
die Symmetrie:
falsch, sie gilt laut Satz erst ab n = 2. Für letzteren Fall muss
(m, n) ∼ (m , n ) ⇔ (m , n ) ∼ (m, n) also (1 + h)2 > 1 + 2h gelten. Auf der linken Seite steht
1 + 2h + h2 , was wegen dem zusätzlichen h2 wirklich größer
und die Transivität: als 1 + 2h ist. Hier muss allerdings h = 0 gelten, was aber
vorgegeben ist.
(m, n) ∼ (m , n ) und (m , n ) ∼ (m , n )
S. 134
⇒ (m, n) ∼ (m , n ). Wenn man diese beiden Graphen skizziert, so erkennt man,
dass sie beide oberhalb der x-Achse liegen. Insbesondere ha-
Die Reflexivität ist offensichtlich. Die Symmetrie folgt direkt ben sie beide keinen Schnittpunkt mit der x-Achse gemein,
aus der Vertauschbarkeit von Faktoren eines Produkts. Es gilt und so existieren auch keine Nullstellen für die Funktions-
zum einen mn = nm , zum anderen soll m n = n m gelten. terme.
Beide Gleichungen sind identisch.
Die Transitivität ist schwieriger zu zeigen. Wir benötigen S. 134
(m, n), (m , n ) und (m , n ). Die Relation (m, n) ∼ (m , n ) Wir addieren wieder null auf beiden Seiten:
ist äquivalent zu mn = nm , und (m , n ) ∼ (m , n ) ist
äquivalent zu m n = n m . Zu zeigen ist (m, n) ∼ (m , n ) x 2 + px + q + 0 = 0 + 0
'  (
bzw. die Gleichung mn = nm . p 2  p 2
⇐⇒ x 2 + px + q + − = 0.
Wir multiplizieren die beiden Ausgangsgleichungen mitein- 2 2
ander und erhalten: Nun sortieren wir wieder die Summanden um und erhalten:
   
(mn )(m n ) = (nm )(n m ),    p 2 '  p 2 (
x 2 + px + + q− = 0.
2 2
was wegen der Kommutativität der Faktoren äquivalent ist
zu: Diese Gleichung ist aber äquivalent zu:
(mn )(m n ) = (m n)(m n ). '
 p 2  p 2 (  p 2
Da n, n und n alle ungleich null sind, muss man nur m  = 0 x+ =− q− = − q,
2 2 2
voraussetzen und erhält die Behauptung. Mit m = 0 wären
wegen der Ausgangsgleichungen auch m = 0 bzw. m = 0, und man kann direkt die beiden Lösungen angeben:
was (m, n) = (0, n) bzw. (m , n ) = (0, n ) impliziert und .  . 
direkt auf (m, n) ∼ (m , n ) führt. 
x1 = − +
p p 2
− q bzw. − −
p p 2
− q.
2 2 2 2
S. 128 Dabei geht man genauso vor wie im Beispiel mit den kon-
Man definiere q = min{k ∈ Z | k ≥ x}. kreten Zahlen.

S. 128 S. 135
Für x ∈ Z ist max{k ∈ Z | k ≤ x} = min{k ∈ Z | k ≥ x}. Zum Beweis der zweiten Aussage nehmen wir an, dass es
Antworten der Selbstfragen 163

eine zweite Lösung z = c + di mit c, d ∈ R gibt, was aber S. 141


a +bi = c +di bedeutet. Es muss gelten a −c = (d −b)i. Im Setzt man w = dz, lässt sich die Gleichung wie folgt aus-
Fall d = b können wir teilen und erhalten auf der linken Seite drücken: z = d1 w. Verkettet man beide Abbildungen, so wird
der Gleichung eine reelle Zahl, rechts jedoch i. Deswegen z über w wieder auf z abgebildet: z → dz =: w → d1 w = z.
muss d = b gelten und daher auch a = c.
S. 145
S. 137 Nach der Formel von Euler-de-Moivre ist cos(4ϕ) =
Aus z2 + 1 = (z + i)(z − i) = 0 folgt z = i oder z = −i. Re (E(4ϕ)) = Re (E(ϕ)4 ) = cos4 (ϕ) − 6 cos2 (ϕ) sin2 (ϕ) +
Für andere komplexe Zahlen wird keiner der beiden Faktoren sin4 (ϕ). Ersetzt man mittels sin2 + cos2 = 1 den Aus-
null. druck sin2 (ϕ) durch (1 − cos2 (ϕ)), so erhält man cos4 (ϕ) −
6 cos2 (ϕ)(1 − cos2 (ϕ)) + (1 − cos2 (ϕ))2 , was sich zu
8 cos4 (ϕ) − 8 cos2 (ϕ) + 1 zusammenfassen lässt.
S. 138
Mit z = x + yi folgt z = x − yi. Wir multiplizieren beide S. 146
und erhalten (x + yi)(x − yi) = x 2 − (yi)2 = x 2 + y 2 . Da Betrachten wir die Ausgangsgleichung z5 = 1. z0 = 1 ist
x, y ∈ R gilt, folgt die Behauptung. wegen 15 = 1 eine Lösung dieser Gleichung und damit ergibt
sich die Faktorisierung z5 −1 = (z−1)(z4 +z3 +z2 +z+1).
S. 139 Wir multiplizieren den Ausdruck (z2 + gz + 1)(z2 − hz + 1)
Die erste Eigenschaft, |z| ≥ 0; |z| = 0 ⇔ z = 0, zeigt man aus und erhalten:
durch Nachprüfen der beiden Richtungen:
(z2 + gz + 1)(z2 − hz + 1)
Sei z = 0, dann ist |z| = Re (z)2 + Im (z)2 = 02 + 02 = 0.
= z4 + (g − h)z3 + (2 − gh)z2 + (g − h)z + 1.
Sei |z| = 0, dann ist |z| = 0 = 02 + 02 = Re (z)2 + Im (z)2
√ √
und da Re (z) = Im (z) = 0 gilt, ist z = 0.
Wegen h = 1/g ist h = 2√ = 2−2 −4
5
= 5−1 2 . Damit
1+ 5
Dass für z = 0, d. h. Re  = 0 oder Im  = 0, immer |z| ≥ 0 gilt (g − h) = 1, und die Hilfsgleichung ist korrekt.
gilt, sieht man daran, dass Re (z)2 + Im (z)2  = 0 ist, wenn
Die weiteren Lösungen von z5 = 1 sind die Lösungen der
einer der beiden Summanden ungleich null ist.
beiden Gleichungen z2 + gz + 1 =
%0 und z − hz + 1 = 0.
2
Die dritte Eigenschaft gilt, da wegen Re (z), Im (z) ∈ R stets 1
Diese sind z2,3 = 2 (−g ± g − 4 ) und z1,4 =
2
%
Re (z)2 , Im (z)2 ≥ 0 gilt und damit |z| = Re (z)2 +Im (z)2 ≥ 1
2 (h ± i 4 − h ).
2
Re (z)2 bzw. |z| = Re (z)2 + Im (z)2 ≥ Im (z)2 erfüllt sind.
Damit die Lösungen 1 = z0 , . . . , z4 ein regelmäßiges Fünf-
eck bilden, muss |z4 − z3 | = |z3 − z2 | = . . . = |z1 − 1| =
S. 140 |1 − z4 | gelten. Dies zeigt man durch Nachrechnen.
1+i

Die gegebene Zahl hat den Betrag 1. Damit ist nach der
2
letzten Eigenschaft aus der Übersichtsbox auf Seite 139 das S. 148
Inverse gerade das Komplex-Konjugierte, also 1−i
√ . Der Kreislinie mit Mittelpunkt z = 21 und Radius 21 : Mit
2
z = x + iy und z = x − iy ist z + z = 2x, bzw. es ist

S. 140 z+z 1
x= = Re (z) = n.V.
Die erste sowie die zweite Aussage überprüft man, indem 2 2
man zuerst die linke Seite voraussetzt und die rechte Seite
Damit muss z + z = 1 sein, und es folgt z = 21 .
folgert. Danach setzt man die rechte Seite voraus und wendet
die Definition des Betrags auf die linke Seite der Gleichung Für die Kreislinie fehlt streng genommen die Zahl z = 0.
an. Die Symmetrie zeigt man durch simples Nachrechnen. Dies sieht man ein, wenn man z = 1 in sich selbst und das
Auch die Dreiecksungleichung wird nachgerechnet. Dabei „Unendliche“ in z = 0 überführt, und dies dann doch nicht
findet man die Gleichheit für z2 = z1 oder für z2 = z3 . tut.
Lineare Gleichungs-
systeme – ein Tor zur 5
linearen Algebra
Worin unterscheiden sich
homogene und inhomogene
Gleichungssysteme?
Was versteht man unter einer
algorithmischen Bestimmung
der Lösung?
Warum kann unmittelbar nach
einer Wahl angegeben werden,
welche Wählerwanderung
stattgefunden hat?

5.1 Erste Lösungsversuche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166


5.2 Das Lösungsverfahren von Gauß und Jordan . . . . . . . . . . . . . . . 172
5.3 Das Lösungskriterium und die Struktur der Lösung . . . . . . . . . . 180
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
166 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

In fast allen Bereichen der linearen Algebra stößt man auf Die unbekannten Größen werden mit x1 , x2 , . . . , xn bezeich-
Aufgaben, die auf lineare Gleichungssysteme zurückführbar net, und ihre Koeffizienten werden immer links davor gesetzt.
sind. Bereits einfache Fragestellungen nach Schnittpunkten von Da nützen wir die Kommutativität aus. Auch schreiben wir
Geraden in der Ebene liefern solche Systeme. Kompliziertere die linearen Gleichungen immer so auf, dass auf der linken
Aufgabenstellungen, wie etwa Eigenwertprobleme oder Fragen Seite der Gleichung genau diejenigen Summanden stehen,
aus der linearen Optimierung, können in riesige Gleichungs- welche Unbekannte enthalten. Damit bleibt rechts jeweils
systeme ausufern. Derartige Systeme spielen auch in vielen nur eine Zahl, das Absolutglied der linearen Gleichung.
anderen Teilgebieten der Mathematik sowie in anderen Wis-
Das System
senschaften eine Rolle, etwa in der numerischen Mathematik,
Statistik, Physik, Statik oder Elektrotechnik. x1 + x 2 = 2
Weil es für die meisten Themenkreise der linearen Algebra un- x1 − x 2 = 0
umgänglich ist, das Lösen von linearen Gleichungssystemen zu ist ein reelles lineares Gleichungssystem. Die beiden folgen-
beherrschen und über die Struktur von Lösungsmengen Bescheid den Gleichungen
zu wissen, behandeln wir diese Systeme gleich hier in dem ersten
derjenigen Buchkapitel, welche vorwiegend der linearen Alge- sin(x1 ) + x2 = 2
bra gewidmet sind. Zur Bestimmung der Lösungsmenge ent- x1 − x22 = 0
wickeln wir ein systematisches Verfahren, welches auch den
meisten Computeralgebrasystemen zugrunde liegt. In diesem beschreiben hingegen kein lineares Gleichungssystem mehr;
nach Gauß und Jordan benannten Verfahren wird in einer ers- man spricht von einem nichtlinearen Gleichungssystem.
ten Phase geklärt, ob ein gegebenes lineares Gleichungssystem Unter einer Lösung eines reellen Gleichungssystems mit n
überhaupt lösbar ist. Im Fall der Lösbarkeit wird dann in einer Unbekannten verstehen wir n reelle Zahlen l1 , l2 , . . . , ln , die,
weiteren Phase die Lösungsmenge auf eine effiziente Art und anstelle der Unbekannten x1 , x2 , . . . , xn eingesetzt, alle Glei-
Weise bestimmt. chungen des Systems erfüllen. Das Gleichungssystem zu lö-
sen heißt, sämtliche Lösungen, also die Lösungsmenge L des
Dabei bieten sich in natürlicher Weise gewisse Schreib- und Be-
Systems zu bestimmen.
zeichnungsweisen an, die uns mit Matrizen und Vektoren, also
mit Grundbegriffe der linearen Algebra vertraut machen. Die
linearen Gleichungssysteme sind andererseits ein erstes Beispiel Achtung: Die reellen Zahlen l1 , l2 , . . . , ln bilden nicht n
dafür, dass die Lösung eines mathematischen Problems nicht Lösungen, sie bilden eine Lösung des Gleichungssystems.
unbedingt aus einzelnen Formeln bestehen muss. Hier betrach- Daher ist die Schreibweise (l1 , l2 , . . . , ln ) für diese eine Lö-
ten wir das Problem als gelöst, wenn es ein exakt beschriebenes sung besser, und wir werden von nun an Lösungen linearer
Verfahren, einen Algorithmus, gibt, der ausnahmslos funktio- Gleichungssysteme stets in dieser Art angeben.
niert – und mag die Anzahl der gegebenen Gleichungen und
Unbekannten auch noch so groß sein.
Im Übrigen ist es durchaus interessant, lineare Gleichungs-
systeme allgemeiner über Integritätsbereiche oder Ringe
(Kapitel 3, Seite 85) zu betrachten. So kann man z. B. nur die
ganzzahligen Lösungen eines linearen Gleichungssystems
5.1 Erste Lösungsversuche mit lauter ganzzahligen Koeffizienten suchen. Derartige
Gleichungen oder Gleichungssysteme heißen diophantisch.
Wir beginnen dieses Kapitel mit der Behandlung reeller li- Dies erfordert allerdings ganz andere Lösungsmethoden, und
nearer Gleichungssysteme und begnügen uns vorerst mit deshalb beschränken wir uns doch auf den Fall, in dem die
einer etwas lockeren Beschreibung dessen, was man darunter Koeffizienten der linearen Gleichungen und die l1 , . . . , ln
versteht. Die exakte Definition derartiger Systeme folgt im einem kommutativen Körper angehören.
Abschnitt 5.2.
Es ist nicht Aufgabe dieses Kapitels zu erklären, wie man
Der Begriff Gleichungssystem besagt, dass es sich um meh- auf ein lineares Gleichungssystem kommt, sondern wie man
rere Gleichungen in mehreren Unbekannten handelt. Die dessen Lösungsmenge bestimmt. Zwischendurch wollen wir
Linearität eines solchen Systems bedeutet, dass die Unbe- aber doch demonstrieren, welche Probleme auf ein lineares
kannten in den Gleichungen des Systems nur in erster Potenz Gleichungssystem führen und auf diese Weise gelöst wer-
auftreten und nicht etwa in trigonometrischen Funktionen den können. So folgt anschließend eine einfache geometri-
eingebunden sind. Reell weist darauf hin, dass die Koeffi- sche Frage, die man vielleicht sogar im Kopf lösen könnte.
zienten der Unbekannten in den Gleichungen reelle Zahlen Eine umfangreichere Anwendungsaufgabe zu linearen Glei-
sind, und wir auch die Lösungen unter den reellen Zahlen chungssystemen ist auf Seite 183 zu finden.
suchen. Es wird aber bald klar werden, dass all die Manipu-
lationen, die wir an den reellen linearen Gleichungssystemen Beispiel Hier geht es um ein geometrisches Problem: Ab-
vornehmen, um die Lösung zu finden, auch bei beliebigen bildung 5.1 zeigt, wie sich die Ebene mit kongruenten fünf-
kommutativen Körpern funktionieren. eckigen Bausteinen, welche die Form einer stilisierten Krone
5.1 Erste Lösungsversuche 167

haben, lückenlos ausfüllen lässt. Man kann nämlich mit die- Ein reelles lineares Gleichungssystem hat
sen Fünfecken zunächst ein einzelnes Sechseck füllen und entweder keine, genau eine oder unendlich
dann mit Kopien dieses gefüllten Sechsecks die ganze Ebene viele Lösungen
pflastern.
Lineare Gleichungssysteme müssen nicht immer eine Lösung
besitzen. Betrachten wir etwa das System der zwei Gleichun-
x2 gen

x1 − x2 = 1
x1 x1 − x 2 = 0

in den zwei Unbekannten x1 und x2 . Es gibt keine reellen


Abbildung 5.1 Ein fünfeckiger Baustein in Form einer stilisierten Krone zum Zahlen l1 , l2 mit l1 = l2 und gleichzeitig l1 = l2 . Dieses
lückenlosen Ausfüllen der Ebene. Gleichungssystem ist unlösbar, oder anders ausgedrückt, die
Lösungsmenge L ist die leere Menge.
Kommentar: Eine Pflasterung mittels kongruenter Sechs- Die einfachste Gleichung, die in keinem Körper eine Lösung
ecke ist nicht nur so wie bei Bienenwaben mit regulären besitzen kann, ist ja 0 x1 = 1 , denn das Nullelement und
Sechsecken möglich, sondern z. B. auch mit solchen, bei das Einselement eines Körpers sind stets verschieden.
welchen Gegenseiten jeweils parallel und gleich lang sind.
Die einzelnen Sechsecke in der Pflasterung gehen dann näm- Als Nächstes betrachten wir das lineare Gleichungssystem
lich durch Parallelverschiebung auseinander hervor. Hat das
Sechseck (ohne ausfüllende Fünfecke) dann so wie in unse- x 1 + x2 = 2
rem Fall eine Symmetrieachse, so kann man in der Sechseck- x1 − x 2 = 0
pflasterung einzelne Sechsecke auch spiegelbildlich darstel-
len, was schließlich nach Füllung durch die kleinen Fünfecke Die zweite Gleichung besagt x1 = x2 . Setzen wir dies in
das Ganze noch verwirrender und unregelmäßiger macht. die erste Gleichung ein, so erhalten wir 2 x1 = 2. Es ist also
l1 = 1, l2 = 1 die einzig mögliche Lösung des Systems,
wofür wir wie vereinbart (l1 , l2 ) = (1, 1) schreiben.
Die Seiten des kleinen fünfeckigen Bausteins sind alle gleich
lang. Außerdem hat dieser eine Symmetrieachse. Unsere Gleich noch ein weiteres lineares Gleichungssystem:
Aufgabe ist es, die genaue Form herauszufinden.
3 x1 − 6 x2 = 0
Zur eindeutigen Festlegung der Gestalt dieses Fünfecks ge-
nügen neben der Seitenlänge die Größen x1 und x2 zweier −x1 + 2 x2 = 0
Winkel. Der spitze Winkel x1 tritt an den Spitzen der „Krone“
auf, der stumpfe Winkel x2 an der Basis. Die zweite Gleichung besagt x1 = 2 x2 . Setzt man dies in
die erste Gleichung ein, so erhält man 6 x2 − 6 x2 = 0. Die
Nachdem an den Treffpunkten verschiedener Fünfecke im zweite Gleichung enthält damit keine Information, die nicht
Inneren des Sechsecks als Winkelsumme stets 360◦ auftreten auch schon aus der ersten Gleichung folgt. Beim genaue-
muss und in den Seitenmitten des berandenden Sechseckes ren Hinsehen erkennt man, dass die zweite Gleichung das
stets 180◦ , folgen zwei Gleichungen: (−1/3)-Fache der ersten Gleichung ist. Man kann daher die
zweite Gleichung einfach weglassen; es bleibt das nur eine
−x1 + 2 x2 = 180◦ Gleichung umfassende System
2 x1 + x2 = 180◦
3 x1 − 6 x2 = 0 ,
Subtraktion der ersten Gleichung von der verdoppelten zwei-
ten ergibt: dessen Lösungsmenge wir nun bestimmen. Durch Probieren
5 x1 = 180◦ erkennt man, dass etwa (2, 1) und (4, 2) Lösungen des Sys-
tems sind. Setzt man für x2 eine beliebige reelle Zahl t ein,
und damit x1 = 36◦ . Nach Einsetzung dieses Werts in die so muss x1 wegen 3 x1 = 6 t den Wert 2 t haben.
zweite Gleichung erhalten wir x2 = 108◦ . Dies zeigt, dass
der in Abbildung 5.1 blau schattierte Baustein entsteht, wenn Damit haben wir alle Lösungen bestimmt: Für jedes t ∈ R
man bei einem regelmäßigen Fünfeck eine Ecke statt nach ist (2 t, t) eine Lösung, und weitere Lösungen gibt es nicht.
außen nach innen stülpt, ohne die Seitenlängen zu ändern. Die Lösungsmenge des Systems lautet also
Natürlich könnte man noch andere lineare Gleichungen aus L = {(2 t, t) | t ∈ R}.
dem Bild herauslesen, aber diese bringen keine neuen Infor-
mationen mehr. Der noch verbleibende erhabene Innenwin- Diese umfasst unendlich viele Lösungen, weil R unendlich
kel in dem fünfeckigen Baustein ist übrigens 252◦ .  viele Elemente besitzt.
168 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

? Ein Blick auf das System zeigt: Jedes Zahlenpaar (l1 , l2 ),


Welche Lösungsmenge erhält man, wenn man für x1 eine das die erste Gleichung erfüllt, erfüllt auch die zweite.
beliebige reelle Zahl t einsetzt und dann x2 bestimmt? Die zweite Gleichung ist also eine Folge der ersten. Wir
sprechen kurz von einer Folgegleichung.
In R gibt es unendlich viele Lösungen, denn jedes l1 ∈ R
Will man dasselbe lineare Gleichungssystem im Körper Z7
löst zusammen mit l2 = 1 − l1 das obige System. Wir füh-
der Restklassen modulo 7 lösen, so umfasst die Lösungs-
ren statt l1 den Parameter t ein und erhalten die folgende
menge L = {(2 t, t) | t ∈ Z7 } nur die sieben Paare (0, 0),
Parameterdarstellung von L :
(1, 4), (2, 1), (3, 5), (4, 2), (5, 6) und (6, 3).
L = {(t, 1 − t) | t ∈ R}.
Die bisher gezeigten Beispiele von reellen linearen Glei-
chungssystemen beweisen bereits: Nun zu einer Erweiterung des Gleichungssystems aus dem
ersten Beispiel:
Folgerung
Bei einem reellen linearen Gleichungssystem kann es x1 + x2 = 1
keine oder genau eine oder unendlich viele Lösungen geben.
2 x1 − x2 = 5
−x1 − 4 x2 = 2
In einer Serie weiterer Beispiele gehen wir etwas genauer auf
die Ursachen für diese verschiedenartigen Lösungsmengen
Die aus den ersten beiden Gleichungen zu ermittelnde Lö-
ein:
sung erfüllt auch die dritte Gleichung. Die dritte ist näm-
Beispiel lich eine Folgegleichung der ersten beiden; sie entsteht,
Wie lautet die Lösungsmenge des folgenden Gleichungs- indem von der zweiten das Dreifache der ersten subtra-
systems? hiert wird. Wie im ersten Beispiel folgt L = {(2, −1)}.
Obwohl hier mehr Gleichungen als Unbestimmte vorlie-
x 1 + x2 = 1
gen, gibt es eine eindeutige Lösung.
2 x1 − x2 = 5
Wegen der ganzzahligen Koeffizienten hätten wir dasselbe
Die erste Gleichung besagt x1 = 1 − x2 . Dieser Wert wird Gleichungssystem auch als eines über dem Körper Q der
in die zweite Gleichung eingesetzt, was auf die lineare rationalen Zahlen betrachten können. Die Lösung wäre
Gleichung 2−3 x2 = 5 für x2 führt. Die erhaltene Lösung dieselbe. Die Lösungsmenge wird auch nicht größer, wenn
für x2 wird dann im Ausdruck für x1 eingesetzt und liefert wir anstelle von R den Körper C der komplexen Zahlen
die in diesem Fall einzige Lösung zugrunde legen.
(l1 , l2 ) = (2, −1). Bei der folgenden Erweiterung des Systems aus dem ers-
ten Beispiel
Also ist L = {(2, −1)} die Lösungsmenge des betrachte-
ten Systems. x 1 + x2 = 1
Nun wenden wir dasselbe Substitutionsverfahren auf das 2 x1 − x2 = 5
folgende System an:
3 x1 + x2 = 4
x1 + x2 = 1
2 x1 + 2 x2 = 5 erfüllt die eindeutige Lösung der ersten beiden Gleichun-
gen die dritte Gleichung nicht mehr, denn
Die erste Gleichung besagt x1 = 1 − x2 . Wir setzen dies
in die zweite Gleichung für x1 ein und erhalten (l1 , l2 ) = (2, −1) ⇒ 3 l1 + l2 = 5 = 4 .
2 − 2 x2 + 2 x2 = 5 , also 2 = 5 ,
Dieses Gleichungssystem ist unlösbar, die Lösungsmenge
eine offensichtlich falsche Aussage. Anders ausgedrückt: ist L = ∅ .
Keines der Paare (x1 , x2 ), welches die erste Gleichung Abschließend ein System mit drei Unbekannten:
löst, kann auch die zweite Gleichung erfüllen. Dies heißt
L = ∅, x1 + 2 x2 − 2 x3 = 0

das Gleichungssystem ist unlösbar. 6 x1 − 3 x2 − 2 x3 = 0


Der obige Widerspruch ist beseitigt in dem folgenden Sys- 2 x1 + x2 − 2 x3 = 6
tem:
Dieses System stellt sich ebenfalls als unlösbar heraus.
x1 + x2 = 1
Wenn wir nämlich zu dem Vierfachen der ersten Glei-
4 x1 + 4 x2 = 4 chung die zweite addieren, erhalten wir die Folgeglei-
Dieselbe Substitution wie vorhin führt diesmal auf eine chung
tatsächliche Zahlengleichheit 4 = 4. 10 x1 + 5 x2 − 10 x3 = 0 ,
5.1 Erste Lösungsversuche 169

die zum 5-Fachen der dritten Gleichung des Systems im Reelle Gleichungssysteme mit zwei oder drei
Widerspruch steht, denn Unbekannten lassen sich geometrisch
interpretieren
10 x1 + 5 x2 − 10 x3 = 30  = 0 .
Eine geometrische Veranschaulichung der Gleichungssys-
Also gilt auch in diesem Fall L = ∅ .
teme wird die Ursache der in den bisherigen Beispielen auf-
Wenn wir diesem Gleichungssystem mit lauter ganzzah- getretenen Phänomene verdeutlichen.
ligen Koeffizienten anstelle des Körpers R den Körper
Z5 der Restklassen modulo 5 zugrunde legen, dann ist es Wir interpretieren die Zahlenpaare (l1 , l2 ) bzw. Zahlentripel
überraschenderweise doch lösbar. (l1 , l2 , l3 ) als Koordinaten von Punkten in der Ebene bzw.
im Raum. Dann stellen die Lösungen einer einzelnen linearen
Um den Wechsel zu Z5 zu verdeutlichen, verwenden wir Gleichung
nicht die Bezeichnungen 0, . . . , 4 der Elemente von Z5 , a1 x1 + a2 x2 = b
sondern wir schreiben jede Gleichung als Kongruenzglei-
chung modulo 5 : mit reellen a1 , a2 , b die Punkte einer Geraden in der Ebene
dar, sofern nicht beide Koeffizienten a1 und a2 null sind. Ana-
x1 + 2 x2 − 2 x3 ≡ 0 (mod 5) log bilden die Lösungen (l1 , l2 , l3 ) einer linearen Gleichung
6 x1 − 3 x2 − 2 x3 ≡ 0 (mod 5) der Form
a1 x1 + a2 x2 + a3 x = b
2 x1 + x2 − 2 x3 ≡ 6 (mod 5)
mit reellen a1 , a2 , a3 , b die Punkte einer Ebene im Raum.
Offensichtlich ist in Z5 die zweite Gleichung identisch mit Auch hier dürfen nicht alle Koeffizienten a1 , a2 , a3 gleich-
der ersten, denn 6 ≡ 1 (mod 5) und 2 ≡ −3 (mod 5) . zeitig null sein.
Damit bleiben nur zwei Kongruenzgleichungen übrig,
nämlich ?
Was sind die Lösungsmengen, wenn die Koeffizienten a1 , a2
x1 + 2 x2 − 2 x3 ≡ 0 (mod 5) bzw. a1 , a2 , a3 alle zugleich null sind?
2 x1 + x2 − 2 x3 ≡ 6 (mod 5)

Die Differenz der beiden ergibt Ein System von reellen linearen Gleichungen in zwei bzw.
drei Unbekannten zu lösen bedeutet demnach bei dieser geo-
x1 − x2 ≡ 1 (mod 5) . metrischen Interpretation, den mengenmäßigen Durchschnitt
der zugehörigen Geraden bzw. Ebenen zu bestimmen.
Wir können deshalb x1 ≡ x2 + 1 (mod 5) setzen und Die zwei Gleichungen des Systems
damit aus einer der Gleichungen das x3 ermitteln:
x1 + x2 = 1 (⇔ x2 = −x1 + 1)
2 x3 ≡ x1 + 2 x2 ≡ 3 x2 + 1 (mod 5) . 2 x1 − x2 = 5 (⇔ x2 = 2 x1 − 5)

Wegen 2−1 ≡ 3 (mod 5) (siehe Kapitel 3, Seite 81) folgt ergeben zwei einander schneidende Geraden (Abb. 5.2). Die
x3 ≡ 3+4 x2 (mod 5), wobei x2 beliebig aus Z5 wählbar Lösung entspricht dem Schnittpunkt.
ist. Wir können somit die Lösungsmenge darstellen als
x2
L = {(1 + t, t, 3 − t) | t ∈ Z5 }.
g1
Dieses Beispiel zeigt, wie wichtig es ist, bei der Frage g2
nach der Lösungsmenge immer auch anzugeben, welcher
Körper zugrunde gelegt wird.
Systeme von Kongruenzgleichungen, in denen der Rest- x1
klassenkörper von Gleichung zu Gleichung variiert, gelten L
nicht als lineare Gleichungssysteme, denn sie erfordern
ganz andere Lösungsmethoden. 

Abbildung 5.2 Die einzige Lösung entspricht dem Schnittpunkt der beiden
? Geraden.
1) Hat ein reelles System mit mehr Unbekannten als Glei-
chungen stets unendlich viele Lösungen in R ? Im Beispiel
2) Ist ein System mit mehr Gleichungen als Unbekannten
x1 + x2 = 1 (⇔ x2 = −x1 + 1)
immer unlösbar?
2 x1 + 2 x2 = 5 (⇔ x2 = −x1 + 5/2)
170 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

liegen zwei parallele Geraden vor (Abb. 5.3). Daher ist die x3
Lösungsmenge leer.

x2

g2

3
1
x1 2
g1

x2
Abbildung 5.3 Sind die beiden Geraden parallel und verschieden, so ist die x1
Lösungsmenge leer.

Die dritte Gleichung des Systems Abbildung 5.5 Die Lösungsmenge ist leer; die Schnittgeraden zwischen je zwei
der drei Ebenen 1 , 2 , 3 sind parallel.

x1 + x2 = 1 (⇔ x2 = −x1 + 1)
2 x1 − x2 = 5 (⇔ x2 = 2 x1 − 5) oder überhaupt die Lösbarkeit festzustellen. Und dann ist
vielleicht nicht immer klar, welche Gleichung heranzuzie-
−x1 − 4 x2 = 2 (⇔ x2 = − 41 x1 − 1
2) hen ist.
ist eine Folgegleichung der ersten beiden Gleichungen und Ähnlich ist es beim Verfahren des Gleichsetzens, wenn man
stellt daher eine weitere Gerade durch den Schnittpunkt der aus zwei Gleichungen dieselbe Unbekannte ausrechnet und
ersten beiden Geraden dar (Abb. 5.4). diese Ausdrücke gleichsetzt. Letztlich bedeuten Substituie-
rung und Gleichsetzen die Elimination einer Unbekannten,
x2 zunächst einmal aus zwei Gleichungen. Wie geht man vor,
g2 wenn noch weitere Gleichungen vorliegen?
g1
Wir wollen nun ein systematisches Vorgehen beschreiben, ein
Verfahren, das uns auf sicherem Wege zeigt, ob ein gegebenes
lineares Gleichungssystem lösbar ist, und uns im Fall der
Lösbarkeit dann auch gleich die Lösungsmenge liefert. Um
g3 x1 unser Vorgehen zu motivieren, betrachten wir die folgenden
L speziellen linearen Gleichungssysteme.

Gleichungssysteme in Stufenform lassen sich


Abbildung 5.4 Die Lösungsmenge als Schnittpunkt dreier Geraden. unmittelbar lösen

Die gegebenen Gleichungen des Systems Gewisse Bauformen linearer Gleichungssysteme machen das
Auffinden der Lösungen besonders einfach, wie die beiden
x1 + 2 x2 − x3 = 0 folgenden Beispiele beweisen. Dabei spielt keine Rolle, ob
6 x1 − 3 x2 − x3 = 0 wir in R oder in einem anderen Körper K rechnen.
2 x1 + x2 − x3 = 6
Beispiel
Das Gleichungssystem
bestimmen drei Ebenen ohne gemeinsamen Punkt, denn die
Schnittgerade der ersten beiden Ebenen verläuft parallel zur x1 + x2 − x3 = 0
dritten Ebene. Die Abbildung 5.5 illustriert dies.
2 x2 − x3 = 1
Das bisher benutzte Substitutionsverfahren, das natürlich x3 = 3
auch bei mehr als zwei Unbekannten schrittweise einge-
setzt werden kann, erweist sich nicht immer als sinnvoll: hat Stufenform . Die Anzahl der auftretenden Unbekann-
Der Ablauf des Rechenverfahrens ist nicht klar genug ge- ten wird von Gleichung zu Gleichung kleiner.
regelt; manchmal muss man am Ende wieder zu früheren Wir lösen dieses System durch Rückwärtseinsetzen, d. h.,
Gleichungen zurückkehren, um zu einer Lösung zu kommen wir setzen den durch die letzte Gleichung bestimmten
5.1 Erste Lösungsversuche 171

Hintergrund und Ausblick: Näherungslösung für ein nicht lösbares lineares Gleichungssystem
Die Lösungsmenge des linearen Gleichungssystems
x1 + x2 = 1
2 x1 − x2 = 5
3 x1 + x2 = 4

ist leer (siehe Beispiele auf Seite 168). Angenommen, die Absolutwerte auf der rechten Seite sind die Ergebnisse von
Messungen und daher fehlerbehaftet. Dann könnte man aus dem Blickpunkt eines Anwenders fragen: Wenn es keine exakte
Lösung gibt, gibt es dann vielleicht doch eine, welche alle Gleichungen wenigstens annähernd erfüllt? Gibt es eine, bei
welcher die Abweichungen von den auf den rechten Seiten vorgegebenen Werten insgesamt minimal sind? Dass sich diese
Minimalitätsforderung mathematisch klar formulieren lässt, wird später in den Kapiteln 17 und 18 gezeigt.

Um zur Näherungslösung zu gelangen, wählen wir für das x3


Lösen von Gleichungssystemen eine andere geometrische
Interpretation als bisher. Dabei spielt eine Abbildung f
eine Rolle, die durch die linken Seiten der Gleichungen
festgelegt ist und zur Klasse der später im Kapitel 12 ge-
nauer untersuchten linearen Abbildungen gehört.
F
Welche Werte für x1 und x2 auch immer in die linken Z
Seiten der Gleichungen eingesetzt werden, es ergibt sich
jeweils ein Ergebnis, aber normalerweise nicht das auf der
rechten Seite vorgeschriebene. Trotzdem können wir eine
Punktabbildung herauslesen, nämlich:

f : R2 → R3 , (x1 , x2 )  → (x1 , x2 , x3 ) x1


⎡ 
x1 = x1 + x2
⎢ 
mit ⎣ x2 = 2 x1 − x2 x2
x3 = 3 x1 + x2 Der Fußpunkt F als Näherung für den Zielpunkt Z.

Weil drei Gleichungen mit zwei Unbekannten vorliegen,


handelt es sich um eine Abbildung aus der Ebene in den Methoden aus Kapitel 7 führen auf
Raum.
F = (23/38, 184/38, 161/38)
Die Bildpunkte (x1 , x2 , x3 ) liegen allerdings alle in der
Ebene f (R2 ) mit der Gleichung und damit zur Näherungslösung

5 x1 + 2 x2 − 3 x3 = 0 , (l˜1 , l˜2 ) = (69/38, −46/38).

Einsetzen dieser Lösung ergibt auf der rechten Seite Ab-


wie wir durch Einsetzen bestätigen können. Der durch die weichungen von den vorgeschriebenen Absolutgliedern
rechte Seite des Gleichungssystems vorgeschriebene Ziel- im Ausmaß von rund
punkt Z = (1, 5, 4) gehört nicht dieser Ebene an, denn
5 · 1 + 2 · 5 − 3 · 4 = 3  = 0 . Er kann daher kein Bild- 0.394 7, 0.157 9 bzw. − 0.236 8 .
punkt sein. Also gibt es keinen Punkt (x1 , x2 ), der durch
f auf Z abgebildet wird und damit auch keine Lösung des Dabei bezeichnen wir als Abweichung die Differenz Soll-
Systems. wert minus Istwert. Der Fußpunkt F ist der dem Zielpunkt
Z nächstgelegene Bildpunkt aus f (R2 ). Daher ist für die
Nun ist folgender Weg zu einer Näherungslösung nahelie-
gezeigte Näherungslösung die Quadratsumme der Abwei-
gend: Wir fragen zunächst nach einem Punkt innerhalb der
chungen minimal, nämlich gleich dem Quadrat der Distanz
Bildebene f (R2 ), der dem vorgeschriebenen Zielpunkt Z
der Punkte Z und F .
am nächsten liegt. Das ist der Normalenfußpunkt F von Z
(siehe Seiten 248 und 255), und das Urbild f −1 (F ) dieses Eine genauere Betrachtung dieser Methode der kleinsten
Fußpunkts ist dann unsere Näherungslösung. Quadrate folgt im Kapitel 17.
172 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Wert 3 von x3 in der vorletzten Gleichung ein und erhalten a11 x1 + a12 x2 + · · · + a1n xn = b1
für x2 a21 x1 + a22 x2 + · · · + a2n xn = b2
.. .. .. ..
2 x2 − 3 = 1 ⇒ x2 = 2 . . . .
am1 x1 + am2 x2 + · · · + amn xn = bm
und schließlich aus der ersten Gleichung für x1
Dabei sind die Koeffizienten aij und die Absolutglieder
x1 + 2 − 3 = 0 ⇒ x1 = 1 . bi für 1 ≤ i ≤ m und 1 ≤ j ≤ n Elemente des Kör-
pers K.
Damit lautet die Lösungsmenge L = {(1, 2, 3)}.
Ein n-Tupel (l1 , l2 , . . . , ln ) ∈ Kn heißt eine Lösung
Noch einfacher wird das Auffinden der Lösung bei einem
dieses Systems, wenn alle Gleichungen durch Einsetzen
System in reduzierter Stufenform. Hier treten die ersten
von l1 , . . . , ln anstelle von x1 , . . . , xn befriedigt wer-
Unbekannten jeweils in nur einer Gleichung auf, im fol-
den. Die Menge L aller Lösungen des Systems heißt
genden Beispiel sogar mit dem Koeffizienten 1 :
Lösungsmenge . Ist L leer, so heißt das Gleichungs-
system unlösbar.
x1 + x4 − x5 = 4
x2 − 2 x4 + 3 x5 = 6
x3 + 3 x4 − 2 x5 = 3 Wir werden im Folgenden stets die Kommutativität von K
voraussetzen, ohne dies noch extra zu erwähnen.
Wir können x1 , x2 und x3 unmittelbar durch x4 und x5
ausdrücken und damit alle Gleichungen befriedigen, egal
was für x4 und x5 eingesetzt wird. Daher können wir zur Mit elementaren Zeilenoperationen bringt
Beschreibung der Lösungsmenge die Unbekannten x4 und
man ein lineares Gleichungssystem auf
x5 durch Zahlen t1 bzw. t2 aus dem zugrunde liegenden
Körper K ersetzen. Dies führt auf eine Parameterdarstel-
Stufenform
lung der diesmal zweidimensionalen Lösungsmenge
Nun lernen wir eine Methode kennen, die auch vielen com-
L = {(4 − t1 + t2 , 6 + 2 t1 − 3 t2 , 3 − 3 t1 + 2 t2 , t1 , t2 ) putergestützten Verfahren zugrunde liegt und auf übersicht-
| t1 , t2 ∈ K}.  liche und effiziente Weise zur Lösungsmenge eines linearen
Gleichungssystems führt.

Wegen dieses recht einfachen Vorgehens beim Lösen von Die Strategie lässt sich wie folgt kurz beschreiben: Es
Gleichungssystemen in Stufen- bzw. reduzierter Stufenform wird wiederholt jeweils eine Gleichung des Systems durch
ist es naheliegend, bei beliebigen linearen Gleichungssyste- eine Folgegleichung ersetzt, bis schließlich das Gleichungs-
men die folgende Strategie zu verfolgen: system Stufenform annimmt. Spätestens an der Stufenform
kann die Frage nach der Lösbarkeit beantwortet werden. Ist
Wir bringen das System zunächst durch Umformungen auf das System lösbar, so lässt sich die Lösungsmenge durch
Stufen- bzw. reduzierte Stufenform und lesen dann die Lö- Rückwärtseinsetzen bestimmen (Eliminationsverfahren von
sung fast unmittelbar ab. Wir müssen allerdings darauf ach- Gauß) oder nach einer weiteren Umformung des Systems di-
ten, dass bei den einzelnen Umformungen die Lösungsmenge rekt von der reduzierten Stufenform ablesen (Eliminations-
nicht verändert wird. Daher beschränken wir uns strikt auf die verfahren von Gauß und Jordan).
sogenannten elementaren Zeilenumformungen. Details dazu
folgen im nächsten Abschnitt. Der Ersatz einer Gleichung durch eine Folgegleichung des
bisherigen Systems muss allerdings wohlüberlegt erfolgen:
Die Lösungsmenge muss unverändert bleiben, es darf keine
5.2 Das Lösungsverfahren von Information verloren gehen. Wir erreichen dieses Ziel, indem
wir die Umformungen, die zu Folgegleichungen führen, stark
Gauß und Jordan einschränken.

Wir haben schon einige reelle lineare Gleichungssysteme an- Definition der elementaren Zeilenumformungen
gegeben und auch gelöst. Dabei haben wir noch gar nicht ge-
Die folgenden, auf die einzelnen Gleichungen eines
klärt, was wir eigentlich genau unter einem solchen System
linearen Gleichungssystems anwendbaren Operationen
verstehen. Wir wollen dies nun nachholen:
heißen elementare Zeilenumformungen:
1. Zwei Gleichungen werden vertauscht.
Definition linearer Gleichungssysteme 2. Eine Gleichung wird mit einem Faktor λ ∈ K \ {0}
Ein lineares Gleichungssystem über dem kommutati- multipliziert, also vervielfacht.
ven Körper K mit m Gleichungen in n Unbekannten 3. Zu einer Gleichung wird das λ-Fache einer anderen
x1 , . . . , xn lässt sich in folgender Form schreiben: Gleichung addiert, wobei λ ∈ K.
5.2 Das Lösungsverfahren von Gauß und Jordan 173

Kommentar: Bei der Vervielfachung in Typ 2 ist λ = 0 zur ausgewählten Gleichung addiert worden, so muss umge-
ausgeschlossen, denn sonst entstünde eine Nullzeile, d. h. kehrt vom Ergebnis das λ-Fache der inzwischen unverändert
eine Zeile, in welcher alle Koeffizienten und das Absolut- gebliebenen anderen Gleichung wieder subtrahiert werden,
glied null sind. Da jedes n-Tupel aus Kn eine Nullzeile befrie- um zur Ausgangsgleichung zurückzukehren.
digt, würde diese Vervielfachung die Lösungsmenge einer & gleich (siehe
Somit sind die beiden Lösungsmengen L und L
ursprünglich von der Nullzeile verschiedenen Gleichung ver-
Mengengleichheit in Kapitel 2). 
ändern. Hingegen ist λ = 0 bei Typ 3 zugelassen, aber das
System bleibt dann unverändert.
Achtung: Das folgende Vorgehen ist nicht zulässig: Ad-
Die Zeilenvertauschung im Umformungstyp 1 ist auch durch
diere zur ersten Zeile die zweite Zeile und zur zweiten Zeile
geschicktes Anwenden der Typen 2 und 3 erreichbar. Wir
die erste Zeile. Und addiere dann zur neuen zweiten Zeile
haben dies als Übungsaufgabe gestellt. Demnach könnte man
das (−1)-Fache der neuen ersten Zeile. Damit entsteht eine
in der Definition bereits mit nur zwei Typen auskommen.
Nullzeile, d. h. eine Zeile mit lauter Nullen.

Mithilfe dieser elementaren Zeilenumformungen gelingt es Wenn z1 , . . . , zm die einzelnen Gleichungen des Systems
nun, lineare Gleichungssysteme zu vereinfachen, indem ein- bezeichnen und 0 eine Nullzeile bedeutet, so könnte diese
zelne Koeffizienten null werden, ohne dass sich die Lösungs- „verbotene“ Zeilenumformung folgendermaßen dargestellt
menge des Systems ändert. Zwei Gleichungssysteme mit der- werden:
selben Lösungsmenge heißen übrigens zueinander äquiva- ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
z1 z1 + z2 z1 + z2
lent. ⎜z2 ⎟ 1. Schritt ⎜z2 + z1 ⎟ 2. Schritt ⎜ 0 ⎟
⎝ ⎠ −→ ⎝ ⎠ −→ ⎝ ⎠
.. .. ..
. . .
Elementare Zeilenumformungen ändern die
Lösungsmenge nicht Offensichtlich ist bei diesen zwei Schritten Information ver-
loren gegangen. Anstelle der früher zwei Gleichungen z1
Wir formulieren sogleich das zentrale Ergebnis dieses Ab- und z2 gibt es jetzt nur mehr eine, und zwar die Summe
schnitts. z1 + z2 .

Äquivalente lineare Gleichungssysteme


Die Lösungsmenge eines linearen Gleichungssystems
?
Warum ist dieses eben geschilderte Vorgehen nicht zulässig?
ändert sich nicht, wenn an diesem System eine elemen-
Inwiefern hat man die Vorschriften für elementare Umfor-
tare Zeilenumformung vorgenommen wird.
mungen verletzt?

Beweis: Eine Lösung des Gleichungssystems erfüllt die-


Wir demonstrieren im Beispiel auf Seite 174, wie sich ein
ses auch noch, nachdem eine elementare Zeilenumformung
lineares Gleichungssystem durch elementare Zeilenumfor-
ausgeübt worden ist. Dies lässt sich wie folgt begründen:
mungen auf reduzierte Stufenform bringen lässt.
(1) Die Vertauschung zweier Gleichungen ändert nicht die
gestellten Bedingungen, sondern nur deren Reihenfolge. Beim schrittweisen Vorgehen in diesem Beispiel zur Auflö-
(2) Die Gleichheit zwischen der linken und rechten Seite sung des Gleichungssystems
einer Gleichung bleibt bestehen, wenn beide Seiten mit dem-
selben Faktor λ ∈ K multipliziert werden. x3 + 3 x4 + 3 x5 = 2
(3) Werden zwei Gleichungen erfüllt, dann ist auch die x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3
Summe der beiden linken Seiten gleich der Summe der bei- x1 + 2 x2 + 2 x3 + 7 x4 + 6 x5 = 5
den rechten. 2 x1 + 4 x2 + x3 + 5 x4 + 3 x5 = 4

Somit ist die Lösungsmenge L des gegebenen Gleichungs- waren nur die Koeffizienten in den Gleichungen ausschlag-
& des umgeform-
systems eine Teilmenge der Lösungsmenge L gebend. Die xi dienten nur als Platzanweiser. Fehlt in einer
ten Systems. Gleichung das xi , so ist der zugehörige Koeffizient von xi
& ⊂ L, d. h., jede Lösung natürlich null.
Es gilt aber auch die Umkehrung L
des umgeformten Systems löst auch das ursprüngliche. Als Wir sparen Schreibarbeit, wenn wir das angegebene lineare
Begründung genügt es zu erkennen, dass die Umkehrope- Gleichungssystem in folgender Art und Weise notieren:
ration einer elementaren Zeilenumformung wiederum eine ⎛ ⎞
von derselben Art ist: (1) Bei der Zeilenvertauschung ist das 0 0 1 3 3 2
trivial. (2) Anstelle der Multiplikation einer Gleichung mit ⎜1 2 1 4 3 3⎟
⎜ ⎟
λ = 0 ist bei der Umkehrung mit 1/λ zu multiplizieren. (3) ⎝1 2 2 7 6 5⎠
Ist schließlich vorher das λ-Fache einer anderen Gleichung 2 4 1 5 3 4
174 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Beispiel: Zurückführung auf reduzierte Stufenform


Gegeben ist ein System über dem Körper R bestehend aus vier linearen Gleichungen mit fünf Unbekannten:
x3 + 3 x4 + 3 x5 = 2
x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3
x1 + 2 x2 + 2 x3 + 7 x4 + 6 x5 = 5
2 x1 + 4 x2 + x3 + 5 x4 + 3 x5 = 4

Problemanalyse und Strategie: Wir kümmern uns zuerst um x1 : Mit elementaren Zeilenumformungen sorgen wir
dafür, dass x1 nur noch in einer, und zwar der dann ersten Zeile auftaucht. Dies gelingt folgendermaßen:
(1) Vertausche die erste mit der zweiten Zeile.
(2) Addiere zur dritten Zeile das (−1)-Fache der neuen ersten Zeile.
(3) Addiere zur vierten Zeile das (−2)-Fache der neuen ersten Zeile.
So verfahren wir nach und nach mit allen Variablen, um am Ende die gewünschte reduzierte Stufenform zu erreichen.

Lösung: Damit endet bereits das Verfahren, denn wir haben die
Zu x1 : reduzierte Stufenform erreicht.
x3 + 3 x4 + 3 x5 = 2 Die letzten beiden Zeilen mit den Nullen auf der linken
x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3 Seite sind besonders wichtig für die Entscheidung, ob un-
→ ser Gleichungssystem lösbar ist oder nicht:
x1 + 2 x2 + 2 x3 + 7 x4 + 6 x5 = 5
2 x1 + 4 x2 + x3 + 5 x4 + 3 x5 = 4
Fall (a) Sind auch die jeweiligen Absolutglieder so wie hier
x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3 gleich null, so können diese restlichen Gleichungen weg-
x3 + 3 x4 + 3 x5 = 2 gelassen werden, denn sie schränken die Lösungsmenge
x3 + 3 x4 + 3 x5 = 2 in keiner Weise ein.
− x3 − 3 x4 − 3 x5 = −2
Zu x2 : Wir stellen fest, dass hier nichts weiter zu erledigen Fall (b) Verbliebe hingegen in einer derartigen Zeile rechts
ist, da x2 nur in der ersten Zeile auftaucht. noch ein Absolutglied = 0, so bestünde ein Widerspruch,
Zu x3 : (1) Zur ersten Zeile addieren wir das (−1)-Fache der nicht beseitigbar wäre, was auch immer für x1 , . . . , x5
der zweiten Zeile; also, wir subtrahieren die zweite Zeile eingesetzt würde. Das Gleichungssystem wäre unlösbar.
von der ersten. (2) Wir ziehen die zweite Zeile auch von
der dritten Zeile ab. (3) Schließlich addieren wir die zweite Das zum Ausgangssystem äquivalente Gleichungssystem
Zeile zur vierten Zeile: in reduzierter Stufenform lautet somit:
x1 + 2 x2 + x3 + 4 x4 + 3 x5 = 3
x3 + 3 x4 + 3 x5 = 2 x1 + 2 x2 + x4 = 1

x3 + 3 x4 + 3 x5 = 2 x3 + 3 x4 + 3 x5 = 2
− x3 − 3 x4 − 3 x5 = −2
x1 + 2 x2 + x4 = 1 Es ist lösbar. Zu jeder Wahl von x2 , x4 und x5 kön-
x3 + 3 x4 + 3 x5 = 2 nen wir x1 und x3 derart angeben, dass beide Gleichun-
0 = 0 gen erfüllt sind. Die Lösungsmenge lautet also: L =
0 = 0 {(1−2 t1 −t2 , t1 , 2−3 t2 −3 t3 , t2 , t3 ) | t1 , t2 , t3 ∈ R}.

Am Schnittpunkt der i-ten Zeile, i ∈ {1, . . . , m}, und j -ten soll uns an die dort befindlichen Gleichheitszeichen erinnern.
Spalte, j ∈ {1, . . . , n}, steht der Koeffizient aij von xj in Rechts davon stehen nur mehr die Absolutglieder des Sys-
der i-ten Gleichung. Diesen Schnittpunkt der (horizontalen) tems. Nun ist auch klar, warum wir schon bisher anstelle von
i-ten Zeile und der (vertikalen) j -ten Spalte nennen wir auch Gleichungen auch von Zeilen und insbesondere von Nullzei-
die Stelle (i, j ). Der vertikale Strich vor der letzten Spalte len gesprochen haben.
5.2 Das Lösungsverfahren von Gauß und Jordan 175

Mit dieser Schreibweise lauten die im Beispiel auf Seite 174 a11 x1 + a12 x2 + · · · + a1n xn = b1
durchgeführten Umformungen wie folgt: a21 x1 + a22 x2 + · · · + a2n xn = b2
.. .. .. ..
⎛ ⎞ . . . .
0 0 1 3 3 2
⎜ 1 am1 x1 + am2 x2 + · · · + amn xn = bm
⎜ 2 1 4 3 3 ⎟
⎟ Typ 1 bzw. 3
⎝ 1 −→
2 2 7 6 5 ⎠ z1 ↔ z2 mit aij und bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n. Wir sagen:
2 4 1 5 3 4 z3 → z3 − z2 Zu diesem linearen Gleichungssystem gehören die Koeffi-
z4 → z4 − 2 z2
⎛ ⎞ zientenmatrix
1 2 1 4 3 3 ⎛ ⎞
a11 a12 · · · a1n
⎜ 0 0 1 3 3 2 ⎟ Typ 3
⎜ ⎟ −→ ⎜ a21 a22 · · · a2n ⎟
⎝ 0 2 ⎠ ⎜ ⎟
0 1 3 3 z1 → z1 − z2 A=⎜ . .. . ⎟
0 0 −1 −3 −3 −2 z3 → z3 − z2 ⎝ .. . · · · .. ⎠
z4 → z4 + z2
⎛ ⎞ am1 am2 · · · amn
1 2 0 1 0 1
⎜ 0 0 1 3 3 2 ⎟ und die erweiterte Koeffizientenmatrix
⎜ ⎟ ⎛ ⎞
⎝ 0 0 0 0 0 0 ⎠ a11 a12 · · · a1n b1
0 0 0 0 0 0 ⎜ a21 a22 · · · a2n b2 ⎟
⎜ ⎟
(A | b) = ⎜ . .. . .. ⎟
⎝ .. . · · · .. . ⎠
Wenn wir das letzte Schema nach Weglassung der beiden
am1 am2 · · · amn bm
Nullzeilen wieder in Gleichungsform ausdrücken, so erhalten
wir genau das letzte Gleichungssystem aus der Beispielbox Aus der erweiterten Koeffizientenmatrix erhalten wir eindeu-
von Seite 174: tig das zugehörige Gleichungssystem wieder zurück. Also ist
jede Information über das Gleichungssystem in der zugehö-
x1 + 2 x2 + x4 = 1 rigen erweiterten Koeffizientenmatrix enthalten.
x3 + 3 x4 + 3 x5 = 2
Allgemein heißt jedes rechteckige Schema von Zahlen aus
Wir erläutern das prinzipielle Vorgehen noch einmal in Wor- einem Körper K eine Matrix. Umfasst diese ebenso wie die
ten: obige Koeffizientenmatrix m ≥ 1 Zeilen und n ≥ 1 Spalten,
so sprechen wir von einer m × n -Matrix. Die Menge aller
1. Schritt: Wir wählen aus der ersten Spalte die rot gedruckte 1 m × n -Matrizen über K wird mit Km×n bezeichnet. In die-
aus und tauschen die zugehörige Gleichung in die erste Zeile. sem Sinn gehört die erweiterte Koeffizientenmatrix (A | b) zu
Mithilfe dieser rot gedruckten 1 werden alle anderen, von Km×(n+1) . Die Elemente einer Matrix heißen auch Einträge.
null verschiedenen Zahlen der ersten Spalte zu null gemacht.
Da diese Zahlen Koeffizienten von Unbekannten sind, die Die nur eine Zeile oder eine Spalte umfassenden Matrizen
dann wegfallen, können wir auch sagen, wir eliminieren diese werden auch Zeilen- bzw. Spaltenvektoren genannt. Ob-
Unbekannten mittels elementarer Zeilenumformungen. wohl erst im Kapitel 6 anhand der Vektorraumaxiome genau
erklärt wird, was ein Vektor ist, wollen wir diese Sprechweise
2. Schritt: Nachdem in der zweiten Spalte ab Zeile 2 kein von doch schon jetzt benutzen und eine Lösung (l1 , . . . , ln ) unse-
null verschiedener Eintrag vorkommt, gehen wir zur dritten res Gleichungssystems auch einen Lösungsvektor nennen.
Spalte weiter. Wir wählen die rot gedruckte 1 an der Stelle Wir verwenden dafür das fettgedruckte l als Symbol. Ebenso
(2, 3) aus und eliminieren damit alle anderen Einträge in die- können wir x als Vektor der Unbekannten (x1 , . . . , xn ) ein-
ser dritten Spalte durch elementare Zeilenumformungen. An führen und das gegebene lineare Gleichungssystem in der
den ersten beiden Spalten hat sich durch diese Zeilenumfor- Kurzform A x = b schreiben.
mungen nichts mehr geändert.
Hier sollte man sich allerdings x als Spaltenvektor vorstel-
len, denn hinter dieser Kurzschreibweise verbirgt sich ein
? Sonderfall der im Kapitel 12 ausführlich erklärten Matrizen-
Was hätten wir tun können, wenn wir an der Stelle (2, 3) multiplikation:
keine 1 zur Verfügung gehabt hätten? ⎛ ⎞
⎛ ⎞ x
a11 a12 · · · a1n ⎜ 1 ⎟
⎜ a21 a22 · · · a2n ⎟ ⎜ x2 ⎟
⎜ ⎟⎜ ⎟
Ax = ⎜ . .. .. ⎟ ⎜ .. ⎟
⎝ .. . ··· . ⎠⎜ ⎝ . ⎠

Die erweiterte Koeffizientenmatrix ist eine am1 am2 · · · amn
xn
komfortable Darstellung des linearen ⎛ ⎞
a11 x1 + a12 x2 + · · · + a1n xn
Gleichungssystems ⎜ a21 x1 + a22 x2 + · · · + a2n xn ⎟
⎜ ⎟
=⎜ ⎜ .. ⎟

Wir betrachten wieder ein allgemeines lineares Gleichungs- ⎝ . ⎠
system: am1 x1 + am2 x2 + · · · + amn xn
176 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Wenn wir zwei gleichartige Matrizen A und C genau dann der Zeilenvektoren von A. Egal, auf welchem Weg wir zur
als gleich erklären, wenn an jeder Stelle (i, j ) die jeweiligen Zeilenstufenform der Matrix A gelangen, es bleiben stets
Einträge aij und cij übereinstimmen, so fasst unsere Matri- rg A Nichtnullzeilen übrig. Diese Eindeutigkeit setzen wir
zengleichung im Folgenden bereits voraus.
Ax = b
genau die m linearen Gleichungen in den n Unbekannten
zusammen: Der m-zeilige Vektor der Summen auf den linken Das Verfahren von Gauß und Jordan ist ein
Seiten des linearen Gleichungssystems wird dem Vektor b der zuverlässiger Weg zur Lösung
Absolutglieder gleichgesetzt.
Wir unterscheiden zwei Eliminationsverfahren zur Lösung
Gemäß unserer Lösungsstrategie wenden wir uns der Auf- linearer Gleichungssysteme: Das Verfahren von Gauß und
gabe zu nachzuweisen, dass sich jede nicht nur aus Nullen das Verfahren von Gauß und Jordan. Tatsächlich waren diese
bestehende Koeffizientenmatrix A mithilfe elementarer Zei- Verfahren schon lange Zeit vor Gauß und Jordan bekannt,
lenumformungen auf Stufenform bringen lässt, genauer auf aber diese Bezeichnung haben sich etabliert, und auch wir
Zeilenstufenform: wollen davon nicht abrücken.
⎛ ⎞ ⎫ Beim Verfahren von Gauß wird die erweiterte Koeffizienten-
f1 ⎪
⎜ f2 ∗ ∗ ⎟ ⎪
⎪ matrix auf Zeilenstufenform gebracht, also auf die Form
⎜ ⎟ ⎪

⎜ ⎪

⎜ f3 ∗ ⎟
⎟ ⎬ ⎛ ⎞
⎜ ⎟ r f1
⎜ ⎟ ⎪ ⎜ f2 ∗ ∗ ⎟
⎜ .. ⎟ ⎪
⎪ ⎜ ⎟
⎜ ⎟ ⎪
⎪ ⎜
⎜ 0 . ⎟ ⎪
⎪ ⎜ f3 ∗ ⎟

⎜ fr ⎟ ⎭ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎝ 0 ⎠ ⎜ .. ⎟
⎜ 0 . ⎟
⎜ ⎟
⎜ fr ⎟
⎜ ⎟
⎝ 0 ⎠
Dabei bezeichnen f1 , . . . , fr die in den Zeilen jeweils ersten,
von 0 verschiedenen Einträge, die führenden Einträge oder
Pivotelemente. Kennzeichnend für die Zeilenstufenform ist, Die führenden Einträge f1 , . . . , fr sind von Null verschie-
dass beim Durchlaufen der Zeilen von oben nach unten nach den; davor und darunter gibt es nur Nullen. Darüber stehen
jeder Zeile der führende Eintrag um mindestens eine Spalte beliebige Einträge; diese sind durch ∗ markiert. Nullspalten
nach rechts rückt. Gibt es Nullzeilen, so stehen diese ganz sind bereits weggelassen worden.
unten.
Liegt fi+1 um k Spalten rechts von fi bei k ≥ 1, so bildet Eliminationsverfahren von Gauß
fi zusammen mit den k − 1 rechts anschließenden Einträ-
Dieses Eliminationsverfahren zur Lösung des linearen
gen eine Stufe der Länge k. Die verstreuten Nullen in der
Gleichungssystems (A | b) besteht aus
obigen Matrix sollen andeuten, dass unter den Stufen, also
1. der Umformung auf Zeilenstufenform,
unter der markierten Linie, nur Nullen auftreten. Die durch
2. der Lösbarkeitsentscheidung und
∗ markierten Einträge sind beliebig.
3. dem Rückwärtseinsetzen zur Bestimmung der Lö-
Wir haben eventuell vorhandene Nullspalten bereits wegge- sungsmenge des Systems.
lassen. Sie bedeuten, dass eine Unbekannte xj überhaupt
nicht in den Gleichungen erscheint und daher in der Lösungs- Beim Verfahren von Gauß und Jordan wird die erweiterte Ko-
menge das xj einen frei wählbaren Parameter darstellt. effizientenmatrix auf reduzierte Zeilenstufenform gebracht,
also auf die Form
? ⎛ ⎞
Wodurch unterscheidet sich die Zeilenstufenform zu dem f1 0
Gleichungssystem auf Seite 174 von jener auf Seite 172 ? ⎜ f2 ∗ 0 ⎟
⎜ ⎟
Wie könnte eine „Spaltenstufenform“ aussehen? ⎜ f 0 ⎟
⎜ 3 ⎟
⎜ ⎟
⎜ ⎟
⎜ . ⎟
⎜ 0 . . ⎟
Unterhalb der Stufen gibt es nur Nullzeilen. Wir nennen die ⎜ ⎟
⎜ fr ⎟
Anzahl r der Stufen, also die Anzahl der Nichtnullzeilen der ⎜ ⎟
⎝ 0 ⎠
Matrix in Zeilenstufenform, den Rang von A und verwenden
dafür das Zeichen rg A.
Im Kapitel 6 werden wir erkennen, dass diese Zahl r durch Wie vorhin sind für i = 1, . . . , r die führenden fi = 0 , und
A eindeutig bestimmt ist, nämlich als Dimension der Hülle davor und darunter gibt es nur Nullen. Diesmal werden aber
5.2 Das Lösungsverfahren von Gauß und Jordan 177

auch über den Stufen mittels elementarer Zeilenumformun- Wir geben wieder das zugehörige, zu (5.1) äquivalente
gen möglichst viele Nullen erzeugt, auf jeden Fall über den Gleichungssystem explizit an:
fi . Durch geeignete Multiplikation der Zeilen könnte auch
f1 = · · · = fr = 1 erreicht werden. x1 = 18/7
x2 = −1/7
Eliminationsverfahren von Gauß und Jordan Bei dieser reduzierten Zeilenstufenform ist die Lösung
Dieses Eliminationsverfahren zur Lösung des linearen direkt ablesbar.
Gleichungssystem (A | b) besteht aus
1. der Umformung auf Zeilenstufenform, Kommentar:
2. der Lösbarkeitsentscheidung und – Natürlich führen beide Eliminationsverfahren zur glei-
3. der Reduktion mittels weiterer elementarer Zeilen- chen Lösung. Tatsächlich aber schleichen sich umso
umformungen auf reduzierte Zeilenstufenform und mehr Rechenfehler ein, je mehr elementare Zeilenum-
dem Ablesen der Lösung. formungen durchgeführt werden. Die Erfahrung zeigt,
dass man am besten das Eliminationsverfahren von
Bevor wir die uneingeschränkte Wirksamkeit dieser Verfah- Gauß anwendet und dann von Fall zu Fall entscheidet,
ren beweisen, üben wir sie an einigen einfachen Beispielen ob man oberhalb der Stufen noch die eine oder andere
ein. Null erzeugt. Meistens lohnt es sich nicht, das Verfahren
von Gauß und Jordan bis zum Ende durchzuexerzieren,
Beispiel denn die Lösung ist oftmals viel früher zu erkennen.
Wir bestimmen die Lösungsmenge des folgenden reellen – Für den Anfänger ist es nützlich, nach Durchführung
linearen Gleichungssystems: des Verfahrens von Gauß das zugehörige äquivalente
Gleichungssystem noch einmal explizit anzuschreiben.
x1 + 4 x2 = 2 Wir haben das bisher ebenfalls gemacht. In Zukunft
(5.1)
3 x1 + 5 x2 = 7 werden wir das mehr und mehr meiden, weil ja in der er-
Die erweiterte Koeffizientenmatrix ist weiterten Koeffizientenmatrix alle wesentlichen Infor-
' ( mationen über das zugehörige Gleichungssystem ent-
1 4 2 halten sind.
3 5 7
Wir wählen in der ersten Spalte die 1 an der Stelle (1, 1) Wir bestimmen die Lösungsmenge des folgenden reellen
und beginnen mit linearen Gleichungssystems:
' ( ' (
1 4 2 1 4 2 2 x1 + 4 x2 = 2
−→ 3 x1 + 6 x2 = 3
3 5 7 z2 → z2 −3 z1 0 −7 1
5 x1 + 10 x2 = 5
Die Matrix hat bereits Zeilenstufenform, der Rang der Ma-
trix ist also 2 . Wir geben das zugehörige, zu (5.1) äquiva- Die erweiterte Koeffizientenmatrix ist
lente Gleichungssystem explizit an: ⎛ ⎞
2 4 2
x1 + 4 x2 = 2 ⎝3 6 3⎠
− 7 x2 = 1 5 10 5
Beim Verfahren von Gauß berechnet man nun die Lösung Wir multiplizieren die erste Zeile mit 1/2 und wählen die
durch Rückwärtseinsetzen. Wir erhalten für x2 den Wert an der Stelle (1, 1) entstehende 1, um mit dem Verfahren
−1/7 und dann durch Einsetzen in die erste Gleichung von Gauß zu beginnen:
x1 + 4 (−1/7) = 2 ⇒ x1 = 18/7 . ⎛ ⎞ ⎛ ⎞
1 2 1 1 2 1
z2 → z2 −3 z1
⎝3 6 3⎠ −→ ⎝0 0 0⎠
Also ist (l1 , l2 ) = (18/7, −1/7) die einzige Lösung. z3 → z3 −5 z1
5 10 5 0 0 0
Beim Verfahren von Gauß und Jordan werden an der Ma-
trix ' ( Die Matrix hat Zeilenstufenform, ihr Rang ist 1 . Die bei-
1 4 2 den Eliminationsverfahren sind hier identisch, die entstan-
0 −7 1 dene Matrix hat bereits reduzierte Zeilenstufenform. Das
in Zeilenstufenform noch zwei weitere Umformungen zugehörige Gleichungssystem lautet
durchgeführt: Die zweite Zeile wird mit −1/7 multipli-
ziert und dann zur ersten Zeile das (−4)-Fache der neuen x1 + 2 x2 = 1 .
zweiten Zeile addiert, kurz:
' ( ' ( Für jedes reelle t, das wir für x2 einsetzen, nimmt x1 den
1 4 2 1 0 18/7 Wert 1 − 2 t an. Also ist L = {(1 − 2 t, t) | t ∈ R} die
−→
0 −7 1 z1 → z1 + 4/7 z2 0 1 −1/7 Lösungsmenge.
178 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Wir bestimmen für alle a ∈ R die Lösungsmenge des Wir diskutieren kurz den Fall einer erweiterten Koeffizien-
folgenden linearen Gleichungssystems: tenmatrix, deren erste Spalte keine 1 aufweist. Dann sind
entweder alle Elemente der ersten Spalte null, oder es gibt
x 1 + a · x 2 − x3 = 0 ein ai1 = 0 . Im ersten Fall braucht man der ersten Spalte
2 x1 + x2 = 0 keine weitere Beachtung zu schenken; die Unbestimmte x1
x 2 + x3 = 0 unterliegt keinerlei Einschränkung, man setze x1 = t ∈ R.
−1
Im zweiten Fall multiplizieren wir die i-te Zeile mit ai1
und erreichen damit eine 1 an der Stelle (i, 1), mit welcher
Kommentar: Hier ist a zwar anfangs nicht bekannt,
die anderen Zahlen der ersten Spalte eliminiert werden kön-
aber keine Unbestimmte, sondern ein Parameter. Das
nen. Dies führt aber häufig zu unhandlichen Brüchen in den
Gleichungssystem wäre andernfalls nicht mehr linear.
weiteren Zahlen dieser Zeile und schließlich in der ganzen
Matrix. Dies lässt sich vermeiden, wenn man die neuen Zei-
Die erweiterte Koeffizientenmatrix lautet len wieder derart erweitert, dass die Nenner wegfallen. Bei
⎛ ⎞ der folgenden Elimination erfolgen diese beide elementaren
1 a −1 0
⎝2 1 0 0⎠ Zeilenumformungen gleichzeitig:
' ( ' (
0 1 1 0 3 2 3 4 3 2 3 4
−→
2 5 6 10 z2 → 3 z2 −2 z1 0 11 12 28
Wir wählen in der ersten Spalte die 1 an der Stelle (1, 1)
Es wird nämlich vom 3-Fachen der zweiten Zeile das 2-Fache
und beginnen mit dem Verfahren von Gauß:
der ersten Zeile subtrahiert.
⎛ ⎞ ⎛ ⎞
1 a −1 0 1 a −1 0
Beispiel Als ausführlicheres Beispiel betrachten wir ein
⎝ 2 1 0 0 ⎠ → ⎝ 0 (1 − 2 a) 2 0 ⎠ →
komplexes lineares Gleichungssystem, also mit K = C :
0 1 1 0 0 1 1 0
2 x1 + i x3 = i
⎛ ⎞ ⎛ ⎞ x1 − 3 x2 − i x3 = 2 i
1 0 (−1 − a) 0 1 0 (−1 − a) 0
⎝ 0 0 (1 + 2 a) 0 ⎠ → ⎝ 0 1 1 0⎠ i x1 + x2 + x3 = 1 + i
0 1 1 0 0 0 (1 + 2 a) 0 Die erweiterte Koeffizientenmatrix ist
⎛ ⎞
Die Matrix hat damit Zeilenstufenform. 2 0 i i
⎝ 1 −3 −i 2i ⎠
Der Rang der Matrix hängt nun von der reellen Zahl a
i 1 1 1+i
ab. Ist a = −1/2, so ist der Rang 2 , im Fall a  = −1/2
jedoch 3 . Wir wählen eine 1 und beginnen:
⎛ ⎞ ⎛ ⎞
2 0 i i 1 −3 −i 2 i
? ⎝ 1 −3 −i 2i ⎠ → ⎝ 0 6 3 i −3 i ⎠
Geben Sie das zugehörige lineare Gleichungssystem an. i 1 1 1+i 0 1 + 3i 0 3 + i
Nun könnten wir die zweite Zeile durch 2 dividieren. Dies
1. Fall: a = −1/2 . führt aber zu unbequemen Brüchen. Wir vermeiden Brüche,
Wegen 1 + 2 a = 0 ist die dritte Gleichung nur für x3 = 0 wenn wir von der dritten Zeile das (1+3 i)-Fache der zweiten
erfüllbar. Für x2 erhalten wir aus der zweiten Gleichung Zeile subtrahieren
durch Einsetzen von x3 = 0 ebenfalls den Wert 0 und ⎛ ⎞
1 −3 −i 2i
schließlich aus der ersten Gleichung x1 = 0 . Also ist ⎝0 2 i −i ⎠ →
(0, 0, 0) die eindeutig bestimmte Lösung des Systems 0 2 + 6i 0 6 + 2i
und L = {(0, 0, 0)} die Lösungsmenge. ⎛ ⎞
1 −3 −i 2i
2. Fall: a = −1/2. ⎝0 2 i −i ⎠
Die erweiterte Koeffizientenmatrix hat in diesem Fall die 0 0 3 − i 3 + 3i
Gestalt ⎛ ⎞ Es gibt also eine eindeutige Lösung, und zwar
1 0 −1/2 0
⎝0 1 1 0⎠ 3 + 3i 1
x3 = = 10 (3 + 3 i) (3 + i) = 35 + 65 i
0 0 0 0 3−i
−i − i x3
Für jedes reelle t, das wir für x3 einsetzen, hat x2 den Wert x2 = = 35 − 45 i
2
−t, wie wir aus der zweiten Gleichung erkennen, und x1
den Wert 1/2 t ; das besagt die erste Gleichung. x1 = 2 i + 3 x2 + i x3 = 35 + 15 i
: 1 1 1
;
Damit ist L = {(1/2 t, −t, t) | t ∈ R} die Lösungs- d. h., L = 5 (3 + i), 5 (3 − 4 i), 5 (3 + 6 i) ist die
menge.  Lösungsmenge. 
5.2 Das Lösungsverfahren von Gauß und Jordan 179

Beispiel: Lineare Gleichungssysteme mit Parameter I


Für welche a ∈ R hat das System
x1 + x2 + a x3 = 2
2 x1 + a x2 − x3 = 1
3 x1 + 4 x2 + 2 x3 = a
keine, genau eine, mehr als eine Lösung? Berechnen Sie für a ∈ {2, 3} alle Lösungen.

Problemanalyse und Strategie: Wir notieren die erweiterte Koeffizientenmatrix (A | b) und bringen diese mit ele-
mentaren Zeilenumformungen auf Stufenform. Dabei achten wir darauf, dass wir Fallunterscheidungen so lange wie
möglich hinausschieben, also nicht durch a oder einen anderen unbestimmten Ausdruck dividieren.

Lösung: Für a = 3 gibt es unendlich viele Lösungen.


Wir beginnen mit den Zeilenumformungen an der erwei- Wir berechnen nun abschließend die Lösungen des Sys-
terten Koeffizientenmatrix: tems für die beiden Fälle a ∈ {2, 3}.
⎛ ⎞ a = 2 : Wir setzen a = 2 in die Zeilenstufenform der er-
1 1 a 2
⎝ 2 a −1 1 ⎠ −→ weiterten Koeffizientenmatrix ein und erhalten
3 4 2 a ⎛ ⎞
1 1 2 2
⎛ ⎞ ⎝ 0 1 −4 −4 ⎠
1 1 a 2
⎝ 0 a − 2 −1 − 2 a −3 ⎠ −→ 0 0 −5 −3
0 1 2 − 3a a − 6
⎛ ⎞ also x3 = 3
, x2 = −4+4 x3 = − 85 , x1 = 2−x2 −2 x3 =
1 1 a 2 5
12
⎝0 1 2 − 3 a a − 6 ⎠ −→ 5 , d. h.
0 a − 2 −1 − 2 a −3 L = {(12/5, −8/5, 3/5)}.
⎛ ⎞
1 1 a 2 a = 3 : In diesem Fall erhalten wir aus der Zeilenstufen-
⎝0 1 2 − 3a a−6 ⎠ form der erweiterten Koeffizientenmatrix
0 0 3(a − 3)(a − 13 ) −(a − 3)(a − 5) ⎛ ⎞
1 1 3 2
⎝ 0 1 −7 −3 ⎠
Dies gilt wegen −1 − 2 a − (a − 2)(2 − 3 a) = 3 a 2 −
10 a + 3 = 3 (a − 3)(a − 13 ) und −3 − (a − 2)(a − 6) = 0 0 0 0
−(a 2 − 8 a + 15) = −(a − 3)(a − 5). also x2 = −3 + 7 x3 , x1 = 2 − x2 − 3 x3 = 5 − 10 x3 .
: ; Für jede Wahl von x3 ∈ R liegt eine Lösung vor. Wir ver-
Für a ∈ / 3, 13 ist das Gleichungssystem also eindeutig
lösbar. deutlichen dies, indem wir x3 = t setzen. Damit lautet die
Lösungsmenge bei a = 3
Für a = 13 ist das Gleichungssystem aufgrund der letzten
Zeile unlösbar. L = {(5 − 10 t, −3 + 7 t, t) | t ∈ R}.

Hinter den Eliminationsverfahren steht ein Reduzierbarkeit auf Zeilenstufenform


Algorithmus Jedes lineare Gleichungssystem lässt sich durch ele-
mentare Zeilenumformungen in ein äquivalentes System
Egal, wie unbequem die Einträge einer Matrix auch sein mö- überführen, das eine Zeilenstufenform oder reduzierte
gen, letztlich gelingt es immer, eine Matrix mit elementa- Zeilenstufenform aufweist.
ren Zeilenumformungen auf (reduzierte) Zeilenstufenform
zu bringen. Nach den vielen Beispielen soll dieses Ergeb-
nis nochmals festgehalten und der algorithmische Charakter Beweis: Wir beschreiben das schrittweise Vorgehen, also
des Verfahrens hervorgehoben werden. Mit Letzterem ist ge- den Eliminationsalgorithmus, bei dem Gleichungssystem
meint, dass ein und dieselben Prozedur solange wiederholt (A | b) aus m Gleichungen in n Unbekannten:
ausgeübt wird, bis die gewünschte Form erreicht ist:
1. Schritt: Wir beginnen mit der ersten Spalte von A.

Gibt es darin ein ai1 = 0, so verwenden wir dieses, um alle


anderen Einträge aj 1 , j = i, in der ersten Spalte zu eliminie-
ren, indem von der j -ten Zeile die mit aj 1 /ai1 multiplizierte
i-te Zeile subtrahiert wird. Dann tauschen wir die i-te Zeile
180 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

mit der ersten Zeile. Alle Zeilenumformungen sind an der die darüber stehenden Einträge zu eliminieren. Über den an-
erweiterten Koeffizientenmatrix (A | b) vorzunehmen. deren Elementen derselben Stufe können durchaus von null
verschiedene Zahlen stehen bleiben. 
Gibt es hingegen nur Nullen in der ersten Spalte, so gehen wir
die Spalten der Reihe nach durch. Finden wir erstmals in der
k-ten Spalte von A, 1 < k ≤ n, ein von null verschiedenes
Element aik , so verfahren wir mit der k-ten Spalte so wie 5.3 Das Lösungskriterium und
vorhin mit der ersten.
die Struktur der Lösung
Gibt es überhaupt nur Nullen in A, so sind wir bereits fertig
mit der Elimination. Bringt man eine Koeffizientenmatrix A bzw. eine erweiterte
2. Schritt: Die Matrix hat nun zu Beginn der ersten Zeile Koeffizientenmatrix (A | b) mithilfe von elementaren Zeilen-
entweder ein ai1 = 0 oder lauter Nullen und erstmals an umformungen auf Zeilenstufenform, so heißt die Anzahl der
der Stelle (1, k), k > 1, ein aik  = 0 . Wir fassen beide Zeilen, in denen nicht nur Nullen als Einträge erscheinen, der
Möglichkeiten zusammen, indem wir k ≥ 1 zulassen. Rang rg A bzw. rg(A | b) (Seite 176). Dieser Begriff spielt
eine wesentliche Rolle bei der Lösbarkeitsentscheidung.
Dann lassen wir im Weiteren die erste Zeile und die ersten k
Spalten der Koeffizientenmatrix A außer Acht und wenden
uns der verbleibenden (m − 1) × (n − k)-Matrix A1 zu: Mithilfe des Ranges lässt sich die Lösbarkeit
⎛ ⎞ eines linearen Gleichungssystems entscheiden
0 aik ∗ ∗ ∗
⎜0 0 ⎟
⎝ ⎠ Wir formulieren gleich das wesentliche Ergebnis.
.. .. A1
. .
Das Lösbarkeitskriterium
Es ist zu beachten, dass die Restmatrix A1 ebenso wie A keine Ein lineares Gleichungssystem mit der Koeffizientenma-
Absolutglieder enthält. Nur bei den Zeilenumformungen sind trix A und der erweiterten Koeffizientenmatrix (A | b) ist
auch die Absolutglieder mit zu berücksichtigen. genau dann lösbar, wenn
Diesmal durchsuchen wir in A1 die Spalten von vorne weg,
rg A = rg(A | b) .
um ein Element aj l = 0 zu entdecken. Gibt es keines, so
sind wir fertig. Finden wir hingegen in der Restmatrix A1 an
der Stelle (j, l), j ≥ 1, l ≥ 1, ein von null verschiedenes Kommentar: Dieses Kriterium wird den im 19. Jahrhun-
Element a1+j k+l , so eliminieren wir damit wie im ersten dert wirkenden Mathematikern Leopold Kronecker und Al-
Schritt die Einträge der l-ten Spalte in A1 und tauschen dann fredo Capelli zugeschrieben und deshalb oft Kriterium von
die j -te Zeile mit der ersten von A1 . Kronecker und Capelli genannt.
Wieder werden die Zeilenumformungen an der gesamten Beweis: Gilt rg A = rg(A | b), so existiert ein zu (A | b)
erweiterten Koeffizientenmatrix vorgenommen. Die ersten äquivalentes lineares Gleichungssystem in Zeilenstufenform,
Spalten bleiben davon sowieso unberührt. Nach diesen Um- bei welchem rechts von den Nullzeilen von A nur Nullen
formungen steht der erste, von null verschiedene Eintrag der stehen. Deshalb ist die Lösungsmenge nichtleer.
zweiten Zeile – bezogen auf die Gesamtmatrix – an der Stelle
Ist rg A = rg(A | b), so bleibt nur rg A < rg(A | b), da die
(2, k + l):
Zeilen in (A | b) jeweils ein Element mehr aufweisen als jene
⎛ ⎞ in A. Dann enthält ein zu (A | b) äquivalentes lineares Glei-
0 aik ∗ ∗ ∗ ∗
⎜ 0 · · · 0 a1+j k+l ∗ ∗ ⎟ chungssystem in Zeilenstufenform eine Zeile der Art
⎜ ⎟
⎜ 0 ··· 0 0 ⎟
⎝ ⎠ (0 0 . . . 0 | b) mit b = 0 .
.. .. .. A2
. . . Dies besagt aber, dass das gegebene Gleichungssystem nicht
lösbar ist. 
Von nun an lassen wir die erste Zeile und die ersten l Spalten
von A1 außer Acht und wiederholen das Verfahren für die Nicht lösbar sind also z. B.
verbleibende Matrix A2 , die nur mehr (m − 2) Zeilen und ⎛ ⎞ ⎛ ⎞
n−k−l Spalten aufweist; und so weiter. Gleichartige Schritte 2 b −1 0 1 1 −2 3 −2
⎝ 0 1 0 4 ⎠ und ⎝ 0 0 0 0 −1 ⎠
sind so lange zu wiederholen, bis alle Zeilen durchlaufen sind
oder die Restmatrix nur mehr Nullen enthält. Nachdem die 0 0 0 2 0 0 0 1 1
Größe der Restmatrix Schritt für Schritt abnimmt, ist nach Hingegen sind lösbar
spätestens m Schritten die Zeilenstufenform hergestellt. ⎛ ⎞ ⎛ ⎞
2 b −1 0 1 1 −2 3 −2
Will man schließlich die reduzierte Zeilenstufenform errei- ⎝ 0 1 0 4 ⎠ und ⎝ 0 0 1 1 1 ⎠
chen, so verwendet man die führenden Einträge pro Zeile, um 0 0 0 0 0 0 0 1 5
5.3 Das Lösungskriterium und die Struktur der Lösung 181

Kommentar: Die Lösungsmengen von homogenen und


Lineare Gleichungssysteme mit lauter Nullen als Abso- inhomogenen linearen Gleichungssystemen
lutglieder sind also immer lösbar. haben eine gewisse Struktur
Beim Verfahren von Gauß und Jordan bedeutet es keinen
zusätzlichen Aufwand, das Lösbarkeitskriterium 5.3 an-
Mithilfe von Begriffen und Ergebnissen aus dem nächsten
zuwenden. Es ist eine Station auf dem Weg zur Lösungs-
Kapitel 6 werden wir eine bessere Einsicht in die Struktur der
findung.
Lösungsmengen gewinnen. Unsere derzeitigen Kenntnisse
Ein Grund, warum das Lösbarkeitskriterium mithilfe der
reichen aber bereits aus, um die folgenden Sachverhalte zu
Ränge formuliert wird, liegt in der Bedeutung des Ranges
begründen.
als eine wichtige Kenngröße einer Matrix. Vorgreifend
wollen wir anmerken, dass sich der Rang auch auf andere
Arten feststellen lässt. Man muss hierzu nicht unbedingt Lösungen eines homogenen Systems
die Zeilenumformungen durchführen. Sind (l1 , . . . , ln ) und (m1 , . . . , mn ) Lösungen eines ho-
mogenen linearen Gleichungssystems über K in n Unbe-
? kannten, dann ist auch die Summe (l1 +m1 , . . . , ln +mn )
Vergleichen Sie in den sechs Beispielen von Seite 168 bis eine Lösung. Ferner ist für jedes λ ∈ K auch das λ-Fache
169 die Ränge der Koeffizientenmatrizen mit jenen der er- (λ l1 , . . . , λ ln ) eine Lösung.
weiterten Koeffizientenmatrizen.

Beweis: Um zu zeigen, dass die Summe eine Lösung ist,


Ein lineares Gleichungssystem, in dessen Spalte der Abso- müssen wir nur verifizieren, dass alle Gleichungen beim Ein-
lutglieder lauter Nullen stehen, heißt homogen und sonst in- setzen dieser Summe erfüllt werden.
homogen. Ein homogenes System besitzt immer die triviale Wir setzen die Summe in die i-te Gleichung des homogenen
Lösung (0, 0, . . . , 0) und ist daher immer lösbar. Das zeigt Systems ein. Mithilfe des in Körpern gültigen distributiven
sich auch daran, dass bei allen elementaren Zeilenumformun- Gesetzes (Seite 80) folgt:
gen die Nullen in der Absolutspalte bestehen bleiben und sich
daher auch in der Zeilenstufenform kein Widerspruch zeigen ai1 (l1 + m1 ) + ai2 (l2 + m2 ) + · · · + ain (ln + mn ) =
kann.
ai1 l1 + ai1 m1 + ai2 l2 + ai2 m2 + · · ·
Setzt man in einem beliebigen linearen Gleichungssystem · · · + ain ln + ain mn =
(A | b) alle Absolutglieder gleich null, so entsteht das zuge- a l + ai2 l2 + · · · + ain ln
hörige homogene lineare Gleichungssystem (A | 0) mit dem i1 1 
=0
Nullvektor 0 als Spalte der Absolutglieder:
+ ai1 m1 + ai2 m2 + · · · + ain mn = 0.

a11 x1 + a12 x2 + · · · + a1n xn = b1 =0
a21 x1 + a22 x2 + · · · + a2n xn = b2
.. .. .. .. Das gilt für jedes i ∈ {1, . . . , m}. Also ist (l1 + m1 , . . . ,
. . . . ln + mn ) eine Lösung.
am1 x1 + am2 x2 + · · · + amn xn = bm
 Ebenso gilt für jedes λ ∈ K und für jeden Zeilenindex
inhomogen ⇐⇒ bi  =0 für mindestens ein i i ∈ {1, . . . , m} wegen der Kommutativität von K:

ai1 (λ l1 ) + ai2 (λ l2 ) + · · · + ain (λ ln )
a11 x1 + a12 x2 + · · · + a1n xn = 0
= λ (ai1 l1 + ai2 l2 + · · · + ain ln ) = λ · 0 = 0 .
a21 x1 + a22 x2 + · · · + a2n xn = 0
.. .. .. ..
. . . . Somit ist wie behauptet auch (λ l1 , . . . , λ ln ) eine Lösung
am1 x1 + am2 x2 + · · · + amn xn = 0 unseres Gleichungssystems.

zugehöriges homogenes System Hier drängt sich die Vektorschreibweise geradezu auf. Wenn
wir l und m als die beiden Lösungsvektoren des homoge-
nen Gleichungssystems A x = 0 voraussetzen, so besagt
? die obige Aussage, dass auch der Summenvektor l + m eine
Hat ein homogenes Gleichungssystem über einem Körper K Lösung ist. Dabei wird – die Vektoraddition bereits vorweg-
neben der trivialen Lösung noch eine weitere Lösung, so hat nehmend – die Summe zweier n-Tupel komponentenweise
es gleich unendlich viele Lösungen. Stimmt das? gebildet, analog zu der im Kapitel 3 auf Seite 64 vorgeführten
Summe zweier Zahlentripel. Ebenso löst mit l auch λ l das
homogene System, und natürlich bedeutet λ l das λ-Fache
der Lösung l .
182 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Beispiel: Lineare Gleichungssysteme mit Parameter II


Wir untersuchen das reelle lineare Gleichungssystem
x1 + a x2 + b x3 = 2 a
x1 − x2 = 0
b x2 + a x3 = b
in Abhängigkeit der beiden Parameter a, b ∈ R auf Lösbarkeit bzw. eindeutige Lösbarkeit und stellen die entsprechenden
Bereiche für (a, b) ∈ R2 grafisch dar.

Problemanalyse und Strategie: Wir wenden die bekannten elementaren Zeilenumformungen an, beachten aber
jeweils, unter welchen Voraussetzungen an a und b diese zulässig sind.

Lösung: 2. Fall b = 0: Die zum Gleichungssystem gehörige Ma-


Die erweiterte Koeffizientenmatrix (A | b) des Systems trix lautet, nachdem wir die dritte Zeile durch b geteilt
lautet ⎛ ⎞ haben, ⎛ ⎞
1 a b 2a 1 −1 0 0
⎝ 1 −1 0 0 ⎠ ⎝ 0 a +1 b 2a ⎠
0 b a b 0 1 a/b 1
Damit die Parameter a und b nicht zu oft auftreten, bietet Wir vertauschen die zweite und die dritte Zeile und addie-
sich ein Tausch der ersten beiden Zeilen an. Zur neuen ren zur neuen dritten Zeile das −(a + 1)-Fache der neuen
zweiten Zeile addieren wir dann das (−1)-Fache der dann zweiten Zeile:
neuen ersten Zeile: ⎛ ⎞
⎛ ⎞ ⎛ ⎞ 1 −1 0 0
1 −1 0 0 1 −1 0 0 ⎝0 1 a/b 1 ⎠
⎝ 1 a b 2a ⎠ → ⎝ 0 a +1 b 2a ⎠ 0 0 b − (a + 1) a/b a − 1
0 b a b 0 b a b
Also gilt:
Damit wir die letzte Zeile mit b−1 multiplizieren dürfen, 1) Das Gleichungssystem ist nicht lösbar für a = 1 und
betrachten wir b = 0 gesondert. b2 = (a + 1) a.
1. Fall b = 0: Die Matrix hat dann die Form: 2) Das Gleichungssystem ist eindeutig lösbar für b2 =
⎛ ⎞ (a + 1) a, wobei a beliebig ist.
1 −1 0 0
⎝ 0 a +1 0 2a ⎠ 3) Das Gleichungssystem hat unendlich viele Lösungen
0 0 a 0 für a = 1 und b2 = 2.
Die Menge der in 1) genannten Punkte (a, b) ∈ R2 mit
Wir unterscheiden zwei Fälle: (a) a = 0 und (b) a  = 0: b2 = (a + 1) a bildet eine Hyperbel:
(a) Ist a = 0, so erhalten wir
⎛ ⎞
1 −1 0 0 a
⎝0 1 0 0⎠
0 0 0 0
1
und damit unendlich viele Lösungen.
(b) Ist a = 0, so müssen wir die beiden Fälle a = −1
und a = −1 unterscheiden: Bei a = −1 gehört zu dem
b
Gleichungssystem die Matrix:
⎛ ⎞
1 −1 0 0
⎝ 0 0 0 −2 ⎠
0 0 −1 0
Wegen rg A < rg(A | b) ist das System nicht lösbar.
Für a = −1 können wir die zweite Zeile durch a + 1 und
die dritte durch a teilen. Wir erhalten so die Matrix
⎛ ⎞ Die blauen Bereiche geben diejenigen Paare (a, b) ∈ R2
1 −1 0 0
⎝0 1 0 2 a ⎠ an, für die das Gleichungssystem eindeutig lösbar ist. Für
a+1 die Punkte der rot eingezeichneten Hyperbel ist das Glei-
0 0 1 0
chungssystem nicht lösbar – abgesehen von den drei grün
mit einer eindeutig bestimmten Lösung. markierten Punkten, die jeweils unendlich viele Lösungen
Damit haben wir den Fall b = 0 abgehandelt. liefern.
5.3 Das Lösungskriterium und die Struktur der Lösung 183

Unter der Lupe: Wählerstromanalyse – stark vereinfacht


Die folgende Tabelle zeigt, wie viele Stimmen die Parteien A, B und C bei den letzten zwei Wahlen in den Städten I, II und III
jeweils erhalten haben. Die Gesamtzahl der Wähler ist in jeder Stadt gleich geblieben. Wir nehmen (stark vereinfachend) an,
dass die Wählerströme in allen Städten exakt gleich sind. Damit ist der Anteil pXY derjenigen früheren Wähler der Partei X,
welche nun ihre Stimme der Partei Y gegeben haben, überall derselbe. Diese Anteile sind zu ermitteln.
frühere Wahl aktuelle Wahlergebnisse
A B C Summe A B C Summe
Stadt I 2 040 2 020 1 140 5 200 Stadt I 1 740 1 900 1 560 5 200
Stadt II 2 450 2 570 1 380 6 400 Stadt II 2 110 2 390 1 900 6 400
Stadt III 4 280 2 960 1 560 8 800 Stadt III 3 470 2 910 2 420 8 800

Wir bezeichnen den unbekannten Anteil jener ursprüngli- algebrasystems ist hier bereits angebracht. Die Lösung
chen A-Wähler, die nun B gewählt haben, mit pAB . Das lautet:
heißt, dass von den 2 040 früheren A-Wählern in der Stadt
I nun 2 040·pAB ihre Stimme der Partei B gegeben haben. pAB = 0.111 1 , pAC = 0.175 8 ⇒ pAA = 0.713 1 ,
Das ergibt insgesamt neun Unbekannte: pBA = 0.140 9 , pBC = 0.120 3 ⇒ pBB = 0.738 9 ,
pCA = 0.007 , pCB = 0.158 7 ⇒ pCC = 0.840 6 .
pAA , pAB , pAC , pBA , pBB , pBC , pCA , pCB , pCC .

Wir können allerdings gleich pAA = 1 − pAB − pAC und A B C 20.0%


ähnlich für pBB und pCC setzen, womit 6 Unbekannte 37.0%
43.0%
übrig bleiben.
Mithilfe dieser Unbekannten ist nun in jeder Stadt je- 84.1%
des der aktuellen Wahlergebnisse durch die früheren aus- 73.9%
71.3% 15.9%
drückbar: Die neuen A-Wähler der Stadt I setzen sich zu-
sammen aus 2 040 pAA früheren A-Wählern, 2 020 pBA 14.1%
früheren B-Wählern und 1 140 pCA früheren C-Wählern. 12.0%
Analoge Gleichungen gelten für die neuen B- und C-Wäh-
ler. Dabei ist allerdings die dritte eine Folge der ersten bei- 11.1%
0.1% 17.6%
den, denn die Summe aller drei Gleichungen ergibt links
und rechts die Gesamtanzahl der Wähler in der Stadt I.
Also bleibt ein System aus sechs linearen Gleichungen in 35.9% 35.3% 28.8%
sechs Unbekannten:
−2 040 pAB −2 040 pAC +2 020 pBA +1 140 pCA = −300 Die Wählerwanderung in Prozentzahlen.
2 040 pAB −2 020 pBA −2 020 pBC +1 140 pCB = −120
−2 450 pAB −2 450 pAC +2 570 pBA +1 380 pCA = −340
Kommentar: In Wirklichkeit gibt es natürlich viel mehr
2 450 pAB −2 570 pBA −2 570 pBC +1 380 pCB = −180
Einzelergebnisse und damit auch viel mehr Gleichungen
−4 280 pAB −4 280 pAC +2 960 pBA +1 560 pCA = −810
als Unbekannte. Dafür kann dann die wahrscheinlichste
4 280 pAB −2 960 pBA −2 960 pBC +1 560 pCB = −50
Wählerbewegung ermittelt werden.
Mit einigem Rechenaufwand zeigt man, dass dieses Sys- Selbstverständlich stehen den Wahlstatistikern noch viel
tem eindeutig lösbar ist. Der Einsatz eines Computer- subtilere Methoden bei der Wahlanalyse zur Verfügung.

Wenn wir gleich auch noch die Matrizengleichung unseres Lösungsmenge eines inhomogenen Systems
Systems verwenden und vorwegnehmen, dass die Matrizen-
Sind (s1 , . . . , sn ) eine spezielle Lösung eines linea-
multiplikation distributiv ist, was in voller Allgemeinheit erst
ren Gleichungssystems über K in n Unbekannten und
im Kapitel 12 erklärt wird, so können wir den obigen Beweis
(l1 , . . . , ln ) eine Lösung des zugehörigen homogenen
ganz kurz wie folgt führen:
Systems, dann ist auch die Summe (s1 +l1 , . . . , sn +ln )
A l = A m = 0 ⇒ A(l + m) = A l + A m = 0 + 0 = 0. eine Lösung des inhomogenen Systems. Umgekehrt ist
jede Lösung des inhomogenen Systems als eine derartige
In Kapitel 6 werden wir eine Menge U von Vektoren einen Summe darstellbar.
Unterraum nennen, wenn dieser mit l und m auch l + m
sowie λ l für alle λ ∈ K enthält. 
184 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Beweis: Wir verwenden hier gleich von Anfang an die also ausgeschrieben, ohne Nullspalten und nach bereits er-
Matrizengleichung A x = b des gegebenen Systems. folgter Umnummerierung der Unbekannten:
Die erste Behauptung ergibt sich durch Einsetzen: x1 + c1 r+1 xr+1 + · · · + c1n xn = s1
.. .. .. ..
A s = b und A l = 0 ⇒ A(s +l) = A s +A l = b +0 = b. . . . .
xr + cr r+1 xr+1 + · · · + crn xn = sr
Ist m so wie s eine Lösung des inhomogenen Systems, so
Nun ersetzen wir die letzten Unbekannten xr+1 , . . . , xn
gilt:
durch frei wählbare Parameter t1 , . . . , tn−r ∈ K und brau-
A m = A s = b ⇒ A(m − s) = A m − A s = b − b = 0. chen die Lösung nur noch abzuschreiben:
x1 = s1 − c1 r+1 t1 − · · · − c1n tn−r
Also löst der Differenzenvektor l = m − s das homogene .. .. .. ..
System, oder anders ausgedrückt: m = s + l .  . . . .
xr = sr − cr r+1 t1 − · · · − crn tn−r
xr+1 = t1
Sind L die Lösungsmenge unseres inhomogenen Systems .. ..
und L0 jene des zugehörigen homogenen Systems, so besagt . .
das zweite Ergebnis xn = tn−r

L = s + L0 = {s + l | l ∈ L0 }. (5.2) In Form einer Matrizengleichung sieht dies noch deutlicher


aus:
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x1 s1 −c1, r+1 · · · −c1n
⎜ . ⎟ ⎜ ⎟ ⎜ ⎟
? ⎜ .
⎜ .
⎟ ⎜
⎟ ⎜
..
.
⎟ ⎜
⎟ ⎜
..
.
..
.
⎟⎛
⎟ t1

Sind Summen und Vielfache von Lösungen inhomogener ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ xr ⎟ ⎜ sr ⎟ ⎜ −cr, r+1 · · · −crn ⎟⎜ . ⎟
⎜ ⎟=⎜ ⎟+⎜ ⎟ ⎝ .. ⎠
Systeme stets wieder Lösungen des inhomogenen Systems? ⎜ xr+1 ⎟ ⎜ 0 ⎟ ⎜ 1 0 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ t
⎜ .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟ n−r
⎝ . ⎠ ⎝ . ⎠ ⎝ . ⎠
xn 0 0 1
In den ersten r Zeilen scheinen Teilmatrizen der vorange-
Nach einer Umreihung der Unbekannten wird gangenen erweiterten Koeffizientenmatrix auf. Bei den rot
das Rückwärtseinsetzen besonders gedruckten Einträgen in der r × (n − r) -Teilmatrix sind al-
übersichtlich lerdings alle Vorzeichen umgekehrt.
In Übereinstimmung mit (5.2) zeigt die obige Parameterdar-
Abschließend noch ein genauer Blick auf das Rückwärtsein- stellung in der ersten Spalte die spezielle Lösung des inho-
setzen: mogenen Systems (erreichbar bei t1 = · · · = tn−r = 0) und
Wir gehen von der reduzierten Zeilenstufenform aus. Nach anschließend die allgemeine Lösung des zugehörigen homo-
geeigneter Multiplikation der Zeilen können alle führenden genen Gleichungssystems.
Einträge, also alle Pivotelemente, zu 1 gemacht werden. Wir
wollen nun auch noch Spaltenvertauschungen zulassen. Da- Freie Parameter in der Lösungsmenge
mit können wir nämlich erreichen, dass alle Stufen die Länge Ist (A | b) ein lösbares lineares Gleichungssystem über
1 erhalten, weil die zwischen den führenden Einträgen gele- K mit n Unbekannten, und hat die Koeffizientenmatrix
genen Spalten zurückgereiht werden. A den Rang r , so treten in der Lösungsmenge n − r
Wenn wir die Spalten mit den Indizes i und j vertauschen, Parameter t1 , . . . , tn−r auf, deren Werte jeweils in K
so bedeutet dies, dass in der bisherigen Reihenfolge der Un- frei wählbar sind.
bekannten x1 , . . . , xn die beiden Unbekannten xi und xj die
Plätze tauschen. Wir können also von einer Umreihung der Wir demonstrieren dies noch an dem Beispiel von Seite 174
Unbekannten sprechen, oder aber auch von einer Umnumme- mit der reduzierten Zeilenstufenform:
⎛ ⎞
rierung, weil wir das bisherige xi als xj bezeichnen können x1 x2 x3 x4 x5
und umgekehrt. ⎝ 1 2 0 1 0 1⎠
Auf diese Weise kommen wir im lösbaren Fall auf die Form 0 0 1 3 3 2
⎛ ⎞ Sicherheitshalber haben wir in einer Kopfzeile die Namen
1 0 c1 r+1 · · · c1n s1
⎜ .. .. .. ⎟ der jeweiligen Unbekannten angeführt, denn nun reihen wir
..
⎜ . . . . ⎟ um, sodass die Stufenlänge einheitlich 1 beträgt:
⎜ ⎟
⎜0 1 c · · · c rn sr ⎟
⎟ ⎛ ⎞
⎜ r r+1
x1 x3 x2 x4 x5
⎜ 0 ··· 0 · · · 0 0 ⎟
⎝ ⎠ ⎝ 1 0 2 1 0 1⎠
.. .. .. ..
. . . . 0 1 0 3 3 2
Zusammenfassung 185

Dies ergibt für die neue Reihenfolge der Unbekannten als Kommentar: In der Sprache der Vektorräume, wie sie
Parameterdarstellung der Lösungsmenge im nächsten Kapitel entwickelt wird, können wir sagen: Die
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ Lösungsmenge eines homogenen Systems über K in n Unbe-
x1 1 −2 −1 0 ⎛ ⎞ kannten und vom Rang r ist ein (n−r)-dimensionaler Unter-
⎜ x3 ⎟ ⎜ 2 ⎟ ⎜ 0 −3 −3 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ t1 raum von Kn . Die Lösungsmenge eines lösbaren inhomoge-
⎜ x2 ⎟=⎜ 0 ⎟+⎜ 1 0 0 ⎟ ⎝ ⎠
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ t2 nen Systems vom Rang r ist ein (n−r)-dimensionaler affiner
⎝ x4 ⎠ ⎝ 0 ⎠ ⎝ 0 1 0 ⎠ t3 Raum.
x5 0 0 0 1

Zusammenfassung

Ein reelles lineares Gleichungssystem hat Elementare Zeilenumformungen ändern die


entweder keine, genau eine oder unendlich Lösungsmenge nicht
viele Lösungen
Äquivalente lineare Gleichungssysteme
Definition linearer Gleichungssysteme Die Lösungsmenge eines linearen Gleichungssystems
Ein lineares Gleichungssystem über dem kommutati- ändert sich nicht, wenn an diesem System eine elemen-
ven Körper K mit m Gleichungen in n Unbekannten tare Zeilenumformung vorgenommen wird.
x1 , . . . , xn lässt sich in folgender Form schreiben:

a11 x1 + a12 x2 + · · · + a1n xn = b1 Das Verfahren von Gauß und Jordan ist ein
a21 x1 + a22 x2 + · · · + a2n xn = b2 zuverlässiger Weg zur Lösung
.. .. .. ..
. . . .
am1 x1 + am2 x2 + · · · + amn xn = bm Eliminationsverfahren von Gauß
Dieses Eliminationsverfahren zur Lösung des linearen
Dabei sind die Koeffizienten aij und die Absolutglieder
Gleichungssystems (A | b) besteht aus
bi für 1 ≤ i ≤ m und 1 ≤ j ≤ n Elemente des Kör-
1. der Umformung auf Zeilenstufenform,
pers K.
2. der Lösbarkeitsentscheidung und
Ein n-Tupel (l1 , l2 , . . . , ln ) ∈ Kn heißt eine Lösung 3. dem Rückwärtseinsetzen zur Bestimmung der Lö-
dieses Systems, wenn alle Gleichungen durch Einsetzen sungsmenge des Systems.
von l1 , . . . , ln anstelle von x1 , . . . , xn befriedigt wer-
den. Die Menge L aller Lösungen des Systems heißt Lö-
sungsmenge. Ist L leer, so heißt das Gleichungssystem Eliminationsverfahren von Gauß und Jordan
unlösbar. Dieses Eliminationsverfahren zur Lösung des linearen
Gleichungssystem (A | b) besteht aus
1. der Umformung auf Zeilenstufenform,
2. der Lösbarkeitsentscheidung und
Mit elementaren Zeilenoperationen bringt 3. der Reduktion mittels weiterer elementarer Zeilen-
man ein lineares Gleichungssystem auf umformungen auf reduzierte Zeilenstufenform und
Stufenform dem Ablesen der Lösung.

Definition der elementaren Zeilenumformungen


Hinter den Eliminationsverfahren steht ein
Die folgenden, auf die einzelnen Gleichungen eines
linearen Gleichungssystems anwendbaren Operationen
Algorithmus
heißen elementare Zeilenumformungen:
1. Zwei Gleichungen werden vertauscht. Reduzierbarkeit auf Zeilenstufenform
2. Eine Gleichung wird mit einem Faktor λ ∈ K \ {0} Jedes lineare Gleichungssystem lässt sich durch ele-
multipliziert, also vervielfacht. mentare Zeilenumformungen in ein äquivalentes System
3. Zu einer Gleichung wird das λ-Fache einer anderen überführen, das eine Zeilenstufenform oder reduzierte
Gleichung addiert, wobei λ ∈ K. Zeilenstufenform aufweist.
186 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Mithilfe des Ranges lässt sich die Lösbarkeit Lösungsmenge eines inhomogenen Systems
eines linearen Gleichungssystems entscheiden Sind (s1 , . . . , sn ) eine spezielle Lösung eines linea-
ren Gleichungssystems über K in n Unbekannten und
Das Lösbarkeitskriterium (l1 , . . . , ln ) eine Lösung des zugehörigen homogenen
Ein lineares Gleichungssystem mit der Koeffizientenma- Systems, dann ist auch die Summe (s1 +l1 , . . . , sn +ln )
trix A und der erweiterten Koeffizientenmatrix (A | b) ist eine Lösung des inhomogenen Systems. Umgekehrt ist
genau dann lösbar, wenn jede Lösung des inhomogenen Systems als eine derartige
rg A = rg(A | b) . Summe darstellbar.

Die Lösungsmengen von homogenen und Nach einer Umreihung der Unbekannten wird
inhomogenen linearen Gleichungssystemen das Rückwärtseinsetzen besonders
haben eine gewisse Struktur übersichtlich

Lösungen eines homogenen Systems Freie Parameter in der Lösungsmenge


Sind (l1 , . . . , ln ) und (m1 , . . . , mn ) Lösungen eines Ist (A | b) ein lösbares lineare Gleichungssystem über
homogenen linearen Gleichungssystems über K in n K mit n Unbekannten, und hat die Koeffizientenmatrix
Unbekannten, dann ist auch die Summe (l1 + m1 , . . . , A den Rang r , so treten in der Lösungsmenge n−r
ln + mn ) eine Lösung. Ferner ist für jedes λ ∈ K auch Parameter t1 , . . . , tn−r auf, deren Werte jeweils in K
das λ-Fache (λ l1 , . . . , λ ln ) eine Lösung. frei wählbar sind.

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen aus einer ganzzahligen Lösung des Systems über Q oder R


5.1 • Haben reelle lineare Gleichungssysteme mit zwei herleitbar?
verschiedenen Lösungen stets unendlich viele Lösungen?
5.6 •• Das folgende lineare Gleichungssystem mit
5.2 • Gibt es ein lineares Gleichungssystem über ganzzahligen Koeffizienten ist über R unlösbar. In welchen
einem Körper K mit weniger Gleichungen als Unbekannten, Restklassenkörpern ist es lösbar, und wie lautet die jeweilige
welches eindeutig lösbar ist? Lösung?
2 x1 + x2 − 2 x3 = −1
5.3 •• Ist ein lineares Gleichungssystem A x = b mit n x1 − 4 x2 − 19 x3 = 10
Unbekannten und n Gleichungen für ein b eindeutig lösbar, x2 + −4 x2 = −3
dann auch für jedes b . Stimmt das? 5.7 •• Es sind Zahlen a, b, c, d, r, s aus dem Körper
K vorgegeben. Begründen Sie, dass das lineare Gleichungs-
5.4 • Folgt aus rg A = rg(A | b), dass das lineare Glei-
chungssystem (A | b) eindeutig lösbar ist? system
a x1 + b x2 = r
c x1 + d x2 = s
5.5 •• Ein lineares Gleichungssystem mit lauter ganz-
zahligen Koeffizienten und Absolutgliedern ist auch als Glei- im Fall a d − b c = 0 eindeutig lösbar ist, und geben Sie die
chungssystem über dem Restklassenkörper Zp aufzufassen. eindeutig bestimmte Lösung an.
Angenommen, l = (l1 , . . . , ln ) ist eine ganzzahlige Lösung Bestimmen Sie zusätzlich bei K = R für m ∈ R die Lösungs-
dieses Systems. Warum ist dann l = (l 1 , . . . , l n ) mit l i ≡ li menge des folgenden linearen Gleichungssystems:
(mod p) für i = 1, . . . , n eine Lösung des gleichlautenden −2 x1 + 3 x2 = 2 m
Gleichungssystems über Zp ? Ist jede Lösung zu letzterem x1 − 5 x2 = −11
Aufgaben 187

Rechenaufgaben x1 − x2 + x3 − 2 x4 = −2
−2 x1 + 3 x2 + a x3 = 4
5.8 • Bestimmen Sie die Lösungsmengen L der fol- −x1 + x2 − x3 + a x4 = a
genden reellen linearen Gleichungssysteme und untersuchen a x2 + b2 x3 − 4 a x4 = 1
Sie deren geometrische Interpretationen:
in Abhängigkeit der beiden Parameter a, b ∈ R auf Lösbar-
2 x1 + 3 x2 = 5 keit bzw. eindeutige Lösbarkeit und stellen Sie die entspre-
x1 + x2 = 2 chenden Bereiche für (a, b) ∈ R2 grafisch dar.
3x1 + x2 = 1
5.13 •• Im Ursprung 0 = (0, 0, 0) des R3 laufen die
2x1 − x2 + 2x3 =1
drei Stäbe eines Stabwerks zusammen, die von den Punkten
x1 − 2x2 + 3x3 =1
6x1 + 3x2 − 2x3 =1 a = (−2, 1, 5), b = (2, −2, −4), c = (1, 2, −3)
x1 − 5x2 + 7x3 =2
ausgehen.
0
5.9 ••• Für welche a ∈ R hat das reelle lineare Glei-
chungssystem
(a + 1) x1 + (−a 2 + 6 a − 9) x2 + (a − 2) x3 = 1
(a 2 − 2 a − 3) x1 + (a 2 − 6 a + 9) x2 + 3 x3 = a − 3
(a + 1) x1 + (−a 2 + 6 a − 9) x2 + (a + 1) x3 = 1

keine, genau eine bzw. mehr als eine Lösung? Für a = 0 und ↓F c
a = 2 berechne man alle Lösungen. c ↓
↓F b F
5.10 •• Berechnen Sie die Lösungsmenge der komple-
xen linearen Gleichungssysteme:
b
↓F a
a) x1 + i x2 + x3 = 1 + 4 i a
x 1 − x2 + i x3 = 1
i x1 − x2 − x3 = −1 − 2 i Abbildung 5.6 Die Gewichtskraft F verteilt sich auf die Stäbe.

b) 2 x1 + i x3 = i Im Ursprung 0 wirkt die vektorielle Kraft F = (0, 0, −56)


x 1 − 3 x 2 − i x3 = 2 i in Newton. Welche Kräfte wirken auf die Stäbe?
i x1 + x2 + x3 = 1 + i
c) (1 + i) x1 − i x2 − x3 = 0
Beweisaufgaben
2 x1 + (2 − 3 i) x2 + 2 i x3 = 0
5.14 • Beweisen Sie, dass bei jedem linearen Glei-
5.11 •• Bestimmen Sie die Lösungsmenge L des fol- chungssystem über dem Körper K mit den beiden Lösungen
genden reellen linearen Gleichungssystems in Abhängigkeit l = (l1 , . . . , ln ) und l ∗ = (l1∗ , . . . , ln∗ ) gleichzeitig auch
von r ∈ R: λl + (1 − λ)l ∗ , also λl1 + (1−λ)l1∗ , . . . , λln + (1−λ)ln∗
r x1 + x2 + x3 = 1 eine Lösung ist, und zwar für jedes λ ∈ K .
x1 + r x2 + x3 = 1
x1 + x2 + r x3 = 1 5.15 •• Zeigen Sie, dass die elementare Zeilenumfor-
mung (1) auf Seite 185 auch durch mehrfaches Anwenden
5.12 ••• Untersuchen Sie das reelle lineare Gleichungs- der Umformungen vom Typ (2) und (3) auf Seite 185 erzielt
system werden kann.
188 5 Lineare Gleichungssysteme – ein Tor zur linearen Algebra

Antworten der Selbstfragen

S. 168 unten ein von null verschiedenes Element vorkommt. Wenn


Man erhält dann {(t, 1/2 t) | t ∈ R} als Lösungsmenge. Dies ja, vertauschen wir die zugehörige Zeile mit der zweiten und
ist aber natürlich die gleiche Menge. verfahren wie vorhin. Wenn nein, verfahren wir mit der 4.
Spalte so wie vorhin mit der dritten, und so weiter. Gibt es
S. 169 von der zweiten Zeile an links vom Trennstrich sowieso nur
1) Nein, denn die Gleichungen können einander widerspre- mehr Nullen, so liegt bereits eine Stufenform vor.
chen wie etwa x1 + x2 + x3 = 1 und x1 + x2 + x3 = 0 ,
was zu L = ∅ führt. Ist das System jedoch lösbar, so kann S. 176
man eine Unbekannte durch einen Parameter t ∈ R ersetzen Auf Seite 174 hat eine Stufe die Länge 2; auf Seite 172 haben
und das System weiterhin lösen. Wegen der freien Wahl von alle Stufen die Länge 1. Bei der Zeilenstufenform kann die
t gibt es unendlich viele Lösungen. Länge der Stufen variieren, bei der Spaltenstufenform die
Höhe.
2) Nein, es ist z. B. x1 = 1, 2 x1 = 2 ein System von zwei
linearen Gleichungen in einer Unbekannten x1 und mit der
S. 178
eindeutig bestimmten Lösung x1 = 1.
Es lautet:
x1 − (1 + a) x3 = 0
S. 169
x2 + x3 = 0
Im Fall b = 0 ist die Lösungsmenge jeweils die leere Menge.
(1 + 2 a) x3 = 0
Im Fall b = 0 ist bei zwei Unbekannten die Lösungsmenge
L = R2 , also die ganze Ebene, und bei drei Unbekannten der
ganze Raum. S. 181
Es gilt der Reihe nach rg A = 2 = rg(A | b), rg A = 1 = 2 =
S. 173 rg(A | b) sowie rg A = 1 = rg(A | b). Bei den drei Gleichun-
Die Zeilenumformung vom Typ 3 wurde beim ersten Um- gen mit vier Unbekannten im vierten Beispiel ist rg A = 2 =
formungspfeil nicht korrekt ausgeführt: Zeilenumformungen rg(A | b), bei dem fünften rg A = 2 = 3 = rg(A | b); beim
sind der Reihe nach durchzuführen. Wird im ersten Schritt sechsten gilt über R rg A = 2 = 3 = rg(A | b), dagegen gilt
gemäß Typ 3 die zweite Gleichung zur ersten addiert, so muss über Z5 rg A = 2 = rg(A | b).
im zweiten Schritt zur zweiten Gleichung bereits die Summe
z1 + z2 addiert werden und nicht nur z1 allein. Hinter dem S. 181
ersten Umformungspfeil verbergen sich bereits zwei Schritte, Es ist nur dann richtig, wenn K unendlich viele Elemente hat,
von denen der zweite unzulässig ist. denn mit l ist auch jedes Vielfache λ l mit λ ∈ K eine Lösung
des homogenen Systems.
S. 175
Steht an der Stelle (2, 3) eine Zahl a23  = 0 , dann erzeugen S. 184
−1
wir dort eine 1, wenn wir die 2. Zeile mit a23 multiplizie- Nein, denn aus As 1 = As 2 = b folgt A(s 1 + s 2 ) = 2 b = b
ren. Bei a23 = 0 sehen wir nach, ob in der 3. Spalte weiter sowie A(λs 1 ) = λ b = b , sofern λ = 1 .
Vektorräume – von
Basen und Dimensionen 6
Können Funktionen Vektoren
sein?
Enthält jedes Erzeugenden-
system eine Basis?
Welche Dimension hat K[X]
über K?

6.1 Der Vektorraumbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190


6.2 Beispiele von Vektorräumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
6.3 Untervektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
6.4 Basis und Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
6.5 Summe und Durchschnitt von Untervektorräumen . . . . . . . . . . 211
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
190 6 Vektorräume – von Basen und Dimensionen

Die lineare Algebra kann auch als Theorie der Vektorräume


(V3) (λ μ) · v = λ · (μ · v),
bezeichnet werden. Diese Theorie entstand durch Verallgemei-
(V4) 1 · v = v
nerung der Rechenregeln von klassischen Vektoren im Sinne
gelten, nennt man V einen Vektorraum über K oder
von Pfeilen in der Anschauungsebene. Der wesentliche Nutzen
kurz einen K-Vektorraum.
liegt darin, dass unzählige, in fast allen Gebieten der Mathema-
tik auftauchende Mengen eben diese gleichen Rechengesetze
erfüllen. So war es naheliegend, jede Menge, in der jene Re- Es ist hier angebracht, die Definition etwas zu erläutern. Bei
chengesetze gelten, allgemein als Vektorraum zu bezeichnen. einem Vektorraum V werden zwei algebraische Strukturen,
Eine systematische Behandlung eines allgemeinen Vektorraums, nämlich die der abelschen Gruppe (V , +) und die des Kör-
d. h. eine Entwicklung einer Theorie der Vektorräume, löst so- pers K, durch eine neue Verknüpfung · miteinander verbun-
mit zahlreiche Probleme in den verschiedensten Gebieten der den. Dass · eine Abbildung ist, bringt zum Ausdruck, dass
Mathematik. diese Verbindung der beiden Strukturen durch eine Multipli-
kation der Elemente aus V mit Elementen aus K gegeben
Auch wenn die Definition eines allgemeinen Vektorraums reich- ist; das Ergebnis dieser Multiplikation ist ein Element in V .
lich kompliziert wirken mag – letztlich kann man einen Vektor- Die Eigenschaften (V1)–(V4) nennt man auch Vektorraum-
raum durch Angabe von oft sehr wenigen Größen vollständig axiome, sie beschreiben eine Verträglichkeit der zwei gege-
beschreiben. Jeder Vektorraum besitzt nämlich eine sogenannte benen Verknüpfungen + und · des Vektorraums V . In (V3)
Basis. In einer solchen Basis steckt jede Information über den bezeichnet λ μ das Produkt von λ mit μ in K. Wir lassen für
Vektorraum. Und es sind auch die Basen, die es möglich ma- das Produkt in K – wie dies oft üblich ist – den Punkt für die
chen, von der Dimension eines Vektorraums zu sprechen. Dabei Multiplikation weg.
entspricht dieser Dimensionsbegriff den drei räumlichen Di-
mensionen des Anschauungsraums. Aber dieser mathematische ?
Dimensionsbegriff ist viel allgemeiner. Es besteht für die Mathe- Hinter dem Begriff abelsche Gruppe (V , +) verbergen sich
matik keine Hürde, auch in Vektorräumen zu rechnen, die sich vier Axiome. Können Sie diese angeben?
der Anschauung völlig entziehen.

Die Elemente aus V heißen Vektoren und werden zunächst


6.1 Der Vektorraumbegriff durch Fettdruck gekennzeichnet. In späteren Kapiteln wer-
den wir keinen Fettdruck mehr einsetzen, weil sonst Formeln
Wir führen den Begriff eines Vektorraums ein. Dieser erlaubt und Aussagen nicht konsistent werden. Es ist unumgänglich,
uns, für viele verschiedene Bereiche, in welchen gleichar- dass man sich über die Bedeutung der einzelnen Symbole in
tige Rechenverfahren auftreten, eine einheitliche Theorie zu mathematischen Aussagen im Klaren ist.
entwickeln.
Die Elemente aus K heißen Skalare und werden häufig durch
griechische Buchstaben gekennzeichnet. Das neutrale Ele-
ment 0 bezüglich der Addition heißt Nullvektor. Wir be-
Ein Vektorraum ist durch eine abelsche zeichnen das zu v entgegengesetzte und eindeutig bestimmte
Gruppe, einen Körper, eine äußere Element v  mit −v und schreiben anstelle von v + (−w) kurz
Multiplikation und vier Verträglichkeits- v−w. Gelegentlich nennt man das entgegengesetzte Element
−v zu v auch inverses Element. Die (äußere) Multiplikation
gesetze gegeben
· nennen wir die Multiplikation mit Skalaren.
Im Folgenden bezeichnen wir mit K einen Körper. Wenn Im Fall K = R nennen wir V auch einen reellen Vektorraum
nicht explizit auf einen besonderen Körper hingewiesen wird, und im Fall K = C einen komplexen Vektorraum.
kann man sich anstelle von K stets den vertrauten Körper R
denken, um ein konkretes Beispiel vor Augen zu haben.
Kommentar: Alles, was als Element eines Vektorraums
aufgefasst werden kann, ist also ein Vektor. Vektoren werden
Definition eines K-Vektorraums
nur durch ihre Eigenschaften definiert. Wir werden bald ver-
Es seien K ein Körper, (V , +) eine abelsche Gruppe und schiedene, zum Teil sehr vertraute mathematische Objekte
 kennenlernen, die auch Vektoren sind. Ein Vektor ist also
K×V → V
·: nicht unbedingt
(λ, v)  → λ · v
ein Pfeil mit einer Länge und einer Richtung oder
eine Abbildung. Falls für alle u, v, w ∈ V und λ, μ ∈ eine Klasse parallel verschobener Pfeile.
K die Eigenschaften
(V1) λ · (v + w) = λ · v + λ · w,
(V2) (λ + μ) · v = λ · v + μ · v,
6.1 Der Vektorraumbegriff 191

Die Anschauungsebene ist ein klassisches (V1) gilt, da


Beispiel eines reellen Vektorraums ' ( ' (
v + w1 λ (v1 + w1 )
λ · (v + w) = λ · 1 =
v2 + w2 λ (v2 + w2 )
Auf Seite 39 haben wir das kartesische Produkt endlich vieler ' ( ' ( ' (
Mengen erklärt. Es ist λ v1 + λ w1 λ v1 λ w1
= = +
λ v2 + λ w2 λ v2 λ w2
R2 = {(v1 , v2 ) | v1 , v2 ∈ R} ' ( ' (
v w1
=λ· 1 +λ· = λv + λw.
die Menge aller geordneten Paare (v1 , v2 ). Dabei war es v2 w2
reine Willkür, die reellen Zahlen v1 und v2 nebeneinander
zu schreiben. Wir können die Zahlen genauso gut übereinan- (V2) gilt, da
der schreiben, d. h. ' ( ' (
v (λ + μ) · v1
' (  (λ + μ) · v = (λ + μ) · 1 =
v1 v2 (λ + μ) · v2
R2 = | v1 , v2 ∈ R . ' ( ' ( ' (
v2 λ · v1 + μ · v 1 λ · v1 μ · v1
= = +
λ · v2 + μ · v 2 λ · v2 μ · v2
Wir werden diese aufrechte Schreibweise in diesem Kapitel ' ( ' (
v v
für alle n-Tupel beibehalten. Die Vorteile liegen darin, dass =λ· 1 +μ· 1
die Darstellung übersichtlicher ist und Rechenregeln einpräg- v2 v2
samer werden. = (λ · v) + (μ · v) .
' ( ' (
v1 w1
Sind v = und w = Elemente aus R2 , so wird (V3) und (V4) begründet man analog. 
v2 w2
R2 mit der komponentenweise erklärten Addition
' ( ' ( ' ( Das Beispiel lässt sich noch weiter verallgemeinern.
v1 w1 v + w1
+ = 1
v2 w2 v2 + w2 Beispiel Analog zu dem eben betrachteten Beispiel des R2
ist für jeden Körper K und jede natürliche Zahl n die Menge
zu einer abelschen Gruppe (R2 , +) (Beispiel Seite 66). Wir
⎧⎛ ⎞ ⎫
erklären nun eine Multiplikation von Elementen der abel- ⎪ ⎪
⎨ v1 ⎬
2
( R mit Elementen aus dem Körper R. Für jedes
schen'Gruppe n ⎜ .. ⎟
V = K = ⎝ . ⎠ | v1 , . . . , vn ∈ K
v1 ⎪
⎩ ⎪

v= ∈ R2 und jedes λ ∈ R setzen wir vn
v2
' ( ' (
v1 λ v1 mit komponentenweiser Addition und Multiplikation mit
λ· = .
v2 λ v2 Skalaren ein K-Vektorraum, Rn ein reeller, Cn ein komplexer.

Eigentlich sollte man für die Addition von Elementen aus Wir prüfen dies für den Fall K = C und n = 1 explizit nach:
dem R2 und die Multiplikation von Elementen aus dem R2 Es gilt hier V = C: V liefert die Vektoren, C die Skalare. Die
mit reellen Zahlen neue Symbole, etwa ⊕ und ", einfüh- Addition in V ist hier die Addition in C und die Multiplikation
ren. Wir tun das nicht, da die Schreibweise dadurch kom- mit Skalaren ist die Multiplikation in C; Skalare stehen links,
pliziert wird, und halten uns immer vor Augen, dass es sich Vektoren rechts. Die Menge V = C ist mit der Addition +
um verschiedene Additionen bzw. Multiplikationen handelt: eine abelsche Gruppe, und C ist ein Körper. Die Axiome
2-Tupel werden addiert (Addition in R2 ), indem man ihre (V1)–(V3) sind das Distributiv- und das Assoziativgesetz in
Koordinaten addiert (Addition in R). Ein 2-Tupel wird mit C, diese sind natürlich erfüllt, und (V4) gilt ebenfalls in C.
einem λ ∈ R multipliziert (äußere Multiplikation), indem Also ist C ein C-Vektorraum.
man jede seiner Koordinaten mit diesem Skalar multipliziert Dieselbe Überlegung zeigt, dass jeder Körper über jedem
(Multiplikation in R). seiner Teilkörper ein Vektorraum ist, also ist R ein R- und
Ähnliche Additionen und Multiplikationen haben wir übri- Q-Vektorraum, C ein C-, R- und Q-Vektorraum.
gens bereits auf Seite 172 mit den Lösungen linearer Glei- Wir betrachten den Vektorraum Z32 über dem Körper Z2 mit
chungssysteme eingeführt. zwei Elementen 0 und 1. Die Elemente von Z32 können ex-
plizit angegeben werden:
Lemma
⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
Die abelsche Gruppe R2 bildet mit der wie eben erklärten ⎨ 0 1 0 0 1 0 1 1 ⎬
komponentenweisen Multiplikation · einen R-Vektorraum. Z32 = ⎝0⎠, ⎝0⎠, ⎝1⎠, ⎝0⎠, ⎝1⎠, ⎝1⎠, ⎝0⎠, ⎝1⎠ .
⎩ ⎭
0 0 0 1 0 1 1 1
Beweis: Die Vektorraumaxiome verifiziert
' ( man durch
' (Nach- Da man für jede Komponente eines Vektors v ∈ Z32 die zwei
v1 w1
rechnen. Wir wählen Elemente v = ,w = ∈ R2 Wahlmöglichkeiten 0 und 1 hat, gibt es genau 23 Elemente
v2 w2
und λ, μ ∈ R: in Z32 . 
192 6 Vektorräume – von Basen und Dimensionen

Hintergrund und Ausblick: „Fastvektorräume“


Es gibt Beispiele von Mengen mit Verknüpfungen, bei denen nur fast alle Vektorraumaxiome erfüllt sind. Wir führen vier
Beispiele an, bei denen jeweils eines der sogenannten Verträglichkeitsaxiome (V1), (V2), (V3), (V4) zwischen der skalaren
Multiplikation und der Addition nicht erfüllt ist. Man beachte, dass wir im Folgenden bei der üblichen Multiplikation · in R bzw.
C keinen Multiplikationspunkt setzen. Die Multiplikationspunkte sind für die definierten skalaren Multiplikationen reserviert.

(1) In K = C und V = C2 bezeichne + die komponen- Das gemischte Assoziativgesetz (V3) gilt hier nicht.
tenweise Addition; als skalare
' Multiplikation
( definie- Z. B. ist
v1
ren wir für λ ∈ C und v = ∈ V:
v2 (i2 ) · v = (−1) · v = Re (−1) v = −v ,
⎧ 

⎪ λ v aber
' ( ⎪
1

⎨ , falls v2  = 0,
v1 λ v2 i · (i · v) = Re (i) Re (i) v = 0 ,
λ· =  
v2 ⎪
⎪ λ v1

⎩ 0 , falls v2 = 0.

d. h. (i2 ) · v = i · (i · v), sofern v = 0. Die anderen
Vektorraumaxiome sind erfüllt. Exemplarisch zeigen
' ( ' (
1 1 wir, dass (V2) erfüllt ist. Für alle λ, μ ∈ C und v ∈ V
Wir wählen λ = i ∈ C, v = ,w= ∈V
1 −1 gilt:
und rechnen nach,
'' ( ' (( ' ( ' ( (λ + μ) · v = Re (λ + μ) · v = (Re λ + Re μ) v
1 1 2 −2 i
λ·(v +w) = i· + = i· = = Re λ v + Re μ v = λ · v + μ · v .
1 −1 0 0

sowie (4) In K = R und V = R2 bezeichne + die komponen-


' ( ' ( '( ' ( ' ( tenweise Addition; als skalare
' Multiplikation
( definie-
1 1 i i 2i v1
λ·v+λ·w = i· +i· = + = . ren wir für λ ∈ R und v = ∈V
1 −1 i −i 0 v2
Also ist das Vektorraumaxiom (V1) verletzt. ' ( ' (
v1 λ v1
Es gelten jedoch alle anderen Vektorraumaxiome. λ· = .
v2 0
Exemplarisch
' ( weisen wir (V4) nach: Für alle v =
v1
∈ V gilt: Für λ = 1, v2 = 0 ergibt sich
v2
' ( ' ( ' ( ' ( ' (
v 1 v1 v1 v v
1·v =1· 1 = = v. 1· = 1 = 1 ,
v2 1 v2 v2 0 v2

(2) In K = R und V = R bezeichne + die übliche Ad- also gilt hier das Axiom (V4) nicht. Alle anderen
dition komplexer Zahlen; als skalare Multiplikation Axiome gelten. Exemplarisch
' ( weisen'wir ((V1) nach.
definieren wir für λ ∈ R und v ∈ V v w1
Für alle λ ∈ R und v = 1 , w = ∈ V gilt:
v2 w2
λ · v = λ2 v .
' ( ' ( ' (
λ (v1 + w1 ) λ v1 λ w1
Das Axiom (V2) (λ + μ) · v = λ · v + μ · v ist verletzt. λ · (v + w) = = +
0 0 0
Z. B. ist
= λ·v +λ·w.
(1 + 1) · v = 2 · v = 4 v  = 2 v = v + v = 1 · v + 1 · v ,

sofern v = 0. Es sind jedoch alle anderen Vektor- Kommentar: Wir haben für jedes der vier Vektorraum-
raumaxiome erfüllt. Exemplarisch zeigen wir, dass axiome eine algebraische Struktur angegeben, in der die-
(V3) erfüllt ist: Für alle λ, μ ∈ R und v ∈ V gilt: ses Axiom verletzt und alle anderen Vektorraumaxiome
erfüllt sind. Demnach folgt keines der vier Axiome der
(λ μ) · v = (λ μ)2 · v = λ2 (μ2 · v) = λ · (μ · v) .
Skalarmultiplikation aus den übrigen Axiomen. Man sagt:
(3) In K = C und V = C bezeichne + die übliche Ad- „Die Axiome der Skalarmultiplikation sind voneinander
dition komplexer Zahlen; als skalare Multiplikation unabhängig“. Dies ist nicht so bei der Kommutativität der
definieren wir für λ ∈ C und v ∈ V Addition. Die Kommutativität der Addition folgt tatsäch-
lich aus den anderen Vektorraumaxiomen. Wir stellen die-
λ · v = (Re λ) v . sen Nachweis als Übungsaufgabe 6.16.
6.2 Beispiele von Vektorräumen 193

Kommentar: Wir lassen von nun an den Punkt · für die über einem Körper K, die Polynome über einem Körper K
Multiplikation mit Skalaren weg, wir schreiben also kurz λ v und die Abbildungen von einer Menge in einen Körper K.
anstelle von λ · v.
Diesen drei Klassen von Beispielen werden wir in den weite-
ren Kapiteln immer wieder begegnen. Oft wird der jeweilige
Vektoren gehorchen Rechenregeln, die man Grundkörper K der Körper der reellen Zahlen sein. Wir erhal-
von Zahlen her kennt ten aber eine Vielfalt von Beispielen, wenn wir nur K anstelle
von R schreiben, K kann dann einfach jeder mögliche Körper
Vektoren, also Elemente von Vektorräumen, können ganz un- sein.
terschiedlicher Art sein. Es können Lösungen von linearen
Gleichungssystemen oder Polynome oder auch allgemeiner
Abbildungen oder auch Matrizen sein. Wir werden diese Bei- Matrizen über einem Körper bilden einen
spiele im Abschnitt 6.2 behandeln. Hier geben wir an, wel- Vektorraum
chen Regeln sie gehorchen – egal, ob es sich dabei um Lö-
sungen von Differenzialgleichungen oder um Punkte des R2 Auf Seite 175 zu den linearen Gleichungssystemen haben wir
handelt. bereits mit Matrizen gearbeitet. Wir wollen uns nun überle-
gen, ob die Menge aller Matrizen mit m Zeilen und n Spalten,
Rechenregeln für Vektoren deren Einträge einem Körper K angehören, mit geeignet defi-
In einem K-Vektorraum V gelten für alle v, w, x ∈ V nierten Verknüpfungen + und · einen K-Vektorraum bilden.
und λ ∈ K: Es seien m und n natürliche Zahlen. Eine m × n -Matrix A
(i) v + x = w ⇔ x = w − v über dem Körper K ist eine Abbildung
(ii) λ v = 0 ⇔ λ = 0 oder v = 0 
(iii) (−λ) v = −(λ v) {1, . . . , m} × {1, . . . , n} → K,
A:
(iv) −(v + w) = −v − w (i, j ) → aij .
Wir notieren eine solche Matrix A übersichtlich durch An-
Diese Regeln erscheinen einem ganz natürlich und selbst- gabe aller Bilder a11 , . . . , amn in der Form
verständlich. Das sollte nicht darüber hinwegtäuschen, dass ⎛ ⎞
diese Aussagen zu beweisen sind. a11 a12 · · · a1n
⎜ a21 a22 · · · a2n ⎟
⎜ ⎟
A=⎜ . .. . ⎟
Beweis: (i) gilt, da (V , +) eine Gruppe ist (Seite 66). ⎝ .. . · · · .. ⎠
(ii) Aus λ = 0 folgt 0 v = (0 + 0) v = 0 v + 0 v; folglich am1 am2 · · · amn
gilt 0 v = 0 nach (i). Und ist v = 0, so folgt analog aus
Wir werden eine Matrix A oft auch kurz mit (aij )m,n oder
λ 0 = λ (0 + 0) = λ 0 + λ 0 mit (i) λ 0 = 0.
– wenn m, n feststehen – mit (aij ) bezeichnen; hierbei ist
Gilt umgekehrt λ v = 0 und λ  = 0, so können wir die Glei- i der Zeilenindex und j der Spaltenindex. Die Körperele-
chung λ v = 0 mit dem Skalar λ−1 multiplizieren und erhal- mente aij ∈ K, i = 1, . . . , m, j = 1, . . . , n nennt man
ten nach dem ersten Teil dieses Beweises v = λ−1 0 = 0. die Komponenten oder die Einträge der Matrix A. Im Fall
Folglich gilt λ = 0 oder v = 0. K = R bzw. K = C bezeichnet man A auch als reelle Matrix
bzw. komplexe Matrix. Unter der Stelle (r, s) einer Matrix
(iii) Aufgrund des Vektorraumaxioms (V2) und (ii) gilt λ v +
A = (aij )m,n versteht man den Schnittpunkt der r-ten Zeile
(−λ) v = (λ + (−λ)) v = 0 v = 0. Folglich ist (−λ) v das
mit der s-ten Spalte im obigen Schema – hierbei sind r und
zu λ v entgegengesetzte Element, d. h. (−λ) v = −(λ v).
s natürliche Zahlen mit r ≤ m und s ≤ n.
(iv) Nach dem Vektorraumaxiom (V1) gilt mit λ = −1:
?
(−1) (v + w) = (−1) v + (−1) w . Wann sind zwei Matrizen gleich?

Nun wenden wir (iii) an, danach dürfen wir (−1) durch
ein einfaches Minuszeichen ersetzen. Es folgt die Behaup- Die Menge aller m × n-Matrizen über K bezeichnen wir mit
tung. 
Km×n , also
⎧⎛ ⎞ ⎫
⎨ a11 · · · a1n
⎪ ⎪

Wir werden diese Regeln im Folgenden oftmals ohne Hin- ⎜ . .. ⎟ | a ∈ K ∀ i, j .
Km×n = ⎝ .. . ⎠ ij
weis benutzen. ⎪
⎩ ⎪

am1 · · · amn
⎛ ⎞
6.2 Beispiele von Vektorräumen 0 ··· 0
⎜ .. ⎟ ∈ Km×n , deren Komponenten
Die Matrix 0 = ⎝ ... .⎠
Wir behandeln in diesem Abschnitt drei wichtige Klassen 0 ··· 0
von Beispielen für Vektorräume. Es sind dies die Matrizen alle 0 sind, heißt Nullmatrix.
194 6 Vektorräume – von Basen und Dimensionen

Wir führen nun in Km×n eine Addition + und eine Multipli- Neben A = (aij ) und B = (bij ) aus Km×n seien nun auch
kation · mit Skalaren komponentenweise ein durch: λ, μ ∈ K gegeben.
⎛ ⎞ ⎛ ⎞
a11 · · · a1n b11 · · · b1n (V1) λ (A + B) = λ ((aij ) + (bij )) = (λ (aij + bij )) =
⎜ .. .. ⎟ + ⎜ .. .. ⎟ (λ aij + λ bij ) = (λ aij ) + (λ bij ) = λ A + λ B.
⎝ . . ⎠ ⎝ . . ⎠
am1 · · · amn bm1 · · · bmn (V2) (λ+μ) A = ((λ+μ) aij ) = (λ aij +μ aij ) = (λ aij )+
⎛ ⎞ (μ aij ) = λ A + μ B.
a11 + b11 · · · a1n + b1n
⎜ .. .. ⎟ (V3) (λ μ) A = (λ μ aij ) = λ (μ aij ) = λ (μ A).
=⎝ . . ⎠
am1 + bm1 · · · amn + bmn (V4) 1 A = 1 (aij ) = (1 aij ) = (aij ) = A.

und Also bildet Km×n mit den angegebenen Verknüpfungen einen


⎛ ⎞ ⎛ ⎞ K-Vektorraum. 
a11 · · · a1n λ a11 · · · λ a1n
⎜ .. . ⎟ ⎜
.. ⎠ = ⎝ ... .. ⎟ .
λ·⎝ . . ⎠ Jeder andere Nachweis dafür, dass eine Menge V mit Ver-
am1 · · · amn λ am1 · · · λ amn knüpfungen + und · einen Vektorraum bildet, verläuft prin-
zipiell nach demselben Verfahren.
Mit der oben eingeführten Kurzschreibweise können wir das
auch notieren als Kommentar: Die Voraussetzung, dass K ein Körper ist,
(aij ) + (bij ) = (aij + bij ) und λ · (aij ) = (λ aij ) . benötigten wir nur für den Begriff „K-Vektorraum“ – wir ha-
ben Vektorräume nämlich nur über Körper erklärt. Aber Ma-
trizen kann man analog über Ringe (R, +, ·) mit 1 erklären.
Kommentar: Eigentlich müsste man auch hier neue Zei- Auch die obige Addition + von Matrizen und die Multipli-
chen für die Addition + und Multiplikation mit Skalaren · kation · mit Elementen aus R kann definiert werden – diese
einführen. Um aber die Rechnung nicht mit Symbolen zu Verknüpfungen + und · werden auf die entsprechenden Ver-
überladen und unübersichtlich zu gestalten, verwenden wir knüpfungen + und · des Rings R zurückgeführt. Gelten die
nur ein +-Zeichen, und das Multiplikationszeichen · für die Axiome eines Vektorraums für eine Gruppe V , wobei nur
Multiplikation mit Skalaren lassen wir, wie bereits verein- anstelle eines Körpers K ein Ring R mit 1 zugrunde liegt,
bart, weg. so spricht man von einem R-Modul V . Folglich ist für jeden
Ring R mit 1 die Menge R m×n aller m × n-Matrizen ein
Km×n ist ein K-Vektorraum R-Modul.
Die Menge Km×n aller m × n-Matrizen über K bil-
Matrizen können also durchaus auch Vektoren sein. Nun ist
det mit komponentenweiser Addition und Multiplikation
es nicht mehr verwunderlich, dass noch wesentlich abstrak-
mit Skalaren einen K-Vektorraum.
tere mathematische Objekte als Vektoren aufgefasst werden
können.
Beweis: Wir zeigen, dass Km×n mit der erklärten Addition
eine abelsche Gruppe ist. Gegeben sind A = (aij ), B = (bij ),
Polynome über einem Körper bilden einen
C = (cij ) ∈ Km×n .
Vektorraum
Die Verknüpfung + ist abgeschlossen: A+B = (aij )+(bij )
= (aij + bij ) ∈ Km×n . Polynome haben wir in Abschnitt 3.4 eingeführt. Ein Poly-
Die Verknüpfung + ist assoziativ: (A+B)+C = (aij +bij ) nom p über dem Körper K in der Unbestimmten X ist eine
+ (cij ) = (aij + bij + cij ) = (aij ) + (bij + cij ) = Summe
A + (B + C). p = a0 + a1 X + · · · + an X n ,

Die Nullmatrix ist ein neutrales Element: A + 0 = (aij + 0) dabei ist n ∈ N0 , und die Koeffizienten a0 , . . . , an liegen
= (aij ) = A. in K. Ist p nicht das Nullpolynom 0, so ist der Index n des
höchsten von null verschiedenen Koeffizienten an der Grad
Jede Matrix hat ein Inverses: Es ist (−aij ) ∈ Km×n , und es von p. Dem Nullpolynom ordnet man den Grad −∞ zu,
gilt (aij ) + (−aij ) = 0. dabei gilt −∞ < n für alle n ∈ N0 .
Die Verknüpfung + ist kommutativ: A + B = (aij + bij )
= (bij + aij ) = B + A. Beispiel Die Menge aller Polynome über Z2 vom Grad
kleiner oder gleich 2 bilden die acht Polynome
Damit ist bereits gezeigt, dass (Km×n , +) eine abelsche
Gruppe ist. Die erklärte Multiplikation mit Skalaren ist we- p0 = 0, p1 = 1,
gen λ (aij ) = (λ aij ) ∈ Km×n eine Abbildung von K × Km×n p2 = X, p3 = 1+X,
in Km×n . Es sind also nur noch die vier Vektorraumaxiome p4 = X2 , p5 = 1 + X2 ,
nachzuweisen. p6 = X + X2 , p7 = 1 + X + X2 . 
6.2 Beispiele von Vektorräumen 195

Die Menge aller Polynome über einem Körper K ist beliebige Menge M. Dann können wir für jeden Körper K
 n  die Menge KM aller Abbildungen f : M → K erklären:
!
i
K[X] = ai X | n ∈ N0 , a0 , . . . , an ∈ K . KM = {f | f : M → K ist eine Abbildung} .
i=0
Diese Menge bildet mit sinnvoll gewählter Addition und
Diese Menge bildet mit der koeffizientenweisen Addition Multiplikation mit Skalaren einen K-Vektorraum. Wir de-
eine abelsche Gruppe (siehe Seite 90). Die Möglichkeit, finieren für f, g ∈ KM und λ ∈ K:
Polynome auch miteinander zu multiplizieren, lassen wir 
M → K,
nun außer Acht und betrachten nur die Addition. f + g: und
x → f (x) + g(x)

Beispiel Mit den Bezeichnungen aus dem obigen Beispiel M → K,
λf :
gilt etwa x → λ f (x) .
p5 + p6 = 1 + X2 + X + X2 Die Summe f + g und das skalare Vielfache λ f liegen
wieder in KM . Die Summe ordnet jedem x ∈ M die Summe
= 1 + X + (1 + 1) X2
f (x) + g(x) der Bilder von x unter f und g zu. Und das
=1+X Bild von x unter λ f ist das λ-Fache des Bildes von x unter
= p3 f . Wir halten fest:
und
pi + p i = 0 für jedes i = 0, . . . , 7 .  Der Vektorraum aller Abbildungen von einer Menge
in einen Körper
Wir führen nun in naheliegender Weise auf der Menge K[X] Für jede Menge M und jeden Körper K ist die Menge KM
eine äußere Multiplikation von Polynomen mit Elementen aller Abbildungen von M in K mit den Verknüpfungen
aus K ein. + und · ein K-Vektorraum.
Wir multiplizieren ein Polynom p = ni=0 ai X i aus K[X]
mit einem Element λ aus K, indem wir alle Koeffizienten von Beweis: Die Addition ist offenbar assoziativ und kommu-
p mit λ multiplizieren: tativ. Das neutrale Element ist die Abbildung 0, die jedem
Element x ∈ M das Nullelement 0 ∈ K zuordnet, und das
!
n
λp = (λ ai ) Xi . dem Vektor f entgegengesetzte Element ist die Abbildung
i=0 −f : x → −f (x). Somit ist (KM , +) eine abelsche Gruppe.
Wegen λ f ∈ KM für jedes λ ∈ K und f ∈ KM ist die
Beispiel Für p = 2 X3 +X 2 −3 X, q = X3 + 21 X 2 +X+1 Multiplikation eine Abbildung von K × KM in KM . Da die
aus R[X] gilt: Vektorraumaxiome (V1)–(V4) offenbar gelten, ist KM ein
K-Vektorraum. 
p − (2 q) = −5 X − 2 . 

Der Beweis der folgenden Aussage verläuft analog zu dem Achtung: Man achte wieder auf die grundsätzlich ver-
Beweis für den Vektorraum der m × n-Matrizen. schiedenen Bedeutungen der Additionen, die wir mit ein und
demselben +-Zeichen versehen. Man unterscheide genau:
f + g bezeichnet die Addition in KM und f (x) + g(x) jene
K[X] ist ein K-Vektorraum
in K.
Die Menge K[X] aller Polynome über K mit koeffizien-
tenweiser Addition und obiger Multiplikation mit Ska-
laren bildet einen K-Vektorraum.
?
Was ist im Fall M = ∅ ?

Die Abbildungen von einer Menge in einen Beispiel Wir betrachten den Fall M = N0 . Im Kapitel 8
Körper bilden einen Vektorraum werden Folgen über C definiert, es sind dies die Abbildungen
von N0 nach C. Also bildet die Menge CN0 der (komplexen)
Bei einem Polynom p = a0 + a1 X + · · · + an X n ∈ K[X] Folgen einen komplexen Vektorraum. Etwas allgemeiner er-
kann man in die Unbestimmte X zum Beispiel Elemente aus halten wir:
K einsetzen. Dadurch erhält man eine Abbildung, nämlich
Die Menge aller Folgen über einem Körper K
die Polynomfunktion (siehe Seite 91):
 KN0 = {(an )n∈N0 | an ∈ K}
K → K
p̃ : .
x  → p(x) ist ein K-Vektorraum.
Die Abbildung p̃ ist ein Element aus KK ,
d. h. eine Abbil- Und der Sonderfall M = R und K = R führt uns zum reellen
dung von K in K.Wir betrachten nun etwas allgemeiner eine Vektorraum RR aller reellwertigen Funktionen. 
196 6 Vektorräume – von Basen und Dimensionen

x3
Sind K und M endlich, so ist die Menge KM aller Abbildun-
gen von M in K ebenfalls endlich. Wir betrachten ein Beispiel
eines solchen endlichen Vektorraums mit acht Elementen:

Beispiel Wir betrachten eine dreielementige Menge M =


{x, y, z} und den Körper K = Z2 = {0, 1} mit zwei Ele-
menten. Es ist dann die Menge KM aller Abbildungen von x1
M nach K eine Menge mit 23 = 8 Elementen. Wir geben die
Elemente von KM explizit an: x2
f1 : x → 0, y  → 0, z  → 0
f2 : x → 0, y  → 0, z  → 1
f3 : x → 0, y  → 1, z  → 1
f4 : x → 1, y  → 1, z  → 1 Abbildung 6.1 Der sich in alle Richtungen erstreckende Vektorraum R2 ,
aufgefasst als Untervektorraum des R3 .
f5 : x → 1, y  → 0, z  → 0
f6 : x → 1, y  → 1, z  → 0 x2
f7 : x → 1, y  → 0, z  → 1
v+w
f8 : x → 0, y  → 1, z  → 0
w
Der eindeutig bestimmte Nullvektor ist f1 , und jedes Element
ist zu sich selbst invers, da für jedes i ∈ {1, . . . , 8} jeweils
fi + fi = f1 gilt. Wir bestimmen weiter die Summe f2 + f3 :
v
Wegen
(f2 + f3 )(x) = f2 (x) + f3 (x) = 0 + 0 = 0 , x1

(f2 + f3 )(y) = f2 (y) + f3 (y) = 0 + 1 = 1 ,


(f2 + f3 )(z) = f2 (z) + f3 (z) = 1 + 1 = 0
gilt also f2 + f3 = f8 . 

Abbildung 6.2 Die begrenzte schattierte Fläche ist kein Untervektorraum des
R2 , da die Summe von v und w nicht in ihr enthalten ist. Das gilt für jede
6.3 Untervektorräume begrenzte Fläche im R2 .

Der Anschauungsraum, den wir auch als die Menge R3 aller


3-Tupel interpretieren können, bildet mit komponentenwei- Ist aber eine Teilmenge eines Vektorraums V doch wieder ein
ser Addition und Multiplikation mit Skalaren einen reellen Vektorraum mit der Addition und der skalaren Multiplikation
Vektorraum. Die Anschauungsebene kann mit dem R2 iden- von V , so spricht man von einem Untervektorraum.
tifiziert werden und ist ebenso ein reeller Vektorraum. Der R2
bildet zwar keine Teilmenge des R3 , er kann aber als dessen Definition eines Untervektorraums
x1 -x2 -Ebene aufgefasst werden, also als Eine nichtleere Teilmenge U eines K-Vektorraums V
⎧⎛ ⎞ ⎫ heißt Untervektorraum von V , wenn gilt:
⎨ v1 ⎬
U = ⎝ v2 ⎠ | v1 , v2 ∈ R (U1) u, w ∈ U ⇒ u + w ∈ U ,
⎩ ⎭ (U2) λ ∈ K, u ∈ U ⇒ λ u ∈ U .
0
(Abb. 6.1). Wir werden sagen: U ist ein Untervektorraum
Man merkt sich das in der Form: Die nichtleere Teilmenge U
des R3 .
von V ist dann ein Untervektorraum, wenn die Summe und
skalare Vielfache von Vektoren aus U wieder in U liegen; in
Untervektorräume sind Teilmengen diesem Zusammenhang ist auch die Sprechweise „die Menge
von Vektorräumen, die selbst wieder U ist gegenüber Addition und Multiplikation mit Skalaren
abgeschlossen“ üblich.
Vektorräume bilden
Ist U ein Untervektorraum eines K-Vektorraums V , so liegt
Beliebige Teilmengen von Vektorräumen bilden im Allge- nach (U2) für jedes u ∈ U auch das Inverse −u in U . Da U
meinen keine Vektorräume (Abb. 6.2). nichtleer ist, liegt wegen (U1) also der Nullvektor 0 = u − u
6.3 Untervektorräume 197

in U . Eine Teilmenge U eines K-Vektorraums V , die den Untervektorräume von Vektorräumen sind wieder Vektor-
Nullvektor 0 ∈ V nicht enthält, kann somit kein Untervek- räume. Mit diesem Ergebnis gelingt für zahlreiche Mengen
torraum von V sein. ein sehr einfacher Nachweis dafür, dass sie einen Vektorraum
bilden. Hat man nämlich eine Menge U , von der man nach-
Jeder Untervektorraum U eines K-Vektorraums V enthält
prüfen will, dass sie ein K-Vektorraum ist, so suche man nach
also zumindest den Nullvektor. Nach dem Untergruppen-
einem großen K-Vektorraum V , der die gegebene Menge U
kriterium von Seite 67 ist ein Untervektorraum U mit der
umfasst und verifiziere für die Teilmenge U von V die im
Addition von V eine Untergruppe von V und als solche
Allgemeinen leicht nachprüfbaren drei Bedingungen:
eine Gruppe. Wegen (U2) ist U bezüglich der Multiplikation
mit Skalaren aus K abgeschlossen. Die Vektorraumaxiome U = ∅,
(V1)–(V4) gelten für alle λ, μ ∈ K und u, v ∈ V . Insbe- v, w ∈ U ⇒ v + w ∈ U ,
sondere gelten diese Axiome auch für alle λ, μ ∈ K und λ ∈ K, u ∈ U ⇒ λ u ∈ U .
v, u ∈ U . Damit haben wir begründet:
Es ist dann U ein Untervektorraum von V und somit ein
K-Vektorraum. Es müssen also nicht alle Axiome eines K-
Lemma
Vektorraums nachgeprüft werden. Man muss hierbei aber auf
Ein Untervektorraum U eines K-Vektorraums V ist
eines aufpassen: Die Vektoraddition und die Multiplikation
wieder ein K-Vektorraum.
mit Skalaren in U muss dabei die Einschränkung der Addi-
Jeder Vektorraum V hat zwei Untervektorräume, nämlich V tion und Multiplikation in V sein.
selbst und die einelementige Menge {0}. Diese Untervek- Wir nutzen diesen kleinen Trick gleich an zwei Beispielen
torräume nennt man die trivialen Untervektorräume eines aus.
Vektorraums. Im Fall V  = {0} sind die trivialen Untervek-
torräume voneinander verschieden.
Lösungsmengen homogener linearer
Beispiel Wir überlegen uns, welche Untervektorräume der Gleichungssysteme und Polynome bis zu
R2 mit komponentenweiser Addition und Multiplikation mit
einem festen Grad bilden Vektorräume
Skalaren besitzt.
Neben den trivialen Untervektorräumen R2 und {0} ist für Wir greifen einige Begriffe aus dem Abschnitt 5.3 zu den
jeden Vektor v ∈ R2 die (nichtleere) Menge U = R v = linearen Gleichungssystemen wieder auf. Ein lineares Glei-
{λ v | λ ∈ R} ein Untervektorraum (Abb. 6.3). chungssystem über K in n Unbekannten und m Gleichungen
lässt sich schreiben als
x2
a11 x1 + a12 x2 + · · · + a1n xn = b1
a21 x1 + a22 x2 + · · · + a2n xn = b2
v .. .. .. ..
. . . .
am1 x1 + am2 x2 + · · · + amn xn = bm

x1 mit aij , bi ∈ K für 1 ≤ i ≤ m, 1 ≤ j ≤ n. Das System heißt


homogen, wenn b⎛ i =⎞ 0 für alle i gilt und sonst inhomogen.
v1
⎜ ⎟
Abbildung 6.3 Der Untervektorraum R v des R2 . Jede Lösung v = ⎝ ... ⎠ ist ein Element des K-Vektorraums
vn
Sind nämlich u, w ∈ U , so gibt es λu , λw ∈ R mit Kn , also ein Vektor.

u = λu v und w = λw v . Die Lösungsmenge L eines homogenen Gleichungssystems


ist nichtleer, da die triviale Lösung 0 ∈ Kn dazugehört. Auf
Folglich ist u + w = (λu + λw ) v ∈ R v = U . Ebenso gilt Seite 181 wird gezeigt, dass mit zwei Elementen u, w ∈ L
für jedes λ ∈ R: λ u = λ (λu v) = (λ λu ) v ∈ R v = U . auch die Summe u + w eine Lösung und ebenso λ u für alle
Tatsächlich besitzt der R2 neben den trivialen Untervektor- λ ∈ K eine Lösung ist. Damit ist bereits gezeigt:
räumen und den von v = 0 erzeugten Geraden R v keine wei-
teren Untervektorräume. Dies wird mit dem Begriff der Di- Lemma
mension auf Seite 209 klar. Ferner gilt für v 1 , v 2 ∈ R2 \ {0}: Die Lösungsmenge L eines homogenen linearen Gleichungs-
systems über K in n Unbekannten ist ein Untervektorraum
R v 1 = R v 2 ⇔ v 1 = λ v 2 für ein λ ∈ R .  von Kn .

? Achtung: Lösungsmengen L inhomogener Systeme über


Geben Sie Untervektorräume des R3 an. einem Körper K sind keine Untervektorräume, denn 0 ∈ L.
Diese Mengen bilden sogenannte affine Teilräume.
198 6 Vektorräume – von Basen und Dimensionen

Als weitere Klasse von Beispielen betrachten wir Untervek- vektorraum von V , und umgekehrt ist jeder Untervektorraum
torräume von K[X]. von V das Erzeugnis einer Teilmenge von V . Wir suchen
letztlich minimale Teilmengen von V , die den ganzen Vek-
Polynome vom Grad kleiner gleich n bilden einen torraum V erzeugen – dieser ist ja auch ein Untervektorraum
Vektorraum von V . Solche minimalen Erzeugendensysteme von V wer-
Für jede natürliche Zahl n sowie für n = 0 und n = −∞ den wir Basen nennen. Die Dimension eines Vektorraums ist
bildet die Menge die Anzahl der Elemente einer Basis.
 ! 
K[X]n = p = ai X i ∈ K[X] | deg(p) ≤ n Vektoren erzeugen durch Bildung von
i∈N0 Linearkombinationen Untervektorräume
aller Polynome mit einem Grad kleiner gleich n einen
Vektorraum. Wir betrachten eine nichtleere Teilmenge X von Vektoren
eines K-Vektorraums V – man beachte, dass X durchaus auch
unendlich sein kann. Für beliebige, endlich viele Vektoren
Beweis: Das Nullpolynom liegt wegen deg(0) = −∞ ≤ n v 1 , . . . , v n ∈ X und λ1 , . . . , λn ∈ K heißt
in K[X]n , sodass K[X]n für keines der zu betrachtenden n
!
n
leer ist. Für Polynome p = ri=0 ai X i und q = si=0 bi X i λi v i = λ1 v 1 + · · · + λn v n
max{r, s}
aus K[X]n , d. h. r, s ≤ n, ist auch p + q = i=0 i=1
(ai + bi ) Xi ∈ K[X]n . Und für jedes λ ∈ K ist auch
eine Linearkombination von X oder von v 1 , . . . , v n . Wir
λ p = ri=0 λ ai X i in K[X]n . 
nehmen stets v i = v j für i = j an.
Für die Menge aller möglichen Linearkombinationen von X
Auf Seite 210 erklären wir in einem ausführlichen Bei-
schreiben wir -X., d. h.
spiel einen weiteren, vielleicht etwas ungewöhnlichen Vek-
 n 
torraum. Diese vorgestellte Vielfalt von Vektorräumen zeigt, !
wie allgemein dieser Begriff eines Vektorraums ist. Um so -X. = λi v i | n ∈ N, λi ∈ K, v i ∈ X, i = 1, . . . , n ,
ungewöhnlicher ist es, dass man alle Vektorräume, die es gibt, i=1
allein durch Angabe des Grundkörpers K und einer zwei-
und sagen, -X. ist das Erzeugnis oder die Hülle von X oder
ten Größe, nämlich der Dimension, bis auf die Bezeichnung
-X. werde durch X erzeugt. Ist X = {v 1 , . . . , v n } eine end-
der Elemente charakterisieren kann. Wir werden dieses Er-
liche Menge, so schreiben wir einfacher
gebnis in dieser Allgemeinheit nicht herleiten können, aber
wenigstens den endlichdimensionalen Fall können wir im -v 1 , . . . , v r . anstelle von -{v 1 , . . . , v n }.
Kapitel 12 behandeln. Zunächst führen wir den Begriff der
Dimension ein. und erhalten für ein solches endliches X = {v 1 , . . . , v n }:

-X. = {λ1 v 1 + · · · + λn v n | λ1 , . . . , λn ∈ K}
Kommentar: Ein K-Vektorraum hat eine Vektoraddition
+ und eine Multiplikation · mit Skalaren. Bei vielen Vektor- = K v1 + · · · + K vn .
räumen kann man zusätzlich eine Multiplikation von Vek-
toren erklären, wobei das Ergebnis wieder ein Vektor ist. Achtung: Oftmals wird der Fehler gemacht, die Menge K
Beispiele sind etwa das bekannte Vektorprodukt × im Vek- in dieser letzten Darstellung auszuklammern. Aber beispiels-
torraum R3 oder die Multiplikation von Polynomen in K[X]. weise gilt
Falls nun in einem K-Vektorraum V eine solche Multiplika- ' ( ' ( '' ( ' (( ' (
1 0 1 0 1
tion " von Vektoren gegeben ist, mit der Eigenschaft, dass R +R = R + =R .
0 1 0 1 1
für alle λ ∈ K und v, w ∈ V die Verträglichkeitsgesetze
λ (v " w) = (λ v) " w = v " (λ w)
Kommentar: Für -X. ist auch die Bezeichnung spanX
gelten, so nennt man V eine K-Algebra. Der R3 mit dem
üblich. Anstelle von der von X erzeugten Menge spricht man
Vektorprodukt und K[X] mit der Multiplikation von Poly-
auch von der von X aufgespannten Menge.
nomen sind somit K-Algebren.

Beispiel <' (= ' (


1 1
6.4 Basis und Dimension Es ist =R die x1 -Achse im R2 (Abb. 6.4).
0 0
<' ( ' (= ' ( ' (
1 0 1 0
Die Menge , =R +R hingegen ist
Wir machen uns nun mit folgendem Sachverhalt vertraut: 0 1 0 1
Jede Teilmenge eines Vektorraums V erzeugt einen Unter- die ganze Ebene R2 (Abb. 6.5).
6.4 Basis und Dimension 199

Beispiel: Magische Quadrate I


Eine quadratische Anordnung von Zahlen mit der Eigenschaft, dass alle Zeilen-, Spalten- und Diagonalsummen denselben Wert
c annehmen, nennt man ein magisches Quadrat, die Zahl c nennt man die magische Zahl. Das älteste bekannte magische
Quadrat ist ein 3 × 3-Quadrat und stammt aus China. Angeblich wurde es um 2200 v. Chr. vom chinesischen Kaiser Yü am
Gelben Fluss auf dem Panzer einer Schildkröte entdeckt. Wir drücken es mit arabischen Zahlen aus:
4 9 2
3 5 7
8 1 6
Wir begründen hier, dass die magischen 3 × 3-Quadrate, aufgefasst als Matrizen, einen Vektorraum bilden. Mit Methoden des
nächsten Abschnitts werden wir dann zeigen, wie man zu einer vorgegebenen Zahl c alle möglichen magischen Quadrate mit
c als magischer Zahl konstruieren kann.

Problemanalyse und Strategie: Es ist zu zeigen, dass die Menge aller magischen Quadrate nichtleer ist. Sodann sind
(U1) und (U2) nachzuprüfen.
⎛ c c c ⎞
Lösung: 3 3 3
Für c ∈ R bezeichne Mc die Menge aller reellen 3 × 3- A=⎝ c
3
c
3
c
3

c c c
Matrizen ⎛ ⎞ 3 3 3
a11 a12 a13
A = ⎝ a21 a22 a23 ⎠ in Mc ; somit ist Mc also für kein c ∈ R die leere Menge.
a31 a32 a33 Doch folgt aus A, B ∈ Mc bei c = 0 stets A + B ∈ Mc .
mit der Eigenschaft, dass alle Zeilensummen, Spaltensum- Lediglich M0 ist ein Untervektorraum, da 0 ∈ M0 , und
men und Diagonalsummen von A gleich c sind. mit A, B ∈ M0 und λ ∈ R auch A + B, λ A ∈ M0 gilt.

Dann ist M = c∈R Mc die Menge aller magischen 3×3- Kommentar:
Quadrate. Nun zeigen wir, dass M ein Untervektorraum Analog kann man die hier gemachten Behauptungen
des reellen Vektorraums R3×3 ist. auch für magische n × n-Quadrate mit n ≥ 2 begrün-

Es ist M = c∈R Mc nichtleer, weil 0 ∈ M0 ⊆ M. Sind den.
A, B ∈ M, so gibt es c, c ∈ R mit A ∈ Mc und B ∈ Mc . Oftmals fordert man bei magischen n × n-Quadraten,
Dann ist A + B ∈ Mc+c ⊆ M. Und mit A ∈ Mc und dass alle Ziffern von 1 bis n2 als Einträge im Quadrat
λ ∈ R ist λ A ∈ Mλ c ⊂ M. Somit ist M ein Untervektor- vorkommen.
raum von R3×3 und damit ein reeller Vektorraum.
?
Wir erwähnen, dass Mc für c ∈ R im Allgemeinen kein Können Sie magische 2 × 2-Quadrate angeben?
Untervektorraum von M ist: Zwar liegt für jedes c ∈ R

x2 x2

       
- 01 , 01 . = R 01 + R 01
    1
- 01 . = R 01

e1 x1

1 x1

Abbildung 6.4 Die x1 -Achse wird von dem Vektor e1 erzeugt.

Für das Erzeugnis der Polynome p 1 = X2 + 1, p 2 =


Abbildung 6.5 Die Ebene R2 wird von den zwei Vektoren e1 und e2 erzeugt.
X + 1 ∈ Z2 [X] erhalten wir
-p 1 , p 2 . = Z2 (X2 + 1) + Z2 (X + 1)
Menge den trivialen Vektorraum erzeugt, -∅. = {0}. Damit
= {0, X2 + 1, X + 1, X 2 + X} ,
können wir zeigen, dass für jede Teilmenge X eines Vektor-
beachte X 2 + 1 + X + 1 = X2 + X in Z2 [X].  raums V das Erzeugnis von X, also -X., ein Untervektorraum
von V ist.
Wir haben das Erzeugnis nur für nichtleere Mengen erklärt.
Der Vollständigkeit halber vereinbaren wir, dass die leere
200 6 Vektorräume – von Basen und Dimensionen

-X. ist der kleinste Untervektorraum, der X umfasst So ist zum Beispiel der R-Vektorraum R2 endlich erzeugt, es
gilt nämlich: <' ( ' (=
Für jede Menge X eines K-Vektorraums V gilt:
1 0
(a) -X. ist ein Untervektorraum von V , R2 = , .
0 1
(b) X ⊆ -X.,
(c) -X. ist der Durchschnitt all derjenigen Untervektor- Wir verallgemeinern dies und kehren zu unseren ersten Bei-
räume von V , welche X umfassen. spielen von Vektorräumen zurück.

Beispiel Im K-Vektorraum Kn betrachten wir für i = 1,


Beweis: (a) Die Menge -X. ist nichtleer, da der Nullvektor . . . , n die Vektoren
stets in -X. liegt. Wir weisen die Eigenschaften (U1) und (U2) ⎛.⎞
.
aus der Definition auf Seite 196 für -X. nach. ⎜.⎟
⎜0⎟
⎜ ⎟
Zu (U1): Nehmen wir zwei Elemente aus -X., also zwei ei = ⎜ ⎟
⎜1⎟ ← i-te Zeile ,
Linearkombinationen v = ri=1 λi v i und w = si=1 μi wi ⎜0⎟
⎝ ⎠
von X, so ist die Summe ..
.
!
r !
s
die in der i-ten Zeile eine 1 und sonst nur Nullen als
v+w = λi v i + μi wi
Komponenten haben. Man nennt e1 , . . . , en die Standard-
i=1 i=1
Einheitsvektoren oder auch die Koordinaten-Einheits-
dieser beiden Linearkombinationen wieder eine Linearkom- vektoren des Kn .
bination von X. Für beliebige λ1 , . . . , λn ist
Zu (U2): Ist v = λ1 v 1 + · · · + λn v n ∈ -X. und λ ∈ K, so ⎛⎞
λ1
gilt λ v = (λ λ1 ) v 1 + · · · + (λ λn ) v n ∈ -X.. ⎜ ⎟
λ1 e1 + · · · + λn en = ⎝ ... ⎠ .
(b) Für jedes v ∈ X gilt v = 1 v ∈ -X., d. h. X ⊆ -X.. λn
(c) Ist U irgendein Untervektorraum von V , der X enthält, so ⎛ ⎞
λ1
ist, weil U die Eigenschaften (U1) und (U2) erfüllt, auch jede ⎜ ⎟
Folglich ist jeder Vektor ⎝ ... ⎠ ∈ Kn eine Linearkombina-
Linearkombination von X in U , somit haben wir -X. ⊆ U .
Da dies für jeden Untervektorraum U mit X ⊆ U gilt, erhal- λn
ten wir hieraus tion der Standard-Einheitsvektoren, d. h.:
 Kn = -e1 , . . . , en . .
-X. ⊆ U.
X⊆U Insbesondere ist der Kn endlich erzeugt. 
U Untervektorraum von V

Es folgt ein Beispiel eines nicht endlich erzeugbaren Vektor-


Mit (a) und (b) folgt die Inklusion ⊇, da -X. einer der Un-
raums.
tervektorräume ist, über die der Durchschnitt gebildet wird.
Damit ist die Gleichheit gezeigt: Beispiel Wir betrachten für einen beliebigen Körper K
 den Vektorraum K[X] der Polynome über K. Dieser Vektor-
-X. = U. raum hat das unendliche Erzeugendensystem {Xk | k ∈ N0 },
X⊆U
U Untervektorraum von V
dabei setzen wir X0 = 1. Wir begründen nun, dass dieser
Vektorraum nicht endlich erzeugbar ist.
Das begründet die Aussage in (c). 
Zuerst zeigen wir, dass die Menge M = {Xk | k ∈ N0 }
tatsächlich K[X] erzeugt. Ist p ein Polynom über K, so gibt
es eine Zahl n ∈ N0 und an , . . . , a1 , a0 ∈ K mit
?
Im obigen Satz steht, dass -X. der kleinste Untervektorraum p = an X n + · · · + a 1 X + a 0 .
ist, der die Menge X enthält. Wodurch ist diese Sprechweise
Daraus folgt, dass p eine Linearkombination von
kleinster Untervektorraum gerechtfertigt?
{X0 , X 1 , . . . , Xn } ⊆ M ist. Damit ist die erste Be-
hauptung gezeigt.
Ist X ⊆ V eine Menge von Vektoren von V mit der Eigen- Die zweite Behauptung begründen wir durch einen Wider-
schaft U = -X. für einen Untervektorraum U von V , d. h., ist spruchsbeweis. Angenommen, es besitzt K[X] ein endliches
jedes Element von U eine Linearkombination von X ⊆ U , Erzeugendensystem E ⊆ K[X]. Wir wählen in E ein Poly-
so sagt man X erzeugt U oder X ist ein Erzeugendensystem nom maximalen Grades m ∈ N0 . Das funktioniert, da die
von U . Besitzt U ein endliches Erzeugendensystem, so heißt Menge E zum einen nichtleer ist, zum anderen nur endlich
U endlich erzeugt. viele Elemente enthält. Es lässt sich jedoch nun das Polynom
6.4 Basis und Dimension 201

p = X m+1 nicht als Linearkombination von E darstellen, Definition der linearen Unabhängigkeit
da ja jedes Polynom aus E einen Grad kleiner oder gleich m
Verschiedene Vektoren v 1 , . . . , v r ∈ V heißen linear
hat. Und das ist ein Widerspruch. Somit kann es kein end-
unabhängig, wenn für jede echte Teilmenge T von
liches Erzeugendensystem für K[X] geben, d. h., K[X] ist
{v 1 , . . . , v r } gilt -T . -v 1 , . . . , v r ..
nicht endlich erzeugt. 
Eine Menge X ⊆ V heißt linear unabhängig, wenn je
? endlich viele verschiedene Elemente aus X linear unab-
Besitzt jeder Vektorraum ein Erzeugendensystem? hängig sind.
Eine nicht linear unabhängige Menge heißt linear ab-
hängig.
Gerade bei den Aufgaben trifft man oft auf die Frage, ob ein
gegebener Vektor v im Erzeugnis einer Teilmenge X eines
K-Vektorraums V liegt, d. h., ob v ∈ -X. gilt. Diese Frage- ?
stellung führt meistens auf das Lösen eines linearen Glei- Sind Teilmengen linear unabhängiger Mengen linear unab-
chungssystems. Wir behandeln diese Problematik für den hängig?
Fall von Spaltenvektoren in einem ausführlichen Beispiel auf
Seite 202.
Linear unabhängige Mengen sind also unverkürzbare Men-
Lineare Unabhängigkeit bedeutet: Mit gen; weniger Vektoren erzeugen auch weniger Raum.
weniger klappt es nicht! Hingegen enthält eine linear abhängige Menge einen Vek-
' ( ' ( tor, der in der Hülle der anderen Vektoren liegt und daher
2 1 weggelassen werden kann, ohne die Hülle zu verkleinern.
Im R2 seien die drei Vektoren u = ,v = und
' ( 0 2
−1
w= gegeben. Beispiel
2
Für jedes v ∈ V ist ∅ die einzige echte Teilmenge von {v}.
x2 Im Fall v = 0 gilt: Der Nullvektor 0 ist linear abhängig,
da ∅ {0} und -∅. = {0} = -0. gilt. Für v = 0 jedoch
w v gilt: -∅. -v., sodass v linear unabhängig ist.
2
Wir betrachten die drei Vektoren
' ( ' ( ' (
1 1 −3 1
v1 = , v2 = , v3 = ∈ R2 .
2 −1 −3
u
−1 1 2 x1 Die Menge {v 1 , v 2 , v 3 } ist linear abhängig. Aus v 3 =
−2 v 1 − v 2 folgt nämlich -v 1 , v 2 . = -v 1 , v 2 , v 3 ., und
−1 es gilt {v 1 , v 2 } {v 1 , v 2 , v 3 }.
Abbildung 6.6 Die drei Vektoren u, v, w im R2 .
Dafür ist die Menge {v 1 , v 2 } linear unabhängig, weil jede
Wir betrachten nun echte Teilmenge dieser Menge, also ∅ oder {v 1 } oder
{v 2 }, jeweils auch einen echt kleineren Vektorraum er-
U = -u, v, w. = R u + R v + R w . zeugt (Abb. 6.7).
Durch Lösen eines linearen Gleichungssystems (oder durch
Probieren) erhalten wir x2

u = v − w, v = u + w, w = −u + v .
v1
Wir können also jeden der drei Vektoren mithilfe der jeweils
anderen beiden linear kombinieren, d. h. darstellen, sodass
also
U = -u, v, w. = -u, v. = -u, w. = -v, w. x1

gilt. Ein Versuch, etwa das Erzeugendensystem {u, v} von U v2


noch weiter zu verkürzen, scheitert. Durch Weglassen eines
der Elemente u oder v kann der Vektorraum U nicht mehr
erzeugt werden, da u kein Vielfaches von v ist. Ebenso las- v3
sen sich die Erzeugendensysteme {u, w} und {v, w} von U
nicht weiter verkürzen. Wir werden sagen u, v, w sind linear Abbildung 6.7 Die Vektoren v 1 , v 2 , v 3 sind linear abhängig, die Vektoren
abhängig, und u, v sind linear unabhängig. v 1 , v 2 linear unabhängig. 
202 6 Vektorräume – von Basen und Dimensionen

Beispiel: Darstellung von Vektoren als Linearkombination


Im R-Vektorraum R4 ist die Teilmenge
⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫

⎪ 1 2 0 −1 ⎪
⎨⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎪ ⎬
1 −1
⎟ , ⎜ ⎟ , ⎜ ⎟ , ⎜ 2 ⎟ ⊆ R4
1
X := ⎜
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠

⎪ −1 0 2 −1 ⎪⎪
⎩ ⎭
−2 3 7 1
⎛⎞ ⎛

6 1
⎜−4⎟ ⎜3⎟
gegeben. Man entscheide für (1) v=⎜ ⎟
⎝ 2 ⎠∈R
4 und (2) v=⎜ ⎟
⎝−1⎠ ∈ R , ob v ∈ -X..
4

−2 2
Falls dies so ist, gebe man eine Darstellung von v als Linearkombination von X an.

Problemanalyse und Strategie: Die Bedingung v ∈ -X. besagt: Es gibt λ1 , . . . , λ4 ∈ R mit

(∗) λ1 v 1 + · · · + λ4 v 4 = v ,

wobei wir kurzerhand die vier Vektoren aus X (der Reihe nach) mit v 1 , . . . , v 4 bezeichnen. Wir fassen λ1 , . . . , λ4 als
Unbekannte auf und überprüfen das (dann reelle) lineare Gleichungssystem (∗) für die beiden Fälle (1) und (2) auf
Lösbarkeit. Die Lösbarkeit von (∗) bedeutet, dass v als Linearkombination von X darstellbar ist. Den Vektor v als
Linearkombination von X darzustellen, bedeutet dabei, eine Lösung (λ1 , . . . , λ4 ) anzugeben.

Lösung: das durch die erweiterte Koeffizientenmatrix


Zu prüfen ist die Lösbarkeit des Gleichungssystems, ge- ⎛ ⎞
geben durch die erweiterte Koeffizientenmatrix (A | v), 1 2 0 −1 6
⎜ 0 1 1 −3 10 ⎟
wobei die Spalten der Matrix A die Vektoren v 1 , . . . , v 4 ⎜ ⎟
⎝ 0 0 0 1 −3 ⎠
bilden. Wir notieren diese beiden erweiterten Koeffizien-
tenmatrizen (für die beiden Fälle (1) und (2)) 0 0 0 0 0
⎛ ⎞
1 2 0 −1 6 1 gegebene lineare Gleichungssystem über R zu lösen. Das
⎜ 1 1 −1 2 −4 3 ⎟
⎜ ⎟ Eliminationsverfahren von Gauß und Jordan liefert
⎝ −1 0 2 −1 2 −1 ⎠
⎛ ⎞
−2 3 7 1 −2 2 1 0 −2 0 1
⎜0 1 1 0 1⎟
⎜ ⎟
Wir haben hier beide Systeme in einer Matrix zusam- ⎝ 0 0 0 1 −3 ⎠
mengefasst und lösen nun diese beiden Systeme zugleich. 0 0 0 0 0
Das Eliminationsverfahren von Gauß liefert nach einigen
Schritten ⎛ ⎞ Eine Lösung dieses linearen Gleichungssystems ist
1 2 0 −1 6 1 (1, 1, 0, −3), und in der Tat ist
⎜ 0 1 1 −3 10 −2 ⎟
⎜ ⎟ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
⎝ 0 0 0 1 −3 1 ⎠
6 1 2 −1
0 0 0 0 0 1 ⎜−4⎟ ⎜1⎟ ⎜1⎟ ⎜2⎟
v=⎜ ⎟
⎝ 2 ⎠=1
⎜ ⎟+1
⎝−1⎠
⎜ ⎟−3
⎝0⎠
⎜ ⎟
⎝−1⎠
Im Fall (1) erhalten wir rg(A | v) = 3 = rg A, also
die Lösbarkeit des Systems. Im Fall (2) hingegen gilt −2 −2 3 1
rg(A | v) = 4 > rg A, in diesem Fall ist das System un-
lösbar. Für die Vektoren bedeutet dies eine Darstellung von v als Linearkombination von X.
⎛ ⎞ ⎛ ⎞
6 1
⎜−4⎟ ⎜3⎟ Kommentar: Diese Darstellung ist nicht eindeutig. Für
⎜ ⎟ ∈ -X. aber ⎜ ⎟ ∈ -X. .
⎝2⎠ ⎝−1⎠ jede andere Lösung des Systems erhält man eine andere
−2 2 Darstellung. Die Menge aller Lösungen des Systems ist
⎛ ⎞ ⎧⎛ ⎞ ⎫
6 ⎪
⎪ 1+2t ⎪

⎨⎜ ⎬
⎜−4⎟ ⎜ 1−t ⎟⎟
Um ⎜ ⎟
⎝ 2 ⎠ als Linearkombination von X darzustellen, ist
L= ⎝ | t ∈ R .

⎪ t ⎠ ⎪

⎩ ⎭
−2 −3
6.4 Basis und Dimension 203

⎛ ⎞ ⎛ ⎞ ⎛ ⎞
Da die Definition der linearen Unabhängigkeit etwas unhand- 0 0 0
lich ist, wenn man die lineare Unabhängigkeit einer gege- Es sind v 1 = ⎝1⎠ , v 2 = ⎝1⎠ , v 3 = ⎝0⎠ ∈ R3 linear
benen Menge von Vektoren nachweisen will, wäre es sehr 0 1 1
nützlich, wenn wir ein leicht nachprüfbares Kriterium für abhängig, denn
die lineare Unabhängigkeit zur Hand hätten. Und ein solches (−1) v 1 + 1 v 2 + (−1) v 3 = 0 .
gibt es auch, wir leiten es nun her.

Es folgt ein Beispiel einer unendlichen linear unabhän-


Die Vektoren v 1 , . . . , v r sind genau dann gigen Menge. Im Vektorraum der Polynome über einem
linear unabhängig, wenn sich der Nullvektor Körper K ist die Menge B = {Xk | k ∈ N0 } linear unab-
hängig.
nur trivial linear kombinieren lässt
Nachzuweisen ist, dass je endlich viele verschiedene Vek-
Verschiedene Vektoren v 1 , . . . , v r sind genau dann linear toren aus B linear unabhängig sind. Wir wählen also end-
abhängig, wenn sich einer der Vektoren, also etwa v j für ein lich viele verschiedene Elemente X i1 , . . . , Xin aus B. Wir
j ∈ {1, . . . , r} als Linearkombination der anderen Vektoren machen den Ansatz entsprechend dem Kriterium – man
{v 1 , . . . , v r } \ {v j } darstellen lässt, d. h., beachte, dass der Nullvektor rechts vom Gleichheitszei-
chen das Nullpolynom ist: Aus
!
r
λ1 X i1 + · · · + λn X in = 0
λi v i = v j für λi ∈ K .
i=1
i=j
folgt
λ1 = · · · = λn = 0 ,
Wir bringen v j auf die linke Seite des Gleichheitszeichens da zwei Polynome genau dann gleich sind, wenn ihre Ko-
und erhalten eine Linearkombination von v 1 , . . . , v r , die den effizienten zu den entsprechenden Potenzen gleich sind,
Nullvektor ergibt, ohne dass alle Koeffizienten, also die Ska- und das Nullpolynom hat zu allen Potenzen die Koeffizi-
lare, gleich null sind, denn der Koeffizient von v j ist −1. enten 0 (Seiten 89 und 90).
Anders formuliert erhalten wir das folgende Kriterium, das Im R-Vektorraum RR aller reellen Funktionen sind die
häufig auf das Lösen eines homogenen linearen Gleichungs- Funktionen f und g mit f (x) = 2x 2x−1 und g(x) = x 2 −1
systems hinausläuft. +1
linear unabhängig. Sind nämlich λ1 , λ2 ∈ R, so folgt aus
λ1 f + λ2 g = 0 ,
Kriterium für lineare Unabhängigkeit
Die verschiedenen Vektoren v 1 , . . . , v r ∈ V sind genau wobei der Nullvektor hier die Nullabbildung ist,
dann linear unabhängig, wenn gilt: 2x −1
r λ1 + λ2 (x 2 − 1) = 0(x) = 0 ∀ x ∈ R . (6.1)
x2 + 1
Aus λi v i = 0 folgt λ1 = λ2 = · · · = λr = 0 .
i=1 Diese Gleichung gilt also insbesondere für x = 1, d. h.,
1
Mit diesem Kriterium erhalten wir nun leicht, dass {0} linear λ1 + λ2 0 = 0 .
2
abhängig ist, weil 1 = 0 und 1 · 0 = 0 gilt. Oder für v ∈ Es folgt λ1 = 0. Mit λ1 = 0 wird aus der Gleichung (6.1)
V \ {0} ist {v} linear unabhängig, da aus λ v = 0 sofort λ = 0 die Gleichung
folgt.
λ2 (x 2 − 1) = 0 für alle x ∈ R . (6.2)
Beispiel Diese Gleichung gilt insbesondere für z. B. x = 0, d. h.,
Zwei vom Nullvektor verschiedene Vektoren v und w
eines K-Vektorraums sind genau dann linear abhängig, λ2 (−1) = 0 .
wenn es ein λ ∈ K mit v = λ w gibt. Nun folgt λ2 = 0. Gezeigt ist: Für λ1 , λ2 ∈ R gilt:
Die Standard-Einheitsvektoren e1 , . . . , en ∈ Kn sind li-
near unabhängig. Aus Aus λ1 f + λ2 g = 0 folgt λ1 = 0 = λ2 .
⎛ ⎞
0 Somit sind f und g linear unabhängig.
⎜ ⎟ Auf λ2 = 0 hätten wir auch schneller schließen können.
λ1 e1 + · · · + λn en = 0 = ⎝ ... ⎠
Die Gleichung (6.2) lautet λ2 g = 0. Und da g nicht der
0 Nullvektor in RR ist, folgt λ2 = 0.
folgt Die Matrizen ( 2 1 ), ( 1 1 ), ( 2 4 ) ∈ Z2×2
5 sind wegen
01 12 10
⎛ ⎞ ⎛ ⎞ ' ( ' ( ' ( ' (
λ1 0 2 1 1 1 2 4 0 0
⎜ .. ⎟ ⎜ .. ⎟ 1 +2 +3 = =0
⎝ . ⎠ = ⎝ . ⎠ , d. h. λi = 0 für i = 1, . . . , n . 0 1 1 2 1 0 0 0
λn 0 linear abhängig. 
204 6 Vektorräume – von Basen und Dimensionen

Ein linear unabhängiges Erzeugendensystem Im Vektorraum K[X] der Polynome über einem Körper K
nennt man Basis bildet die Menge {X k | k ∈ N0 } eine Basis, die Standard-
basis oder kanonische Basis von K[X].
⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
Wir reduzieren Vektorräume auf Basen, weil wir Vektor- ⎨ 0 0 0 ⎬
räume möglichst ökonomisch schreiben wollen – kennt man Die Menge ⎝1⎠ , ⎝1⎠ , ⎝0⎠ ist keine Basis des R3 ,
⎩ ⎭
die Basis, dann kennt man den Vektorraum. 0 1 1
' ( da sie linear abhängig ist.
v ⎧⎛ ⎞ ⎛ ⎞⎫
Jeder Vektor 1 des R2 lässt sich als Linearkombination
v2 ' ( ' ( ⎨ 0 0 ⎬
der beiden Vektoren v =
2
und w =
1 Die Menge B = ⎝1⎠ , ⎝1⎠ ist eine Basis von -B.,
0 2
darstellen, da ⎩ ⎭
0 1
das lineare Gleichungssystem aber nicht des R3 .
' ( Für einen Körper K und Zahlen r ∈ {1, . . . , m} und
2 1 v1
0 2 v2 s ∈ {1, . . . , n} definieren wir die m · n sogenannten
Standard-Einheitsmatrizen aus Km×n ,
für alle v1 , v2 ∈ R (eindeutig) lösbar ist.
Ers = (aij ) mit ars = 1 und aij = 0 sonst.
Zudem sind v und w linear unabhängig, da das lineare Glei-
chungssystem Dann ist die Menge
' (
2 1 0
B = {Ers | r ∈ {1, . . . , m}, s ∈ {1, . . . , n}}
0 2 0
nur die triviale Lösung (0, 0) hat. eine Basis des Km×n , da für eine beliebige Matrix A =
(aij )i,j ∈ Km×n gilt:
Es ist also {v, w} ein linear unabhängiges Erzeugenden-
system des R2 . !
m !
n
A = (aij )i,j = λij Eij ,
i=1 j =1
Definition einer Basis
Eine Teilmenge B eines K-Vektorraums V heißt Basis sodass B ein Erzeugendensystem von Km×n ist. Zudem
von V , wenn gilt: folgt aus
-B. = V , ⎛ ⎞
λ11 · · · λ1n
B ist linear unabhängig. !!
m n
⎜ .. ⎟ = 0
λij Eij = ⎝ ... . ⎠
i=1 j =1 λm1 · · · λmn
Basen sind somit linear unabhängige Erzeugendensysteme
(siehe Abb. 6.8).
sofort λij = 0 für alle i und j , und damit, dass B linear un-
abhängig ist. Also ist B tatsächlich eine Basis von Km×n .
Teilmengen von V Auch diese nennt man Standardbasis oder kanonische
Basis des Km×n . 

lin. unabh. Basen Erzeugenden- ?


Teilmengen von V systeme 1. Ist stets X eine Basis von -X.?
von V von V
2. Ist jede linear unabhängige Menge auch Basis eines
Vektorraums?

In dem Beispiel auf Seite 202 haben wir gezeigt, dass ein
Abbildung 6.8 Basen sind linear unabhängige Erzeugendensysteme.
Vektor v im Allgemeinen durch viele verschiedene Linear-
kombinationen einer Menge X gebildet werden kann. Ist aber
X eine Basis, so ist die Linearkombination eindeutig, das be-
? sagt der Satz:
Kann es sein, dass ein Vektorraum genau eine Basis besitzt?

Eindeutige Darstellbarkeit von Vektoren durch Basen


Beispiel Ist B eine Basis eines K-Vektorraums V , so lässt sich
Für jeden Körper K bildet die Menge jedes v ∈ V auf genau eine Art und Weise in der Form

En = {e1 , . . . , en } v = λ 1 b 1 + · · · + λn b n
der Standard-Einheitsvektoren eine Basis des Kn , die so- mit λ1 , . . . , λn ∈ K und b1 , . . . , bn ∈ B darstellen.
genannte Standardbasis oder kanonische Basis des Kn .
6.4 Basis und Dimension 205

Beweis: Weil eine Basis B von V insbesondere ein Er- ein Erzeugendensystem von V ist, aber jede echte Teil-
zeugendensystem von V ist, existieren zu jedem v ∈ V Vek- menge von B den Vektorraum V nicht mehr erzeugt,
toren b1 , . . . , br ∈ B und von null verschiedene λ1 , . . . , λr
so ist B bereits eine Basis, das besagt der folgende Satz. Bevor
∈ K \ {0} mit
wir den Satz formulieren, wiederholen wir eine Sprechweise
v = λ1 b1 + · · · + λr br . (6.3) aus Kapitel 2: Die Potenzmenge

Es sei P (V ) = {X | X ⊆ V } ,
v = λ1 b1 + · · · + λs bs (6.4)
das ist die Menge aller Teilmengen von V , ist nach den
eine weitere Linearkombination mit b1 , . . . , bs ∈ B und Beispielen auf Seite 51 mit der Inklusion ⊆ eine geordnete
λ1 , . . . , λs ∈ K \ {0}. Menge. Das gilt analog für jede Teilmenge M ⊆ P (V ), d. h.
Angenommen, es gibt ein j ∈ {1, . . . , s} mit bj  = bi für alle für jede Menge M von Teilmengen von V . Ein Element B
i ∈ {1, . . . , r}. Dann gilt für die Differenz der Gleichungen von M ist bezüglich der Ordnung ⊆ ein
in (6.3) und (6.4): maximales Element, falls es in M kein Element C gibt mit
C  B, und ein
!
r !
s
0= λi bi − λi bi minimales Element, falls es in M kein Element C gibt mit
i=1 i=1 C B.
!
r !
s
Man vergleiche hierzu die Ausführungen auf Seite 51. Mit-
= λi bi − λi bi − λj bj .
hilfe dieser Begriffe können wir nun die oben angedeuteten
i=1 i=1
i=j Kennzeichnungen von Basen knapp formulieren.

Das ist ein Widerspruch zur linearen Unabhängigkeit von


B. Somit gilt also r = s und nach evtl. Umnummerieren Kennzeichnungen von Basen
bi = bi für alle i ∈ {1, . . . , r}. Setzt man dies in (6.4) ein Für eine Teilmenge B eines K-Vektorraums V sind äqui-
und betrachtet erneut die Differenz der Gleichungen in (6.3) valent:
und (6.4), so erhält man (i) B ist eine Basis von V .
(ii) B ist eine maximale linear unabhängige Teilmenge
!
r !
r !
r
von V , d. h. B ist linear unabhängig und für jedes
0= λi bi − λi bi = (λi − λi ) bi .
v ∈ V \ B ist B ∪ {v} linear abhängig.
i=1 i=1 i=1
(iii) B ist ein minimales Erzeugendensystem von V ,
Nun folgt aus der linearen Unabhängigkeit der Vektoren d. h. B erzeugt V , und für jedes v ∈ B gilt B \ {v}
b1 , . . . , br sogleich λi − λi = 0, d. h., λi = λi für alle erzeugt V nicht.
i = 1, . . . , r. Das zeigt die Eindeutigkeit der Darstellung
bezüglich der Basis B. 

Beweis: (i) ⇒ (ii): Es sei B eine Basis von V . Dann ist B


linear unabhängig. Wir wählen ein v ∈ V \ B. Da V = -B.
? gilt, ist v eine Linearkombination von B. Somit existieren
Gilt auch die Umkehrung dieses Satzes? D. h., folgt aus der
v 1 , . . . , v n ∈ B und λ1 , . . . , λn ∈ K mit
eindeutigen Darstellbarkeit jedes Vektors v ∈ V als Linear-
kombination von B, dass B eine Basis von V ist? !
n
v= λi v i .
i=1

Basen sind maximale linear unabhängige Durch Umstellen erhalten wir hieraus
Mengen und minimale Erzeugendensysteme !
n
λi v i + (−1) v = 0 .
Will man zeigen, dass eine Teilmenge B eines K-Vektor- i=1
raums V eine Basis ist, so ist zu begründen, dass B ein linear
Dies besagt aber, dass v 1 , . . . , v n , v linear abhängig sind.
unabhängiges Erzeugendensystem ist.
Somit ist auch B ∪ {v} linear abhängig.
Unter gewissen Voraussetzungen reicht es aus, eine dieser
(ii) ⇒ (iii): Es sei B eine maximale linear unabhängige Teil-
beiden Eigenschaften nachzuweisen. Kann man nämlich be-
menge von V .
gründen, dass eine Teilmenge B
1. B ist ein Erzeugendensystem von V , d. h. V = -B.: Dazu
linear unabhängig ist, aber jede andere, B echt umfassende
ist nur V ⊆ -B. zu zeigen. Wir wählen ein v ∈ V beliebig.
Teilmenge von V linear abhängig ist
Im Fall v ∈ B erhalten wir wie gewünscht v ∈ -B.. Daher
oder nehmen wir nun an v ∈ B. Nach Voraussetzung ist dann
206 6 Vektorräume – von Basen und Dimensionen

B ∪ {v} linear abhängig. Somit gibt es v 1 , . . . , v n ∈ B und und zum anderen es keine kleinere Teilmenge von V gibt, die
λ, λ1 , . . . , λn ∈ K, die nicht alle gleich null sind, mit dies möglich macht, da B ein minimales Erzeugendensystem
ist.
!
n
λv + λi v i = 0 . Daher wäre es sehr wünschenswert, wenn jeder Vektorraum
i=1 auch eine Basis enthalten würde. Dass dem wirklich so ist,
Da die Vektoren v 1 , . . . , v n linear unabhängig sind, muss folgern wir aus dem folgenden allgemeinen Satz.
λ = 0 gelten. Nun stellen wir um:
Basisergänzungssatz
!
n
v=− (λ−1 λi )v i ∈ -B. . Es sei V ein K-Vektorraum. Weiter seien S ⊆ V ein
i=1 Erzeugendensystem und A ⊆ S eine linear unabhängige
Teilmenge,
Da dies für alle v ∈ V gilt, folgt V = -B..
A⊆S⊆V.
2. B ist ein minimales Erzeugendensystem von V : Wir wäh-
Dann gibt es eine Basis B von V mit A ⊆ B ⊆ S.
len ein v ∈ B und zeigen, dass -B \ {v}. kein Erzeugen-
densystem von V ist. Dazu zeigen wir, dass bereits der Vek- Man sagt: „Die linear unabhängige Menge A wird durch
tor v ∈ V nicht in -B \ {v}. liegt. Angenommen, es gilt Elemente des Erzeugendensystems S zu einer Basis B
v ∈ -B \ {v}.. Dann existieren v 1 , . . . , v n ∈ B \ {v} und von V ergänzt.“
λ1 , . . . , λn ∈ K mit
!
n
Beweis: Wir zeigen die Behauptung mit dem Zorn’schen
v= λi v i .
Lemma (Seite 52).
i=1
Dazu betrachten wir die Menge
Durch Umstellen erhalten wir hieraus
!
n M = {X | X ist linear unabhängig und A ⊆ X ⊆ S} ,
λi v i + (−1) v = 0 .
i=1 die bezüglich der Inklusion geordnet ist. Wir zeigen, dass
Da bei dieser Linearkombination des Nullvektors nicht alle (M, ⊆) eine nichtleere, induktiv geordnete Menge ist. Das
Koeffizienten null sind, sind die Vektoren v, v 1 , . . . , v n Zorn’sche Lemma garantiert in diesem Fall die Existenz eines
linear abhängig. Das ist aber ein Widerspruch zur linearen maximalen Elements.
Unabhängigkeit der Menge B. Dieser Widerspruch belegt, Da die linear unabhängige Menge A natürlich A ⊆ A erfüllt,
dass v ∈ -B \ {v}. liegt. Somit ist B ein minimales Erzeu- gilt A ∈ M, sodass M nichtleer ist. Es sei C ⊆ M eine
gendensystem von V . nichtleere linear geordnete Teilmenge von M. Wir betrachten
(iii) ⇒ (i): Es sei B ein minimales Erzeugendensystem. Dann die Vereinigung der Elemente aus C:
ist B insbesondere ein Erzeugendensystem. Da B per Defi- 
nition linear unabhängig ist (siehe Seite 201), folgt die Be- Y = X. (6.5)
X∈C
hauptung. 

Offenbar ist Y eine obere Schranke von C. Es bleibt zu zeigen,


Beispiel dass Y ∈ M gilt. Da C nichtleer ist, gilt A ⊆ Y ⊆ S. Die
Die Menge B = {X k | k ∈ N0 } ist eine maximale linear Menge Y ist linear unabhängig. Es seien v 1 , . . . , v n ∈ Y
unabhängige Teilmenge von K[X], da für jedes p = a0 + gewählt. Weil Y Vereinigung von Teilmengen X ∈ C ist
a1 X + · · · + an X n ∈ K[X] \ B gilt, dass (siehe Gleichung (6.5)), gibt es Teilmengen X1 , . . . , Xn ∈ C
mit v i ∈ Xi . Da die Menge C total geordnet ist, gibt es ein
{X0 , . . . , Xn , p} ⊆ B ∪ {p} j ∈ {1, . . . , n} mit Xi ⊆ Xj für alle i = 1, . . . , n. Es liegen
damit alle v 1 , . . . , v n in diesem Xj . Da Xj linear unabhängig
linear abhängig ist.
ist, sind auch v 1 , . . . , v n ∈ Xj linear unabhängig. Folglich
Die Menge B = {Xk | k ∈ N0 } ist auch ein minimales
gilt Y ∈ M. Die Menge (M, ⊆) ist somit induktiv geordnet.
Erzeugendensystem von K[X], da für jedes k ∈ N0 gilt:
Nach dem Zorn’schen Lemma besitzt (M, ⊆) ein maxima-
Xk  ∈ -B \ {X k }. .  les Element B. Da diese Teilmenge B von V in M liegt, ist
B linear unabhängig. Um zu zeigen, dass B eine Basis ist,
reicht es aus zu begründen, dass B den Vektorraum V erzeugt,
Jeder Vektorraum besitzt eine Basis
-B. = V . Dies folgt aus S ⊆ -B..
Eine Basis eines Vektorraums V liefert insofern eine ideale Ohne Einschränkung nehmen wir v ∈ B an. Dann erhalten
Beschreibung von V , da mit ihrer Hilfe zum einen alle Ele- wir
mente des Vektorraums V darstellbar sind, d. h., V = -B., A ⊆ B B ∪ {v} ⊆ S .
6.4 Basis und Dimension 207

Die Menge B ∪ {v} ist wegen der Maximalität von B linear V , so ist für λ1 , . . . , λn ∈ K \ {0} auch B  = {λ1 v 1 , . . . ,
abhängig. Also existieren v 1 , . . . , v n ∈ B und λ, λ1 , . . . , λn λn v n } eine Basis. Aber es wichtig, dass die Elementzahl einer
∈ K, die nicht alle gleich null sind, mit Basis eindeutig bestimmt ist.
!
n
λv + λi v i = 0 .
Die Dimension ist die Mächtigkeit einer und
i=1
damit jeder Basis
Da die Menge B linear unabhängig ist, muss λ  = 0 gelten,
wir erhalten ' ( ' (
2 1
!n Im R2 gilt für die drei Vektoren u = ,v = und
v = −λ−1 λi v i . ' ( 0 2
−1
i=1 w=
2
Folglich gilt S ⊆ -B.. 

R2 = -u, v. = -u, w. = -v, w. ,


Wir betrachten nun für einen beliebigen Vektorraum V den
sodass {u, v}, {u, w}, {v, w} drei verschiedene Basen des
Sonderfall S = V und A = ∅. Es ist S = V ein Erzeu-
R2 sind. Es ist kein Zufall, dass jede dieser Basen genau
gendensystem von V und A = ∅ eine linear unabhängige
zwei Elemente enthält. Tatsächlich ist es so, dass in jedem
Teilmenge von V . Außerdem gilt natürlich A ⊆ S ⊆ V . Der
endlich erzeugten Vektorraum V jede Basis von V gleich
Basisergänzungssatz besagt nun, dass es in S = V eine Ba-
viele Elemente enthält. Dies ist keine Selbstverständlichkeit.
sis gibt. Damit haben wir gezeigt, dass jeder Vektorraum eine
Diese Aussage folgt aus dem folgenden Satz:
Basis besitzt. Wir können sogar mehr zeigen: Mit A = ∅ und
einem Erzeugendensystem S von V besagt der Basisergän-
zungssatz, dass jedes Erzeugendensystem eine Basis enthält. Austauschsatz von Steinitz
Und mit einer linear unabhängigen Menge A und dem Er- Ist S = {b1 , . . . , bs } ein endliches Erzeugendensystem
zeugendensystem S = V besagt der Basisergänzungssatz, des K-Vektorraums V , so gilt für jedes linear unabhän-
dass jede linear unabhängige Menge A zu einer Basis von V gige System A = {a1 , . . . , ar }:
ergänzt werden kann, wir halten das fest:
|A| = r ≤ s = |S| .
Existenz von Basen
Jeder Vektorraum V besitzt eine Basis. Beweis: Wir zeigen die Behauptung durch vollständige
Genauer: Induktion nach |S \ A|.
Jedes Erzeugendensystem von V enthält eine Basis
von V . Induktionsanfang: Falls |S \ A| = 0, so gilt A ⊆ S. Es folgt
Jede linear unabhängige Teilmenge von V kann durch |A| ≤ |S|.
Hinzunahme weiterer Vektoren zu einer Basis von V Induktionsvoraussetzung: Die Behauptung gelte für jedes Er-
ergänzt werden. zeugendensystem S und jede linear unabhängige Menge A
mit |S \ A| = n.
Beim obigen Beweis des Basisergänzungssatzes wurde das
Induktionsschritt: Es gelte |S \ A| = n + 1 für ein Erzeugen-
Zorn’sche Lemma benutzt. Will man das Zorn’sche Lemma
densystem S und eine linear unabhängige Menge A. Wegen
vermeiden, so bleibt einem nur die deutlich schwächere Aus-
A ⊆ S existiert ein v ∈ A \ S. Und da V = -S. gibt es
sage:
v 1 , . . . , v n ∈ S \ {0} und λ1 , . . . , λn ∈ K \ {0} mit

Existenz von Basen endlich erzeugter Vektorräume (∗) λ 1 v 1 + · · · + λn v n = v .


Jeder endlich erzeugte Vektorraum V besitzt eine Basis.
Angenommen, alle v 1 , . . . , v n sind in A. Dann erhalten wir
einen Widerspruch zur linearen Unabhängigkeit von A, da in
Beweis: Es sei B ⊆ S ein Erzeugendensystem mit mi- diesem Fall eine nichttriviale Linearkombination des Null-
nimaler Elementzahl. Ein solches existiert, da S endlich ist. vektors gegeben wäre,
Es ist B dann ein minimales Erzeugendensystem. Nach den λ 1 v 1 + · · · + λn v n − v = 0 .
Kennzeichnungen von Basen auf Seite 209 ist B somit eine
Basis.  Somit ist mindestens ein v i aus S \ A. Nach eventuellem
Umnummerieren können wir ohne Einschränkung v 1 ∈ S \A
Wir erörtern das Ergänzen und Verkürzen von Mengen zu annehmen. Aus der Gleichung (∗) folgt:
Basen in einem ausführlichen Beispiel auf Seite 212.  
!n
−1
Basen sind im Allgemeinen keineswegs eindeutig bestimmt. v 1 = λ1 v − λi v i ∈ -v, v 2 , . . . , v n . .
Ist etwa B = {v 1 , . . . , v n } eine Basis eines K-Vektorraums i=2
208 6 Vektorräume – von Basen und Dimensionen

Unter der Lupe: Der Basisergänzungssatz


Es sei V ein K-Vektorraum. Weiter seien S ⊆ V ein Erzeugendensystem und A ⊆ S eine linear unabhängige Teilmenge. Dann
gibt es eine Basis B von V mit A ⊆ B ⊆ S.

Da wir zeigen wollen, dass in V eine Basis B mit A ⊆ Wir betrachten die Vereinigung all dieser Teilmengen,
B ⊆ S existiert, haben wir nach der Kennzeichnung von 
Basen auf Seite 209 im Wesentlichen drei Möglichkeiten. (∗) Y = X,
Wir zeigen, dass es in V ein X∈C
linear unabhängiges Erzeugendensystem oder und begründen, dass Y eine obere Schranke von C ist und
eine maximale linear unabhängige Teilmenge oder Y ∈ M gilt. Die erste Behauptung ist klar: Es gilt offenbar
ein minimales Erzeugendensystem X ⊆ Y für alle X ∈ C. Nun zeigen wir, dass Y ∈ M gilt.
mit A ⊆ B ⊆ S gibt. Da wir in einem beliebigen Vek- Dazu ist zu begründen, dass zum einen A ⊆ Y ⊆ S und
torraum V keine Möglichkeit haben, Erzeugendensys- zum anderen Y linear unabhängig ist.
teme anzugeben, um sie auf lineare Unabhängigkeit oder (iii.a) Es gilt A ⊆ Y , da C nichtleer und A ⊆ X für jedes
Minimalität hin zu überprüfen, fallen die erste und die X ∈ C ist. Außerdem gilt Y ⊆ S, da Y eine Vereinigung
dritte Möglichkeiten weg. Da wir aber andererseits das von Teilmengen von S ist. Somit gilt A ⊆ Y ⊆ S.
Zorn’schne Lemma kennen (Seite 52), das die Existenz (iii.b) Die Menge Y ist linear unabhängig: Es seien dazu
maximaler Elemente garantiert, ist es nur naheliegend, v 1 , . . . , v n ∈ Y gewählt. Weil Y Vereinigung von Teil-
dass wir es damit versuchen. mengen X ∈ C ist (siehe (∗)), gibt es Teilmengen
Wir zeigen, dass eine maximale linear unabhängige Teil- X1 , . . . , Xn ∈ C mit v i ∈ Xi . Nun beachten wir, dass
menge B von S existiert, die A enthält. Wir können dann die Menge C total geordnet ist. Hiernach gibt es unter den
zwar nicht die Kennzeichnungen von Basen auf Seite 209 endlich vielen X1 , . . . , Xn ein bezüglich der Inklusion ⊆
anwenden, da wir nur eine maximale linear unabhängige größtes Element Xj , j ∈ {1, . . . , n}, d. h. X1 , . . . , Xn ⊆
Teilmenge von S und noch nicht notwendig von V haben, Xj . Es liegen damit alle Vektoren v 1 ∈ X1 , . . . , v n ∈ Xn
aber wir werden zeigen, dass diese Menge B aufgrund ih- in diesem Xj . Da Xj ein Element aus M ist, ist die Menge
rer Maximalität die Eigenschaft -B. = -S. hat. Wegen Xj linear unabhängig, wonach also auch die Vektoren
-S. = V erhalten wir das gewünschte Ergebnis: B ist eine v 1 , . . . , v n ∈ Xj linear unabhängig sind.
Basis von V . Wie schon angekündigt, betrachten wir die In (iii.a) und (iii.b) haben wir gezeigt, dass Y ∈ M gilt. So-
Menge mit ist (M, ⊆) induktiv geordnet. Nach dem Zorn’schen
Lemma besitzt (M, ⊆) ein maximales Element, das wir
M = {X | X ist linear unabhängig und A ⊆ X ⊆ S}
mit B bezeichnen. Da diese Teilmenge B von V in M
und ordnen diese mit der Inklusion, es ist (M, ⊆) eine ge- liegt, ist B linear unabhängig. Um zu zeigen, dass B eine
ordnete Menge. Gesucht ist nun ein maximales Element Basis ist, reicht es aus zu begründen, dass B den Vektor-
in M bezüglich ⊆. raum V erzeugt, -B. = V .
Falls M endlich ist, existiert ein solches maximales Ele- Die Inklusion -B. ⊆ V gilt wegen B ⊆ V . Wir begrün-
ment B, denn aus der Annahme, ein maximales Element den die Inklusion V ⊆ -B.. Wegen V = -S. folgt die
würde nicht existieren, könnten wir folgern, dass wir gewünschte Inklusion aus der Inklusion S ⊆ -B., da in
in M eine nicht abbrechende Inklusionskette der Form diesem Fall -S. ⊆ -B. folgt.
B1 B2 · · · mit Elementen Bi ∈ M bilden könnten. Es sei v ∈ S. Im Fall v ∈ B gilt natürlich v ∈ -B.. Daher
Das wäre ein Widerspruch zur Endlichkeit von M. können wir annehmen, dass v ∈ B gilt. Dann erhalten wir
Die Schwierigkeit besteht im Fall eines unendlichen M.
Für diesen Fall setzen wir das Zorn’sche Lemma ein. Das A ⊆ B B ∪ {v} ⊆ S .
Zorn’sche Lemma garantiert die Existenz von maximalen Die Menge B ∪ {v} muss linear abhängig sein. Wäre sie
Elementen in nichtleeren, induktiv geordneten Mengen. es nicht, so läge B ∪ {v} in M – das wäre ein Widerspruch
Wir müssen also nur begründen, dass (M, ⊆) nichtleer zur Maximalität von B in (M, ⊆).
und induktiv geordnet ist. Das zeigen wir in mehreren Da B ∪ {v} linear abhängig ist, existieren v 1 , . . . , v n ∈ B
Schritten. und λ, λ1 , . . . , λn ∈ K, die nicht alle gleich null sind, mit
(i) Da die linear unabhängige Menge A natürlich A ⊆ A
erfüllt, gilt A ∈ M, sodass M nichtleer ist. !
n
λv + λi v i = 0 .
(ii) Nach den Beispielen auf Seite 51 ist (M, ⊆) eine ge-
i=1
ordnete Menge.
(iii) Jede linear geordnete Teilmenge von M hat eine obere Da die Menge B linear unabhängig ist, muss λ = 0 gelten,
Schranke in (M, ⊆): wir erhalten
!n
Es sei C ⊆ M eine linear geordnete Teilmenge von M. v = −λ−1 λi v i .
Man beachte, dass die Elemente von C nun Teilmengen i=1
von V sind, die A umfassen und in S liegen. Folglich gilt S ⊆ -B.. Damit ist alles gezeigt. 
6.4 Basis und Dimension 209

Nun setzen wir S  = (S \ {v 1 }) ∪ {v} und erhalten v 1 ∈ -S  .. Für jeden Körper K gilt dim(K[X]) = ∞, da {Xk |
Es folgt S ⊆ -S  .. Somit ist auch S  ein Erzeugendensystem k ∈ N0 } eine nicht endliche Basis bildet.
von V , d. h. -S  . = V . Die Dimension des R-Vektorraums C ist 2, da {1, i} eine
Basis bildet. Weiter ist {1} eine Basis von C über C, sodass
Für das Erzeugendensystem S  gilt wegen v ∈ S  und
C als C-Vektorraum eindimensional ist.
v ∈ A \ S und v 1 ∈ S \ A:
Die Lösungsmenge L eines homogenen linearen Glei-
|S  \ A| = |S \ A| − 1 = n . chungssystems A x = 0 mit einer Matrix A ∈ Km×n ist,
wie wir bereits in einem Lemma auf Seite 197 formuliert
Wegen der Induktionsvoraussetzung gilt |A| ≤ |S  |. Aber es haben, ein Untervektorraum des Kn . Die Dimension die-
gilt auch |S  | = |S|. Somit ist die Behauptung |A| ≤ |S| ses Untervektorraums L ist die Anzahl der frei wählbaren
nachgewiesen.  Variablen, also

dim L = n − rg A .
Nun können wir das angekündigte Ergebnis folgern:
Man beachte den Satz auf Seite 184. 
Folgerung (F)
alls der K-Vektorraum V ein endliches Erzeugenden-
system hat, so sind alle Basen endlich und haben gleich
viele Elemente. Wie findet man Basen?

Beweis: Sind B1 und B2 zwei Basen von V , so liefert der Eine Basis ist ein linear unabhängiges Erzeugendensystem.
obige Satz zuerst |B1 |, |B2 | ∈ N0 , und dann mit B1 in der Zum Nachweis dieser beiden Eigenschaften sind die folgen-
Rolle von A und B2 in der Rolle von S: den Aussagen nützlich:

|B1 | ≤ |B2 | .
Kennzeichnungen endlicher Basen
Nun vertauschen wir die Rollen von B1 und B2 und erhalten Es sei V ein K-Vektorraum der endlichen Dimension
n ∈ N0 .
|B2 | ≤ |B1 | .
(i) Je n linear unabhängige Vektoren bilden eine Basis.
Insgesamt ist damit |B1 | = |B2 | gezeigt. 
(ii) Jedes Erzeugendensystem mit n Elementen bildet
eine Basis.
(iii) Für jeden Untervektorraum U ⊆ V gilt dim(U ) ≤
Da je zwei Basen endlich erzeugter Vektorräume gleich viele dim(V ).
Elemente haben, ist die folgende Definition sinnvoll: (iv) Für einen Untervektorraum U ⊆ V mit dim(U ) =
dim(V ) gilt U = V .
Die Dimension eines Vektorraums (v) Mehr als n Vektoren sind stets linear abhängig.
Ist B eine Basis eines endlich erzeugten Vektorraums (vi) Weniger als n Vektoren bilden kein Erzeugenden-
V , so nennt man die Elementzahl einer und damit jeder system.
Basis von V die Dimension von V . Wir schreiben dafür

dim(V ) = |B| . Beweis: (i) Nach dem Austauschsatz von Steinitz ist jede
Menge {v 1 , . . . , v n } linear unabhängiger Vektoren von V
Ist V nicht endlich erzeugt, so setzen wir eine maximale linear unabhängige Teilmenge von V und so-
mit eine Basis.
dim(V ) = ∞ .
(ii) Nach dem Austauschsatz von Steinitz ist jedes Erzeu-
Im ersten Fall nennt man V endlichdimensional, im gendensystem {v 1 , . . . , v n } mit n Elementen ein minimales
zweiten Fall unendlichdimensional. Erzeugendensystem von V und somit eine Basis.
(iii) Es sei BU eine Basis von U . Nach dem Basisergänzungs-
Beispiel satz existiert eine Basis BV von V mit BU ⊆ BV . Hieraus
Es gilt dim({0}) = 0, da ∅ eine Basis von {0} ist und folgt |BU | ≤ |BV |.
|∅| = 0 gilt.
Für jeden Körper K und jede natürliche Zahl n gilt (iv) Dies folgt aus dem Beweis von (iii), da unter der Voraus-
dim(Kn ) = n, da En = {e1 , . . . , en } eine Basis ist und setzung dim(U ) = dim(V ) sogleich BU = BV und somit
|En | = n gilt. U = V folgt.
Für jeden Körper K und alle natürlichen Zahlen m, n gilt
(v) Das folgt aus (iii).
dim(Km×n ) = m · n, da B = {Er,s | r ∈ {1, . . . , m},
s ∈ {1, . . . , n}} eine Basis ist und |B| = m n gilt. (vi) Das folgt aus (iv). 
210 6 Vektorräume – von Basen und Dimensionen

Beispiel: Der Vektorraum aller Abbildungen mit endlich vielen von null verschiedenen Werten
Für einen Körper K und eine nichtleere Menge M definieren wir

V = {f ∈ KM | nur für endlich viele x ∈ M ist f (x) = 0} .

Es ist V also eine Teilmenge von KM , dem Vektorraum aller Abbildungen von M nach K (Seite 195). Wir zeigen:
(a) V ist ein K-Vektorraum.
(b) Für jedes y ∈ M betrachten wir die Abbildung δy : M → K mit

1 , falls x = y,
δy (x) =
0 , sonst

und zeigen, dass B = {δy | y ∈ M} eine Basis von V ist.


Es gilt demzufolge dim V = |B| = |M|.

Problemanalyse und Strategie: Für den Teil (a) zeigen wir, dass V ein Untervektorraum von KM ist. Bei Teil
(b) müssen wir beachten, dass die Menge B durchaus unendlich sein kann. Somit ist es hier notwendig, die lineare
Unabhängigkeit von B dadurch zu beweisen, dass man die lineare Unabhängigkeit jeder endlichen Teilmenge von B
beweist.

Lösung: Nun setzen wir λ1 = f (x1 ), . . . , λn = f (xn ) und zeigen


(a) Es ist V eine nichtleere Teilmenge des Vektorraums die Gleichheit
KM , da die Nullabbildung in V enthalten ist. Denn diese
nimmt für kein x ∈ M und damit für endlich viele x ∈ M f = λ1 δx1 + . . . + λn δxn .
einen von null verschiedenen Wert an. Sind f und g
zwei Abbildungen aus V , d. h., f und g nehmen nur an Für jedes x ∈ M \ {x1 , . . . , xn } gilt:
endlich vielen Stellen einen von null verschiedenen Wert
0 = f (x) = (λ1 δx1 + · · · + λn δxn )(x)
an, so auch deren Summe f + g : x  → f (x) + g(x).
Für jedes λ ∈ K und f ∈ V hat auch die Abbildung = λ1 δx1 (x) + · · · + λn δxn (x)
λ f : x → λ f (x) die Eigenschaft, nur endlich viele von = 0 + · · · + 0 = 0.
null verschiedene Werte anzunehmen. Damit ist begrün-
det, dass V ein Untervektorraum von KM , also ein K- Und für jedes xi ∈ {x1 , . . . , xn } gilt:
Vektorraum ist.
λi = f (xi ) = (λ1 δx1 + · · · + λn δxn )(xi )
(b) Die Menge B ist linear unabhängig: Wir wählen eine
endliche Teilmenge E ⊆ B, etwa E = {δy1 , . . . , δyn } für = λ1 δx1 (xi ) + · · · + λn δxn (xi ) = λi .
verschiedene y1 , . . . , yn ∈ M. Für λ1 , . . . , λn ∈ K gelte
Also stimmen die beiden Abbildungen f und λ1 δx1 + · · ·
!
n +λn δxn für alle Werte aus M überein, d. h., sie sind gleich:
(∗) λi δyi = 0 , f = λ1 δx1 + · · · + λn δxn . Dies begründet, dass jedes be-
i=1 liebige f aus V eine Linearkombination von Elementen
n aus B ist, sodass B ein Erzeugendensystem von V liefert.
d. h., für alle x ∈ M gilt λi δyi (x) = 0. Insgesamt wurde gezeigt, dass B ein linear unabhängiges
i=1
Erzeugendensystem von V , also eine Basis von V , ist.
Setzt man nun in (∗) nacheinander (die verschiedenen)
y1 , y2 , . . . , yn ein, so erhält man nacheinander λ1 = 0, Die Dimension des Vektorraums V ist die Mächtigkeit von
λ2 = 0, . . . , λn = 0. Damit ist die lineare Unabhängigkeit B, und wegen |B| = |M| haben wir somit einen Vektor-
von B gezeigt. raum der Dimension
Die Menge B ist ein Erzeugendensystem von V : Gegeben
dim V = |M| .
ist ein f ∈ V . Dann gibt es endlich viele verschiedene
x1 , . . . , xn ∈ M mit Man beachte, dass die Dimension unabhängig vom Körper
K ist, in dem die Werte der Abbildungen f liegen. Im Fall
f (x1 ) = 0, . . . , f (xn )  = 0 und
M = R haben wir ein Beispiel eines Vektorraums mit der
f (x) = 0 ∀x ∈ M \ {x1 , . . . , xn }. Dimension |R|, egal, welchen Körper K wir dazu wählen.
6.5 Summe und Durchschnitt von Untervektorräumen 211

Insbesondere ist nun auch klar, dass die Untervektorräume für alle x ∈ Q. Nun setzen wir x = 1, x = −1 und x = 2 ein.
der Dimension 1 bzw. 2 des R3 die Form R a mit a  = 0 Das liefert ein lineares Gleichungssystem für die a1 , a2 , a3 :
bzw. R a + R b mit a, b  = 0 und R a  = R b, also mit li-
near unabhängigen Vektoren a, b, haben. Außer diesen und a1 1 + a2 1 + a3 1 = 0
den trivialen Untervektorräumen {0} und R3 existieren keine a1 (−1) + a2 1 + a3 (−1) = 0
weiteren Untervektorräume im R3 .
a1 2 + a2 4 + a3 8 = 0
? Die Koeffizientenmatrix dieses homogenen linearen Glei-
Welche reellen Zahlen bilden eine Basis des reellen Vektor-
raums R ? chungssystems lautet
⎛ ⎞
1 1 1
⎝ −1 1 −1 ⎠
Beispiel Wir betrachten den K-Vektorraum KK aller Ab- 2 4 8
bildungen von K nach K. Für i ∈ N0 sei pi ∈ KK die Poly-
nomfunktion  Mit dem Gauß-Algorithmus sieht man, dass dieses Sys-
K → K, tem nur die Lösung (0, 0, 0) besitzt. Also ist {p0 , p1 ,
pi :
x → x i . p 2 , p3 } linear unabhängig, also eine Basis und somit
Wir bestimmen jeweils die Dimension des von {p0 , p 1 , dim(U ) = 4. 
p 2 , p 3 } aufgespannten Untervektorraums von KK für die
Fälle

(a) K = Z2 , (b) K = Z3 , (c) K = Q . 6.5 Summe und Durchschnitt


Es sei U = -p0 , p 1 , p 2 , p 3 ..
von Untervektorräumen
(a) K = Z2 : Wegen p1 (0̄) = p2 (0̄) = p3 (0̄) = 0̄ und Durch Summen und Durchschnittbildung werden aus Unter-
p1 (1̄) = p2 (1̄) = p3 (1̄) = 1̄ gilt: vektorräumen wieder Untervektorräume.

p1 = p2 = p3 ,

und somit -p0 , p 1 . = -p0 , p 1 , p 2 , p 3 . = U . Die Summe von Untervektorräumen ist ein
Untervektorraum
Wir zeigen nun noch, dass {p0 , p 1 } linear unabhängig ist.
Es seien a0 , a1 ∈ Z2 mit a0 p0 + a1 p1 = 0 ∈ KK , also
a0 p 0 (x) + a1 p 1 (x) = 0̄ für alle x ∈ Z2 . Einsetzen von Für zwei Untervektorräume U und W eines K-Vektorraums
x = 0̄ liefert a0 = 0̄ und dann Einsetzen von x = 1̄ auch V definiert man
a1 = 0̄. Also ist {p0 , p 1 } linear unabhängig, also eine Basis
von U , also dim(U ) = 2. U + W = {u + w | u ∈ U, w ∈ W } ⊆ V

(b) K = Z3 : Analog zu K = Z2 sieht man, dass {p 0 , p 1 , p 2 } und nennt U + W die Summe der Untervektorräume U
eine Basis von U ist, also dim(U ) = 3. und W .
(c) K = Q: Wir zeigen, dass {p0 , p 1 , p 2 , p 3 } linear unab- Offenbar ist U + W wieder ein Untervektorraum von V .
hängig ist, sodass {p 0 , p 1 , p 2 , p 3 } eine Basis von U ist.
Es seien a0 , a1 , a2 , a3 ∈ Q mit ?
Wieso ist U + W ein Untervektorraum?
(∗) a0 p0 + a1 p1 + a2 p2 + a3 p3 = 0 ∈ KK

gegeben, d. h. Gilt sogar V = U + W , so sagt man, der K-Vektorraum V


ist die Summe der Untervektorräume U und W .
a0 p 0 (x) + a1 p 1 (x) + a2 p2 (x) + a3 p3 (x) = 0
Wir betrachten Erzeugendensysteme MU von U und MW
für alle x ∈ Q. Einsetzen von x = 0 liefert von W , d. h.,

a0 1 + a 1 0 + a 2 0 + a 3 0 = 0 , U = -MU . und W = -MW . .

sodass a0 = 0 gilt. Wir setzen a0 = 0 in (∗) ein und erhalten Gegeben seien u ∈ U und w ∈ W . Da -MU . aus allen
Linearkombinationen von Elementen aus MU besteht, exis-
a1 p1 (x) + a2 p2 (x) + a3 p3 (x) = 0 tieren r ∈ N0 , u1 , . . . , ur ∈ MU und λ1 , . . . , λr ∈ K mit
212 6 Vektorräume – von Basen und Dimensionen

Beispiel: Bestimmung von Basen


Wir lösen beispielhaft zwei typische Problemstellungen.
(1) Gegeben ist ein endliches Erzeugendensystem E eines Vektorraums V . Man bestimme eine Basis B ⊆ E.
⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫

⎪ 1 1 1 0 0 0 ⎪
⎨⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎪ ⎬
1 0 0 1
⎟ , ⎜ ⎟ , ⎜ ⎟ , ⎜ ⎟ , ⎜ ⎟ , ⎜0⎟ .
1
Beispiel: V = R und E = ⎜
4
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
⎪ 0
⎪ 1 0 1 0 1 ⎪⎪
⎩ ⎭
0 0 1 0 1 1
(2) Gegeben ist eine linear unabhängige Teilmenge E eines endlich erzeugten Vektorraums V . Man bestimme eine Basis
B ⊇ E. ⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫

⎪ 1 2 −1 ⎪⎪
⎨⎜ ⎟ ⎜ ⎟ ⎜ 3 ⎟⎬
−2 −3
Beispiel: V = R und E = ⎜
4 ⎟, ⎜ ⎟, ⎜ ⎟ .
⎝ 3 ⎠ ⎝ 6 ⎠ ⎝−2⎠⎪

⎪ ⎪
⎩ ⎭
−4 −11 6

Problemanalyse und Strategie: Bei (1) entferne man so lange Vektoren aus dem Erzeugendensystem E, bis ein linear
unabhängiges Erzeugendensystem verbleibt.
Bei (2) füge man zu der linear unabhängigen Menge E so lange weitere, zu den Vektoren aus E linear unabhängige
Elemente von V hinzu, bis ein linear unabhängiges Erzeugendensystem entsteht. Dabei muss man sich nach jedem
Hinzufügen eines Vektors vergewissern, dass die dann größere Menge nach wie vor linear unabhängig ist.

Lösung: Wir schreiben die Vektoren v 1 , v 2 , v 3 als Zeilen einer


(1) Dass E tatsächlich ein Erzeugendensystem ist, ergibt Matrix und bringen die Matrix mittels elementarer Zei-
sich im Laufe der Rechnung. Wir benennen die sechs Vek- lenumformungen auf Zeilenstufenform:
toren aus E der Reihe nach mit v 1 , . . . , v 6 . Durch Probie- ⎛ ⎞
ren (oder Lösen eines Gleichungssystems) erkennt man, 1 −2 3 −4
dass ⎝ 2 −3 6 −11 ⎠ →
v6 = v3 + v4 − v1 . −1 3 −2 6
Also gilt -v 1 , . . . , v 6 . = -v 1 , . . . , v 5 ., sodass wir v 6 aus
⎛ ⎞ ⎛ ⎞
dem Erzeugendensystem entfernen können. Nun betrach- 1 −2 3 −4 1 −2 3 −4
ten wir in dem Erzeugendensystem E  = {v 1 , . . . , v 5 } → ⎝ 0 1 0 −3 ⎠ → ⎝ 0 1 0 −3 ⎠
den Vektor v 5 und sehen, dass 0 1 1 2 0 0 1 5
v5 = v3 + v4 − v2 .
Also gilt -v 1 , . . . , v 5 . = -v 1 , . . . , v 4 ., sodass wir v 5 aus Nun bezeichnen wir die Zeilen der letzten Matrix der
dem Erzeugendensystem entfernen können. Es verbleibt Reihe nach mit w1 , w 2 , w 3 und machen uns mit folgen-
nun das Erzeugendensystem E  = {v 1 , . . . , v 4 }. Weil sich dem Sachverhalt vertraut:
keine weiteren Kombinationen zu ergeben scheinen, prü- Es gilt -v 1 , v 2 , v 3 . = -w1 , w 2 , w 3 ..
fen wir das System E  auf lineare Unabhängigkeit. Es
Dies ist so, da w1 , w 2 , w 3 Linearkombinationen von
gelte λ1 v 1 + · · · + λ4 v 4 = 0 für λ1 , . . . , λ4 ∈ R. Dies
v 1 , v 2 , v 3 sind. Diese Vektoren entstanden ja durch
führt zu dem linearen Gleichungssystem
⎛ ⎞ Zeilenumformungen (d. h. Vektoraddition und skalare
1 1 1 0 0
⎜1 0 0 1 0⎟ Multiplikation) der Zeilen v 1 , v 2 , v 3 . Und somit gilt
⎜ ⎟ -w 1 , w 2 , w 3 . ⊆ -v 1 , v 2 , v 3 .. Aber ebenso sind
⎝0 1 0 1 0⎠
v 1 , v 2 , v 3 Linearkombinationen von w 1 , w 2 , w 3 , da
0 0 1 0 0
diese Zeilenumformungen alle umkehrbar sind. Somit gilt
dessen einzige Lösung offenbar λ1 = · · · = λ4 = 0 ist. auch -v 1 , v 2 , v 3 . ⊆ -w 1 , w 2 , w 3 ., schließlich also die
Also ist E  linear unabhängig. Folglich ist B = E  ⊆ E Gleichheit dieser beiden Vektorräume.
eine Basis von V ; insbesondere erzeugt E den R4 .
(2) Dass E tatsächlich linear unabhängig ist, wird sich Den Vektoren w 1 , w 2 , w 3 ist es nun leicht anzusehen,
wieder im Laufe der Rechnung zeigen. Wir benennen die dass sie linear unabhängig sind – und somit sind dann
drei Vektoren aus E der Reihe nach mit v 1 , v 2 , v 3 . auch v 1 , v 2 , v 3 linear unabhängig –, und es ist nun
Aber mit welchem Vektor sollte man nun E ergänzen, um leicht, einen zu w 1 , w 2 , w 3 linear unabhängigen Vek-
eine Basis zu erhalten? Man könnte es mit e1 versuchen. tor anzugeben. Man ergänze E mit dem Element e4 . Die
Man muss aber dann nachprüfen, ob v 1 , v 2 , v 3 , e1 linear obige Rechnung – beachte die letzte Matrix – begrün-
unabhängig sind. Falls dies nicht so sein sollte, so hätte det, dass v 1 , v 2 , v 3 , e4 , linear unabhängig sind. Wegen
man dann den Versuch mit einem anders gewählten Vek- |E ∪ {e4 }| = 4 bildet somit E ∪ {e4 } eine Basis von V ;
tor zu wiederholen. ebenso natürlich auch {w 1 , w 2 , w 3 , e4 }.
6.5 Summe und Durchschnitt von Untervektorräumen 213

Hintergrund und Ausblick: Der Bauer-Code


Ein Kommunikationssystem lässt sich vereinfacht darstellen als
Codierung Decodierung
Nachrichtenquelle −→ Kanal −→ Empfänger

Die Nachrichtenquelle gibt eine Folge von Bits 0 oder 1 in den Kanal ein. Der Kanal ist gestört, d. h. hin und wieder wird ein Bit
als das entgegengesetzte Bit vom Kanal an den Empfänger weitergereicht. Um diese Störung zu bekämpfen, schalten wir vor
bzw. hinter den Kanal einen Codierer bzw. Decodierer. Der Codierer fasst je k (zum Beispiel k = 4) von der Nachrichtenquelle
ausgegebene Bits zu einem Informationsblock zusammen. Dann berechnet er in Abhängigkeit vom Informationsblock r
(im Beispiel r = 4) Kontrollbits, fasst diese zu einem Kontrollblock zusammen und sendet das Codewort, das ist das
Paar (Informationsblock, Kontrollblock), an den Kanal. Die Zuordnung Informationsblock → Codewort heißt Codierung. Der
Kanal gibt nach Eingabe des Codewortes ein Kanalwort der Länge k + r aus. Als Kanalwort kann prinzipiell jedes der
2k+r möglichen Bit-Wörter der Länge k + r auftreten (im Beispiel also jedes der 256 Bytes). Die Kanalstörungen können ja
jedes Bit verfälschen; wir gehen aber davon aus, dass die Bit-Störungen selten und unabhängig voneinander auftreten. Der
Decodierer versucht, aus der Kenntnis des Kanalwortes das ursprünglich gesendete Codewort zu rekonstruieren; die ersten
k Bits des geschätzten Codewortes reicht der Decodierer als seine Mutmaßung des tatsächlich von der Nachrichtenquelle
ausgegebenen Informationsblocks an den Empfänger weiter. Der Bauer-Code ist ein sogenannter 1-fehlerkorrigierender Code,
d. h., ein geeigneter Decodierer kann die von höchstens einem Bit-Fehler betroffenen Codewörter richtig schätzen.

Ein (binärer) linearer Code der Länge n ist ein Unter- 00000000 10101010 10110100
vektorraum C von Zn2 mit |C| ≥ 2, wobei Z2 = {0, 1} 10000111 10011001 11010010
der Körper mit 2 Elementen ist. Es sei nun C ein sol- 01001011 01100110 11100001
cher linearer Code der Länge n. Für die Elemente x = 00101101 01010101 11111111
(x1 , . . . , xn ) ∈ C schreiben wir kürzer x = x1 . . . xn . 00011110 00110011
Der Hamming-Abstand d(x, y) zweier Codewörter x, 11001100 01111000
y ∈ C ist die Anzahl der Positionen, in denen sich x und
y unterscheiden, d. h. Zum Beweis der Tatsache, dass B ein Z2 -Vektorraum ist,
nutzen wir aus, dass eine Teilmenge C ⊆ Zn2 genau dann
d(x, y) = |{j | 1 ≤ j ≤ n und xj  = yj }|. ein linearer Code ist, wenn 0 ∈ C und aus x, y ∈ C stets
x + y ∈ C folgt.
Das Hamming-Gewicht w(x) von x ∈ C ist die An-
zahl der Einsen in x, also w(x) = d(x, 0), wobei Wir schreiben die Elemente aus B in der Form (a, a ∗ ) mit
0 = 00 . . . 0 ∈ Zn2 das Nullwort ist. Für jeden Code a ∈ Z42 und
C ⊆ Zn2 mit |C| ≥ 2 heißen die Zahlen 
∗ a, falls w(a) ∈ 2 N0 ,
d(C) = min{d(x, y) | x, y ∈ C, x  = y} bzw. a =
a + 1, falls w(a) ∈ 2 N0 ,
w(C) = min{w(x) | x ∈ C, x  = 0}
wobei wir zur Abkürzung 1 = 11 . . . 1 geschrieben ha-
der Minimalabstand bzw. das Minimalgewicht.
ben. Es gilt (a, a ∗ ) + (b, b∗ ) = (a + b, a ∗ + b∗ ).
Für x, y ∈ C ist stets auch x + y ∈ C, und x + y  = 0 im- Das
 einzige Codewort,
 das hierfür in Frage kommt, ist
pliziert x = −y = y. Somit gilt d(x, y) = |{i | xi  = yi }| a + b, (a + b)∗ . Also ist B genau dann ein linearer
= |{i | xi + yi = 0}| = w(x + y) und schließlich Code, wenn (a + b)∗ = a ∗ + b∗ für alle a, b ∈ Z42 .
d(C) = min{d(x, y) | x, y ∈ C, x  = y} Unter Beachtung von 1 + 1 = 0 in Z2 bestätigt man die
= min{w(x + y) | x, y ∈ C, x  = y} Formel: w(a + b) ∈ 2 N0 ⇔ w(a) + w(b) ∈ 2 N0 .
Hiermit erhalten wir die Tabelle (für ein c ∈ Z42 schreiben
= min{w(z) | z ∈ C, z  = 0} = w(C) . > = 0 im Fall w(c) ∈ 2 N0 und w(c) > = 1 im Fall
wir w(c)
Der Bauer-Code B besteht aus allen Elementen x = w(c) ∈ 2 N0 + 1):
x1 x2 x3 x4 x5 x6 x7 x8 ∈ Z82 , die der folgenden Bedingung w(a) 
 
w(b) w(a + b) a ∗ b∗ (a + b)∗
genügen: 0 0 0 a b a+b
1 0 1 a+1 b a+b+1
b+1 a+b+1
x5 x6 x7 x8 = 0 1 1 a
a+1 b+1 a+b
 1 1 0
x1 x2 x3 x4 , falls w(x1 x2 x3 x4 ) ∈ 2 N0 , Mit 1 + 1 = 0 erhalten wir in allen Fällen (a + b)∗ =
=
x1 x2 x3 x4 + 1111, falls w(x1 x2 x3 x4 ) ∈ 2 N0 + 1 . a ∗ + b∗ . Der Bauer-Code B ist also ein linearer Code. Da-
mit können wir d(B) bestimmen. Wir erhalten d(B) =
Da x1 x2 x3 x4 ∈ Z42 beliebig gewählt werden kann, gilt w(B) = 4, denn außer 00 . . . 0, 11 . . . 1 haben ja alle
|B| = 16, damit erhalten wir als Elemente von B: Codewörter aus B das Hamming-Gewicht 4.
214 6 Vektorräume – von Basen und Dimensionen

Beispiel: Die Anzahl der k-dimensionalen Untervektorräume von Znp


Gegeben seien n ∈ N0 sowie eine Primzahl p ∈ N. Wir wollen die Anzahl der (verschiedenen) k-dimensionalen Untervektor-
räume von Znp bestimmen.

Problemanalyse und Strategie: Wir bestimmen in einem ersten Schritt für k ≤ n die Anzahl der linear unabhängigen
k-Tupel (a 1 , . . . , a k ). In einem zweiten Schritt überlegen wir uns, wie viele verschiedene solche Tupel den gleichen
Vektorraum erzeugen.

Lösung: sind p2 − 1 Möglichkeiten) und eines von b1 linear unab-


Wir betrachten den Zp -Vektorraum Znp : hängigen Vektors aus U \-b1 . (das sind p 2 −p Möglichkei-
⎧⎛ ⎞ ⎫ ten) liefert eine Basis von U : Es gibt also (p 2 −1) (p 2 −p)

⎨ a1 ⎪
⎬ verschiedene Basen in U . Folglich gibt es genau
n ⎜ .. ⎟
Zp = ⎝ . ⎠ | a1 , . . . , an ∈ Zp . (p n − 1) (pn − p)

⎩ ⎪

an (p 2 − 1) (p2 − p)
Für jede Komponente hat man p Möglichkeiten, ein Ele- verschiedene 2-dimensionale Untervektorräume von Znp .
ment aus Zp zu wählen, also enthält Znp insgesamt p n Die Überlegungen wiederholen sich für die 3-
Elemente. dimensionalen Untervektorräume. Und allgemein erhalten
Der triviale Untervektorraum {0} ist der einzige Untervek- wir für die Anzahl der k-dimensionalen Untervektorräume
torraum der Dimension 0. von Znp die Formel: Es gibt genau
Zur Anzahl der 1-dimensionalen Untervektorräume: Es
gibt pn −1 Möglichkeiten, einen vom Nullvektor verschie- 
k−1
pn − pj (p n − 1)(p n − p) · · · (pn − p k−1 )
=
denen Vektor zu wählen, und jeder solche Vektor erzeugt pk − pj (pk − 1)(p k − p) · · · (pk − p k−1 )
j =0
einen 1-dimensionalen Untervektorraum. Nun sind aber
diese Untervektorräume nicht alle verschieden, so gilt im k-dimensionale Untervektorräume von Znp .
Z33 etwa ?⎛1⎞@ ?⎛2⎞@
Als Beispiel bestimmen wir alle Untervektorräume von
Z32 :
⎝ 1 ⎠ = ⎝2 ⎠ .
Es ist {0} der einzige Untervektorraum von Z32 der Dimen-
0 0 sion 0.
3 −1
Wir überlegen uns, wie viele verschiedene Basen ein 1- Die 22−1 = 7 verschiedenen 1-dimensionalen Untervek-
dimensionaler Untervektorraum von Znp haben kann. Ist torräume von Z32 sind
U ein 1-dimensionaler Untervektorraum, so liefert jede
?⎛1⎞@ ?⎛0⎞@ ?⎛0⎞@ ?⎛1⎞@ ?⎛1⎞@ ?⎛0⎞@ ?⎛1⎞@
Wahl eines vom Nullvektor verschiedenen Vektors aus U
(das sind p − 1 Möglichkeiten) eine Basis für U . Also ⎝0⎠ , ⎝1⎠ , ⎝0⎠ , ⎝1⎠ , ⎝0⎠ , ⎝1⎠ , ⎝1⎠ .
erzeugen je 0 0 1 0 1 1 1
p − 1 = |Zp \ {0}|
(23 −1) (23 −2)
Elemente den gleichen Untervektorraum. Folglich gibt es Die (22 −1) (22 −2)
= 7 verschiedenen 2-dimensionalen
genau Untervektorräume von Z32 sind
pn − 1
p−1 ?⎛1⎞ ⎛0⎞@ ?⎛1⎞ ⎛0⎞@ ?⎛0⎞ ⎛0⎞@
verschiedene 1-dimensionale Untervektorräume von Znp . ⎝0⎠ , ⎝1⎠ , ⎝0⎠ , ⎝0⎠ , ⎝1⎠ , ⎝0⎠ ,
Zur Anzahl der 2-dimensionalen Untervektorräume: Es
0 0 0 1 0 1
gibt pn − 1 Möglichkeiten, einen vom Nullvektor ver-
?⎛1⎞ ⎛0⎞@ ?⎛0⎞ ⎛1⎞@ ?⎛0⎞ ⎛1⎞@
schiedenen Vektor a 1 zu wählen und p n − p Möglich-
keiten, einen zum Vektor a 1 linear unabhängigen Vektor ⎝0⎠ , ⎝1⎠ , ⎝1⎠ , ⎝0⎠ , ⎝0⎠ , ⎝1⎠ ,
a 2 ∈ Znp \ -a 1 . zu wählen. Jedes solche Paar von Vekto- 0 1 0 1 1 0
ren a 1 und a 2 erzeugt einen 2-dimensionalen Untervek- ?⎛1⎞ ⎛0⎞@
torraum. Diese Untervektorräume sind aber nicht alle ver- ⎝ 1⎠ , ⎝1 ⎠ .
schieden. So gilt im Z33 etwa 0 1
Und schließlich ist Z32 der einzige dreidimensionale Unter-
?⎛1⎞ ⎛0⎞@ ?⎛2⎞ ⎛0⎞@
vektorraum von Z32 .
⎝ 1 ⎠ , ⎝2 ⎠ = ⎝ 2 ⎠ ⎝ 2 ⎠ .
0 0 0 0 Kommentar: Im Kapitel 12 werden wir zeigen, dass
Wir überlegen uns, wie viele verschiedene Basen ein 2- je zwei k-dimensionale Vektorräume über ein und dem-
dimensionaler Untervektorraum von Znp haben kann. Jede selben Körper isomorph sind, d. h., sie unterscheiden sich
Wahl eines vom Nullvektor verschiedenen Vektors b1 (das nur in der Bezeichnung der Elemente.
6.5 Summe und Durchschnitt von Untervektorräumen 215

Beispiel: Magische Quadrate II ⎛ ⎞


x11 x12 x13
Für c ∈ R sei Mc wie in dem Beispiel auf Seite 210 die Menge aller magischen Quadrate A = ⎝ x21 x22 x23 ⎠ ∈ R3×3 mit
x31 x32 x33

der Eigenschaft, dass alle Zeilen-, Spalten- und Diagonalsummen von A gleich c sind. Und es sei M = Mc die Menge der
c∈R
magischen 3 × 3-Quadrate. Wir wollen alle möglichen magischen Quadrate zu einer vorgegebenen Zahl c ∈ R bestimmen
und schließlich eine Basis des Untervektorraums M von R3×3 angeben.

Problemanalyse und Strategie: Dazu begründen wir, dass ein magisches Quadrat mit der magischen Zahl c durch
seine erste Zeile festgelegt ist.

Lösung: Man wähle also zu einer vorgegebenen Zahl c ∈ R eine


Wir geben uns eine reelle Zahl c vor, und es sei Zerlegung in eine Summe der drei Zahlen x11 , x12 , x13 ,
⎛ ⎞
x11 x12 x13 also c = x11 + x12 + x13 , und setze
A = ⎝ x21 x22 x23 ⎠ ∈ Mc .
x31 x32 x33 A = x11 A1 + x12 A2 + x13 A3 .

Für i = 1, 2, 3 sei Zi die Summe der i-ten Zeile und Es ist dann A ein magisches Quadrat mit der magischen
Si die Summe der i-ten Spalte von A. Es seien ferner Zahl c, d. h., die restlichen Einträge der Matrix A = (aij )
D1 := x11 + x22 + x33 und D2 := x13 + x22 + x31 die stimmen dann automatisch. Es ist etwa a33 = −1/3 x11 +
Diagonalsummen von A. Dann ist 2/3 x12 + 2/3 x13 , also wegen c = x11 + x12 + x13 weiter
D1 + D2 + Z2 + S2 = Z1 + Z2 + Z3 + 3x22 , a33 = −1/3 x11 + 2/3 (c − x11 ) = 2/3 c − x11 .
Wir wollen die Basis noch etwas verschönern. Durch Pro-
also 4 c = 3 c + 3 x22 und somit c = 3 x22 . Damit haben bieren findet man
wir x22 = c/3 bestimmt. Für c = 0 gilt also etwa x22 = 0. ⎛ ⎞
Nun überlegen wir uns, dass das magische Quadrat A 1 −1 0
durch die erste Zeile, d. h. durch die Zerlegung von c in die B 1 = A1 − A2 = ⎝ −1 0 1 ⎠
Summe c = x11 + x12 + x13 bereits eindeutig festgelegt 0 1 −1
⎛ ⎞
ist. Die erste Zeile von A ∈ Mc sei (x11 , x12 , x13 ). Dann 0 1 −1
folgt B 2 = A2 − A3 = ⎝ −1 0 1 ⎠
⎛ ⎞
x11 x12 x13 1 −1 0
A = ⎝ 3 − x11 + x13
c c ⎠ ⎛ ⎞
3 + x11 − x13
c
3 1 1 1
2 2 2
3 c − x 13 3 c − x 12 3 c − x 11 B 3 = A1 + A2 + A3 = ⎝ 1 1 1 ⎠
Der Eintrag an der Stelle (2, 2) ergibt sich unmittelbar 1 1 1
aus obigem; die Einträge in der letzten Zeile ergeben sich
Die magischen Quadrate B 1 , B 2 , B 3 haben nun eine
dann aus den Bedingungen D1 = c, D2 = c und S2 = c;
schöne Gestalt. Nun müssen wir uns aber natürlich noch
weiter ergeben sich die beiden noch fehlenden Einträge in
davon überzeugen, dass sie eine Basis bilden. Es ist näm-
der mittleren Zeile von A aus den Bedingungen S1 = c
lich keineswegs so, dass beliebige drei Linearkombinatio-
und S3 = c.
nen dreier Basisvektoren wieder drei Basisvektoren bil-
Nun können wir wegen c = x11 + x12 + x13 einfach
den. So folgt etwa schon bei nur zwei Basisvektoren a 1
eine Basis von M angeben, da jedes magische Quadrat
und a 2 aus b1 = a 1 + a 2 und b2 = 2 a 1 + 2 a 2 die Glei-
durch seine erste Zeile eindeutig bestimmt ist: Es ist
chung b1 = b2 .
{A1 , A2 , A3 } mit
⎛ ⎞ Wir müssen uns aber nur davon überzeugen, dass
1 0 0
B 1 , B 2 , B 3 linear unabhängig sind. Wir machen den üb-
A1 = ⎝ −2 3
1
3
4 ⎠
3 , lichen Ansatz. Für λ1 , λ2 , λ3 ∈ R gelte
2 2 −1
3 3 3
⎛ ⎞
0 1 0 λ1 B 1 + λ2 B 2 + λ3 B 3 = 0 ∈ R3×3 .
A2 = ⎝ 1
3
1
3
1
3
⎠,
2 −1 2 Aus dem Eintrag an der Stelle (2, 2) folgt λ3 = 0. Nun

3 3 3
⎞ betrachten wir die Stelle (1, 1). Es ist dann auch λ2 = 0.
0 0 1 Und schließlich folgt aus dem Eintrag an der Stelle (1, 3)
−2
A3 = ⎝ 4
3
1
3 3
⎠ in der letzten Zeile λ2 = 0.
−1 2 2
3 3 3 Damit ist gezeigt, dass B 1 , B 2 , B 3 linear unabhängig sind.
eine Basis von M: Jedes magische Quadrat ist eine Linear- Es ist also {B 1 , B 2 , B 3 } eine Basis von M.
kombination der magischen Quadrate A1 , A2 , A3 , und Wir merken noch an, dass M ein 3-dimensionaler Unter-
offenbar sind A1 , A2 , A3 linear unabhängig. vektorraum des 9-dimensionalen R-Vektorraums R3×3 ist.
216 6 Vektorräume – von Basen und Dimensionen

r s
u = i=1 λi ui . Ebenso ist w = i=1 μi w i mit einem 0 mit λ1 , λ2 , λ3 ∈ R führt zu einem linearen Gleichungs-
s ∈ N0 , wi ∈ MW und μi ∈ K für 1 ≤ i ≤ s. Folglich ist system mit der erweiterten Koeffizientenmatrix
⎛ ⎞
!
r !
s 1 0 1 0
u+w = λi ui + μi w i ⎜ −1 1 1 0 ⎟
⎜ ⎟
⎜ 0 −1 0 0 ⎟ ,
i=1 i=1 ⎜ ⎟
⎝ 0 0 0 0⎠
eine Linearkombination von u1 , . . . , ur , w1 , . . . , ws ∈
0 0 −2 0
MU ∪ MW . Es gilt also U + W ⊆ -MU ∪ MW ..
dessen einzige Lösung offenbar (0, 0, 0) ist. Demnach ist
Nun sei umgekehrt v = ti=1 λi v i eine Linearkombination
{u1 , u2 , u3 } ein linear unabhängiges Erzeugendensystem,
von Elementen v i ∈ MU ∪ MW . Wir setzen
also eine Basis von U .
I = {i ∈ {1, 2, . . . , t} | v i ∈ MU } und J = {1, 2, . . . , t}\I . Nun untersuchen wir die Vektoren w 1 , w 2 , w 3 auf lineare
Unabhängigkeit. Offenbar sind w 1 , w 2 linear unabhängig,
Für i ∈ J gilt v i ∈
/ MU , d. h. v i ∈ MW . Folglich ist denn aus λ1 w1 + λ2 w2 = 0 mit z. B. λ2 = 0 folgt w 2 =
(−λ1 /λ2 ) w1 , d. h., w2 wäre skalares Vielfaches von w1 , was
!
t ! !
v= λi v i = λi v i + λi v i ∈ U + W. offensichtlich nicht der Fall ist. Wir müssen dann prüfen,
i=1 i∈I i∈J ob w 3 ∈ -w 1 , w 2 ., d. h. w 3 = λ1 w1 + λ2 w2 lösbar ist.
  Ausgeschrieben liefert dies das lineare Gleichungssystem mit
∈-MU . ∈-MW .
der erweiterten Koeffizientenmatrix
⎛ ⎞
Damit ist gezeigt: 2 −2 1
⎜ 1 1 −1 ⎟
⎜ ⎟
⎜ −1 3 −2 ⎟
Lemma ⎜ ⎟
⎝ −2 6 −4 ⎠
Sind U1 , . . . , Un Untervektorräume eines K-Vektorraums V
mit den Erzeugendensystemen MU1 , . . . , MUn , so gilt 0 −8 6
Dieses Gleichungssystem ist lösbar mit Lösung λ1 = −1/4,
U1 + · · · + Un = {u1 + · · · + un | u1 ∈ U1 , . . . , un ∈ Un } λ2 = −3/4. Es folgt W = -w 1 , w 2 ., und {w1 , w 2 } ist als
= -MU1 ∪ · · · ∪ MUn . . linear unabhängiges Erzeugendensystem eine Basis von W .

Insbesondere ist die Summe U1 + · · · + Un ein Untervektor- Nun wissen wir, dass U + W = -u1 , u2 , u3 , w 1 , w 2 ..
raum von V . Der Vektor w1 kann nicht Linearkombination von v 1 , v 2 , v 3
sein – man beachte die vierten Komponenten. Also sind
u1 , u2 , u3 , w 1 linear unabhängig. Wegen w 2 = 4 u3 −3 w1
? gilt U + W = -u1 , u2 , u3 , w1 ., d. h., {u1 , u2 , u3 , w 1 } ist
Wenn MU und MW sogar Basen von U und W sind, ist dann
eine Basis von U + W . 
MU ∪ MW eine Basis von U + W ?

Durchschnitte von Untervektorräumen sind


Beispiel Wir bestimmen jeweils eine Basis von U , W und wieder Untervektorräume
U + W für
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ Für zwei Untervektorräume U und W eines K-Vektorraums
1 0 1
V ist U ∩ W wieder ein Untervektorraum von V . Der Nach-
⎜−1⎟ ⎜1⎟ ⎜1⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ weis ist sehr einfach: Weil der Nullvektor sowohl in U als
U =R⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0 ⎟ + R ⎜−1⎟ + R ⎜ 0 ⎟ und
⎝0⎠ ⎝0⎠ ⎝0⎠ auch in W liegt, ist U ∩ W nichtleer. Weiterhin ist mit jedem
λ ∈ K und v ∈ U ∩ W auch λ v ein Element aus U und
0 0 −2
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ zugleich ein Element aus W , also wieder ein Element aus
2 −2 1 U ∩ W . Und mit zwei Elementen v und v  aus U ∩ W liegt
⎜1⎟ ⎜1⎟ ⎜−1⎟ auch deren Summe sowohl in U als auch in W , also wieder
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
W =R⎜ ⎟ ⎜ ⎟
⎜−1⎟ + R ⎜ 3 ⎟ + R ⎜−2⎟ .
⎜ ⎟ in deren Durchschnitt. Diesen Nachweis kann man leicht auf
⎝−2⎠ ⎝6⎠ ⎝−4⎠ einen beliebigen nichtleeren Durchschnitt verallgemeinern:
0 −8 6
Lemma
Wir bezeichnen die angegeben Vektoren aus U der Reihe Ist M eine nichtleere Menge von Untervektorräumen
nach mit u1 , u2 , u3 und jene aus W mit w 1 , w 2 , w 3 . eines K-Vektorraums V , so ist

Die Schreibweise U = R u1 + R u2 + R u3 bedeutet nichts U0 = U
anderes als U = -u1 , u2 , u3 .. Wir zeigen, dass u1 , u2 , u3 U ∈M

linear unabhängig sind. Die Gleichung λ1 v 1 +λ2 v 2 +λ3 v 3 = wieder ein Untervektorraum von V .
6.5 Summe und Durchschnitt von Untervektorräumen 217

Achtung: Ist MU ein Erzeugendensystem von U und MW Also gilt L = {(λ, λ, λ, λ) | λ ∈ R} und somit
eines von W , so gilt im Allgemeinen ⎧ ⎛ ⎞ ⎛ ⎞ ⎫
⎨ 1 0 ⎬
U ∩ W = -MU . ∩ -MW .  = -MU ∩ MW . . U ∩ W = λ ⎝0⎠ + λ ⎝ 1 ⎠ | λ ∈ R
⎩ ⎭
1 −1
⎧ ⎛ ⎞ ⎫
Man wähle etwa MU = {1} und MW = {2} im eindimensio- ⎨ 1 ⎬
nalen R-Vektorraum R. = λ ⎝1⎠ | λ ∈ R ;
⎩ ⎭
0
Beispiel Im R-Vektorraum V = R3 seien zwei Untervek-
?⎛1⎞@
also
torräume U und W gegeben durch
U ∩ W = ⎝1⎠ . 
?⎛1⎞ ⎛ 0 ⎞@ ?⎛ 1 ⎞ ⎛0⎞@
0
U = ⎝0⎠ , ⎝ 1 ⎠ und W = ⎝ 0 ⎠ , ⎝1⎠ .
1 −1 −1 1
Achtung: Die Vereinigung von Untervektorräumen ist im
Wir bestimmen U ∩ W . Allgemeinen kein Untervektorraum. Als Beispiel wähle man
etwa zwei verschiedene eindimensionale Untervektorräume
x3 des R2 (siehe Abb. 6.10).

x2
U2
 ∈ U1 ∪ U2

x1
U1
x1 x2

Abbildung 6.10 Die Summe der zwei Vektoren aus U1 ∪ U2 ist nicht Element
von U1 ∪ U2 , also ist U1 ∪ U2 kein Vektorraum.

Man beachte auch den Unterschied zwischen der Summe und


der Vereinigung von Untervektorräumen.
Abbildung 6.9 Der Schnitt der beiden Untervektorräume U und W ist eine
Gerade.

⎛ ⎞ ⎛ ⎞
1 0 Die Summe der Dimensionen von U und W ist
Für v = λ1 ⎝0⎠ +λ2 ⎝ 1 ⎠ mit λ1 , λ2 ∈ R gilt v ∈ U ∩W
gleich der Summe der Dimensionen von
1 −1
genau dann, wenn es μ1 , μ2 ∈ R gibt, sodass U ∩ W und U + W
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ Die Summe U + W von Untervektorräumen U und W eines
1 0 1 0
λ1 ⎝0⎠ + λ2 ⎝ 1 ⎠ = μ1 ⎝ 0 ⎠ + μ2 ⎝1⎠ K-Vektorraums V ist erneut ein Untervektorraum von V .
1 −1 −1 1 Doch welche Dimension hat der Vektorraum U + W ? Die
naheliegende Formel dim(U + W ) = dim U + dim W ist
gilt. Wir bestimmen daher die Lösungsmenge L des homo- falsch, wie das Beispiel U = W = -e1 . ⊆ R2 zeigt, hier
genen linearen Gleichungssystems über R mit der folgenden gilt:
erweiterten Koeffizientenmatrix:
dim U + dim W = 2 = 1 = dim(U + W ) .
⎛ ⎞
1 0 −1 0 0
⎝ 0 1 0 −1 0 ⎠ Korrekt hingegen ist die folgende Dimensionsformel:
1 −1 1 −1 0
Die Dimensionsformel für Untervektorräume
Mittels elementarer Zeilenumformungen wird diese Matrix Sind U und W endlichdimensionale Untervektorräume
überführt in ⎛ ⎞ des K-Vektorraums V , so gilt:
1 0 0 −1 0
⎝ 0 1 0 −1 0 ⎠
dim(U ∩ W ) + dim(U + W ) = dim U + dim W .
0 0 1 −1 0
218 6 Vektorräume – von Basen und Dimensionen

Man beachte die Ähnlichkeit zu der folgenden Formel aus Der triviale Durchschnitt kennzeichnet direkte
der elementaren Mengenlehre (siehe Seite 40): Summen
|A ∩ B| + |A ∪ B| = |A| + |B| .
Ein K-Vektorraum V heißt direkte Summe der Untervek-
torräume U und W , in Zeichen
Beweis: Es sei B = {b1 , . . . , br } eine Basis des Vektor-
raums U ∩ W ⊆ U, W . Wir ergänzen B zu einer Basis BU V =U ⊕W ,
von U und zu einer Basis BW von W , falls
BU = {b1 , . . . , br , u1 , . . . , us } , (i) V = U + W ,
BW = {b1 , . . . , br , w 1 , . . . , wt } . (ii) U ∩ W = {0}.
Nun begründen wir, warum Der Vektorraum V ist somit die Summe von U und W , wobei
U und W einen trivialen Durchschnitt haben.
BU ∪ BW = {b1 , . . . , br , u1 , . . . , us , w 1 , . . . , wt }
Beispiel Der R3 ist die direkte Summe einer Ebene und
eine Basis von U + W ist.
einer Geraden:
(i) BU ∪ BW erzeugt U + W , da nach dem Lemma auf ?⎛1⎞ ⎛0⎞@ ?⎛0⎞@
Seite 216 gilt: R3 = ⎝1⎠ , ⎝1⎠ ⊕ ⎝0⎠ . 
-BU ∪ BW . = U + W . 0 1 1

(ii) BU ∪ BW ist linear unabhängig: Sind λ1 , . . . , λr , Ist V = U + W , so kann man jeden Vektor v ∈ V als
μ1 , . . . , μs und ν1 , . . . , νt aus K gegeben, und gilt eine Summe v = u + w schreiben. Eine solche Darstellung
!
r !
s !
t ist aber im Allgemeinen nicht eindeutig, wie das einfache
(∗) λi bi + μi ui + νi w i = 0 , Beispiel v = e1 im Fall U = -e1 . = W zeigt. Im Fall einer
i=1 i=1 i=1 direkten Summe ist die Situation anders:
so erhalten wir: Lemma
!
r !
s !
t Ist V die direkte Summe zweier Untervektorräume U
λi bi + μi ui = − νi wi . und W , so existiert zu jedem v ∈ V genau eine Darstellung
i=1 i=1 i=1 der Form
v =u+w
Der Vektor links vom Gleichheitszeichen liegt in U , der Vek-
tor rechts davon in W , sodass mit u ∈ U und w ∈ W .

!
r !
s
Beweis: Aus
λi bi + μi ui ∈ U ∩ W = -B. .
i=1 i=1 u + w = v = u + w 
Es folgt μ1 = · · · μs = 0. Da BW linear unabhängig ist, mit u, u ∈ U und w, w  ∈ W folgt:
erhalten wir nun aus (∗) weiterhin
u − u = w  − w .
 
λ1 = · · · λr = 0 = ν1 = · · · νt . ∈U ∈W

Wegen Wegen U ∩ W = {0} gilt also u − u = 0 = w  − w. Das


|B| + |BU ∪ BW | = |BU | + |BW | liefert:
u = u und w = w . 
gilt die Dimensionsformel. 

Beispiel Wir betrachten erneut das Beispiel von Seite 217:


Für die Untervektorräume Ein Komplement ist ein direkter Summand
?⎛1⎞ ⎛ 0 ⎞@ ?⎛ 1 ⎞ ⎛0⎞@
Ist U ein Untervektorraum eines K-Vektorraums V , so heißt
U = ⎝0⎠ , ⎝ 1 ⎠ und W = ⎝ 0 ⎠ , ⎝1⎠ ein Untervektorraum W von V ein Komplement von U in
1 −1 −1 1 V , wenn V = U ⊕ W .
gilt dim U = 2 und dim W = 2. Wegen U ∩ W = -e1 +
e2 . gilt dim(U ∩ W ) = 1. Mit der Dimensionsformel für Satz über die Existenz von Komplementen
Untervektorräume folgt nun Ist U ein Untervektorraum eines K-Vektorraums V , so
besitzt U ein Komplement in V .
dim(U + W ) = dim U + dim W − dim(U ∩ W ) = 3 . 
6.5 Summe und Durchschnitt von Untervektorräumen 219

Beweis: Es sei BU eine Basis von U . Nach dem Basis- Die Äquivalenzklassen haben somit die Form
ergänzungssatz von Seite 207 können wir die linear unab-
hängige Menge BU mittels einer linear unabhängigen Menge
BU zu einer Basis BU ∪ BU von V ergänzen. Die Menge BU [v]∼ = v + U .
erzeugt einen Unterrvektorraum W = -BU .. Wir begründen,
dass W ein Komplement von U in V ist. Wegen
Für die Quotientenmenge V / ∼, das ist die Menge aller Äqui-
U + W = -BU ∪ BU . = V valenzklassen, ist die Schreibweise V /U üblich,

ist V die Summe der beiden Untervektorräume U und W von


V . Ist v ∈ U ∩ W , so ist v eine Linearkombination von BU V /U = {[v]∼ | v ∈ V } = {v + U | v ∈ V } .
und von BU . Somit gibt es λ1 , . . . , λr , μ1 , . . . , μs ∈ K und
v 1 , . . . , v r ∈ BU , w1 , . . . , ws ∈ BU mit
Für das Zeichen V /U verwendet man die Sprechweise V
λ1 v 1 + · · · + λr v r = v = μ1 w1 + · · · + μr ws . nach U oder V modulo U . Wegen der Form der Äquiva-
lenzklasse nennt man v + U auch (Links-)Nebenklasse von
Nun stellen wir diese Gleichung um:
v nach U und spricht anstelle von der Quotientenmenge V /U
λ1 v 1 + · · · + λr v r − (μ1 w1 + · · · + μr ws ) = 0 . auch von der Menge der (Links-)Nebenklassen.

Wegen der linearen Unabhängigkeit von BU ∪ BU folgt Die Äquivalenzklassen bilden eine Zerlegung der Menge V in
hieraus λi = 0 = μj für alle vorkommenden i und j . Dies disjunkte, nichtleere Teilmengen (man beachte den Abschnitt
zeigt v = 0, d. h., U ∩ W = {0}. Also ist W ein Komplement auf Seite 55 f.).
von U in V . 

Wir arbeiten nun mit diesen Äquivalenzklassen als Elemente


Auf Seite 219 bestimmen wir in einem ausführlichen Beispiel der Quotientenmenge weiter. Unser Ziel ist es, V /U zu einem
ein Komplement des Untervektorraums der symmetrischen K-Vektorraum zu machen. Dazu führen wir nun eine Addi-
Matrizen im Vektorraum aller quadratischen Matrizen über tion von Nebenklassen und eine Multiplikation von Neben-
einem Körper K. klassen mit Skalaren ein. Wir setzen für v+U, w+U ∈ V /U
und λ ∈ K:

Ein Faktorraum ist ein Vektorraum, dessen


(v + U ) + (w + U ) = (v + w) + U,
Elemente Äquivalenzklassen sind
λ · (v + U ) = (λ v) + U .
Wir schildern die Konstruktion eines Vektorraums V /U aus
einem Vektorraum V mithilfe eines Untervektorraums U .
Zwei Nebenklassen werden also miteinander addiert, indem
Dazu benutzen wir die Äquivalenzrelationen aus Kapitel 2,
man die Repräsentanten addiert und davon die Nebenklasse
Seite 53.
bildet, und eine Nebenklasse wird mit einem Skalar multi-
Gegeben sind ein K-Vektorraum V und ein (beliebiger) Un- pliziert, indem der Repräsentant mit dem Skalar multipliziert
tervektorraum U von V . Wir führen eine Äquivalenzrelation und davon die Nebenklasse gebildet wird.
∼ auf der Menge V ein. Dabei nennen wir zwei Elemente
v und w aus V äquivalent, wenn die Differenz v − w im Die Definition ist nur dann sinnvoll, wenn sie unabhängig
vorgegebenen Untervektorraum U liegt, d. h., für v, w ∈ V von der Wahl der Repräsentanten v und w ist. Würde nämlich
gilt: etwa v + U = v  + U für verschiedene Elemente v = v  aus
v ∼w ⇔ v−w ∈U. V gelten, aber (λ v) + U = (λ v  ) + U möglich sein, so wäre

? 
K × V /U → V /U,
Warum ist ∼ eine Äquivalenzrelation? ·:
(λ, v + U ) → (λ v) + U

Wir betrachten nun eine Äquivalenzklasse bezüglich dieser


Relation ∼. Für ein v ∈ V ist keine Abbildung, da einem Element v + U der Definitions-
menge verschiedene Elemente der Wertemenge zugeordnet
[v]∼ = {w ∈ V | w ∼ v} werden.
= {w ∈ V | w − v ∈ U }
Um also nachzuweisen, dass unsere Definitionen sinnvoll
= {w ∈ V | w − v = u, u ∈ U }
sind, müssen wir zeigen, dass unabhängig von der Wahl des
= {w ∈ V | w = v + u, u ∈ U } Repräsentanten stets dasselbe Element bei der Addition und
=v+U. der Multiplikation entsteht. Wir zeigen mehr:
220 6 Vektorräume – von Basen und Dimensionen

Beispiel: Symmetrische und schiefsymmetrische Matrizen


Eine quadratische Matrix A ∈ Kn×n heißt symmetrisch, wenn A = A0 erfüllt ist; sie heißt schiefsymmetrisch, wenn
A = −A0 gilt. Die Menge der symmetrischen bzw. schiefsymmetrischen n × n-Matrizen über K bezeichnen wir mit S(n, K)
bzw. A(n, K) und zeigen, dass S(n, K) und A(n, K) komplementäre Untervektorräume des Kn×n sind mit
n (n + 1) n (n − 1)
dim S(n, K) = und dim A(n, K) = .
2 2
Somit besitzt jede Matrix M ∈ Kn×n genau eine Darstellung

M = S + A mit S ∈ S(n, K), A ∈ A(n, K) .

Problemanalyse und Strategie: Wir zeigen, dass Kn×n die direkte Summe der Untervektorräume S(n, K) und
A(n, K) ist und bestimmen Basen dieser Untervektorräume.

Lösung: genauso. So folgt etwa aus A0 = −A, B 0 = −B so-


Bevor wir den allgemeinen Fall behandeln, sehen wir gleich (A + B)0 = A0 + B 0 = −A − B = −(A + B).
uns zunächst exemplarisch den Fall n = 2 an. Es gilt Wir gehen von der Standardbasis B = {Eij | 1 ≤ i, j ≤ n}
dim K2×2 = 4. Die Standardbasis des K2×2 ist B = des Kn×n aus. Eine Matrix A = (aij ) ∈ Kn×n ist genau
{E11 , E12 , E21 , E22 } mit dann symmetrisch, wenn aij = aj i für i < j gilt. In die-
        sem Fall kann man in der Darstellung A = ni,j =1 aij Eij
E11 = 01 00 , E12 = 00 01 , E21 = 01 00 , E22 = 00 01 .
die beiden Summanden aij Eij + aj i Ej i zu einem einzi-
 
Die Darstellung von A = ac db ∈ K2×2 als Linearkom- gen, nämlich aij (Eij + Ej i ) zusammenfassen. Somit ist
bination der kanonischen Basis ist
S = {Eii | 1 ≤ i ≤ n} ∪ {Eij + Ej i | 1 ≤ i < j ≤ n}
A = a E11 + b E12 + c E21 + d E22 .
eine Basis von S(n, K), und es gilt dim S(n, K) = |S| =
Wir setzen n(n + 1)/2. Die Matrix A ist genau dann schiefsymme-
    trisch, wenn aii = −aii , d. h., aii = 0 für alle Elemente
S = 01 01 = E12 + E21 , T = 01 −1
0 = −E12 + E21 .
in der Hauptdiagonalen von A gilt und aij = −aj i für
Weil S und T linear unabhängig sind, ist {E11 , E22 , S, T } i < j . Man sieht dann analog, dass
eine Basis des K2×2 .
Die Symmetrie bzw. Schiefsymmetrie von A lässt sich A = {Eij − Ej i | 1 ≤ i < j ≤ n}
folgendermaßen ausdrücken:
  eine Basis von A(n, K) ist. Es folgt dim A(n, K) = |A| =
A = A0 ⇔ b = c ⇔ A = ab db = n(n − 1)/2.
      Für eine beliebige Matrix M ∈ Kn×n gilt:
= a 01 00 + d 00 01 + b 01 01 ∈ -E11 , E22 , S.,
A = −A0 ⇔ a = d = 0 und b = −c M=
1 1
(M + M 0 ) + (M − M 0 )
   0 −1  2 2
⇔ A = 0c −c  
0 = c 1 0 ∈ -T .. =S =A
Demnach ist {E11 , E22 , S} eine Basis von S(2, K), also   
dim S(2, K) = 3, und {T } ist eine Basis von A(2, K), also mit S0 = 1
M0+ (M 0 )0= M 0 + M) = S,
1
2 2 
dim A(2, K) = 1. Jede Matrix lässt sich auf genau eine d. h., S ∈ S(n, K), und A0 = 21 M 0 − (M 0 )0 =
1
 0  
2 M −M) = −A, d. h., A ∈ A(n, K). Ist M = S +A
Weise als Summe einer symmetrischen und einer schief-
symmetrischen Matrix schreiben: 
eine weitere solche Darstellung, so gilt S + A = S + A ,
' ( ' ( ' b−c ( und folglich ist
a b a b+c 0
= b+c 2 + 2
c d 2 d − b−c
2 0 S − S  = A − A ∈ S(n, K) ∩ A(n, K)
 
∈S(2, K) ∈A(2, K)
eine Matrix, die zugleich symmetrisch und schiefsymme-
b+c b−c trisch ist. Da die Nullmatrix 0 ∈ Kn×n die einzige Matrix
= a E11 + d E22 + S− T.
2 2 mit dieser Eigenschaft ist, folgt S = S  , A = A , und wir
Sind nun A, B ∈ S(n, K), d. h., A0 = A, B 0 = B, haben auch die Eindeutigkeit der Darstellung gezeigt.
so folgt (A + B)0 = A0 + B 0 = A + B, d. h., Es gilt etwa:
A + B ∈ S(n, K), und (λ A)0 = λ A0 = λ A für λ ∈ K, ' ( ' ( ' (
d. h., λ A ∈ S(n, K). 6 13 6 9 0 4
= +
Die Menge S(n, K) ist demnach ein Untervektorraum des 5 11 9 11 −4 0
 
Kn×n . Der Beweis für schiefsymmetrische Matrizen geht ∈S(n, R) ∈A(n, R)
6.5 Summe und Durchschnitt von Untervektorräumen 221

Der Vektorraum V /U Wenn wir zeigen können, dass die Menge


Für jeden Untervektorraum U eines K-Vektorraums V
B = {b1 + U, . . . , bn−r + U }
ist
V /U = {v + U | v ∈ V }
eine Basis von V /U ist, folgt die Behauptung
mit der Addition
dim V /U = n − r = dim V − dim U .
(v + U ) + (w + U ) = (v + w) + U , v, w ∈ V
Es ist B ein Erzeugendensystem von V /U : Es sei v + U
und der Multiplikation mit Skalaren ∈ V /U . Wegen v ∈ V = W + U existieren Skalare
λ1 , . . . , λn−r ∈ K und ein u ∈ U mit
λ · (v + U ) = (λ v) + U , λ ∈ K , v ∈ V
v = λ1 b1 + · · · + λn−r bn−r + u .
ein K-Vektorraum. Ist V endlichdimensional, so gilt:
Es folgt durch Übergang zu Nebenklassen
dim V /U = dim V − dim U .
v + U = λ1 b1 + · · · + λn−r bn−r + U

Beweis: Die Addition ist wohldefiniert: Es seien v, v  , = λ1 (b1 + U ) + · · · + λn−r (bn−r + U ) ∈ -B. .
w, w  ∈ V mit
Es ist B linear unabhängig: Es gelte
 
v + U = v + U und w + U = w + U λ1 (b1 + U ) + · · · + λn−r (bn−r + U ) = 0 = U (6.6)

gegeben. Es folgt v  − v, w  − w ∈ U . Daher gilt: für Skalare λ1 , . . . , λn−r ∈ K. Wegen

(v  + w  ) − (v + w) = (v  − v) + (w  − w) ∈ U . λ1 (b1 + U ) + · · · + λn−r (bn−r + U )


=λ1 b1 + · · · + λn−r bn−r + U
Nun folgt aber (v  + w  ) ∼ (v + w), d. h.,
besagt die Gleichung (6.6):
(v  + w  ) + U = (v + w) + U .
λ1 b1 + · · · + λn−r bn−r ∈ U .
Die Multiplikation mit Skalaren ist wohldefiniert: Es seien
λ ∈ K und v, v  ∈ V mit Da -B. = W aber das Komplement von U in V ist, ist nur
der Fall λ1 = · · · = λn−r = 0 möglich. 

v + U = v + U
Beispiel Wir betrachten den Untervektorraum U = -e1 .
gegeben. Es folgt v  − v ∈ U . Daher gilt des R3 . Da -e2 , e3 . ein Komplement zu U in R3 ist, erhalten
wir
λ v  − λ v = λ (v  − v) ∈ U .
R3 /U = -e2 + U, e3 + U .

Nun folgt aber λ v  ∼ λ v, d. h., und dim R3 /U = 2. 

(λ v  ) + U = (λ v) + U .
Kommentar: Das Prinzip der Konstruktion des Vektor-
Dass V /U mit dieser Addition eine abelsche Gruppe ist, raums V /U aus V und U findet sich in der Algebra immer
wurde im Wesentlichen auf Seite 77 gezeigt. Das neutrale wieder. Z. B. wird aus einer Gruppe G mit einem Normal-
Element bezüglich dieser Addition ist die Nebenklasse teiler U die Faktorgruppe G/U gebildet, und aus einem Ring
R kann man mit einem Ideal I den Faktorring R/I konstru-
ieren. Das Ziel einer solchen Konstruktion ist es oftmals, aus
0+U =U.
Gruppen, Ringen oder Vektorräumen neue Strukturen zu ge-
winnen, die vorgegebene Eigenschaften erfüllen.
Die Gültigkeit der Vektorraumaxiome (V1)–(V4) ist offen-
sichtlich, da diese Axiome ja in V erfüllt sind. Es bleibt also Aber nicht nur in der Algebra, auch in allen weiteren Gebieten
nur noch die Formel zur Dimension nachzuweisen. Dazu set- der Mathematik werden ähnliche Konstruktionen durchge-
zen wir nun voraus, dass V die Dimension n ∈ N0 hat. Der führt, die aus einer gegebenen Struktur mithilfe von Äquiva-
Untervektorraum U habe die Dimension r ≤ n. Wir wählen lenzrelationen eine neue Struktur schaffen. Wir werden zum
ein Komplement W ⊆ V zu U , V = W ⊕ U . Die Dimension Beispiel im Kapitel 19 auf ähnliche Weise die reellen Zahlen
von W ist n − r. Es sei {b1 , . . . , bn−r } eine Basis von W . aus den rationalen Zahlen gewinnen.
222 6 Vektorräume – von Basen und Dimensionen

Zusammenfassung

Die lineare Algebra kann auch als Theorie der Vektorräume so gilt für den Durchschnitt -X. aller Untervektorräume U
bezeichnet werden, ein Vektorraum ist dabei wie folgt defi- von V mit X ⊆ U
niert.  n 
!
-X. = λi v i | n ∈ N, λi ∈ K, v i ∈ X, i = 1, . . . , n
Definition eines K-Vektorraums i=1

Es seien K ein Körper, (V , +) eine abelsche Gruppe und – man spricht vom Erzeugnis von X. Es kann durchaus sein,
 dass eine echte Teilmenge T X denselben Untervektor-
K×V → V
·: raum erzeugt, -T . = -X.. Falls dies aber für keine echte
(λ, v)  → λ · v
Teilmenge von X möglich ist, so nennt man X linear unab-
eine Abbildung. Falls für alle u, v, w ∈ V und λ, μ ∈ hängig, genauer:
K die Eigenschaften
(V1) λ · (v + w) = λ · v + λ · w, Definition der linearen Unabhängigkeit
(V2) (λ + μ) · v = λ · v + μ · v, Verschiedene Vektoren v 1 , . . . , v r ∈ V heißen linear
(V3) (λ μ) · v = λ · (μ · v), unabhängig, wenn für jede echte Teilmenge T von
(V4) 1 · v = v {v 1 , . . . , v r } gilt -T . -v 1 , . . . , v r ..
gelten, nennt man V einen Vektorraum über K oder
Eine Menge X ⊆ V heißt linear unabhängig, wenn je
kurz einen K-Vektorraum.
endlich viele verschiedene Elemente aus X linear unab-
hängig sind.
Viele Strukturen in der Mathematik bilden Vektorräume,
wichtige Beispiele von Vektorräumen sind Ein einfacher Test auf lineare Unabhängigkeit funktioniert
wie folgt:
der Kn , die Spaltenvektoren mit Komponenten aus K,
der Km×n , die Matrizen mit Komponenten aus K, Falls für verschiedene Vektoren v 1 , . . . , v r ∈ V und Skalare
der K[X], die Polynome mit Koeffizienten aus K, λ1 , . . . , λr gilt:
der KK , die Abbildungen von K nach K.
r
Aus λi v i = 0 folgt λ1 = λ2 = · · · = λr = 0 ,
In der Analysis lernen wir viele weitere Beispiele kennen, i=1
etwa den Vektorraum aller auf einem Intervall [a, b] ⊆ R
so sind v 1 , . . . , v r linear unabhängig.
stetigen oder integrierbaren Funktionen. Eine Theorie der
Vektorräume bringt diese vielfältigen mathematischen Struk- Ein linear unabhängiges Erzeugendensystem eines Vektor-
turen unter einen Hut. raums V nennt man eine Basis von V . Man kann eine Basis
von V auch anderes beschreiben: Eine Basis ist ein mini-
Wie immer in der Algebra untersucht man bei einer Struktur
males Erzeugendensystem von V oder eine maximale linear
die Unterstrukturen, im vorliegenden Fall von Vektorräumen
unabhängige Teilmenge von V .
also Untervektorräume. Das sind Teilmengen von Vektorräu-
men, die für sich genommen wieder Vektorräume sind. Um Da eine Basis B eines K-Vektorraums V insbesondere ein
nachzuweisen, dass eine Teilmenge eines Vektorraumes wie- Erzeugendensystem von V ist, kann jeder Vektor von V be-
der ein Vektorraum ist, ist nicht viel Aufwand nötig, es gilt züglich B als Linearkombination dargestellt werden,
nämlich:
v = λ1 b 1 + · · · + λn b n
Eine nichtleere Teilmenge U eines K-Vektorraums V ist ein
Untervektorraum von V , wenn gilt: mit λ1 , . . . , λn ∈ K und b1 , . . . , bn ∈ B. Tatsächlich gelingt
dies bei einer Basis B sogar eindeutig. Das ist wesentlich, es
(U1) u, w ∈ U ⇒ u + w ∈ U , gelingt uns nämlich so, jeden Vektor v ∈ V im Fall einer
(U2) λ ∈ K, u ∈ U ⇒ λ u ∈ U . endlichen Basis, |B| = n, mit dem Tupel von Koeffizien-
ten (λ1 , . . . , λn ) ∈ Kn zu identifizieren, wir zeigen das in
Hiermit ist es leicht zu zeigen, dass Lösungsmengen homoge- Kapitel 12.
ner linearer Gleichungssysteme und Polynome bis zu einem
festen Grad Vektorräume bilden. Jeder Vektorraum V besitzt eine Basis. Dieser prägnante Satz
ist eine der Kernaussagen der linearen Algebra. Tatsächlich
Es ist sehr einfach, einen kleinsten Untervektorraum anzu- beweist man etwas mehr. Man zeigt, dass jede linear unab-
geben, der vorgegebene Vektoren enthält. Ist nämlich X eine hängige Menge A eines Erzeugendensystems S von V durch
solche Menge vorgegebener Vektoren eines Vektorraumes V , Elemente von S zu einer Basis B von V ergänzt werden
Aufgaben 223

kann – das ist der Inhalt des Basisergänzungssatzes. Der Be- Ein Sonderfall ist von besonderem Interesse, nämlich der
weis dieses Satzes ist in dieser allgemeinen Form alles andere Fall U ∩ W = {0} und U + W = V . Man nennt V in dieser
als einfach. Er erfordert das Zorn’sche Lemma, ein Axiom der Situation die direkte Summe von U und W und schreibt dafür
Mengenlehre.
V =U ⊕W .
Ein Vektorraum hat im Allgemeinen viele verschiedene Ba-
sen. Aber je zwei Basen B und C eines Vektorraums V ist Die Dimensionsformel lautet in diesem Fall
eines gemeinsam, es gilt nämlich |B| = |C|. Daher ist es
dim V = dim U + dim W .
sinnvoll, die Mächtigkeit |B| einer Basis B von V die Dimen-
sion dim V von V zu nennen, die Definition ist unabhängig Den Untervektorraum U bzw. W nennt man ein Komplement
von der Wahl der Basis. von W bzw. U in V , solche Komplemente existieren stets:
Für die Dimensionen von Schnitt und Summe endlichdimen-
sionaler Untervektorräume U und W eines K-Vektorraums Satz über die Existenz von Komplementen
V gilt die Dimensionsformel Ist U ein Untervektorraum eines K-Vektorraums V , so
besitzt U ein Komplement in V .
dim(U ∩ W ) + dim(U + W ) = dim U + dim W .

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

⎧⎛ ⎞ ⎫
Verständnisfragen ⎨ v1 ⎬
6.1 • Gelten in einem Vektorraum V die folgenden (a) U1 = ⎝v2 ⎠ ∈ R3 | v1 + v2 = 2
⎩ ⎭
Aussagen? v
⎧⎛ 3 ⎞ ⎫
(a) Ist eine Basis von V unendlich, so sind alle Basen von ⎨ v1 ⎬
V unendlich. (b) U2 = ⎝v2 ⎠ ∈ R3 | v1 + v2 = v3
⎩ ⎭
(b) Ist eine Basis von V endlich, so sind alle Basen von V v
⎧⎛ 3 ⎞ ⎫
endlich. ⎨ v1 ⎬
(c) Hat V ein unendliches Erzeugendensystem, so sind alle (c) U3 = ⎝v2 ⎠ ∈ R3 | v1 v2 = v3
⎩ ⎭
Basen von V unendlich. v
⎧⎛ 3 ⎞ ⎫
(d) Ist eine linear unabhängige Menge von V endlich, so ist ⎨ v1 ⎬
es jede. (d) U4 = ⎝v2 ⎠ ∈ R3 | v1 = v2 oder v1 = v3
⎩ ⎭
6.2 • Gegeben sind ein Untervektorraum U eines K- v3
Vektorraums V und Elemente u, w ∈ V . Welche der folgen-
den Aussagen sind richtig? 6.6 •• Welche der folgenden Teilmengen des R-
(a) Sind u und w nicht in U , so ist auch u + w nicht in U . Vektorraums RR sind Untervektorräume? Begründen Sie Ihre
(b) Sind u und w nicht in U , so ist u + w in U . Aussagen.
(c) Ist u in U , nicht aber w, so ist u + w nicht in U . (a) U1 = {f ∈ RR | f (1) = 0}
6.3 • Folgt aus der linearen Unabhängigkeit von u und (b) U2 = {f ∈ RR | f (0) = 1}
v eines K-Vektorraums auch jene von u − v und u + v? (c) U3 = {f ∈ RR | f hat höchstens endlich viele
Nullstellen}
6.4 • Folgt aus der linearen Unabhängigkeit der drei (d) U4 = {f ∈ RR | für höchstens endlich viele x ∈ R ist
Vektoren u, v, w eines K-Vektorraums auch die lineare Un- f (x) = 0}
abhängigkeit der drei Vektoren u + v + w, u + v, v + w? (e) U5 = {f ∈ RR | f ist monoton wachsend}
6.5 • Geben Sie zu folgenden Teilmengen des R- (f) U6 = {f ∈ RR | die Abbildung g ∈ RR mit g(x) =
Vektorraums R3 an, ob sie Untervektorräume sind, und be- f (x) − f (x − 1) liegt in U }, wobei U ⊆ RR ein vorge-
gründen Sie dies: gebener Untervektorraum ist.
224 6 Vektorräume – von Basen und Dimensionen

6.7 •• Gibt es für jede natürliche Zahl n eine Menge 6.13 •• Begründen Sie, dass für jedes n ∈ N die Menge
A mit n + 1 verschiedenen Vektoren v 1 , . . . , v n+1 ∈ Rn , ⎧ ⎛ ⎞ ⎫
sodass je n Elemente von A linear unabhängig sind? Geben ⎪
⎨ u1 ⎪

⎜ ⎟
Sie eventuell für ein festes n eine solche an. U = u = ⎝ ... ⎠ ∈ Rn | u1 + · · · + un = 0

⎩ ⎪

un
6.8 •• Da dim(U + V ) = dim U + dim V − dim(U ∩
V ) gilt, gilt doch sicher auch analog zu Mengen dim(U +V + einen R-Vektorraum bildet, und bestimmen Sie eine Basis
W ) = dim U + dim V + dim W − dim(U ∩ V ) − dim(U ∩ und die Dimension von U .
W ) − dim(V ∩ W ) + dim(U ∩ V ∩ W )? Beweisen oder
widerlegen Sie die Formel für dim(U + V + W )! 6.14 •• Bestimmen Sie die Dimension des Vektorraums

-f1 : x → sin(x), f2 : x → sin(2x), f3 : x → sin(3x).


Rechenaufgaben ⊆ RR .
6.9 • Wir betrachten im R2 die drei Untervektorräume
<' (= <' ( ' (= <' (=
1 1 1 1 6.15 •• Es seien a, b verschiedene, linear unabhängige
U1 = , U2 = , und U3 = . Wel-
2 1 −2 −3 Elemente eines K-Vektorraums V . Wir setzen für Skalare
che der folgenden Aussagen ist richtig? λ, μ, ν, σ ∈ K:
' (
−2
(a) Es ist ein Erzeugendensystem von U1 ∩ U2 . c = λ a + μ b und
−4
d = ν a + σ b.
(b) Die leere Menge ∅ ist eine Basis von U1 ∩ U3 .
' (
(c) Es ist
1
eine linear unabhängige Teilmenge von Unter welcher Bedingung an λ, μ, ν, σ ∈ K sind c, d linear
4 unabhängig?
U2 .
(d) Es gilt -U1 ∪ U3 . = R2 .
Beweisaufgaben
6.10 •• Prüfen Sie, ob die Menge 6.16 •• Begründen Sie, dass sich die Kommutativität
der Vektoraddition aus den restlichen Axiomen folgern lässt,
 ' ( ' ( vgl. auch den Kommentar auf Seite 192.
1 0 1 1
B := v 1 = , v2 = ,
0 1 0 0
' ( ' ( 6.17 • Es seien U1 , U2 , U3 Untervektorräume eines
0 1 0 0 K-Vektorraums V . Weiter gelte
v3 = , v4 = ⊆ R2×2
−1 0 1 0
U1 + U3 = U2 + U3 , U1 ∩ U3 = U2 ∩ U3 und U1 ⊆ U2 .
eine Basis des R2×2 bildet.
Zeigen Sie U1 = U2 .
6.11 •• Bestimmen Sie eine Basis des von der Menge
6.18 •• Eine Funktion f : R → R heißt gerade (bzw.
⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫ ungerade), falls f (x) = f (−x) für alle x ∈ R (bzw.

⎪ 0 1 −1 −1 1 2 ⎪⎪
⎨⎜ ⎟ ⎜ ⎟ ⎜−2⎟ ⎜ 0 ⎟ ⎜ 0 ⎟ ⎜ 0 ⎟⎬ f (x) = −f (−x) für alle x ∈ R). Die Menge der geraden
1 0
X= ⎜ ⎟ ⎜ ⎟
⎝ 0 ⎠, ⎝ 1 ⎠,
⎜ ⎟, ⎜ ⎟, ⎜ ⎟,
⎝ 0 ⎠ ⎝ 1 ⎠ ⎝−1⎠
⎜ ⎟
⎝−1⎠⎪ (bzw. ungeraden) Funktionen werde mit G (bzw. U ) bezeich-

⎪ ⎪
⎩ ⎭ net. Beweisen Sie: Es sind G und U Untervektorräume von
−1 −2 1 0 −1 0
RR , und es gilt RR = G ⊕ U .

erzeugten Untervektorraums U = -X. des R4 .


6.19 ••• Es seien K ein Körper mit |K| = ∞ und V ein
K-Vektorraum. Ferner seien n ∈ N und U1 , . . . , Un Unter-
6.12 • Schreiben Sie die Matrix vektorräume von V mit Ui = V für i = 1, . . . , n. Zeigen
⎛ √ ⎞ Sie:
−2 − 2 √1 n

A=⎝ 3 1 2⎠ ∈ R3×3 Ui  = V .
1 −3 2 i=1

(Anders formuliert: Ist |K| = ∞, so lässt sich V nicht als


als Summe einer symmetrischen und einer schiefsymmetri- Vereinigung endlich vieler echter Untervektorräume schrei-
schen Matrix. ben.)
Antworten der Selbstfragen 225

Antworten der Selbstfragen

S. 190 S. 204
Vgl. die Definition auf Seite 65: Für alle u, v, w aus V gilt: Der Nullvektorraum {0} besitzt die einzige Basis ∅ und der
Z2 -Vektorraum Z2 besitzt die einzige Basis {1}. Jeder K-
(AG1) (u + v) + w = u + (v + w) (Assoziativität).
Vektorraum besitzt im Fall K = Z2 mehr als eine Basis,
(AG2) Es gibt ein Element 0 ∈ V mit v + 0 = v (Existenz da man einen Basisvektor b nämlich stets durch λ b mit
eines neutralen Elements). λ ∈ K \ {0} ersetzen kann, man erhält so wieder eine
Basis.
(AG3) Es gibt ein v  ∈ V mit v + v  = 0 (Existenz eines
entgegengesetzten Elements).
S. 204
(AG4) v + w = w + v (Kommutativität).
1. Nein, der R2 ist keine Basis von -R2 . = R2 .
S. 193 2. Ja, jede linear unabhängige Menge X ist Basis von -X..
Da Matrizen Abbildungen sind, sind diese genau dann gleich,
wenn sie dieselbe Definitions- und Wertemenge und die- S. 205
selben Bilder haben: Zwei m × n -Matrizen A = (aij ) Ja! Dass B ein Erzeugendensystem von V ist, folgt aus der
und B = (bij ) über K sind also genau dann gleich, wenn Tatsache, dass sich jeder Vektor als Linearkombination von
aij = bij für alle i, j gilt. B darstellen lässt. Zu überlegen bleibt also nur, ob B linear
unabhängig ist. Es seien v 1 , . . . , v n beliebige Vektoren aus
S. 195 B. Aus der Gleichung
Natürlich ist auch für jeden Körper K die Menge K∅ ein
K-Vektorraum, obiger Beweis gilt für jede Menge M. Die λ 1 v 1 + · · · + λn v n = 0
Menge K∅ besteht aber nur aus einem Element, nämlich
der leeren Menge – es ist ∅ die einzige existierende Abbil- mit λ1 , . . . , λn ∈ K folgt wegen der eindeutigen Darstell-
dung von ∅ in K (beachte die Definition einer Abbildung auf barkeit des Nullvektors sogleich λ1 = · · · = λn = 0, da
Seite 58). Der Vektorraum K∅ ist somit der triviale Vektor- natürlich der Nullvektor trivial dargestellt werden kann,
raum {∅}, das einzige Element ∅ ist der Nullvektor.
0 v1 + · · · + 0 vn = 0 .
S. 197
Neben den trivialen Untervektorräumen sind für alle v =
0 = w und w ∈ R v die Mengen R v und R v + R w = S. 211
{λ v + μ w | λ, μ ∈ R} Untervektorräume. Tatsächlich gibt Der R-Vektorraum R hat die Dimension 1, und jede von null
es keine weiteren Untervektorräume im R3 . verschiedene Zahl ist als Basisvektor wählbar.

S. 199 '
( ' (
a a a b S. 211
Von denen gibt es nur die trivialen . Ist nämlich Es ist U + W nichtleer, weil der Nullvektor 0 in U + W liegt.
a a c d
ein solches magisches Quadrat, so folgt aus Weiter liegen mit zwei Elementen u + w, u + w  ∈ U + W
und λ ∈ K stets auch u + w + u + w  = (u + u ) + (w + w  )
a+b =c+d =a+c =b+d =a+d =b+c und λ (u + w) = λ u + λ w wieder in U + W .

sofort a = b = c = d.
S. 216
Nein, man wähle etwa zwei verschiedene Basen MU und MW
S. 200
eines Vektorraums U = W .
Die Menge M aller Untervektorräume von V , die X enthalten
ist bezüglich der Inklusion ⊆ geordnet. Wir haben gezeigt,
dass -X. bezüglich dieser Ordnung tatsächlich das kleinste S. 219
Element ist, siehe den Abschnitt auf Seite 51. (i) Wegen v − v = 0 ∈ U für alle v ∈ V gilt v ∼ v für alle
v ∈ V.
S. 201 (ii) Da mit jedem Element u ∈ U auch −u in U liegt, folgt
Ja. Der Vektorraum V selbst ist stets ein Erzeugendensystem, aus v ∼ w, d. h., v − w ∈ U , auch w − v ∈ U , d. h., w ∼ v.
es gilt V = -V ..
(iii) Da mit je zwei Elementen aus U auch deren Summe in
S. 201 U liegt, folgt aus u ∼ v und v ∼ w, d. h., u − v, v − w ∈ U ,
Ja, dies folgt aus der Definition. sogleich u − w ∈ U , d. h., u ∼ w.
Analytische Geometrie –
Rechnen statt Zeichnen 7
Was bedeutet die
Koordinateninvarianz des
Vektorprodukts und des
Spatprodukts?
Was versteht man unter der
Hesse’schen Normalform einer
Ebene?
Wie erfolgt die Umrechnung
zwischen einem geozentrischen
und einem heliozentrischen
Koordinatensystem?

7.1 Punkte und Vektoren im Anschauungsraum . . . . . . . . . . . . . . . . 228


7.2 Das Skalarprodukt im Anschauungsraum . . . . . . . . . . . . . . . . . . 232
7.3 Weitere Produkte von Vektoren im Anschauungsraum . . . . . . . 238
7.4 Abstände zwischen Punkten, Geraden und Ebenen . . . . . . . . . . 247
7.5 Wechsel zwischen kartesischen Koordinatensystemen . . . . . . . 257
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
228 7 Analytische Geometrie – Rechnen statt Zeichnen

Historisch gesehen hat sich die Geometrie aus einer Idealisierung 7.1 Punkte und Vektoren im
unserer physikalischen Welt entwickelt. Zunächst war allein die
Zeichnung die Grundlage für geometrische Fragestellungen, für Anschauungsraum
deren Analyse und deren Lösung. Es bedeutete zweifellos einen
besonderen Durchbruch, als man begann, geometrische Ele- Wir haben uns schon in den Kapiteln 5 und 6 mit dem An-
mente durch Zahlen zu beschreiben und damit die zeichnerische schauungsraum befasst. Damit meinen wir den R3 als die
Lösung eines Problems durch eine rechnerische zu ersetzen. geometrische Idealisierung des uns umgebenden physikali-
Dieser für die moderne Wissenschaft so bedeutende Schritt ist schen Raums. Nach Einführung eines Koordinatensystems
vor allem René Descartes (1596–1650), siehe Abbildung 1.17, im Anschauungsraum sind die Punkte a mit den Koordinaten-
⎛ ⎞
und Pierre de Fermat (1607/08–1665) zu verdanken und führte a1
zur Entwicklung der analytischen Geometrie. Ohne diese gäbe tripeln ⎝a2 ⎠ zu identifizieren und als Vektoren des Vektor-
es keine Computergrafik, keine Robotik und keine Raumfahrt, a3
um nur einige wenige unserer heute so selbstverständlichen raums R3 aufzufassen. Somit stehen als Verknüpfungen die
Errungenschaften zu nennen. Addition von Punkten und die skalare Multiplikation von a
mit λ ∈ R zu λa zur Verfügung.
Das Verhältnis zwischen Zeichnung und Rechnung hat sich
neuerdings geradezu umgekehrt: Wenn heute jemand auf dem Im Folgenden wird gezeigt, dass Vektoren im Anschauungs-
Computer mit Geometrie-Software, also mit „virtuellen Zeichen- raum noch eine andere Bedeutung haben.
instrumenten“ konstruiert, so läuft im Hintergrund die Rechnung
ab. Nicht die Rechnung ersetzt die Zeichnung, sondern jetzt dient
die Zeichnung auf dem Bildschirm der benutzerfreundlichen Ein- Vektoren im Anschauungsraum können
gabe von Daten und Ausgabe von errechneten Resultaten. sowohl Punkte als auch Pfeile bedeuten
In diesem Kapitel konzentrieren wir uns auf die analytische
In Kapitel 6 wurde die Summe der Vektoren a, c ∈ R3 defi-
Geometrie des R3 , genauer des dreidimensionalen euklidischen
niert als
Raums. Dies deshalb, weil der R3 unseren physikalischen Raum ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
idealisiert und wir uns die notwendigen Begriffe geometrisch a1 c1 a1 + c1
veranschaulichen können. Die ebene Geometrie ist dabei selbst- a + c = ⎝a2 ⎠ + ⎝c2 ⎠ = ⎝ a2 + c2 ⎠.
verständlich enthalten. Mit der Kenntnis der zwei- und dreidi- a3 c3 a3 + c3
mensionalen Geometrie fällt es uns auch leichter, so manche
Dies bedeutet geometrisch, dass im Anschauungsraum je
n-dimensionale Fragestellung oder allgemeine mathematische
zwei Punkten a, c ein Summenpunkt b = a + c zugeord-
Prinzipien zu verstehen.
net werden kann. Und zwar ergänzt dieser die drei Punkte a,
Im R3 gibt es neben der im vorhergehenden Kapitel behandel- 0 und c zu einem Parallelogramm (Abb. 7.1).
ten Vektorraumstruktur noch andere Verknüpfungen, die eine
geometrische Bedeutung haben. Wir werden uns nach einer x3 b =a+c
Analyse der Begriffe Punkt und Vektor vor allem auf diese
zusätzlichen Produkte konzentrieren und deren geometrische
Bedeutung hervorkehren. Mit den zugehörigen Formeln schaf- a
fen wir uns das Werkzeug, um auch die vorstellungsmäßig
oft recht anspruchsvollen Umrechnungen zwischen räumlichen
Koordinatensystemen übersichtlich zu gestalten. x2 c

Bei unserer Betrachtung des R3 greifen wir gelegentlich auf die


Elementargeometrie zurück, wie sie aus der Schule her bekannt x1
ist. So setzen wir etwa den pythagoreischen Lehrsatz oder 0
den Kosinussatz als bekannt voraus. Dabei verstehen wir die
Abbildung 7.1 Die Summe b = a + c der Punkte a und c ergänzt das Dreieck
hier auftretenden trigonometrischen Funktionen im Sinn ihrer a 0 c zu einem Parallelogramm.
geometrischen Definition. Das Ziel des vorliegenden Kapitels
ist es jedenfalls, die Eleganz und Nützlichkeit der Vektor- und Somit sind alle Punktepaare (a, b), (p, q) mit demselben
Matrizenrechnung im R3 zu demonstrieren. Über das formale Differenzvektor
Rechnen hinaus wollen wir aber die geometrische Bedeutung b−a =q −p
der einzelnen Operationen stets im Auge behalten, um auf
Verallgemeinerungen in späteren Kapiteln vorzubereiten. Elementepaare ein und derselben Translation. Es liegt nahe,
diese Translation grafisch durch Pfeile darzustellen, deren
Endpunkt b das Bild des jeweiligen Anfangspunkts a ist
(Abb. 18.13).
Dies führt uns im Anschauungsraum zu einer neuen Inter-
pretation von Vektoren: Wir verstehen unter einem Vektor
7.1 Punkte und Vektoren im Anschauungsraum 229

x3 Punkte des affinen Raums sind die nulldimensionalen affinen


b Teilräume {a} = a + {0} von V .

q
a Der Vektor v = b − a des Anschauungsraums wird also
durch einen Pfeil mit Anfangspunkt a und Spitze b repräsen-
v p tiert, doch kann dieser Pfeil im Raum noch beliebig paral-
x2
lel verschoben werden, ohne dabei den Vektor zu verändern
(Abb. 7.3).
x1
0 Nun sind im Anschauungsraum sowohl die Punkte, als auch
die durch Pfeile repräsentierten Vektoren jeweils durch drei
Abbildung 7.2 Der Vektor v ist sowohl gleich b − a als auch gleich q − p. Koordinaten festgelegt. Punkte wie Vektoren werden daher
auch auf dieselbe Weise durch fett gedruckte Symbole be-
zeichnet. Dies kann manchmal verwirren.
v ∈ R3 alle möglichen Pfeile, deren jeweiliger Anfangs-
punkt a und Endpunkt b der Bedingung v = b − a genügen. In der Regel ist aus dem Zusammenhang klar, was gemeint
Alle diese Pfeile sind gleich lang und gleich gerichtet. Kennt ist: Wenn wir z. B. eine Gerade darstellen als
man einen, so kennt man alle.
G = {x = a + t u | t ∈ R},
Dahinter steht eine Äquivalenzrelation: Wir nennen zwei
Paare (p, q), (a, b) ∈ (R3 × R3 ) äquivalent, wenn so sind a und x Punkte, während u ein Vektor ist (Abb. 7.5
auf Seite 230).
q −p =b−a
Zur besseren sprachlichen Unterscheidung werden wir die
gilt. Diese Relation auf R3 × R3 ist offensichtlich reflexiv, durch Pfeile repräsentierten Vektoren auch Richtungsvekto-
symmetrisch und transitiv. Die Äquivalenzklassen heißen ren nennen. Und den „Punkt p“ nennen wir gelegentlich auch
Vektoren des Anschauungsraums. Natürlich ist jeder Vektor v den „Punkt mit dem Ortsvektor p“. Dabei verstehen wir un-
bereits durch einen Repräsentanten eindeutig bestimmt, und ter dem Ortsvektor des Punkts p die Differenz p − 0, die re-
so schreiben wir kurz v = b − a ∈ R3 . präsentiert wird durch den vom Koordinatenursprung 0 zum
Punkt p weisenden Pfeil. Zudem werden wir die Symbole a,
b, p, q, x zumeist für Punkte reservieren und u, v, w und n
für Richtungsvektoren.

x3

u v
u+v
v
u−v
u
0 p

x2
x1
Abbildung 7.4 Summe u + v und Differenz u − v von Richtungsvektoren.
Abbildung 7.3 Eine Äquivalenzklasse gleich langer und gleich orientierter
Pfeile ist ein Vektor. Wenn wir auch die Ortsvektoren p, q zweier Punkte durch
Pfeile darstellen, so lässt sich die Bildung der Vektorsumme
p + q auch ohne das Parallelogramm in Abbildung 7.1 geo-
Kommentar: Der Anschauungsraum ist ein affiner Raum metrisch beschreiben. Wir können nämlich einheitlich for-
und wird zunächst als Menge von Punkten verstanden. Jede mulieren:
Äquivalenzklasse von Punktepaaren mit derselben Differenz
Zwei Vektoren werden addiert, indem zugehörige Pfeile
ist ein Vektor, und diese bilden den zum affinen Raum gehö-
aneinandergehängt werden. Zur Bestimmung der Differenz
rigen Vektorraum.
zweier Vektoren wählen wir zwei repräsentierende Pfeile mit
Umgekehrt legt jeder Vektorraum V einen affinen Raum fest demselben Anfangspunkt und legen dann den Differenzvek-
als Menge aller affinen Teilräume a +U mit a ∈ V und U als tor als Pfeil nach der Regel „Endpunkt minus Anfangspunkt“
Untervektorraum von V (siehe auch Kapitel 6, Seite 197). Die fest (Abb. 7.4).
230 7 Analytische Geometrie – Rechnen statt Zeichnen

Beispiel Gegeben sind die drei Punkte Ist b ein weiterer Punkt von G neben a, so können wir sagen,
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ G wird von den Punkten a und b aufgespannt, was man gele-
1 4 3 gentlich mit dem Symbol G = span{a, b} ausdrückt. Wählen
a = ⎝ −2 ⎠, b = ⎝ 3 ⎠, c = ⎝ 4 ⎠. wir nun u = b − a als Richtungsvektor von G, so können
1 3 2
wir die Punkte x von G auch darstellen als
Gesucht ist derjenige Punkt d, welcher die drei Punkte a, b, c
x = a + λ(b − a) = (1 − λ)a + λb mit λ ∈ R.
zu einem Parallelogramm abcd ergänzt.
Damit diese vier Punkte in der angegebenen Reihenfolge ein x ist eine sogenannte Affinkombination von a und b, also
Parallelogramm bilden, müssen die Pfeile von a nach b so- eine Linearkombination, für welche die Summe der verwen-
wie von d nach c gleich lang und gleich gerichtet sein. Dies deten Skalare (1 − λ) + λ genau 1 ergibt.
bedeutet
b − a = c − d, x3
also
d = a − b + c. G

Somit lautet die Lösung: x = a + tu


u
⎛ ⎞
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ b
1 4 3 0
d = ⎝ −2 ⎠ − ⎝ 3 ⎠ + ⎝ 4 ⎠ = ⎝ −1 ⎠. a
1 3 2 0

Wir erkennen: Die vier Punkte a b c d bilden genau dann in x2


dieser Reihenfolge ein Parallelogramm, wenn gilt:
x1
a − b + c − d = 0. 
Abbildung 7.5 Parameterdarstellung der Geraden G.

? Wird zudem λ auf 0 ≤ λ ≤ 1 eingeschränkt, so durchläuft


Bestimmen Sie den Punkt f , welcher die obigen Punkte x genau die abgeschlossene Strecke von a bis b, und dann
a, b, c zu einem Parallelogramm abf c ergänzt. Beachten heißt die Affinkombination Konvexkombination.
Sie dabei die nun geänderte Reihenfolge.
Überprüfen Sie, dass c in der Mitte zwischen f und dem Analog können wir bei den Ebenen vorgehen. Wird die durch
vorhin berechneten Punkt d liegt. den Punkt a gehende Ebene E von den zwei linear unabhän-
gigen Vektoren u und v aufgespannt, so lautet ihre Para-
meterdarstellung:
Eine Teilmenge A des Vektorraums V heißt affiner Teil-
raum, wenn A darstellbar ist als a + U mit a ∈ V und U E = {x = a + μu + νv | (μ, ν) ∈ R2 }.
als Untervektorraum von V . Wir definieren die Dimension
Wir schreiben dafür auch E = p + Ru + Rv.
von A durch die Gleichung dim A = dim U und nennen den
Unterraum U die Richtung von A. Nachdem es sich bei U um Angenommen, E enthält die drei nicht auf einer Geraden
eine Untergruppe der kommutativen Gruppe (V , +) handelt, gelegenen Punkte a, b und c, kurz E = span{a, b, c}. Dann
ist der affine Teilraum A eine Nebenklasse von U im Sinne können wir u = b − a und v = c − a setzen, und Punkte x
von Kapitel 3, Seite 68. von E sind darstellbar als
Im Folgenden wenden wir uns den ein- und zweidimensio- x = a + μ(b − a) + ν(c − a) = (1 − μ − ν)a + μ b + ν c
nalen affinen Teilräumen des Anschauungsraums R3 zu, den
Geraden und Ebenen. mit (μ, ν) ∈ R2 . Wieder liegt eine Linearkombination mit
der Koeffizientensumme 1 vor, und wir können sagen: x ist
genau dann eine Affinkombination von a, b und c, wenn
Affin- und Konvexkombinationen im R3 als x ∈ span{a, b, c} gilt. Die drei Skalare (λ, μ, ν) mit der
spezielle Linearkombinationen Bedingung λ + μ + ν = 1 werden manchmal als überzäh-
lige Punktkoordinaten in der Ebene E verwendet; sie heißen
Wir betrachten die Gerade G = a + Ru, also ausführlich baryzentrische Koordinaten.

G = {x = a + t u | t ∈ R}. In Hinblick auf die vorhin betonte Unterscheidung zwischen


Punkten und Vektoren im Anschauungsraum müssen wir
Ru ist die Richtung dieses affinen Teilraums und u ein Rich- festhalten, dass Affinkombinationen auf Punkte anzuwenden
tungsvektor von G. sind und wiederum Punkte liefern.
7.1 Punkte und Vektoren im Anschauungsraum 231

? Beispiel Nach dem Beispiel auf Seite 230 bilden die vier
Beweisen Sie, dass eine Affinkombination von Affinkom- Punkte
binationen wieder eine Affinkombination ist und dass die ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 4 3 0
analoge Eigenschaft für Konvexkombinationen gilt. a = ⎝ −2 ⎠, b = ⎝ 3 ⎠, c = ⎝ 4 ⎠, d = ⎝ −1 ⎠
1 3 2 0

Welche Punktmenge ist nun durch die Menge aller Kon- ein Parallelogramm. Berechnen Sie dessen Mittelpunkt m.
vexkombinationen von a, b und c beschrieben, wenn diese
Der Mittelpunkt m der Diagonale ac hat die Eigenschaft
Punkte nach wie vor nicht auf einer Geraden liegen? Wir
m − a = c − m, also 2m = a + c. Wir erhalten daraus
untersuchen also
die spezielle Konvexkombinationen
 = {y = λ a + μ b + ν c | λ, μ, ν ≥ 0
und λ + μ + ν = 1}. m = 21 (a + c) = 21 (b + d),

 ist jedenfalls eine Teilmenge von E = span{a, b, c}. Bei nachdem a + c = b + d kennzeichnend ist für das Paral-
ν = 0 ist λ + μ = 1 und daher y ein Punkt der abgeschlosse- lelogramm abcd. Durch Einsetzen der obigen Koordinaten
nen Strecke ab. Bei ν > 0 liegt y = a + μ(b − a) + ν(c − a) folgt: ⎛ ⎞ ⎛ ⎞
innerhalb E auf derjenigen Seite der Geraden ab, welcher 4 2
auch c angehört. Analog folgt aus μ ≥ 0, dass y in E entwe- m = 21 ⎝ 2 ⎠ = ⎝ 1 ⎠. 
3
3
der der abgeschlossenen Strecke ac angehört oder auf der- 2

selben Seite der Geraden ac liegt wie b. Schließlich können


wir auch schreiben: ?
Welche der folgenden Aussagen ist richtig?
y = b + ν(c − b) + λ(a − b),
Liegt der Punkt x auf der Verbindungsgeraden von a und
und bei λ > 0 liegen a und y auf derselben Seite von bc.  b, so ist x eine Linearkombination von a und b.
ist somit gleich der Menge aller Punkte der abgeschlossenen Jede Linearkombination von a und b stellt einen Punkt
Dreiecksscheibe, also der Punkte, die bei λ, μ, ν > 0 im der Verbindungsgeraden ab dar.
Dreiecksinneren und sonst auf dem Rand liegen (Abb. 7.6).

x3
?
Gegeben sind drei Punkte a, b, c. Deren arithmetisches Mit-
tel s = 13 (a + b + c) ist der Schwerpunkt des Punktetripels.
Angenommen, die drei Punkte a, b, c bilden ein Dreieck.
Warum liegt s stets im Inneren dieses Dreiecks?
v c Zeigen Sie, dass s auf der Verbindungsgeraden von c mit
E
dem Mittelpunkt von a und b liegt.
a


u
b
Im Anschauungsraum ist zwischen Rechts- und
x2
Linkssystemen zu unterscheiden

x1 Wollen wir unsere physikalische Welt mathematisch be-


schreiben, so müssen wir auch Distanzen und Winkel messen
Abbildung 7.6 Die abgeschlossene Dreiecksscheibe  ist gleich der Menge können. Was wir schon bisher stillschweigend angenommen
aller Konvexkombinationen von a, b und c, kurz:  = conv{a, b, c}. haben, soll nun besonders betont werden: Wir verwenden im
Folgenden ausschließlich Koordinatensysteme, deren Basis-
Man nennt die Menge aller Konvexkombinationen einer ge- vektoren {b1 , b2 , b3 } orthonormiert, d. h. paarweise orthogo-
gebenen Punktmenge M auch die konvexe Hülle von M nal und von der Länge 1 sind. Derartige Koordinatensysteme
und verwendet dafür das Symbol convM. Die konvexe Hülle heißen nach René Descartes kartesisch. Ist o der Koordina-
enthält mit je zwei verschiedenen Punkten a, b auch deren tenursprung, so bezeichnen wir das Koordinatensystem kurz
konvexe Hülle conv{a, b}, also die davon begrenzte Strecke. mit dem Symbol (o; B).
Mengen mit dieser Eigenschaft heißen konvex. Somit ist die
Zudem fordern wir, dass die Basisvektoren in der Reihen-
konvexe Hülle convM eine M umfassende konvexe Menge.
folge (b1 , b2 , b3 ) ein Rechtssystem bilden, d. h. sich ihre
Analog heißt die Menge der Affinkombinationen von M auch Richtungen der Reihe nach durch den Daumen, Zeigefin-
affine Hülle spanM der Punktmenge M. ger und Mittelfinger der rechten Hand angeben lassen. Man
232 7 Analytische Geometrie – Rechnen statt Zeichnen

b3 es, dass ein und derselbe Punkt oder Vektor je nach Wahl des
Koordinatensystems verschiedene Koordinaten hat.
Bei dieser Gelegenheit erinnern wir an Kapitel 6: Ist B eine
geordnete Basis des n-dimensionalen K-Vektorraums V , so
b2 ist jeder Vektor v ∈ V eindeutig als Linearkombination

v = v1 b1 + · · · + vn bn
o +90◦
von B darstellbar. Wir nennen das n-Tupel (v1 , . . . , vn ) der
b1 verwendeten Skalare die B-Koordinaten von v und schrei-
ben diese als Spaltenvektor. Für diesen Koordinatenvektor
Abbildung 7.7 Ein orthonormiertes Rechtskoordinatensystem. aus Kn benutzen wir gelegentlich das Symbol B v, wenn aus-
drücklich auch die zugrunde liegende Basis hervorgehoben
werden soll.
spricht dann auch von einem kartesischen Rechtssystem.
Häufig werden wir uns den dritten Basisvektor und damit die Im Fall des Anschauungsraums V = R3 können wir B =
dritte Koordinatenachse lotrecht, und zwar nach oben wei- (b1 , b2 , b3 ) setzen. Dann lautet der Vektor B u der B-Koor-
send vorstellen. Dann liegen b1 und b2 horizontal. Von oben dinaten des Vektors u ∈ R3 :
gesehen erfolgt die Drehung von b1 nach b2 durch 90◦ im ⎛ ⎞
u1
mathematisch positiven Sinn (Abb. 7.7).
B u = ⎝u2 ⎠ ⇐⇒ u = u1 b1 + u2 b2 + u3 b3 . (7.1)
Spiegelbilder von Rechtssystemen sind Linkssysteme. Hier u3
folgen die drei Basisvektoren aufeinander wie Daumen, Zei-
gefinger und Mittelfinger der linken Hand (Abb. 7.8). Wenn wir von einem Koordinatensystem (o; B) für Punkte
sprechen, so spielt auch die Wahl des Ursprungs o eine Rolle.
Wir schreiben daher (o;B) x, wenn wir ausdrücklich die Ko-
b1
b1 ordinaten des Punkts x bezüglich des genannten Koordina-
tensystems meinen, und diese sind wie folgt definiert:
b2
b2 ⎛ ⎞
b3
x1
(o;B) x = ⎝x2 ⎠ ⇐⇒ x = o+x1 b1 +x2 b2 +x3 b3 . (7.2)
b3
x3

Abbildung 7.8 Merkregel für die Anordnung der Basisvektoren: b1 = Daumen, 7.2 Das Skalarprodukt im
b2 = Zeigefinger, b3 = Mittelfinger, wie wenn man mit den Fingern „1,2,3“
zählt. Die rechte Hand bestimmt ein Rechtssystem, die linke ein Linkssystem. Anschauungsraum
Wir werden die Bezeichnung Rechtssystem später auch aus-
Neben der Addition und skalaren Multiplikation gibt es im
dehnen auf drei Vektoren, die nicht paarweise orthogonal
Anschauungsraum noch weitere nützliche Verknüpfungen.
sind, die aber trotzdem der Rechten-Hand-Regel folgen. Da-
Das im Folgenden behandelte Skalarprodukt kann auf be-
bei dürfen wir voraussetzen, dass die von zwei Fingern ein-
liebige Dimensionen verallgemeinert werden (siehe Kapi-
geschlossenen Winkel zwischen 0◦ und 180◦ liegen.
tel 17). Zunächst aber interessiert uns vor allem seine geo-
? metrische Bedeutung.
Angenommen, wir stellen ein Rechtssystem „auf den Kopf“,
d. h., wir verdrehen es derart, dass der dritte Basisvektor nach
unten weist. Wird das Rechtssystem dadurch zu einem Links- Definition des Skalarprodukts und der Norm
system? im Anschauungsraum

Definition des Skalarprodukts

⎛ u,⎞v ∈ R mit kartesischen Koor-


Für je zwei Vektoren 3
Punkte, Vektoren und ihre Koordinaten ⎛ ⎞
u1 v1
dinaten ⎝u2 ⎠ bzw. ⎝v2 ⎠ lautet das Skalarprodukt
Obwohl wir die Punkte und Vektoren vorhin über ihre Koor- u3 v3
dinaten eingeführt haben, werden wir den in der Theorie der
u · v = u1 v1 + u2 v2 + u3 v3 .
Vektorräume üblichen Standpunkt einnehmen: Die Punkte
und Vektoren sind geometrische Objekte unseres Raums, und Dieses Produkt legt eine Abbildung
diese existieren von vornherein. In diesem Raum können Ko-
ordinatensysteme willkürlich festgelegt werden. So kommt R3 × R3 → R mit (u, v)  → u · v
7.2 Das Skalarprodukt im Anschauungsraum 233

fest, welche jedem Paar von Vektoren aus R3 eine reelle Zahl Beispiel Als kleines Zahlenbeispiel zwischendurch be-
in Form des Skalarprodukts zuweist. rechnen wir für die Vektoren
⎛ ⎞ ⎛ ⎞
Das Skalarprodukt u · v lässt sich auch als Matrizenprodukt 2 −1
auffassen, so wie es uns bereits bei den Gleichungssystemen u = ⎝ −1 ⎠ und v = ⎝ 5 ⎠
auf Seite 175 begegnet ist. Dazu müssen die Koordinaten des 2 3
ersten Vektors u als Zeile und jene des zweiten Vektors v als
deren Skalarprodukt
Spalte geschrieben werden:
⎛ ⎞ u · v = 2 · (−1) + (−1) · 5 + 2 · 3 = −2 − 5 + 6 = −1
v1
u · v = (u u u ) ⎝v2 ⎠ = u0 v. (7.3)
 1 2 3  sowie die Norm von u:
Skalarprodukt v3 Matrizenprodukt  √ √
von Vektoren
u = 22 + (−1)2 + 22 = 4 + 1 + 4 = 9 = 3. 
Aus Gründen der Einfachheit verwenden wir die Symbole
u und v links für Vektoren und ebenso rechts für Matrizen Nachdem das Quadrat der Norm eines Vektors gleich der
mit drei Zeilen und einer Spalte. Das hochgestellte 0 bei Quadratsumme seiner Koordinaten ist, gilt:
u bedeutet die Transponierung, wodurch Zeilen mit Spalten
vertauscht werden. Deshalb bezeichnet u0 eine 1×3 -Matrix. u = 0 ⇐⇒ u = 0. (7.4)
Diese Doppelverwendung der Symbole u und v sollte aber
Eine weitere wichtige Formel zur Norm lautet:
kaum zu Schwierigkeiten führen. Der Punkt kennzeichnet je-
denfalls das Skalarprodukt von zwei Vektoren. Bei der Auf- λu = |λ| u. (7.5)
fassung als Matrizenprodukt wird kein Verknüpfungssymbol
verwendet.
Beweis: Es ist λu2 = (λu) · (λu) = λ2 (u · u). 

x3
Normieren von Vektoren
Jeder Vektor u = 0 lässt sich durch skalare Multiplika-
b tion gemäß
1

u= u
b3 − a3 u
in einen Vektor mit der Norm 1, also in einen Einheits-
a
vektor u transformieren. Wir sagen dazu, wir normie-
x2 ren den Vektor u.

x1 b2 −
a2 |b1 −
a
1|
Beweis: Mit (7.5) ist
) )
) 1 )
u = ))
 ) u = 1 u = 1.
u )
Abbildung 7.9 Die Distanz der Punkte a und b ist a − b =
% u
(a1 − b1 )2 + (a2 − b2 )2 + (a3 − b3 )2 , was sich auch aus dem Satz des
Pythagoras ergibt.

u behält die Richtung von u = 0 bei. 

Auf dem Skalarprodukt eines Vektors mit sich selbst beruht


die Definition der Norm oder Länge
 Kommentar: Es gibt viele verschiedene Normen in der
√ Mathematik (siehe auch Kapitel 17 und 19). Die hier defi-
u = u21 + u22 + u23 = u · u,
nierte heißt Standardnorm oder 2-Norm. Für alle Normen
die oft auch Standardnorm des R3 genannt wird. Die Abbil- gelten die zu (7.4) und (7.5) analogen Gleichungen und dazu
dung noch die später folgende Dreiecksungleichung.
R3 → R≥0 mit u  → u
ordnet jedem Richtungsvektor die gemeinsame Länge der Das Skalarprodukt ist offensichtlich symmetrisch, d. h.,
repräsentierenden Pfeile zu, denn bei u = a − b ist u · v = v · u.

u = a − b = (a1 − b1 )2 + (a2 − b2 )2 + (a3 − b3 )2 Zudem ist das Skalarprodukt linear in jedem Anteil und damit
bilinear, d. h.,
genau die Distanz der Punkte a und b, wie anhand des Satzes
von Pythagoras (Abb. 7.9) sofort zu erkennen ist. Anstelle (u1 + u2 ) · v = (u1 · v) + (u2 · v),
von u · u schreibt man übrigens auch oft u2 . (λu · v) = λ(u · v)
234 7 Analytische Geometrie – Rechnen statt Zeichnen

und analog für v. Später im Kapitel 17 werden wir Skalar-


x3
produkte auch in anderen Vektorräumen definieren und dabei
zunächst nur die Bilinearität und Symmetrie fordern. Das hier
definierte wird auch als kanonisches Skalarprodukt bezeich-
net.

Beispiel Wir beweisen die Formel u


v u+
v
u − v2 = u2 + v2 − 2 (u · v). p
u−
v v
u
Beweis: Wir nutzen die Bilinearität und die Symmetrie
des Skalarprodukts, um den Ausdruck auf der linken Seite x2
wie folgt umzuformen:
(u − v) · (u − v) = x1
=u·u−u·v−v·u+v·v =
= u · u + v · v − 2 (u · v). Abbildung 7.11 Die Parallelogrammgleichung liefert eine Beziehung zwischen
den Längen der Seiten und der Diagonalen eines Parallelogramms.
Auf der rechte Seite treten offensichtlich, wie behauptet, die
Quadrate der Normen auf. 

Dabei wird das Parallelogramm von den Punkten p, p + u,


p +u+v und p +v gebildet (siehe Abbildung 7.11 und auch
x3
Abbildung 7.4). Wir nennen dieses das von u und v aufge-
spannte Parallelogramm, obwohl es wegen der freien Wahl
der ersten Ecke p unendlich viele derartige Parallelogramme
gibt, die alle durch Parallelverschiebungen auseinander her-
p+
v vorgehen.
v
p u− ?
v Bestätigen Sie, dass je zwei der folgenden vier Punkte
u a 1 , . . . , a 4 (siehe Abbildung 7.18 auf Seite 245) mit
p+ ⎛ ⎞ ⎛⎞
u ±2 0
x2 a 1,2 = ⎝ √0 ⎠, ±2 ⎠
a 3,4 = ⎝ √
2 − 2
x1 dieselbe Distanz 4 einschließen. Welches Dreieck bilden
demnach je drei dieser Punkte, welche geometrische Figur
Abbildung 7.10 Der verallgemeinerte Satz des Pythagoras u−v2 = u2 + alle vier Punkte zusammengenommen?
v2 − 2 (u · v) gilt auch für nicht rechtwinklige Dreiecke.

Diese Formel wird manchmal verallgemeinerter Satz des


Pythagoras genannt, weil damit in dem Dreieck der Punkte Das Skalarprodukt hat eine geometrische
p, p + u und p + v (Abb. 7.10) die Länge der dem Punkt p Bedeutung
gegenüberliegenden Seite berechnet werden kann. Wir kön-
nen bereits erraten, warum bei u · v = 0 genau der Satz des Wir wenden uns nun der Frage zu, welcher Wert eigentlich
Pythagoras übrig bleibt.  mit dem Skalarprodukt ausgerechnet wird. Dazu tragen wir
vom Anfangspunkt c die Vektoren u und v ab und erhalten
Eine weitere Konsequenz der Bilinearität ist die folgende die Punkte
Parallelogrammgleichung: a = c + u und b = c + v.
Für die Distanz der Endpunkte a und b gilt:
u + v2 + u − v2 = 2 (u2 + v2 ).
a − b2 = (u − v) · (u − v) =
= u2 + v2 − 2(u · v) =
? = a − c2 + b − c2 − 2 (u · v).
Beweisen Sie die Parallelogrammgleichung.
Das ist offensichtlich wieder der bereits auf Seite 234 behan-
delte verallgemeinerte Satz des Pythagoras, den wir nun in
Diese Gleichung besagt in Worten: In jedem Parallelogramm
der Form
ist die Quadratsumme der beiden Diagonalenlängen gleich
der Quadratsumme der vier Seitenlängen. 2 (u · v) = a − c2 + b − c2 − a − b2
7.2 Das Skalarprodukt im Anschauungsraum 235

schreiben. Wir vergleichen dies mit dem aus der Elementar- ?


geometrie her bekannten Kosinussatz für das Dreieck abc, Berechnen Sie den Winkel ϕ zwischen den Vektoren
indem wir wie üblich die Seitenlängen mit a, b, c und die
⎛ ⎞ ⎛ ⎞
jeweils gegenüberliegenden Innenwinkel mit α, β und γ be- 1 0
zeichnen (Abb. 7.12). u = ⎝ 0 ⎠ und v = ⎝ 1 ⎠.
1 1
b
v

a c Kartesische Punkt- und Vektorkoordinaten


hb
sind Skalarprodukte
γ
c a Es gibt aber noch weitere wichtige Folgerungen: Das Produkt
b u u v cos ϕ ist genau dann gleich null, wenn mindestens
Abbildung 7.12 Der Kosinussatz c2 = a 2 + b2 − 2 a b cos γ . einer der drei Faktoren verschwindet. Dabei tritt cos ϕ = 0
nur bei ϕ = 90◦ oder ϕ = 270◦ ein. Dies bedeutet:
Der Kosinussatz lautet:
Verschwindendes Skalarprodukt
c2 = a 2 + b2 − 2 a b cos γ .
Das Skalarprodukt u · v verschwindet genau dann, wenn
Er lässt sich beweisen, indem man das Dreieck durch die entweder einer der beteiligten Vektoren der Nullvektor
Höhe auf b zerlegt und aus einem der rechtwinkligen Teil- ist oder die beiden Vektoren u und v zueinander ortho-
dreiecke die Seitenlänge c berechnet als gonal sind.

c2 = h2b + (b − a cos γ )2 = (a sin γ )2 + (b − a cos γ )2 .


?
Wir stellen fest, dass sich in der Gleichung Gegeben sind die Gerade G = {x = a + t u | t ∈ R}
und der Punkt b. Beweisen Sie, dass der von b zum Punkt
2 a b cos γ = a 2 + b2 − c2 (b − a) · u
f = a+ u ∈ G weisende Vektor zu u orthogonal ist.
u·u
der Ausdruck auf der rechten Seite nur in der Bezeichnungs- f ist somit der Fußpunkt der aus b an G legbaren Normalen.
weise unterscheidet von der rechten Seite der obigen Formel
für 2 (u · v). Damit folgt die
Die Basisvektoren b1 , b2 , b3 kartesischer Koordinaten-
systeme sind paarweise orthogonale Einheitsvektoren. Also
Geometrische Deutung des Skalarprodukts
gilt z. B. b1 · b1 = 1 sowie b1 · b2 = b1 · b3 = 0. Derartige
Das Skalarprodukt gibt den Wert Basen heißen orthonormiert, und wir können all die defi-
nierenden Gleichungen mithilfe des Kronecker-Deltas δij
u · v = u v cos ϕ (7.6) in einer einzigen Gleichung zusammenfassen:
an, wobei ϕ der von u und v eingeschlossene Winkel ist 
1 bei i = j,
mit 0◦ ≤ ϕ ≤ 180◦ . bi · bj = δij = (7.7)
0 bei i = j.

Wir haben das Skalarprodukt mithilfe eines Koordinaten- Wir werden diese wichtige Gleichung noch mehrfach ver-
systems berechnet, doch ist letzteres natürlich willkürlich wenden. Sie gilt insbesondere für die Standardbasis oder
festsetzbar. Ein Wechsel des Koordinatensystems bewirkt kanonische Basis E des R3 bestehend aus
eine Änderung der Koordinaten von u und v. Dass trotzdem ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
der Wert u1 v1 +u2 v2 +u3 v3 unverändert bleibt, folgt aus der 1 0 0
e 1 = ⎝ 0 ⎠, e 2 = ⎝ 1 ⎠, e 3 = ⎝ 0 ⎠.
obigen geometrischen Deutung. Das Skalarprodukt u · v ist
0 0 1
also eine geometrische Invariante, d. h. unabhängig von der
Wahl des kartesischen Koordinatensystems, und dies beweist
letztlich erst die Sinnhaftigkeit der obigen Definition. Ein weiterer Sonderfall der geometrischen Deutung des
Skalarprodukts verdient hervorgehoben zu werden:
Aus unserer geometrischen Interpretation des Skalarprodukts
folgt als Formel für die Berechnung des Winkels ϕ zwischen
Folgerung
je zwei vom Nullvektor verschiedenen Vektoren u und v:
Bei v = 1 gibt u · v = u cos ϕ die vorzeichen-
u·v behaftete Länge des orthogonal auf v projizierten Vektors u
cos ϕ = .
u v an (Abb. 7.13).
236 7 Analytische Geometrie – Rechnen statt Zeichnen

Es ist für jedes i ∈ {1, 2, 3}


x3

bi  = 13 1 + 4 + 4 = 1.

Zudem gilt:

u b1 · b2 = b1 · b3 = b2 · b3 = 0.

1 v Somit sind die Bedingungen (7.7) für die Orthonormiertheit


von B erfüllt, und wir können zweckmäßig (7.8) benutzen,
u·v
um die Koordinaten des Vektors u bezüglich B als Skalar-
produkte zu berechnen:
x2
1 5 1
u1 = u · b1 = , u2 = u · b2 = , u3 = u · b3 = .
3 3 3
x1
Als Kontrolle empfiehlt es sich natürlich zu überprüfen, dass
nun tatsächlich u = 3i=1 ui bi gilt. 
Abbildung 7.13 Bei v = 1 gibt u · v die vorzeichenbehaftete Länge der
Orthogonalprojektion von u auf den Einheitsvektor v an.
Die eben gezeigte Art der Berechnung der Vektorkoordi-
naten ist um Vieles einfacher als die Standardmethode, die
Die durch u · v definierte Länge ist genau dann positiv, wenn ui als Unbekannte anzusehen und aus jenem linearen Glei-
cos ϕ > 0 ist und daher der orthogonal auf v projizierte chungssystem zu ermittelt, welches sich durch die koordina-
Vektor u in dieselbe Richtung weist wie v. tenweise Aufsplittung der Vektorgleichung u = 3i=1 ui bi
Dies führt uns dazu, auch die kartesischen Koordinaten als ergibt. Doch nur bei kartesischen Koordinatensystemen sind
Skalarprodukte zu interpretieren. die Vektorkoordinaten zugleich Skalarprodukte mit den Ba-
sisvektoren.
Kartesische Vektorkoordinaten als Skalarprodukte Als Gegenbeispiel betrachten wir die offensichtlich nicht
Ist die Basis B = (b1 , b2 , b3 ) orthonormiert, so gilt für orthonormierte R3 -Basis B bestehend aus
die zugehörigen Koordinaten des Vektors u: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
⎛ ⎞ 1 0 1
u1 b 1 = e 1 = ⎝ 0 ⎠, b 2 = e 2 = ⎝ 1 ⎠, b 3 = ⎝ 1 ⎠.
ui = u · b i
B u = ⎝u2 ⎠ ⇐⇒ (7.8) 0 0 1
für i = 1, 2, 3.
u3
Bei der Wahl u = e3 = −b1 − b2 + b3 ist
⎛⎞
Beweis: Wir multiplizieren beide Seiten der Gleichung −1
u = 3i=1 ui bi skalar mit dem Vektor bj und erhalten: B u = ⎝ −1 ⎠, aber u · b1 = u · b2 = 0.
1
 3 
! !
3
u · bj = ui b i · b j = ui (bi · bj ) =
i=1 i=1
b3
!
3
= ui δij = uj
i=1

für j = 1, 2, 3. 
x

Beispiel Zeigen Sie, dass die durch ihre kartesischen Ko- x−o
ordinaten gegebenen Vektoren u b2
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 1 1 2 1 −2 o
b1 = ⎝ 2 ⎠, b 2 = ⎝ 1 ⎠, b3 = ⎝ 2⎠
3 −2 3 2 3 1

eine orthonormierte Basis B bilden, und berechnen Sie die


Koeffizienten u1 , u2 , u3 in der Darstellung
b1
⎛ ⎞
1
u = ⎝ 1 ⎠ = u1 b1 + u2 b2 + u3 b3 . Abbildung 7.14 Kartesische Koordinaten von Vektoren und Punkten sind
1 Skalarprodukte.
7.2 Das Skalarprodukt im Anschauungsraum 237

Kommentar: In Kapitel 12 wird gezeigt, dass bei endlich- Beweis: Diese Ungleichung ist trivialerweise richtig bei
dimensionalen Vektorräumen die Abbildung der Vektoren v u = 0 oder bei v = 0. Bei u, v = 0 gilt für den von u und v
auf deren i-te B-Koordinate linear ist, und zwar ein Element eingeschlossenen Winkel ϕ:
b∗i der zur Basis B dualen Basis B ∗ . Im Sonderfall einer
orthonormierten Basis B gilt b∗i : v  → (bi · v). u · v = u v cos ϕ,

also:
Analog zur Berechnung der Vektorkoordinaten sind auch |u · v| = u v | cos ϕ| ≤ u v.
die Koordinaten eines Punkts x bezüglich eines kartesischen Damit besteht Gleichheit genau bei | cos ϕ| = 1, also ϕ = 0◦
Koordinatensystems mit dem Ursprung o und den Basisvek- oder ϕ = 180◦ .
toren b1 , b2 , b3 als Skalarprodukte auszudrücken, nämlich:
Wir werden feststellen, dass diese Ungleichung auch noch
unter viel allgemeineren Bedingungen gilt. Deshalb wird für
Kartesische Punktkoordinaten als Skalarprodukte
v = 0 noch eine zweite Beweismöglichkeit gezeigt:
Ist (o; B) ein kartesisches Koordinatensystem, so gilt für
die zugehörigen Koordinaten des Punkts x: Für alle Linearkombinationen λu + μv von u und v gilt:
⎛ ⎞
x1
xi = (x − o) · bi λu + μv2 = λ2 u2 + 2λμ(u · v) + μ2 v2 ≥ 0.
(o;B) x = ⎝x2 ⎠ ⇐⇒
für i = 1, 2, 3.
x3 Wir betrachten diejenige Linearkombination, welche nach
der Frage auf Seite 235 den Fußpunkt f der aus dem Ur-
Dass die kartesischen Koordinaten von Punkten und Vek- sprung auf die Gerade G = u + R v legbaren Normalen
toren als Skalarprodukte berechenbar sind, wird auch aus ergibt, also den Fall
Abbildung 7.14 klar. Zur Begründung muss man sich nur u·v
λ = 1 und μ = − .
daran erinnern, dass mit Abbildung 7.13 das Skalarprodukt v·v
mit einem Einheitsvektor genau die Länge des auf diesen Dann folgt für f = λu + μv:
Einheitsvektor orthogonal projizierten Vektors angibt.
u·v (u · v)2
f 2 = u2 − 2 (u · v) + (v · v)
v·v (v · v)2
Kommentar: Dem aufmerksamen Leser wird nicht ent- (u · v)2
= u2 − ≥ 0,
v2
gangen sein, dass wir noch vor der Definition des Skalar-
produkts die Orthogonalität und Längenmessung als bekannt also u2 v2 ≥ (u · v)2 und damit weiter die Cauchy-
vorausgesetzt haben, um damit ein kartesisches Koordinaten- Schwarz’sche Ungleichung. Nur bei f = 0 besteht Gleich-
system zu erklären. Und jetzt verwenden wir das Skalarpro- heit. Genau dann geht die Gerade G durch den Ursprung,
dukt zur Erklärung der Längen- und Winkelmessung. Diese und die beiden Vektoren u, v sind linear abhängig, denn eine
logisch höchst bedenkliche Vorgehensweise kommt daher, nicht triviale Linearkombination λu + μv ergibt den Null-
weil wir in diesem Abschnitt ein mathematisches Modell vektor. 
für unsere physikalische Umwelt entwickeln und von intuitiv
vorhandenen Begriffen ausgehen.
Von der Cauchy-Schwarz’schen Ungleichung können wir auf
Später in Kapitel 17 vermeiden wir derartige Zirkelschlüsse:
die folgende wichtige Ungleichung schließen.
Wir werden in allgemeinen Vektorräumen ein Skalarprodukt
definieren, indem wir dessen wichtigste Eigenschaften per
Definition fordern. Und darauf bauen wir dann erst eine Dreiecksungleichung
Längen- und Winkelmessung auf.
u + v ≤ u + v.

Beweis: Aus
Die Dreiecksungleichung und andere wichtige
Formeln u + v2 = (u + v) · (u + v) = u2 + v2 + 2(u · v)

Hinsichtlich der Norm gilt die und der Cauchy-Schwarz’schen Ungleichung

u · v ≤ |u · v| ≤ u v
Cauchy-Schwarz’sche Ungleichung
folgt:
|u · v| ≤ u v.
Dabei gilt Gleichheit genau dann, wenn die Vektoren u u + v2 ≤ u2 + v2 + 2u v = (u + v)2 ,
und v linear abhängig sind.
und das ergibt die Dreiecksungleichung. 
238 7 Analytische Geometrie – Rechnen statt Zeichnen

7.3 Weitere Produkte


von Vektoren im
Anschauungsraum
u+
v Es gibt im Anschauungsraum R3 neben dem Skalarprodukt
c
a noch andere Möglichkeiten, aus Vektoren Produkte mit einer
v koordinateninvarianten Bedeutung zu berechnen.
u
b

Das Vektorprodukt zweier Vektoren liefert


einen neuen Vektor

In vielen geometrischen und physikalischen Anwendungen


Abbildung 7.15 Die Dreiecksungleichung u + v ≤ u + v im Anschau- begegnet man der Aufgabe, einen Vektor zu finden, der ortho-
ungsraum. gonal ist zu zwei gegebenen Vektoren u, v ∈ R3 mit kartesi-
⎛ ⎞ ⎛ ⎞
u1 v1
schen Koordinaten u2 bzw. ⎝v2 ⎠. Wir werden erkennen,
⎝ ⎠
Die Bezeichnung „Dreiecksungleichung“ erklärt sich aus u3 v3
dem Dreieck der Punkte a, b = a + u und c = a + u + v dass das folgende Vektorprodukt eine spezielle Lösung für
(Abb. 7.15). Die Ungleichung besagt nun die offensichtliche diese Aufgabe bietet.
Tatsache, dass der geradlinige Weg von a nach c niemals län-
ger ist als der „Umweg“ über b, wo immer auch der Punkt b Definition des Vektorprodukts
liegen mag. ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
u1 v1 u2 v3 − u3 v2
Wir sind verschiedenen Varianten der Dreiecksungleichung u × v = ⎝u2 ⎠ × ⎝v2 ⎠ = ⎝ u3 v1 − u1 v3 ⎠ .
bereits im Kapitel 4 begegnet. Nun können wir die Dreiecks- u3 v3 u1 v2 − u2 v1
ungleichung auch in der Form
Dieses Produkt, das wegen des Verknüpfungssymbols × oder
a − c ≤ a − b + b − c wegen der kreuzweisen Berechnung der Koordinaten oft auch
Kreuzprodukt genannt wird, legt eine Abbildung
schreiben. Dabei besteht Gleichheit genau dann, wenn b
der abgeschlossenen Strecke conv{a, c} angehört, wenn also R3 × R3 → R3 mit (u, v)  → u × v
(Abb. 7.15) u und v linear abhängig sind bei u · v ≥ 0.
fest, welche im Gegensatz zum Skalarprodukt je zwei Vek-
toren aus dem R3 nunmehr einen Vektor zuweist. Es han-
Kommentar: Wir haben bereits betont, dass Normen delt sich also diesmal um eine Verknüpfung im R3 (siehe
auch in viel allgemeineren Vektorräumen definierbar sind. Seite 64). Auch hier werden wir zeigen können, dass der
Doch werden in der Regel nur derartige Normen zugelassen, Vektor u × v mit seinen Faktoren u und v auf eine vom
für welche die Cauchy-Schwarz’sche Ungleichung und die Koordinatensystem unabhängige Art verbunden ist.
Dreiecksungleichung gelten. In diesen Vektorräumen kann Es genügt für das Berechnen eines Vektorprodukts, sich die
man dank der Cauchy-Schwarz’schen Ungleichung die For- Formel für die erste Koordinate zu merken, denn die weiteren
u·v
mel cos ϕ = von Seite 235 weiterhin zur Messung Koordinaten folgen durch zyklische Vertauschung 1 → 2 →
u v
der Winkel verwenden (siehe Kapitel 17). 3 → 1.
Die Formeln für die einzelnen Koordinaten werden besonders
Der Anschauungsraum R3 wird durch die Definition der Dis- einprägsam, wenn man mit dem Begriff der Determinante
tanz d(a, b) = a − b ∈ R≥0 mit einer zweireihigen Matrix vertraut ist. Deshalb unterbrechen
wir hier kurz mit einem Vorgriff auf das Kapitel 13 über
d(a, b) = d(b, a) und d(a, b) = 0 ⇐⇒ a = b Determinanten.

und durch die Gültigkeit der Dreiecksungleichung zum


Im Vektorprodukt stecken Determinanten
Musterbeispiel eines metrischen Raums (siehe Kapitel 19).
zweireihiger Matrizen
In der Box auf Seite 239 wird gezeigt, dass das unseren
Navigationssystemen zugrunde liegende Global Positioning Zu jeder n × n -Matrix A über dem Körper K gibt es eine De-
System auf Distanzmessungen beruht. terminante det A. Es ist dies eine Zahl aus K, die Aufschluss
7.3 Weitere Produkte von Vektoren im Anschauungsraum 239

Hintergrund und Ausblick: Die Geometrie hinter dem Global Positioning System (GPS)
Das Global Positioning System (GPS) hat die Aufgabe, jedem Benutzer, der über ein Empfangsgerät verfügt, dessen genaue
Position auf der Erde mitzuteilen, wo auch immer er sich befindet. In der gegenwärtigen Form beruht das GPS auf 29 Satelliten,
welche die Erde ständig umkreisen und derart verteilt sind, dass mit Ausnahme der polnahen Gebiete für jeden Punkt der Erde
stets mindestens vier Satelliten über dem Horizont liegen. Jeder Satellit Si , i ∈ {1, 2, . . . }, kennt zu jedem Zeitpunkt seine
genaue Raumposition s i und teilt diese laufend den Empfängern per Funk mit.
Andererseits kann das Empfangsgerät die scheinbare Distanz di zwischen seiner Position x und der augenblicklichen
Satellitenposition s i messen – und zwar erstaunlicherweise anhand der Dauer, welche das Funksignal vom Satelliten zum
Empfänger braucht. Das ist vereinfacht so zu sehen: Der Satellit in der Position s i funkt die Zeitansage 8:00 Uhr, und diese
trifft beim Empfänger x gemäß dessen Uhr mit einer gewissen Zeitverzögerung ti ein, woraus durch Multiplikation mit der
Lichtgeschwindigkeit c die Distanz s i − x = di = c ti folgt. Dabei ist allerdings eine wesentliche Fehlerquelle zu beachten:
Während die Atomuhren in den Satelliten sehr genau synchronisiert sind, ist dies bei den Empfängeruhren technisch nicht
möglich. Geht etwa die Empfängeruhr um t0 vor, so erscheinen alle Distanzen um dasselbe d0 = c t0 vergrößert. Deshalb
lautet die wahre Distanz s i − x = di − d0 .

Es gibt vier Unbekannte, nämlich die drei Koordinaten für j = 2, 3, 4. Dies sind drei lineare Gleichungen. Wenn
x1 , x2 , x3 von x und den durch die mangelnde Synchro- für eine Lösung dieses linearen Systems neben
nisation der Empfängeruhr entstehenden Distanzfehler
d0  0. Stehen vier Satellitenpositionen s i , i = 1, . . . , 4, q1 (x, d0 ) = q2 (x, d0 ) = q3 (x, d0 ) = q4 (x, d0 )
samt zugehörigen scheinbaren Distanzen di = s i − x auch noch q1 (x, d0 ) = 0 gilt, so sind alle vier quadrati-
zur Verfügung, so müssen die vier Unbekannten die vier schen Gleichungen aus (∗) erfüllt.
quadratische Gleichungen
Sind die drei linearen Gleichungen in (∗∗) linear unab-
qi (x, d0 ) = (s i − x)2 − (di − d0 )2 = 0
hängig, so gibt es nach Seite 184 eine einparametrige Lö-
oder ausführlich sungsmenge, die wir mithilfe eines Parameters t darstellen
x · x − 2(s i · x) + s i · s i − d02 + 2di d0 − di2 = 0 (∗) können in der Form
' ( ' ( ' (
x &
x u
erfüllen. Wir zeigen, dass sich dieses nichtlineare Glei- = & +t bei t ∈ R.
chungssystem über R auf drei lineare und eine einzige d0 d0 v
quadratische Gleichung zurückführen lässt: Dabei schreiben wir abkürzend ein Vektorsymbol anstelle
des Koordinatentripels.
Wir setzen diese Lösung in die quadratische Gleichung
s2 q1 (x, d0 ) = 0 ein und erhalten als Bedingung für t
s3
&
x 2 + 2(& x · u)t + u2 t 2 − 2(s 1 · & x ) − 2(s 1 · u)t
+ s 1 2 = d&02 + 2d&0 vt + v 2 t 2 − 2d1 d&0 − 2d1 vt + d12 .

x Nach Potenzen der verbleibenden Unbekannten t geordnet


s1 lautet diese quadratische Gleichung
s4 * + * +
u2 − v 2 t 2 + 2 (& x ·u) − (s 1 ·u) − d&0 v + d1 v t
* +
+ & x ) + s 1 2 − d&02 + 2d1 d&0 − d12 = 0.
x 2 − 2(s 1 ·&
Die zwei Lösungen t1 und t2 dieser Gleichungen sind anstelle
t in der obigen Parameterdarstellung einzusetzen und erge-
ben zwei mögliche Positionen x 1 und x 2 des Empfängers. Die
richtige Lösung ist in der Regel leicht zu identifizieren, weil
grobe Näherungswerte für x vorliegen. Zumeist wird bereits
die Information ausreichen, dass sich der Empfänger auf der
GPS: Es werden die scheinbaren Distanzen von vier oder mehr Satelliten
Erdoberfläche aufhält.
s i zum Empfänger x gemessen
Liegen noch weitere Satellitenpositionen samt zugehörigen
scheinbaren Distanzen vor, so ist das Gleichungssystem (∗)
Wir subtrahieren von der ersten Gleichung die Gleichun- überbestimmt. Dann aber kann man mittels Methoden der
gen 2, 3 und 4 und erhalten: Ausgleichsrechnung (wie z. B. in Kapitel 18, Seite 750) die
q1 (x, d0 ) − qj (x, d0 ) = 2(s j − s 1 ) · x bestapproximierende Lösung ermitteln und damit die Genau-
(∗∗)
− 2(dj − d1 )d0 − d12 + dj2 + s 1 2 − s j 2 = 0 igkeit erhöhen.
240 7 Analytische Geometrie – Rechnen statt Zeichnen

über Eigenschaften der Matrix gibt und gewisse Forderungen Die drei Koordinaten des Vektors (u × v) sind mit geeigne-
erfüllt. So sind etwa die n Spaltenvektoren von A genau dann ten Vorzeichen versehene Determinanten. Die zugehörigen
linear unabhängig, wenn det A von null verschieden ist, und zweireihigen Matrizen entstehen durch Streichung je einer
die Determinante ändert ihr Vorzeichen, wenn zwei Spalten Zeile aus der 3 × 2 -Matrix
oder auch zwei Zeilen vertauscht werden. ⎛ ⎞
u1 v1
Unser Ausgangspunkt für die Definition der Determinante im ⎝ u2 v2 ⎠
Sonderfall n = 2 ist das folgende Kriterium für die lineare u3 v3
Abhängigkeit zweier Vektoren:
welche von den Koordinatenspalten der beteiligten Vektoren
Lemma ' ( ' (
u und v gebildet wird.
Die Vektoren u = uu1 und v = vv1 aus K2 sind Nachdem die Vertauschung der beiden Spalten das Vorzei-
2 2
genau dann linear abhängig, wenn D = u1 v2 − u2 v1 = 0 chen aller drei Determinanten ändert, ist das Vektorprodukt
ist. nicht symmetrisch, sondern schiefsymmetrisch oder alternie-
rend, d. h. es gilt:
Beweis: Sind u und v linear abhängig, so ist u = 0 oder
v ein Vielfaches von u, also vi = λ ui für i = 1, 2. In beiden v × u = −u × v.
Fällen gilt D = 0.
Ist umgekehrt D = 0, so unterscheiden wir drei Fälle: Beispiel
Als erstes Zahlenbeispiel berechnen wir für die Vektoren
Bei u1 u2 = 0 können wir durch u1 u2 dividieren. Wir
v v ⎛ ⎞ ⎛ ⎞
erhalten 1 = 2 . Also ist v ist ein Vielfaches von u. 2 −1
u1 u2
Bei u1 = 0 und u2 = 0 muss auch v1 = 0 sein und daher u = ⎝ −1 ⎠ und v = ⎝ 5 ⎠
ebenfalls v = λ u gelten. 2 3
Bei u = 0 folgt keinerlei Bedingung für v.
das Vektorprodukt. Es ist
In allen drei Fällen sind jedenfalls u und v linear abhän- ⎛ ⎞ ⎛ ⎞
gig. 
2 −1
u × v = ⎝ −1 ⎠ × ⎝ 5 ⎠
' ( 2 3
a11 a12 ⎛ ⎞ ⎛ ⎞
Um festzustellen, ob die Matrix ∈ K2×2 linear (−1) · 3 − 2 · 5 −13
a21 a22
= ⎝ 2 · (−1) − 2 · 3 ⎠ = ⎝ −8 ⎠.
abhängige Spaltenvektoren hat, muss man also nur über- 2 · 5 − (−1) · (−1) 9
prüfen, ob a11 a22 −a12 a21 = 0 ist. Dabei hat der Ausdruck
auf der linken Seite die zusätzliche Eigenschaft, bei einer Ver-
Für die Vektoren der Standardbasis des R3 , also für
tauschung der beiden Spalten das Vorzeichen zu wechseln.
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
All dies sind Gründe für die folgende Definition. 1 0 0
e1 = ⎝ 0 ⎠, e2 = ⎝ 1 ⎠ und e3 = ⎝ 0 ⎠,
0 0 1
Determinante
' ( 2 × 2 -Matrix
einer
a11 a12 gilt:
Ist A = a21 a22
∈ K2×2 , so nennen wir

det A = a11 a22 − a12 a21 ∈ K e1 × e2 = e3 , e2 × e3 = e1 , e3 × e1 = e2 .

die Determinante von A. Andererseits ist wegen der Schiefsymmetrie:

e2 × e1 = −e3 , e3 × e2 = −e1 , e1 × e3 = −e2 . 


Abkürzend schreiben wir auch
) ) ' (
)a11 a12 )
) ) = det a11 a12
)a21 a22 ) a21 a22 Verschwindendes Vektorprodukt
Es ist u × v = 0 genau dann, wenn die Vektoren u und
und sprechen kurz von einer zweireihigen Determinante
v linear abhängig sind.
statt von der Determinante einer 2 × 2 -Matrix.
Man kann sich die Formel für eine 2 × 2 -Matrix leicht mer-
ken: Die Determinante ist gleich der Differenz der Produkte Beweis: u × v = 0 ist äquivalent zur Aussage
der Diagonalen, und zwar kurz Hauptdiagonale minus Ne-
u2 v3 − u3 v2 = u3 v1 − u1 v3 = u1 v2 − u2 v1 = 0.
bendiagonale, also:
⎛ ⎞
) ) + − Dies bedeutet, wie im obigen Lemma gezeigt, dass die durch
)a11 a12 ) a a
) ) ⎝ ⎠
)a21 a22 ) =
11 12 Weglassung einer Koordinate verkürzten Vektoren linear ab-
a 21 a 22 hängig sind.
7.3 Weitere Produkte von Vektoren im Anschauungsraum 241

Sind demnach u und v linear abhängig, d. h., u = 0 oder metrischen dreireihigen Matrizen S u ∈ R3×3 . Dies ist aber
v = λ u, so trifft dies auch auf die durch Weglassung einer wirklich nur im Dreidimensionalen möglich, denn eine
Koordinate entstehenden Vektoren zu, und es verschwinden schiefsymmetrische n-reihige Matrix enthält n(n − 1)/2 un-
alle drei Determinanten. abhängige Einträge, während Vektoren des Rn n Koordinaten
umfassen.
Verschwinden umgekehrt die drei Determinanten, so müssen
wir unterscheiden:
Bei u = 0 besteht jedenfalls die behauptete lineare Ab- Bei linear abhängigen Vektoren u und v ist deren Vektorpro-
hängigkeit. dukt gleich dem Nullvektor. Bei linearer Unabhängigkeit ist
Bei u = 0 ist mindestens eine Koordinate von u von null der Vektor u × v durch die folgenden Eigenschaften gekenn-
verschieden. Angenommen, es ist u1  = 0: Dann gilt für zeichnet.
v
λ = 1 wegen u1 v2 − u2 v1 = 0 zugleich v2 = λu2
u1
und wegen u3 v1 − u1 v3 = 0 auch v3 = λu3 und daher Geometrische Deutung des Vektorprodukts
v = λ u. 1) Sind die Vektoren u und v linear unabhängig, so ist
Ist bei u = 0 zwar u1 = 0, aber dafür u2  = 0 oder u3  = 0, der Vektor u × v orthogonal zu der von u und v auf-
v v
so gehen wir analog vor mit λ = 2 bzw. λ = 3 . Wieder gespannten Ebene.
u2 u3
folgt v = λ u. 2) Es gilt:
u × v = 0 hat somit stets die lineare Abhängigkeit von u und u × v = u v sin ϕ. (7.10)
v zur Folge. 
Dabei ist ϕ der von u und v eingeschlossene Winkel
mit 0◦ ≤ ϕ ≤ 180◦ .
Eine Eigenschaft des Vektorprodukts wurde bereits in Kapi- u × v ist somit gleich dem Flächeninhalt des von
tel 3 besprochen: Das Vektorprodukt ist nicht assoziativ, d. h. u und v aufgespannten Parallelogramms.
von Sonderfällen abgesehen gilt:
3) Die drei Vektoren (u, v, (u × v)) bilden in dieser
(u × v) × w  = u × (v × w). Reihenfolge ein Rechtssystem.
Als Begründung genügt ein einziges Beispiel, etwa
(e1 × e2 ) × e2 = e3 × e2 = −e1 , hingegen Beweis: 1) Wir erkennen durch Ausrechnen, dass
e1 × (e2 × e2 ) = e1 × 0 = 0.
u · (u × v) = u1 (u2 v3 − u3 v2 )
+ u2 (u3 v1 − u1 v3 ) + u3 (u1 v2 − u2 v1 ) = 0.
Das Vektorprodukt hat eine geometrische
Bedeutung Damit ist das vom Nullvektor verschieden vorausgesetzte
Vektorprodukt u × v zu u orthogonal.
Das Vektorprodukt ist linear in jedem Anteil, denn Nach Vertauschung von u mit v folgt:
(u1 + u2 ) × v = (u1 × v) + (u2 × v),
(λu) × v = λ(u × v). v · (v × u) = −v · (u × v) = 0.

Mit einiger Mühe lässt sich auch das Vektorprodukt u × v Also ist das Vektorprodukt u × v auch orthogonal zu v und
als ein Matrizenprodukt schreiben. Dazu muss allerdings der wegen der Bilinearität sogar orthogonal zu jeder Linearkom-
erste Vektor u zu einer alternierenden oder schiefsymmetri- bination von u und v, also zu allen Vektoren der von u und
schen Matrix S u umgeformt werden, also zu einer quadrati- v aufgespannten Ebene.
schen Matrix, bei der sich die bezüglich der Hauptdiagonale
symmetrischen Einträge aik und aki genau durch das Vorzei- Sucht man umgekehrt einen Vektor x, der zu u×v orthogonal
chen unterscheiden. Für die Einträge auf der Hauptdiagonale, ist, so müssen dessen 3 Koordinaten eine lineare homogene
also mit k = i, bedeutet dies aii = −aii und somit aii = 0. Gleichungen lösen, deren Koeffizienten nicht alle null sind.
Nach den Ergebnissen von Kapitel 5 (siehe Seite 184) gibt
Nach den Regeln für die Bildung des Matrizenprodukts ist es eine zweiparametrige Lösungsmenge. Nachdem u und v
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
u1 v1 u2 v3 − u3 v2 bereits zwei linear unabhängige Lösungen sind, ist x eine
u × v = ⎝u2 ⎠ × ⎝v2 ⎠ = ⎝ u3 v1 − u1 v3 ⎠ Linearkombination von u und v. Somit ist ein verschwin-
u3 v3 u1 v2 − u2 v1 dendes Skalarprodukt mit u × v äquivalent zur linearen Ab-
⎛ ⎞⎛ ⎞ (7.9) hängigkeit von u und v.
0 −u3 2 u v 1
= ⎝ u3 0 −u1 ⎠ ⎝v2 ⎠ = S u v.
−u2 u1 0 v3
?
Beweisen Sie die Aussage: Der Punkt x gehört genau dann
der von u und v aufgespannten Ebene E durch den Punkt p
Kommentar: Es besteht offensichtlich eine bijektive an (Abb. 7.16), wenn (x − p) · (u × v) = 0 ist.
Abbildung zwischen Vektoren u ∈ R3 und den schiefsym-
242 7 Analytische Geometrie – Rechnen statt Zeichnen

auch die daraus nach der Formel errechneten Koordinaten des


b3
Vektorprodukts u × v stetig. Hingegen bleibt dessen Norm
nach 2) unverändert, denn während der Verlagerung der Kar-
u×v tonscheibe wurden weder die Längen von u und v, noch der
eingeschlossene Winkel ϕ abgeändert. Am Ende dieses Vor-
gangs ist
v ⎛ ⎞ ⎛ ⎞
u1 v1
ϕ
u = ⎝ 0 ⎠, v = ⎝ v2 ⎠ mit u1 , v2 > 0
p
u
0 0

und somit ⎛ ⎞
E b2
0
u × v = ⎝ 0 ⎠.
b1 u 1 v2

Also zeigt nach dieser stetigen Verlagerung von u und v in die


Abbildung 7.16 Die geometrische Deutung des Vektorprodukts u × v. b1 -b2 -Ebene das Vektorprodukt u×v in die Richtung von b3 .
Die Vektoren u, v und u × v folgen somit der Rechten-Hand-
Regel, wobei wir gegenüber Abbildung 7.8 nur den Winkel
2) Wir bestätigen die Behauptung durch direktes Ausrechnen, zwischen Daumen und Zeigefinger dem ϕ mit 0 ≤ ϕ ≤ 180◦
wobei wir zwischendurch einmal geeignet erweitern müssen: anzupassen haben. Wie schon früher vereinbart, nennen wir
dies weiterhin ein Rechtssystem. Die genaue Definition von
Rechtssystemen folgt auf Seite 245.
u × v2
= (u2 v3 − u3 v2 )2 + (u3 v1 − u1 v3 )2 + (u1 v2 − u2 v1 )2 Die Eigenschaft, ein Rechtssystem zu bilden, muss bereits
= +
u21 v22 +
u21 v32 +
u22 v12 + u22 v32 + u23 v12 u23 v22 vor der Verlagerung bestanden haben, denn die Stetigkeit des
− 2u1 u2 v1 v2 − 2u1 u3 v1 v3 − 2u2 u3 v2 v3 Vorgangs, bei dem zudem u × v = 0 bleibt, schließt ein
+ u21 v12 + u22 v22 + u23 v32 − u21 v12 − u22 v22 − u23 v32 plötzliches Umspringen von einem Rechtssystem zu einem
Linkssystem aus. 
= (u21 + u22 + u23 )(v12 + v22 + v32 )−(u1 v1 + u2 v2 + u3 v3 )2
= u2 v2 − (u v cos ϕ)2
= u2 v2 (1 − cos2 ϕ) = u2 v2 sin2 ϕ. Kommentar: Auf Seite 258 werden wir erst kennenlernen,
wie eine derartige „Verlagerung“ mathematisch beschreibbar
ist. Die Formeln in Gleichung (7.5) zeigen dann unmittelbar,
Nun betrachten wir das von u und v aufgespannte Paralle- dass sich bei eine Verlagerung von zwei Vektoren deren Vek-
logramm (siehe Seite 234 sowie Abbildung 7.16). torprodukt mit verlagert und dass dabei die Eigenschaft, ein
Rechtssystem zu bilden, unverändert bleibt.
Dessen Flächeninhalt ist nach der Formel „Grundlinie mal
Höhe“ zu berechnen. Dabei lesen wir für die Höhe auf u ab:
h = v sin ϕ. Als Sonderfall halten wir fest: Für die beiden Vektoren
⎛ ⎞ ⎛ ⎞
Also ist u × v = u v sin ϕ gleich dem Inhalt des von u1 v1
u und v aufgespannten Parallelogramms. u = ⎝ u2 ⎠, v = ⎝ v2 ⎠
0 0

3) Aufgrund der bisher nachgewiesenen geometrischen in der von den Basisvektoren b1 und b2 aufgespannten Ebene
Eigenschaften des Vektorprodukts u × v bleibt nur mehr of- gibt die zweireihige Determinante
fen, nach welcher Seite der Vektor zeigt. ⎞⎛
' ( 0
u1 v1
Um dies zu klären, denken wir uns das von u und v aufge- D = det mit u × v = ⎝ 0 ⎠
u2 v2
spannte Parallelogramm als Kartonscheibe (Abb. 7.16). Nun D
verlagern wir diese im Raum. Und zwar verlegen wir u in die
Richtung des ersten Vektors b1 unserer kartesischen Basis. den vorzeichenbehafteten Flächeninhalt des von u und v auf-
Hingegen soll v derart in die von b1 und b2 aufgespannte gespannten Parallelogramms an. Dabei ist dieser Inhalt ge-
Ebene gelegt werden, dass die zweite Koordinate von v po- nau dann positiv, wenn u, v und der dritte Basisvektor b3 ein
sitiv ausfällt. Rechtssystem bilden. Jetzt erkennen wir „im Hinsehen“, was
in dem Lemma auf Seite 240 behauptet wurde, dass nämlich
Bei dieser anschaulich vorzustellenden Verlagerung ändern D = 0 die lineare Abhängigkeit der zwei Vektoren kenn-
sich die Koordinaten von u und v stetig. Daher ändern sich zeichnet.
7.3 Weitere Produkte von Vektoren im Anschauungsraum 243

? den definierte Determinante einer 3 × 3 -Matrix A entsteht


Beweisen Sie die folgende Aussage: Die drei Punkte a, b, c aus dem Wert D, indem lediglich die bisherigen Vektoren
liegen genau dann nicht auf einer Geraden, wenn gilt: u, v, w durch die Spaltenvektoren a 1 , a 2 , a 3 von A ersetzt
werden.
(a × b) + (b × c) + (c × a)  = 0.
Determinante einer 3 × 3 -Matrix
⎛ ⎞
a11 a12 a13
Die geometrischen Deutungen des Skalarprodukts u · v und Ist A = (a 1 , a 2 , a 3 ) = ⎝a21 a22 a23 ⎠ ∈ K3×3 , so
des Vektorprodukts ergeben: a31 a32 a33
nennen wir
u · v = u v cos ϕ und u × v = u v sin ϕ.
det A = a 1 · (a 2 × a 3 )
Daraus folgt unmittelbar die Gleichung = a11 a22 a33 + a12 a23 a31 + a13 a21 a32
−a13 a22 a31 − a12 a21 a33 − a11 a23 a32 ∈ K
(u · v)2 + (u × v)2 = u2 v2 .
die Determinante von A.
Man beachte: Im ersten Summanden wird eine reelle Zahl
quadriert, dagegen im zweiten Summanden ein Vektor skalar
mit sich selbst multipliziert. Abkürzend schreiben wir auch
) ) ⎛ ⎞
) a11 a12 a13 ) a11 a12 a13
) )
) a21 a22 a23 ) = det ⎝a21 a22 a23 ⎠
Dreireihige Determinanten sind die Grundlage ) )
) a31 a32 a33 ) a31 a32 a33
für ein Produkt dreier Vektoren
und sprechen kurz von einer dreireihigen Determinante
Bevor wir uns einem weiteren Produkt zuwenden, und zwar
statt von der Determinante einer 3 × 3 -Matrix.
einem von drei Vektoren, befassen wir uns mit den Determi-
nanten dreireihiger Matrizen. Wir gehen ähnlich wie bei den Man kann die Formel zur Berechnung einer dreireihigen De-
zweireihigen Matrizen vor und können nur darauf verweisen, terminante durch das folgende Schema darstellen, welches
dass erst im Kapitel 13 das gemeinsame Bildungsgesetz aller man auch die Regel von Sarrus nennt:
Determinanten vorgestellt wird.
⎛ ⎞
) )
Wir beginnen mit einer Kennzeichnung der linearen Abhän- ) a11 a12 a13 ) +a13 +a11 +
a12

a13
− −
gigkeit von drei Vektoren aus R3 : ) ) ⎜ ⎟ a11
) a21 a22 a23 ) = ⎜ ⎟
) ) a23 ⎝ a21 a22 a23 ⎠ a21
) a31 a32 a33 )
Lemma a33 a31 a32 a33 a31
Die Vektoren u, v, w ∈ R3 sind genau dann linear
abhängig, wenn D = u · (v × w) = 0 ist. Wir fügen rechts den ersten Spaltenvektor an und links den
letzten Spaltenvektor. Dann gibt es zusammen mit der Haupt-
diagonalen drei blaue, nach rechts abfallende Diagonalen und
Beweis: Wir unterscheiden zwei Fälle: ebenso drei rote, nach links abfallende Diagonalen, die Ne-
bendiagonale mit eingeschlossen. Nun werden ähnlich zum
v und w sind linear unabhängig: zweireihigen Fall die Produkte der Einträge in den blauen
Nun spannen v und w eine Ebene auf, und alle Linear- „Hauptdiagonalen“ addiert und jene der roten „Nebendiago-
kombinationen von v und w und nur diese, haben ein nalen“ subtrahiert.
verschwindendes Skalarprodukt mit dem Normalvektor
v × w. Demnach drückt D = 0 aus, dass u eine Linear- Aber Achtung: Diese Regel gilt nicht für vier- oder mehrrei-
kombination von v und w ist. hige Determinanten, die wir im Kapitel 13 einführen werden:
v und w sind linear abhängig:
Die Regel von Sarrus verdeutlicht eine weitere Eigenschaft
Nun sind auch {u, v, w} linear abhängig, und gleichzeitig
der Determinante: Wenn wir die Spaltenvektoren von A zy-
ist v × w = 0 und daher auch D = 0.
klisch vertauschen, also 1 → 2 → 3 → 1, so rücken die
Demnach gilt für beide Fälle: Sind {u, v, w} linear abhängig, Haupt- und Nebendiagonalen jeweils nach rechts um eine
so ist D = 0. Ist umgekehrt D = 0, so sind die 3 Vektoren weiter, und die letzte wird zur ersten. Die Determinante bleibt
linear abhängig.  offensichtlich unverändert.

In Koordinaten ausgedrückt ist D = u1 (v2 w3 − v3 w2 ) +


u2 (v3 w1 − v1 w3 ) + u3 (v1 w2 − v2 w1 ). Die im Folgen-
244 7 Analytische Geometrie – Rechnen statt Zeichnen

Das Spatprodukt dreier Vektoren liefert das Geometrische Deutung des Spatprodukts
Volumen des aufgespannten Parallelepipeds Der Absolutbetrag | det(u, v, w)| des Spatprodukts ist
gleich dem Volumen des von den Vektoren u, v und w
Wir kehren zurück zu den Produkten von Vektoren. aufgespannten Parallelepipeds.

Definition des Spatproduktes


Das Spatprodukt der Vektoren v, w ∈ ⎛
R3 mit Beweis: Wir haben bereits früher erklärt, dass die vier
⎛ ⎞ ⎛u,⎞ ⎞ kar-
u1 v1 w1 Punkte 0, u, u + v und v das von u und v aufgespannte
tesischen Koordinaten ⎝u2 ⎠, ⎝v2 ⎠ und ⎝w2 ⎠ wird Parallelogramm bestimmen. Nehmen wir noch die durch
u3 v3 w3 Verschiebung längs w entstehenden Ecken w, u+w, u+v+w
definiert als und v + w dazu, so entsteht das von den Vektoren u, v und w
⎛ ⎞
u1 v1 w1 aufgespannte Spat oder Parallelepiped. Fassen wir dieses
det(u, v, w) = det ⎝ u2 v2 w2 ⎠ als Vollkörper auf, so ist es gleich der Punktmenge
u3 v3 w3
{λu + μv + νw | 0 ≤ λ, μ, ν ≤ 1}.
Dies führt auf eine Abbildung
Wie bei Parallelogrammen lassen wir zu, dass der Anfangs-
3 3 3
(R × R × R ) → R mit (u, v, w)  → det(u, v, w). punkt 0 durch einen beliebigen anderen Punkt p ersetzt wird,
also das Parallelepiped im Raum parallel verschoben wird
Offensichtlich ist das Spatprodukt det(u, v, w) gleich dem im (Abb. 7.17).
Lemma auf Seite 243 definierten Wert D, dessen Verschwin-
den die lineare Abhängigkeit der Vektoren charakterisiert.

Verschwindendes Spatprodukt
Genau dann ist det(u, v, w) = 0, wenn die drei Vektoren
u, v und w linear abhängig sind, also komplanar liegen.
u×v
w
ϕ h
Wir haben D als u · (v × w) eingeführt. Dies zeigt, dass eine
v
Vertauschung von v mit w das Vorzeichen von D ändert.
Andererseits bleibt die Determinante bei zyklischen Vertau-
schungen der Spaltenvektoren erhalten. Somit verhält sich p
u
das Spatprodukt bei Änderungen der Reihenfolge gemäß

det(u, v, w) = det(v, w, u) = det(w, u, v)


= − det(u, w, v) = − det(v, u, w) = − det(w, v, u).

Auch bei der Darstellung des Spatprodukts D als gemischtes


Produkt u · (v × w) können wir zyklisch vertauschen, ohne Abbildung 7.17 Das Spatprodukt det(u, v, w) gibt das orientierte Volumen
den Wert zu verändern. Also ist auch D = w · (u × v). des von u, v und w aufgespannten Parallelepipeds an.

Das Spatprodukt als gemischtes Produkt Wir berechnen das Volumen des Parallelepipeds nach der
Das Spatprodukt lässt sich auch als Skalarprodukt mit Formel „Grundfläche mal Höhe“. Dabei wählen wir das von
einem Vektorprodukt ausdrücken: u und v aufgespannte Parallelogramm als Grundfläche des
genannten Parallelepipeds. Der Inhalt der Grundfläche be-
det(u, v, w) = u · (v × w) = w · (u × v) (7.11) trägt demnach
F# = u × v.
Wie die bisherigen Produkte ist auch das Spatprodukt linear
Die Höhe des Parallelepipeds ist gleich dem Wert h =
in jedem Anteil, also z. B.
w cos ϕ, wenn ϕ den Winkel zwischen w und einer zur
det ((u1 + u2 ), v, w) = det(u1 , v, w) + det(u2 , v, w). Grundfläche orthogonalen Geraden angibt. Nach unseren
bisherigen Ergebnissen gilt nun offensichtlich:
Dass das Spatprodukt eine vom Koordinatensystem unab-
hängige Bedeutung hat, folgt einerseits aus der Darstellung | det(u, v, w)| = |(u × v) · w|
als Skalarprodukt mit einem Vektorprodukt und der bereits = u × v w cos ϕ = F# · h,
bewiesenen Invarianz dieser beiden Produkte. Aber das Spat-
produkt hat auch eine einfache geometrische Deutung. wie behauptet wurde. 
7.3 Weitere Produkte von Vektoren im Anschauungsraum 245

? Beispiel
Für die Vektoren e1 , e2 , e3 der Standardbasis gilt:
Welche der oben angeführten Eigenschaften des Spat-
⎛⎞
produkts sind aufgrund dieser geometrischen Deutung un- 1 0 0
mittelbar ersichtlich? det(e1 , e2 , e3 ) = det ⎝ 0 1 0 ⎠ = 1.
0 0 1

Allgemein hat jede orthonormierte Basis (b1 , b2 , b3 ), die


Werden die drei linear unabhängigen Vektoren stetig ver-
ein Rechtssystem bildet, als Spatprodukt den Wert +1,
lagert, so kann sich auch deren Spatprodukt nur stetig ändern.
denn nach (7.11) ist
Das Volumen des Parallelepipeds und damit der Absolut-
betrag des Spatprodukts bleiben dabei konstant. Die Stetig- det(b1 , b2 , b3 ) = (b1 × b2 ) · b3 = b3 · b3 = b3 2 = 1.
keit ohne Nulldurchgang lässt beim Spatprodukt keinen Vor-
zeichenwechsel zu. Nicht nur der Betrag, sondern das Spat- Das von b1 , b2 und b3 aufgespannte Parallelepiped ist ein
produkt selbst muss konstant bleiben. Einheitswürfel.
Die vier Punkte
Wie früher beim Vektorprodukt können wir nach stetiger Ver- ⎞⎛ ⎛ ⎞
±2 0
lagerung die spezielle Position
a 1,2 = ⎝ √0 ⎠, ±2 ⎠
a 3,4 = ⎝ √
⎛ ⎞ ⎛ ⎞ 2 − 2
u1 v1
u = ⎝ 0 ⎠, v = ⎝ v2 ⎠ mit u1 , v2 > 0 bilden eine dreiseitige Pyramide, deren Kanten alle die-
0 0 selbe Länge 4 aufweisen (siehe Frage auf Seite 234). Es
handelt sich also um ein reguläres Tetraeder (Abb. 7.18).
erreichen. Dann aber ist Gesucht ist dessen Volumen V .
⎛ ⎞
u1 v1 w1 x3
det(u, v, w) = det ⎝ 0 v2 w2 ⎠ = u1 v2 w3 .
0 0 w3
a2
Somit gilt hier:

det(u, v, w) > 0 ⇐⇒ w3 > 0. a1

Bei positivem Spatprodukt zeigt w auf dieselbe Seite der


b1 -b2 -Ebene wie b3 . Damit folgen dann die Vektoren u, v und
w der Rechten-Hand-Regel. Deshalb wollen wir für beliebige
Vektortripel folgende Definition aufstellen. x1 a4
x2

Definition eines Rechts- bzw. Linkssystems


Die drei Vektoren u, v und w bilden ein Rechtssystem,
a3
wenn det(u, v, w) > 0 ist. Hingegen sprechen wir bei
det(u, v, w) < 0 von einem Linkssystem. Abbildung 7.18 Die Punkte a 1 bis a 4 bilden ein reguläres Tetraeder.

Dies legt nahe, das Spatprodukt det(u, v, w) ohne Betrags- Zu dessen Berechnung wählen wir etwa das Dreieck
a 1 a 2 a 3 als Grundfläche und berechnen das Pyramidenvo-
zeichen als orientiertes Volumen des von u, v und w auf-
lumen nach der Formel 13 Grundfläche mal Höhe. Wenn
gespannten Parallelepipeds zu definieren. Dessen Absolut-
wir die Grundfläche zu dem Parallelogramm a 1 a 2 p a 3
betrag ist, wie eben gezeigt, gleich dem elementaren Vo- ergänzen bei p = a 2 + (a 3 − a 1 ), so verdoppeln wir
lumen. Das orientierte Volumen ist positiv oder negativ je deren Flächeninhalt. Dann aber stellt das Produkt Grund-
nachdem, ob die linear unabhängigen Vektoren in der ange- fläche ×Höhe den Inhalt des von den Differenzvektoren
gebenen Reihenfolge ein Rechtssystem oder ein Linkssystem a 2 − a 1 , a 3 − a 1 und a 4 − a 1 aufgespannten Parallelepi-
bilden. peds dar. Somit gilt für das Tetraedervolumen:
V = 1
|det [(a 2 − a 1 ), (a 3 − a 1 ), (a 4 − a 1 )]|
6
) ⎛ ⎞)
) −4 −2 −2 )
Kommentar: Wenn wir ein Rechtssystem mithilfe der De- ) )
= 1 )det ⎝ 0 2 −2 ⎠)
terminante definieren, die selbst ja über Koordinaten berech- 6 ) √ √ )
) 0 −2 2 −2 2 )
net wird, so genügt es nur dann der Rechten-Hand-Regel, √
) √ √ )) 16 2
wenn auch die den Koordinaten zugrunde liegende kartesi- )
= 1
6 )(−4)(−4 2 − 4 2)) = .
sche Basis der Rechten-Hand-Regel genügt. 3
246 7 Analytische Geometrie – Rechnen statt Zeichnen

Alternativ dazu zeigt die Formel auf Seite 491, wie das Mithilfe der Grassmann-Identität lassen sich die folgenden
Volumen einer dreiseitigen Pyramide aus deren sechs Kan- Formeln für weitere gemischte Produkte herleiten:
tenlängen berechenbar ist, nämlich mithilfe der Cayley-
Menger’schen Determinante.  1. Jacobi-Identität
[u × (v × w)] + [v × (w × u)] + [w × (u × v)] = 0.
In der Box auf Seite 247 wird anhand eines Beispiels de-
monstriert, wie der Grundaufgabe der analytischen Geome-
trie entsprechend jede geometrische Aussage äquivalent ist 2. Lagrange-Identität
zu einer in Koordinaten formulierbaren mathematischen Aus-
sage. (u × v) · (w × x) = (u · w)(v · x) − (u · x)(v · w).

Die Übersicht auf Seite 248 zeigt gesammelt die bisherigen


Produkte sowie die damit zusammenhängenden wichtigsten 3. Vektorprodukt zweier Vektorprodukte
Formeln.
(u × v) × (w × x) = det(u, w, x) v − det(v, w, x) u.

Einige nützliche Formeln für gemischte Beweis: Die erste Gleichung folgt aus der Grassmann-
Produkte Identität durch zyklische Vertauschung, also den Ersatz
(u, v, w) → (v, w, u) → (w, u, v), und durch anschlie-
Wir stellen in der Folge einige Formeln zusammen, die beim ßende Addition.
Rechnen mit Vektoren im R3 hilfreich sind, und beginnen
mit der Grassmann-Identität:
Die Langrange-Identität ergibt sich aus (7.11) wie folgt:
(u × v) × w = (u · w)v − (v · w)u.
(u × v) · (w × x) = det ((u × v), w, x)
= [(u × v) × w] · x
Beweis: Wir bestätigen die Richtigkeit, indem wir die = [(u · w)v − (v · w)u] · x.
Koordinaten ausrechnen: Setzen wir vorübergehend x =
u × v, so lautet die erste Koordinate des gesuchten Vektors Die Formel u × v = u v sin ϕ aus (7.10) ist wegen
y = (u×v) × w = x × w: (7.6) ein Sonderfall der Lagrange-Identität. Dasselbe trifft
auf die Gleichung (u · v)2 + (u × v)2 = u2 v2 von
y 1 = x 2 w3 − x 3 w2 Seite 243 zu.
= (u3 v1 − u1 v3 )w3 − (u1 v2 − u2 v1 )w2
= v1 (u3 w3 + u2 v2 ) − u1 (v3 w3 + v2 w2 ).
Schließlich folgt aus der Grassmann-Identität
Wir geben auf der rechten Seite u1 v1 w1 − u1 v1 w1 = 0 dazu
und erhalten: (u × v) × (w × x) = (u · (w × x)) v − (v · (w × x)) u
= det(u, w, x) v − det(v, w, x) u,
y1 = v1 (u3 w3 +u2 v2 +u1 w1 ) − u1 (v3 w3 +v2 w2 +v1 w1 )
= (u · w)v1 − (v · w)u1 . womit auch die letzte Gleichung gezeigt ist. 

Zyklische Vertauschung liefert die restlichen Koordinaten


und damit genau die obige Formel. Kommentar: Ein K-Vektorraum V mit einer zusätzlichen
Abschließend noch eine Bemerkung zu diesem eher unele- Verknüpfung ∗ : V × V → V und
ganten Beweis: Das Skalarprodukt von y = (u × v) × w
a ∗ (b + c) = (a ∗ b) + (a ∗ c),
mit (u × v) muss verschwinden. Ebenso ist u · (u × v) =
(a + b) ∗ c = (a ∗ c) + (b ∗ c),
v · (u × v) = 0. Somit muss bei linear unabhängigen u und v
λ (a ∗ b) = (λ a) ∗ b = a ∗ (λ b)
der Vektor y eine Linearkombination von u und v sein, also
y = λu + μv. Aber wie die Koeffizienten λ und μ tatsäch-
lich aussehen, das ist doch nur durch explizites Ausrechnen heißt K-Algebra. Offensichtlich ist der R3 zusammen mit
zu bestimmen. 
dem Vektorprodukt eine R-Algebra. Diese Verknüpfung ist
allerdings weder assoziativ (siehe Seite 66), noch kommu-
tativ. Hingegen ist der Polynomring aus dem Abschnitt 3.4
? ein Beispiel für eine K-Algebra, wenn ∗ die Multiplikation
Beweisen Sie unter Benutzung der Grassmann-Identität die von Polynomen bedeutet, und diese Verknüpfung ist sowohl
folgende Variante: assoziativ als auch kommutativ.

u × (v × w) = (u · w)v − (u · v)w. Eine K-Algebra, in welcher die Jacobi-Identität gilt und fer-
ner a ∗ a = 0 für alle a ∈ V , heißt übrigens Lie-Algebra.
7.4 Abstände zwischen Punkten, Geraden und Ebenen 247

Beispiel: Analytische Formulierung einer geometrischen Bedingung


Gegeben seien vier Raumpunkte s 1 , . . . , s 4 . Welche Gleichung muss ein Raumpunkt x erfüllen, damit dessen Verbindungsge-
raden mit den gegebenen Punkten auf einem Drehkegel liegen?

Problemanalyse und Strategie: Liegen diese Geraden auf einem Drehkegel, so enden die von x längs dieser Geraden
abgetragenen Einheitsvektoren in vier Punkten p1 , . . . , p4 eines Kreises auf diesem Drehkegel (siehe Abbildung unten)
und damit in einer Ebene. Liegen umgekehrt diese vier Punkte im Abstand 1 von x in einer Ebene, so gehören sie dem
Schnitt dieser Ebene mit der in x zentrierten Einheitskugel an, also einem Kreis. Dessen Verbindungsgeraden mit der
Kugelmitte bilden einen Drehkegel oder, falls die Ebene durch die Kugelmitte geht, eine Ebene, also den Grenzfall eines
Drehkegels mit 180◦ Öffnungswinkel.

Lösung: Diese liegen genau dann in einer Ebene, wenn die Diffe-
renzvektoren je zweier v j −
v 1 für j = 2, 3, 4 komplanar,
also linear abhängig sind. Dies kann mithilfe des Spatpro-
s4
dukts ausgedrückt werden:
 

v4 v2 − 
det ( v3 − 
v 1 ), ( v4 − 
v 1 ), ( v 1 ) = 0. (∗)

s1 s3 Will man den Grenzfall eines in eine Ebene entarteten



v3 Drehkegels ausschließen, so muss man bedenken, dass in

v1
s2 v1 , . . . , 
diesem Fall nicht nur x und  v 4 in einer Ebene lie-
x 
v2 gen, sondern auch die Ausgangspunkte s 1 , . . . , s 4 . Dieser
Fall kann also überhaupt nur auftreten, wenn

Zur Formulierung der entsprechenden analytischen Bedin- det ((s 2 − s 1 ), (s 3 − s 1 ), (s 4 − s 1 )) = 0


gung wenden wir eine Parallelverschiebung an, die x in
ist. Wenn dann bei (s 2 − s 1 ) × (s 3 − s 1 ) = 0 zusätzlich
den Koordinatenursprung verlegt. Die Spitzen der längs
zu (∗) noch die Bedingung
der Geraden abgetragenen Einheitsvektoren werden zu
Punkten mit den Ortsvektoren det ((s 2 − s 1 ), (s 3 − s 1 ), (x − s 1 )) = 0
si − x

vi = , i = 1, . . . , 4. gefordert wird, so sind nur „echte“ Drehkegel möglich.
s i − x

7.4 Abstände zwischen Punkten, herausstellen; es gibt dann nämlich stets Punkte a ∈ M und
b ∈ N mit dist(M, N ) = a − b.
Geraden und Ebenen
In diesem Abschnitt zeigen wir, wie mithilfe der im Anschau- Abstände eines Punkts von Geraden oder
ungsraum verfügbaren Produkte von Vektoren Abstände zwi- Ebenen sind mittels Vektorprodukt zu
schen Punkten, Geraden und Ebenen oder auch zwischen berechnen
zwei Geraden berechenbar sind. Dabei gehen wir von fol-
gender Definition aus: Angenommen, es sind die Gerade G = p + Ru und der
Punkt a außerhalb von G gegeben (Abb. 7.19). Der Punkt
Sind M und N zwei nichtleere Punktmengen des R3 , so heißt
b ∈ G sei der Fußpunkt der aus p an G legbaren Normalen.
Dann bildet jeder Punkt x ∈ G \ {b} zusammen mit a und
dist(M, N) = inf { x − y | x ∈ M und y ∈ N}
b ein rechtwinkliges Dreieck, und dessen Hypotenuse ax ist
stets länger als die Kathete ab. Also ist die Kathetenlänge
Abstand oder Distanz der Punktmengen M und N.
Wegen x − y ≥ 0 ist die Menge der Distanzen x − y a − b = min{ a − x | x ∈ G} = dist(a, G).
durch 0 nach unten beschränkt; also gibt es stets dieses Infi-
mum. Dieses braucht allerdings kein Minimum zu sein, wie Zur Berechnung des Abstands dist(a, G) bestimmen wir zu-
wir aus Kapitel 4 wissen. Sind die Mengen M und N af- erst einen Normalvektor der Verbindungsebene aG, nämlich
fine Teilräume des R3 , also Punkte, Geraden oder Ebenen, (Abb. 7.19):
so werden sich die gegenseitigen Abstände doch als Minima n = (a − p) × u.
248 7 Analytische Geometrie – Rechnen statt Zeichnen

Übersicht: Produkte von Vektoren im R3


Für die analytische Geometrie im Anschauungsraum stehen drei verschiedene Produkte von Vektoren zur Verfügung.

Das Skalarprodukt u · v der Vektoren u, v ∈ R3 – Bei linear unabhängigen u, v steht u × v auf der
mit kartesischen Koordinaten (u1 , u2 , u3 )0 bzw. von u und v aufgespannten Ebene normal; die Norm
(v1 , v2 , v3 )0 lautet: u × v ist gleich dem Flächeninhalt u v sin ϕ
des von u und v aufgespannten Parallelogramms; der
u · v = u1 v1 + u2 v2 + u3 v3 . Vektor u × v bildet mit u und v ein Rechtssystem,
sofern sich die Koordinaten auf ein Rechtskoordina-
√ tensystem beziehen.
– Es ist u = u · u die Norm oder Länge des Vek-
tors u und a − b die Distanz der Punkte a und b. Das Spatprodukt det(u, v, w) ist eine reelle Zahl und
– Jeder Vektor u  = 0 lässt sich durch skalare Multi- zwar die Determinante derjenigen 3 × 3 -Matrix, wel-
plikation gemäß u = u1 u auf einen Einheitsvektor che die kartesischen Koordinaten von u, v und w der
normieren. Reihe nach als Spaltenvektoren besitzt.
– Das Skalarprodukt u·v ist symmetrisch, v ·u = u·v, – Das Spatprodukt ist linear in jedem Anteil, also
und in jedem Anteil linear, also (u1 +u2 )·v = (u1 ·v) det(u1 + u2 , v, w) = det(u1 , v, w) + det(u2 , v, w)
+ (u2 · v) und (λu) · v = λ(u · v). und det(λu, v, w) = λ det(u, v, w).
– Das Produkt u · v ist vom verwendeten kartesi- – Die Vertauschung zweier Vektoren ändert das Vor-
schen Koordinatensystem unabhängig, denn es gilt zeichen; es ist det(u, v, w) = det(v, w, u) =
u · v = u v cos ϕ mit ϕ als dem von u und v − det(v, u, w).
eingeschlossenen Winkel bei 0 ≤ ϕ ≤ π. – Das Spatprodukt det(u, v, w) gibt das orientierte
– Eine orthonormierte Basis (b1 , b2 , b3 ) des R3 ist Volumen des von den drei Vektoren aufgespannten
durch bi · bj = δij gekennzeichnet. Parallelepipeds an und ist somit unabhängig von dem
– Es gelten die Cauchy-Schwarz’sche Ungleichung zugrunde liegenden Rechtskoordinatensystem.
|u · v| ≤ u v und die Dreiecksungleichung – Genau bei det(u, v, w) > 0 bilden die drei Vektoren
u + v ≤ u + v. in dieser Reihenfolge ein Rechtssystem.
Das Vektorprodukt oder Kreuzprodukt u × v ist ein – Ein verschwindendes Spatprodukt kennzeichnet li-
Vektor und aus den kartesischen Koordinaten von u und neare Abhängigkeit.
v nach der Formel – Es ist det(u, v, w) = u · (v × w) = w · (u × v).

u × v = (u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 )0 Ferner gelten:


– die Grassmann-Identität (u × v) × w = (u · w)v
zu berechnen. − (v · w)u,
– Das Vektorprodukt ist schiefsymmetrisch, also – die Jacobi-Identität [u × (v × w)] + [v × (w × u)]
v × u = −u × v, und linear in jedem Anteil, + [w × (u × v)] = 0,
d. h., (u1 + u2 ) × v = (u1 × v) + (u2 × v) und – die Lagrange-Identität (u × v) · (w × x) = (u · w)
λu × v = λ (u × v). (v · x) − (u · x)(v · w)
– Lineare Abhängigkeit von u und v ist durch – sowie für das Vektorprodukt von Vektorprodukten
u × v = 0 gekennzeichnet. (u×v)×(w ×x) = det(u, w, x) v −det(v, w, x) u.

Dann ist n gleich dem Inhalt des von u und a − p auf- Bei der Bestimmung des Abstand des Punkts a von der Ebene
gespannten Parallelogramms. Die Höhe dieses Parallelo- E = p + R u + R v gehen wir analog vor: Wir legen durch a
gramms gegenüber u ist gleich der gesuchten Distanz. die Normale N = a+R(u×v) zur Ebene E und suchen deren
Schnittpunkt b mit E (siehe Abbildung 7.22 auf Seite 252).
Folgerung Jeder von b verschiedene Punkt x ∈ E bildet mit b und
Für den Abstand des Punkts a von der Geraden G = p + Ru a ein rechtwinkliges Dreieck, denn (x − b) · (u × v) =
gilt: det(x − b, u, v) = 0 wegen der linearen Abhängigkeit der
(a − p) × u beteiligten Vektoren. Die Hypotenuse ax ist natürlich länger
dist(a, G) = .
u als die Kathete ab. Somit ist dist(a, E) = b − a.

Der Fußpunkt b der Normalen aus dem Punkt a an die Gerade Der Normalenfußpunkt b ∈ (E ∩ N) hat die beiden Darstel-
G = p + Ru lautet: lungen
(a − p) · u b = p + λ u + μ v und b = a + ν (u × v)
b=p+ u,
u·u
wie schon auf Seite 235 festgestellt worden ist. mit gewissen λ, μ, ν ∈ R. Das Skalarprodukt beider Darstel-
7.4 Abstände zwischen Punkten, Geraden und Ebenen 249

jedem Punkt a ∈ G eine Normale N an H gelegt werden, die


wegen der Parallelität zwischen H und G auch zu G normal
ist. Der Schnittpunkt b von N mit H bestimmt dist(G, H ) =
u × (a −p)
a − b. Durch Translationen in der Richtung von G und H
entstehen aus N unendlich viele gemeinsame Normalen.
a−p a Sind G und H nicht parallel, also deren Richtungsvektoren u
und v linear unabhängig, so muss eine gemeinsame Normale
d N von G und H die Richtung des Vektors n = u × v haben.
p Nun gibt es eine zu n normale Ebene EG durch G, und H
u b G ist parallel dazu. Durch die Orthogonalprojektion von H auf
die Ebene EG entsteht die Gerade H  (Abb. 7.20). Diese ist
parallel zum Urbild H und schneidet G in einem Punkt a. Die
Verbindungsgerade von a mit dessen Urbild b ∈ H ergibt das
in diesem Fall eindeutige Gemeinlot N .
Abbildung 7.19 Der Abstand d des Punkts a von der Geraden G.
N y H

lungen mit u × v führt wegen (u × v) · u = (u × v) · v = 0


auf die Gleichung b
d
2 H
p · (u × v) = a · (u × v) + ν(u × v) ,
x
also nach Seite 244: G
a
EG
(p − a) · (u × v) det(p − a, u, v)
ν= = .
u × v 2 u × v2
Abbildung 7.20 Die gemeinsame Normale N der Geraden G und H .
Aus b − a = ν (u × v) folgt b − a = |ν| u × v.

Folgerung Lemma
Für den Abstand des Punkts a von der Ebene E = p + Sind die zwei Geraden G und H nicht parallel, so
Ru + Rv gilt: gibt es ein eindeutiges Gemeinlot N. Für die Schnittpunkte
a, b von N mit G bzw. H gilt:
| det(p − a, u, v)|
dist(a, E) = . dist(G, H ) = b − a.
u × v

Wir erkennen zugleich: Zu jedem Raumpunkt a gibt es einen


Normalenfußpunkt Beweis: Für beliebige Punkte x = a + λ u ∈ G und
det(p−a , u, v )
y = b + μ v ∈ H ist
b=a+ u×v 2
(u × v) (7.12)
y − x = (b − a) + (μ v − λ u) bei (b − a) ⊥ u, v.
in E. Wir nennen die Abbildung R3 → E mit a  → b die Or-
thogonalprojektion oder Normalprojektion auf die Ebene Wegen (b − a) · u = (b − a) · v = 0 folgt:
E (Abb. 7.22 oder 7.23). Auf Seite 255 werden wir eine Ma-
trizendarstellung dieser Abbildung kennenlernen. y − x2 = b − a2 + μ v − λ u2 ≥ b − a2 .

Gleichheit besteht genau dann, wenn μ v − λ u = 0 ist. We-


Der Abstand zweier Geraden wird längs des gen der geforderten linearen Unabhängigkeit von u und v
Gemeinlots gemessen bleibt für das Minimum nur λ = μ = 0, also x = a und
y = b. 

Als Nächstes wenden wir uns dem Abstand zweier Geraden


G = p + Ru und H = q + Rv zu. Zuerst zeigen wir, dass es Wie können wir die Fußpunkte a und b und die Distanz
stets ein Gemeinlot gibt, also eine Gerade N, welche G und dist(G, H ) berechnen, wenn die Geraden in der Form G =
H unter rechtem Winkel schneidet (Abb. 7.20). p + Ru und H = q + Rv gegeben sind?
Bei G = H ist die Aussage trivial. Sind die beiden Geraden G Wir setzen die beiden Fußpunkte von N an in der Form
und H parallel und verschieden, so liegen sie in der von q −p
und u aufgespannten Ebene. Dann kann so wie vorhin aus a = p + λu, b = q + μv bei b − a = ν n, n = u × v.
250 7 Analytische Geometrie – Rechnen statt Zeichnen

Dann ist dist(G, H ) = ν n = |ν| n, wobei die Vektor- (Abb. 7.21). Genau dann verschwindet deren Spatprodukt,
gleichung b − a = ν n, also d. h.:

q − p − λ u + μ v = ν n. (∗) det ((x − p), u, v) = (x − p) · (u × v) = 0,

zu erfüllen ist. In Koordinaten ausgeschrieben sind dies drei oder mit n = u × v als Normalvektor zu E:
lineare Gleichungen in den drei Unbekannten λ, μ und ν.
n · x = n · p = k = konst.
Durch Bildung von Skalarprodukten lassen sich die Unbe-
kannten sogar explizit angeben: Dies bedeutet ausführlich:
Wir multiplizieren die auf der linken und rechten Seite der
n1 x1 + n2 x2 + n3 x3 = k.
Gleichung (∗) stehenden Vektoren skalar mit n und erhalten:

(q − p) · n − λ(u · n) + μ(v · n) = ν(n · n)


x3
und weiter wegen u · n = v · n = 0
(q − p) · n n
ν= . b
n2
v
Wenn wir andererseits das Skalarprodukt der Vektoren aus E
(∗) mit v × n bilden, so fallen wegen der Orthogonalität die x
Produkte mit v und n weg, und es bleibt nach (7.11): p
u
det ((q − p), v, n) − λ det(u, v, n) = 0, a
x2
somit
det(q − p, v, n)
λ= . x1
det(u, v, n)
Analog folgt nach Bildung des Skalarprodukts mit u × n:
Abbildung 7.21 Die Ebene E = p + Ru + Rv geht durch p und wird von
den Vektoren u und v aufgespannt.
det(q − p, u, n)
μ= .
det(u, v, n)
Die Ebenengleichung
Folgerung Eine Ebene ist die Lösungsmenge einer linearen Glei-
Die Distanz zweier nicht paralleler Geraden G = p + Ru chung n1 x1 + n2 x2 + n3 x3 = k. Dabei sind die in dieser
und H = q + Rv lautet: Gleichung auftretenden Koeffizienten (n1 , n2 , n3 ) = 0
die Koordinaten eines Normalvektors n von E.
| det ((q − p), u, v) |
dist(G, H ) = .
u × v Wir können den Normalvektor normieren, und zwar sogar
n = ± n1 n.
auf zwei Arten, als 
Die Punkte a ∈ G und b ∈ H mit dist(G, H ) = a − b
lauten:
[(q − p) × v] · (u × v) Definition der Hesse’schen Normalform einer Ebene
a = p + λ u mit λ = und Ist n ein normierter Normalvektor der Ebene E, d. h.,
u × v2
n = 1, so heißt die zugehörige Ebenengleichung
[(q − p) × u] · (u × v)
b = q + μ v mit μ = .
u × v2 l(x) = n · x − k = n1 x1 + n2 x2 + n3 x3 − k = 0

Der Mittelpunkt der Gemeinlotstrecke ab ist gleichzeitig nach L. O. Hesse (1811–1874) Hesse’sche Normalform
eine optimale Näherung für den „Schnittpunkt“ zweier ein- der Ebene E.
ander „beinahe“ schneidenden Geraden, wie das Beispiel auf
Seite 251 zeigt. Dabei gibt |k| = |n · p| nach der geometrischen Deu-
tung des Skalarprodukts (siehe Abbildung 7.13) den Ab-
stand des Koordinatenursprungs o von der Ebene E an, also
Die Hesse’sche Normalform ist mehr als nur dist(o, E) = |k|.
die Gleichung einer Ebene Setzen wir einen beliebigen Raumpunkt a in die Ebenenglei-
chung ein, so ist bei x ∈ E (Abb. 7.22)
Der Punkt x liegt genau dann in der Ebene E = p+ Ru+ Rv,
wenn die Vektoren (x − p), u und v linear abhängig sind l(a) = n · a − k = n · a − n · x = n · (a − x).
7.4 Abstände zwischen Punkten, Geraden und Ebenen 251

Beispiel: Optimale Approximation des Schnittpunkts zweier Geraden


Es gibt numerische Verfahren, um aus zwei Fotos desselben Objektes das dargestellt Objekt zu rekonstruieren, also die Koordi-
naten der in beiden Bildern sichtbaren Punkte zu berechnen, sofern die tatsächliche Länge einer in beiden Bildern ersichtlichen
Strecke bekannt ist. Ist dann die gegenseitige Lage der Kameras zum Zeitpunkt der Aufnahmen bestimmt, so denken wir uns die
beiden Fotos der Aufnahmesituation entsprechend im Raum platziert (siehe Skizze unten). Seien z1 bzw. z2 die Aufnahmezen-
tren, also die Brennpunkte der Objektive, und x 1 bzw. x 2 die beiden Bilder eines Raumpunkts x. Zur Rekonstruktion des Urbild-
punkts x sind dann offensichtlich die beiden Projektionsgeraden z1 +R(x 1 −z1 ) und z2 +R(x 2 −z2 ) miteinander zu schneiden.

5
6 5
6
4 3
3 4
8 11 1 8
9 11
1
9
7 12 7
12
2
13 2 13
10 10
14
14

Ein Problem der Computer-Vision: Die Rekonstruktion zweier Fotos mithilfe von 14 Passpunkten.

Problemanalyse und Strategie: Nachdem die zi und x i durch Messungen und numerische Berechnungen ermittelt
worden sind, kann man nicht erwarten, dass die beiden Projektionsgeraden einander wirklich schneiden. Man muss also
die bestmögliche Näherung für den Schnittpunkt ausrechnen.

Lösung: 2) Verlangt man hingegen eine minimale Quadratsumme


Setzt man voraus, dass die beiden Projektionsgeraden G der Entfernungen, so bleibt der Mittelpunkt m von ab als
und H nicht parallel sind, so wird man diese Näherung einzige Lösung. Zur Begründung wählen wir ein spezielles
intuitiv dort wählen, wo G und H einander am nächsten Koordinatensystem mit m als Ursprung und der gemeinsa-
kommen. Wir bestimmen demnach die gemeinsame Nor- men Normalen als x3 -Achse. Dann können wir ansetzen:
male der beiden Projektionsgeraden und darauf den Mit- ⎛ ⎞ ⎛ ⎞
0 0
telpunkt m zwischen den beiden Normalenfußpunkten a a = ⎝ 0 ⎠, b=⎝ 0 ⎠ mit 2c = a − b.
und b, also m = 21 (a + b) (siehe Abbildung unten). Dazu c −c
verwenden wir die Formeln von Seite 250.
Die Punkte x ∈ G und y ∈ H seien x = a + λ u ,
Inwiefern ist dieser Punkt optimal? y = b + μ v, wobei
1) Angenommen p ist ein beliebiger Raumpunkt und ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
u1 v1 p1
x ∈ G und y ∈ H sind die zugehörigen Normalenfuß- u= ⎝ u2 ⎠ , v= ⎝ v2 ⎠ und p = ⎝ p2 ⎠ .
punkte auf G bzw. H . Dann ist jedenfalls nach der Drei- 0 0 p3
ecksungleichung
Dann ist
p − x + p − y ≥ x − y ≥ a − b.
p − x2 + p − y2
Die Summe der Entfernungen des Punkts p von G und H
= p − a − λ u2 + p − b − μ v2
ist genau dann minimal, wenn beide Male das Gleichheits-
zeichen gilt, und dies trifft für alle Punkte der abgeschlos- = (p1 − λu1 )2 + (p2 − λu2 )2 + (p3 − c)2
senen Strecke ab zu (Abb. 7.20). + (p1 − μv1 )2 + (p2 − μv2 )2 + (p3 + c)2
≥ (p3 − c)2 + (p3 + c)2 = 2 p32 + 2 c2 ≥ 2 c2 .
2. Bil
d
m Gleichheit in beiden Fällen ist nur möglich bei
x2 ' ( ' ( ' (
1. Bild
p3 = 0 und p1
p2
=λ u1
u2
=μ v1
v2
.
z2
x1 Wegen der linearen Unabhängigkeit von u und v bleibt
z1 λ = μ = 0, also x = a, y = b und p = m.
252 7 Analytische Geometrie – Rechnen statt Zeichnen

Somit gibt l(a) die vorzeichenbehaftete Länge der Projektion Die Werte l(x) durchlaufen wegen 0 ≤ λ ≤ 1 das abge-
des Vektors a − x auf n an. Dies eröffnet die Möglichkeit, schlossene Intervall [ l(a), l(b) ] in R. Haben l(a) und l(b)
den Abstand dist(a, E) zusätzlich mit einem Vorzeichen zu gleiche Vorzeichen, so haben auch alle Zwischenwerte l(x)
versehen. dieses Vorzeichen. Deshalb sind die offenen Halbräume kon-
vex. Sind l(a) und l(b) nicht negativ bzw. nicht positiv, so gilt
jeweils dasselbe für alle Zwischenwerte. Damit ist auch die
Konvexität der abgeschlossenen Halbräume bewiesen. 
N
a Beispiel Die vier Punkte
n
⎛ ⎞ ⎛⎞
a−x ±2 0
a 1,2 = ⎝ √0 ⎠, a 3,4 = ⎝ √
±2 ⎠
2 − 2
l(a ) b

x bestimmen eine dreiseitige Pyramide mit lauter Kanten der-


selben Länge, also ein reguläres Tetraeder (Abb. 7.18). Ge-
E sucht sind spezielle Normalvektoren der vier Seitenflächen,
und zwar diejenigen Einheitsvektoren, welche nach außen
weisen. Auch soll das Innere dieses Tetraeders durch Un-
gleichungen gekennzeichnet werden.
Abbildung 7.22 Die Bedeutung der Hesse’schen Normalform: d = l(a) ist der
orientierte Abstand des Punkts a von der Ebene E. Dabei kann d positiv, negativ Ein auf der Verbindungsebene von a 1 , a 2 und a 3 normal
oder gleich null sein. stehender Vektor ist als Vektorprodukt zu berechnen:

n123 = (a 2 − a 1 ) × (a 3 − a 1 )
Eigenschaften der Hesse’schen Normalform ⎛ ⎞
⎛ ⎞ ⎛ ⎞
−4 −2 0√
Ist l(x) = 0 die Hesse’sche Normalform der Ebene E, = ⎝ 0 ⎠ × ⎝ 2√ ⎠ = ⎝−8 2 ⎠.
so gibt l(a) den orientierten Abstand des Punkts a von 0 −2 2 −8
E an. Dabei ist dieser Abstand l(a) genau dann posi-
tiv, wenn a auf jener Seite von E liegt, auf welche der Wir normieren zu
Normalvektor n zeigt. ⎛ ⎞
1 √0

n123 = √ ⎝ 2 ⎠
3 1
Die Ebene E zerlegt den Raum R3 \ E in zwei offene Halb-
räume, deren Punkte x durch l(x) > 0 bzw. durch l(x) < 0 und haben damit eine von zwei möglichen Richtungen aus-
gekennzeichnet sind. Die durch l(x) ≥ 0 bzw. l(x) ≤ 0 gewählt. Um festzustellen, ob n123 nach außen oder innen
charakterisierten Punktmengen heißen abgeschlossene Halb- zeigt, berechnen wir die Gleichung der Ebene a 1 a 2 a 3 als
räume.
l(x) = n123 · x − k mit l(a 1 ) = 0,
Lemma √
Halbräume sind stets konvexe Mengen, ob sie nun offen sind also k = 
n123 · a 1 = 2/3. Nun gilt für den Ursprung, also
oder die Punkte der Begrenzungsebene einschließen. für einen Innenpunkt des Tetraeders:
%
Beweis: Nach der Definition der Konvexität auf Seite 231 l(0) = −k = − 2/3 < 0.
müssen wir beweisen, dass ein offener bzw. abgeschlossener
Dieser orientierte Abstand ist negativ; der Vektor 
n123 weist
Halbraum mit zwei Punkten a und b stets die ganze Strecke
somit wie gewünscht nach außen.
ab enthält. Unsere Anschauung zeigt uns, dass dies offen-
sichtlich richtig ist. Trotzdem soll vorgeführt werden, wie Der Normalvektor n124 der Ebene span(a 1 a 2 a 4 ) unterschei-
sich dies durch Rechnung beweisen lässt: det sich von n123 durch das Vorzeichen der ersten und dritten
Koordinate, und analoge Überlegungen ergeben für den rich-
Die Punkte der abgeschlossenen Strecke ab sind als Kon-
tig orientierten Einheitsvektor:
vexkombinationen von a und b darstellbar. Nach Seite 230
ist ⎛ ⎞
√ 0
1
conv{a, b} = { x = λ a + (1 − λ) b | 0 ≤ λ ≤ 1 }. 
n124 = √ ⎝− 2 ⎠.
3 1
Wegen l(x) = n · x − k folgt weiter:
Analog berechnen wir:
l(x) = n · [λ a + (1 − λ) b] − k
⎛√ ⎞ ⎛ √ ⎞
= λ(n · a) + (1 − λ)(n · b) − k
1 2 1 − 2
= λ (l(a) + k) + (1 − λ) (l(b) + k) − k 
n134 = √ ⎝ 0 ⎠ und 
n234 = √ ⎝ 0 ⎠.
= λ l(a) + (1 − λ) l(b). 3 −1 3 −1
7.4 Abstände zwischen Punkten, Geraden und Ebenen 253

Dabei weisen auch diese beiden Vektoren nach außen, denn aus R3×3 . Damit lautet ϕ ausführlich:
wir erhalten für den in beiden Ebenen gelegenen√Punkt a 3 ⎛ ⎞ ⎛ ⎞⎛ ⎞
positive Skalarprodukte a 3 · 
n134 = a 3 · 
n234 = 2/3 > 0. x1 a11 a12 a13 x1
⎝x  ⎠ = ⎝ a21 a22 a23 ⎠ ⎝x2 ⎠
2
Die Punkte im Inneren dieses Tetraeders sind somit durch die x3 a31 a32 a33 x3
folgenden vier linearen Ungleichungen beschrieben: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a11 a12 a13
√ √ = ⎝ a21 ⎠ x1 + ⎝ a22 ⎠ x2 + ⎝ a23 ⎠ x3 .
√2 x2 + x3 − √2 < 0
a31 a32 a33
−√2 x2 + x3 − √2 < 0
√2 x1 − x3 − √2 < 0
Wählen wir als Urbild x den Vektor e1 der Standardbasis
− 2 x2 − x3 − 2 < 0
des R3 (siehe Seite 235), also mit x1 = 1, x2 = x3 = 0,
Hier haben √
wir die Hesse’schen Normalformen jeweils mit so ist der Bildvektor x  gleich dem ersten Spaltenvektor s 1
dem Faktor 3 erweitert. von A. Analog sind die restlichen Spaltenvektoren Bilder
von e2 bzw. e3 . Die Abbildung ϕ ist somit durch die Bilder
Die Bestimmung der Lösungsmenge von Systemen derarti- ϕ(ei ) = s i der Standardbasis eindeutig festgelegt.
ger linearer Ungleichungen gehört übrigens zum Fachgebiet
lineare Optimierung (siehe Kapitel 24). Nach dem Lemma Auch die identische Abbildung idR3 ist eine lineare Abbil-
auf Seite 252 ist die Lösungsmenge der Durchschnitt endlich dung. Wegen idR3 (ei ) = ei lautet die zugehörige Darstel-
vieler konvexer Mengen und somit ebenfalls konvex.  lungsmatrix
⎛ ⎞
1 0 0
? E 3 = ⎝ 0 1 0 ⎠.
Welche geometrische Form wird von den Punkten mit den 0 0 1
n123 , 
Ortsvektoren  n124 , 
n134 , 
n234 gebildet?
Diese heißt (dreireihige) Einheitsmatrix, und es ist
E3 x = x für alle x ∈ R3 .
Die obige Zerlegung des Matrizenprodukts A x in eine
Die Orthogonalprojektion ist Anlass für eine Summe von Spaltenvektoren zeigt, dass alle Bildvektoren
x  Linearkombinationen der Spaltenvektoren s 1 , s 2 , s 3 von
Vorschau auf lineare Abbildungen
A sind. Die Menge der Bildvektoren ist somit die Hülle der
Spaltenvektoren von A und damit ein Unterraum von R3 .
Bevor wir uns im Anschauungsraum genauer mit Ortho-
Die Dimension dieses Unterraums, des Bildes ϕ(R3 ), heißt
gonalprojektionen auf Ebenen oder Geraden befassen, sind
Rang rg(ϕ) der linearen Abbildung ϕ und auch Rang rg A
einige Zwischenbemerkungen über lineare Abbildungen und
der Darstellungsmatrix A.
über das Rechnen mit Matrizen notwendig.
Bei rg(A) = 3 sind die Spaltenvektoren s 1 , s 2 , s 3 linear un-
Eine Abbildung ϕ von einem Vektorraum V in einen Vek-
abhängig; daher ist det A = 0. In diesem Fall bilden die Spal-
torraum V  heißt linear, wenn sie sich nach Einführung von
tenvektoren von A eine Basis des R3 . Nachdem jeder Vektor
Koordinaten in V und V  durch Multiplikation mit einer Ma-
x  des R3 eine eindeutige Darstellung als Linearkombination
trix beschreiben lässt, also von folgender Bauart ist:
dieser Basisvektoren besitzt, gibt es zu jedem Bildvektor ein
ϕ : V → V  mit x  → x  = A x. eindeutiges Urbild x. Die Abbildung ϕ ist in diesem Fall
bijektiv; es gibt die Umkehrabbildung ϕ −1 .
A heißt Darstellungsmatrix dieser Abbildung. Wir werden Hat man die Urbilder y i der Vektoren ei der Standardbasis
uns sehr ausführlich im Kapitel 12 mit derartigen Abbildun- bereits berechnet, etwa durch Auflösen des zugehörigen li-
gen befassen und dort eine elegantere Definition kennenler- nearen Gleichungssystems A y i = ei , so ist das Urbild von
nen, nämlich eine anhand ihrer beiden Eigenschaften x = 3  −1  3 
i=1 xi ei gleich ϕ (x ) = i=1 xi y i , denn für
jedes i ∈ {1, 2, 3} ist
ϕ(x + y) = ϕ(x) + ϕ(y) und ϕ(λx) = λ ϕ(x).
A (xi y i ) = xi (A y i ) = xi ei .
Diese bewirken, dass Linearkombinationen wieder auf Li-
nearkombinationen mit denselben Koeffizienten abgebildet
Dies zeigt, dass auch ϕ −1 eine lineare Abbildung ist; die
werden, also
zugehörige Darstellungsmatrix A−1 heißt inverse Matrix
 n  von A. Deren Spaltenvektoren y 1 , y 2 , y 3 haben die Eigen-
! !n
ϕ λi x i = λi ϕ(x i ). schaft A y i = ei . Wird also die Matrix A der Reihe nach
i=1 i=1 mit den Spaltenvektoren von A−1 multipliziert, so entstehen
die Spalten der Einheitsmatrix. Wir schreiben dies kurz als
Hier beschränken wir uns auf die lineare Abbildungen Matrizenprodukt
 
ϕ : R3 → R3 . Deren Darstellungsmatrizen A = aik sind A · A−1 = E3 .
254 7 Analytische Geometrie – Rechnen statt Zeichnen

Dahinter steht die folgende Erweiterung der auf Seite 175 Nachdem bei bijektivem ϕ die Zusammensetzungen ϕ −1 ◦ ϕ
eingeführten Multiplikation einer Matrix mit einem Spalten- und ebenso ϕ ◦ϕ −1 die identischen Abbildung id R3 ergeben,
vektor: folgt für die zugehörigen Darstellungsmatrizen ergänzend zu
oben:
Wir bilden das Matrizenprodukt D = B · C einer Matrix
B ∈ Km×n mit einer Matrix C ∈ Kn×p , indem wir der Reihe A−1 A = A A−1 = E3 .
nach B mit den p Spaltenvektoren von C multiplizieren und
diese als Spalten in D zusammenfassen.
Die bijektiven linearen Abbildungen ϕ : R3 → R3 bilden
Man beachte: Das Produkt kann nur gebildet werden, wenn eine Gruppe, und zwar eine Untergruppe der Gruppe aller
die Spaltenanzahl n des ersten Faktors B gleich der Zeilenan- Permutationen des R3 (siehe Seite 66). Jedem ϕ ist eine Ma-
zahl des zweiten Faktors C ist. Dann lautet das Element dik trix A ∈ R3×3 mit det A = 0 bijektiv zugeordnet, wobei der
der Produktmatrix für i ∈ {1, . . . , m} und j ∈ {1, . . . , p}: Hintereinanderausführung ϕ  ◦ ϕ das Produkt A · A ent-
spricht. Deshalb bilden auch die dreireihigen reellen Ma-
!
n
dik = bij cj k . trizen A mit det A = 0 eine Gruppe mit E3 als neutra-
j =1
lem Element und A−1 als zu A inversem Element. Diese
Gruppe heißt allgemeine lineare Gruppe des R3 und wird
In Worten: Das Element an der Stelle (i, k) der Produktmatrix mit GL3 (R) bezeichnet. Die Matrizen aus GL3 (R) heißen
B · C entsteht aus der i-ten Zeile von B und der k-ten Spalte auch invertierbar oder regulär. Später in Kapitel 13 wer-
von C durch „skalare Multiplikation“. den wir erkennen, dass die Matrizen A mit det A = 1 eine
Unterguppe bilden, die spezielle lineare Gruppe SL3 (R). Sie
Die folgende Illustration zeigt die Größenverhältnisse der umfasst diejenigen linearen Abbildungen, welche das orien-
an diesem Matrizenprodukt beteiligten Matrizen B, C und D. tierte Volumen unverändert lassen.
n m
n
p = p · m

Affine Abbildungen bilden Affinkombina-


D = B · C
tionen wieder auf Affinkombinationen ab
Der Punkt, der hier zur Verdeutlichung als Verknüpfungszei-
chen für die Matrizenmultiplikation dient, wird allerdings in
Abschließend noch zu einer Verallgemeinerung der linearen
Zukunft meist weglassen. Er ist nicht üblich.
Abbildungen R3 → R3 : Wird zu allen Bildvektoren noch ein
konstanter Vektor t addiert, liegt also eine Abbildung mit der
? Darstellung
Berechnen Sie das Produkt D der Matrizen
A : x → x  = t + A x
⎛ ⎞ ⎛ ⎞
2 1 −2 2 1 2
B = ⎝1 2 2 ⎠ und C = ⎝ 1 2 −2 ⎠ vor, so spricht man von einer affinen Abbildung. Dabei
2 −2 1 −2 2 1 nennt man x → A x die zu A gehörige lineare Abbildung.

Affine Abbildungen A sind als Punktabbildungen aufzufas-


sen, also als Abbildungen zwischen affinen Räumen. Rich-
Zurück zu den linearen Abbildungen R3 → R3 : Werden zwei
tungsvektoren u = x−y gehen durch A in A(x)−A(y) = A u
lineare Abbildungen hintereinander ausgeführt, also
über, werden also der zu A gehörigen linearen Abbildung
unterworfen. Die Zusammensetzung zweier affiner Abbil-
ϕ : x → x  = A x und ϕ  : x   → x  = A x  ,
dungen ist wieder eine affine Abbildung. Die bijektiven af-
finen Abbildungen bilden eine Gruppe, die affine Gruppe
so gilt für die Abbildung des Vektors ei der Standardbasis:
AGL3 (R).
Der i-te Spaltenvektor s i von A ist gleich ϕ(ei ). Daher ist
ϕ  ◦ ϕ(ei ) = A s i der i-te Spaltenvektor in dem Matrizen- Beispiele affiner Abbildungen sind bei t = 0 die linearen
produkt A A . Andererseits folgt aus der Linearität der Ein- Abbildungen sowie die Translationen x → x  = x + t.
zelabbildungen, dass auch für x = 3i=1 xi ei gilt: Bei Letzteren ist A = E3 ; die zugehörige lineare Abbil-
  dung ist die Identität; der Vektor t heißt Schiebvektor t der
ϕ  ◦ ϕ(x) = ϕ  xi s i = xi (A A) ei = (A A) x. Translation. Offensichtlich ist jede affine Abbildung A das
Produkt aus der zugehörigen linearen Abbildung und der an-
Damit ist auch die Zusammensetzung ϕ  ◦ ϕ wieder eine schließenden Translation mit dem Schiebvektor A(0).
lineare Abbildung R3 → R3 . Die Darstellungsmatrix der
Produktabbildung ϕ  ◦ ϕ ist gleich dem Produkt der beiden Affine Abbildungen haben die Eigenschaft, Affinkombina-
Darstellungsmatrizen. tionen (siehe Seite 230) wieder auf Affinkombinationen ab-
7.4 Abstände zwischen Punkten, Geraden und Ebenen 255

zubilden, denn unter der Voraussetzung λi = 1 ist Zu dieser Darstellung des Fußpunkts b kommen wir eigent-
 n   n  lich auch ohne jede Rechnung, denn l(a) gibt den im Sinn
! !
A λi x i = t + A λi x i von n orientierten Normalabstand des Punkts a von E an.
i=1 i=1
Wir haben somit nur vom Punkt a aus längs n die Länge
  l(a) zurückzulaufen, um die Ebene E im Fußpunkt b zu er-
!
n !
n
reichen.
= λi t+ λi A x i
i=1 i=1 ?
!
n !
n Zeigen Sie, dass die Formel für b aus (7.12) in jene aus (7.13)
u×v
= λi (t + A x i ) = λi A(x i ). übergeht, wenn durch n ersetzt wird und n·p durch k.
u × v
i=1 i=1

Daher gehen affine Teilräume wieder in affine Teilräume Die Formel (7.13) für b zeigt erneut (vergleiche Seite 249),
über. dass b unter allen Punkten x ∈ E derjenige ist, welcher
dem Punkt a am nächsten liegt, für den also die Gleichung
dist(a, E) = b − a gilt.
Das dyadische Produkt vereinfacht die
Darstellung der Orthogonalprojektionen Aus a = b + λ n, n2 = 1 und n · (b − x) = 0 ergibt sich
nämlich:
Wir kehren nochmals zu der auf Seite 249 definierten Or- a − x2 = (λ n + (b − x))2 = λ2 + (b − x)2 ≥ λ2 .
thogonalprojektion des R3 auf eine Ebene E zurück, die je-
dem Raumpunkt a den Fußpunkt b ∈ E der durch a gehen- Gleichheit tritt nur bei b − x = 0, also bei x = b ein.
den Ebenennormalen zuordnet (Abb. 7.23). Im Gegensatz zu Nun schreiben wir die Abbildung
(7.12) geben wir die Ebene E diesmal in der Hesse’schen Nor-
malform an, und wir fassen die Orthogonalprojektion auf als N : a  → b = a − [(n · a) − k] n = k n + [a − (n · a) n]
Abbildung R3 → R3 , auch wenn das Bild nur der affine Teil- in Matrizenform um. Dazu ersetzen wir das auftretende Ska-
raum E ist. Neben der Orthogonalprojektion N : a → b auf larprodukt n · a ∈ R gemäß (7.3) durch ein Matrizenpro-
E soll auch die Spiegelung S : a  → a  an E in Matrizenform dukt. Nun ist die Matrizenmultiplikation generell assoziativ.
dargestellt werden. Das wird zwar erst im Kapitel 12 allgemein bewiesen; im
vorliegenden Fall lässt sich die Gültigkeit durch einfaches
Ausrechnen bestätigen. Demnach ist

a (n · a) n = n (n0 a) = (n n0 ) a.
b Hier tritt eine symmetrische Matrix auf, nämlich
M

⎛ 2 ⎞
E n1 n1 n2 n1 n3
a
N = n n0 = ⎝ n2 n1 n22 n2 n3 ⎠
kit taM

Ma
hta

n3 n1 n3 n2 n23

the Dabei heißt eine Matrix symmetrisch, wenn die bezüglich der
kitaammeeh

ma Hauptdiagonale symmetrisch gelegenen Einträge aik und aki

tik stets gleich sind, wenn also N 0 = N ist.


Wir schreiben nun noch x statt a sowie x E statt b und stellen
die Orthogonalprojektion auf E wie folgt dar.

Darstellung der Orthogonalprojektion auf eine Ebene


Abbildung 7.23 Der Normalenfußpunkt b von a in der Ebene E sowie das
Spiegelbild a  von a. Auch der blaue Schriftzug wurde an E gespiegelt (grün) Die Orthogonalprojektion auf die Ebene E mit der
sowie normal in die Ebene E projiziert (rot). Hesse’schen Normalform n · x − k = 0 lautet

Wir geben E durch die Gleichung x → x E = k n + (E3 − N ) x

l(x) = n · x − k = 0 mit n = 1. mit N = n n0 und E3 als dreireihiger Einheitsmatrix.

vor und können daher ansetzen:


Allgemein nennt man die aus zwei Vektoren u, v ∈ R3 be-
b = a + λ n mit l(b) = (n · a) + λ(n · n) − k = 0. rechnete symmetrische 3 × 3 -Matrix
⎛ ⎞ ⎛ ⎞
Es folgt λ = [ k − (n · a)] = −l(a) und damit als Lösung u1 u1 v1 u1 v2 u1 v3
u v 0 = ⎝u2 ⎠ (v1 v2 v3 ) = ⎝ u2 v1 u2 v2 u2 v3 ⎠
b = a − l(a) n. (7.13) u3 u3 v1 u3 v2 u3 v3
256 7 Analytische Geometrie – Rechnen statt Zeichnen

das dyadische Produkt von u und v. In dieser Matrix sind (Abb. 7.24): Dann gilt nach (7.8):
der Reihe nach alle möglichen Produkte zwischen einer Ko-  
ordinate von u und einer von v angeordnet. !
3 !
3
x= (x · ni ) ni = (ni n0
i ) x = E3 x.
? i=1 i=1
Welchen Rang hat das dyadische Produkt?
Die Summe der dyadischen Quadrate lautet also:

Die Orthogonalprojektion auf eine Ebene E ist ein Beispiel (n1 n0 0 0


1 ) + (n2 n2 ) + (n3 n3 ) = E3 .
für eine affine Abbildung (siehe Seite 254). Nur im Sonder-
Die Orthogonalprojektion auf die Ebene E kann daher im
fall k = 0, bei dem die Ebene E durch den Ursprung geht
Fall k = 0 auch als
(Abb. 7.24), handelt es sich um eine lineare Abbildung.
 0 
x E = (n1 n0
1 ) + (n2 n2 ) x (7.14)
n = n3 x

n2 geschrieben werden. Diese Darstellung von x E ist nunmehr


x3 E auch unmittelbar aus Abbildung 7.24 ablesbar, nämlich als
x2 Summe x 1 + x 2 der Orthogonalprojektionen auf die von n1
G
xE bzw. n2 aufgespannten Geraden.

?
0 1. Warum ist die bei der Orthogonalprojektion auftretende
x1
n1 Darstellungsmatrix (E3 − N ) mit N = n n0 bei n = 1
idempotent, d. h., warum gilt:
Abbildung 7.24 Die Orthogonalprojektionen des Punkts x auf die Ebene E
und auf die Ebenennormale G. (E3 − N )2 = (E3 − N ) (E3 − N ) = (E3 − N )?

Der Normalvektor n von E spannt eine durch den Ursprung 2. Ist det(E3 − N ) = 0?
gehende Ebenennormale G auf, und nun wollen wir den
Raumpunkt x auch normal auf diese Gerade G projizieren.
Für das Bild x 3 von x gilt wegen der geometrischen Bedeu-
tung des Skalarprodukts (Abb. 7.13) Die Orthogonalprojektion auf eine Ebene und
x 3 = (x · n) n. die Spiegelung an dieser Ebene hängen eng
zusammen
Auch diese Abbildung x  → x 3 ist eine lineare Abbil-
dung R3 → R3 , denn sie kann ebenfalls durch eine 3 × 3- Für das Spiegelbild x  von x bezüglich der Ebene E mit dem
Darstellungsmatrix beschrieben werden. Zu deren Herleitung normierten Normalvektor n gilt (siehe Abbildung 7.23):
schreiben wir ähnlich wie vorhin bei der Orthogonalprojek-
tion nach E die obige Vektordarstellung von x 3 auf ein Ma- 1
2 (x + x  ) = x E , also x  = 2 x E − x.
trizenprodukt um:
In Matrizenschreibweise bedeutet dies:
x 3 = (x · n) n = n (n0 x) = (n n0 ) x.
x  = 2k n + 2(E3 − N ) x − x
Die Darstellungsmatrix der Orthogonalprojektion auf die
durch den Ursprung gehende Gerade G ist gleich dem schon mit N als dyadischem Quadrat von n.
vorhin verwendeten dyadischen Quadrat N = n n0 des
normierten Richtungsvektors von G. Darstellung der Spiegelung an einer Ebene
Nun ist (Abb. 7.24) x = x E + x 3 mit x E als Normalenfuß- Die Spiegelung an der Ebene E mit der Hesse’schen Nor-
punkt von x in E, also malform n · x − k = 0 lautet:

x E = x − x 3 = x − (n n0 ) x = (E3 − n n0 ) x. x → x  = 2k n + (E3 − 2N) x


Wir haben erneut die obige Darstellung der Orthogonalpro- mit N = n n0 .
jektion hergeleitet, allerdings nur für den Fall k = 0. Dafür
verstehen wir jetzt aber die Bauart der Darstellungsmatrix
(E3 − n n0 ) besser. ?
Warum gilt für die Darstellungsmatrix der Spiegelung
Schreiben wir nun n3 anstelle n und ergänzen wir diesen Ein- (E3 − 2N)(E3 − 2N) = E3 ?
heitsvektor zu einem orthonormierten Dreibein (n1 , n2 , n3 )
7.5 Wechsel zwischen kartesischen Koordinatensystemen 257

⎛ ⎞
7.5 Wechsel zwischen der Basisvektoren bj . Wir setzen diese an als B bj
a1j
= ⎝ a2j ⎠.
kartesischen a3j
Dann lässt sich die Vektorgleichung
Koordinatensystemen ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13
⎝x2 ⎠ = x  ⎝ a21 ⎠ + x  ⎝ a22 ⎠ + x  ⎝ a23 ⎠
Bei vielen Gelegenheiten ist es notwendig, von einem kar- 1 2 3
x3 a31 a32 a33
tesischen Koordinatensystem auf ein anderes umzurechnen.
Ein Musterbeispiel bildet in der Astronomie die Umrechnung
übersichtlich in Matrizenform schreiben als
von einem in der Sonne zentrierten und nach Fixsternen ori-
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
entierten heliozentrischen Koordinatensystem auf ein lokales x1 a11 a12 a13 x1
System in einem Punkt der Erdoberfläche mit lotrechter x3 - ⎝x2 ⎠ = ⎝ a21 a22 a23 ⎠ ⎝x  ⎠
2
Achse und der nach Osten orientierten x1 -Achse. Erst damit x3 a31 a32 a33 x3
ist es möglich vorauszuberechnen, wie die Bewegungen der
Planeten oder des Mondes von der Erde aus zu beobachten Die Matrix (aij ) ist eine Transformationsmatrix, und wir
sein werden. Wir werden uns diesem Problem noch genauer bezeichnen sie mit B T B  . Mit ihrer Hilfe transformieren wir
widmen. Koordinaten von einem Koordinatensystem auf ein anderes,
in unserem Fall von B  -Koordinaten (rechter Index) auf B-
Koordinaten (linker Index), also
Orthogonale Matrizen erledigen die
Bx = B T B  B  x. (7.15)
Umrechnung zwischen zwei kartesischen
Koordinatensystemen
In den Spalten von B T B  stehen die B-Koordinaten der Basis-
Es seien zwei kartesische Koordinatensysteme mit demsel- vektoren b1 , b2 , b3 . Da diese linear unabhängig sind, hat
ben Ursprung o gegeben, nämlich (o; B) mit der ortho- B T B  den Rang 3. Die Gleichung (7.15) beschreibt eine bi-
normierten Basis B = (b1 , b2 , b3 ) und (o; B  ) mit B  = jektive lineare Abbildung B  x → B x; Transformationsma-
(b1 , b2 , b3 ) (Abb. 7.25). Sind dann trizen sind invertierbar.

⎛ ⎞ ⎛ ⎞ Nach (7.8) ist die i-te B-Koordinate von bj gleich dem Ska-
x1 x1
larprodukt bi · bj . Dies führt auf die Darstellung
B x = ⎝x2 ⎠ und B  x = ⎝x2 ⎠


x3 x3 ⎛ ⎞
b1 · b1 b1 · b2 b1 · b3
die Koordinaten desselben Punkts x, so bedeutet dies nach B TB = ⎝ b2 · b1 b2 · b2 b2 · b3 ⎠
   (7.16)
(7.2): b3 · b1 b3 · b2 b3 · b3
!3 !
3
x−o= xi b i = xj bj . Die Spaltenvektoren in dieser Matrix sind orthonormiert, also
i=1 j =1 paarweise orthogonale Einheitsvektoren.
Sollen umgekehrt die B  -Koordinaten aus den B-Koor-
dinaten berechnet werden, so benötigen wir die Umkehrab-
b3 x bildung der linearen Abbildung B  x → B x, also die inverse
Matrix. Demnach gilt:
b3
⎛ ⎞ ⎛ ⎞
b2 x1 x1
⎝x  ⎠ = B TB
⎝x2 ⎠ mit B  T B = (B T B  )−1 .
2
x3 x3

In den Spalten von Matrix B  T B stehen die B  -Koordinaten


⎛ ⎞
b1 bi · b1
o der bi , also gemäß (7.8) die Skalarprodukte ⎝ bi · b2 ⎠, und
b2 bi · b3
das sind genau die Zeilen der ursprünglichen Transformati-
onsmatrix B T B  . Also gilt für die Transformationsmatrizen
b1
A zwischen kartesischen Koordinatensystemen, dass die in-
Abbildung 7.25 Zwei kartesische Rechtskoordinatensysteme mit demselben verse Matrix gleich ist der transponierten. Um diese zu inver-
Ursprung. tieren, braucht man nur an der Hauptdiagonale zu spiegeln,
also Spalten mit Zeilen zu vertauschen, kurz:
Wir stellen nun alle Vektoren dieser Gleichung im Koordina-
tensystem (o; B) dar. Dazu brauchen wir die B-Koordinaten A−1 = A0 und damit auch A A0 = A0 A = E3 .
258 7 Analytische Geometrie – Rechnen statt Zeichnen

Derartige Matrizen heißen orthogonal. Mehr darüber gibt es Dies gilt sinngemäß auch für das Vektorprodukt, sofern aus-
im Kapitel 17. schließlich Rechtskoordinatensysteme verwendet werden:
Modifizieren wir das Koordinatensystem, so werden sich die
Orthogonale Transformationsmatrizen Koordinaten von (u × v) in derselben Weise ändern wie jene
von u und v.
Die Transformationsmatrizen zwischen kartesischen
Koordinatensystemen sind orthogonal; sie genügen der Dies lässt sich in den folgenden Formeln ausdrücken.
Bedingung
Koordinateninvarianz der Produkte von Vektoren
(B T B  )−1 = (B T B  )0 , d. h.,
(B T B  )0 · B T B  = E3 . Ist A eine eigentlich orthogonale Matrix, so gilt:
(A u) · (A v) = u · v,
Die Spaltenvektoren s i in einer orthogonalen Matrix A (A u) × (A v) = A (u × v),
sind nach (7.7) orthonormiert, d. h. paarweise orthogonale det (A u, A v, A w) = det(u, v, w).
Einheitsvektoren, denn die Einträge in der Produktmatrix
A0A = E3 sind identisch mit den Skalarprodukten s i · sj = δij . Die erste dieser Gleichung folgt wegen A0 A = E3 auch
Damit ist umgekehrt jede orthogonale Matrix eine Um- unmittelbar aus (7.3), denn
rechnungsmatrix zwischen kartesischen Basen, nämlich von
(s 1 , s 2 , s 3 ) auf die kanonische Basis (e1 , e2 , e3 ). (A u) · (A v) = (A u)0 (A v) = u0 A0 A v = u0 v.

In den Spalten der Umrechnungsmatrix B T B  von den B  - Hinsichtlich des Spatprodukts kann man auf die Formel von
Koordinaten zu den B-Koordinaten stehen die B-Koor- Seite 244 zurückgreifen:
dinaten der bj und in den Zeilen die B  -Koordinaten der det (A u, A v, A w) = A u · (A v × A w)
bi . Sind B und B  Rechtssysteme, so ist das Spatprodukt = A u · A(v × w) = u · (v × w) = det(u, v, w).
det(b1 , b2 , b3 ) = det A = +1 (siehe Seite 245). Derartige
orthogonale Matrizen heißen eigentlich orthogonal. In dem In Kapitel 13 werden wir übrigens erkennen, dass allgemei-
Beispiel auf Seite 259 ist eine derartigen Matrix zu berech- ner bereits die Bedingung det A = 1 hinreicht für die Inva-
nen. rianz des Spatprodukts.

Werden die Wechsel B x  → B  x und B  x  → B  x zwischen


orthonormierten Basen hintereinander ausgeführt, so gibt es Orthogonale Matrizen beschreiben zugleich
für den Wechsel B x → B  x erneut eine orthogonale Trans- Bewegungen mit einem Fixpunkt
formationsmatrix B  T B = B  T B  · B  T B , nachdem darin
die Spaltenvektoren, also die B  -Koordinaten von b1 , b2 , b3 , Im Folgenden verwenden wir den Begriff „Bewegung“ für
nach wie vor orthonormiert sind. Demnach ist das Produkt eine Verlagerung von Raumobjekten oder des ganzen Raums
zweier orthogonaler Matrizen wieder orthogonal. Die drei- von einer Position in eine andere. Vorderhand interessieren
reihigen orthogonalen Matrizen bilden hinsichtlich der Mul- uns allerdings nur die Anfangs- und Endlage, also weder der
tiplikation eine Untergruppe von GL3 (R), die orthogonale „Weg“ dazwischen noch der zeitliche Ablauf.
Gruppe O3 . Die eigentlich orthogonalen Matrizen bilden die
Untergruppe SO3 von O3 . Definition einer Bewegung

? Eine affine Abbildung B : R3 → R3, x → x  = t + A x


1. Ist die Matrix heißt Bewegung, wenn dabei alle Distanzen und Win-
⎛ ⎞
1 1 2 −2 kelmaße erhalten bleiben und Rechtssysteme wieder in
⎝ 2 1 2 ⎠ Rechtssysteme übergehen.
3 −2 2 1

eigentlich orthogonal? Statt Bewegung sagt man auch gleichsinnige Kongruenz. Die
2. Man bestätige durch Rechnung, dass die auf Seite 256 bei zu einer Bewegung gehörige lineare Abbildung heißt auch
der Spiegelung an einer Ebene auftretende symmetrische gleichsinnige Isometrie.
Matrix M = E3 − 2N orthogonal ist. Warum ist sie un- Offensichtlich sind die Translationen Beispiele von Bewe-
eigentlich orthogonal? gungen, und zwar diejenigen mit A = E3 .
Definitionsgemäß muss die Bewegung B : x → x  = t +A x
Wir wissen von den geometrischen Bedeutungen des Skalar- ein kartesisches Rechtssystem mit Ursprung o und ortho-
produkts u · v und des Spatprodukts det(u, v, w) von Vekto- normierten Basisvektoren (b1 , b2 , b3 ) wieder in ein kartesi-
ren aus R3 . Diese Produkte hängen nur von der gegenseitigen sches Rechtssystem mit Ursprung o = B(o) und Basisvekto-
Lage der jeweiligen Vektoren ab, müssen also unverändert ren (A b1 , A b2 , A b3 ) überführen. Hier haben wir berück-
bleiben, wenn wir das Koordinatensystem ändern. Wir sagen, sichtigt, dass Richtungsvektoren durch die zu B gehörige li-
diese Produkte sind koordinateninvariant. neare Abbildung transformiert werden (siehe Seite 254). Eine
7.5 Wechsel zwischen kartesischen Koordinatensystemen 259

Beispiel: Ein Würfel wird wie das Atomium in Brüssel aufgestellt


Wir stellen einen Einheitswürfel W derart auf, dass eine Raumdiagonale lotrecht wird, also in Richtung der x3 -Achse verläuft.
Eine weitere Raumdiagonale soll in die Koordinatenebene x1 = 0 fallen. Wie lauten die Koordinaten der acht Ecken dieses
aufgestellten Würfels?

Problemanalyse und Strategie: Der Einheitswürfel W werde von den Basisvektoren b1 , b2 und b3 eines kartesischen
Rechtskoordinatensystems aufgespannt. Wir verknüpfen nun mit dem Würfel ein zweites Rechtskoordinatensystem mit
Basisvektoren b1 , b2 und b3 , welches der geforderten Würfelposition entspricht. Der Vektor b3 weist also in Richtung
der Raumdiagonale, und der Vektor b2 spannt mit b3 eine Ebene auf, welche auch b1 enthält. Dabei entscheiden wir uns
für die Lösung (siehe Abbildung unten rechts) mit positivem Skalarprodukt b1 · b2 .
Nun muss nur der Würfel mit den beiden Koordinatensystemen derart verlagert werden, dass B in Grundstellung kommt,
also b3 lotrecht wird. Um also die gesuchten Koordinaten zu bekommen, brauchen wir nur die bekannten B  -Koordinaten
der Würfelecken auf B-Koordinaten umzurechnen. Gemäß (7.15) gelten Umrechnungsgleichungen der Art B x = A B  x.
In den Spalten der orthogonalen Transformationsmatrix A = B T B  aus (7.16) stehen die B-Koordinaten der Basisvek-
toren b1 , b2 , b3 des Würfels. Wegen A0 = A−1 = B  T B stehen in den Zeilen die B  -Koordinaten der bi .

Lösung:

b3

b3

b1
b2
b1
b2

Würfel W in der aufgestellten Position.

Das Atomium in Brüssel, ein auf die Raumdiagonale gestellter Würfel. ⎛ ⎞ ⎛ ⎞ ⎛ ⎞


1 0 2
1 ⎝ ⎠ ⎝ 1
B  b2 = ± √ 1 × −1 ⎠ = ± √ ⎝ −1 ⎠ .
Die durch den Ursprung verlaufende Raumdiagonale von 6 1 1 6 −1
W bestimmt die Richtung von b3 . Also entsteht b3 durch
Bei der Wahl des oberen Vorzeichens wird die erste B  -
Normieren von b1 + b2 + b3 . Die B  -Koordinaten von
Koordinate von b2 , also b1 · b2 positiv.
b3 lauten√demnach (λ λ λ)0 mit 3λ2 = 1. Die Wahl Wir übertragen diese B  -Koordinaten von b1 , b2 und b3
λ = +1/ 3 bedeutet, dass die dem Koordinatenursprung in die Zeilen der Matrix A und erhalten
gegenüberliegende Würfelecke eine positive dritte Koor- ⎛ ⎞
dinate erhält. Die von b1 und b3 aufgespannte Ebene be- 0 − √1 √1
⎜ 2 2 ⎟
stimmt einen Diagonalschnitt des Würfels, und dieser ent- ⎜ 2 1 1 ⎟
A = ⎜ √6 − √6 − √6 ⎟
hält auch den Vektor b2 . Der Vektor b1 ist zu dieser Ebene ⎝ ⎠
orthogonal, hat also die Richtung des Vektorprodukts √1 √1 √1
3 3 3
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 1 0 Die Koordinaten der Ecken des aufgestellten Einheits-
1 1
b1 × b3 = ⎝ 0 ⎠ × √ ⎝ 1 ⎠ = √ ⎝ −1 ⎠ . würfels W stehen in den Spalten der Produktmatrix
0 3 1 3 1 ⎛ ⎞
0 1 1 0 0 1 1 0
⎜ ⎟
Durch Normierung erhalten wir: A·⎝ 0 0 1 1 0 0 1 1 ⎠=
⎛ ⎞ 0 0 0 0 1 1 1 1
0
1 ⎝ ⎛ ⎞
B  b1 = ± √ −1 ⎠ . 0 0 − √1 − √1 √1 √1 0 0
2 1 ⎜ 2 2 2 2 ⎟
⎜ 0 √2 √1 − √1 − √1 √1 0 − √2 ⎟
⎜ ⎟
Schließlich ist bei einem kartesischen Rechtskoordinaten- ⎝ 6 6 6 6 6

6⎠
1 2 1 1 2 2
system stets b2 = b3 × b1 , also 0 √ √ √ √ √ 3 √
3 3 3 3 3 3
260 7 Analytische Geometrie – Rechnen statt Zeichnen

Bewegung ist durch ein Paar zugeordneter Rechtssysteme be- b3


reits eindeutig festgelegt, denn damit kennt man sowohl den
b3
Schiebvektor t = o − o, als auch die zugehörige lineare
Abbildung.
x
Verwendet man B = (b1 , b2 , b3 ) als Basis für kartesi- b2
sche Koordinaten, so bilden die B-Koordinaten der Bilder
(A b1 , A b2 , A b3 ) die Spaltenvektoren in der Matrix A.
Also muss A eigentlich orthogonal sein.
x b1
Diese Bedingung ist bereits hinreichend für eine Bewegung,
denn die auf der Seite 258 festgestellte Invarianz der Produkte o
b2
von Vektoren garantiert, dass dabei alle Distanzen x − y
u·v
und alle mittels cos ϕ = berechenbaren Winkelmaße
u v
unverändert bleiben und Rechtssysteme wieder in Rechts- b1 B
systeme übergehen.
Abbildung 7.26 Die Bewegung B : x → x  bringt die Vektoren b1 , b2 und
b3 mit b1 , b2 bzw. b3 zur Deckung.
Darstellung von Bewegungen
Bei Verwendung kartesischer Koordinaten (o; B) ist die
affine Abbildung A : x  → t + A x genau dann eine Wir halten fest: Bezüglich eines festgehaltenen Koordinaten-
Bewegung, wenn die Matrix A eigentlich orthogonal ist. systems (o; B) lässt sich jede Bewegung B : x → x  mit dem
Fixpunkt o, also mit B(o) = o, durch eine Gleichung (7.17)
darstellen. Dabei stehen in den Spalten der eigentlich ortho-
Kommentar: Die obige Definition einer Bewegung B lässt gonalen Matrix A die B-Koordinaten der Bilder (b1 , b2 , b3 )
sich abschwächen. Es genügt zu fordern, dass für alle x, y ∈ der Basisvektoren.
R3 gilt B(x) − B(y) = x − y.
Beispiel Der Punkt x werde um die dritte Koordinaten-
Die Zusammensetzung zweier Bewegungen ist wieder eine achse b3 durch den Winkel ϕ verdreht. Gesucht sind die Ko-
Bewegung. Deshalb bilden die Bewegungen eine Unter- ordinaten der Drehlage x  .
gruppe der affinen Gruppe AGL3 (R) (siehe Seite 254), die
Bewegungsgruppe ASO3 (R).
b3 b3
Die Gleichung

x  = A x bei A−1 = A0 und det A = 1 (7.17)


ϕ x
beschreibt bei A = B T B  im Sinn von (7.5) die Um-
rechnung zwischen zwei kartesischen Rechtskoordinaten- x b2
systemen, und zwar von (o; B)-Koordinaten zu (o; B  )-
Koordinaten. Das bedeutet, ein und derselbe Punkt oder auch o ϕ
Vektor erhält durch die beiden Koordinatensysteme verschie- ϕ
dene Koordinaten zugeordnet. b2
Wir können die Gleichung (7.17) aber noch anders interpre- b1 b1
tieren: Es gibt eine Bewegung B, die das Achsenkreuz (o; B)
auf (o; B  ) abbildet. Ein mit (o; B) starr verbundener Punkt Abbildung 7.27 Drehung um die x3 -Achse.
x kommt dadurch in die Lage x  (Abb. 7.26). Wie lauten die
(o; B)-Koordinaten des Bildpunkts x  ? Wie eben festgestellt, wird die Drehung durch eine orthogo-
nale Matrix dargestellt, in deren Spalten der Reihe nach die
Unsere Bewegung B führt die anfangs mit (b1 , b2 , b3 )
Koordinaten der verdrehten Basisvektoren stehen.
identischen Basisvektoren in die Position (b1 , b2 , b3 ) über.
Diese bilden weiterhin ein kartesischen Rechtssystem. Der Ist wie in unserem Fall die Drehachse orientiert, so ist der
Punkt x wird mit dem Achsenkreuz mitgeführt. Daher hat Drehsinn eindeutig: Blickt man gegen die Drehachse, so-
sein Bildpunkt x  bezüglich des mitgeführten Koordinaten- mit bei uns von oben gegen die x3 -Achse, so erscheint eine
systems (o; B  ) dieselben Koordinaten wie sein Urbild x be- Drehung mit einem positiven Drehwinkel im mathematisch
züglich (o; B). Zur Lösung unseres Problems haben wir so- positiven Sinn, also gegen den Uhrzeigersinn. Damit haben
mit nur die B-Koordinaten des Urbilds x als B  -Koordinaten die verdrehten Basisvektoren die B-Koordinaten
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
des Bilds x  aufzufassen und auf B-Koordinaten umzurech- cos ϕ − sin ϕ 0
nen, und dies erfolgt wie in (7.15) mithilfe einer eigentlich 
B b1 = ⎝ sin ϕ ⎠, 
B b2 = ⎝ cos ϕ ⎠, 
B b3 = ⎝ 0 ⎠.
orthogonalen Matrix A = B T B  . 0 0 1
7.5 Wechsel zwischen kartesischen Koordinatensystemen 261

Diese brauchen nur mehr in einer Matrix zusammengefasst Dies führt zur Vektordarstellung
zu werden, und wir erhalten
⎛ ⎞ ⎛ ⎞⎛ ⎞ x  = (1 − cos ϕ)(d ·x) d + cos ϕ x + sin ϕ (d ×x). (7.18)
x1 cos ϕ − sin ϕ 0 x1
⎝x  ⎠ = ⎝ sin ϕ cos ϕ 0 ⎠ ⎝x2 ⎠ Um die Darstellungsmatrix der Abbildung x → x  zu erhal-
2
x3 0 0 1 x3 ten, nutzen wir jene der Orthogonalprojektion auf Seite 255.
Bei d = 1 ist
als Darstellung der Drehung um die x3 -Achse.
Diesmal wollen wir auch den Ablauf der Bewegung von der x d = (d d 0 ) x und x E = x − x d = (E3 − d d 0 ) x.
Ausgangslage in die Endlage beschreiben. Angenommen, die
Andererseits ist d × x = S d x, wobei S d die dem Vektor
Drehung von x nach x  erfolgt mit der konstanten Winkelge-
d im Sinn von (7.9) zugeordnete schiefsymmetrische Matrix
schwindigkeit ω und beginnt zum Zeitpunkt t = 0. Damit wir
ist.
dann zu jedem Zeitpunkt t wissen, wo sich der Punkt x ge-
rade befindet, ersetzen wir in der obigen Matrizengleichung
das ϕ durch den augenblicklichen Drehwinkel x

ϕ
ψ(t) = ω t mit 0 ≤ t ≤ , d xE⊥
ω

denn der im Bogenmaß angegebenen Drehwinkel ψ(t) er- x n x E


xd b2
gibt, nach der Zeit t differenziert, gerade
  die gewünschte b2  b1 
dψ ϕ
Winkelschwindigkeit = ω und ψ = ϕ. 
dt ω ϕ
o
? b1 xE
Wie sieht die Matrix der Drehung um die x1 -Achse durch den
Winkel ϕ aus, wie jene einer Drehung um die x2 -Achse? Das
Ergebnis ist übrigens auch durch zyklische Vertauschung der Abbildung 7.28 Die Drehung um die Achse d durch ϕ.
Koordinatenachsen zu gewinnen.
Lemma
Die Seite 262 zeigt als Beispiel die Euler’schen Drehwinkel. Die Drehung durch den Winkel ϕ um die durch den Koor-
dinatenursprung verlaufende Drehachse mit dem normierten
Richtungsvektor d hat die eigentlich orthogonale Darstel-
Drehungen sind Bewegungen, welche die lungsmatrix
Punkte einer Geraden fix lassen
R d ,ϕ = (1 − cos ϕ)(d d 0 ) + cos ϕ E3 + sin ϕ S d .
Nach diesen Spezialfällen wenden wir uns der Darstellung
einer Drehung zu, deren Achse durch den Ursprung geht und Die ersten zwei Summanden in dieser Darstellung sind sym-
in Richtung eines vorgegebenen Vektors d verläuft. metrische Matrizen, der dritte Summand ist schiefsymme-
Wir wollen einen außerhalb der Achse gelegenen Punkt x trisch. Deshalb lautet die transponierte Matrix
um diese Achse durch den Winkel ϕ verdrehen (Abb. 7.28).
Um die Drehlage x  zu berechnen, zerlegen wir den Ortsvek- R0 0
d ,ϕ = (1 − cos ϕ)(d d ) + cos ϕ E3 − sin ϕ S d ,
tor x in die Summe zweier Komponenten x d und x E , von
woraus
welchen x d parallel zu d ist und x E normal dazu (verglei-
R d ,ϕ − R 0
d ,ϕ = 2 sin ϕ S d
che Abbildung 7.24). Bei d = 1 ist x d = (d · x) d und
xE = x − xd . folgt. Auf diese Weise lässt sich aus der Drehmatrix der Vek-
tor sin ϕ d herausfiltern.
Nachdem die zu d orthogonalen Ebenen bei der Drehung um
d in sich bewegt werden, hat die Drehlage x  dieselbe Kom- Nachdem die Einträge in der Hauptdiagonale der Drehmatrix
ponente x d in Richtung der Drehachse d wie x. Hingegen R d ,ϕ nur von den symmetrischen Anteilen stammen, lautet
ist der zu d orthogonale Anteil x E durch den Winkel ϕ zu die Summe der Hauptdiagonalglieder wegen d = 1:
verdrehen, d. h.,
Sp A = (1 − cos ϕ) + 3 cos ϕ = 1 + 2 cos ϕ.
x  = x d + cos ϕ x E + sin ϕ x ⊥
E,
Diese Summe heißt übrigens Spur der Matrix.
wobei x ⊥
E aus x E durch eine Drehung um d durch 90 im

mathematisch positiven Sinn hervorgeht (Abb. 7.28). Wegen Mithilfe des Begriffs der Eigenvektoren (siehe Kap. 14) kann
der Orthogonalität zwischen d und x E ist nach (7.10) man übrigens zeigen, dass jede eigentlich orthogonale drei-
reihige Matrix eine derartige Drehmatrix ist. Deshalb nennt
x⊥
E = d × x E = d × (x − x d ) = d × x. man die von diesen Matrizen gebildete Gruppe SO3 auch die
262 7 Analytische Geometrie – Rechnen statt Zeichnen

Beispiel: Euler’sche Drehwinkel


Um bei festgehaltenem Koordinatenursprung die Raumlage eines Rechtsachsenkreuzes B  relativ zu einem Rechtsachsenkreuz
B eindeutig vorzugeben, kann man die eigentlich orthogonale Matrix A = B T B  benutzen. Diese stellt nach (7.17) gleichzeitig
diejenige Bewegung B dar, welche B nach B  bringt.
Eine orthogonale 3 × 3 -Matrix enthält 9 Einträge, doch erfüllen diese 6 Gleichungen, nämlich die 3 Normierungsbedingungen
sowie die 3 Orthogonalitätsbeziehungen der Spaltenvektoren. Es ist demnach eher mühsam, eine Raumposition auf diese
Weise durch 9 vielfältig voneinander abhängige Größen anzugeben.
Im Gegensatz dazu bieten die Euler’schen Drehwinkel eine Möglichkeit, dieselbe Raumlage durch drei voneinander unabhängige
Größen festzulegen, nämlich durch die drei Euler’schen Drehwinkel α, β, γ (siehe unten stehende Abbildung), und diese
sind bei Einhaltung gewisser Grenzen fast immer eindeutig bestimmt. Wie sieht zu gegebenen Drehwinkeln α, β, γ die
Transformationsmatrix aus?

Problemanalyse und Strategie: Die Bewegung B, also der Übergang von (b1 , b2 , b3 ) zu (b1 , b2 , b3 ), ist gemäß
der unten gezeigten Abbildung 7.20 die Zusammensetzung folgender drei Drehungen.
1. Die Drehung um b3 durch α bringt b1 nach d.
2. Die Drehung um d durch β bringt b3 bereits in die Endlage b3 und die b1 b2 -Ebene in die Position E.
3. Die Drehung um b3 durch γ bringt auch die restlichen Koordinatenachsen innerhalb von E in ihre Endlagen b1
bzw. b2 .
Aber Achtung: Die Reihenfolge dieser Drehungen darf nicht verändert werden; die Zusammensetzung von Bewegungen
ist so wie die Multiplikation von Matrizen nicht kommutativ!
Rechnerisch einfacher, allerdings nicht so unmittelbar verständlich, ist die folgende Zusammensetzung von B, bei welcher
dieselben Drehwinkel, aber zumeist andere Drehachsen auftreten.
1. Wir drehen um b3 durch γ und bringen damit die Koordinatenachsen innerhalb der anfangs mit der b1 b2 -Ebene
zusammenfallenden Ebene E in die gewünschte Position.
2. Wir drehen um b1 durch β; damit bekommen die Ebene E und der zugehörige Normalvektor b3 bereits die richtige
Neigung.
3. Wir drehen um b3 durch α und bringen damit b3 und auch E in die jeweils vorgeschriebenen Endlagen.
Diese Zerlegung von B hat den Vorteil, dass stets um die ortsfesten Achsen b1 und b3 gedreht wird.

Lösung: In den Ausnahmefällen β = 0◦ (b3 = b3 ) und β = 180◦


Die zu diesen Drehungen gehörigen eigentlich orthogona- (b3 = −b3 ) sind nur (α + γ ) bzw. (α − γ ) eindeutig.
len Matrizen sind bereits früher aufgestellt worden (siehe
Seite 260). Somit können wir die Matrix A, welche die b3
Bewegung B darstellt, als Produkt von drei Drehmatrizen b3
ausrechnen.
In den folgenden Matrizen wurde aus Platzgründen der
Sinus durch s abgekürzt und der Kosinus durch c: β
b2


⎛ ⎞⎛ ⎞⎛ ⎞
cα −sα 0 1 0 0 cγ −sγ 0
A = ⎝ sα cα 0 ⎠⎝ 0 cβ −sβ ⎠⎝ sγ cγ 0 ⎠
E

0 0 1 0 sβ cβ 0 0 1
b1


⎛ ⎞⎛ ⎞
cα −sα cβ sα sβ cγ −sγ 0 0
= ⎝ sα cα cβ −cα sβ ⎠ ⎝ sγ cγ 0 ⎠
γ

α b2
0 sβ cβ 0 0 1 β
⎛ ⎞
cα cγ − sα cβ sγ −cα sγ − sα cβ cγ sα sβ b1
d
= ⎝ sα cγ + cα cβ sγ −sα sγ + cα cβ cγ −cα sβ ⎠
sβ sγ sβ cγ cβ Die Euler’schen Drehwinkel α, β und γ .
Wenn umgekehrt eine Position des Rechtsachsenkreuzes
(b1 , b2 , b3 ) gegeben ist, so sind bei linear unabhängigen Kommentar: Diese Überlegungen beweisen: Jede
{b3 , b3 } die zugehörigen Euler’schen Drehwinkel eindeu- Raumlage B  eines Achsenkreuzes ist aus deren Aus-
tig bestimmt, sofern man deren Grenzen mit gangslage B durch die Zusammensetzung von drei Dre-
0◦ ≤ α < 360◦ , 0◦ ≤ β ≤ 180◦ , 0◦ ≤ γ < 360◦ hungen zu erreichen, nämlich der Reihe nach durch
festsetzt. Der Vektor d (siehe Abbildung rechts) hat näm- Drehungen um b3 , um b1 und schließlich nochmals um
lich die Richtung des Vektorprodukts b3 × b3 , und d b3 . Mithilfe des Begriffes der Eigenvektoren (siehe Ka-
schließt mit b1 bzw. b1 die Winkel α bzw. γ ein. Dabei pitel 13) lässt sich zeigen, dass es auch stets durch eine
sind diese Winkel als Drehwinkel zu vorgegebenen Dreh- einzige Drehung geht, doch hat deren Drehachse eine all-
achsen jeweils in einem bestimmten Drehsinn zu messen. gemeine Lage.
7.5 Wechsel zwischen kartesischen Koordinatensystemen 263

Drehungsgruppe des R3 . Die Box auf Seite 264 zeigt eine ist. Wir drücken diese Gleichung in (o; B)-Koordinaten aus.
⎛ ⎞
Darstellung der Drehungen mithilfe von Quaternionen. x1
Dann stehen auf der linken Seite die gesuchten ⎝x2 ⎠. Rechts
? ⎛ ⎞
p1
x3
Warum ist R 0
d ,ϕ = R d ,−ϕ = R −d ,ϕ ? müssen wir die (o; B)-Koordinaten ⎝p2 ⎠ von p und jene der
p3
Basisvektoren bj einsetzen. Dabei sind letztere die Spalten
in der orthogonalen Matrix A = B T B  . Wir erhalten:
Umrechnung zwischen zwei kartesischen ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
Koordinatensystemen mit verschiedenen x1 p1 x1
⎝x2 ⎠ = ⎝p2 ⎠ + A ⎝x  ⎠ mit A−1 = A0 .
Nullpunkten 2
x3 p3 x3
Nun seien zwei kartesische Koordinatensysteme gegeben,
deren Koordinatenursprünge verschieden sind (Abb. 7.29):
Neben dem System (o; B) mit B = (b1 , b2 , b3 ) in gewohn- Erweiterte Koordinaten und Matrizen
ter Position gibt es noch das System (p; B  ) mit der ortho- ermöglichen einheitliche Formeln für Punkte
normierten Basis B  = (b1 , b2 , b3 ). Nun muss sorgfältig und Vektoren
unterschieden werden, ob wir die Koordinaten von Punkten
umrechnen oder jene von Vektoren. Die Umrechnungsgleichungen für Punktkoordinaten sind
verschieden von jenen für Vektorkoordinaten. Das zwingt
b3 x
zu besonderer Sorgfalt. Zudem ist die Koordinatentrans-
b2 formation von Punkten nicht allein durch eine Matrizen-
b3
multiplikation ausdrückbar, sondern es ist zusätzlich ein kon-
stanter Vektor zu addieren. Dies führt zu unübersichtlichen
b1 Formeln, wenn mehrere derartige Transformationen hinter-
einandergeschaltet werden müssen.
p
Hier erweist sich nun folgender Trick als vorteilhaft: Wir fü-
gen den drei Koordinaten eine weitere als nullte Koordinate
o hinzu. Bei Punkten wird diese gleich 1 gesetzt, bei Vektoren
gleich 0. Wir nennen diese Koordinaten erweiterte Punkt-
b2 bzw. Vektorkoordinaten und kennzeichnen die zugehörigen
b1
Vektorsymbole durch einen Stern. Dann lassen sich die Um-
Abbildung 7.29 Zwei Koordinatensysteme im R3 mit verschiedenen Null- rechnungsgleichungen einheitlich schreiben in der Form
punkten.
∗ ∗ ∗
(o;B) x = (o;B) T (p;B  ) (p;B  ) x (7.19)
Beginnen wir mit den Vektoren: Sie sind als Pfeile zu sehen,
⎛ ⎞ ⎛ ⎞
die im Raum beliebig parallel verschoben werden dürfen. Zur x0 x0
Ermittlung der B  -Koordinaten eines Vektors u verwenden ⎜ x1 ⎟ ⎜ x ⎟
mit (o;B) x = ⎝ ⎠, (p;B  ) x = ⎝ 1 ⎟
∗ ⎜ ⎟ ∗ ⎜ und
wir den Pfeil mit Anfangspunkt p. Dann sind die (p; B  )- x2 x2 ⎠
Koordinaten des Endpunkts zugleich die B  -Koordinaten x3 
x3
von u. ⎛ ⎞
1 0 0 0
Die B-Koordinaten von u sind durch den parallelen Pfeil mit
∗ ∗ ⎜ p1 a11 a12 a13 ⎟

A = (o;B) T (p;B  ) = ⎝ ⎟
dem Anfangspunkt o bestimmt. Gemäß (7.1) besteht also p2 a21 a22 a23 ⎠
nur die Aufgabe, u einmal aus den bi und dann aus den bj li- p3 a31 a32 a33
near zu kombinieren. Die beiden Koordinatentripel desselben
Vektors u sind somit nach wie vor durch die Matrizenglei- In der 4 × 4 -Matrix A∗ sind die (o; B)-Koordinaten des
chung (7.15) miteinander verknüpft. Punkts p vereint mit der orthogonalen 3 × 3 -Matrix A, wäh-
⎛ ⎞ ⎛ ⎞ rend die erste Zeile immer völlig gleich aussieht. Wir nennen
x1 x1
Anders ist es bei Punktkoordinaten: ⎝x2 ⎠ bzw. ⎝x2 ⎠ sind die diese die erweiterte Transformationsmatrix.
x3 x3
(o; B)- bzw. (p; B  )-Koordinaten desselben Raumpunkts x, Wir erkennen, dass die nullten Koordinaten stets unverän-
wenn gemäß (7.2) dert bleiben, d. h. stets x0 = x0 ist. Vektorkoordinaten
bleiben also Vektorkoordinaten, und das analoge gilt für
!
3 !
3 Punktkoordinaten. In den Spalten der erweiterten Transfor-
x =o+ xi bi = p + xj bj mationsmatrix (o;B) T (∗p;B  ) stehen der Reihe nach die erwei-
i=1 j =1 terten (o; B)-Koordinaten des Punkts p und der Vektoren bj .
264 7 Analytische Geometrie – Rechnen statt Zeichnen

Hintergrund und Ausblick: Quaternionen zur Darstellung von Drehungen


Auf Seite 83 wurden die Quaternionen q = a + i b + j c + k d ∈ H, also mit (a, b, c, d) ∈ R4 , als Erweiterungen von
komplexen Zahlen eingeführt. Wir können die Quaternion q aber auch als Summe aus dem Skalarteil a und der vektorwertigen
Quaternion v = i b + j c + k d darstellen, also als q = a + v. Wir nennen den zweiten Summanden v einfachheitshalber
einen Vektor und interpretieren dabei (i, j, k) in gleicher Weise wie die Standardbasis (e1 , e2 , e3 ) des R3 als orthonormierte
Basis des Anschauungsraums.
Dies ist dann die Grundlage für eine Darstellung der Drehungen mittels Quaternionen. Es wird sich zeigen, dass die multiplikative
Gruppe des Quaternionenschiefkörpers H homomorph ist zur Drehungsgruppe SO3 von Seite 263.

Für die Vektoren aus H gibt es ein Skalarprodukt, ein Vek- Quaternionen mit der Norm 1, der Einheitsquaternionen,
torprodukt und ein Quaternionenprodukt. Um Verwechs- bildet den Kern dieses Homomorphismus und damit eine
lungen zu vermeiden, verwenden wir von nun an ◦ als Untergruppe von (H \ {0}, ◦).
Verknüpfungssymbol der Quaternionenmultiplikation. Für q = a + v ∈ H1 gibt es wegen q2 = a 2 + v2 = 1
Es gibt einen tieferen Grund für die Interpretation von einen Winkel α mit a = cos α. Deshalb können Einheits-
(i, j, k) als orthonormierter Basis. Den auf Seite 240 an- quaternionen dargestellt werden als:
geführten Vektorprodukten e1 × e2 = e3 , e2 × e1 = −e3 q = cos α + sin α 
v mit 
v  = 1.
usw. von Vektoren der Standardbasis stehen nämlich die
Jede Einheitsquaternion q legt eine Vektorabbildung
Quaternionenprodukte i ◦ j = k, j ◦ i = −k usw. gegen-
über. Nachdem das Quaternionenprodukt distributiv ge- δq : R3 → R3 mit x → x  := q ◦ x ◦ q (∗∗)
bildet wird, gilt für je zwei Vektoren v 1 , v 2 ∈ H wegen
i ◦ i = j ◦ j = k ◦ k = −1: fest. x  ist tatsächlich wieder ein Vektor, denn
v 1 ◦ v 2 = −(v 1 · v 2 ) + (v 1 × v 2 ). x  = q ◦ x ◦ q = q ◦ (−x) ◦ q = −x  .
Mithilfe von (∗) lässt sich nachweisen, dass δq linear
Das Quaternionenprodukt zweier Vektoren aus H ist so-
ist und Skalarprodukte sowie Vektorprodukte unverändert
mit bei v 1 · v 2 = 0 nicht mehr vektorwertig. Aber es gilt
lässt. Wir wollen hier allerdings gleich eine explizite Vek-
umgekehrt:
tordarstellung von x  herleiten.
v 1 · v 2 = − 21 ((v 1 ◦ v 2 ) + (v 2 ◦ v 1 )) ,
(∗) x  = q ◦ x ◦ q = (cos α + sin α  v ) ◦ x ◦ (cos α − sin α 
v)
v 1 × v 2 = 21 ((v 1 ◦ v 2 ) − (v 2 ◦ v 1 )) . * +
= − sin α( v ·x) + (cos α x + sin α( v ×x)) ◦ (cos α − sin α  v)
Durch die Zerlegung der Quaternionen in Skalar- und Vek- = − ,sin α cos α(v ·x) + sin α cos α(v ·x) + sin2 α det(
v, 
v , x)
torteil wird das Produkt zweier Quaternionen qi = ai +v i , + sin2 α( v + cos2 α x + sin α cos α(
v ·x) v ×x)
-
i = 1, 2, übersichtlicher, denn − sin α cos α( 2
v ×x) − sin α[(v ×x) ×  v] .
(a1 + v 1 ) ◦ (a2 + v 2 ) = (a1 a2 − v 1 · v 2 )
Wegen ( v × x) ×  v = (v · v · x) 
v ) x − ( v nach der
+ (a1 v 2 + a1 v 1 + (v 1 × v 2 )) .
Grassmann-Identität (Seite 246) und wegen 2 sin2 α =
Die zu q = a + v konjugierte Quaternion ist q = a − v. 1 − cos2 α + sin2 α = 1 − cos 2α folgt weiter:
Vektorwertige Quaternionen sind durch q = −q gekenn-
x  = 2 sin2 α( v + (cos2 α − sin2 α) x + 2 sin α cos α(
v ·x)  v ×x)
zeichnet. Ein gleichzeitiger Vorzeichenwechsel von v 1
v ·x) 
= (1 − cos 2α)( v + cos 2α x + sin 2α (
v × x).
und v 2 in der obigen Formel zeigt:
Der Vergleich mit der Vektordarstellung (7.18) auf
(q1 ◦ q2 ) = q 2 ◦ q 1 . Seite 261 zeigt: Die Abbildung δq aus (∗∗) mit q =
Bei q = 0 bestimmt q die zu q inverse Quaternion als cos α + sin α 
v ist eine Drehung mit 
v als Einheitsvek-
q −1 =
1
q. tor in Drehachsenrichtung und mit dem Drehwinkel 2α.
a 2 + b2 + c2 + d 2
Die Zusammensetzung der Drehungen δ1 : x → x  =
Im Nenner tritt die Standardnorm des R4 auf. Wir definie-
q1 ◦ x ◦ q 1 und δ2 : x  → x  = q2 ◦ x  ◦ q 2 lautet:
ren diese gleichzeitig als Norm der Quaternion
% % δ2 ◦ δ1 : x → x  = (q2 ◦ q1 ) ◦ x ◦ (q2 ◦ q1 ).
q = a 2 + b2 + c2 + d 2 = q ◦ q,
Die Abbildung ψ : q → δq ist somit ein Homomorphis-
wobei jene der Vektoren inkludiert ist. Es gilt: mus (H1 , ◦) → (SO3 , ◦) mit dem Kern {1, −1}; neben q
q1 ◦ q2  = q1  · q2 , stellt auch −q dieselbe Drehung dar. Ein weiterer Homo-
morphismus ist Inhalt der Aufgabe 7.22.
denn wegen der Assoziativität der Multiplikation in H ist
In (∗∗) kann man anstelle q ∈ H1 allgemeiner ein q ∈
(q1 ◦ q2 ) ◦ (q1 ◦ q2 ) = (q1 ◦ q2 ) ◦ q 2 ◦ q 1 H \ {0} verwenden, doch muss dann die rechten Seite noch
= q1 ◦ q2 2 ◦ q 1 = q2 2 q1 2 . durch q2 dividiert werden. Dies führt auf einen surjek-
Damit vermittelt die Abbildung q → q einen Homo- tiven Homomorphismus (H \ {0}, ◦) → (SO3 , ◦) mit dem
morphismus (H \ {0}, ◦) → (R>0 , ·). Die Menge H1 der Kern R \ {0}.
7.5 Wechsel zwischen kartesischen Koordinatensystemen 265

Transformation zwischen kartesischen Koordinaten Bildpunkt in demselben Koordinatensystem (o; B) darstel-


len wollen, so müssen wir nur noch die (p; B  )-Koordinaten
Die Umrechnung vom kartesischen Koordinatensystem
von x  auf (o; B)-Koordinaten umrechnen. Und genau dies
(p; B  ) auf das kartesische Koordinatensystem (o; B)
wird in (7.20) ausgedrückt. Dabei stehen in den Spalten
erfolgt für die erweiterten Punkt- und Vektorkoordinaten
der erweiterten Matrix A∗ = (o;B) T (∗p;B  ) die erweiterten
nach (7.19). Dabei stehen in den Spalten der erweiterten
B-Koordinaten des Bilds p vom Ursprung o und der
Transformationsmatrix (o;B) T (∗p;B  ) der Reihe nach die
durch Verlagerung der Basis B entstandenen Vektoren
erweiterten (o; B)-Koordinaten des Ursprungs p sowie
(b1 , b2 , b3 ).
die B-Koordinaten der Vektoren b1 , b2 , b3 der orthonor-
mierten Basis B  . Die rechte untere 3 × 3-Teilmatrix in Umgekehrt ist jede Abbildung mit der Darstellung (7.20) und

(o;B) T (p;B  ) ist orthogonal. einer erweiterten Matrix A∗ von dem auf Seite 263 gezeig-
ten Typ mit eigentlich orthogonaler 3 × 3 Teilmatrix eine
Bewegung. Das wurde bereits auf Seite 260 gezeigt.
Dass hinter der Erweiterung der Koordinaten mehr als nur
ein formaler Trick steht, zeigt die Box auf Seite 266.
Umrechnung von einem lokalen
?
Beweisen Sie, dass auch bei Verwendung erweiterter Ko- Koordinatensystem auf der Erde zu einem
ordinaten jede Linearkombination von Vektoren wieder ein heliozentrischen System
Vektor ist und jede Affinkombination von Punkten wieder
ein Punkt ist. In der Astronomie begegnen wir immer wieder der Aufgabe,
zwischen verschiedenen kartesischen Koordinatensystemen
im Raum umzurechnen. In unserem Beispiel verwenden wir
die folgenden Systeme.
Auch bei der Darstellung allgemeiner Wir beginnen mit einem lokalen Koordinatensystem
Bewegungen sind erweiterte Koordinaten (p, Bl ) auf der Erde (Abb. 7.31): Der Ursprung p habe
zweckmäßig die geografische Länge λ und Breite β. Der erste Basis-
vektor b1l weise nach Osten, der zweite b2l nach Norden.
Wie früher bei festgehaltenem Ursprung, so gestattet auch Daneben betrachten wir ein im Erdmittelpunkt zentriertes,
hier die Transformationsgleichung (7.19) eine zweite Inter- also ein geozentrisches Koordinatensystem (ze ; Be ) mit
pretation, wenn wir diese unter Benutzung erweiterter Koor- einem zum Nordpol weisenden dritten Basisvektor b3e .
dinaten schreiben als Der erste b1e zeige zum Äquatorpunkt des Nullmeridians.
Dieses System macht die Erdrotation mit.

x  = A∗ x ∗ (7.20) Schließlich sei ein in der Sonnenmitte zs zentriertes, also
heliozentrisches Koordinatensystem gegeben (Abb. 7.32).
mit der erweiterten Matrix A∗ von Seite 263. Dessen Basisvektoren b1s und b2s spannen die Bahn-
ebene der Erde auf. Der dadurch festgelegte mathema-
b3 tisch positive Drehsinn soll mit dem Durchlaufsinn der
x Erdbahn übereinstimmen. Der erste Basisvektor b1s weise
b3
zum Frühlingspunkt. Dies ist der Mittelpunkt jener Posi-
b2
tion der Erde, wo die Äquatorebene die Sonne enthält und
die Fortschreitungsrichtung der Erde mit der zum Nordpol
b1
orientierten Erdachse einen stumpfen Winkel einschließt.
Gesucht ist die erweiterte Transformationsmatrix s T l∗ vom
p
x lokalen Koordinatensystem auf das heliozentrische. Dabei
treffen wir – abweichend von der Realität – die folgenden
o
b2 Vereinfachungen.
b1 B Die Erde wird als Kugel mit dem Radius r vorausgesetzt
– und nicht durch ein Ellipsoid approximiert.
Abbildung 7.30 Die Bewegung B : x  → x  bringt o mit p zur Deckung und Die Bahn der Erde um die Sonne wird als in der Sonne
die Vektoren bi für i = 1, 2, 3 mit bi . zentrierter Kreis mit dem Radius R angenommen – und
nicht als Ellipse mit der Sonne in einem Brennpunkt. Die
Es gibt genau eine Bewegung B, welche o in p überführt konstante Flächengeschwindigkeit bewirkt nun sogar eine
und die Basisvektoren bi von B der Reihe nach in jene von konstante Bahngeschwindigkeit.
B  . Angenommen, x geht in x  über (Abb. 7.30). Dann hat Während der Umrundung der Sonne bleibt die Stellung der
das Urbild x bezüglich (o; B) dieselben Koordinaten wie Erdachse unverändert; Präzession und Nutation bleiben
der Bildpunkt x  bezüglich (p; B  ). Wenn wir Urbild und unberücksichtigt.
266 7 Analytische Geometrie – Rechnen statt Zeichnen

Hintergrund und Ausblick: Euklidische, affine und projektive Geometrie


Vor mehr als 2000 Jahren erkannte man bereits, dass man nur dann eine Übersicht über die vielen geometrischen Einzelresultate
gewinnen kann, wenn man gewisse Aussagen als Axiome an die Spitze stellt und alle anderen daraus herleitet. Dadurch wurde
die Geometrie sehr früh zum Musterbeispiel einer deduktiven Wissenschaft.
Ein Axiomensystem bringt nicht nur Ordnung, sondern es ist auch anregend. Will man sich zum Beispiel Klarheit über
die Reichweite der einzelnen Axiomen verschaffen, so wird man gewisse Axiome abändern oder überhaupt weglassen.
So entstanden verschiedene Geometrien, die ihrerseits wieder eine gewisse Gliederung erforderten. Eine tragfähige Basis
hierfür stellte das von Felix Klein (1849–1925) entwickelte Erlanger Programm dar. Es empfiehlt, von den Gruppen der
jeweiligen Automorphismen auszugehen und die Geometrien als Studium der zur jeweiligen Gruppe gehörigen Invarianten zu
kennzeichnen. Um eine geometrische Aussage richtig einzuordnen, muss überprüft werden, hinsichtlich welcher größtmöglichen
Gruppe von Automorphismen die dabei verwendeten Begriffe invariant sind.

So anschaulich die Geometrie auch scheinen mag, man Forderungen sowohl die euklidische, als auch die nicht-
braucht deutlich mehr Axiome als etwa zur Definition euklidische Geometrie entstehen.
eines Vektorraums, selbst wenn man sich nur auf die ebene Die analytische Geometrie in dem durch Fernpunkte er-
Geometrie beschränkt. Die ersten Versuche für ein Axio- weiterten Anschauungsraum verwendet die auf Seite 263
mensystem der Geometrie gehen auf Euklid (∼ 365–300 eingeführten erweiterten Koordinaten x ∗ bzw. u∗ der
v. Chr.) zurück. Das bekannteste Axiomensystem stammt Punkte und Vektoren. Man muss allerdings in Kauf neh-
von David Hilbert (1862–1943). Es umfasst Inzidenz- men, dass die vier Koordinaten der Punkte des projektiven
axiome über die gegenseitige Lage von Punkten und Raums homogen, also nur bis auf einen Faktor eindeutig
Geraden, Kongruenzaxiome, Distanzen und Winkelmaße sind.
betreffend, Anordnungsaxiome zu den Begriffen „Halb- Punkte des reellen projektiven Raums sind somit eindi-
ebene“ und „zwischen“, sowie ein Stetigkeitsaxiom, ver- mensionale Unterräume des R4 , Geraden sind zweidimen-
gleichbar mit der in Kapitel 4 erklärten Vollständigkeit der sionale und Ebenen dreidimensionale Unterräume. Die
reellen Zahlen. bijektiven linearen Selbstabbildungen des R4 induzieren
Unter den Axiomen kam Euklids Parallelenpostulat eine Kollineationen, und diese spielen die Rolle von Automor-
besondere Rolle zu, nämlich der Forderung, dass durch je- phismen.
den Punkt P außerhalb der Geraden G genau eine Parallele Zeichnet man umgekehrt im projektiven Raum eine Ebene
legbar ist, also eine Gerade, die G nicht schneidet. Die- als Menge von „Fernpunkten“ aus und entfernt man diese,
ses ist experimentell niemals nachprüfbar, denn was weiß so bleibt ein affiner Raum, in dem wieder Parallelitäten er-
man schon von Geraden, wenn man sie weit genug über un- klärbar sind. Kollineationen, welche die gewählte „Fern-
ser Sonnensystem hinaus verlängert. Man versuchte 2000 ebene“ auf sich abbilden, induzieren dann im verbleiben-
Jahre lang vergeblich, dieses Axiom durch äquivalente den Raum affine Abbildungen. Die Gruppe der bijektiven
und eher „überprüfbare“ Aussagen zu ersetzen, bis der affinen Abbildungen bestimmt die affine Geometrie.
Ungar János Bolyai (1802–1860) bestätigte, dass es auch Dieser affinen Raum bestimmt einen Vektorraum (siehe
eine widerspruchsfreie nichteuklidische Geometrie gibt, Seite 228). Die Einführung eines Skalarprodukts auf die-
deren Axiomensystem sich von jenem der euklidischen sem Vektorraum ermöglicht die Definition von Distan-
Geometrie nur dadurch unterscheidet, dass das euklidi- zen und Winkelmaßen. Die zugehörigen Automorphis-
sche Parallelenpostulat ersetzt wird durch die Forderung: men sind die Kongruenzen; deren Gruppe ist isomorph
Durch P gibt es mindestens zwei verschiedene Parallele zur Gruppe der orthogonalen Matrizen. Die zugehörige
zu G. Geometrie ist die euklidische.
Das Studium der Zentralprojektion zeigte, dass in per- Der pythagoräische Lehrsatz gehört demnach zur euklidi-
spektiven Bildern Fluchtpunkte auftreten, also Bilder von schen Geometrie. Der Strahlensatz, wonach parallele Ge-
Punkten, die es in Wirklichkeit gar nicht gibt, nämlich von raden auf zwei schneidenden Geraden Strecken proportio-
Schnittpunkten paralleler Geraden. Dies führte zur Erwei- naler Längen ausschneiden, ist eine affine Aussage. Der
terung unseres Anschauungsraums durch unendlich ferne im Bild unten gezeigte Satz von Pappus-Pascal zählt zur
Punkte. Jede Gerade bekommt einen Fernpunkt dazu, was projektiven Geometrie. Seine Aussage lautet: Für je drei
unserer Anschauung ein wenig widerspricht, denn man Punkte P1 , P2 , P3 auf der Geraden G und Q1 , Q2 , Q3
kommt zu demselben Fernpunkt, egal, ob man in der einen auf der Geraden H liegen die Schnittpunkte S1 , S2 , S3 auf
oder in der entgegengesetzten Richtung die Gerade entlang einer Geraden K. G P3
läuft. Interpretiert man die Menge der Fernpunkte einer P2
Ebene als eine Gerade und jene des Raums als Ebene, so P1
entsteht der projektive Raum. S2
S1
S3 K
Die Geometrie in diesem Raum, die reelle projektive Geo-
metrie, erfordert nur wenig Axiome und stellt eine über- Q1 H
Q2
geordnete Geometrie dar, aus welcher durch zusätzliche Q3
7.5 Wechsel zwischen kartesischen Koordinatensystemen 267

Wir setzen die gewünschte Koordinatentransformation zu- Mit obiger Abbildung finden wir, wenn wir den Sinus und
sammen aus dem Wechsel von (p, Bl ) zu (ze ; Be ), der Dre- Kosinus zu s bzw. c abkürzen:
hung von (ze ; Be ) gegenüber (ze ; Be ) um die gemeinsame ⎛ ⎞⎛ ⎞
dritte Koordinatenachse durch den Winkel ϕ und schließlich 1 0 0 0 1 0 0 0
⎜ 0 cλ −sλ 0 ⎟ ⎜ r cβ 0 −sβ cβ ⎟
der Umrechnung von (ze ; Be ) auf das angegebene heliozen- ∗
e T l = ⎝
⎜ ⎟⎜ ⎟=
trische System (zs ; Bs ). Dabei setzen wir voraus, dass der 0 sλ cλ 0 ⎠ ⎝ 0 1 0 0 ⎠
Erdmittelpunkt vom Frühlingspunkt ausgehend den Kreisbo- ⎛0 0 0 1 r sβ 0 cβ
⎞ sβ
gen zum Zentriwinkel ψ zurückgelegt hat (siehe Abb. 7.32). 1 0 0 0
⎜ r cβ cλ −sλ −sβ cλ cβ cλ ⎟
Demgemäß erhalten wir mithilfe der zugehörigen erweiterten = ⎜
⎝ r cβ sλ cλ −sβ sλ cβ sλ ⎠

Transformationsmatrizen rsβ 0 cβ sβ

s Tl = s T e∗ (ψ) · e T e∗ (ϕ) · e T l∗ . (∗)
Die Bewegung von (ze ; Be ) nach (ze ; Be ) ist eine Drehung
um die gemeinsame dritte Koordinatenachse durch den Win-
b3e kel ϕ. Somit ist
b2l ⎛ ⎞
1 0 0 0
N
b3l
∗ ⎜ 0 cos ϕ − sin ϕ 0⎟
e T e (ϕ) = ⎜
⎝ 0 sin ϕ cos ϕ

0⎠
0 0 0 1
b1l
p
Die Vektoren aus Be behalten gegenüber dem heliozentri-
schen System ihre Richtungen bei, machen also die Erdrota-
ze β
tion nicht mit. Durch diese dreht sich die Erde gegenüber dem
heliozentrischen System in 24 Stunden durch mehr als 360◦ ,
λ denn während dieser 24 Stunden wandert der Erdmittelpunkt
b2e
ja auf seiner Bahn weiter.
b1e Betrachten wir dies etwas genauer: Angenommen, wir begin-
nen unsere Winkelmessung genau um 12 Uhr mittags (wahre
Sonnenzeit). Zu dieser Zeit geht die Ebene des Nullmeri-
Abbildung 7.31 Das lokale Koordinatensystem (p; B) und das geozentrische dians durch die Sonnenmitte. Nach einer 360◦ -Drehung der
(ze ; Be ). Erde um ihre Achse ist diese Ebene des Nullmeridians zwar
wieder zu ihrer Ausgangslage parallel. Sie wird aber nicht
Für die Transformationsmatrix e T l∗ benötigen wir die erwei- mehr durch die Sonnenmitte gehen, weil der Erdmittelpunkt
terten (ze , Be )-Koordinaten von p, b1l , b2l und b3l . Wir ge- inzwischen gewandert ist. Wir müssen bis 12 Uhr mittags
hen zunächst vom Nullmeridian aus, also von der Annahme noch etwas weiterdrehen, allerdings um die gegenüber der
λ = 0. Wenn wir darauf die Drehung um die Erdachse b3 b1s b2s -Ebene geneigte Erdachse. Daher ist dieser zusätzliche
durch die gegebene geografische Länge λ anwenden, erhal- Drehwinkel trotz unserer vereinfachenden Annahmen nicht
ten wir die Spaltenvektoren der Transformationsmatrix e T l∗ . konstant.

b3s

b3e

b2s
σ
zs
ψ b3e

b2e
b1s
σ

b1e

Abbildung 7.32 Das von der Erdrotation „befreite“ geozentrische Koordinatensystem (ze ; Be ) und das heliozentrische System (zs ; Bs ). Die Erde ist rund 2 500-fach
vergrößert dargestellt.
268 7 Analytische Geometrie – Rechnen statt Zeichnen

Im täglichen Leben verwenden wir die mittlere Zeit, die auf gelegt haben und diese daher der Äquatorebene der zugehö-
der Annahme basiert, dass alle Tage gleich lang sind und das rigen Erdposition angehört,

hat b3e die von ψ unabhängigen
Jahr etwa 365.24 Tage umfasst. Das ermöglicht uns, den zu- 0
Bs -Koordinaten − sin σ . Wir wählen die erste Koordinaten-
sätzlichen Drehwinkel durch seinen Mittelwert 360◦ /365.24 cos σ
zu ersetzen. Die Differenz zwischen der wahren und mittle- achse b1e des geozentrischen Systems Be gleich dem b1s .
ren Sonnenzeit heißt Zeitgleichung und beträgt bis zu ±15 Damit folgt:
Minuten. ⎛ ⎞
1 0 0 0
∗ ⎜ R cos ψ 1 0 0 ⎟
Wir können ϕ = ωe t + ϕ0 setzen mit der Winkelgeschwin- s T e (ψ) = ⎜ ⎟
⎝ R sin ψ 0 cos σ − sin σ ⎠
digkeit
0 0 sin σ cos σ
' (
1
ωe = 2π 1 + /(24 · 3 600) Nachdem die Erde in etwa 365.24 Tagen die Sonne einmal
365.24
umrundet, können wir ψ = ωs t setzen mit der Winkelge-
pro Sekunde. ϕ0 ist der Anfangswert zum Zeitpunkt t = 0. schwindigkeit
Übrigens ist r ≈ 6 371 km.
ωs = 2π/(365.24 · 3 600 · 24)
Während der Bewegung der Erde um die Sonne behält die
Erdachse ihre Richtung bei. Nun ist die Äquatorebene um den pro Sekunde. Wir können R ≈ 150 000 000 km annehmen,
Winkel σ ≈ 23.45◦ , der Schiefe der Ekliptik, gegenüber der verzichten hier allerdings darauf, die in der Gleichung (∗)
Bahnebene geneigt. Nachdem wir die erste Koordinatenachse notwendige Matrizenmultiplikation zur Berechnung von s T l∗
unseres heliozentrischen Systems durch den Frühlingspunkt explizit vorzuführen.

Zusammenfassung

Elemente des R3 stellen einerseits Punkte des Anschauungs- Drei paarweise orthogonale Einheitsvektoren (b1 , b2 , b3 )
raums dar, andererseits Vektoren, also Äquivalenzklassen heißen orthonormiert oder kartesische Basis. Sie sind durch
gleich langer und gleich gerichteter Pfeile. bi · bj = δij gekennzeichnet. Die Koordinaten des Vektores
u bezüglich der kartesischen Basis B = (b1 , b2 , b3 ) sind
Es gibt verschiedene Produkte von Vektoren.
Skalarprodukte, nämlich

Definition des Skalarprodukts Bu = (u1 , u2 , u3 )0 ⇐⇒ ui = u · bi für i = 1, 2, 3.


Für je zwei Vektoren u, v ∈ R3 mit kartesischen Ko-
Ist (o; B) ein kartesisches Koordinatensystem, so gilt für die
ordinaten (u1 , u2 , u3 )0 bzw. (v1 , v2 , v3 )0 lautet das
zugehörigen Koordinaten des Punkts x:
Skalarprodukt
(o;B) x = (x1 , x2 , x3 )0 ⇐⇒ xi = (x − o) · bi , i = 1, 2, 3.
u · v = u1 v1 + u2 v2 + u3 v3 .
Für alle u, v ∈ R3 gelten die
Auf dem Skalarprodukt beruht die Definition der Norm oder
Länge: Cauchy-Schwarz’sche Ungleichung: |u · v| ≤ u v
 √ und die Dreiecksungleichung: u + v ≤ u + v.
u = u21 + u22 + u23 = u · u.

Definition des Vektorprodukts


Geometrische Deutung des Skalarprodukts
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
u1 v1 u2 v3 − u3 v2
u · v = u v cos ϕ
u × v = ⎝u2 ⎠ × ⎝v2 ⎠ = ⎝ u3 v1 − u1 v3 ⎠
mit ϕ als von u und v eingeschlossenem Winkel. u3 v3 u1 v 2 − u 2 v 1

Das Skalarprodukt u·v verschwindet genau dann, wenn einer Das Vektorprodukt u × v ist genau dann gleich dem Null-
der beteiligten Vektoren der Nullvektor ist oder die beiden vektor, wenn die Vektoren u und v linear abhängig sind. Für
Vektoren u und v zueinander orthogonal sind. linear unabhängige u, v gilt:
Zusammenfassung 269

Geometrische Deutung des Vektorprodukts Beides sind affine Abbildungen des R3 , also von der Bauart
x → x  = t + A x mit t ∈ R3 , A ∈ R3×3 .
1) Der Vektor u × v ist orthogonal zu der von u und v
aufgespannten Ebene. Mithilfe des Skalarprodukts und des Vektorprodukts lassen
2) u × v = u v sin ϕ mit ϕ als von u und v sich für je zwei affine Teilräume des R3 , also für Punkte, Ge-
eingeschlossenem Winkel. raden oder Ebenen, die gegenseitigen Abstände berechnen.
3) Die drei Vektoren (u, v, (u × v)) bilden ein Rechts- Dabei wird der Abstand zwischen zwei nichtleeren Punkt-
system, d. h. folgen aufeinander wie die ersten drei mengen M und N des R3 definiert als
Finger der rechten Hand.
dist(M, N ) = inf { x − y | x ∈ M und y ∈ N} .

Definition des Spatprodukts


Das Spatprodukt der Vektoren u, v, w ∈ R3 mit karte- Orthogonale Transformationsmatrizen
sischen Koordinaten (u1 , u2 , u3 )0 , (v1 , v2 , v3 )0 bzw.
(w1 , w2 , w3 )0 ist gleich der Determinante Die Transformationsmatrizen zwischen kartesischen
Koordinatensystemen sind orthogonal, d. h.;
⎛ ⎞
u1 v1 w1
det(u, v, w) = det ⎝ u2 v2 w2 ⎠ (B T B  )−1 = (B T B  )0 .
u3 v3 w3
Handelt es sich um zwei Rechtskoordinatensysteme, so ist die
Genau dann ist det(u, v, w) = 0, wenn die drei Vektoren u, Matrix B T B  eigentlich orthogonal, d. h., det(B T B  ) = +1.
v und w linear abhängig sind. Das Spatprodukt lässt sich als Alle eingeführten Produkte von Vektoren sind koordinaten-
gemischtes Produkt schreiben: invariant, d. h., für eigentlich orthogonale A ∈ R3×3 gilt:
det(u, v, w) = u · (v × w) = w · (u × v). (A u) · (A v) = u · v,
Die Vektoren u, v, w bilden genau dann in dieser Reihenfolge (A u) × (A v) = A (u × v),
ein Rechtssystem, wenn det(u, v, w) > 0 ist. det (A u, A v, A w) = det(u, v, w).

Geometrische Deutung des Spatprodukts Eine affine Abbildung B : R3 → R3 heißt Bewegung, wenn
Der Absolutbetrag | det(u, v, w)| des Spatprodukts ist alle Distanzen und Winkelmaße erhalten bleiben und Rechts-
gleich dem Volumen des von den Vektoren u, v und w systeme wieder in Rechtssysteme übergehen.
aufgespannten Parallelepipeds.
Darstellung einer Bewegung
Jede Ebene E des R3 ist die Lösungsmenge einer linearen Bei Verwendung eines kartesischen Koordinatensystems
Gleichung n1 x1 + n2 x2 + n3 x3 = k. Dabei sind die in dieser sind die Bewegungen B : x → x  durch eine Gleichung
Gleichung auftretenden Koeffizienten (n1 , n2 , n3 )  = 0 die x  = t + A x mit eigentlich orthogonaler Matrix A ge-
Koordinaten eines Normalvektors n von E. Bei n = 1 kennzeichnet.
heißt die zugehörige Ebenengleichung
Bei der Umrechnung zwischen kartesischen Rechtskoordi-
l(x) = n · x − k = 0
natensystemen (p; B  ) und (o; B) mit p = o verhalten sich
Hesse’sche Normalform von E. Punkt- und Vektorkoordinaten verschieden. Daher ist es sinn-
voll, zu erweiterten Punkt- und Vektorkoordinaten x ∗ bzw.
Eigenschaften der Hesse’schen Normalform u∗ aus R4 überzugehen, indem 1 bzw. 0 als nullte Koordi-
nate hinzugefügt wird. Dann gibt es eine erweiterte Trans-
Für alle a ∈ R3 gibt l(a) den orientierten Abstand des
formationsmatrix (o;B) T (∗p;B  ) ∈ R4×4 mit einer eigentlich
Punkts a von der Ebene E an.
orthogonalen 3 × 3-Teilmatrix rechts unten, und die Trans-
formationsgleichungen lauten einheitlich:
Die Orthogonalprojektion auf die Ebene E mit der
Hesse’schen Normalform n · x − k = 0 lautet: (o;B) x

= ∗ ∗
(o;B) T (p;B  ) (p;B  ) x .

x → x E = k n + (E3 − N) x
Ist A∗ ∈ R4×4 eine derartige Transformationsmatrix, so ist
mit N = n n0 als dyadischem Quadrat von n und E3 als die in einem kartesischen Koordinatensystem durch
dreireihiger Einheitsmatrix. Die Spiegelung an der Ebene E ∗
mit der Hesse’schen Normalform n · x − k = 0 lautet: x ∗ → x  = A∗ x ∗

x → x  = 2k n + (E3 − 2N) x. dargestellte Abbildung eine Bewegung.


270 7 Analytische Geometrie – Rechnen statt Zeichnen

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen Rechenaufgaben
7.1 •• Angenommen, die Gerade G ist die Schnitt- 7.6 •⎛ Im 3
⎞ R sind zwei
⎛ ⎞ Vektoren gegeben, nämlich
gerade der Ebenen E1 und E2 , jeweils gegeben durch eine 2 2
lineare Gleichung u = ⎝ −2 ⎠ und v = ⎝ 5 ⎠. Berechnen Sie u, v,
1 14
den von u und v eingeschlossenen Winkel ϕ sowie das Vek-
ni · x − ki = 0, i = 1, 2.
torprodukt u × v samt Norm u × v.

Stellen Sie die Menge aller durch G legbaren Ebenen dar 7.7 • Stellen Sie die Gerade
als Menge aller linearen Gleichungen mit den Unbekannten ⎛ ⎞ ⎛ ⎞
(x1 , x2 , x3 ), welche G als Lösungsmenge enthalten. 3 2
G = ⎝ 0 ⎠ + R⎝ −2 ⎠
4 1
7.2 ••• Welche eigentlich orthogonale 3 × 3 -Matrix
A = E3 erfüllt die Eigenschaften als Schnittgerade zweier Ebenen, also als Lösungsmenge
zweier linearer Gleichungen dar. Wie lauten die Gleichun-
⎛ ⎞ ⎛ ⎞
1 1 gen aller durch G legbaren Ebenen?
A = AAA = E3 und A ⎝ 1 ⎠ = ⎝ 1 ⎠.
3
1 1 7.8 •• Im Raum R3 sind die vier Punkte
⎛⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
Wie viele Lösungen gibt es? Gibt es auch eine uneigentlich −1 0 −1 1
orthogonale Matrix mit diesen Eigenschaften? a = ⎝ 0 ⎠, b = ⎝ 0 ⎠, c = ⎝ 2 ⎠, d = ⎝ 2 ⎠
1 2 0 x3

7.3 •• Man füge in der folgenden Matrix M die durch gegeben. Bestimmen Sie die letzte Koordinate x3 von d der-
Sterne markierten fehlenden Einträge derart ein, dass eine art, dass der Punkt d in der von a, b und c aufgespannten
eigentlich orthogonale Matrix entsteht. Ebene liegt. Liegt d im Inneren oder auf dem Rand des Drei-
⎛ ⎞ ecks abc?
1 ∗ −2 2
M = ⎝∗ 1 ∗⎠ 7.9 • Im Anschauungsraum R3 sind die zwei Geraden
3 ∗ ∗ ∗
⎞ ⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞
2 3 2 −1
Wie viele verschiedene Lösungen gibt es? G = ⎝ 0 ⎠ + R⎝ 1 ⎠, H = ⎝ −1 ⎠ + R⎝ 1 ⎠
−3 −1 0 1

7.4 •• Der Einheitswürfel W wird um die durch den gegeben. Bestimmen Sie die Gleichung derjenigen Ebene E
Koordinatenursprung gehende Raumdiagonale durch 60◦ ge- durch den Ursprung, welche zu G und H parallel ist. Welche
dreht. Berechnen Sie die Koordinaten der Ecken des verdreh- Entfernung hat E von der Geraden G, welche von H ?
ten Würfels W  .
7.10 • Im Anschauungsraum R3 sind die Gerade
7.5 •• Man bestimme die orthogonale Darstellungs- ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 2 1
matrix R d ,ϕ der Drehung durch den Winkel ϕ um eine durch G = ⎝ 0 ⎠ + R⎝ 1 ⎠ und der Punkt p = ⎝ 1 ⎠
den Koordinatenursprung
⎛ ⎞ laufende Drehachse mit dem Rich- 2 −2 1
d1
tungsvektor d = ⎝ d2 ⎠ bei d = 1. gegeben. Bestimmen Sie die Hesse’sche Normalform derje-
d3 nigen Ebene E durch p, welche zu G normal ist.
Aufgaben 271

7.11 •• Im Anschauungsraum R3 sind die zwei Geraden ist die Umrechnungsmatrix B T B  zwischen kartesischen Ko-
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ordinatensystemen (o; B  ) und (o; B). Bestimmen Sie die
3 2 2 −1
G1 = ⎝ 0 ⎠ + R⎝ −2 ⎠, G2 = ⎝ 3 ⎠ + R⎝ 1 ⎠ zugehörigen Euler’schen Drehwinkel α, β und γ .
4 1 3 2
7.18 ••• Die drei Raumpunkte
gegeben. Bestimmen Sie die kürzeste Strecke zwischen den
beiden Geraden, also deren Endpunkte a 1 ∈ G1 und a 2 ∈ G2 ⎛ ⎞ ⎞ ⎛ ⎛ ⎞
0 −2 −1
sowie deren Länge d. a 1 = ⎝ 0 ⎠, a 2 = ⎝ 1 ⎠, a 3 = ⎝ −1 ⎠
1 2 3
7.12 •• Im⎛ Anschauungsraum
⎞ R3 ist die Gerade
⎛ ⎞
1 2
bilden ein gleichseitiges Dreieck. Gesucht ist die erweiterte
G= ⎝1⎠ + R⎝ −2 ⎠ gegeben. Welcher Gleichung müssen
2 1 Darstellungsmatrix derjenigen Bewegung, welche die drei
die Koordinaten x1 , x2 und x3 des Raumpunkts x genügen, Eckpunkte zyklisch vertauscht, also mit a 1 → a 2 , a 2 → a 3
damit x von G den Abstand r = 3 hat und somit auf dem und a 3 → a 1 .
Drehzylinder mit der Achse G und dem Radius r liegt?

7.13 •• Im Anschauungsraum R3 sind die zwei Geraden Beweisaufgaben


⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
3 2 2 −1 7.19 • Man beweise: Zwei Vektoren u, v ∈ R3 \ {0}
G1 = ⎝0⎠ + R⎝ −2 ⎠, G2 = ⎝3⎠ + R⎝ 2 ⎠ sind dann und nur dann zueinander orthogonal, wenn
4 1 3 2
u + v2 = u2 + v2 ist.
gegeben. Welcher Gleichung müssen die Koordinaten x1 , x2
und x3 des Raumpunkts x genügen, damit x von den bei- 7.20 • Man beweise: Für zwei linear unabhängige Vek-
den Geraden denselben Abstand hat? Bei der Menge dieser toren u, v ∈ R3 sind die zwei Vektoren u−v und u+v genau
Punkte handelt es sich übrigens um das Abstandsparaboloid dann orthogonal, wenn u = v ist. Was heißt dies für das
von G1 und G2 , ein orthogonales hyperbolisches Paraboloid von u und v aufgespannte Parallelogramm?
(siehe Kapitel 18).
7.21 •• Das (orientierte) Volumen V des von drei Vek-
7.14 •• Im Anschauungsraum
⎛ ⎞ R3 ⎛ist die
⎞ Gerade toren v 1 , v 2 und v 3 aufgespannten Parallelepipeds ist gleich
1 2
G = p + Ru mit p = ⎝ 1 ⎠ und u = ⎝ −2 ⎠ gegeben. dem Spatprodukt det(v 1 , v 2 , v 3 ). Zeigen Sie unter Verwen-
2 1 dung des Determinantenmultiplikationssatzes von Seite 474,
Welcher Gleichung müssen die Koordinaten x1 , x2 und x3 dass das Quadrat V 2 des Volumens gleich ist der Determi-
des Raumpunkts x genügen, damit x auf demjenigen Dreh- nante der von den paarweisen Skalarprodukten gebildeten
kegel mit der Spitze p und der Achse G liegt, dessen halber (symmetrischen) Gram’schen Matrix
Öffnungswinkel ϕ = 30◦ beträgt? ⎛ ⎞
v1 · v1 v1 · v2 v1 · v3
7.15 •• Im Anschauungsraum R3 sind die „einander fast G(v 1 , v 2 , v 3 ) = ⎝ v 2 · v 1 v 2 · v 2 v 2 · v 3 ⎠.
schneidenden“ Geraden v3 · v1 v3 · v2 v3 · v3
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
2 −1 3 2
G1 = ⎝ 3 ⎠ + R⎝ 1 ⎠, G2 = ⎝ 0 ⎠ + R⎝ −2 ⎠
7.22 ••• Die Quaternionen (siehe Seite 83) bilden einen
3 2 4 1
vierdimensionalen Vektorraum über R. Sie sind aber auch als
gegeben. Für welchen Raumpunkt m ist die Quadratsumme Elemente des Vektorraums C2 über R aufzufassen dank der
der Abstände von G1 und G2 minimal? bijektiven linearen Abbildung ϕ : H → C2 mit
' ( ' (
7.16 •• Die eigentlich orthogonale Matrix x a +ib
⎛ ⎞ ϕ : q = a + i b + j c + k d → = .
−1 −1
2 √ y c +id
1 √
A = √ ⎝ √0 √3 −√ 3 ⎠
6 Im Urbild ist i eine Quaternioneneinheit; das i im Bild ist die
2 2 2
imaginäre
' ( Einheit. Ignoriert man diesen Unterschied, so ist
ist die Darstellungsmatrix einer Drehung. Bestimmen Sie ϕ −1 xy = x + y ◦ j.
einen Richtungsvektor d der Drehachse und den auf die Ori-
Beweisen Sie, dass ϕ einen Isomorphismus von (H \ {0}, ◦)
entierung von d abgestimmten Drehwinkel ϕ.
auf (C2 \ {0}, ∗) induziert, sofern ◦ die Quaternionenmulti-
7.17 •• Die eigentlich orthogonale Matrix plikation bezeichnet und die Verknüpfung ∗ auf C2 definiert
⎛ ⎞ wird durch
1 2 1 2 ' ( ' ( ' (
A = ⎝ 1 2 −2 ⎠ x1 x2 x1 x2 − y1 y2
3 −2 2 1 ∗ = .
y1 y2 x1 y2 + y1 x2
272 7 Analytische Geometrie – Rechnen statt Zeichnen

Der Querstrich
' ( bedeutet hier die Konjugation in C. Wie sieht 7.23 ••• Man zeige:
das zu xy hinsichtlich ∗ inverse Element aus? a) In einem Parallelepiped schneiden die vier Raumdiago-
Beweisen Sie weiter, dass die Abbildung nalen einander in einem Punkt.
b) Die Quadratsumme dieser vier Diagonalenlängen ist
' ( ' (
x x −y gleich der Summe der Quadrate der Längen aller 12 Kan-
ψ : C2 → C2×2 , →
y y x ten des Parallelepipeds (siehe dazu die Parallelogramm-
gleichung (7.2)).
einen injektiven Homomorphismus von (C2 \ {0}, ∗) in die
multiplikative Gruppe der invertierbaren Matrizen aus C2×2 7.24 ••• Angenommen, die Punkte p1 , p2 , p3 , p4 bil-
induziert. Inwiefern bestimmt die Norm der Quaternion q die den ein reguläres Tetraeder der Kantenlänge 1. Man zeige:
Determinante der Matrix (ψ ◦ ϕ)(q)?
a) Der Schwerpunkt s = 41 (p1 + p2 + p3 + p4 ) hat von
Damit ist dann bestätigt, dass die von den Einheitsquaternio- allen Eckpunkten dieselbe Entfernung.
nen gebildete Gruppe (H1 , ◦) (siehe Seite 264) isomorph ist b) Die Mittelpunkte der Kanten p1 p2 , p 1 p3 , p 4 p3 und
zur multiplikativen Gruppe SU2 der Matrizen obiger Bauart p4 p2 bilden ein Quadrat. Wie lautet dessen Kantenlänge?
mit der Determinante 1, der zweireihigen unitären Matrizen c) Der Schwerpunkt s halbiert die Strecke zwischen den
(siehe Kapitel 17). Mittelpunkten gegenüberliegender Kanten. Diese drei
Strecken sind paarweise orthogonal.

Antworten der Selbstfragen

S. 230 punkte, denn 13 + 13 + 13 = 1 und 0 ≤ 13 ≤ 1 . Nachdem


Nunmehr gilt b − a = f − c, also keiner der Koeffizienten verschwindet, liegt s im Inneren.
⎛ ⎞ Wir finden noch eine weitere Affinkombination, nämlich
6 , -
f = b − a + c = ⎝ 9 ⎠. s = 23 21 (a + b) + 13 c,
4
und diese beweist die zweite Behauptung.
Die Gleichung f − c = c − d bestätigt c als Mittelpunkt der
Strecke df . S. 232
Nein, natürlich nicht! Die Eigenschaft, ein Rechtssystem zu
S. 231
sein, ist unabhängig von der Position im Raum. Ein rechter
Wir beschränken uns im Beweis zunächst darauf, dass in
Schuh wird kein linker, wenn wir ihn umdrehen, also mit der
einer Affinkombination einer der vorkommenden Vekto-
Sohle nach oben hinlegen.
ren selbst wieder eine Affinkombination ist: Angenommen,
c = ni=1 λi a i mit ni=1 λi = 1 und a 1 = m j =1 μj bj S. 234
m
bei j =1 μj = 1. Dann ist c eine Linearkombination von Nach der Definition der Norm auf Seite 233 ist a2 = a·a =
b1 , . . . , bm , a 2 , . . . ,a n , und die Summe der Koeffizienten a 2 . Aus der Bilinearität und Symmetrie des Skalarprodukts
m n folgt:
lautet λ1 j =1 μj + λ2 + · · · + λn = i=1 λi = 1. Im
Fall von Konvexkombinationen gilt zudem λi , μj ≥ 0, und u + v2 + u − v2 = (u + v)2 + (u − v)2
das trifft auch auf die neuen Koeffizienten λ1 μj zu. = u2 + 2 (u · v) + v 2 + u2 − 2 (u · v) + v 2
Sollte nun eine Affin- bzw. Konvexkombination vorliegen,
= 2 (u2 + v 2 ) = 2 (u2 + v2 ).
bei welcher zwei oder mehrere vorkommende Vektoren selbst
wieder Affin- bzw. Konvexkombinationen sind, so braucht
zum Beweis der obigen Behauptung nur das bisherige Er- S. 234
gebnis wiederholt angewendet zu werden. Es ist
a 1 − a 2  = a 3 − a 4  = 4,
S. 231
Die erste ist richtig, denn die Affinkombinationen sind spe- und für jedes i ∈ {1, 2} und j ∈ {3, 4} ist
zielle Linearkombinationen. Die zweite Aussage ist falsch, %
denn nicht jede Linearkombination ist eine Affinkombina- a i − a j  = 22 + 22 + 22 · 2 = 4.
tion, also eine mit der Koeffizientensumme 1.
Je drei dieser Punkte bilden ein gleichseitiges Dreieck. Alle
S. 231 vier sind die Eckpunkte einer speziellen dreiseitigen Pyra-
s = 13 a + 31 b + 13 c ist eine Konvexkombination der drei Eck- mide, eines regulären Tetraeders.
Antworten der Selbstfragen 273

S. 235 S. 255
Nach (7.12) ist aufgrund der angegebenen Substitutionen
u·v 1 1
cos ϕ = = √ √ = $⇒ ϕ = 60◦ . det(p−a , u, v )
u v 2 2 2 b = a+ (u × v)
u×v 2
(p−a )·(u×v ) u×v
= a+ u×v  u×v 
S. 235
= a + [(p − a) · n] n
Wir zeigen, dass das Skalarprodukt (f − b) · u null ist:
  = a − [(a · n) − (p · n)] n
(b − a) · u
(f − b) · u = a + u−b ·u = a − [(a · n) − k] n = a − l(a) n.
u·u
(b − a) · u
= (a − b) · u + (u · u)
u·u
= (a − b) · u + (b − a) · u = 0. S. 256
Im dyadischen Produkt sind die Spaltenvektoren der Reihe
Hier haben wir die Linearität des Skalarprodukts ausgenutzt. nach v1 u , v2 u und v3 u und somit skalare Vielfache von u.
Bei b = f beweist das verschwindende Skalarprodukt die Sind u und v verschieden vom Nullvektor, so ist wenigstens
Orthogonalität. Bei b = f muss b bereits als Punkt von einer der Spaltenvektoren vom Nullvektor verschieden und
G gewählt worden sein. Umgekehrt bedeutet b ∈ G, dass daher der Rang des dyadischen Produkts 1. Andernfalls ist
f − b = λ u ist und daher (f − b) · u = λ(u · u) = 0 wegen der Rang 0, denn alle Einträge sind null.
u = 0 nur bei λ = 0, also bei f = b möglich ist.
S. 256
S. 241
1) Wegen n = 1 ist
x liegt genau dann in der Ebene E, wenn der Vektor x−p eine
Linearkombination von u und v ist. Und dies ist, wie vorhin N N = n (n0 n) n0 = n n0 = N
gezeigt wurde, äquivalent zum Verschwinden des Skalarpro-
dukts von x − p und dem Vektorprodukt u × v. und daher (E3 − N )2 = E3 − 2N + N = E3 − N .

S. 243 Dazu gibt es auch eine geometrische Erklärung: Geht die


Die Punkte a, b, c liegen genau dann nicht auf einer Geraden, Ebene E durch den Ursprung (k = 0), so beschreibt die
wenn die Vektoren (b − a) und (c − a) linear unabhängig Matrix (E3 − N ) die Orthogonalprojektion. Wird nun der
sind, also bei (c − a) × (b − a)  = 0. Wegen der Linearität Normalenfußpunkt x E von x noch einmal normal nach E
des Vektorprodukts können wir die linke Seite dieser Unglei- projiziert, so ändert er sich nicht mehr. Es bewirkt die zwei-
chung noch umformen zu (c×b)−(a ×b)−(c×a)+(a ×a), malige Ausführung der Orthogonalprojektion nichts anderes
wobei der letzte Summand verschwindet. als die einmalige, und genau dies wird mit der Idempotenz
der Matrix ausgedrückt .
S. 245 2) Die Spaltenvektoren in der Darstellungsmatrix sind die
Ein verschwindendes Spatprodukt kennzeichnet lineare Ab- Bilder der Standardbasis des R3 . Da diese drei Bildvektoren
hängigkeit. Der Absolutbetrag bleibt bei Vertauschungen der in E liegen, sind sie linear abhängig. Somit verschwindet die
Reihenfolge unverändert. Determinante.

S. 246 S. 256
Aus der Schiefsymmetrie des Vektorprodukts folgt: Wegen N 2 = N folgt durch Ausrechnen (E3 − 2N )2 = E3 .
Diese Gleichung ist andererseits daraus zu folgern, dass die
u × (v×w) = −(v× w) × u = −(v · u)w + (w · u)v. zweimalige Spiegelung an E alle Raumpunkte unverändert
lässt.
S. 253
S. 258
Ebenfalls ein reguläres Tetraeder, und zwar eines, das der Ein-
1) Nein, sie ist zwar orthogonal, aber die Spaltenvektoren
heitskugel eingeschrieben ist, nachdem es sich ausschließlich
(s 1 , s 2 , s 3 ) bilden ein Linkssystem; es ist det(s 1 , s 2 , s 3 ) =
um Einheitsvektoren handelt.
−1 und s 1 × s 2 = −s 3 . Erst nach Vertauschung zweier Spal-
ten oder auch Zeilen entstünde eine eigentlich orthogonale
S. 254
Matrix.
⎛ ⎞
4+1+4 2+2−4 4−2−2
2) Die Matrix M ist symmetrisch, und wegen N 2 = N ist
D =⎝ 2+2−4 1+4+4 2−4+2 ⎠
M M 0 = M M = E3 , wie bereits früher auf Seite 256 fest-
⎛ 4 − 2 −⎞
2 2−4+2 4+4+1
gestellt worden ist. Die Spiegelung führt Rechtssysteme in
9 0 0
= ⎝ 0 9 0 ⎠ = 9 E3 . Linkssysteme über. Daher ist die Matrix uneigentlich ortho-
0 0 9 gonal.
274 7 Analytische Geometrie – Rechnen statt Zeichnen

S. 261 gegengesetztem Drehsinn. Dieselbe Bewegungsumkehr ist


In den Spalten der Transformationsmatrizen stehen die Koor- auch durch den Ersatz von d durch −d zu erreichen.
dinaten der verdrehten Basisvektoren. Daher lauten die Ma-
Natürlich ist dies auch anhand der Darstellung der Dreh-
trizen der Drehungen um die x1 - bzw. x2 -Achse:
matrix R d ,ϕ aus dem obigen Lemma zu bestätigen: Wegen
⎛ ⎞ ⎛ ⎞
1 0 0 cϕ 0 −sϕ der Schiefsymmetrie von S d ist S −d = −S d = S 0 d . Ebenso
A1 = ⎝ 0 cϕ −sϕ ⎠ , A2 = ⎝ 0 1 0 ⎠ bewirkt ein Vorzeichenwechsel von ϕ, dass der schiefsym-
0 sϕ cϕ sϕ 0 cϕ metrische Summand in der Drehmatrix transponiert wird,
wodurch R d ,ϕ in R 0
d ,ϕ übergeht, also invertiert wird.
Hier wurden die Symbole für die Sinus- und Kosinusfunktion
durch s bzw. c abgekürzt. S. 265
Die verschwindende nullte Koordinate bei Vektoren bleibt
S. 263 auch nach beliebigen Linearkombinationen gleich null. Der
−1
Die Drehmatrix ist orthogonal. Daher gilt R 0
d ,ϕ = R d ,ϕ . Die Einser als nullte Koordinate für die Punkte geht bei Line-
zur Drehung durch den Winkel ϕ inverse Bewegung ist die arkombinationen in die Summe der Koeffizienten über; er
Drehung um dieselbe Achse d durch −ϕ, also in dem ent- bleibt somit genau bei den Affinkombinationen gleich 1.
Folgen – der Weg ins
Unendliche 8
Warum überholt Achilles die
Schildkröte?
Was ist ein Grenzwert?
Weshalb betrachtet man
Cauchy-Folgen?

8.1 Der Begriff einer Folge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276


8.2 Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
8.3 Häufungspunkte und Cauchy-Folgen . . . . . . . . . . . . . . . . . . . . . . 291
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
276 8 Folgen – der Weg ins Unendliche

Eine der wichtigsten Errungenschaften der Mathematik ist die Wir haben es hier mit einer Abfolge, den Aktienschlusskur-
konkrete Beschreibung des Unendlichen. Dadurch wurde un- sen, zu tun. Es ist wichtig, die Tage nacheinander zu betrach-
endlich groß und unendlich klein greifbar und mathematischen ten. Begriffe wie steigen oder fallen machen nur einen Sinn,
Aussagen zugänglich. Die Geschichte der Naturwissenschaften wenn wir die Reihenfolge der Tage einhalten. Diesen Aspekt
und Technik ist voll von Irrtümern, die man bei dem Versuch be- finden wir bei einer mathematischen Folge wieder: Irgend-
ging, Unendlichkeit zu fassen. Sie zeigen, wie komplex eigentlich welche Objekte sind in einer Reihenfolge, wir können sie
unser heutiger Begriff des „Grenzwerts“ ist. abzählen.
Folgen spielen bei der Beschreibung des Unendlichen eine Es gibt aber noch einen weiteren Aspekt: Wir haben es mit
entscheidende Rolle und sind daher eines der wichtigsten Hand- einer Liste von Kurswerten zu tun, für die kein Ende definiert
werkszeuge in der Analysis. Zahlreiche nützliche Begriffe lassen ist. Das Diagramm gibt nur einen Ausschnitt der Abfolge aller
sich mit ihrer Hilfe definieren und erklären. Andererseits sind Schlusskurse dieses Index wieder. Es gibt zwar einen Beginn,
Folgen Grundlage für ganz alltägliche Dinge geworden: Stän- nämlich der Tag, an dem der Index an der Börse eingeführt
dig werden in Taschenrechnern, MP3-Playern oder für Wetter- wurde, aber sofern der Index nicht abgeschafft wird, kommt
vorhersagen Folgenglieder berechnet. Hierbei geht es um die mit jedem Handelstag ein neuer Schlusskurs hinzu.
Gewinnung von Näherungslösungen von Gleichungen.
Die Grundlage für einen fehlerfreien Einsatz von Folgen ist
Bei einer Folge haben wir es mit unendlich
eine genaue Begriffsbildung. Dabei wird die Konvergenz von
Zahlenfolgen zunächst im Vordergrund stehen. Aber erst durch vielen Objekten zu tun
Verallgemeinerungen, wie Häufungspunkte und Cauchy-Folgen,
wird die tiefliegende Bedeutung der Konzepte, etwa bei der Natürlich kann man einwenden, dass in der Realität zu je-
Konstruktion der reellen Zahlen, deutlich. dem festen Zeitpunkt auch die Abfolge solcher Aktienkurse
oder anderer Messwerte endlich ist. Wir gelangen zu einer
mathematischen Definition einer Folge, indem wir uns über
diesen Einwand hinwegsetzen: Wir konstruieren gedanklich
8.1 Der Begriff einer Folge eine Abfolge irgendwelcher Objekte, die unendlich fortge-
setzt wird, indem wir den Objekten eine Nummerierung zu-
Um ein Verständnis für den Begriff der Folge zu erhalten, ordnen.
werden wir uns ihm behutsam nähern. Wir tun dies anhand
eines Beispiels. Definition einer Folge
Eine Folge ist eine Abbildung der natürlichen Zahlen in
eine Menge M, die jeder natürlichen Zahl n ∈ N ein
Bei einer Folge stehen Objekte in einer
Element xn ∈ M zuordnet.
Reihenfolge

In der Abbildung 8.1 sehen Sie einen Börsenchart des Aktien- Die Elemente xn werden Folgenglieder genannt und übli-
index DAX für einen Zeitraum im Herbst 2006. Der Ver- cherweise mit einem Index angegeben, obwohl es sich um
lauf der Kurve entspricht den täglichen Schlusskursen die- Bilder einer Abbildung handelt, d. h., wir schreiben xn an-
ses Index. Man sieht, wie der Aktienkurs sich geändert hat, stelle von x(n). Die gesamte Folge wird mit (xn )∞
n=1 , (xn )n∈N
wie er von Tag zu Tag steigt oder fällt. Eigentlich müss- oder, wenn es unmissverständlich ist, einfach mit (xn ) be-
ten hier diskrete, isolierte Werte eingezeichnet sein, eben die zeichnet.
Schlusskurse der entsprechenden Tage, aber aus optischen
Gründen wurden diese Werte durch Strecken verbunden, so- In diesem Kapitel werden wir es zumeist mit Zahlenfolgen
dass eine durchgehende Line entsteht. zu tun haben, bei denen jedes Folgenglied entweder eine re-
elle oder eine komplexe Zahl ist. Es ist dann M = R oder
M = C oder eine Teilmenge davon.
DAX
6500 Beispiel
6400 Die Folge (xn ) bestehend aus den positiven geraden Zah-
len bzw. aus den positiven ungeraden Zahlen ist durch
6200
xn = 2n bzw. xn = 2n − 1
6100
für n ∈ N gegeben.
6000
Okt Nov Bei der Folge (xn ) mit
' (
1 n
Abbildung 8.1 Der Indexchart des DAX, wie man ihn in einer Börsenzeitschrift xn = 1 + , n ∈ N,
findet, stellt eine Folge von Tagesschlusskursen dar. n
8.1 Der Begriff einer Folge 277

ist jedes Folgenglied xn eine positive reelle Zahl. In der Achtung: Es ist nicht unbedingt notwendig, dass die Folge
Abbildung auf Seite 281 sind die ersten 10 Folgenglieder mit dem Index 1 beginnt. Der Startindex kann durchaus 0 oder
dargestellt. eine andere beliebige ganze Zahl sein. Eine verallgemeinerte
Durch die Definition Definition ist aber nicht nötig, da mit einer Verschiebung des
!n Index der Zähler der Folgenglieder stets der ursprünglichen
xn = j Definition angepasst werden kann.
j =1
erhalten wir eine Folge von Summen, ein spezieller
Auch außerhalb der Mathematik tauchen Folgen auf. Hier ist
Fall einer Zahlenfolge. Wir wissen aus Kapitel 4 (siehe
ein Beispiel für eine Folge, mit der fast jeder täglich zu tun
Seite 124), dass diese Folge auch anders beschrieben wer-
hat.
den kann, nämlich durch
n(n + 1) Beispiel Das Referenzformat für Papiergrößen nach Norm
xn = , n ∈ N.
2 DIN 476 ist das Format A0, bei dem ein Blatt einen Flächen-
Solche Folgen von Summen sind mathematische Objekte, inhalt
√ von einem Quadratmeter und ein Seitenverhältnis von
die uns als Reihen im Kapitel 8 wieder begegnen werden. 1 : 2 besitzt. Ausgehend von diesem Format erhält man das
Die Definition einer Folge auf Seite 276 lässt auch Folgen Format An durch n-maliges Halbieren der längeren Seite des
zu, die nicht aus Zahlen bestehen. Für jedes n ∈ N erhalten vorhergehenden Formats. Eine Eigenschaft dieser Konstruk-
wir mit der Vorschrift tion ist, dass dabei das Seitenverhältnis immer gleich bleibt.
  Die Norm DIN 476 definiert also eine Folge (An)n∈N0 von
n
Gn = (x, y) ∈ R2 | y = (x − 1) Papierformaten. In der Abbildung 8.3 sind einige typische
5
Vertreter der Folgenglieder dargestellt. 
eine Gerade Gn in der Ebene, insgesamt also eine Folge
von Geraden (Gn ). Die ersten Glieder dieser Folge sind
in der Abbildung 8.2 dargestellt. Als Menge M kann hier
die Menge aller Geraden in der Ebene gewählt werden,
oder die Menge aller Geraden durch (1, 0). 

G8
4 G7
G6
G5
3
G4

G3
2
G2

1
G1

Abbildung 8.3 Ein Ausschnitt aus der Folge der Papierformate nach DIN 476,
x von der technischen Zeichnung (DIN A2) bis zur Postkarte (DIN A6).
1 2 3 4 5

Abbildung 8.2 Die ersten 8 Folgenglieder einer Folge von Geraden. Folgen können explizit oder rekursiv definiert
werden
In späteren Kapiteln spielen auch Folgen von anderen ma-
thematischen Objekten eine wichtige Rolle. So werden etwa Es gibt einen wichtigen Unterschied in der Definition zwi-
Folgen von Vektoren in einem Vektorraum oder Funktionen- schen dieser letzten Folge und denen, die uns bisher begeg-
folgen betrachtet. net sind: Bisher ließ sich für ein vorgegebenes n ∈ N das
zugehörige Folgenglied xn direkt aus der Definition bestim-
? men. Wir nennen diese Art der Definition einer Folge ex-
Machen Sie sich die Reihenfolge der Folgenglieder in den
Beispielen klar, indem Sie jeweils die ersten 5 bis 10 Folgen- plizit. Im Beispiel der Papierformate wurde das Folgenglied
glieder berechnen. für den Startindex angegeben, der Startwert, und außerdem
eine Rekursionsvorschrift, mit der ein Folgenglied xn+1 aus
278 8 Folgen – der Weg ins Unendliche

dem vorhergehenden Folgenglied xn bestimmt werden kann. Im(z)


Diese Art der Definition heißt rekursiv . Allgemeiner sind i
auch Vorschriften möglich, bei denen xn+1 aus mehreren Vor-
gängern bestimmt wird.

Beispiel Rekursiv definierte Folgen


Wir beginnen mit den Zahlen a0 = 0 und a1 = 1. Das
nächste Folgenglied soll die Summe der beiden vorherge-
henden Glieder sein. Die Rekursionsvorschrift lautet:

an+1 = an + an−1 , n ∈ N. −1 1 Re(z)

Wir erhalten so eine Folge, deren erste Glieder

0, 1, 1, 2, 3, 5, 8, 13, 21, . . .

lauten. Dies ist die Folge der Fibonacci-Zahlen, die eine


Reihe überraschender Anwendungen besitzt, die wir im −i
weiteren Verlauf kennenlernen werden. ' n−1 (
9 3
Bei einer rekursiv definierten Folge können unterschied- Abbildung 8.4 Die ersten 60 Folgenglieder der Folge 10 + 10 i in
n
liche Startwerte zu völlig anderen Folgen führen. Betrach- der komplexen Zahlenebene.
ten wir etwa die Rekursionsvorschrift
' (
1 1
an+1 = 1+ ,
2 an 1
Re(zn )
Im(zn )
so erhalten wir für den Startwert a1 = 2 eine Folge, die
mit den Gliedern
3 7 13 27 n
2, , , , , ... 10 30 50
4 6 14 26
beginnt. Dagegen erhält man mit dem Startwert a1 = 1
−1
die konstante Folge

1, 1, 1, 1, 1, . . .  ' n−1 (
9 3
Abbildung 8.5 Die ersten 60 Folgenglieder der Folge 10 + 10 i
n
? aufgespalten in Real- und Imaginärteil.

Geben Sie sowohl eine explizite als auch eine rekur-


sive Beschreibung der Folge der Potenzen von 3 an, also Achtung: Die Abbildung 8.4 enthält keine Informationen
1, 3, 9, 27, . . . Die Identität beider Darstellungen lässt sich über die Reihenfolge der Zahlen in der Folge. Für eine ein-
mit vollständiger Induktion (vergleiche Kapitel 4) einfach deutige Darstellung müssen die einzelnen Punkte mit dem
begründen – probieren Sie es aus! jeweiligen n beschriftet werden. In einigen Abbildungen im
späteren Verlauf werden wir diese Nummerierung zumindest
andeuten.
Alles bisher Gesagte trifft für Zahlenfolgen aus C genauso Für den Rest dieses Kapitels werden wir uns ausschließlich
zu wie für Folgen aus R. Bei der grafischen Darstellung ha- mit Zahlenfolgen, sowohl reellen als auch komplexen, be-
ben wir aber verschiedene Möglichkeiten. Eine davon ist, schäftigen. Andere Typen von Folgen werden uns aber in
die Folgenglieder als Punkte in der komplexen Zahlenebene späteren Kapiteln dieses Buchs noch begegnen.
darzustellen. Für die Folge (zn ) mit
' (n−1
zn =
9 3
+ i , n ∈ N,
Zwei elementare Eigenschaften:
10 10 Beschränktheit und Monotonie
ist das in Abbildung 8.4 aufgezeigt.
In der Abbildung 8.6 ist die komplexe Folge (wn ) dargestellt,
Eine zweite Möglichkeit ist, Real- und Imaginärteil der Fol- die durch
genglieder als reelle Zahlenfolgen aufzufassen und getrennt ' (
abzubilden. In der Abbildung 8.5 ist der Realteil der Folge 1 99 3 n−1
wn = + i , n ∈ N,
blau, der Imaginärteil rot dargestellt. 4 100 10
8.1 Der Begriff einer Folge 279

Im(z) Im(z)

5
i
4
3
2
1
54 Re(z)
−1 1
3
2
1 Re(z)
−1 1

−i

Abbildung 8.7 Die Folge (un ) scheint den Einheitskreis nicht zu verlassen.
−i

denn durch Weglassen des Summanden 3/(4n) wird der Nen-


ner kleiner. Die Folgenglieder un liegen also stets innerhalb
   des komplexen Einheitskreises.
1 99 3 n−1
Abbildung 8.6 Die Glieder der Folge 4 100 + 10 i n
werden mit
zunehmendem n beliebig groß (die Spirale wird gegen den Uhrzeigersinn durch- Dieses grundsätzlich unterschiedliche Verhalten der beiden
laufen). komplexen Zahlenfolgen wird sich als wichtiger Aspekt bei
unseren weiteren Untersuchungen herausstellen.
definiert ist. Zusätzlich ist der komplexe Einheitskreis einge-
zeichnet. Definition einer beschränkten Folge
Da die Abbildung C → C mit z  → az die Zusammenset- Eine reelle oder komplexe Zahlenfolge (xn ) heißt be-
zung einer Drehung um den Ursprung mit Winkel arg(a) und schränkt, falls es eine positive reelle Zahl R gibt, sodass
einer Streckung um den Faktor |a| ist, ergibt sich durch wie- |xn | ≤ R für alle n ∈ N gilt. Falls dies nicht der Fall ist,
derholte Anwendung die Spiralform, wenn |a| > 1 gilt. Die heißt die Folge unbeschränkt.
Folgenglieder verlassen ab einem gewissen Index den Ein-
heitskreis und scheinen sich auch danach immer weiter vom Anschaulich bedeutet diese Definition, dass die Folgenglie-
Ursprung zu entfernen. der einen bestimmten Kreis um die Null nicht verlassen. Im
Ganz anders die Folge (un ), die wir aus (wn ) durch die Vor- Reellen ist dies ein Intervall mit der Null als Mittelpunkt. Eine
schrift äquivalente Formulierung ist es zu sagen, dass die Menge al-
wn ler Folgenglieder beschränkt ist.
un = 3
, n ∈ N,
|wn | + 4n
Wir können die Definition auch abschwächen und gelangen
gewinnen. Ihre Folgenglieder nähern sich mit größerem n so zu spezielleren Begriffen: Eine reelle Zahlenfolge (xn )
der grauen Einheitskreislinie immer mehr an. Anscheinend heißt nach unten bzw. nach oben beschränkt, falls es eine
verlassen sie den Kreis aber nicht (siehe Abbildung 8.7). Zahl m bzw. M gibt mit
Wir können uns schnell davon überzeugen, dass unsere Ver-
mutungen über das Verhalten dieser beiden Folgen richtig m ≤ xn bzw. xn ≤ M
sind. Mit der Bernoulli-Ungleichung (siehe Seite 285) gilt:
für alle n ∈ N. Die Zahl m heißt untere Schranke, die Zahl
⎛1 ⎞n−1 1
' ( M heißt obere Schranke der Folge.
1 ⎝ 992 + 302 ⎠ 1 10 701 n−1
|wn | = =
4 1002 4 10 000
Beispiel
. Wir betrachten die reelle Folge (xn ) mit
1 701
≥ 1 + (n − 1) .
4 10 000
2n2 − 2n + 1
Der Betrag von wn wird mit zunehmendem n beliebig groß. xn = , n ∈ N.
n2 − n + 1
Für (un ) gilt dagegen
Den Nenner kann man auch als (n−1/2)2 +3/4 schreiben,
|wn | |wn |
|un | = ≤ = 1, den Zähler als n2 + (n − 1)2 . Beide sind also stets positiv.
|wn | + 3
4n
|wn | Damit haben wir die untere Schranke 0 gefunden.
280 8 Folgen – der Weg ins Unendliche

Um eine obere Schranke zu finden, addieren wir null in Allgemein sind arithmetische Folgen, d. h. Folgen, die
der Form 1 − 1 im Zähler und können dann kürzen: gegeben sind durch
2n2 − 2n + 2 1 an = a0 + nd, n ∈ N,
xn = − 2
n2 − n + 1 n −n+1
1 mit Startwert a0 ∈ R, für d > 0 streng monoton wachsend
=2− 2 ≤ 2.
n −n+1 und für d < 0 streng monoton fallend.
Die Folge ist durch 2 nach oben beschränkt. Die Folge (bn ) mit
Bei der rekursiv definierten Folge (yn ) mit 1
bn = 1 + , n ∈ N,
1 1 n
y1 = , yn+1 = , n ∈ N,
2 2 − yn
ist streng monoton fallend, denn
muss vollständige Induktion angewandt werden, um die
Beschränktheit nachzuweisen. Wir berechnen die ersten 1 1 1
bn+1 − bn = − =− < 0.
Folgenglieder, n+1 n n(n + 1)

1 2 3 4 Diese Folge ist in Abbildung 8.8 dargestellt.


, , , ,...,
2 3 4 5
bn
und vermuten 0 < yn < 1 für alle n ∈ N. Da y1 in diesem
Intervall liegt, ist der Induktionsanfang schon gemacht. 2
Für den Induktionsschritt nehmen wir an, dass für ein n ∈
N gilt: 0 < yn < 1. Dann ist
1
2 − yn > 2 − 1 = 1.

Damit folgt:
n
5 10 15 20
1 1  
yn+1 = < = 1. Abbildung 8.8 Die ersten 20 Glieder der monoton fallenden Folge 1 + n1 .
2 − yn 1 n

Andererseits ist auch 2 − yn > 0 und damit yn+1 >


0. Somit ist die Induktionsbehauptung gezeigt. Es folgt Die Folge (cn ) mit
0 < yn < 1 für alle n ∈ N. 
(−1)n
cn = 1 + , n ∈ N,
Mit der Ordnungsrelation bei reellen Zahlen ergibt sich eine n
weitere wichtige Eigenschaft, die wir deswegen aber nur für ist weder monoton fallend noch monoton wachsend. Dafür
reelle Zahlenfolgen definieren können. müssen wir nur die ersten drei Folgenglieder betrachten,
denn es ist
Definition monotoner Folgen
1 3
Eine reelle Zahlenfolge (xn ) heißt monoton wachsend, c2 − c1 = 1 + −1+1= >0
2 2
falls xn+1 ≥ xn für alle n ∈ N ist. Falls xn+1 ≤ xn für
alle n ∈ N gilt, so heißt die Folge monoton fallend. und
1 1 5
c3 − c 2 = 1 − − 1 − = − < 0.
Ist bei diesen Ungleichungen die Gleichheit ausgeschlossen, 3 2 6
sprechen wir von streng monoton wachsenden oder streng Diese Folge sehen Sie in Abbildung 8.9.
monoton fallenden Folgen.
cn
Die Monotonie einer Folge überprüft man, indem man die
Differenz zweier aufeinanderfolgender Folgenglieder be- 2
trachtet, oder aber, falls die Folge nur positive oder nur ne-
gative Glieder besitzt, den Quotienten. Sehen wir uns einige
1
Beispiele an.

Beispiel
Die Folgen der geraden Zahlen (2n)∞ n=1 und der ungeraden n
5 10 15 20
Zahlen (2n − 1)∞ sind streng monoton wachsend, denn 
n=1 n
hier ist die Differenz zweier aufeinanderfolgender Glieder Abbildung 8.9 Die ersten 20 Glieder der Folge 1 + (−1)
n , die nicht
n
stets 2. monoton ist.
8.1 Der Begriff einer Folge 281

Beispiel: Zeigen Sie, dass eine Folge beschränkt ist


Für die Folge (xn ) mit '(
1 n
xn = 1 +
n
soll nachgewiesen werden, dass sie durch 1 nach unten und durch 3 nach oben beschränkt ist.

Problemanalyse und Strategie: Die einzelnen Folgenglieder werden untersucht. Durch Anwendung bekannter ele-
mentarer Ungleichungen wollen wir zeigen, dass die Schranken gelten.
' (
Lösung: n 1 1 n(n − 1)(n − 2) · · · (n − k + 1)
=
Da 1 + 1/n > 1 ist für n ∈ N, ist auch ·
· · n
k n k k! n
' (
1 n k mal
xn = 1 + > 1. können wir weiter abschätzen: Im rechten Bruch stehen im
n
Zähler und Nenner je k Faktoren, wobei die Faktoren im
Somit ist gezeigt, dass 1 eine untere Schranke ist.
Zähler kleiner oder gleich denen im Nenner sind. Daher ist
der rechte Bruch insgesamt kleiner oder gleich 1. Es folgt
xn
mit der geometrischen Summenformel (siehe Seite 129):
3
!n
1
2 xn ≤ 1 +
k!
1 k=1
!
n
1
2 4 6 8 10
n ≤1+
2k−1
k=1
!'
n−1
1
(k
Mit der binomischen Formel (vergleiche Seite 291) erhal- =1+
ten wir 2
k=0
' (  n
1 n 1
xn = 1 + 1− 2
n =1+
! n(
n ' ' (k
1
1 − 21
= 1n−k ' ' (n (
k n 1
k=0 =1+2 1−
!n ' ( 2
n 1
=1+ . ≤ 3.
k nk
k=1 Damit haben wir auch bewiesen, dass 3 eine obere
Die Terme in der Summe Schranke ist.

Kommentar: Die Zahlen 1 und 3 sind keineswegs die größte obere bzw. die kleinste untere Schranke für die Folge. Dies
ist aber für die Tatsache, dass die Folge beschränkt ist, überhaupt nicht wichtig.
Die ersten paar Folgenglieder sind in der Abbildung dargestellt. Die Vermutung liegt nahe, dass die kleinste obere
Schranke für die Folge (xn ) irgendwo bei 2.7 liegt. Tatsächlich werden wir später beweisen können, dass die kleinst-
mögliche obere Schranke eine irrationale Zahl ist, deren erste Stellen so aussehen:

2.718 281 828 459 05 . . .

Diese Zahl, die Euler’sche Zahl genannt und mit e bezeichnet wird, wird noch eine große Rolle spielen.

Bei der Folge (dn ) mit dn+1 (n + 1)2 − 1 n2 + 1


= ·
dn (n + 1)2 + 1 n2 − 1
n2 − 1
dn = , n ∈ N, (n2 + 2n) (n2 + 1)
n2 + 1 = 2
(n + 2n + 2) (n2 − 1)
bietet es sich an, den Quotienten der Glieder zu betrachten. n4 + 2n3 + n2 + 2n
Es folgt für n ≥ 2: = 4
n + 2n3 + n2 − 2n − 2
4n + 2
=1+ 4 ≥ 1.
n + 2n3 + n2 − 2n − 2
282 8 Folgen – der Weg ins Unendliche

Hintergrund und Ausblick: Die Mandelbrotmenge


. . . oder wie man mit einer einfachen Formel Kunst erzeugt

Vielleicht haben Sie das folgende Bild oder eine Variante Iterationen entspricht. Im zweiten Fall nimmt man an, dass
davon schon einmal gesehen: die Folge beschränkt bleibt. Der Bildpunkt wird schwarz
eingefärbt. Alle farbigen Punkte liegen also außerhalb der
Mandelbrotmenge.
Die Mandelbrotmenge ist ein Beispiel für ein Fraktal. Sie
ist eine Menge, die selbst wieder verkleinerte, sich selbst
ähnliche Kopien enthält. Ein Beispiel ist die Abbildung
links unten, die einen Ausschnitt aus der Spitze links in
der ersten Abbildung zeigt. Auch in den 4 kleineren Ab-
bildungen finden Sie zahlreiche, einander ähnliche Struk-
turen. Beim Betrachten eines Ausschnitts kann man auch
nicht entscheiden, welche Vergrößerung vorliegt, da die
Strukturen sich auf jeder Skala ähneln.
Das Bild ist eine Visualisierung der sogenannten Mandel-
brotmenge (nach dem französischen Mathematiker Benoît
Mandelbrot), die etwas mit komplexen Zahlenfolgen zu
tun hat. Dazu betrachtet man die Folge (zn ) mit
2
z0 = 0, zn = zn−1 + c, n ∈ N,
für verschiedene Werte c ∈ C. Es stellt sich die Frage, (i) (iii)
für welche Parameter c diese Folge beschränkt bleibt. Die
Menge dieser Parameter ist die Mandelbrotmenge.
Es lässt sich zeigen, dass die Folge auf jeden Fall dann
unbeschränkt ist, wenn für ein n0 ∈ N die beiden Bedin-
gungen |zn0 | > 2 und |zn0 | ≥ |c| erfüllt sind. In diesem Fall
gilt nämlich |zn0 +m | ≥ q m, |zn0 | mit einer reellen Zahl (ii) (iv)
q > 1. Die Mandelbrotmenge erreichte in den 80er Jahren des
Eine weitere Überlegung ist, dass im Fall |c| > 2 schon 20. Jahrhunderts einen für ein mathematisches Thema
für n0 = 1 beide Bedingungen erfüllt sind. Daher ist die seltenen Bekanntheitsgrad. Die Ästhetik der Bilder fas-
Bedingung |zn0 | > 2 allein bereits hinreichend, damit die zinierte ein breites Publikum. Ein zusätzlicher Fak-
Folge unbeschränkt ist. tor war die zunehmende Verbreitung von Heimcom-
putern, durch die jeder Interessierte selbst Bilder be-
rechnen konnte. Die Abbildungen auf dieser Seite wur-
den mit dem Programm xaos (http://wmi.math.u-
szeged.hu/xaos/) erzeugt. Ein Bildausschnitt wird in
diesem Programm durch den Mittelpunkt und einen Ra-
dius festgelegt. Für die Abbildungen auf dieser Seite wur-
den die folgenden Koordinaten gewählt:

Abbildung Mittelpunkt Radius


links, oben −0,55 2,5
links, unten −1,76 0,063
rechts, (i) −0,651 30−0,492 638i 0,002 140 05
Um die Bilder auf dieser Seite zu erzeugen, macht man rechts, (ii) −0,747−0,0887i 0,0046
sich diese Tatsache zu nutze. Man legt einen Fluchtradius rechts, (iii) −0,058 197 6−0,984 697i 4,466 45 · 10−5
rechts, (iv) −1,479 01−0,010 740 1i 0,001 185 96
fest, der größer als 2 sein muss. Dann berechnet man für
Fluchtradius: 4 max. Iterationen: 170
ein festes c so lange Folgenglieder, bis der Betrag von zn
den Fluchtradius übersteigt oder aber eine vorher festge- Literatur
legte Maximalzahl von Iterationen erreicht ist. Im ersten 1. B. Mandelbrot: Die Fraktale Geometrie der Natur.
Fall weiß man, dass die Folge unbeschränkt ist. Der Bild- Birkhäuser, 1991.
punkt, der dem Parameter c in der komplexen Ebene ent- 2. H.-O. Peitgen, P. H. Richter: The Beauty of Fractals,
spricht, erhält eine Farbe, die der Anzahl der benötigten Springer, 1986.
8.2 Konvergenz 283

Die Ungleichung am Schluss gilt, da im Bruch sowohl vergangen. Hier haben wir die geometrische Summenformel
Zähler als auch Nenner positiv sind. Dass der Nenner po- angewandt!
sitiv ist, erkennt man an der faktorisierten Darstellung aus
der 2. Zeile. Nun löst sich die scheinbare Paradoxie auf. Keine der Mes-
Es gilt also dn+1 ≥ dn für n ≥ 2. Da auch d2 = 3/5 > 0 sung findet später als Tmax = 43 statt. Es ist also nicht so, dass
= d1 ist, wächst die Folge monoton.  Achilles die Schildkröte niemals einholt, sondern er holt sie
nicht innerhalb der ersten 43 Minuten des Experiments ein.
Tatsächlich werden wir später sehen, dass der Zeitpunkt, an
dem die beiden gleichauf sind, eben genau Tmax ist.
8.2 Konvergenz
Viele Generationen von Philosophen rätselten über dieses
Vom Philosophen Zenon von Elea (ca. 450 v. Chr.) ist das oder ähnliche scheinbare Paradoxa. Für uns ist es eine schöne
berühmte Paradoxon von Achilles und der Schildkröte über- Illustration der wichtigsten Frage im Zusammenhang mit
liefert. Folgen: Was passiert mit den Folgengliedern, wenn wir den
Index n ∈ N immer größer werden lassen? Beim Beispiel von
Zenon behauptet, dass bei einem Wettrennen zwischen Achil- Achilles und der Schildkröte kommt es zu einer Häufung der
les und einer Schildkröte Achilles die Schildkröte nie ein- Zeitpunkte und der Positionen der beiden Protagonisten. Wir
holen wird, wenn die Schildkröte zu Anfang einen Vorsprung werden den Begriff der Konvergenz dafür einführen.
bekommt. Sein Argument ist bestechend: Achilles muss nach
dem Start zunächst den Punkt erreichen, an dem die Schild- Um die Notwendigkeit der formalen Definition zu unterstrei-
kröte gestartet ist. In der Zwischenzeit ist die Schildkröte aber chen, möchten wir betonen, dass eine reine Betrachtung der
weitergekrochen. Wenn Achilles nun diesen Punkt erreicht, numerischen Folgenglieder unzureichend ist. Als Beispiel
ist die Schildkröte wieder ein Stück voraus, usw. betrachten wir die beiden Folgen (xn ) und (yn ) mit
Warum überholt Achilles aber doch die Schildkröte, wenn
das Wettrennen wirklich stattfindet? Versuchen wir das Ren- !
n
1 !
n
1
xn = und yn = für n ∈ N.
nen formal durch Folgen zu erfassen: Nehmen wir an, der j j 1,01
j =1 j =1
Vorsprung ist 1 A lang, wobei diese Längeneinheit gerade
die Strecke sein soll, die Achilles pro Zeiteinheit, sagen wir
pro Minute, zurücklegt. Also hat Achilles die Geschwindig- Dezimaldarstellungen einiger Folgenglieder auf 6 Nachkom-
keit 1 A/min . Wenn Achilles nun viermal so schnell ist mastellen gerundet sind:
wie die Schildkröte, dann ist der Abstand zwischen Achil-
les und der Schildkröte bei jedem Betrachtungspunkt  in Ze- n xn yn
n
1
nons Gedanken durch die Folge (dn ) mit dn = > 0 4 1 1,000 000 1,000 000
für alle n ∈ Z≥0 gegeben. Da dn stets positiv bleibt, holt 2 1,500 000 1,496 546
Achilles die Schildkröte während des Experiments nicht 3 1,833 333 1,826 238
ein. .. .. ..
. . .
1 000 7,485 471 7,252 980
2 000 8,178 368 7,897 391
3 000 8,583 749 8,272 340

Dieses Ergebnis ist wenig aufschlussreich. Numerisch ist


kein qualitativer Unterschied zwischen beiden Folgen sicht-
A B C D bar. Allerdings ist die Folge (yn ) im Sinne der gleich folgen-
den Definition konvergent, die Folge (xn ) ist es nicht! Der
Abbildung 8.10 In der Zeit, in der Achilles von A nach B läuft, kriecht die Nachweis wird im Kapitel 9 erbracht werden.
Schildkröte von B nach C. Erreicht der Held aber C, ist die Schildkröte schon bei
D. Holt er sie niemals ein?

Ein Hilfsmittel für die Definition der Begriffe Konvergenz


Die scheinbare Paradoxie entsteht dadurch, dass wir die Zeit und Grenzwert sind Mengen der Form
nicht berücksichtigt haben. Die Messungen von Zenon finden
zu den Zeitpunkten t1 = 1, t2 = t1 + 1/4, t3 = t2 + 1/16,
. . . statt, d. h., nach der n-ten Messung ist die Gesamtzeit {y | |y − x| < ε}
 n+1 
n ' (j
! 1− 1 ' (n+1  für festes x ∈ R (oder ∈ C) und festes ε > 0. Die Menge der
1 4 4 1
Tn = = 1
= 1− so definierten y ∈ R (oder ∈ C) nennt man ε-Umgebung um
j =0
4 1− 4
3 4
x. Beispiele sind in der Abbildung 8.11 dargestellt.
284 8 Folgen – der Weg ins Unendliche

Beispiel: Monotonie bei rekursiv definierten Folgen


Untersuchen Sie die Folgen (xn )∞ ∞
n=0 bzw. (yn )n=0 mit
1 2 1
x0 = , xn = 2xn−1 − xn−1 bzw. y0 = 0, yn = , n ∈ N,
2 2 − yn−1
auf Monotonie.
Problemanalyse und Strategie: Fast immer muss man bei rekursiv definierten Folgen die Beschränktheit ausnutzen,
um Monotonie nachzuweisen. Wir werden also zunächst die Folgen auf Beschränktheit untersuchen und dann die
Monotonie nachweisen, indem wir Differenz bzw. Quotient aufeinanderfolgender Folgenglieder ansehen.

Lösung: Nun zur Folge (yn ). Wir betrachten die Differenz zweier
Eine obere Schranke für die Folge (xn ) erhält man mit Folgenglieder:
quadratischer Ergänzung, 1
yn − yn−1 = − yn−1
xn+1 = 2xn − xn2 2 − yn−1
= 1 − (1 − 2xn + xn2 ) 1 − 2yn−1 + yn−1
2
=
= 1 − (1 − xn )2 2 − yn−1
(1 − yn−1 )2
< 1, = .
2 − yn−1
da das Quadrat positiv ist, und es von 1 abgezogen wird.
Da auch x1 = 1/2 < 1 ist, ist xn < 1 für alle n ∈ N. Das Quadrat im Zähler ist immer positiv. Somit wächst
Außerdem sind alle xn > 0. Dies zeigen wir durch voll- die Folge streng monoton, falls 2 − yn−1 > 0, d. h., falls
ständige Induktion: Der Induktionsanfang ist die Aussage yn−1 < 2 ist, sie fällt streng monoton, falls yn−1 > 2
x0 = 1/2 > 0. Nun zum Induktionsschritt: Wir wissen, gilt. Auch hier ist eine Schranke für die Folgenglieder yn
dass xn ≤ 1 ist, also auch 2 − xn > 0. Aus der Induktions- entscheidend.
annahme xn > 0 folgt nun Wir wollen sogar zeigen, dass yn < 1 für alle n ∈ N gilt.
Dies beweisen wir durch vollständige Induktion. Den In-
xn+1 = 2xn − xn2 = xn (2 − xn ) > 0, duktionsanfang bildet die Aussage für n = 0, und diese
denn beide Faktoren sind positiv. Also ist xn > 0 für alle ist laut Voraussetzung erfüllt: y0 = 0 < 1.
n ≥ 0. Für den Induktionsschritt gelte für ein n ∈ N, dass
Nun können wir den Quotienten der Folgenglieder be- yn−1 < 1 ist. Dann folgt:
trachten: 1
2 − yn−1 > 1, also yn = < 1.
xn+1 xn <1 2 − yn−1
= 2 − xn > 2 − 1 = 1.
xn Damit ist insgesamt gezeigt: yn < 1 für alle n ∈ N. Mit
Also ist xn+1 > xn , die Folge ist streng monoton wach- der Überlegung oben erhalten wir die Aussage, dass die
send. Folge streng monoton wachsend ist.

Die Betonung bei dieser Definition liegt auf „jeder“ Zahl


Im(z)
ε > 0. Dies beinhaltet insbesondere jede noch so kleine po-
sitive Zahl, was letztendlich die Bedeutung der Definition
x x ausmacht. Für den Fall einer reellen Zahlenfolge können wir
x−ε x+ε y überall R statt C schreiben. In der Definition können wir
das Kleinerzeichen auch ohne Weiteres durch „kleiner oder
Re(z) gleich“ ersetzen, da die Bedingung für alle ε > 0 gelten soll.
Beide Varianten werden wir im Folgenden verwenden.
Abbildung 8.11 ε-Umgebungen im Reellen und Komplexen.
In dem Fall, dass eine Folge (xn ) einen Grenzwert x besitzt,
schreiben wir
Definition des Grenzwerts einer Folge
lim xn = x oder xn → x (n → ∞) .
Eine Zahl x ∈ C heißt Grenzwert einer Folge (xn )∞ n=1 n→∞
in C, wenn es zu jeder Zahl ε > 0 eine natürliche Zahl n→∞
N ∈ N gibt, sodass Auch andere Schreibweisen, wie zum Beispiel xn −→ x,
sind in der Literatur zu finden.
|xn − x| < ε für alle n ≥ N
gilt. Eine Folge (xn ) in C, die einen Grenzwert hat, heißt Anschaulich können wir den Begriff des Grenzwerts auch so
konvergent, andernfalls heißt die Folge divergent. interpretieren: Bei einer konvergenten Folge liegen in jeder
ε-Umgebung um den Grenzwert fast alle Folgenglieder. Nur
8.2 Konvergenz 285

endlich viele liegen außerhalb. In der Abbildung 8.12 ist dies d. h., die Folge (xn ) ist eine Nullfolge. Wegen der archime-
n
zum Beispiel für die Folge (xn ) mit xn = 1 + (−1) n veran- dischen Eigenschaft von R (siehe den Satz auf Seite 123)
schaulicht. Man kann auch sagen: Ab einem gewissen N lie- können wir zu ε > 0 eine Zahl N ∈ N wählen mit
1
gen alle Folgenglieder innerhalb der ε-Umgebung. Dies gilt N > εq/p . So folgt für alle n ≥ N :
offensichtlich für eine konstante Folge (xn ) mit xn = a ∈ C
1 1
für alle n ∈ N. Somit sind konstante Folgen konvergent. |xn − 0| = |xn | = ≤ < ε.
np/q N p/q
xn Für die erste Abschätzung, haben wir verwendet, dass mit
x > y > 0 auch x r > y r für alle r ∈ Q>0 gilt. Dies
2
ergibt sich als Anwendung der verallgemeinerten dritten
binomischen Formel
1 !
m−1
x m − y m = (x − y) x j y p−j −1 , m ∈ N.
j =0

n Übrigens: im Fall r = 1, d. h. xn = n1 , wird (xn ) als die


5 10 15 20 harmonische Folge bezeichnet. Sie ist der Prototyp einer
Abbildung 8.12 Ab n = 5 liegen alle Folgenglieder in der Umgebung um den Nullfolge.
Grenzwert mit ε = 0.25.
Sei q ∈ C mit |q| < 1. Dann ist die geometrische Folge
(xn ) mit
xn = q n , n ∈ N
Eine Folge besitzt höchstens einen Grenzwert
eine Nullfolge. Um dies zu beweisen, erinnern wir uns an
Diese Beschreibung und auch die Notation für einen Grenz- die Bernoulli-Ungleichung
wert sind aufgrund des folgenden Hilfssatzes sinnvoll. (1 + h)n ≥ 1 + nh für n ∈ N und h > −1 .
1−|q|
Lemma Mit h = |q| > 0 lässt sich
Eine Folge aus C besitzt höchstens einen Grenzwert. ' (n
1 1
=
|q |
n |q|
Beweis: Nehmen wir an, a und b seien beides Grenzwerte ' ( ' (
ein und derselben Folge (xn ), so gibt es nach der Definition 1 − |q| n 1 − |q|
= 1+ ≥1+n
zu ε > 0 eine natürliche Zahl N ∈ N mit |xn − a| < ε und |q| |q|
|xn − b| < ε für alle n ≥ N. Es folgt mit der Dreiecksun- abschätzen. Bilden wir den Kehrwert, so folgt:
gleichung
1
|q n − 0| ≤  
1−|q|
|a − b| = |a − xn + xn − b| 1+n |q|
≤ |a − xn | + |xn − b| < 2ε für n ≥ N . |q| |q|
= ≤ ,
|q| + n(1 − |q|) n (1 − |q|)
Da dies für jede beliebige Zahl ε > 0 gilt, muss die Identität
a = b für die Grenzwerte gelten (siehe das Fundamental- da wir bei der letzten Abschätzung den Nenner durch Weg-
lemma auf Seite 110). 
lassen des Summanden |q| verkleinert haben. Mit dieser
Ungleichung können wir zu einem Wert ε > 0 eine ent-
|q|
sprechende Zahl N ∈ N mit N > ε(1−|q|) angeben, sodass
Kommentar: Beachten Sie die Vorgehensweise bei der
Abschätzung. Um die Dreiecksungleichung sinnvoll nutzen |q| 1 |q| 1
|q n − 0| ≤ ≤ <ε
zu können, wird 0 = −xn + xn eingefügt. Der Trick, „0“ zu 1 − |q| n 1 − |q| N
addieren, hilft häufig bei Abschätzungen weiter. Daher ist es für alle n ≥ N gilt. Also ist (xn ) eine konvergente Folge
empfehlenswert, sich dieses beweistechnische Werkzeug zu mit Grenzwert x = 0. 
merken.
Folgen, die den Grenzwert x = 0 haben, heißen Nullfolgen. ?
Falls eine Folge (xn ) konvergent ist, bildet dann die Folge
Wir betrachten zwei Beispiele.
der Differenzen (xn+1 − xn ) eine Nullfolge?

Beispiel Der Zusammenhang zwischen dem Konvergenzbegriff und


Sei pq ∈ Q eine positive rationale Zahl mit p, q ∈ N. Dann den Eigenschaften von Folgen aus dem vorherigen Abschnitt
gilt: kann uns oft weiterhelfen. Wir beginnen damit, einen Zusam-
' (p
1 q menhang zwischen Konvergenz und Beschränktheit herzulei-
xn = → 0, für n → ∞ ,
n ten.
286 8 Folgen – der Weg ins Unendliche

Jede konvergente Folge ist beschränkt Im(z)


|q| = 0,975

Wir betrachten eine Folge (xn ) in C mit Grenzwert x ∈ C. i |q| = 1


Mit der Dreiecksungleichung folgt zunächst: |q| = 1,025
|xn | = |xn − x + x| ≤ |xn − x| + |x| . x0 = q 0

Wegen der Konvergenz von (xn ) gibt es insbesondere eine


natürliche Zahl N , sodass |xn − x| ≤ 1 für alle n ≥ N ist. −1 1 2
Re(z)
Wir erhalten die Abschätzung
|xn | ≤ 1 + |x| für n ≥ N .
Insgesamt ist somit die Folge beschränkt mit −i

|xn | ≤ max{|x1 |, |x2 |, . . . , |xN −1 |, 1 + |x|}


für alle n ∈ N. Diese Überlegung zeigt die folgende Aussage:

Lemma
Abbildung 8.13 Die geometrische Folge (q n ) für verschiedene Werte für q.
Jede konvergente Folge ist beschränkt. Die Glieder werden jeweils gegen den Uhrzeigersinn durchlaufen, das erste
Folgenglied q 0 = 1 ist für alle drei Folgen gleich.
?
Suchen Sie ein Beispiel für eine divergente Folge, die be-
schränkt ist. Majoranten helfen bei Konvergenzbeweisen

Sehen wir uns noch einmal an, was wir im Beispiel auf
Häufig wird die Umkehrung dieser Aussage genutzt, um die Seite 285 gemacht haben. Wir haben versucht den Ausdruck
Divergenz einer Folge zu belegen: Jede unbeschränkte Folge |xn −x| abzuschätzen gegen einen Term, bei dem wir leichter
ist divergent. Betrachten wir zum Beispiel die Folge (q n )∞
n=0 die Konvergenz sehen. Im Beispiel war das die uns bekannte
mit einer komplexen Zahl q mit |q| > 1. Da Nullfolge ( n1 )∞
n=1 .
|q n | = |q|n Allgemein gilt, falls wir für eine Nullfolge (yn ) die Abschät-
unbeschränkt ist, ist die Folge divergent. zung |xn − x| ≤ |yn | gefunden haben, so lässt sich zu ε > 0
ein N ∈ N angeben mit |yn | < ε für alle n ≥ N. Es folgt
Die geometrische Folge (q n )∞ n=0 haben wir für den Fall |xn − x| < ε für n ≥ N . Diese Überlegung halten wir fest,
|q| < 1 und für |q| > 1 betrachtet. Im ersten Fall ist sie damit wir uns in Zukunft die explizite Konstruktion von N
konvergent, im zweiten Fall divergent. Es bleibt noch der in Abhängigkeit von ε sparen können.
Fall |q| = 1 zu klären. Für q = 1 ist xn = 1 konstant für alle
n ∈ N, insbesondere auch konvergent.
Majorantenkriterium
Für alle anderen q auf dem komplexen Einheitskreis müssen
wir anders argumentieren. Es ist Wenn es zu einer Folge (xn ) in C eine Nullfolge (yn )
und einen Wert x ∈ C gibt, sodass
q n+1 − q n = q n (q − 1).
|xn − x| ≤ |yn | für n ≥ N ∈ N
Daher gilt auch:
|q n+1 − q n | = |q|n |q − 1| = |q − 1|. gilt, dann konvergiert die Folge (xn ) gegen den Grenz-
wert x.
Die Differenzen aufeinanderfolgender Glieder bilden also
keine Nullfolgen, daher ist (q n ) divergent. Zum Beispiel er-  
1
hält man für q = −1 die alternierende Folge Beispiel Wir wollen zeigen, dass die Folge 1 + n+1
den Grenzwert 1 besitzt. Es gilt die Abschätzung
+1, −1, +1, −1, +1, . . . ,
) )
) )
für q = i die Folge )1 + 1 − 1) = 1 ≤ 1 .
) n+1 ) n+1 n
+1, +i, −1, −i, +1, . . .
Da (1/n) eine Nullfolge ist, folgt mit dem Majorantenkrite-
Die Abbildung 8.13 illustriert dies für rium die Behauptung. 
 π π
q = r cos + i sin
16 16 Das Majorantenkriterium soll nun für den Nachweis der
mit r ∈ {0, 975 , 1 , 1, 025}. Konvergenz einer wichtigen Folge verwendet werden.
8.2 Konvergenz 287

Die Fakultät strebt schneller gegen Unendlich (zn ) durch zn = xn + yn definieren. Ist diese auch konver-
als die Potenzen einer Zahl gent? Falls ja, was ist ihr Grenzwert?
Es ist zu vermuten, dass der Grenzwert z = x + y ist. Dies
Wir wollen zeigen, dass für jedes q ∈ C gilt:
ist in der Tat so, denn mit der Dreiecksungleichung folgt:
qn
lim = 0.
n→∞ n! |z − zn | = |x + y − xn − yn | ≤ |x − xn | + |y − yn |.
Dies bedeutet, dass die Fakultät, n!, mit n schneller anwächst
als die geometrische Folge q n . Wir wählen dazu ein N ∈ N Die rechte Seite strebt gegen null und daher folgt mit dem
mit Majorantenkriterium die gewünschte Aussage. Griffig lässt
|q| 1 sie sich übrigens als
≤ .
N 2
Dann gilt für alle n ∈ N mit n ≥ N die Ungleichungskette lim (xn + yn ) = lim xn + lim yn
n→∞ n→∞ n→∞
|q|n |q| |q|n−1
1 |q|n−1
= · ≤ · formulieren.
n! n (n − 1)! 2 (n − 1)!
' (n−N
1 |q|N Auch die anderen üblichen Rechenregeln lassen sich auf
≤ ··· ≤ .
2 N! Grenzwerte konvergenter Folgen übertragen. Die wichtigsten
Regeln sind hier zusammengestellt (siehe auch die Übersicht
Anders geschrieben haben wir
' (n auf Seite 290).
|q|n |2q|N 1

n! N! 2
Rechenregeln bei konvergenten Folgen
erhalten. Die geometrische Folge ((1/2)n ) ist eine Nullfolge,
Sind x und y die Grenzwerte konvergenter Folgen (xn )
der positive konstante Faktor davor ändert daran nichts. Das
und (yn ) in C, und sind λ ∈ C eine komplexe und
Majorantenkriterium liefert die Konvergenz lim q n /n! = 0.
n→∞ p, q ∈ N natürliche Zahlen, so existieren die folgenden
Grenzwerte, und es gilt:
xn
lim (λxn ) = λx,
n→∞
10 q=2
lim (xn + yn ) = x + y,
q=3 n→∞

q=4 lim (xn − yn ) = x − y,


n→∞
5
lim (xn yn ) = x y,
n→∞
xn x
lim = , wenn y = 0,
n n→∞ yn y
5 10 15
p p
Abbildung 8.14 Die ersten 15 Glieder der Folge (q n /n!)n für verschiedene lim xnq = x q .
n→∞
Werte von q.

Die Abbildung 8.14 zeigt das Verhalten der Folge (q n /n!) für
verschiedene Werte von q. Man sieht, dass q n /n! durchaus Beweis: Die Aussagen lassen sich stets als Folgerungen
große Werte annehmen kann. Konvergenz sagt nur etwas aus aus dem Majorantenkriterium auffassen. Wir führen hier ne-
über das Verhalten für große n. ben der oben hergeleiteten Summe noch den Beweis für den
Die Rechnung oben zeigt, wie umständlich es sein kann, auf Grenzwert des Quotienten zweier Folgen und für die q-te
diese Weise die Konvergenz einzelner Folgen nachzuwei- Wurzel auf. Die anderen Beweise funktionieren ganz analog
sen. Wir wollen uns nach Rechenregeln umsehen, die es ein- und sollten vom Leser nachvollzogen werden (siehe Auf-
facher machen, Grenzwerte zu bestimmen. Dabei wird aber gabe 8.16).
das Majorantenkriterium unser wichtigstes Werkzeug blei- Betrachten wir die Folge (zn ) mit zn = xn /yn . Wenn der
ben. Grenzwert y = 0 ist, so gibt es ein N ∈ N mit |yn −y| ≤ 21 |y|
für alle n ≥ N, und es folgt mit der Dreiecksungleichung
Mit Grenzwerten lässt sich fast wie mit Zahlen 1
rechnen |yn | = |y − (y − yn )| ≥ |y| − |yn − y| ≥ |y|
2

Betrachten wir zwei konvergente Folgen (xn ) bzw. (yn ) mit für alle n ≥ N . Insbesondere sind die Folgenglieder yn = 0
Grenzwerten x bzw. y. Damit können wir eine weitere Folge für n ≥ N , und zumindest ab n ≥ N ist zn wohldefiniert.
288 8 Folgen – der Weg ins Unendliche

Beispiel: Grenzwerte mit n-ten Wurzeln


√ √ √
Zeigen Sie, dass die Folgen ( n a) für a > 0 und ( n n) jeweils gegen 1 konvergieren, die Folge ( n n!) aber divergiert.

Problemanalyse und Strategie: Es soll jeweils das Majorantenkriterium angewandt werden. Will man die Konvergenz
zeigen, muss die Differenz von Folgenglied und vermutetem Grenzwert durch eine Nullfolge nach oben abgeschätzt
werden. Bei der Divergenz werden wir versuchen zu zeigen, dass die Folge unbeschränkt ist.

Lösung: Wir kommen nun zur zweiten Folge, setzen also xn =


√ √
Wir betrachten zunächst xn = n a. Dann ist auf jeden Fall n
n − 1 für n ∈ N. Dann gilt xn ≥ 0, und es ergibt sich
xn > 0. Mit der Bernoulli-Ungleichung gilt: mit der binomischen Formel

a = xnn = (1 + xn − 1)n ≥ 1 + n(xn − 1) . n ' (


!
 n j
>−1
n = (xn + 1)n = xn .
j
j =0
Nehmen wir zunächst an, dass a ≥ 1 gilt. Dann ist auch

xn = n a ≥ 1, und aus der Ungleichung oben folgt: In der Summe rechts sind alle Summanden positiv. Wenn
a−1 wir einige weglassen, wird die Summe kleiner. Wir be-
|xn − 1| = xn − 1 ≤ →0 (n → ∞) . trachten n ≥ 2 und lassen sogar alle Glieder bis auf das
n
erste und dritte aus, also
Also ist nach dem Majorantenkriterium lim xn = 1.
n ' ( ' (
n→∞
Nun bleibt noch der Fall 0 < a < 1 zu untersuchen. Hier ! n j n 2
gilt 0 < xn < 1. Wir betrachten den Kehrwert a1 > 1. Da n= xn ≥1+ x .
j 2 n
wir bereits wissen, dass j =0
. n
1
=
n 1
→ 1 (n → ∞) Es folgt mit 2 = n(n − 1)/2, dass
xn a
.
gilt, erhalten wir die Konvergenz aus der Abschätzung 2 2
xn2 ≤ bzw. xn ≤ →0 (n → ∞)
) ) ) ) n n
) 1) ) 1)
|xn − 1| = |xn | ))1 − )) ≤ ))1 − )) → 0 (n → ∞)
xn xn mit dem Majorantenkriterium und der Nullfolge
√ √
mit dem Majorantenkriterium und der Nullfolge (1 − (1/ n)∞ n=1 . Da wir xn =
n
n − 1 gesetzt hatten, folgt

1/xn )∞ lim n = 1.
n
n=0 . n→∞

xn √ Als Drittes betrachten wir xn = n n!. Wir zeigen, dass (xn )
n
( 2) unbeschränkt ist. Dazu führen wir einen Widerspruchsbe-
5 √
( n 5) weis durch. Wir nehmen an, dass die Folge (xn ) beschränkt

( n n) ist. Dann gibt es eine Konstante c > 0 mit n! ≤ cn für alle
n ∈ N. Dies steht aber im Widerspruch dazu, dass cn /n!
eine Nullfolge ist (siehe Seite 287). Also ist die Folge un-
n
5 10 15 beschränkt und somit nicht konvergent.

1/q
Weiter ergibt sich die Abschätzung Wir zeigen nun die Konvergenz von (xn ), falls (xn ) gegen
) ) ) ) x konvergiert. Im Fall x = 0 kann man mit der Definition des
) xn ) ) )
) − x ) = ) yxn − yn x ) 1/q
)y y ) ) yn y ) Grenzwerts sofort nachvollziehen, dass (xn ) eine Nullfolge
n
1 ist.
= |y(xn − x) + (y − yn )x|
|yn | |y| Im Fall x > 0 verwenden wir einen Standardtrick: Hat man es
1 |x| mit der Differenz von q-ten Wurzeln zu tun, verwendet man
≤ |xn − x| + |y − yn |
|yn | |yn | |y| eine Verallgemeinerung der dritten binomischen Formel
2 2 |x|
≤ |xn − x| + |y − yn | !
q−1
|y| |y|2 1/q 1/q (q−1−j )/q
xn − x = (xn −x ) xn x j/q .
für n ≥ N . Rechts steht die Summe zweier Nullfolgen, also j =0
wieder eine Nullfolge. Das Majorantenkriterium liefert, dass
auch die Folge (xn /yn ) konvergiert, und der Grenzwert ist Wie beim Nachweis der Konvergenz eines Quotienten zweier
x/y. konvergenter Folgen sehen wir xn ≥ x für alle n ab einem ge-
8.2 Konvergenz 289

wissen n0 . Damit folgt, ebenfalls für n ≥ n0 , für die Summe Dies sehen wir aus folgender Überlegung. Zu ε > 0 können
auf der rechten Seite: wir N ∈ N finden, sodass |xn − x| ≤ ε/2 und |yn − y| ≤ ε/2
für alle n ≥ N ist. Damit ergibt sich
!
q−1
(q−1−j )/q
!
q−1
x (q−1−j )/q j/q
xn x j/q ≥ x 0 ≤ yn − xn = yn − y − xn + x + y − x ≤ ε + y − x ,
2
j =0 j =0

!'
q−1
1
((q−1−j )/q wenn x = lim xn und y = lim yn sind. Diese Unglei-
n→∞ n→∞
= x (q−1)/q chung erhalten wir für jeden Wert ε > 0, und somit ist x ≤ y.
2
j =0
⎛ ⎞ Die Ungleichung xn ≤ yn bleibt also im Grenzfall erhalten:
!'
q−2
1
((q−1−j )/q x ≤ y. Das Beispiel xn = n12 und yn = n1 zeigt außerdem,
= x (q−1)/q ⎝1 + ⎠ ≥ x (q−1)/q . dass wir bei echten Ungleichung xn < yn aufpassen müssen,
2
j =0 da im Grenzfall im Allgemeinen nur auf x ≤ y geschlossen
Somit gilt für n ≥ n0 : werden kann.
) ) |xn − x| |xn − x|
) 1/q )
)xn − x 1/q ) = q−1 (q−1−j )/q j/q
≤ .
x (q−1)/q Durch Einschließen lassen sich Grenzwerte
j =0 xn x

Die rechte Seite geht gegen null für n → ∞, mit dem Mono- bestimmen
1/q
toniekriterium folgt somit die Konvergenz xn → x 1/q
für n → ∞. 
Die letzte Eigenschaft lässt sich für ein weiteres Konvergenz-
kriterium nutzen. Um zu zeigen, dass eine Folge konvergent
ist, benötigten wir bislang eine Vermutung für den Grenz-
Wie diese Regeln zur Berechnung von Grenzwerten genutzt wert, um passende Abschätzungen zu finden. Dies ist aber
werden können, wird im Beispiel auf Seite 291 aufgezeigt. oft nicht möglich. Es ist somit wichtig, Kriterien zur Verfü-
gung zu haben, die erlauben, ohne Kenntnis des Grenzwerts
Achtung: Bei den Rechenregeln haben wir stets die Vor- Aussagen über die Konvergenz einer Folge zu machen.
aussetzung, dass sowohl (xn ) als auch (yn ) konvergieren. Mit dem letzten Resultat halten wir fest: Wenn drei reelle Fol-
Diese Voraussetzung ist notwendig und muss berücksichtigt gen (an ), (bn ) und (cn ) gegeben sind und wir wissen, dass
werden. (an ) und (bn ) gegen denselben Grenzwert a ∈ R konvergie-
ren, so genügt es zu zeigen, dass an ≤ cn ≤ bn für n ∈ N
Die ersten beiden Regeln bezüglich der Summe und der Mul- gilt, um zu sehen, dass auch lim cn = a gilt. Diese Tat-
n→∞
tiplikation mit einer Zahl zeigen, dass wir es mit linearen al- sache wird Einschließungskriterium oder auch Sandwich
gebraischen Strukturen zu tun haben. Fassen wir alle Folgen Theorem genannt.
in C zu einer Menge zusammen, so ergibt sich mit dieser
Addition und der skalaren Multiplikation ein Vektorraum, Beispiel Mit dem Einschließungskriterium lässt sich leicht
der Vektorraum der Folgen in C. Aus den Rechenregeln für einsehen, dass die Folge (cn ) mit
Grenzwerte folgt, dass die Menge der konvergenten Folgen

cn = 1 − xn
n
U = {(xn )n∈N | (xn ) konvergent}
ein Unterraum ist. Weiter entdecken wir, dass die Menge aller für jedes x ∈ (−1, 1) gegen 1 konvergiert. Denn wir können
Nullfolgen wiederum einen Unterraum in Raum der konver-
genten Folgen bildet. 1 − x n ≥ 1 − |x|n ≥ 1 − |x|

? und
Finden Sie zur harmonischen Folge, d. h. xn = 1/n, drei 1 − x n ≤ 1 + |x|n ≤ 2
Nullfolgen (yn ), sodass die Folge (xn /yn )∞
n=1
abschätzen. Also ist 1 − |x| ≤ 1 − x n ≤ 2 . Es folgt aus der
1. auch eine Nullfolge,
Monotonie der n-ten Wurzel:
2. eine konvergente Folge mit Grenzwert 2 bzw.
3. divergent ist. √
n √ %
2 ≥ 1 − x n ≥ n 1 − |x|.
n

Neben den erwähnten Rechenregeln, sind auch häufig Un- Da sowohl die linke als auch die rechte Seite dieser Unglei-
gleichungen zwischen Folgengliedern relevant. Sind (xn ) chungskette für n → ∞ gegen 1 konvergieren, folgt mit dem
und (yn ) konvergente Folgen reeller Zahlen mit der Eigen- Einschließungskriterium lim cn = 1.
n→∞
schaft xn ≤ yn für alle n ∈ N, so folgt für die Grenzwerte:
Die Abbildung 8.15 illustriert diese Anwendung des Ein-
lim xn ≤ lim yn .
n→∞ n→∞ schließungskriterium für den Fall x = 1/2. 
290 8 Folgen – der Weg ins Unendliche

Übersicht: Grenzwerte von Folgen


Einige Folgen mit ihren Grenzwerten genauso wie die Rechenregeln werden uns ständig begleiten. Daher ist eine Zusammen-
stellung dieser Ergebnisse nützlich.

Liste einiger Grenzwerte Liste der Rechenregeln


Wenn (xn ) und (yn ) konvergente Folgen in C mit Grenz-
werten lim xn = x und lim yn = y sind, und λ ∈ C
Harmonische Folge n→∞ n→∞
eine Zahl ist, dann existieren auch die folgenden Grenz-
1 werte:
lim = 0.
n→∞ n lim (λxn ) = λx,
n→∞
Geometrische Folge lim (xn + yn ) = x + y,
n→∞

lim q n = 0 für |q| < 1. lim (xn − yn ) = x − y,


n→∞ n→∞

n-te Wurzeln lim (xn yn ) = x y,


n→∞
√ xn x
lim n
a=1 für a ∈ C, lim = , wenn y = 0,
n→∞ n→∞ yn y

lim n
n = 1. p p
n→∞
lim xnq = x q , für p, q ∈ N.
n→∞
Weitere Grenzwerte
Wenn (an ) eine beschränkte Folge ist und (xn ) eine Null-
qn
lim =0 für q ∈ C, folge, so gilt:
n→∞ n!
lim (an xn ) = 0.
lim np q n = 0 für |q| < 1 und p ∈ N. n→∞
n→∞

Ungleichungen
Divergente Folgen Wenn (xn ) und (yn ) konvergente Folgen in C mit Grenz-
√ werten lim xn = x und lim yn = y sind, gilt:
( n!)∞
n n→∞ n→∞
n=1 ,

(q n )∞
n=1 mit |q| > 1, Aus xn ≤ yn für alle n ∈ N folgt x ≤ y.

(a + nd)∞
n=1 mit a, d ∈ C, d  = 0. Aus xn < yn für alle n ∈ N folgt nur x ≤ y.


xn  Beispiel Die rekursiv definierte Folge an+1 = 2an mit
( n 21 ) a0 = 1 liefert

2 ( n 1 − xn) . 
√ 
( n 2) √ √ √
1 1, 2, 2 2, 2 2 2, . . .

Nun nehmen wir an, dass die Folge konvergiert, bzw. genauer,
n es gibt eine Zahl a ∈ R mit lim an = a. Dann folgt aus der
5 10 15 n→∞
Rekursionsformel mit den Rechenregeln (siehe die Übersicht
Abbildung 8.15 Mittels Einschließungskriterium lässt sich oft ein Grenzwert
finden. auf Seite 290) für a die Gleichung:
% √
a = lim an+1 = lim 2an = 2a .
n→∞ n→∞
Lösungen der Fixpunktgleichung sind
Eine solche Identität für einen möglichen Grenzwert ergibt
mögliche Grenzwerte sich immer bei rekursiv definierten Folgen mit den Rechen-
regeln aus der Rekursionsvorschrift. Sie wird Fixpunktglei-
Die Rechenregeln geben uns auch eine elegante Möglichkeit, chung genannt. Wir erhalten die Fixpunktgleichung, indem
bei rekursiv definierten Folgen Kandidaten für Grenzwerte wir in der Rekursionsformel den Grenzwert für n → ∞ be-
zu bestimmen. Machen wir uns dies an einem Beispiel klar. trachten. Im Beispiel bestimmen wir durch Quadrieren die
8.3 Häufungspunkte und Cauchy-Folgen 291

Beispiel: Ausnutzen der Rechenregeln


Untersuchen Sie die Folgen (xn ) mit den folgenden Gliedern auf Konvergenz.
3n2 + 2n + 1 % %
(a) xn = 2 , (b) xn = n2 + 1 − n2 − 2n − 1 .
5n + 4n + 2

Problemanalyse und Strategie: Man muss die Folgenglieder so umschreiben, dass die Rechenregeln angewandt
werden können. Am einfachsten ist das, wenn man einen Bruch erzeugt, bei dem im Zähler und Nenner jeweils nur noch
einfache Folgen stehen, zum Beispiel Konstanten oder Nullfolgen. Dann erhält man mit den Rechenregeln sofort den
Grenzwert.
% %
Lösung: xn = ( n2 + 1 − n2 − 2n − 1)
% %
2 n2 + 1 + n2 − 2n − 1
(a) In der Folge können wir durch Kürzen von n direkt ·% %
Nullfolgen erzeugen: n2 + 1 + n2 − 2n − 1
(n2 + 1) − (n2 − 2n − 1)
3 + n2 + n12 = % %
xn = . n2 + 1 + n2 − 2n − 1
5 + n4 + n22 2n + 2
= % % .
Bis auf die jeweils ersten Summanden in Zähler und n + 1 + n2 − 2n − 1
2

Nenner haben wir es jetzt durchweg mit Nullfolgen Nun klammern wir in Zähler und Nenner den Term n
zu tun. Der Zähler konvergiert gegen 3, der Nenner aus und kürzen:
gegen 5. Nach der Regel für den Quotienten gilt nun:
2 + n2
lim (3 + n2 + n12 ) xn =   .
n→∞ 3 1 + n12 + 1 − 2 n1 − n12
lim xn = = .
n→∞ lim (5 + n4 + n22 ) 5
n→∞
Jetzt haben wir wieder die einfache Form mit Kon-
(b) Wir erinnern uns an die dritte binomische Formel und stanten und Nullfolgen. Die Rechenregeln liefern
erweitern die Differenz der Wurzeln mit ihrer Summe:
lim 2 + lim n2
n→∞ n→∞
lim xn =  
n→∞
lim 1 + n2 + lim 1 − 2 n1 − n12
1
n→∞ n→∞
2
= = 1.
1+1

Kommentar: Diese Beispiele zeigen zwei wichtige Techniken beim Durchführen solcher Rechnungen:
Man kürzt stets den Term, der am stärksten wächst, etwa das Monom höchsten Grades im Zähler und Nenner.
Differenzen von Wurzeln kann man häufig durch Erweitern mit ihrer Summe vereinfachen.


√ a = 2a als a = 0 und a = 2.
Lösungen der Gleichung Kandidaten für einen Grenzwert nur die Möglichkeit a = 0.
Da mit an ≥ 1 auch 2an ≥ 1 folgt, kommt von den beiden Aber offensichtlich ist die Folge unbeschränkt und somit
Werten nur a = 2 als möglicher Grenzwert der Folge infrage. nicht konvergent.
Die Abbildung 8.16 illustriert das Vorgehen. Die Lösung der
Fixpunktgleichung
√ ist gegeben durch einen Schnittpunkt der
Kurve y = 2x mit der Winkelhalbierenden y = x. Die 8.3 Häufungspunkte und
Stufen deuten die Rekursionsschritte an. 
Cauchy-Folgen
Achtung: Mithilfe der Fixpunktgleichung bei rekursiv de- Die letzten Bemerkungen zeigen die Notwendigkeit von
finierten Folgen lassen sich oft Kandidaten für Grenzwerte theoretischen Konvergenzaussagen und zwar gerade dann,
ermitteln. Dies ist aber kein Beweis dafür, dass die Folge wenn wir keine Vermutung haben, welchen Wert ein mögli-
überhaupt konvergiert. So liefert uns etwa bei der Folge mit cher Grenzwert a hat, und sich keine elementare Abschätzung
an+1 = 2an und a0 = 1 die Fixpunktgleichung a = 2a als von |an − a| anbietet.
292 8 Folgen – der Weg ins Unendliche

y für n ≥ N . Also konvergiert die Folge (an ) gegen das Supre-


y=x
mum a. 

2 Das Monotoniekriterium ist ein mächtiges Werkzeug und


liefert uns bei vielen Folgen einen Konvergenzbeweis.

√ Beispiel Betrachten wir eine Folge, die wir schon kennen-


y= 2x gelernt haben, nämlich
' (
1 n
xn = 1 + .
n

Im Beispiel auf Seite 281 haben wir gezeigt, dass diese Folge
beschränkt ist mit 1 ≤ xn ≤ 3.

1 Um über die Monotonie dieser Folge eine Aussage machen


zu können, schauen wir uns den Quotienten xn+1 /xn an. Mit
elementaren Umformungen ergibt sich
a0 = 1 a1 a2 a3 a4 2 x
 n+1
1
xn+1 1 + n+1
Abbildung 8.16 Fixpunktgleichung und Iterationen für eine Folge mit der

Rekursionsvorschrift an+1 = 2an .
=  n
xn 1 + n1
' ( 1
n+1
1 1 + n+1
? = 1+
n 1 + n1
Stellen Sie, bevor noch zwei weitere Kriterien zur Konver- ' (' (n+1
genz diskutiert werden, die bisherigen Methoden zum Be- 1 n(n + 1) + n
= 1+
weisen der Existenz von Grenzwerten zusammen. n n(n + 1) + n + 1
' ( n+1
1 (n + 1)2 − 1
= 1+
n (n + 1)2
' (' (n+1
Aus beschränkt und monoton folgt 1 1
= 1+ 1− .
n (n + 1)2
konvergent

Gehen Sie einmal die Abbildungen von konvergenten Folgen Nun verwenden wir die Bernoulli-Ungleichung mit h = −1/
in diesem Kapitel durch: In vielen Fällen ist die Folge mono- (n + 1)2 und erhalten die Abschätzung
ton und außerdem beschränkt. Es zeigt sich, dass diese beiden ' (' (
xn+1 1 1
Eigenschaften hinreichend sind, damit Konvergenz vorliegt. ≥ 1+ 1 − (n + 1)
((n + 1)
xn n(' 2
'
1 1
Monotoniekriterium = 1+ 1− = 1.
n n+1
Jede beschränkte und monotone Folge reeller Zahlen ist
konvergent. Es ist stets xn+1 ≥ xn , d. h., die Folge ist monoton wachsend.
Mit dem Monotoniekriterium folgt die Konvergenz der Folge
(xn ). Der Grenzwert dieser Zahlenfolge ist die Euler’sche
Beweis: Wir betrachten den Fall einer monoton wachsen- Zahl e, wie bereits im Kommentar auf Seite 281 angemerkt
den Folge in R. Für monoton fallende Folgen ergibt sich der wurde. 
Beweis ganz analog.
Sei also (an ) eine monoton wachsende und beschränkte Im Beispiel auf Seite 293 wird ausführlich gezeigt, wie das
Folge. Nach dem Vollständigkeitsaxiom (siehe Seite 114) Monotoniekriterium genutzt werden kann, um bei rekursiv
besitzt die beschränkte Menge M = {an | n ∈ N} ⊆ R gegebenen Folgen Konvergenz zu prüfen.
ein Supremum a = sup M. Somit gibt es zu ε > 0 eine Zahl
N ∈ N mit der Eigenschaft |aN − a| ≤ ε (siehe Seite 114). ?
Weiter gilt aufgrund der Monotonie der Folge (an ) die Ab- Versuchen Sie es√selbst und zeigen Sie Konvergenz für die
schätzung aN ≤ an ≤ a für alle n ≥ N. Wir erhalten Folge an+1 = 2an mit a1 = 1 aus dem Beispiel auf
Seite 290
|an − a| = a − an ≤ a − aN = |aN − a| ≤ ε
8.3 Häufungspunkte und Cauchy-Folgen 293

Beispiel: Konvergenz und Grenzwertberechnung bei einer rekursiven Folge


Betrachte die Folge (xn ) mit einem Startwert x0 ≥ 0 und
%
xn = 5 + 4xn−1 , n ∈ N.

Für welche Startwerte x0 konvergiert die Folge? Wie lautet gegebenenfalls der Grenzwert?

Problemanalyse und Strategie: Es soll das Monotoniekriterium verwendet werden, um die Konvergenz der Folge
nachzuweisen. Es muss sichergestellt werden, dass die Folge monoton und beschränkt ist. Das Verhalten von rekursiven
Folgen hängt oft entscheidend von der relativen Lage von Startwert und Grenzwert ab. Daher bestimmen wir zunächst
mögliche Kandidaten für den Grenzwert als Lösungen der Fixpunktgleichung.

Lösung: positiv, denn xn−1 ≥ 0. Der Term 1 + xn−1 ist auch po-
Wir nehmen an, dass die Folge konvergiert und setzen sitiv. Daher hängt das Vorzeichen von xn − xn−1 nur von
x = lim xn . Indem man in der Rekursionsvorschrift auf der Differenz 5 − xn−1 ab: Ist xn−1 > 5, so ist xn < xn−1 ,
n→∞
beiden Seiten zum Grenzwert übergeht, erhält man die ist xn−1 < 5, so ist xn > xn−1 .
Fixpunktgleichung Wir betrachten nun zwei Fälle. Zunächst sei xn−1 > 5.
√ Dann gilt:
x = 5 + 4x. % √
5 − xn = 5 − 5 + 4xn−1 < 5 − 5 + 20 = 0,
Durch Quadrieren ergibt sich die quadratische Gleichung
x 2 − 4x − 5 = 0 mit den Lösungen −1 und 5. Dies sind und es ist auch xn > 5. Mit den bisherigen Überlegun-
die Kandidaten für den Grenzwert. gen folgt durch Induktion: Für einen Startwert x0 > 5 gilt
Für einen Startwert x0 ≥ 0 erkennt man durch Induktion xn > 5 für alle n ∈ N. Die Folge ist in diesem Fall mono-
leicht, dass xn ≥ 0 für alle n ∈ N gilt. Die Folge ist durch ton fallend. Mit dem Monotoniekriterium folgt, dass sie
0 nach unten beschränkt. Aus dieser Beobachtung folgt auch konvergent ist. Da 5 der einzige verbleibende Kan-
auch, dass −1 als Grenzwert nicht infrage kommt. didat für den Grenzwert ist, gilt lim xn = 5.
Es ist nun am einfachsten, die Folge zunächst auf Mono- n→∞
Nun zum zweiten Fall. Wir nehmen jetzt an xn−1 < 5. Es
tonie zu untersuchen. Es gilt:
folgt, dass
%
xn − xn−1 = 5 + 4xn−1 − xn−1 % √
xn − 5 = 5 + 4xn−1 − 5 < 5 + 20 − 5 = 0,
5 + 4xn−1 − xn−1
2
= %
5 + 4xn−1 + xn−1 also xn < 5. Jetzt dreht sich die Argumentation um: Für
(5 − xn−1 ) (1 + xn−1 ) einen Startwert x0 < 5 gilt xn < 5 für alle n ∈ N, und
= % . die Folge ist monoton wachsend. Nach dem Monotonie-
5 + 4xn−1 + xn−1
kriterium konvergiert die Folge, wieder ist 5 der einzige
Beachten Sie, dass wir hier wieder den Trick angewandt Kandidat für den Grenzwert.
haben, eine Differenz von Wurzeln mit der Summe der Es bleibt noch der Fall x0 = 5, in dem die Folge konstant
Wurzeln zu erweitern und die dritte binomische Formel ist. Insgesamt haben wir gezeigt, dass die Folge für jeden
anzuwenden. Die Summe, die jetzt im Nenner steht, ist Startwert x0 ≥ 0 gegen 5 konvergiert.

Kommentar: Dieses Beispiel zeigt, wie sehr gerade bei rekursiv definierten Folgen die Begriffe der Monotonie, Be-
schränktheit und Konvergenz ineinander verzahnt sind. Ein genaues Verständnis jedes dieser Begriffe ist notwendig, um
eine korrekte Argumentationskette aufzubauen.

Teilfolgen sind auch Folgen aber mit unterschiedlichen Grenzwerten. Insgesamt ist die
Folge (an )∞
n=1 allerdings divergent.
Die Monotonie ist eine starke Voraussetzung. Sobald sie nicht
Um ein solches Verhalten mathematisch beschreiben zu kön-
gegeben ist, können sehr unterschiedliche Situationen auftre-
nen, führen wir einen neuen Begriff ein: die Teilfolge. Man
ten. In der Abbildung 8.17 ist die reelle Folge (an )∞
n=1 mit bezeichnet eine Folge (ank )∞ k=1 als Teilfolge einer Folge
' ( (an )∞ , wenn (n ) ∞ eine streng monoton steigende Folge
1 n=1 k k=1
an = (−1)n 1 + , n ∈ N, von Indizes in N ist. Wir erzeugen etwa mit nk = 2k aus der
n
Folge (an ) die Teilfolge (ank ) mit den Folgengliedern
abgebildet. Es sieht auf den ersten Blick so aus, als seien zwei
Folgen abgebildet. Beide davon scheinen zu konvergieren, a1 , a2 , a4 , a8 , a16 , a32 , . . .
294 8 Folgen – der Weg ins Unendliche

xn Beweis: Wenn (an ) eine konvergente Folge ist mit Grenz-


2 wert a, so gibt es zu ε > 0 ein N ∈ N mit |an − a| ≤ ε für
alle n ≥ 0. Ist nun (ank ) eine Teilfolge, so findet sich wegen
der Monotonie der Indizes (nk ) auch ein K ∈ N mit nk > N
1 für alle k ≥ K. Also gilt |ank − a| ≤ ε für alle k ≥ K. Dies
bedeutet, die Folge (ank ) ist konvergent mit Grenzwert a. 

n
5 10 15 20 25 30
Beschränkte Folgen besitzen mindestens
−1
einen Häufungspunkt

Wir können zwar ohne die Voraussetzung der Monotonie bei


−2
beschränkten Folgen reeller Zahlen keinen Grenzwert erwar-
  
ten, aber es zeigt sich, dass zumindest ein Häufungspunkt
Abbildung 8.17 Die Folge (−1)n 1 + n1 hat zwei Häufungspunkte. existieren muss. Diese grundlegende Aussage wird nach den
n
beiden Mathematikern Bernard Bolzano (1781–1848) und
Karl Weierstraß (1815–1897) benannt.
Achtung: Es ist ganz wesentlich, dass (nk ) streng mono-
ton wachsend ist. Dadurch treffen wir bei einer Teilfolge eine Satz von Bolzano-Weierstraß
Auswahl der Glieder einer Folge, behalten aber ihre Reihen-
Jede beschränkte Folge reeller oder komplexer Zahlen
folge bei.
besitzt mindestens einen Häufungspunkt.

Häufig betrachtet man alle Folgenglieder mit geradem oder Beweis: Der Beweis ist unterteilt in drei Schritte:
ungeradem Index. Mit nk = 2k erhält man etwa im Beispiel
oben die Folge (ank ) mit (i) Zunächst konstruieren wir einen Kandidaten für einen
Häufungspunkt im Falle einer beschränkten Folge (an ) in R.
' (
1 1 Wir definieren für jedes k ∈ N die beschränkte Menge
ank = (−1)2k 1 + =1+ , k ∈ N.
2k 2k Mk = {an | n ≥ k}. Nach dem Vollständigkeitsaxiom besitzt
diese Menge ein Supremum. Wir erhalten damit eine weitere
Mit nk = 2k − 1 erhält man dagegen
Folge (bk )∞
k=1 durch
' (
1 1
ank = (−1)2k−1 1 + = −1 − , k ∈ N. bk = sup Mk .
2k − 1 2k − 1
Da Mk+1 ⊂ Mk für alle k ∈ N gilt, ist die Folge bk monoton
fallend. Wegen
Häufungspunkte sind Grenzwerte von
Teilfolgen bk = sup Mk ≥ inf Mk ≥ inf{an | n ∈ N}

ist die Folge (bk ) auch nach unten beschränkt. Somit folgt mit
In diesem Fall sind beide Teilfolgen konvergent: Die Folge
dem Monotoniekriterium, dass (bk ) konvergiert. Wir setzen
(a2k ) hat den Grenzwert 1, die Folge (a2k−1 ) hat den Grenz-
wert −1. Diese beiden Grenzwerte charakterisieren irgend- b = lim bk .
wie das Verhalten der gesamten Folge (an ) selbst, daher ver- k→∞
dienen sie eine besondere Bezeichnung.
(ii) Es ist zu zeigen, dass b Häufungspunkt von (an ) ist.

Definition von Häufungspunkten Angenommen dies ist nicht der Fall. Dann gibt es ein ε > 0
und eine Zahl N ∈ N, sodass |b − an | > ε für alle n ≥ N
Ist eine Teilfolge (ank )∞
konvergent, so heißt ihr
k=1 gilt. Da die Folge (bk ) gegen b konvergiert, existiert weiter
Grenzwert Häufungspunkt der Folge (an ).
ein K ∈ N mit |b − bk | < 2ε für alle k > K. Also ist mit der
Dreiecksungleichung
Ein Zusammenhang von Konvergenz und Häufungspunkt er-
ε
gibt sich direkt aus der Definition. |an − bk | = |an − b − (bk − b)| ≥ |an − b| − |bk − b| ≥
2
Lemma für alle n ≥ N und k ≥ K. Dies steht aber im Widerspruch
Ist eine Folge (an ) von komplexen Zahlen konvergent zur Definition von bk = sup Mk ; denn, wenn k ≥ N ge-
mit Grenzwert a ∈ C, so ist a der einzige Häufungspunkt, wählt wird, so gibt es ein n ≥ k > N mit der Eigenschaft
und jede Teilfolge von (an ) konvergiert ebenfalls gegen a. |an − bk | = |an − sup Mk | < 2ε (siehe Seite 114).
8.3 Häufungspunkte und Cauchy-Folgen 295

(iii) Nun verallgemeinern wir noch die Aussage für be- Analog führt man den Limes Inferior ein mit
schränkte Folgen (an ) in C.
lim inf an = lim (inf{an ∈ R | n ≥ k}) .
Die beiden reellen Folgen des Real- und des Imaginärteils von n→∞ k→∞
an sind beschränkt, da |Re(an )| ≤ |an | und |Im(an )| ≤ |an | In der Literatur findet sich für diese Häufungspunkte auch
gilt. Nach der Aussage für Folgen in R besitzt somit die manchmal die Notation lim für lim inf und lim für lim sup.
Folge (Re(an )) eine konvergente Teilfolge (Re(ank )) mit
Häufungspunkt lim ank = x ∈ R. Wir wenden die Aussage Beispiel Die Folge (an ) mit
k→∞
für reelle Folgen nun auf die Folge (Im(ank ))∞ an. Dem- π
k=1
nach gibt es einen Häufungspunkt y ∈ R zu dieser Folge, d. h. an = sin( n), n∈N
2
eine Teilfolge (Im(ankl ))l∈N konvergiert gegen y. Insgesamt
besitzt drei Häufungspunkte, −1, 0, 1. Zugehörige Teilfolgen
folgt, dass lim ankl = x + iy ∈ C ein Häufungspunkt der
l→∞ sind etwa (a4n+3 ), (a2n ) und a4n+1 . Damit erhalten wir
ursprünglichen Folge (an ) ist. 

lim inf an = −1 und lim sup an = 1 . 


n→∞ n→∞
Wir können uns den Satz von Bolzano-Weierstraß auch so
merken: Jede beschränkte, reelle oder komplexe Folge besitzt Aus der Definition dieser beiden speziellen Häufungspunkte
eine konvergente Teilfolge. Der Satz ist eng mit der Defini- ergeben sich zwei Eigenschaften, die die Begriffsbildung
tion der reellen bzw. komplexen Zahlen verknüpft. Wie wir deutlicher machen.
im Beweis gesehen haben, spielt das Vollständigkeitsaxiom
dabei die entscheidende Rolle. Folgerung
(a) Sind (an ) eine beschränkte Folge in R und a ∈ R ein
Häufungspunkt von (an ), so gilt:
Folgerung
Falls eine Folge (an ) beschränkt ist und nur einen ein- lim inf an ≤ a ≤ lim sup an .
zigen Häufungspunkt a besitzt, dann konvergiert die Folge, n→∞ n→∞
und a ist ihr Grenzwert. Also ist der Limes Superior der größte und der Limes
Inferior der kleinste Häufungspunkt einer beschränkten
Beweis: Wir nehmen an, die Folge (an ) konvergiert nicht. Folge.
Dann gibt es ein ε > 0, sodass für jedes k ∈ N ein nk > k (b) Ist (an ) eine konvergente Folge in R so gilt:
existiert mit
|ank − a| ≥ ε . lim inf an = lim an = lim sup an .
n→∞ n→∞ n→∞
Indem wir die nk wachsend anordnen und mehrfache nk weg-
lassen, erhalten wir eine Teilfolge von (an ), die nicht gegen a Beweis: (a) Wir definieren wieder zunächst die Folge
konvergiert. Da die Folge (an ) beschränkt ist, ist auch diese bk = inf{an | n ≥ k}
Teilfolge beschränkt und besitzt nach dem Satz von Bolzano-
Weierstraß eine konvergente Teilfolge. Deren Grenzwert mit dem Grenzwert lim bk = lim inf an und betrachten zu
k→∞ n→∞
kann aber nicht a sein, die Folge (an ) hat also einen von einem Häufungspunkt a eine konvergente Teilfolge (ank )k∈N
a verschiedenen Häufungspunkt. Dies widerspricht der Vor- mit dem Grenzwert lim ank = a. Aus der Ungleichung
aussetzung, dass (an ) nur einen einzigen Häufungspunkt be- k→∞
sitzt. Die Annahme ist also falsch, die Folge (an ) ist konver- bnk ≤ ank für alle k ∈ N und der Konvergenz beider Folgen
gent. 
ergibt sich

lim inf an = lim bnk ≤ lim ank = a .


n→∞ k→∞ k→∞
? Analog ergibt sich die Abschätzung für den Limes Superior.
Warum benötigt man bei der Aussage die Voraussetzung, dass
(an ) beschränkt ist? Überlegen Sie sich ein Beispiel! (b) Da Limes Inferior und Limes Superior Häufungspunkte
sind und nach dem Lemma auf Seite 294 zu einer konver-
genten Folge genau ein Häufungspunkt existiert, folgt bei
Im Beweis des Satzes von Bolzano-Weierstraß haben wir konvergenten Folgen:
durch bk = sup{an ∈ R | n ≥ k} eine monoton fallende
Folge konstruiert und über einen Widerspruch gezeigt, dass lim inf an = lim an = a = lim sup an . 
n→∞ n→∞ n→∞
ihr Grenzwert ein Häufungspunkt der beschränkten, reellen
Folge (an ) ist. Dieser spezielle Häufungspunkt wird Limes
Um die grundlegende Bedeutung des Satzes von Bolzano-
Superior genannt. Man schreibt
Weierstraß zu sehen, bietet es sich an, eine weitere Eigen-
lim sup an = lim (sup{an ∈ R | n ≥ k}) . schaft von Folgen herauszustellen. Dazu betrachten wir zu-
n→∞ k→∞ nächst ein weiteres Beispiel zum Monotoniekriterium.
296 8 Folgen – der Weg ins Unendliche

Unter der Lupe: Der Satz von Bolzano-Weierstraß


Jede beschränkte Folge reeller oder komplexer Zahlen besitzt mindestens einen Häufungspunkt.

Dies ist ein typischer Satz, bei dem man zunächst ohne An- sich jedoch als technisch schwierig. Versuchen Sie ein-
fangsidee für den Beweis steht, also wie der Ochs vor’m mal, eine solche Konstruktion zu realisieren.
Berg. Es bietet sich an, Teilaussagen zu identifizieren, die Leichter ist es, eine geeignete Folge zu konstruieren: In-
getrennt bzw. nacheinander bewiesen werden können. dem wir die Suprema bk der mit wachsendem k kleiner
Wir beginnen gewissermaßen hinten: Der Satz macht Aus- werdenden Mengen
sagen über reelle und komplexe Folgen. Kann man die
Aussage für komplexe Folgen aus der für reelle Folgen Mk = {an | n ≥ k}
ableiten? Was offensichtlich nicht zum Ziel führt, ist die
Aussage für Real- und Imaginärteil getrennt anzuwenden. betrachten, erhalten wir von selbst eine monoton fallende
So erhalte ich zwar eine Teilfolge mit konvergentem Re- beschränkte Folge. Zu zeigen ist nun noch, dass der Grenz-
alteil und eine mit konvergentem Imaginärteil, aber diese wert b dieser Folge auch Häufungspunkt von (an ) ist.
Folgen müssen keine gemeinsamen Glieder besitzen. Aber Diese letzte Aussage ist ideal für einen Widerspruchsbe-
eine kleine Variante funktioniert: Haben wir eine Teil- weis. Sie ist im zweiten Teil des Beweises dargestellt.
folge, deren Realteile konvergieren, so bleibt diese Eigen- Wir nehmen an, dass b kein Häufungspunkt von (an ) ist.
schaft bei jeder Teilfolge erhalten. Man wählt also eine Hieraus folgt, dass sich die Folgenglieder an sich b nicht
Teilfolge dieser Teilfolge, bei der auch die Imaginärteile beliebig dicht nähern können. Andererseits müssen sie
konvergieren. sich aber nach der Definition des Supremums den (bk )
Damit bleibt die Aussage für eine reelle Folge (an ) übrig, beliebig dicht annähern. Hieraus ergibt sich durch eine
der dritte Teil des Beweises. Da wir außer der Beschränkt- Standardanwendung der Dreiecksungleichung der Wider-
heit keinerlei Informationen über die Folge besitzen, ist spruch.
nur die Anwendung eines allgemeinen Konvergenzkrite- Bei der Formulierung des Satzes von Bolzano-Weierstraß
riums möglich, also des Monotoniekriteriums. Um dieses ist es notwendig, sich auf reelle oder komplexe Zahlen zu
einsetzen zu können, benötigen wir aber zusätzlich Mo- beziehen. So besitzt jede monotone und beschränkte Folge
notonie. Ziel muss es also sein, aus unserer beschränkten aus Q zwar einen Häufungspunkt, denn Q ist in R enthal-
Folge (an ) eine monotone beschränkte Folge zu konstru- ten. Dieser Häufungspunkt muss jedoch nicht selbst eine
ieren. rationale Zahl sein. Dazu fehlt Q die Eigenschaft, voll-
Denkbar ist, aus (an ) selbst eine monotone Teilfolge aus- ständig zu sein. Im Zusammenhang mit Cauchy-Folgen
zuwählen. Dann wären wir sofort am Ziel. Dies erweist werden wir diesen Aspekt weiter vertiefen.


Beispiel Zu einer Zahl x ∈ R>0 definieren wir die rekur- Es gilt also für alle n ≥ 1, dass an ≥ x ist. Zweimaliges
sive Folge (an ) mit Anwenden dieser Abschätzung führt zu
' ( ' ( ' (
1 x 1 x 1 x
an+1 = an + an+1 = an + ≤ an + √
2 an 2 an 2 x
1 √
und starten mit a0 > 0. Die zugehörige Fixpunktgleichung = (an + x) ≤ an .
2
1 x Die Folge (an ) ist also zumindest ab Index n = 1 nach un-

a= a+ , ten durch x beschränkt, und sie fällt monoton (siehe auch
2 a
√ Abbildung 8.18). Damit ist die Folge konvergent.
hat nur die eine positive Lösung a = x. Sie liefert daher,

dass der Grenzwert der Folge x sein muss, falls die Folge Kommentar: Diese Methode zur approximativen Berech-
konvergiert. √
nung von x wird Heron-Verfahren genannt. Da sie schon
Mithilfe des Monotoniekriteriums (siehe Seite 292) zeigen den Bewohnern des antiken Babylon bekannt war, spricht
wir Konvergenz. Zunächst beobachten wir, dass induktiv mit man auch vom Babylonischen Wurzelziehen. 
a0 > 0 auch an > 0 für alle n ∈ N folgt. Eine Anwendung
der binomischen Formel liefert Schauen wir uns die Folge (an ) aus dem Beispiel etwa für
√ √ x = 2 noch einmal genauer an. Ist der Startwert a0 ∈ Q,
0 ≤ (an − x)2 = an2 − 2an x + x.
so sind offensichtlich√alle Folgenglieder rationale Zahlen.
√ Der Grenzwert a = 2 ist es aber nicht, d. h. in Q ist die
Diese Ungleichung lösen wir nach x auf:
' ( Folge divergent, ihr Grenzwert existiert nicht. Andererseits
√ 1 x verhalten sich die Folgenglieder wie bei einer konvergenten
x≤ an + = an+1 .
2 an Folge.
8.3 Häufungspunkte und Cauchy-Folgen 297

y
y=t es folgt |xm − xm−1 | ≤ q |xm−1 − xm−2 | ≤ · · · ≤
q m−n−1 |xn+1 − xn | . Mit der Dreiecksungleichung, der geo-
metrischen Summe und l = m − j − n − 1 erhält man für
m > n die Ungleichung
 
y = 21 t + xt
!
m−n−1
|xm − xn | ≤ |xm−j − xm−j −1 |
j =0

!
m−n−1
≤ q l |xn+1 − xn |
a0 √ a2 a1 t
x l=0
Abbildung 8.18 Die Fixpunktiteration für das Heron-Verfahren. Ab dem Index 1 − q m−n
1 ist die Folge monoton fallend und nach unten beschränkt. = |xn+1 − xn |
1−q
|xn+1 − xn | 9
Eine Abschwächung des Konvergenzbegriffs – ≤ = |xn+1 − xn | .
1−q 7
die Cauchy-Folge
Es folgt |xm − xn | ≤ (9/21) q n ≤ ε für alle hinreichend
Der Begriff konvergent ist also nicht adäquat, um dieses Ver- großen Zahlen n, m da die geometrische Folge (q n ) eine
halten von (an ) als Folge in den rationalen Zahlen zu be- Nullfolge ist. Wir haben so die Cauchy-Folgen-Eigenschaft
schreiben. Wir benötigen eine Beschreibung des Verhaltens, gezeigt. 
die ohne die Existenz eines Grenzwerts auskommt.
Kommentar: Den zweiten Schritt in diesem Beweis sollte
Definition einer Cauchy-Folge man sich genauer ansehen. Er beinhaltet einen Schluss, dem
Wir nennen eine Folge (an ) von Zahlen eine Cauchy- man in allgemeinen vollständigen Räumen häufiger begeg-
Folge, wenn es zu jedem Wert ε > 0 eine Zahl N ∈ N net, so etwa beim Beweis des Banach’schen Fixpunktsatzes
gibt mit der Eigenschaft, dass für alle Indizes m, n > N (siehe Seite 801). Es wird aus einer Kontraktionseigenschaft,
die Abschätzung |am − an | ≤ ε gilt. nämlich |xn+1 − xn | ≤ q|xn − xn−1 | mit q ∈ (0, 1), die
Cauchy-Folgen-Bedingung durch
Diese Definition bedeutet, dass mit hinreichend großen In- qn
|xm − xn | ≤
dizes die Differenz von Folgengliedern beliebig klein wird. 1−q
Cauchy-Folgen sind benannt nach dem französischen Ma-
mittels des Grenzwerts der geometrischen Summe bewiesen.
thematiker Augustin Louis Cauchy (1789–1857), der mit an-
deren den Weg zur modernen Analysis bereitet hat.

Beispiel Als Beispiel einer Cauchy-Folge wählen wir die Cauchy-Folge und Konvergenz
rekursiv definierte Folge (xn ) mit xn+1 = (1/3) (1−xn2 ) und
x0 = 0. Induktiv sieht man, dass (xn ) im Intervall (0, 1/3) be- Wir hatten angedeutet, dass der Begriff der Cauchy-Folge
schränkt ist. In zwei Schritten zeigen wir, dass es sich um eine schwächer ist als der Konvergenzbegriff. Allgemein gilt, dass
Cauchy-Folge handelt. Zunächst gilt mit der Rekursionsfor- jede konvergente Folgen auch Cauchy-Folge ist; denn mit
mel und der Beschränkung |xn +xn−1 | ≤ |xn |+|xn−1 | ≤ 2/3 einem Grenzwert x und der Dreiecksungleichung können wir
die Abschätzung abschätzen:
) )
)1 1 )
|xn+1 − xn | = )) (1 − xn2 ) − (1 − xn−1 2
))) |xm − xn | = |xm − x + x − xn | ≤ |xm − x| + |xn − x| .
3 3
1 )) 2 )
) Wegen der Konvergenz der Folge (xn ) streben die beiden
= )xn−1 − xn2 ) Terme auf der rechten Seite gegen 0 für n, m → ∞. Also ist
3
1 die Folge eine Cauchy-Folge.
= |xn−1 + xn | |xn−1 − xn |
3 Interessant ist die Umkehrung dieser Aussage. In den ratio-
2 nalen Zahlen kann diese Umkehrung nicht gelten, wie wir es
≤ |xn − xn−1 | . etwa am Beispiel des Heron-Verfahrens auf Seite 296 gese-
9
hen haben. Aber in R oder in C lässt sich, letztendlich wegen
Diese Abschätzung gilt für jede Zahl n ∈ N. Setzen wir des Vollständigkeitsaxioms, die Aussage umdrehen.
q = 2/9 und nutzen die Ungleichung n-mal, so folgt
|xn+1 − xn | ≤ q n |x1 − x0 | = (1/3) q n .
Cauchy-Kriterium
Der zweite Schritt: Für Zahlen m, n ∈ N mit m > n lässt Jede Cauchy-Folge in R bzw. C ist konvergent.
sich diese Abschätzung (m − n − 1)-mal anwenden, und
298 8 Folgen – der Weg ins Unendliche

Übersicht: Folgen und Konvergenz


Aus den elementaren Eigenschaften von Folgen ergibt sich eine Kette von Klassifizierungen, deren Zusammenhänge sich
in einem Diagramm aufzeigen lassen. Hilfreich ist darüber hinaus eine Zusammenstellung von wesentlichen Kriterien zur
Konvergenz. Wobei wir insbesondere herausstellen, welchen Kriterien das Vollständigkeitsaxiom zugrunde liegt

Klassifizierung von Folgen zeichneten Kriterien die Vollständigkeit eine notwendige


Im folgenden Venn-Diagramm sind die Eigenschaften von Voraussetzung ist.
Folgen und Zusammenhänge als Unterräume/Teilmengen Die Folge (xn ) in R oder C konvergiert gegen x ∈ R oder
des Vektorraums aller Folgen dargestellt. Zu jeder Klasse C, wenn gilt:
ist auch ein typischer Vertreter mit angegeben. Zu ε > 0 gibt es N ∈ N mit
alle Folgen |xn − x| ≤ ε für n ≥ N .

beschränkte Folgen (n) Majorantenkriterium


 n
 konvergente Folgen Es gibt eine Nullfolge (yn ) mit
(−1)
 monotone
 Folgen
 
(−1)n
1
n |xn − x| ≤ |yn | .
n

 
(−2)n Einschließungskriterium in R (erfordert Anordnung)
Es gibt Folgen (an ) und (bn ) mit

Beachten Sie, dass es sich bei den monotonen Folgen nur an ≤ xn ≤ bn


um eine Teilmenge und nicht um einen Unterraum handelt.
Unterräume bekommen wir nur bei Aufteilung in monoton und lim an = x = lim bn .
n→∞ n→∞
wachsende und monoton fallende Folgen. Monotoniekriterium (basiert auf Anordnung und
Im Diagramm sind die Cauchy-Folgen nicht eingezeich- Vollständigkeit)
net, da diese zumindest in den vollständigen Mengen der Jede beschränkte und monotone Folge in R ist konver-
reellen oder komplexen Zahlen nach dem Cauchy-Krite- gent.
rium mit den konvergenten Folgen zusammenfallen. Bolzano-Weierstraß (benötigt/definiert Vollständig-
keit)
Konvergenzkriterien Beschränkte Folgen in R oder C besitzen mindestens
Die ersten aufgelisteten Konvergenzkriterien können pro- einen Häufungspunkt.
blemlos in allgemeine normierte Vektorräume übertragen Cauchy-Kriterium (benötigt/definiert Vollständig-
werden. Aber Vorsicht, gehen wir die Beweise nochmal keit)
durch, so ergibt sich, dass bei den entsprechend gekenn- Jede Cauchy-Folge in R oder C ist konvergent.

Beweis: Der Satz lässt sich mit dem Satz von Bolzano- ?
Weierstraß (siehe Seite 299) zeigen. Falls (an ) eine Cauchy-
Warum gilt das Monotoniekriterium nicht für Folgen in Q
Folge ist, können wir zu ε = 1 ein N ∈ N finden mit
oder in C?
|an | = |an − aN + aN | ≤ |an − aN | + |aN | ≤ 1 + |aN |
für alle n ≥ N. Also ist die Cauchy-Folge beschränkt durch
max{1+|aN |, |a1 |, |a2 |, . . . , |aN −1 |}. Der Satz von Bolzano-
Weierstraß besagt, dass (an ) einen Häufungspunkt a hat. Die Vollständigkeit der reellen Zahlen muss man bei der
Wenn wir mit (anj )∞j =1 eine Teilfolge bezeichnen, die gegen
Definition der reellen Zahlen durch ein Axiom verankern.
a konvergiert, ergibt sich aus |an −a| ≤ |a−anj |+|anj −an |, Verschiedene Varianten eines Vollständigkeitsaxioms wer-
dass a Grenzwert der gesamten Folge (an ) ist.  den in der Literatur diskutiert, zum Beispiel Dedekind’sche
Schnitte, oder, wie es in der Schule üblich ist, die Inter-
Beachten Sie, dass genauso wie das Monotoniekriterium, das vallschachtelungen (siehe Hintergrundbox auf Seite 118).
Cauchy-Kriterium ohne die Kenntnis des Grenzwerts aus- Wir haben in diesem Werk die Existenz des Supremums
kommt. Die Aussage des Cauchy-Kriteriums gilt nach unse- als Vollständigkeitsaxiom verwendet. Genauso könnten man
rem ersten Beispiel (siehe Seite 297) nicht in Q. Dies ist ein aber auch das Cauchy-Kriterium oder den Satz von Bolzano-
substantieller Unterschied zwischen diesen beiden Mengen Weierstraß für das Vollständigkeitsaxiom zugrunde legen.
von Zahlen. Eine Menge von Zahlen, Vektoren oder auch an- Deren Formulierung würde aber gerade die jetzt erarbeiteten
deren Elementen heißt vollständig, wenn jede Cauchy-Folge Kenntnisse von Folgen und von Konvergenz voraussetzten.
konvergiert.
Zusammenfassung 299

Die generelle Tragweite der Cauchy-Folgen wird erst spä- Darstellung und verweisen auf das Kapitel 19 über metrische
ter deutlich. Mithilfe der Cauchy-Folgen lassen sich aus Räume.
den rationalen Zahlen die reellen Zahlen konstruieren. An-
schaulich nehmen wir einfach alle „Grenzwerte“, die wir In den Aufgaben zu diesem Kapitel ergeben sich noch wei-
durch Cauchy-Folgen rationaler Zahlen erreichen können, tere Beispiele zu den Konvergenzkriterien. Rekapitulieren
zur Menge Q hinzu. Um dies mathematisch sauber auszu- wir noch einmal die verschiedene Eigenschaften von Folgen
führen sind entsprechende Äquivalenzklassen zu definieren und die Beziehungen zwischen ihnen. Zusammengefasst ist
(siehe Seite 53). Das Vorgehen liefert letztendlich ein allge- das bisher errichtete Gebäude der Folgen und ihrer Eigen-
meines Konzept zur Vervollständigung von Räumen. Daher schaften in der Übersicht auf Seite 298.
verzichten wir an dieser Stelle zunächst auf eine ausführliche

Zusammenfassung

Bei einer Folge sind abzählbar unendlich viele Folgenglieder Ist eine Folge konvergent, so ist ihr Grenzwert eindeutig be-
in eine Reihenfolge gebracht. stimmt. Eine konvergente Folge muss automatisch auch be-
schränkt sein.
Definition einer Folge Um nicht immer die Definition der Konvergenz bemühen
Eine Folge ist eine Abbildung der natürlichen Zahlen in zu müssen, gibt es Konvergenzkriterien. Beim Majoranten-
eine Menge M, die jeder natürlichen Zahl n ∈ N ein kriterium wird die Differenz zwischen Folgengliedern und
Element xn ∈ M zuordnet. Grenzwert durch die Glieder einer Nullfolge abgeschätzt.
Grenzwerte können auch direkt bestimmt werden, indem man
Von besonderem Interesse sind zunächst Zahlenfolgen, bei eine Folge als Summe, Produkt oder Quotient von Folgen
denen M ⊆ C ist. Später im Buch werden zum Beispiel auch schreibt, deren Grenzwerte bekannt sind.
Funktionenfolgen eine wichtige Rolle spielen. Ohne den Grenzwert zu kennen, kann bei bestimmten Folgen
Elementare Eigenschaften von Zahlenfolgen sind die Be- mit dem Monotoniekriterium auf die Konvergenz geschlos-
schränktheit und die Monotonie. Bei einer beschränkten sen werden.
Zahlenfolge gibt es einen Kreis in der komplexen Zahlen-
ebene, in dem alle Glieder der Folge liegen. Der Betrag der Monotoniekriterium
Folgenglieder kann also nicht beliebig groß werden, sondern Jede beschränkte und monotone Folge reeller Zahlen ist
übersteigt eine bestimmte endliche Größe niemals. konvergent.
Reelle Zahlenfolgen können die Eigenschaft besitzen, mono-
ton zu sein. Bei einer monoton wachsenden Folge werden die Ein weiteres wichtiges Werkzeug im Umgang mit Folgen
Glieder mit zunehmendem Index größer, bei einer monoton sind Teilfolgen. Ist eine Teilfolge konvergent, so heißt ihr
fallenden Folge werden sie mit zunehmendem Index kleiner. Grenzwert Häufungspunkt der ursprünglichen Folge. Aus
dem Monotoniekriterium erhält man in diesem Zusammen-
Die interessantesten Folgen sind solche, die konvergieren,
hang den Satz von Bolzano-Weierstraß.
also einen Grenzwert besitzen. Solche Folgen werden wir
in weiteren Kapiteln verwenden, um unterschiedlichste Be-
griffe zu definieren, etwa die Stetigkeit von Funktionen, die Satz von Bolzano-Weierstraß
Ableitung für differenzierbare oder das Integral für integrier- Jede beschränkte Folge reeller oder komplexer Zahlen
bare Funktionen. besitzt mindestens einen Häufungspunkt.

Definition des Grenzwerts einer Folge Dieser Satz ist äquivalent zum Vollständigkeitsaxiom für die
Eine Zahl x ∈ C heißt Grenzwert einer Folge (xn )∞ n=1
reellen Zahlen. Er dient in theoretischen Überlegungen oft
in C, wenn es zu jeder Zahl ε > 0 eine natürliche Zahl zur Herleitung von nicht-konstruktiven Existenzaussagen:
N ∈ N gibt, sodass Man erhält die Existenz eines Häufungspunkts und kann ihn
für weitere Überlegungen verwenden, ohne ihn explizit zu
|xn − x| < ε für alle n ≥ N kennen.

gilt. Eine Folge (xn ) in C, die einen Grenzwert hat, heißt Später in der Mathematik spielen auch nicht-vollständige
konvergent, andernfalls heißt die Folge divergent. Räume eine große Rolle. √ Zum Beispiel hat eine Folge ra-
tionaler Zahlen, die gegen 2 konvergiert, keinen Grenzwert
300 8 Folgen – der Weg ins Unendliche

in Q. Der Begriff der Cauchy-Folge charakterisiert solche Cauchy-Kriterium


potentiell konvergenten Folgen.
Jede Cauchy-Folge in R oder C ist konvergent.
Eine konvergente Folge ist immer eine Cauchy-Folge. Da R
und C vollständig sind, gilt hier auch die Umkehrung, for-
muliert als Konvergenzkriterium:

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen Grenzwerts aus Q aus, dass die Folge mindestens einen Häu-
fungspunkt in Q besitzt?
8.1 • Gegeben sei die Folge (xn )∞mit xn = (n−2)/
n=2
(n + 1) für n ≥ 2. Bestimmen Sie eine Zahl N ∈ N sodass
|xn − 1| ≤ ε für alle n ≥ N gilt, wenn Rechenaufgaben
8.6 • Untersuchen Sie die Folge (xn ) auf Monotonie
1 1
(a) ε= , (b) ε = und Beschränktheit. Dabei ist
10 100
ist. 1 − n + n2 1 − n + n2
(a) xn = , (b) xn = ,
n+1 n(n + 1)
8.2 • Stellen Sie eine Vermutung auf für eine explizite .
1 n+1
Darstellung der rekursiv gegebenen Folge (an ) mit (c) xn = , (d) xn = 1 + .
1 + (−2)n n
an+1 = 2an + 3an−1 und a1 = 1, a2 = 3,
8.7 • Untersuchen Sie die Folgen (an ), (bn ), (cn ) und
und zeigen Sie diese mit vollständiger Induktion. (dn ) mit den unten angegebenen Gliedern auf Konvergenz.
8.3 •• Zeigen Sie, dass für zwei positive Zahlen x, y > 0
gilt: n2 n3 − 2
% an = , bn = ,
lim n x n + y n = max{x, y} . n3 − 2 n2
n→∞
cn = n − 1, dn = bn − cn .
8.4 • Welche der folgenden Aussagen sind richtig? Be-
gründen Sie Ihre Antwort.
(a) Eine Folge konvergiert, wenn Sie monoton und be- 8.8 • Berechnen Sie jeweils den Grenzwert der Folge
schränkt ist. (xn ), falls dieser existiert:
(b) Eine konvergente Folge ist monoton und beschränkt.
(c) Wenn eine Folge nicht monoton ist, kann sie nicht kon- 1 − n + n2
(a) xn =
vergieren. n(n + 1)
(d) Wenn eine Folge nicht beschränkt ist, kann sie nicht kon- n3 − 1 n3 (n − 2)
(b) xn = 2 −
vergieren. n +3 n2 + 1
(e) Wenn es eine Lösung zur Fixpunktgleichung einer re- %
(c) xn = n2 + n − n
kursiv definierten Folge gibt, so konvergiert die Folge % %
gegen diesen Wert. (d) xn = 4n2 + n + 2 − 4n2 + 1
8.5 •• Eine Cauchy-Folge aus Q braucht keinen Grenz- 3n+1 + 2n
(e) xn =
wert aus Q zu besitzen. Reicht es für die Existenz eines 3n + 2
Aufgaben 301

8.9 •• Bestimmen Sie mit dem Einschließungskriterium 8.16 •• Zeigen Sie mit der Definition des Grenzwerts
Grenzwerte zu den Folgen (an ) und (bn ), die durch die folgenden Rechenregeln:
. .
√ (a) Ist (xn ) eine konvergente Folge aus C, und ist x =
n 3n + 2 1
an = , bn = + n − n, n ∈ N , lim xn , so gilt für alle λ ∈ C die Gleichung
n+1 2n n→∞
lim (λxn ) = λx.
gegeben sind. n→∞
(b) Sind (xn ), (yn ) konvergente Folgen aus C, und sind
8.10 ••• Untersuchen Sie die Folgen (an ), (bn ), (cn ) bzw. x = lim xn , y = lim yn , so gilt lim (xn yn ) = xy.
n→∞ n→∞ n→∞
(dn ) mit den unten angegebenen Gliedern auf Konvergenz
und bestimmen Sie gegebenenfalls ihre Grenzwerte: 8.17 •• Gegeben sei eine konvergente Folge (an ) aus
' ( C und eine bijektive Abbildung g : N → N. Setze bk =
1 n ag(k) für k ∈ N. Man nennt die so definierte Folge (bk ) eine
an = 1 − 2 (Hinweis: Bernoulli-Ungleichung),
n Umordnung der Folge (an ).
(n + i)(1 + in)
bn = 2n/2 , Zeigen Sie, dass die Folge (bk ) konvergiert mit
(1 + i)n
1+q n lim bk = lim an .
n→∞
cn = , mit q > 0, k→∞
1 + q n + (−q)n
(iq)n + in 8.18 ••• Im Beispiel auf Seite 278 ist die Folge (an ) der
dn = , mit q ∈ C.
2n + i Fibonacci-Zahlen definiert. Zeigen Sie, dass für die Folge
(bn ) der Verhältnisse
8.11 •• Zu a > 0 ist die rekursiv definierte Folge (xn ) bn =
an+1
, n ∈ N,
mit an
xn+1 = 2xn − axn2 aufeinanderfolgender Fibonacci-Zahlen gilt:
1 √ 
1
und x0 ∈ (0, gegeben. Überlegen Sie sich zunächst, dass
a)
lim bn = 1+ 5 .
xn ≤ a1 gilt für alle n ∈ N0 und damit induktiv auch xn > 0 n→∞ 2
folgt. Zeigen Sie dann, dass diese Folge konvergiert und be- Dieser Grenzwert wird Zahl des goldenen Schnitts genannt.
rechnen Sie ihren Grenzwert.
Gehen Sie wie folgt vor:
8.12 •• Für welche Startwerte a0 ∈ R konvergiert die (a) Leiten Sie eine Rekursionsformel für die (bn ) her.
rekursiv definierte Folge (an ) mit (b) Zeigen Sie, dass die Teilfolgen (b2n ) und (b2n−1 ) mono-
1 2  ton und beschränkt sind.
an+1 = an + 3 , n ∈ N ? (c) Weisen Sie nach, dass der goldene Schnitt der Grenzwert
4
der Folge (bn ) ist.
8.13 • Bestimmen Sie für die Folgen (an ) mit den 8.19 ••• Beweisen Sie mit der Definition des Grenzwerts
unten angegebenen Gliedern jeweils supn∈N an , inf n∈N an , folgende Aussage: Wenn (an ) eine Nullfolge ist, so ist auch
Limes Superior und Limes Inferior, falls diese Zahlen exis- die Folge (bn ) mit
tieren.
1!
n

(a) an = 1 + (−1) + n n −1/2


, n∈N bn = aj , n ∈ N,
n
⎧ k−1 j =1

⎪ , n = 3k,
⎨ k eine Nullfolge.
(b) an = k+1 , n = 3k − 1, k ∈ N
1


⎩ 1 8.20 •• Zeigen Sie: Ist (an ) eine beschränkte Folge aus
− k 2 , n = 3k − 2,
R, so ist lim sup an gleich dem größten Häufungspunkt von
n2 + 1 n→∞
(c) an = , n∈N (an ).
n+1
8.21 •• Gegeben ist eine Folge von abgeschlossenen In-
tervallen (In ) mit
Beweisaufgaben
I1 ⊇ I2 ⊇ · · · ⊇ In ⊇ In+1 ⊇ · · · .
8.14 • Ist (an ) eine konvergente Zahlenfolge aus C mit
a = lim an , so gilt auch |a| = lim |an |. Setze In = [an , bn ]. Es gelte |In | = bn −an → 0 für n → ∞.
n→∞ n→∞ Zeigen Sie: Es gibt genau eine Zahl a ∈ R mit a ∈ In für
8.15 • Zeigen Sie für p ∈ N und |q| < 1: alle n ∈ N.
Man nennt eine solche Konstruktion eine Intervallschach-
lim np q n = 0 .
n→∞ telung.
302 8 Folgen – der Weg ins Unendliche

Antworten der Selbstfragen

S. 277 eine unbeschränkte Folge ist divergent,


1. Beispiel: 2, 4, 6, 8, 10, . . . und 1, 3, 5, 7, 9, . . . Anwenden des Majorantenkriteriums,
2. Beispiel: 2, 9/4, 64/27, 625/256, 7 776/3 125, . . . Rückführen auf bekannte Grenzwerte durch die Rechen-
3. Beispiel: 1, 3, 6, 10, 15, 21, 28, . . . regeln,
4. Beispiel: In der Abbildung ist die Reihenfolge der Gera- Anwenden des Einschließungskriteriums.
den mit Steigungen 15 , 25 , 35 , 45 , . . . durch den Punkt (1, 0) zu
Kein Existenzbeweis aber Kandidaten für Grenzwerte erge-
sehen.
ben sich bei rekursiv gegebenen Folge aus der zugehörigen
Fixpunktgleichung.
S. 278
Rekursiv: x0 = 1, xn = 3 · xn−1 , n ∈ N.
S. 292
Explizit: xn = 3n , n ∈ N0 .
Wenn an ∈ [1, 2] ist, beobachten wir zunächst, dass mit der
Monotonie der Wurzelfunktion
S. 285
Setze x := lim xn . Zu ε > 0 wähle N, sodass |xn −x| < ε/2 √ √
n→∞ 1 ≤ 2 ≤ an+1 ≤ 2 · 2 = 2
für alle n ≥ N . Dann ist
folgt. Also zeigt man durch vollständige Induktion, dass
|xn+1 −xn | = |xn+1 −x −xn +x| ≤ |xn+1 −x|+|xn −x| < ε an ∈ [1, 2] beschränkt ist. Betrachten wir noch das Verhältnis
für alle n ≥ N . Die Folge der Differenzen bildet eine Null- 1
folge. an+1 2
= ≥1
an an
Kommentar: Die Umkehrung dieser Aussage ist im All-
gemeinen falsch. Dies sieht man am einfachsten an der für an ∈ [1, 2]. Damit ist die Folge monoton wachsend. Ins-

Folge ( n). gesamt liefert das Monotoniekriterium die Konvergenz von
(an ).
S. 286
Ein mögliches Beispiel ist xn = (−1)n . S. 295
Die Folge (xn ) mit x2k = 1/k und x2k−1 = k hat nur den
S. 289 einen Häufungspunkt 0, aber sie divergiert.

1. yn = 1/ n
2. yn = 1/(2n) S. 298
3. yn = 1/n2 Das Monotoniekriterium gilt nicht in Q, da die Menge der
rationalen Zahlen nicht vollständig ist. Die Anmerkung zum
S. 292 Heron-Verfahren nach dem Beispiel auf Seite 296 liefert ein
Die bisher vorgestellten Methoden zum Beweis von Konver- Gegenbeispiel.
genz/Divergenz lassen sich durch fünf Stichworte auflisten:
In den komplexen Zahlen fehlt uns die Möglichkeit, die
direkte Angabe von N(ε) ∈ N mit |xn − x| ≤ ε für alle Zahlen vollständig anzuordnen, sodass von Monotonie einer
n ≥ N, Folge nicht gesprochen werden kann.
Funktionen und
Stetigkeit – ε trifft auf δ 9
Was bedeutet Stetigkeit?
Sind Schnittmengen offener
Mengen selbst wieder offen?
Was ist eine
Optimierungsaufgabe?

9.1 Grundlegendes zu Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 304


9.2 Beschränkte und monotone Funktionen . . . . . . . . . . . . . . . . . . . 310
9.3 Grenzwerte für Funktionen und die Stetigkeit . . . . . . . . . . . . . . 313
9.4 Abgeschlossene, offene, kompakte Mengen . . . . . . . . . . . . . . . 322
9.5 Stetige Funktionen mit kompaktem Definitionsbereich,
Zwischenwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
304 9 Funktionen und Stetigkeit – ε trifft auf δ

Im Kapitel 2 haben wir bereits den Begriff der Abbildung kennen- Den Graphen einer Funktion f : D → W , also die Menge
gelernt, eines der ganz wesentlichen Konzepte der abstrakten
Mathematik. In diesem Kapitel werden wir uns mit ganz spe- Graph(f ) = {(x, f (x)) | x ∈ D} ,
ziellen Abbildungen, den Funktionen, beschäftigen, bei denen können wir im Spezialfall D, W ⊆ R zeichnen, indem wir
Zahlen wieder Zahlen zugeordnet werden. in einem Koordinatensystem die eine Achse mit den x- und
Funktionen bilden eine eigenständige Menge mathematischer die andere Achse mit den f (x)-Werten identifizieren. Sind D
Objekte mit spezifischen Eigenschaften, die für sich genommen und W allgemeine Teilmengen der komplexen Zahlenebene,
schon interessant sind. Man kann mit Funktionen rechnen, sie so handelt es sich in der Anschauung jedoch um ein 4-dimen-
transformieren und miteinander zu neuen Funktionen verknüp- sionales Objekt, das man nicht mehr so einfach zeichnen
fen. Später im Buch werden wir mit der Differenziation und kann. Daher ist es oft hilfreich, auch das Bild der Funktion f ,
Integration noch weitere Operationen kennenlernen, die Funk-
f (D) = {y ∈ W | es gibt x ∈ D mit f (x) = y},
tionen auf andere abbilden. Es entstehen so Strukturen, die wir
schon an anderer Stelle kennengelernt haben. Vor allem von zu betrachten.
Funktionen gebildete Vektorräume spielen eine wichtige Rolle.
Beispiel
Funktionen treten häufig aber als Teile komplexerer mathema- Die Abbildung f : R → R mit f (x) = x 2 ist eine sehr
tischer Probleme auf. Häufige Fragestellungen sind z. B.: einfache Funktion. Hier handelt es sich um eine Funktion
Hat eine Gleichung, in der Funktionen auftauchen, eine mit reellem Definitions- und Wertebereich, und wir kön-
Lösung? nen den Graphen in der Ebene zeichnen. In der Abbildung
Kann ich eine Stelle finden, an der ein Funktionswert optimal 9.1 ist er zu sehen, man nennt ihn Normalparabel.
wird, z. B. maximal oder minimal?
f (x)
Auf diese beiden Fragen werden wir im Verlauf dieses Kapitels
3
eingehen und sie zumindest teilweise beantworten.
Der zentrale Begriff hierbei wird die Stetigkeit sein. Anschaulich 2
gesprochen bedeutet er, dass ein funktionaler Zusammenhang
1
stabil ist: Kleine Änderungen im Argument bewirken auch nur
kleine Änderungen im Funktionswert. Für eine wasserdichte
mathematische Definition werden wir aber den Begriff des −2 −1 0 1 2 x
Grenzwerts aus dem vorherigen Kapitel bemühen.
Abbildung 9.1 Die Normalparabel ist der Graph der Funktion f : R → R,
Stetige Funktionen haben deswegen eine solch herausragende f (x) = x 2 .
Bedeutung, weil man für sie unter geeigneten Voraussetzungen
die beiden Fragen oben bejahen kann. Sie bilden damit das Auch g : [0, 2π ] → C mit g(x) = cos(x) + i sin(x) ist
Fundament für alle weiteren Überlegungen in der Analysis. eine Funktion. Das Bild der Funktion ist eine Teilmenge
der komplexen Zahlenebene und in der Abbildung 9.2 zu
sehen. Es handelt sich gerade um den Einheitskreis. Der
Graph der Funktion ist in der Anschauung ein dreidimen-
9.1 Grundlegendes zu sionales Objekt, da der Definitionsbereich im Reellen, der
Wertebereich im Komplexen liegt. In Abbildung 9.3 ist
Funktionen der Graph als blaue Kurve dargestellt. Das Bild von g ist
wieder als roter Kreis dargestellt.
Im Kapitel 2 haben wir Abbildungen f : D → W kennen-
gelernt, die jedem Element der Definitionsmenge D ein Ele- Im g(x)
ment der Wertemenge W zuordnen. In Kapitel 4 wurden kon-
kreter Funktionen einer Veränderlichen eingeführt als Ab- i
g(π/4)
bildungen zwischen Teilmengen der Menge C der komplexen
Zahlen.
Wieso stellt man für Funktionen gerade Teilmengen von R
1 1 Re g(x)
oder C heraus? Zum einen handelt es sich um Zahlenkörper.
Dies bedeutet, dass wir einen reichhaltigen Vorrat an Rechen-
regeln haben, die wir einsetzen können. Zum anderen sind
g(7π/4)
diese Mengen vollständig. Im Abschnitt 9.5 werden wir ganz
genau untersuchen, warum diese Eigenschaft der Körper R −i
und C es uns erlaubt, wichtige Aussagen über Funktionen zu Abbildung 9.2 Das Bild der Funktion g : [0, 2π] → C mit g(x) = cos(x) +
treffen. i sin(x) ist der Einheitskreis. Der Graph ist in Abbildung 9.3 dargestellt.
9.1 Grundlegendes zu Funktionen 305

x
f (x)
2

Im g(x)

0 1 2 x
g(π/4) Abbildung 9.5 Die Abbildungsvorschrift dieser Funktion definiert man am
besten abschnittsweise.
g(7π/4)
Re g(x)

Alle bisher vorgestellten Formulierungen von Abbildungs-


Abbildung 9.3 Die blaue Kurve ist der Graph der Funktion g(x) = cos(x) + vorschriften sind explizit, d. h., aus Kenntnis der Stelle x
i sin(x) für x ∈ [0, 2π]. Die horizontale Koordinatenebene entspricht der kann man direkt den Funktionswert f (x) bestimmen. Eine
Abbildung 9.2.
andere Form der expliziten Darstellung ist eine Tabelle der
Werte. Diese bietet sich insbesondere bei Funktionen mit end-
lichem Definitionsbereich an.
1
Bei der Funktion h : C → R mit h(z) = 1+|z| 2 werden
Es gibt aber auch nicht explizite Formen der Formulierung
komplexe auf reelle Zahlen abgebildet. Der Graph lässt
von Abbildungsvorschriften: Der Ausblick auf Seite 309 be-
sich als Fläche über der komplexen Zahlenebene darstel-
schäftigt sich mit impliziten Definitionen, bei denen eine
len (Abb. 9.4). 
Gleichung gelöst werden muss, um aus der Kenntnis von x
den Funktionswert f (x) zu bestimmen.
Als weitere Möglichkeit soll die Definition durch einen Algo-
f (z)
rithmus nicht unerwähnt bleiben. Unter einem Algorithmus
versteht man eine Vorschrift, die nach einer endlichen An-
zahl von Schritten zu dem gewünschten Ergebnis führt. Ein
Kochrezept ist ein Beispiel für einen Algorithmus. Im Bei-
spiel auf Seite 282 wurde bereits eine Funktion f : C → N
Im (z) durch einen Algorithmus definiert: Sie bildet eine komplexe
Zahl c auf die Anzahl der Iterationen ab, ab der die Glieder
einer rekursiv definierten Folge einen vorgegebenen Kreis
verlassen. Dafür müssen eine bestimmte, vorher nicht be-
kannte Anzahl von Folgengliedern berechnet werden.
Es muss für eine gegebene Funktion der Funktionswert an ir-
Re (z) gendeiner Stelle übrigens nicht notwendigerweise berechen-
bar sein, es reicht, dass er wohldefiniert ist. Z. B. sind die
Abbildung 9.4 Der Graph einer Funktion f : C → R kann als Fläche über der Werte vieler Funktionen, etwa der trigonometrischen oder
komplexen Zahlenebene dargestellt werden. der Exponentialfunktion, als Grenzwerte definiert, die man
nur näherungsweise berechnen kann. Die Berechenbarkeit
von Funktionen ist ein Thema, das in der Logik und der In-
In diesen Beispielen haben wir die Abbildungsvorschrift
formatik eine Rolle spielt, uns hier aber nicht interessieren
durch eine einfache Formel angegeben. Sehr häufig kommt
muss.
es vor, dass dieses einfache Vorgehen nicht ausreicht. Eine
Möglichkeit, mit der wir oft zu tun haben werden, ist die
Funktion abschnittsweise zu erklären, etwa bei der Funktion
f : [0, 2] → R mit: Transformationen führen auf verwandte
⎧ Funktionen
⎪ 2
⎨x , 0 ≤ x < 1,
f (x) = 2, x = 1,


Da sowohl die Argumente als auch die Bilder von Funktionen
x − 1, 1 < x ≤ 2. komplexe Zahlen sind, bieten sich eine Vielzahl von Mög-
lichkeiten an, diese zu transformieren und somit aus gegebe-
Die Definitionsmenge wird also in disjunkte Teilmengen zer- nen Funktionen neue, aber verwandte Funktionen zu bilden.
legt und für jede dieser Teilmengen ist eine Definition durch
eine Formel möglich. Den Graphen dieser Funktion sehen Wir können etwa das Argument um eine Konstante verschie-
Sie übrigens in der Abbildung 9.5. ben, d. h., aus einer gegebenen Funktion f : D ⊆ R → R
306 9 Funktionen und Stetigkeit – ε trifft auf δ

Beispiel: Visualisierung von komplexwertigen Funktionen


Stellen Sie den Graphen oder das Bild der Funktionen g : R → C und h : C \ {1} → C dar, mit
iz + 1
g(x) = x 2 + i sin x 2 und h(z) = .
z−1

Problemanalyse und Strategie: Bei Funktionen im Komplexen ist es oft nicht möglich, den Graphen angemessen
auf ein Blatt Papier, das ja von Natur aus zweidimensional ist, zu zeichnen. Bei einer Funktion von C nach C geht
die Abbildung von der komplexen Zahlenebene in die komplexe Zahlenebene, der Graph ist in der Anschauung ein
vierdimensionales Objekt! Wir werden unterschiedliche Formen der Darstellung ausprobieren und nebeneinander stellen.

Lösung: und des Imaginärteils getrennt darzustellen. In beiden Fäl-


Bei der Funktion g werden reelle Zahlen auf komplexe len erhalten wir eine Fläche über der komplexen Zahlen-
abgebildet. Der Graph dieser Funktion hat also einen drei- ebene.
dimensionalen Charakter. Eine erste Möglichkeit zur Vi-
Graph von Re h(z) Graph von Im h(z)
sualisierung ist also, nur das Bild der Funktion in der kom-
plexen Zahlenebene zu zeigen. Dadurch erhält man eine
Sinuskurve in der komplexen Zahlenebene, die als rote
Kurve in der folgenden Abbildung dargestellt ist.

Graph von g
Eine letzte Möglichkeit der Visualisierung lässt sich aus
x Re g(x)
speziellen Eigenschaften der Funktion h gewinnen. Es
ist eine sogenannte Möbius-Transformation (siehe Ab-
schnitt 4.6), bei der Kreise und Geraden in der komplexen
Im g(x) Zahlenebene wieder auf Kreise bzw. Geraden abgebildet
Bild von g werden. Diese Eigenschaft machen wir uns zu Nutze: In
der linken Abbildung sind einige Kreise und Geraden ein-
gezeichnet, rechts ihre Bilder unter h.
Eine zweite Möglichkeit ist, den Graphen in ein dreidi-
mensionales Koordinatensystem zu zeichnen, mit einer h
Im z
Achse für die Definitionsmenge und je einer Achse für Im h(z)
Real- und Imaginärteil der Wertemenge. Diese Möglich- 2i
keit wird in der Abbildung oben durch die grüne Kurve i 2i
demonstriert. i
−1 1 2 3 Re z
Bei der Funktion h ist es nicht mehr möglich, den Graphen −i
in einer einzigen Abbildung darzustellen. Eine häufig ver- −1 1 Re h(z)
wendete Methode ist, jeweils den Graphen des Realteils

und einer Konstanten c ∈ R erhalten wir eine neue Funktion von f genau um c nach links ergibt. Diese einfache Trans-
f˜ : D̃ → R durch formation von Funktionen nennt man Translation. Analog
verschiebt sich der Graph einer Funktion um einen Wert c
f˜(x) = f (x + c) . nach oben bzw. unten, wenn die Funktion h : D → R mit
h(x) = f (x) + c betrachtet wird.
Ausführlich bedeutet diese Schreibweise, dass wir den Wert
der Funktion f˜ an einer Stelle x bekommen, wenn wir die Auch Streckungen und Spiegelungen der Graphen lassen sich
Funktion f an der Stelle x + c auswerten. Der Defini- durch Multiplikation des Arguments oder der Funktion mit
tionsbereich der neuen Funktion f˜ muss natürlich auch ent- einem Faktor erreichen. Es ergibt sich etwa durch h(x) =
sprechend verschoben werden, d. h., für x ∈ D̃ muss gelten f (−x) als Graph von h die Spiegelung des Graphen von
x + c ∈ D. Stellen wir die Graphen dieser beiden Funk- f an der vertikalen Achse bzw. durch h̃(x) = −f (x) eine
tionen nebeneinander (siehe Abb. 9.6), so sehen wir, dass Funktion h̃, deren Graph die Spiegelung des Schaubilds von
sich der Graph von f˜ aus einer Verschiebung des Graphen f an der horizontalen Achse ist.
9.1 Grundlegendes zu Funktionen 307

f (x)
der Verkettung ergibt, in natürlicher Art und Weise fortset-
zen (siehe Abbildung 9.8). Das ist ein Aspekt, den wir später
genauer analysieren werden.
c
Analog folgt:
f (x) + c
1 1 1
f (x + c) (g◦f )(x) = g(f (x)) = = = (1−x) ,
c 1 + f (x) 1+x
1 + 1−x 2

wobei in diesem Fall nur x = 1 für den Definitionsbereich


x
gefordert werden muss, da f (x)  = −1 für alle x ∈ R gilt,
denn die Gleichung 1+x
1−x = −1 besitzt keine reelle Lösung.

Abbildung 9.6 Translationen einer Funktion f (schwarze Kurve) um c = 1 f (x)


im Argument, f˜(x) = f (x + c) (rote Kurve), bzw. im Bild, h(x) = f (x) + c
(blaue Kurve).

g◦f 2

f (x) 1
f (−x)

1 3 x
f ◦g

Abbildung 9.8 Graphen der Verkettungen der angegebenen Funktionen f, g.


−f (x) 

Abbildung 9.7 Spiegelungen des Graphen einer Funktion f (schwarz) mit Die oben angesprochenen Translationen lassen sich etwa mit
h(x) = f (−x) (blau) und h̃(x) = −f (x) (rot). g(x) = x + c und den Verkettungen h = f ◦ g bzw. h̃ =
g ◦ f angeben. Oder die Spiegelungen an den Achsen sind
gegeben durch die beiden Kompositionen mit der Funktion
All diese Transformationen sind gut zu veranschaulichende g mit g(x) = −x.
spezielle Beispiele von Verkettungen von Abbildungen, wie
sie in Kapitel 2 eingeführt wurden. Wir sprechen auch von ?
Komposition oder Hintereinanderausführung. Auch bei Drücken Sie die Funktion h : R → R mit h(x) = 2(x − 2)3
Funktionen ist die Notation f ◦ g für die Hintereinanderaus- als Verkettung der Funktion f : R → R mit f (x) = x 3 mit
führung von f und g üblich. einer weiteren Funktion aus. Welche Transformationen des
Graphen von f werden so beschrieben?
Beispiel Wir betrachten die beiden Funktionen f, g mit
f (x) = 1+x 1
1−x und g(x) = 1+x für x  = 1 bzw. x  = −1. Dann
ergibt sich: Neben den Verkettungen von Funktionen können wir auch
Kombinationen nutzen, um Funktionen zu verknüpfen. Von
1
1 + g(x) 1+ 1+x 2 Kombinationen sprechen wir immer dann, wenn aus zwei
(f ◦ g) (x) = f (g(x)) = = =1+ , Funktionen f, g durch die üblichen Rechenoperationen in
1 − g(x) 1− 1
1+x
x
R neue Funktionen gebildet werden. So ist naheliegender-
wobei noch der Definitionsbereich festzulegen ist. Da g nur weise die Funktion f + g gegeben durch die Auswertung
für x  = −1 definiert ist, müssen wir diese Stelle ausneh- (f + g)(x) = f (x) + g(x). Entsprechend definieren wir die
men. Weiter muss aber auch der Wert x = 0 ausgeschlossen Funktionen f − g, f g und fg punktweise, d. h. an jeder Stelle
werden, da g(0) = 1 die kritische Stelle für die Funktion f x ∈ D (siehe Übersicht auf Seite 308).
ergibt und somit g(0) nicht als Argument von f verwendet
werden kann. Insgesamt ist also eine Einschränkung des De- Beispiel Mit den Funktionen f und g mit f (x) = x1 und
finitionsbereichs von g auf die Menge D = R\{−1, 0} erfor- 1
g(x) = x−1 erhalten wir für x = 0, 1 etwa die Kombinatio-
derlich. Beachten Sie, dass wir den resultierenden Ausdruck nen
für (f ◦ g)(x) ohne Weiteres an der Stelle x = −1 angeben 1 1 1
(f − g)(x) = − =
können. Dies bedeutet, wir können die Funktion, die sich aus x x−1 x − x2
308 9 Funktionen und Stetigkeit – ε trifft auf δ

Übersicht: Transformationen und Kombinationen von Funktionen


Durch Transformationen oder Kombinationen lassen sich aus bekannten Funktionen eine Vielzahl von weiteren Funktionen
gewinnen.

In dieser Zusammenstellung sind f : Df ⊆ R → R und Translation, Streckung oder Spiegelung


g : Dg ⊆ R → R Funktionen. Bei einfachen Transformationen ergeben sich folgende
Änderungen des Graphen einer Funktion f :
Kombination 
c > 0 Translation um c nach links,
Durch algebraische Kombinationen ergeben sich neue f (x + c)
Funktionen mit folgenden Definitionsbereichen: c < 0 Translation um |c| nach rechts,

c > 0 Translation um c nach oben,
(f + g)(x) = f (x) + g(x) , D = D f ∩ Dg , f (x) + c
c < 0 Translation um |c| nach unten,
(f − g)(x) = f (x) − g(x) , D = D f ∩ Dg ,

(fg)(x) = f (x) g(x) , D = Df ∩ Dg , ⎪
⎪ c>1 horizontale Stauchung um 1c ,


f f (x) c ∈ (0, 1) horizontale Streckung um 1c ,
(x) = , f (c x)

g g(x) ⎪
⎪ c = −1 Spiegelung an der

D = {x ∈ Df ∩ Dg | g(x)  = 0}. vertikalen Achse,


⎪ c>1 vertikale Streckung um c,
Verkettung ⎪

c ∈ (0, 1) vertikale Stauchung um c,
c f (x)
(f ◦ g)(x) = f (g(x)) , D = Dg ⎪
⎪ c = −1 Spiegelung an der


definiert, falls g(Dg ) ⊆ Df . horizontalen Achse.

oder Funktionen bilden Vektorräume


1 1 1
(fg)(x) = = 2 .
x x−1 x −x Durch die Kombination von Funktionen f : D → C, die auf
ein und derselben Definitionsmenge D definiert sind, erhal-
y f −g ten wir durch deren Kombination durch die Grundrechenar-
ten die Struktur eines Vektorraums. Dazu benötigen wir die
Summe zweier Funktionen und das skalare Vielfache:
(λf )(x) = λ f (x), x ∈ D, λ ∈ C .
Lemma
Die Menge aller Funktionen f : D → C bildet mit der
Addition und skalaren Multiplikation von Funktionen
einen Vektorraum über C. Betrachtet man nur reellwertige
1 Funktionen und lässt auch nur Skalare aus R zu, ist es ein
−g
Vektorraum über R.
1 x
f
Beweis: Die Aussagen folgen sofort aus den Definitionen
der Operationen. 

Achtung: Es ist für die Aussage des Lemmas unerheblich,


ob die Definitionsmenge eine Teilmenge von R oder eine
beliebige Teilmenge von C ist.
Abbildung 9.9 Kombination f − g für f (x) = 1/x und g(x) = 1/(x − 1). f (x) f (x)
 4 4
3 3
Mit den algebraischen Transformationen und Kombinationen
2 2
haben wir unzählige Möglichkeiten, aus gegebenen Funktio-
nen neue zu gewinnen. Im nächsten Abschnitt betrachten wir 1 1
wichtige Klassen von Funktionen, die wir auf diesem Wege
erhalten. −2 −1 1 2 x −2 −1 1 2 x

Abbildung 9.10 Die Funktion f : R → R, f (x) = x 2 (links) und ihre Ein-


schränkung auf R≥0 (rechts).
9.1 Grundlegendes zu Funktionen 309

Hintergrund und Ausblick: Implizit definierte Funktionen


Bisher wurden alle Funktionen durch die explizite Angabe der Abbildungsvorschrift definiert. Manchmal ist das zwar nicht
möglich, aber man hat trotzdem genug Informationen, um eine Funktion festzulegen.

Die Situation, dass verschiedene Größen durch eine Glei- Dabei


√ ist es egal, wie stark wir vergrößern, solange nur
chung in Zusammenhang stehen, tritt sehr häufig auf. Bei- (− 2, 0) im Zentrum unseres Interesses bleibt. Suchen
spiele sind wir uns√aber einen Punkt aus, der nur ein wenig entfernt
x + 2y = 7 von (− 2, 0) liegt und vergrößern stark genug, so liegt
oder wieder eine Funktion y = f (x) vor. Der Definitionsbe-
x 2 − y + 2x − 3 = 0 . reich ist nur entsprechend klein zu wählen.
Es stellt sich die Frage, unter welchen Umständen durch
eine solche Gleichung eine Funktion definiert wird, die die
eine Größe auf die andere abbildet. Im ersten Fall kann die Ausschnitt
√ um
Gleichung sowohl nach x als auch nach y in eindeutiger 3, 1
2 2
Weise aufgelöst werden. Für diese Gleichung haben wir Ausschnitt um
 √ 
somit einen funktionalen Zusammenhang von x und y. − 2, 0 y
Im Falle der zweiten Gleichung ist zwar das eindeutige
Auflösen nach y möglich, nicht aber nach x. 1
2

Im allgemeinen Fall ist die Frage, ob eine gegebene Glei-


−1 1 x
chung einen funktionalen Zusammenhang beschreibt, kei-
− 21
nesfalls einfach zu beantworten. Mit den im Buch bis-
her zur Verfügung gestellten Mitteln ist es jedenfalls nicht
möglich. An einem Beispiel können wir uns jedoch we-
sentliche Aspekte bei der impliziten Definition einer Funk- Die Schlussfolgerung ist, dass wir die Frage danach, ob
tion klarmachen. eine Gleichung implizit eine Funktion definiert, nur lokal
Durch die Gleichung beantworten können. D. h., wir suchen uns einen Punkt,
der die Gleichung erfüllt und betrachten dessen unmittel-
(x 2 + y 2 )2 − 2 (x 2 − y 2 ) = 0 bare Umgebung.
ist eine Teilmenge des R2 definiert, nämlich die Menge al- Übrigens kann man die Rolle der Koordinaten in diesem

ler Punkte (x,√y), die diese √
Gleichung erfüllen. Beispiele Spiel auch vertauschen: In der Umgebung von (− 2, 0)
sind (0, 0), (− 2, 0) oder ( 3/2, 1/2). Die Menge dieser ist sehr wohl eine Funktion x = g(y) durch die Lem-
Punkte ist die in der Abbildung blau dargestellte Kurve. niskatengleichung festgelegt. Dies geht allerdings bei

Man nennt sie Lemniskate. ( 3/2, 1/2) schief.
In der Abbildung sind auch zwei Ausschnitte vergrößert.
Betrachten wir zunächst √
den rechten Ausschnitt, der eine
?
Umgebung des Punktes ( 3/2, 1/2) zeigt. Betrachtet man Überlegen Sie sich, in der Umgebung welcher Punkte auf
nur die Vergrößerung, so würde man sofort davon ausge- der Lemniskate Funktionen y = f (x) oder x = g(y) fest-
hen, hier den Graphen einer Funktion y = f (x) vor sich gelegt sind. Gibt es Punkte, in denen weder die eine noch
zu haben. die andere Möglichkeit funktioniert?

Betrachten wir nun den√linken Ausschnitt, der eine Um-


gebung des Punktes (− 2, 0) zeigt. In diesem Ausschnitt Theoretisch werden wir die hier aufgeworfene Problema-
haben wir es sicher nicht mit einer Funktion y = f (x) zu tik erst in Kapitel 21 klären können. Es ist trotzdem jetzt
tun: Die Kurve verläuft so, dass manchen x zwei verschie- schon nützlich, eine Vorstellung von den auftretenden Pro-
dene y-Werte zugeordnet sind, anderen x gar kein y-Wert. blemen zu haben.

Polynome lassen sich um beliebige Stellen nommen als Polynomfunktionen bezeichnen sollte. Aller-
entwickeln dings ist diese Bezeichnung unüblich, man spricht stattdessen
ebenfalls von Polynomen. Aus dem Kontext ist hierbei fast
Im Kapitel 4 hatten wir Polynome kennengelernt. Durch Ein- immer klar, ob ein Polynom im algebraischen Sinne oder eine
setzen von komplexen Zahlen für die Unbestimmte erhalten Polynomfunktion gemeint ist, sodass es nicht zu Verwechs-
wir eine wichtige Klasse von Funktionen, die man streng ge- lungen kommen kann.
310 9 Funktionen und Stetigkeit – ε trifft auf δ

Unter einem Polynom im Sinne der Analysis verstehen wir Für eine konkrete Rechnung muss man den Ausdruck für
also eine Funktion p : C → C mit die neuen Koeffizienten natürlich nicht direkt verwenden,
sondern wendet die binomische Formel für jeden Ausdruck
!
n
p(z) = aj z j , z ∈ C. explizit an.
j =0
Beispiel Es soll das Polynom p : C → C mit p(z) =
Hierbei sind aj ∈ C, j = 0, . . . , n . z3 + 2z2 − 1 um den Punkt ẑ = 1 entwickelt werden. Wir
Sämtliche Operationen, die wir für algebraische Polynome berechnen:
kennengelernt haben, übertragen sich auf Polynomfunktio-
nen: Sie können addiert und mit anderen Polynomen oder z3 + 2z2 − 1 = (z − 1 + 1)3 + 2(z − 1 + 1)2 − 1
mit Skalaren multipliziert werden. Bezüglich der Addition = (z − 1)3 + 3(z − 1)2 + 3(z − 1) + 1
und der skalaren Multiplikation bilden die Polynome einen
+ 2(z − 1)2 + 4(z − 1) + 2 − 1
C-Vektorraum, einen Unterraum des Raums der auf C defi-
nierten Funktionen. = (z − 1)3 + 5(z − 1)2 + 7(z − 1) + 2. 
Auch die Division mit Rest (siehe Seite 92) kann durchge-
führt werden. Für die Analysis ist dies eine wichtige Opera-
tion, die an vielen Stellen von großem Nutzen ist. Hiermit
können rationale Ausdrücke ggf. vereinfacht werden. Eine 9.2 Beschränkte und monotone
wichtige Anwendung ist die Partialbruchzerlegung, die wir
im Kapitel 16 im Zusammenhang mit der Integration vorstel- Funktionen
len werden.
Wir wenden uns zunächst einigen sehr einfachen Eigenschaf-
Ein Thema, das noch nicht vollständig angesprochen wurde,
ten von Funktionen zu, die den entsprechenden Eigenschaf-
betrifft die Möglichkeit, unterschiedliche Darstellungsfor-
ten der Folgen ähneln. Die erste Eigenschaft nutzt aus, dass
men von Polynomen zu finden. Die obige Form können wir
für komplexe Zahlen stets der Betrag als Maß ihrer Größe zur
ausführlicher schreiben als
Verfügung steht und bringt zum Ausdruck, dass die Funk-
!
n
tionswerte einer Funktion nicht beliebig groß werden. Eine
p(z) = aj (z − 0)j , z ∈ C.
Funktion f : D → W heißt beschränkt, falls es eine positive
j =0
Zahl C gibt mit
Dadurch motiviert kann man nach einer Darstellung der Form
|f (x)| ≤ C für alle x ∈ D.
!
n
j
p(z) = bj (z − ẑ) , z∈C Ist diese Eigenschaft für keine positive Zahl C erfüllt, d. h.
j =0 gibt es zu jedem positiven C ein x ∈ D mit |f (x)| > C, so
für irgendein fest gewähltes ẑ suchen. Im Sinne der oben heißt f unbeschränkt.
betrachteten Translationen suchen wir also ein Polynom q, Bei diesem Begriff wird wieder klar, dass eine Eigenschaft
sodass q(z − ẑ) = p(z) für alle z ∈ C ist. Wir nennen dies einer Funktion nicht nur von der Abbildungsvorschrift, son-
die Entwicklung von p um die Stelle ẑ. Wir erhalten diese dern auch vom Definitionsbereich abhängt. Betrachten wir
Darstellung durch Anwendung der binomischen Formel: die Funktionen f : (1, 2) → R sowie g : (0, 1) → R mit
!
n !
n
1 1
p(z) = aj zj = aj (z − ẑ + ẑ)j f (x) = für x ∈ (1, 2) , g(x) = für x ∈ (0, 1) .
j =0 j =0 x x

!
n j ' (
! Aus x > 1 erhalten wir die Abschätzung
j j −l
= aj ẑ (z − ẑ)l .
l 1
j =0 l=0 f (x) = <1 x ∈ (1, 2) .
j  x
Definieren wir l = 0 für 0 ≤ j < l, so ergibt sich die Da die Funktionswerte auch alle positiv sind, gilt also
gesuchte Entwicklung nach Vertauschen der Summations- |f (x)| < 1 für alle x ∈ (1, 2), die Funktion f ist beschränkt.
reihenfolge zu
' ( Andererseits gilt für x < 1/n, n ∈ N:
! n ! n
j j −l
p(z) = aj ẑ (z − ẑ)l
l g(x) > n.
j =0 l=0
⎛ ⎞
! n !n ' ( Die Funktionswerte können also größer werden als jede be-
j
= ⎝ aj ẑj −l ⎠(z − ẑ)l . liebige natürliche Zahl, die Funktion g ist unbeschränkt.
l
l=0 j =0
 Die beiden Funktionen f und g unterscheiden sich nur
=bl im Definitionsbereich, die Abbildungsvorschrift ist dieselbe.
9.2 Beschränkte und monotone Funktionen 311

y f (x)

3 f
2 h

2 x  → g(x)
1

1 x  → f (x)
−1 1 2 3 x
Dg Df
1 2 x −1
Abbildung 9.11 Die beiden Funktionen f und g haben dieselbe Abbildungs-
vorschrift – aber f ist beschränkt, g nicht. x2
Abbildung 9.12 Der Graph der Funktion f (x) = x+1 befindet sich oberhalb
der Geraden h(x) = x − 1, aber unterschreitet die Parallele hδ für genügend
großes x.
Trotzdem ist die eine beschränkt, die andere nicht. Die Situa-
tion ist auch in Abbildung 9.11 veranschaulicht.
mathematisch zu erfassen, verschieben wir den Graphen von
Wie bei Folgen kann man bei reellwertigen Funktionen auch h ein kleines Stück nach oben und erhalten für δ > 0
von nach oben beschränkten oder nach unten beschränk- die Funktion hδ : R → R mit hδ (x) = x − 1 + δ. Setze
ten Funktionen sprechen, wenn xδ = 1/δ − 1. Dann gilt für x ≥ xδ die Ungleichung:
f (x) ≤ C bzw. f (x) ≥ C 1 x≥xδ 1
f (x) = x − 1 + ≤ x−1+
x+1 xδ + 1
für alle x ∈ D gilt. So ist etwa die Funktion f : (0, 1) → R
mit f (x) = x1 zwar, wie wir oben gesehen haben, unbe- = x − 1 + δ = hδ (x) .
schränkt, aber sehr wohl nach unten beschränkt (Abb. 9.11). Für x ≥ xδ gilt also f (x) ≤ hδ (x). Da wir diese Überlegung
Noch allgemeiner kann bei zwei reellwertigen Funktionen für jedes noch so kleine δ > 0 durchführen können, muss
f : D → R, g : D → R mit demselben Definitionsbereich sich der Graph von f also dem Graphen von h immer weiter
die eine Funktion eine Schranke für eine andere Funktion annähern. 
bilden, wenn nämlich die Ungleichung
Eine zweite elementare Eigenschaft, die wir bei Folgen ken-
f (x) ≤ g(x) für alle x ∈ D nengelernt haben, ist die Monotonie. Auch diese lässt sich
ganz analog auf Funktionen übertragen. Bei diesem Begriff
gilt. Dies ist oft ein nützliches Werkzeug: Man kann etwa müssen aber D und W Teilmengen von R sein, denn die
eine kompliziertere Funktion durch eine einfachere beschrän- Menge C ist nicht angeordnet, d. h. Ungleichungszeichen ste-
ken, um auf Eigenschaften der komplizierteren Funktion zu hen uns dort nicht zur Verfügung. Eine Funktion f : D → W
schließen. heißt monoton wachsend bzw. monoton fallend, falls für
x, y ∈ D mit x < y stets
Beispiel Wir betrachten die Funktion f : R>−1 → R, de-
finiert durch f (x) ≤ f (y) bzw. f (x) ≥ f (y)
x2
f (x) = . gilt. Ist in diesen Ungleichungen die Gleichheit nicht zugelas-
x+1
sen, so sprechen wir von einer streng monoton wachsenden
Der Graph der Funktion ist in der Abbildung 9.12 dargestellt.
bzw. einer streng monoton fallenden Funktion.
Indem wir im Zähler eine Null addieren, erhalten wir

f (x) =
x2 − 1 + 1
=x−1+
1
.
?
x+1 x+1 Überlegen Sie sich zwei Funktionen mit derselben Ab-
bildungsvorschrift aber unterschiedlichen Definitionsberei-
Der Bruch 1/(x + 1) ist aber stets positiv für x > −1. Also
chen, sodass die eine monoton wachsend, die andere mono-
folgt
1 ton fallend ist.
f (x) = x − 1 + ≥ x − 1.
x+1
Somit ist f durch die Gerade h mit h(x) = x − 1, x ∈ R,
nach unten beschränkt (Abb. 9.12). Unter anderem können Die beschränkten Funktionen bilden einen
wir daran ablesen, dass f nicht nach oben beschränkt ist,
Vektorraum, die monotonen nicht
denn h ist nicht nach oben beschränkt.
In der Abbildung sieht man aber auch, dass sich der Graph In Abschnitt 6.3 wurden Untervektorräume definiert. Für
von f dem Graphen von h anzunähern scheint. Um dies Funktionen gilt die folgende Aussage:
312 9 Funktionen und Stetigkeit – ε trifft auf δ

Lemma 1. Fall: Es ist x < y. Dann muss f (x) < f (y) sein,
Sei D ⊆ C. Dann ist {u : D → C | u ist beschränkt} da f streng monoton wächst. Dies ist ein Widerspruch zu
ein Untervektorraum des Raums der auf D definierten f (x) = f (y).
komplexwertigen Funktionen.
2. Fall: Es ist x > y. Dann muss auch f (x) > f (y) gelten.
Beweis: Sind f , g : D → C beschränkt durch C1 bzw. Wiederum haben wir einen Widerspruch zu f (x) = f (y).
C2 , so gilt für alle x ∈ D und alle λ ∈ C: Es bleibt also nur x = y. 

|(f + g)(x)| =|f (x) + g(x)| ≤ |f (x)| + |g(x)|


f (x) f (x)
≤ C1 + C 2 ,
|(λf )(x)| =|λ f (x)| = |λ| |f (x)| ≤ |λ| C1 .

Nach der Definition eines Unterraums (siehe Seite 196) bil- f (xj )
f (x0 )
den die beschränkten Funktionen also einen linearen Unter-
raum des Raums der Funktionen.  x1 x2 x3 x x0 x

Abbildung 9.13 Eine nicht monotone Funktion braucht nicht injektiv zu sein
Die Aussage des Lemmas gilt natürlich entsprechend für re-
(links). Eine streng monotone Funktion ist immer injektiv (rechts).
ellwertige Funktionen.
Die Situation ist anders bei den monotonen Funktionen. Wir wollen uns klar machen, dass die Umkehrung dieser
Aussage keinesfalls gilt. Es ist also nicht jede injektive
Beispiel Gegeben sind f , g : [0, 1] → R durch f (x) = x Funktion streng monoton. Dazu betrachten wir die Funktion
sowie g(x) = x 2 . Beide Funktionen sind monoton wachsend. f : [0, 2] → R mit
Setze h = g − f . Dann ist 
' ( x, 0≤x<1
1 2 3 f (x) = ,
2
h(x) = x − x = x − + . 3 − x, 1 ≤ x ≤ 2
2 4
Dann gilt für x, y ∈ [0, 1]: die in Abbildung 9.14 zu sehen ist. Für 0 ≤ x < 1 ist auch
' ( ' ( 0 ≤ f (x) < 1. Dagegen ist für 1 ≤ x ≤ 2 die Unglei-
1 2 1 2 chung 1 ≤ f (x) ≤ 2 erfüllt. Die Bilder der beiden Intervalle
h(x)−h(y) = x − − y− = (x−y) (x+y−1) .
2 2 [0, 1) und [1, 2] unter f haben keine gemeinsamen Punkte.
Es reicht also aus, die beiden Intervalle getrennt zu betrach-
Ist nun 1 ≥ x > y > 1/2, so sind beide Faktoren positiv,
ten. Auf beiden ist f aber streng monoton, also injektiv. Es
also h(x) − h(y) > 0. Ist aber 1/2 > x > y ≥ 0, so ist der
folgt, dass f insgesamt injektiv ist.
erste Faktor positiv, der zweite aber negativ. In diesem Fall
ist h(x) − h(y) < 0.
f (x)
Insgesamt folgt, dass h keine monotone Funktion ist. Die
2
Menge der monotonen Funktionen ist also gegenüber den x → 3 − x
Vektorraumoperationen nicht abgeschlossen. 
1
x → x
Jede streng monotone Funktion ist injektiv
1 2 x
Auf Seite 44 haben wir den Begriff injektiv kennengelernt.
Eine injektive Abbildung hat die Eigenschaft, dass es zu je- Abbildung 9.14 Eine Funktion, die nicht monoton, aber trotzdem injektiv ist:
dem Funktionswert f (x) nur genau ein Urbild x ∈ D gibt. Zu jedem Funktionswert gibt es nur ein Urbild.
Wir wollen uns klar machen, dass dies bei einer streng mo-
notonen Funktion stets der Fall ist. Geometrisch ist diese Auf Seite 48 hatten wir für bijektive Abbildungen die
Aussage sofort klar, wie man in der Abbildung 9.13 sieht. Umkehrabbildung eingeführt. Im Kontext von Funktionen
spricht man entsprechend von der Umkehrfunktion. Ist eine
Lemma Funktion injektiv, so können wir, indem wir den Wertebe-
Ist D ⊆ R, so ist jede streng monotone Funktion f : D → R reich auf das Bild der Funktion einschränken, eine Umkehr-
injektiv. funktion bilden. Aus unserem Lemma ergibt sich somit eine
Aussage zur Existenz von Umkehrfunktionen.
Beweis: Wir beschränken uns auf den Fall einer streng
monoton wachsenden Funktion. Für eine streng monoton fal- Folgerung
lende Funktion geht die Herleitung analog. Wir nehmen an, Jede streng monotone Funktion f : D → f (D) besitzt
dass es zwei Stellen x, y ∈ D mit f (x) = f (y) gibt. eine Umkehrfunktion f −1 : f (D) → D.
9.3 Grenzwerte für Funktionen und die Stetigkeit 313

Eine Bemerkung zum Abschluss: Am Graphen in Abbil-


dung 9.14 ist zu sehen, dass f einen Sprung hat. Im über-
nächsten Abschnitt werden wir uns den Zusammenhang zwi-
schen Monotonie, Injektivität und dem Auftreten von Sprün-
gen genauer klar machen.

9.3 Grenzwerte für Funktionen


und die Stetigkeit
In diesem Kapitel wurden schon die unterschiedlichsten Bei-
spiele für Funktionen betrachtet. In den meisten von uns un-
tersuchten Fällen ist der Graph der Funktion eine glatte Kurve
gewesen, aber wir haben auch schon Graphen mit Sprüngen Abbildung 9.16 Die Bewegung einer Billardkugel beim Stoß mit einem Queue
kennengelernt. Für solch unterschiedliches Verhalten gibt es lässt sich als eine sprunghafte Änderung der Momentangeschwindigkeit ideali-
sieren.
auch Beispiele in den Naturwissenschaften.
Beispiel Zu den essenziellen Instrumenten an Bord jedes
Autos gehört der Tachometer, der zu jedem Zeitpunkt die v(t)
Momentangeschwindigkeit anzeigt (Abb. 9.15). Auch wenn
sich die Anzeige bei entsprechender Fahrweise durchaus
schnell ändern kann, wird sie das niemals sprunghaft tun.

t0 t

Abbildung 9.17 Die Momentangeschwindigkeit einer Billardkugel ist vor und


nach dem Stoß konstant. Im Augenblick des als ideal angenommenen Stoßes
springt sie.

mag sich die Geschwindigkeitsänderung zwar sehr schnell,


aber nicht mehr sprunghaft vollziehen. 

Wie können wir dieses Verhalten nun mathematisch fassen?


Der Unterschied zwischen den beiden Situationen besteht
darin, dass wir im ersten Fall vom Verhalten in der Nähe
Abbildung 9.15 Das Armaturenbrett eines Autos umfasst die Anzeige vieler eines bestimmten Zeitpunkts auf das Verhalten zu diesem
stetiger Funktionen – auch die Momentangeschwindigkeit auf dem Tacho.
Zeitpunkt schließen können. Wir können auch sagen, dass
sich diese Funktion stabil verhält: Eine kleine Änderung des
Beim Billard (Abbildung 9.16) stellt sich die Situation voll- Arguments (des Zeitpunktes) bewirkt nur eine kleine Ände-
kommen anders dar. Dazu wollen wir die Idealisierung des rung des Funktionswerts (der Momentangeschwindigkeit).
vollkommen elastischen Stoßes betrachten, bei dem Impuls Im zweiten Fall ist das nicht möglich, das Verhalten kurz
und Energie erhalten bleiben und ferner noch annehmen, vor dem Stoß hat nichts mit dem Verhalten danach zu tun.
dass es sich bei den Kugeln um starre Körper handelt, sie Die Funktion verhält sich instabil, denn man kann die Ände-
also nicht verformbar sind. Die Kugeln ruhen dann, bis sie rungen in den Funktionswerten nicht dadurch beliebig klein
durch eine andere Kugel einen Impuls erhalten. Dann be- machen, dass man nur sehr kleine Änderungen im Argument
wegen sie sich sofort mit einer gewissen Geschwindigkeit zulässt.
vorwärts. Den Verlauf der Momentangeschwindigkeit einer
Allerdings könnte sich eine Änderung zwar stabil aber sehr
Billardkugel zeigt die Abbildung 9.17.
schnell vollziehen. Dann kann man trotzdem durch sehr
Bei diesen Anwendungen ist das Modell ganz entschei- kleine Änderungen der Argumente nur kleine Änderungen
dend für die mathematischen Eigenschaften der auftretenden der Funktionswerte zulassen. Allerdings müssen wir dann
Funktionen: Wählt man statt des idealisierten vollkommen sehr genau hinsehen, quasi mit einer Lupe. Die Rolle dieser
elastischen Stoßes zwischen starren Körpern eine andere Be- mathematischen Lupe werden konvergente Folgen überneh-
schreibung der Impulsübertragung für die Billardkugeln, so men.
314 9 Funktionen und Stetigkeit – ε trifft auf δ

Definition x̂ konvergiert. Dann folgt


Seien f : D → W eine Funktion und x̂, y ∈ C. Es heißt y
Grenzwert von f (x) für x gegen x̂, falls es eine Folge (xn ) lim f (xn ) = lim (xn xn )
n→∞ n→∞
in D mit lim xn = x̂ gibt und für jede solche Folge gilt,   
dass
n→∞ = lim xn lim xn = x̂ 2 = f (x̂).
n→∞ n→∞
lim f (xn ) = y
n→∞ Für jedes x̂ ∈ R existiert also der Grenzwert von f (x) für
(Abb. 9.18). Diese Tatsache drückt man dann in einer Formel x gegen x̂, und es ist
durch
lim f (x) = y lim f (x) = f (x̂) .
x→x̂
x→x̂
aus.
Wir wählen nun g : R → R mit
f (x) 
1, x ≥ 0
g(x) =
0, x < 0

y
und eine nicht negative reelle Nullfolge (xn ). Dann ist

(f (xn )) lim g(xn ) = lim 1 = 1 .


n→∞ n→∞

Wählt man dagegen eine negative reelle Nullfolge (yn ),


so folgt:
(xn ) x̂ x lim g(yn ) = lim 0 = 0 .
n→∞ n→∞
Abbildung 9.18 Die Definition des Grenzwerts für Funktionswerte: Für jede
Somit existiert der Grenzwert lim g(x) nicht.
Folge (xn ) mit xn → x̂ konvergiert f (xn ) gegen y. In der Abbildung ist nur x→0
eine solche Folge gezeigt, es kann auch jede andere gegen x̂ konvergente Folge Als drittes Beispiel betrachten wir h : (0, 2) → C mit
aus dem Definitionsbereich gewählt werden.
i+x
h(x) = , x ∈ (0, 2) .
i−x
Achtung: Die Definitionen für Grenzwerte von Funkti- Existiert limx→2 h(x) ? Zwar ist 2 ∈ / (0, 2), aber die Folge
onswerten in der Literatur sind in Details unterschiedlich. (2 − n1 ) ist aus dem Definitionsbereich von h und konver-
Anders als wir schließen manche Autoren z. B. aus, dass die giert gegen 2. Ferner gilt für jede Folge (xn ) aus (0, 2) mit
Folgenglieder gleich x̂ sein können. Berücksichtigen Sie im Grenzwert 2 nach den Rechenregeln für Folgen:
Folgenden, dass eine andere Grenzwertdefinition ggf. andere
oder zusätzliche Voraussetzungen bei der Formulierung von i + xn i + lim xn i+2
n→∞
Aussagen erfordert. lim h(xn ) = lim = = .
n→∞ n→∞ i − xn i − lim xn i−2
n→∞

Aus der Eindeutigkeit des Grenzwerts für Folgen (Seite 285) Somit ist
i+2
ergibt sich automatisch, dass auch die Zahl lim f (x) eindeu- lim h(x) = . 
x→x̂ x→2 i−2
tig bestimmt ist, sofern der Grenzwert existiert. Ist x̂ ∈ D, so
Anhand ihres Graphen würden wir sagen, dass die zweite
ergibt sich auch unmittelbar, dass lim f (x) = f (x̂) ist. Aber
x→x̂ Funktion aus dem Beispiel einen Sprung besitzt. Wir erhal-
der Grenzwert ist auch für Punkte definiert, die nicht in D lie- ten unterschiedliche Grenzwerte wenn wir uns der Stelle x̂
gen, sich aber durch eine Folge aus D approximieren lassen. auf unterschiedlicher Weise nähern. Die Folge ist, dass der
Im Abschnitt 9.4 werden wir die Menge dieser Punkte den Grenzwert nicht existiert. Eine besondere Bedeutung aber
Abschluss von D nennen. Will man dagegen einen Grenzwert haben Funktionen, bei denen der Grenzwert von f (x) für
x → x̂ bilden und explizit den Funktionswert an der Stelle x → x̂ immer existiert, wenn x̂ im Definitionsbereich liegt.
x̂ außer Acht lassen, so kann man durch die Notation

lim f (x) Definition der Stetigkeit


x→x̂
x=x̂ Eine Funktion f : D → W heißt an der Stelle x̂ ∈ D
stetig, falls
deutlich machen, dass man keine Folgen zulässt, bei denen
lim f (x) = f (x̂)
Glieder gleich x̂ sind. x→x̂
gilt. Ist f an jedem x ∈ D stetig, so heißt f auf D stetig.
Beispiel Die Menge aller auf D stetigen Funktionen bezeichnen
Setze f (x) = x 2 , x ∈ R und wähle x̂ ∈ R beliebig. Nun wir mit C(D).
wählen wir eine beliebige Folge (xn ) aus R aus, die gegen
9.3 Grenzwerte für Funktionen und die Stetigkeit 315

Noch klarer wird die Bedeutung dieses Begriffs mit der For- y
mel   f (x̂) + ε
lim f (x) = f lim x .
x→x̂ x→x̂ f (x̂)
Ist eine Funktion also an einer Stelle x̂ stetig, so darf man die
f (x̂) − ε
Grenzwertbildung gegen x̂ und die Anwendung der Funktion
vertauschen. Entscheidend hierbei ist, dass die Ausdrücke
auf beiden Seiten dieser Gleichung überhaupt existieren, die x
x̂ − δ x̂ x̂ + δ
Gleichheit ergibt sich dann von selbst.
Abbildung 9.19 Die Situation bei der ε-δ-Definition der Stetigkeit.
?
Wieso ergibt sich aus der Existenz der beiden obigen Aus-
drücke sofort ihre Gleichheit? δ-Umgebung durch f in die ε-Umgebung abgebildet wird.
Wegen dieses Zusammenspiels von ε und δ spricht man auch
von der ε-δ-Definition der Stetigkeit. Die Zusammenhänge
Die Funktion f (x) = x 2 , x ∈ R aus dem Beispiel oben ist sind in der Abbildung 9.19 dargestellt.
also auf ganz R stetig. Die zweite Funktion aus dem Beispiel,
g, ist im Punkt 0 nicht stetig. ?
Können Sie in der ε-δ-Definition der Stetigkeit statt < δ
Beispiel Wir betrachten ein weiteres Beispiel dieser Art, bzw. statt < ε auch ≤ δ bzw. ≤ ε schreiben? Welche Kom-
das Polynom p : C → C mit p(x) = 5x 2 − 2x + 1, das binationen dieser Ungleichungen sind äquivalent zu der hier
wir an der Stelle x̂ = 0 auf Stetigkeit überprüfen wollen. gegebenen Definition?
Gegeben ist eine beliebige Nullfolge (xk ). Dann gilt nach den
Rechenregeln für Grenzwerte von Folgen (siehe Seite 290):
  Beweis: Wir geben uns dazu eine Funktion f : D → W
lim p(xk ) = lim 5xk2 − 2xk + 1 = 1 = p(0). vor.
k→∞ k→∞
(i) Aus der Stetigkeit definiert durch Grenzwerte folgt die
Da die Folge (xk ) ganz beliebig war, folgt also: ε-δ-Stetigkeit.
Für ein x̂ ∈ D und jede Folge (xn ) aus D mit lim xn = x
n→∞
lim p(x) = p(0); gelte lim f (xn ) = f (x). Wir nehmen aber an, dass
x→0 n→∞
f in x̂ im Sinne der ε-δ-Definition nicht stetig ist. Das
das Polynom p ist also in 0 stetig. 
bedeutet: Es gibt ein ε > 0, sodass für alle δ > 0 ein
x(δ) ∈ D existiert mit
Eine alternative Charakterisierung der |x(δ) − x̂| < δ, aber |f (x(δ)) − f (x̂)| ≥ ε.
Stetigkeit Wir setzen speziell δ = 1/n und xn = x(1/n). Somit ha-
ben wir eine Folge (xn ) aus D \ {x̂} erhalten, die gegen x̂
Es gibt eine zweite äquivalente Definition des Begriffs der konvergiert. Dann konvergiert nach Voraussetzung auch
Stetigkeit, die ohne Folgen auskommt und auf den franzö- (f (xn )) gegen f (x̂). Nach der Definition eines Grenz-
sischen Mathematiker Augustin Louis Cauchy (1789–1857) werts existiert zu dem vorgegebenen ε also ein n ∈ N
zurückgeht. Salopp gesprochen ist eine Funktion f in x̂ ste- mit |f (xn ) − f (x̂)| < ε. Dies ist ein Widerspruch zu der
tig, falls für Stellen x dicht bei x̂ auch die Funktionswerte Definition der xn . Somit ist f in x̂ auch im Sinne der
f (x) dicht bei f (x̂) liegen. ε-δ-Definition stetig.
Mathematisch fassen wir den heuristischen Begriff dicht bei (ii) Aus der ε-δ-Definition der Stetigkeit folgt die Stetigkeit
durch die Verwendung von Umgebungen. Es kommen also definiert durch Grenzwerte.
zwei verschiedene Sorten von Umgebungen ins Spiel: solche Es sei f im Sinne der ε-δ-Definition in x̂ stetig, und wir
um x̂ und solche um f (x̂). wählen eine Folge (xn ) aus D \ {x̂} vor, die gegen x̂
konvergiert. Wir wählen auch ε > 0. Dann existiert ein
δ > 0 mit
Äquivalenz der ε-δ-Definition der Stetigkeit
|f (xn ) − f (x̂)| < ε, falls |xn − x̂| < δ .
Eine Funktion f : D → W ist an der Stelle x̂ ∈ D
genau dann stetig, wenn für jedes ε > 0 ein δ > 0 Wähle nun N ∈ N mit |xn − x̂| < δ für alle n ≥ N . Dann
existiert, sodass für alle x ∈ D mit |x − x̂| < δ auch folgt:
|f (x) − f (x̂)| < ε folgt.
|f (xn ) − f (x̂)| < ε für alle n ≥ N .
Vorgegeben wird also eine ε-Umgebung um f (x̂). Zu dieser Mit anderen Worten: Die Folge (f (xn )) konvergiert ge-
muss es eine passende δ-Umgebung um x̂ geben, sodass diese gen f (x̂). 
316 9 Funktionen und Stetigkeit – ε trifft auf δ

Beispiel Auch zu dieser Definition der Stetigkeit betrach- p ist also in x̂ stetig. Da aber auch x̂ beliebig gewählt war,
ten wir als Beispiel das Polynom p : C → C mit p(x) = haben wir die Stetigkeit von p auf ganz C nachgewiesen.
5x 2 − 2x + 1 und x̂ = 0. Zu vorgegebenem ε > 0 müssen (ii) Beweis über ε-δ-Formalismus:
wir ein δ > 0 finden, sodass die Aussage aus der Definition Wir geben uns x̂ ∈ C und ε > 0 vor und setzen
erfüllt ist. Dazu betrachten wir  
ε
δ = min 1, .
|p(x) − p(x̂)| = |5x 2 − 2x| ≤ 5|x|2 + 2|x| , n max {|αj | (|x̂| + 1)j −1 }
j =1,...,n
wobei wir im letzten Schritt die Dreiecksungleichung ange-
wandt haben. Ferner ist in diesem Beispiel |x − x̂| = |x|. Dieses δ ist so gewählt, dass es genau für die folgenden
Somit ist δ in Abhängigkeit von ε so zu wählen, dass die Überlegungen passt. Aus δ ≤ 1 folgt nämlich für alle
Ungleichung x ∈ D mit |x − x̂| < δ die Abschätzung
5δ 2 + 2δ < ε
|x| = |x − x̂ + x̂| < δ + |x̂| ≤ |x̂| + 1 .
erfüllt ist.
Daher ist mit der Verallgemeinerung der dritten binomi-
Nun geben wir uns ε > 0 beliebig vor. Dann wählen wir δ so,
schen Formel
dass sowohl δ < 1 als auch δ < ε/7 ist. Dann folgt δ 2 < δ
und somit !
n
5δ 2 + 2δ < 7δ < ε . |p(x̂) − p(x)| ≤ |αj | |x̂ j − x j |
j =1
Also gilt für alle x ∈ C mit |x−x̂| = |x| < δ die Abschätzung ) )
)j −1 )
!
n
)! )
|p(x) − p(x̂)| ≤ 5|x|2 + 2|x| < 5δ 2 + 2δ < ε .  = ) l j −1−l )
|αj | ) (x̂ − x) x̂ x )
j =1 ) l=0 )

!
n −1
j!
<δ |αj | |x̂|l |x|j −1−l .
Jedes Polynom ist stetig
j =1 l=0

Zu den einfachsten Funktionen gehören die Polynome. In den Die Summanden in der inneren Summe können wir mit
Beispielen oben hatten wir schon ein spezielles Polynom in den oben gefundenen Ungleichungen abschätzen:
x̂ = 0 auf Stetigkeit untersucht. Wir zeigen nun, dass jedes
beliebige Polynom in jedem Punkt der komplexen Zahlen- |x̂|l |x|j −1−l < (|x̂| + 1)l (|x̂| + 1)j −1−l
ebene stetig ist.
= (|x̂| + 1)j −1 .

Stetigkeit der Polynome Somit folgt wegen δ ≤ ε/(n max {|αj | (|x̂| +1)j −1 }):
j =1,...,n
Jedes Polynom ist ein Element von C(C).

!
n −1
j!
Beweis: Mit p : C → C bezeichnen wir ein Polynom vom |p(x̂) − p(x)| < δ |αj | (|x̂| + 1)j −1
Grad n, j =1 l=0
!
n
p(x) = j
αj x , ≤ δ n max {|αj | (|x̂| + 1)j −1 }
j =1,...,n
j =0
≤ ε. 

mit irgendwelchen komplexen Koeffizienten αj ∈ C. Wir


wollen einmal für beide Definitionen der Stetigkeit beweisen,
dass p stetig ist, um die Vorgehensweisen zu verdeutlichen.
Natürlich reicht einer der beiden Beweise aus.
Manche Funktionen kann man außerhalb ihres
(i) Beweis über Grenzwerte: Definitionsbereichs stetig fortsetzen
Wir geben uns x̂ ∈ C und eine Folge (xk ) in C vor, die
gegen x̂ konvergiert. Dann gilt nach den Rechenregeln Von Stetigkeit einer Funktion f in einer Stelle x̂ kann man nur
für Grenzwerte von Folgen: sprechen, wenn ein Funktionswert an der Stelle x̂ definiert
!
n !
n ist. Liegt x̂ außerhalb des Definitionsbereichs D von f , so
j
lim p(xk ) = αj lim xk = αj x̂ j = p(x̂). kann aber immer noch versucht werden, den Grenzwert
k→∞ k→∞
j =0 j =0
lim f (x)
Da die Folge (xk ) beliebig gewählt war, gilt also: x→x̂

zu bilden, wenn es zumindest eine Folge (xn ) aus D gibt, die


lim p(x) = p(x̂);
x→x̂ gegen x̂ konvergiert.
9.3 Grenzwerte für Funktionen und die Stetigkeit 317

Beispiel: Nachweis der Stetigkeit mit ε und δ


Verwenden Sie die ε-δ-Definition der Stetigkeit, um zu zeigen, dass folgende Funktionen in ihrem ganzen Definitionsbereich
stetig sind: ⎧ ⎧
⎨ R≥0 −→ R ⎨ R −→ R
(a) f : , (b) g : x .
⎩ x → √ 3
x ⎩ x →
1 + x2

Problemanalyse und Strategie: Um f an der Stelle x̂ auf Stetigkeit zu untersuchen, schätzen wir den Ausdruck
f (x) − f (x̂) so ab, dass ein Produkt aus der Differenz x − x̂ und einem Produkt entsteht, das nicht mehr von x abhängt.
Dieses Produkt liefert die notwendige Information zur Wahl von δ in Abhängigkeit von ε und x̂. Es reicht übrigens auch,
eine Potenz von x − x̂ als ersten Faktor zu erhalten.

Lösung: x x̂
g(x) − g(x̂) = −
(a) Wir betrachten zunächst für x̂, x ∈ R≥0 die Differenz 1+x 2 1 + x̂ 2
der beiden Funktionswerte: x (1 + x̂ ) − x̂ (1 + x 2 )
2
√ =
3 √ (1 + x̂ 2 ) (1 + x 2 )
f (x̂) − f (x) = x̂ − 3 x
(1 − x x̂) (x − x̂)
x̂ − x = .
= . (1 + x̂ 2 ) (1 + x 2 )
x̂ 2/3 + x̂ 1/3 x 1/3 + x 2/3
Durch Anwendung des Betrags, der Dreiecksungleichung
Hier haben wir die Formel und der Abschätzung x 2 ≥ 0 erhalten wir:
a 3 − b3 = (a − b) (a 2 + ab + b2 ) 1 + |x x̂|
|g(x) − g(x̂)| ≤ |x − x̂| .
verwendet, die es entsprechend auch für höhere Potenzen 1 + x̂ 2
gibt. Wir machen nun die Annahme |x − x̂| ≤ 2. Somit ist
Um den Nenner zu vereinfachen, wollen wir annehmen, |x| ≤ |x̂| + 2, und es folgt:
dass x ≥ x̂/2 gilt. Dann folgt: 1 + 2 |x̂| + |x̂|2
|g(x) − g(x̂)| ≤ |x − x̂|
|x̂ − x| 1 + x̂ 2
|f (x̂) − f (x)| =
x̂ 2/3 + x̂ 1/3 x 1/3 + x 2/3 (1 + |x̂|)2
= |x − x̂| .
|x̂ − x| 4 |x̂ − x| 1 + x̂ 2
≤ 1 1
= .
x̂ (1 + 2 + 4 )
2/3 7 x̂ 2/3
Mit der allgemein gültigen Ungleichung
Damit ist eine Schranke der gewünschten Form gefunden. (a + b)2 ≤ 2a 2 + 2b2
Sei nun ε > 0. Wir wählen
  folgt hieraus:
x̂ 7 x̂ 2/3 ε
δ = min , . 2 + 2|x̂|2
2 4 |g(x) − g(x̂)| ≤ |x − x̂| = 2|x − x̂| .
1 + x̂ 2
Der erste Term garantiert, dass die Annahme oben er- Dies ist die gewünschte Form. Wir geben nun ε > 0 vor
füllt ist. Den zweiten setzen wir nun ein, denn es folgt und wählen δ durch
für |x̂ − x| ≤ δ:  ε
δ = min 2, .
4δ 2
|f (x̂) − f (x)| ≤ ≤ ε.
7 x̂ 2/3 Für |x − x̂| ≤ δ folgt:
Somit ist f in jedem x̂ ≥ 0 stetig. ε
|g(x) − g(x̂)| ≤ 2 = ε.
(b) Für x, x̂ ∈ R betrachten wir zunächst wieder die Dif- 2
ferenz der Funktionswerte. Somit ist g in jedem x̂ ∈ R stetig.

Kommentar:
Machen Sie sich jeweils genau klar, wie die Definition von δ zustande kommt. Durch die Bildung des Minimums
sind in beiden Teilaufgaben zwei Ungleichungen erfüllt. Wo wird jede davon verwendet?
Ein wesentlicher Unterschied zwischen beiden Teilaufgaben liegt darin, dass im ersten Fall die Wahl von δ von x̂
und von ε abhängt, im zweiten Fall nur von ε. Später werden wir Funktionen, bei der der zweite Fall vorliegt, als
gleichmäßig stetig bezeichnen.
318 9 Funktionen und Stetigkeit – ε trifft auf δ

Übersicht: Stetige Funktionen und Unstetigkeiten


In dieser Übersicht werden die wichtigsten stetigen Funktionen zusammengestellt. Auch die wichtigsten Beispiele für
Unstetigkeiten sind noch einmal aufgeführt.

Polynomfunktionen Insbesondere sind alle Wurzelfunktionen


Ein Polynom √
!
n f (x) = q
x
j
p(z) = αj z ,
j =0 auf R≥0 stetig.
ist an jeder Stelle z ∈ C definiert und stetig. Transzendente Standardfunktionen
Rationale Funktionen Die im Kapitel 11 vorgestellten Funktionen
Eine rationale Funktion
exp ln sin cos
p(z)
f (z) =
q(z) sind auf ihrem gesamten Definitionsbereich stetig.
Für den natürlichen Logarithmus gilt:
mit zwei Polynomen p, q ist an jeder Stelle z ∈ C stetig,
an der sie definiert ist (d. h., an der q(z)  = 0 gilt). lim ln(x) = −∞.
x→0
An Nullstellen des Nenners, die nicht gleichzeitig Null-
stellen des Zählers sind, haben rationale Ausdrücke einen Man spricht von einer Singularität.
Pol. Ist ein Funktionswert an dieser Stelle festgelegt, ist
die Funktion dort nicht stetig. Sprünge
Ist f : D → R eine Funktion mit D ⊆ R und gilt
Potenzfunktionen
Eine Funktion der Form lim f (x) = lim f (x),
x→x̂− x→x̂+
p/q
f (x) = x
so spricht man von einem Sprung an der Stelle x̂. Ist x̂ ∈ D,
für p ∈ Z und q ∈ N ist in allen Stellen x ∈ (0, ∞) stetig. so ist f an der Stelle x̂ nicht stetig.

Stetige Fortsetzung so ist


x−1
Eine Funktion f : D → C heißt nach x̂ ∈
/ D stetig f (x) = , x ∈ C \ {1, −1} .
x+1
fortsetzbar, wenn der Grenzwert
Somit können wir den Grenzwert für x → 1 bilden, und es
lim f (x) ist
1−1
x→x̂ lim f (x) = = 0.
x→1 1+1
existiert. In diesem Fall ist die Funktion f˜ : D∪{x̂} → C Somit ist f nach 1 stetig fortsetzbar.
mit ⎧
⎨f (x) , x ∈ D, In dem Punkt −1 ist f nicht stetig fortsetzbar. Für die Folge
f˜(x) = xn = −1 + 1/n, n ∈ N, ist
⎩ lim f (x) , x = x̂
x→x̂
−2 + 1/n
f (xn ) = = 1 − 2n .
stetig in x̂ und heißt stetige Fortsetzung von f nach x̂. 1/n

Übliche Beispiele für diesen Begriff sind rationale Funktio- Die Folge (f (xn )) ist unbeschränkt und konvergiert daher
nen an Stellen, in denen ihr Nenner eine Nullstelle hat. Es nicht. Somit existiert auch der Grenzwert limx→−1 f (x)
sei aber darauf hingewiesen, dass der Begriff der stetigen nicht. 
Fortsetzung durchaus eine weittragende Bedeutung besitzt.
Insbesondere im Hinblick auf die Stetigkeit von Ableitungen
Die stetigen Funktionen bilden einen
(siehe Seite 559) werden wir wieder darauf zurückkommen.
Vektorraum
Beispiel Betrachten wir f : C \ {−1, 1} → C mit Das vorangegangene Beispiel zeigt, dass es sehr mühsam
ist, bei der Verwendung von Grenzwerten für Funktionen
x 2 − 2x + 1 immer mit Folgen oder -δ-Definition hantieren zu müssen.
f (x) = , x ∈ C \ {1, −1} ,
x2 − 1 Glücklicherweise ist das auch gar nicht notwendig: Da die
9.3 Grenzwerte für Funktionen und die Stetigkeit 319

Grenzwertdefinition auf der Konvergenz für Folgen beruht, eine Richtung zu beschränken. Dazu betrachten wir etwa alle
übertragen sich alle Rechenregeln für Grenzwerte, die wir Folgen (xn ) aus D mit Grenzwert x̂ und xn > x̂ für alle
von den Folgen her kennen, auf das Rechnen mit Funktionen. n ∈ N. Wir nähern uns x̂ also stets von oben. Existiert nun
Die Übersicht auf Seite 290 listet alle diese Regeln auf. Sie eine solche Folge sowie für jede solche Folge der Grenzwert
gelten ganz entsprechend bei Grenzwerten für Funktionen. limn→∞ f (xn ), und sind alle diese Grenzwerte gleich, so
Wir werden sie ab jetzt verwenden und uns dadurch das Leben setzen wir
erheblich vereinfachen. lim f (x) = lim f (xn ).
x→x̂+ n→∞
Die Rechenregeln beinhalten insbesondere das Bilden der Analog definiert man den Grenzwert limx→x̂− f (x) für
Summen und von skalaren Vielfachen von Funktionen. Damit einen Grenzwert von unten.
ergibt sich direkt die folgende Aussage:
Für diese einseitigen Grenzwerte findet man in der Literatur
Satz auch andere Notationen. So ist es etwa auch üblich einen
Für D ⊆ C bildet die Menge C(D) einen Vektorraum schrägen Pfeil beim Limessymbol zu verwenden:
über C.
lim f (x) = lim f (x) und lim f (x) = lim f (x).
x3x̂ x→x̂− x4x̂ x→x̂+
Schränken wir uns auf reellwertige Funktionen ein, so erhal-
ten wir analog einen Vektorraum über R. Noch kürzer ist die Schreibweise f (x̂−) = lim f (x).
x→x̂−
Genauso sind auch Produkte von stetigen Funktionen wieder Es gibt nun drei typische Situationen, bei denen Funktionen
stetig, und auch andere grundlegende Rechenoperationen er- unstetig sein können, die wir im Folgenden vorstellen wollen.
halten die Stetigkeit. Die Übersicht auf Seite 318 listet die
wichtigsten Fälle stetiger Funktionen auf. Beispiel
Die Funktion f : [0, 2] → R mit
? 
Bildet die Menge C(D) mit der Multiplikation einen Ring x2, 0 ≤ x ≤ 1,
oder sogar einen Körper? f (x) = x
2 + 1, 1 < x ≤ 2

ist in der Abbildung 9.20 links dargestellt. Der Graph die-


Eine Operation, die bei Funktionen zusätzlich auftritt, ist die
ser Funktion hat einen Sprung. Die Vermutung liegt nahe,
Verkettung. Auch diese Operation erhält die Stetigkeit.
dass f an dieser Stelle nicht stetig ist.
In der Tat ist
Satz
x  3
Sind D, W , V ⊆ C und f : D → W und g : W → V auf D
lim f (x) = lim + 1 = = 1 = f (1).
bzw. W stetig, so ist auch h = g ◦ f auf D stetig. x→1+ x→1+ 2 2
Also ist f in 1 nicht stetig
Beweis: Wir wählen x̂ ∈ D und eine Folge (xn ) aus D Die Funktion g : [−1, 1] → R soll durch
aus, die gegen x̂ konvergiert. Da f stetig ist, ist dann (f (xn )) 
eine Folge in W , die gegen f (x̂) ∈ W konvergiert. Nun 1
, x = 0
g(x) = x
verwenden wir die Stetigkeit von g, 0, x = 0

lim h(xn ) = lim g(f (xn )) definiert sein. Der Graph ist in der Abbildung 9.20 rechts
n→∞ n→∞
  dargestellt. Eine Stelle wie die 0 bei 1/x nennt man eine
= g lim f (xn ) = g(f (x̂)) = h(x̂) . Singularität. In der Tat ist g in der Nähe von null unbe-
n→∞
schränkt, weder der Grenzwert limx→0− g(x) noch der
Also ist h in x̂ ∈ D stetig. Da x̂ beliebig gewählt war, ist h Grenzwert limx→0+ g(x) existieren, aber g ist in null de-
auf D stetig. 
finiert. Somit ist g in null nicht stetig.
Als dritten Fall betrachten wir die Funktion h : R → R
mit: 
0,   x ≤ 0,
Bei einseitigen Grenzwerten beschränkt man h(x) =
sin x1 , x > 0,
sich auf bestimmte Folgen
wobei wir im Vorgriff auf deren Definition in Kapi-
Um den Begriff der Stetigkeit noch besser verstehen zu kön- tel 11 die Sinusfunktion verwenden. Diese ist auf R
nen, wollen wir uns mit Funktionen beschäftigen, die nicht definiert, stetig und 2π-periodisch. Den Graphen von
stetig sind. Vorher definieren wir noch ein wichtiges Hilfs- h zeigt die Abbildung 9.21. Während der Grenzwert
mittel. Insbesondere bei Funktionen mit Sprüngen ist es oft limx→0− h(x) existiert (und gleich null ist), existiert der
nützlich, sich bei der Bestimmung eines Grenzwerts nur auf Grenzwert limx→0+ h(x) nicht. Es lässt sich für jedes
320 9 Funktionen und Stetigkeit – ε trifft auf δ

f (x) f (x) so schreiben wir kurz


2 1
lim f (x) = ∞.
x→x̂

1 Ganz analog ist


1 x lim f (x) = −∞
x→x̂
definiert. In diesen Situationen sprechen wir von einem unei-
1 2 x gentlichen Grenzwert und sagen f geht für x gegen x̂ gegen
Abbildung 9.20 Links: Unstetigkeit durch einen Sprung; rechts: Unstetigkeit plus (oder minus) unendlich.
durch eine Singularität.
Analog definieren wir einseitige uneigentliche Grenzwerte
(x → x̂±) und uneigentliche Grenzwerte der Form
f (x)
1 lim f (x),
x→±∞

um das Verhalten einer Funktion für sehr große Argumente


zu charakterisieren.
1 2 1 2 x
2π 3π π π f (x) g(x)

−1 1 1
f
Abbildung 9.21 Unstetigkeit durch Oszillation. g

1 x 1 x
y ∈ [−1, 1] eine Folge (xn ) mit limn→∞ xn = 0 und
limn→∞ h(xn ) = y konstruieren. Man spricht von einer
Oszillationsstelle.  −1 −1

Abbildung 9.22 Zwei Funktionen mit einer Singularität bei 1. Für f existiert der
Achtung: Für die vorangegangenen Beispiele ist es we- uneigentliche Grenzwert limx→1 f (x) = ∞. Bei g existieren nur die einseitigen
sentlich, dass die Unstetigkeitsstelle zum Definitionsbereich uneigentlichen Grenzwerte limx→1− g(x) = −∞ und limx→1+ g(x) = ∞.
der Funktion gehört. Betrachtet man etwa f : R \ {0} → R
mit f (x) = 1/x, so ist diese Funktion auf ihrem gesamten
Beispiel Die Funktion f : R \ {−1} → R mit
Definitionsbereich stetig! Dies ist die Grenze der anschau-
lichen Vorstellung, dass eine Funktion stetig ist, wenn man x2 + x + 2 2
ihren Graphen zeichnen kann, ohne den Stift dabei abzuset- f (x) = =x+
x+1 x+1
zen. Von Stetigkeit kann man nur an einer Stelle sprechen,
an der die Funktion auch definiert ist. hat an der Stelle −1 eine Singularität. An der zweiten Dar-
stellung lässt sich das Verhalten der Funktion gut ablesen:
Für x < −1 ist der Nenner des Bruchs stets negativ. Er kon-
vergiert gegen null für x → −1, während der erste Summand
Bei unbeschränkten Funktionen können in x beschränkt bleibt, also gilt:
manchen Fällen uneigentliche Grenzwerte 2
lim f (x) = lim = −∞.
definiert werden x→−1− x→−1− x + 1

Dagegen ist der Nenner des Bruchs für x > −1 stets positiv,
Für den Fall von Singularitäten kann man die Definition des hier gilt
Grenzwerts für Funktionen erweitern, um auch in diesen Si-
tuationen mit einer einfachen Darstellung durch eine Formel 2
lim f (x) = lim = +∞.
arbeiten zu können. Betrachten wir dazu eine reellwertige x→−1+ x→−1+ x+1
Funktion f : D → W , W ⊆ R und eine konvergente Folge
Für betragsmäßig große Werte von x dominiert der erste Sum-
(xn ) in D mit limn→∞ xn =: x̂. Es muss dabei x̂ selbst kein
mand, das x, denn der Bruch konvergiert hier gegen null. Hier
Element von D sein.
gilt
Gibt es nun für jede Zahl C > 0 und jede Folge (xn ) aus D
mit limn→∞ xn = x̂ ein N ∈ N mit lim f (x) = lim x = −∞,
x→−∞ x→−∞
lim f (x) = lim x = ∞. 
f (xn ) > C für alle n ≥ N, x→∞ x→∞
9.3 Grenzwerte für Funktionen und die Stetigkeit 321

Beispiel: Unstetigkeit bei einer komplexen Funktion


Ist die Funktion f : C → C mit ⎧
⎨z − z, z = 0,
f (z) = z z

0, z=0
an der Stelle z = 0 stetig?

Problemanalyse und Strategie: Beim Nachweis von Stetigkeit im Komplexen muss man sicherstellen, dass man das
Verhalten einer Funktion an der zu untersuchenden Stelle in allen Richtungen betrachtet. Aus einzelnen Richtungen mag
eine Funktion stetig erscheinen, aber aus anderen nicht. Dies ist hier der Fall.

Lösung: Es ist also limn→∞ f (zn ) = 2i = f (0). Die Funktion f


Als eine erste Folge betrachten wir (zn ) mit zn = 1/n. ist in 0 nicht stetig.
Dann gilt:
zn zn Im f (z)
= = 1.
zn zn
Damit ist dann f (zn ) = 0 für alle n ∈ N, und damit gilt
limn→∞ f (zn ) = 0 = f (0).
Doch dieses Ergebnis stimmt nicht für alle Folgen, wie
wir anhand einer zweiten Folge nachprüfen können. Wir
wählen (zn ) mit

1+i
zn = , n ∈ N.
n
Im z
Auch hier gilt limn→∞ zn = 0, allerdings ist nun Re z

zn 1+i
= = i.
zn 1−i Die Abbildung zeigt einen Ausschnitt des Graphen des
Imaginärteils von f . Man kann gut das Verhalten von f in
Damit folgt:
der Nähe der Stelle 0 erkennen: je nachdem aus welcher
zn Richtung in der komplexen Zahlenebene man sich nähert,
= −i und daher f (zn ) = 2i. erhält man einen anderen Grenzwert für z → 0.
zn

Eine Lipschitzkonstante quantifiziert die Lipschitzkonstante quantifiziert den Zusammenhang zwi-


Stetigkeit schen der Lage von Stellen, an denen eine Funktion aus-
gewertet wird, und den entsprechenden Funktionswerten.
Bei einer stetigen Funktion gibt das Verhalten der Funktion Sie gibt eine Höchstrate der Änderung der Funktionswerte
in der Nähe einer Stelle Auskunft über das Verhalten an der an.
Stelle selbst. Allerdings liefert die Definition keine Aussagen
darüber, wie dicht man der Stetigkeitsstelle kommen muss, Lemma
damit sich der Funktionswert innerhalb einer bestimmten Eine auf D lipschitz-stetige Funktion ist auf D auch
Umgebung des Werts an dieser Stelle befindet. stetig.

Der Beweis ergibt sich direkt aus der obigen Überlegung und
Definition einer lipschitz-stetigen Funktion
der ε-δ-Definition der Stetigkeit. Es ergibt sich, dass für ein
Falls für eine Funktion f : D → W eine Konstante ε immer δ = ε/L gewählt werden kann, unabhängig davon,
L > 0 mit der Eigenschaft an welcher Stelle x ∈ D die Funktion betrachtet wird. Damit
ist die Lipschitz-Stetigkeit ein Spezialfall der gleichmäßigen
|f (x) − f (y)| ≤ L |x − y| für alle x, y ∈ D
Stetigkeit (siehe Seite 331).
existiert, so nennen wir die Funktion lipschitz-stetig mit Direkt aus der Definition ergibt sich, dass Summen und
Lipschitzkonstante L. skalare Vielfache lipschitz-stetiger Funktionen selbst wie-
der lipschitz-stetig sind. Somit bildet die Menge der auf
Für eine lipschitz-stetige Funktion haben wir somit die Aus- D lipschitz-stetigen Funktionen einen Untervektorraum von
sage: Ist |x−y| ≤ ε/L, so folgt sofort |f (x)−f (y)| ≤ ε. Die C(D).
322 9 Funktionen und Stetigkeit – ε trifft auf δ

Sehr gut kann man sich den Begriff am Beispiel der Wurzel- sehen werden, sind ihre Bildmengen wieder Intervalle. Je-
funktion klar machen (Abb. 9.23). Wir betrachten D = [δ, 1] doch kann sich der Typus der Intervalle ändern. Betrachtet
mit δ > 0 und setzen man z. B. D = (−1, 1) und f : D → R mit f (x) = x 2 , dann
√ ist f (D) = [0, 1).
f (x) = x, x ∈ D.
Im Abschnitt über komplexe Zahlen hatten wir offene und
Dann gilt für δ ≤ y ≤ x ≤ 1 die Abschätzung: abgeschlossene Kreisscheiben eingeführt. Für r > 0 und
a ∈ C hatten wir Ur (a) = {z ∈ C | |z − a| < r} die
√ √ x−y 1 offene Kreisscheibe und U r (a) = {z ∈ C | |z − a| ≤ r} die
|f (x) − f (y)| = x− y= √ √ ≤ √ |x − y|.
x+ y 2 δ abgeschlossene Kreisscheibe mit Mittelpunkt a und Radius
r genannt.
Da
1 1 Ziel dieses Abschnitts ist es, die Begriffe offen und abge-
√ √ → √ x, y → δ,
x+ y 2 δ schlossen zu präzisieren und zu zeigen, dass die offenen bzw.
abgeschlossenen Intervalle bzw. Kreisscheiben wirklich of-
ist diese Abschätzung optimal: Wir können keine √ kleinere fen bzw. abgeschlossen im Sinne einer allgemeineren Defi-
Konstante mit dieser Eigenschaft finden als 1/(2 δ).
nition sind. Im engen Zusammenhang mit abgeschlossenen
Teilmengen stehen kompakte Mengen.
f (x)
)
0.01

1.0 z3
1/(2 √

√ 0.2) √
x
1/(2
ng
igu
ung

0.5 Ste D
Steig

z1 z4

0.2 0.4 0.6 0.8 1.0 x z2

Abbildung 9.23 Lipschitz-Konstanten am Beispiel der Wurzelfunktion.

Nun lassen wir δ → 0 gehen. Wir wissen ja, dass die Wur- Abbildung 9.24 An dieser „Amöbe“ lassen sich die verschiedenen möglichen
Fälle für die Lage von Punkten unterscheiden. Punkte wie z1 liegen im Inneren von
zelfunktion auch auf dem Intervall [0, 1] stetig ist, aber die
D, während Punkte wie z3 auf dem Rand zwischen D und seinem Komplement
Lipschitzkonstante geht dann gegen Unendlich! Die Wurzel- liegen. Punkte wie z2 bzw. z4 liegen außerhalb von D.
funktion ist also auf dem Intervall [0, 1] nicht mehr lipschitz-
stetig. Am Graphen kann man auch gut erkennen, warum dies Wir betrachten eine Teilmenge D ⊆ C, die etwa die in Ab-
so ist: Die Kurve wird zunehmend steiler, wenn sie sich der bildung 9.24 dargestellte Gestalt hat. Dann gibt es für die
Null nähert, die Änderungsrate wird immer größer. Lage von Punkten aus C die folgenden Möglichkeiten, die
Lipschitz-Stetigkeit spielt immer dort eine Rolle, wo es auf sich gegenseitig ausschließen:
eine Beschränkung von Änderungsraten ankommt. Dies ist
vor allem bei numerischen Anwendungen der Fall, aber auch Definition: Inneres, Komplement und Rand einer
in dem Kapitel zu Differenzialgleichungen wird uns dieser Menge
Begriff wieder begegnen. Ist z1 ∈ D, und gibt es ein r1 > 0 mit Ur1 (z1 ) ⊆ D,
so nennen wir z1 einen inneren Punkt von D. Die
Gesamtheit D 0 dieser Punkte heißt das Innere von
D.
9.4 Abgeschlossene, offene, Ist z2 ∈ C \ D, und gibt es ein r2 > 0 mit Ur2 (z2 ) ⊆
C \ D, so nennen wir z2 einen äußeren Punkt be-
kompakte Mengen züglich D. Äußere Punkte gehören zum Komplement
von D bezogen auf die Grundmenge (hier: C). Sie
In Abschnitt 4.2 hatten wir verschiedene Intervalltypen de- sind innere Punkte des Komplements C \ D.
finiert. Darunter offene Intervalle, d. h. Intervalle vom Typ Gilt für ein z3 ∈ C und für alle r3 > 0, dass
(a, b) = {x ∈ R | a < x < b} und abgeschlossene Inter- Ur3 (z3 ) ∩ D  = ∅ und Ur3 (z3 ) ∩ (C \ D) = ∅, so
valle [a, b] = {x ∈ R | a ≤ x ≤ b} (dabei seien jeweils nennen wir z3 einen Randpunkt von D. Die Gesamt-
a, b ∈ R und a < b). Zwischen diesen Intervalltypen scheint heit dieser Punkte heißt Rand von D, für den wir die
kein großer Unterschied zu bestehen, so haben beide Inter- Bezeichnung ∂D wählen.
valle nach Definition die gleiche Länge b − a.
Stetige Funktionen f mit Intervallen als Definitionsbereiche Diese Begriffe lassen sich ganz analog für Teilmengen von R
haben angenehme Eigenschaften: Wie wir im Abschnitt 9.5 einführen: In der Definition muss C durch R ersetzt werden,
9.4 Abgeschlossene, offene, kompakte Mengen 323

und statt den offenen Kreisscheiben Ur (z) verwendet man Jede endliche Teilmenge von R oder C ist abgeschlossen
offene Intervalle (z − r, z + r). Das Intervall (a, b] hat dann in R bzw. in C.
z. B. die Eigenschaft, dass der Randpunkt a kein Element des Das Intervall (0, 1) ⊆ R ist nicht abgeschlossen in R,
1
Intervalls ist, der Randpunkt b schon. denn für die Folge (xn ) mit xn = n+1 gilt xn ∈ (0, 1],
aber lim xn = 0 ∈ / (0, 1).
n→∞
Achtung: Das reelle Intervall (a, b) ist als Teilmenge von Z ist eine abgeschlossene Teilmenge von R, und Z + Zi
R eine Menge, die nur aus inneren Punkten besteht. Man kann ist eine abgeschlossene Teilmenge von C. 
dieses Intervall auch als Teilmenge von C auffassen. Dann hat
es keine inneren Punkte, da für jedes z ∈ (a, b) und jedes r >
?
Beweisen Sie die Aussage des dritten und des fünften Bei-
0 die offene Kreisscheibe Ur (z) nicht reelle Zahlen enthält.
spiels formal!
Die oben definierten Begriffe hängen also entscheidend von
der Obermenge ab, bezüglich der sie definiert werden.
In der Praxis setzt man sehr häufig das folgende Lemma ein,
? um nachzuweisen, dass eine Teilmenge von C abgeschlossen
Finden Sie die Randpunkte der offenen Kreisscheibe Ur (a) ist.
und überprüfen Sie, ob diese Randpunkte Elemente von
Ur (a) sind. Lemma
Sind f1 , . . . , fl : C → R stetige Funktionen, und sind
a1 , . . . , al gegebene reelle Zahlen, dann ist die Menge
Die abgeschlossenen Intervalle vom Typ [a, b], [a, ∞) bzw. A = {z ∈ C | f1 (z) ≤ a1 , . . . , fl (z) ≤ al } abgeschlossen
(∞, b] (a, b ∈ R) haben die folgende Abgeschlossenheitsei- in C.
genschaft:
Eine analoge Aussage erhält man, wenn man „≤“ durch „≥“
Satz ersetzt.
Ist (xn ) eine konvergente Folge von Elementen xn aus
einem dieser Intervalle, dann liegt auch der Grenzwert
x = lim xn in dem betreffenden Intervall. Beweis: Zur Begründung betrachten wir eine konvergente
n→∞ Folge (zn ) von Punkten zn ∈ A und setzen z∗ = lim zn .
n→∞
Aus zn ∈ A folgt fj (zn ) ≤ aj für j = 1, 2, . . . , n. Dann ist
Beweis: Wir geben hier einen kurzen Beweis für den Fall auch fj (z∗ ) = lim fj (zn ) ≤ aj für alle j . Das bedeutet,
des Intervalls [a, ∞). Die anderen Intervalltypen werden ana- n→∞
dass auch z∗ in A liegt. A ist also abgeschlossen. 
log behandelt. Wir wählen eine Folge (xn ) mit xn ≥ a für
alle n ∈ N und setzen x = lim xn . Wäre nun x < a, dann
n→∞
gäbe es ein N ∈ N mit |xN − x| <  für  = a − x > 0. Es Mithilfe der folgenden Prinzipien lassen sich abgeschlossene
wäre daher xN = x + (xN − x) ≤ x + |xN − x| < x +  = a Mengen konstruieren:
mit Widerspruch zu xN ≥ a. Also ist auch x ≥ a. 

Konstruktion abgeschlossener Mengen


Die betrachteten Intervalltypen sind also abgeschlossen im (A1) Die Vereinigung endlich vieler abgeschlossener
Sinne folgender Definition für K = R oder K = C: Mengen ist wieder abgeschlossen.
(A2) Der Durchschnitt beliebig vieler abgeschlossener
Mengen ist wieder abgeschlossen.
Definition einer abgeschlossenen Teilmenge
Eine Teilmenge A ⊆ K heißt abgeschlossen (in K),
wenn für jede konvergente Folge (xn ) mit xn ∈ A gilt: Beweis: Für den Beweis der ersten Behauptung genügt es,
die Aussage für zwei abgeschlossene Teilmengen A und B
lim xn ∈ A
n→∞ nachzuweisen. Durch vollständige Induktion erhält man die
Aussage für eine beliebig große endliche Anzahl von Mengen
(siehe aber auch die Selbstfrage auf Seite 327).
?
Wieso ist die leere Menge abgeschlossen? Sei dazu (xk ) eine konvergente Folge mit Elementen xk ∈
A ∪ B. Die Folge (xk ) besitzt eine konvergente Teilfolge,
deren sämtliche Folgeglieder nur in A oder nur in B liegen,
Beispiel
o. B. d. A. mögen sie in A liegen.
Intervalle vom Typ [a, b], [a, ∞) bzw. (−∞, b] (a, b ∈ R)
und auch (−∞, ∞) sind abgeschlossene Teilmengen Weil A abgeschlossen ist, liegt der Grenzwert der Teilfolge in
von R. A. Da die Folge (xk ) und die Teilfolge denselben Grenzwert
Die 1-Sphäre S 1 = {z ∈ C | |z| = 1} ist eine abgeschlos- haben, liegt auch der Grenzwert der Ausgangsfolge (xk ) in
sene Teilmenge von C. A und damit in A ∪ B, d. h., A ∪ B ist abgeschlossen.
324 9 Funktionen und Stetigkeit – ε trifft auf δ

Zum Beweis der zweiten


A Behauptung beachte man, dass eine ∂A ist als Durchschnitt zweier abgeschlossener Mengen wie-
konvergente Folge in k Ak eine konvergente Folge in jedem der abgeschlossen (Aussage (A2)).
Ak ist. 
Die Randpunkte zerfallen in zwei Klassen:
Die zu A gehörigen Randpunkte und die zum Komplement
Abgeschlossene Mengen stimmen mit ihrem K \ A gehörigen. Für A gilt dann A = A ∪ ∂A. Gilt nun
Abschluss überein ∂A ⊆ A, so ist A = A, also ist A abgeschlossen. Gilt umge-
kehrt A = A, so ist ∂A ⊆ A. Damit haben wir eine dritte Cha-
Ist M ⊆ K eine beliebige Teilmenge, so sei die Menge der rakterisierung abgeschlossener Mengen mithilfe des Randes
Grenzwerte von konvergenten Folgen (xk ), xk ∈ M mit M erhalten:
bezeichnet:
Charakterisierung abgeschlossener Mengen mithilfe
Definition der abgeschlossenen Hülle
des Randes
Ist M eine Teilmenge von K, so nennt man
Eine Teilmenge A ⊆ K ist genau dann abgeschlossen,
wenn sie ihren Rand enthält: ∂A ⊆ A.
M = {x ∈ K | es gibt eine Folge (xk ) aus M
mit lim xk = x}
k→∞ Beispiel
Die abgeschlossene Einheitskreisscheibe E, die gegeben
Abschluss oder die abgeschlossene Hülle von M.
ist durch E = {z ∈ C | |z| ≤ 1}, ist abgeschlossen, denn
es gilt ∂ E = S 1 = {z ∈ C | |z| = 1} und S 1 ⊆ E.
Achtung: Da jedes x ∈ M Grenzwert der konstanten Die rationalen Zahlen Q sind als Teilmenge von R nicht
Folge (x, x, x, . . .) ist, gilt immer M ⊆ M. abgeschlossen, denn es gilt ∂ Q = R. Dieses Beispiel zeigt
etwas überraschend, dass eine Menge (hier Q) in ihrem
Rand enthalten sein kann.
? Es ergibt sich auch Q = R, denn Q = Q ∪ ∂ Q = Q ∪
Wieso ist M stets abgeschlossen? R = R. Dies folgt natürlich auch aus der in Kapitel 4
getroffenen Dichtigkeitsaussage, dass Q dicht in R liegt.
Weder ∅ noch K besitzen Randpunkte. Es ist ∂∅ =
Wir betrachten nun eine abgeschlossene Teilmenge A ⊆ K. ∂ K = ∅, somit enthalten beide Mengen ihren Rand. So-
Da der Grenzwert jeder konvergenten Folge (xk ) aus A in A wohl ∅ als auch K sind abgeschlossen. 
liegt, gilt also hier A ⊆ A und damit A = A. Damit haben
wir die folgende Charakterisierung abgeschlossener Mengen Abgeschlossene Mengen in R oder C können eine äußerst
mithilfe des Abschlusses: komplizierte Struktur besitzen. In dem Beispiel auf Seite 325
behandeln wir das sogenannte Cantor’sche Diskontinuum
Satz (Abgeschlossene Mengen stim- („Cantor’sche Wischmenge“).
men mit ihrem Abschluss überein)
Eine Teilmenge A ⊆ K ist genau dann abgeschlossen Es sei an die Abbildung 9.24 erinnert und speziell an die
(in K), wenn sie mit ihrem Abschluss übereinstimmt: Punkte x ∈ D zu denen es eine ε-Umgebung Uε (x) gibt, für
die Uε (x) ⊆ D ist. Diese Punkte hatten wir innere Punkte
M =M. von D genannt und ihre Gesamtheit D 0 das Innere von D
(oder auch den offenen Kern von D).

Beispiel N und Z sind abgeschlossene Teilmengen von R,


denn es gilt N = N und Z = Z. Dies folgt daraus, dass die Definition offener Mengen
einzigen konvergenten Folgen aus diesen Mengen diejenigen Eine Menge U ⊆ K, die nur aus inneren Punkten besteht,
Folgen sind, die ab irgendeinem Index konstant sind.  heißt offen in K.
U ist also genau dann offen in K, wenn es zu jedem
Erinnern wir uns an die Definition des Randes, so können x ∈ U eine ε-Menge U (x) gibt mit U (x) ⊆ U .
wir ihn jetzt wie folgt beschreiben:
Unmittelbar folgt, dass eine offene Menge U keinen ihrer
Folgerung (Charakterisierung des Ran- Randpunkte enthalten kann, also U ∩ ∂U = ∅. Dies gilt auch
des einer Menge durch den Abschluss) umgekehrt: aus U ∩ ∂U = ∅ folgt, dass U offen ist.

∂A = A ∩ K \ A
Beispiel Ein typisches Beispiel einer offenen Menge ist
In Worten: Der Rand der Menge A ist der Schnitt aus ihrem die „offene“ Kreisscheibe (z0 ∈ C, r > 0) Ur (z0 ) = {z ∈ C |
Abschluss mit dem Abschluss ihres Komplements. |z − z0 | < r}.
9.4 Abgeschlossene, offene, kompakte Mengen 325

Beispiel: Das Cantor’sche Diskontinuum


Abgeschlossene Teilmengen von R oder C können eine äußerst komplizierte Struktur besitzen. Ein Beispiel ist das Cantor’sche
Diskontinuum.
Problemanalyse und Strategie: Zur Konstruktion dieser Menge starten wir mit dem abgeschlossenen Intervall [0, 1]
und entfernen („wischen“) im ersten Schritt das mittlere (offene) Intervalldrittel ( 13 , 23 ). Es verbleibt die Vereinigung
der beiden abgeschlossenen Intervalle [0, 13 ] und [ 23 , 1]. Diesen beiden Teilintervallen wird wieder das innere Drittel
entnommen usw.
Um eine bessere Vorstellung von diesem Algorithmus zu erhalten, führen wir auch die nächsten Schritte explizit aus,
bevor wir zum allgemeinen n-ten Schritt kommen. Eine solche Strategie empfiehlt sich immer, bis „klar“ ist, wie der
allgemeine Fall lautet. Erst dann sollten wir uns dem eigentlichen Problem zuwenden, nämlich, zu erkennen, von welcher
Gestalt diese Wischmenge ist.

Lösung:
Nach dem ersten Schritt haben wir als Menge die Ver- C0
einigung der zwei abgeschlossenen Intervalle [0, 13 ] und C1
[ 23 , 1] mit einer Länge von je 13 erzeugt:
C2
B C B C C3
1 2
C1 = 0, ∪ ,1 . C4
3 3
C5
Jedem dieser beiden Intervalle entnehmen wir nun wieder
das (offene) mittlere Intervalldrittel und erhalten so die
Vereinigung
Für uns ist hier besonders interessant, dass C abgeschlos-
B C B C B C B C sen ist. Jede der Mengen Cn ist als endliche Vereinigung
1 2 1 2 7 8
C2 = 0, ∪ , ∪ , ∪ ,1 . abgeschlossener Intervalle nämlich abgeschlossen. Somit
9 9 3 3 9 9
ist C ein Durchschnitt abzählbar vieler abgeschlossener
Mengen und damit nach Aussage (A2) selbst abgeschlos-
Damit gibt es schon 4 Intervalle, jeweils mit der Länge 19 . sen.
Dieses Vorgehen setzen wir fort. Im n-ten Schritt erhalten Weitere besondere Eigenschaften von C sind:
wir 2n Intervalle der Länge 31n , deren Vereinigung wir Cn C besitzt überabzählbar viele Elemente. Dies werden
nennen. Aufgrund der Konstruktion gilt wir im Kapitel 10 beweisen.
In Kapitel 16 wird gezeigt, dass C eine sogenannte
[0, 1] = C0 ⊇ C1 ⊇ C2 ⊇ C3 ⊇ · · · ⊇ Cn ⊇ · · · Nullmenge ist. Solche Mengen spielen in der Integrati-
onstheorie eine wichtige Rolle. Einfache Beispiele für
solche Mengen sind abzählbar, das Cantor’sche Dis-
Den Durchschnitt aller Cn ,
kontinuum ist aber ein Beispiel für eine überabzählbare
∞ Nullmenge.

C= Cn , Wegen dieser Eigenschaften galt C als „extrem patholo-
n=1
gisch“ für eine Teilmenge von R. C besitzt ein zweidimen-
sionales Analogon, den sogenannten Sierpinski-Teppich.
nennen wir das Cantor’sche Diskontinuum oder auch die
Cantor-Menge, nach dem Mathematiker Georg Cantor, ?
der diese Menge 1853 vorstellte. In der Abbildung ist der Wie könnte man das eindimensionale Vorgehen zum Er-
beschriebene Wischprozess auch schematisch dargestellt. zeugen von C auf zwei Dimensionen erweitern?

Das Cantor’sche Diskontinuum ist nichtleer. Ist eine Zahl


x ein Randpunkt eines der Intervalle, aus dem Cn besteht, Mengen wie die Cantor’sche Wischmenge und der
so wird diese Zahl nicht mehr entfernt: x ∈ Cm für alle Sierpinski-Teppich treten auch im Rahmen der Chaos-
m ∈ N und damit auch x ∈ C. Theorie (bzw. Theorie nichtlinearer dynamischer Sys-
teme) auf, die Systeme untersucht, deren Dynamik emp-
findlich von den Anfangsbedingungen abhängt.
326 9 Funktionen und Stetigkeit – ε trifft auf δ

Im für alle n ≥ N, denn |an −ξ | < ε für alle n ≥ N ist äquivalent


zu an ∈ Uε (ξ ) für alle n ≥ N.
r Zum Beweis der Umkehrung „⇐“ seien A das nach Vo-
z0 raussetzung abgeschlossene Komplement von U und ξ ∈ U .
Würde jede ε-Umgebung Uε (ξ ) nur Punkte aus A enthalten,
dann gäbe es speziell in U 1 (ξ ) ein aN ∈ A. Die Folge (an )
Re n
mit an ∈ A∩U 1 (ξ ) konvergiert gegen ξ . Da A abgeschlossen
n
Abbildung 9.25 Eine Kreisscheibe Ur (z0 ) = {z ∈ C | |z − z0 | < r} in der
komplexen Zahlenebene mit Mittelpunkt z0 und Radius r is eine offene Menge.
ist, folgt ξ ∈ A, das ist ein Widerspruch zu ξ ∈ U = K \ A.
Dieser Widerspruch zeigt, dass es eine -Umgebung Uε (ξ )
mit Uε ⊆ U geben muss. Da ξ ∈ U beliebig war, ist U also
Sei z beliebiger Punkt aus Ur (z0 ). Wir wählen uns dann offen. 

ε < r − |z − z0 |. Die so konstruierte Menge Uε (z) ist dann


ganz in Ur (z0 ) enthalten, da alle darin enthaltenen Punkte Achtung: Ein weit verbreiteter Irrtum ist zu glauben, dass
einen kleineren Abstand als r zum Mittelpunkt der offenen eine Teilmenge D ⊆ K stets entweder abgeschlossen oder
Kreisscheibe z0 besitzen. Da z beliebig gewählt war, ist die offen ist. Dies ist falsch! Eine Teilmenge kann weder offen
„offene“ Kreisscheibe Ur (z0 ) tatsächlich offen im Sinne un- noch abgeschlossen sein.
serer Definition. 
So ist etwa das Intervall (0, 1] weder eine offene, noch eine
abgeschlossene Teilmenge von R. Ferner gibt es Mengen, die
Kommentar: Wir wollen an dieser Stelle noch einige ein-
gleichzeitig abgeschlossen und offen sind. Beispiele sind die
fache Aussagen zusammenstellen, die zeigen, wie die ver-
leere Menge ∅ und R.
schiedenen, bisher definierten Begriffe zusammenhängen.
Für jede Menge M ⊆ K gilt: ?
◦ Geben Sie Beispiele für Teilmengen D ⊆ R, die
M ⊆M ⊆M.
offen, aber nicht abgeschlossen
Bei der zweiten Teilmengenbeziehung besteht genau dann nicht offen, aber abgeschlossen
Gleichheit, wenn M abgeschlossen ist, bei der ersten be-
steht Gleichheit, wenn M offen ist. sind.
Für jede Menge M ⊆ K gilt:

∂M = M \ M ◦ = (M \ M ◦ ) ∪ (M \ M). Offen ist also nicht das logische Gegenteil von abgeschlos-
sen, die Begriffe hängen über die Komplementbildung mit-
Diese Beziehung ergibt sich sofort aus der Definition des einander zusammen.
Inneren bzw. der Randpunkte einer Menge über offene
Umgebungen. ?
Warum sind ∅ und R Teilmengen von R mit leerem Rand?

Die Begriffe „offen“ und „abgeschlossen“


hängen über die Komplementbildung
zusammen Die Grundeigenschaften offener Mengen
folgen aus dem Zusammenhang von „offen“
Zusammenhang zwischen offen und abgeschlossen und „abgeschlossen“
Eine Teilmenge U ⊆ K ist genau dann offen in K,
Offene Teilmengen von K haben die folgenden Eigenschaf-
wenn ihr Komplement K \ U abgeschlossen in K ist.
ten:
Es gilt auch: A ist genau dann abgeschlossen in K, wenn
U = K \ A offen in K ist. (O1) Der Durchschnitt endlich vieler offener Mengen ist
wieder offen.
Beweis: Beweis der Hinrichtung „⇒“: Zum Beweis neh- (O2) Die Vereinigung beliebig vieler offener Mengen ist
men wir an, dass U eine offene Menge in K ist und müssen wieder offen.
zeigen, dass ihr Komplement A = K \ U abgeschlossen Man kann diese Grundeigenschaften offener Mengen mit-
ist. Dazu sei (an ), mit an ∈ A, eine konvergente Folge und hilfe der de Morgan’schen Regeln (siehe Seite 38) aus den
ξ = lim an . Wir müssen ξ ∈ A zeigen. Wäre ξ ∈ / A, Eigenschaften der abgeschlossenen Mengen ableiten (siehe
x→∞
also ξ ∈ U , dann gäbe es eine ε-Umgebung Uε (ξ ) ⊆ U die Konstruktion abgeschlossener Mengen auf Seite 323).
mit Uε (ξ ) ∩ A = ∅ und damit würde an ∈ / Uε (ξ ) für alle Aus demselben Grund findet sich auch die folgende Analogie
n ∈ N gelten. Das ist aber ein Widerspruch zur vorausgesetz- zur Charakterisierung der abgeschlossenen Mengen durch
ten Konvergenz von (an ) gegen ξ . Danach gilt ja |an −ξ | < ε A = A:
9.4 Abgeschlossene, offene, kompakte Mengen 327

Eine Teilmenge U ⊆ K ist genau dann offen, wenn U = U 0 konvergente Teilfolge besitzt. Der Grenzwert dieser Teilfolge
gilt. liegt wegen der Abgeschlossenheit in K.

? „⇐“: Wir setzen voraus, dass jede Folge aus K eine in K


Zeigen Sie an einfachen Beispielen, dass der Durchschnitt konvergente Teilfolge besitzt. Dann muss K beschränkt sein;
von unendlich vielen offenen Mengen i. A. nicht wieder of- denn wenn dies nicht der Fall wäre, dann gäbe es eine Folge
fen ist und die Vereinigung unendlich vieler abgeschlossener (zn ), n ∈ N, für welche |zn | > n für alle n ∈ N gilt. Dann
Mengen nicht wieder abgeschlossen sein muss. kann aber keine Teilfolge (znk ) dieser Folge konvergieren,
denn wegen |znk | > nk ≥ n ist jede Teilfolge unbeschränkt!
Ist ferner ζ der Grenzwert einer konvergenten Folge (zn ) aus
K, so ist ζ auch Grenzwert einer geeigneten Teilfolge, also
Die Folgenkompaktheit als Charakterisierung ist nach Voraussetzung ζ ∈ K. Somit ist K = K und daher
kompakter Mengen ist für viele Beweise abgeschlossen. 

besonders zweckmäßig
Man nennt eine Menge, die die Bolzano-Weierstraß-Eigen-
Im Kapitel 19 über metrische Räume und ihre Topologie wer- schaft besitzt auch folgenkompakt. Die Tatsache, dass Teil-
den wir auf offene und abgeschlossene Mengen und die damit mengen von C bzw. von R genau dann kompakt sind, wenn
zusammenhängenden Begriffe noch ausführlicher zu spre- sie folgenkompakt sind, ist eine besondere Eigenschaft die-
chen kommen. Allerdings lassen sich über stetige Funktio- ser Grundmengen. Allgemeiner definiert man in sogenann-
nen, die offene oder abgeschlossene Mengen als Definitions- ten metrischen Räumen (siehe Kapitel 19) Kompaktheit über
mengen besitzen, nur wenig interessante Aussagen treffen. die Überdeckungseigenschaft (Ausblick auf Seite 328). Aus
Um eine reichhaltigere Menge an Aussagen zu erhalten, füh- dieser folgt die Folgenkompaktheit und hieraus wieder Be-
ren wir die kompakten Mengen ein. schränktheit und Abgeschlossenheit. In einem metrischen
Raum muss eine beschränkte und abgeschlossene Menge
nicht kompakt sein.
Definition einer kompakten Menge
Eine Teilmenge K ⊆ K heißt kompakt, wenn sie be-
schränkt und abgeschlossen ist. Existenzsatz von Maximum und Minium kompakter
Mengen
Eine nichtleere kompakte Teilmenge K ⊆ R hat ein
Zur Erinnerung: Eine Menge K ist beschränkt, wenn es eine
Maximum und ein Minimum.
reelle Zahl R gibt, sodass |z| ≤ R für alle z ∈ K gilt. Offen-
sichtlich sind die leere Menge ∅ und jede endliche Teilmenge
{z1 , . . . , zn } ⊆ K kompakt. Diesen Satz werden wir im folgenden Abschnitt 9.5 und an
anderen Stellen häufig verwenden.
Offensichtlich gilt:
Die Vereinigung endlich vieler kompakter Mengen ist Beweis: Da K beschränkt ist, existieren s = sup K und
wieder kompakt. t = inf K. Es ist zu zeigen, dass s, t ∈ K sind. Da der Beweis
Der Durchschnitt beliebig vieler kompakter Mengen ist beider Aussagen völlig analog verläuft, beschränkten wir uns
wieder kompakt. auf s ∈ K.
Der Durchschnitt A ∩ K einer abgeschlossenen Menge A
und einer kompakten Menge K ist wieder kompakt. Mithilfe der ε-Charakterisierung von sup K konstruieren wir
eine Folge (xn ) mit xn ∈ K, xn < s und lim xn = s.
n→∞
? Wegen der Abgeschlossenheit ist sofort lim xn = s ∈ K.
n→∞
Können Sie diese drei Aussagen schnell begründen? 

Bolzano-Weierstraß-Charakterisierung kompakter Beweistechnisch und für das Gebiet der mengentheoreti-


Mengen schen Topologie und der Funktionalanalysis ist eine weitere
Charakterisierung kompakter Mengen von Bedeutung, die
Eine Teilmenge K ⊆ K ist genau dann kompakt, wenn von Überdeckungen einer kompakten Menge mit offenen
jede Folge von Elementen aus K eine Teilfolge besitzt, Mengen ausgeht. Wir gehen auf diese sogenannte Heine-
die gegen einen Punkt aus K konvergiert. Borel’sche Eigenschaft in einer Vertiefung ein. Diese auch
Überdeckungskompaktheit genannte Eigenschaft ist der
Beweis: für manche Anwendungen bequemere und für allgemeinere
„⇒“: Sei K eine kompakte Menge. Eine Folge aus K Räume unverzichtbare Kompaktheitsbegriff. Zunächst sind
ist damit beschränkt. Wir benutzen den Satz von Bolzano- jedoch unsere beiden Kompaktheitsbegriffe für die weiteren
Weierstraß, der besagt, dass jede beschränkte Folge in K eine Betrachtungen ausreichend.
328 9 Funktionen und Stetigkeit – ε trifft auf δ

Hintergrund und Ausblick: Die Heine-Borel-Eigenschaft


Kompakte Mengen von R oder C können auf verschiedene Weise charakterisiert werden. Wir stellen hier eine Charakterisierung
über offene Mengen vor, die sich in weiterführenden mathematischen Disziplinen als die maßgebliche Eigenschaft kompakter
Mengen zu erkennen gibt.

Wir haben eine Teilmenge K von R oder C kompakt


genannt, wenn sie beschränkt und abgeschlossen ist.
Nach der Bolzano-Weierstraß-Charakterisierung kompak-
ter Mengen ist die Kompaktheit äquivalent mit der Eigen-
schaft, dass jede Folge (an ) aus K eine Teilfolge besitzt,
die gegen eine Zahl aus K konvergiert. Diese Eigenschaft
E
wollen wir die Folgenkompaktheit von K nennen.
In der Topologie und der Funktionalanalysis beschäftigt
man sich nun auch mit Mengen, in denen es, anders als in Teilüberdeckungen geben kann, also auch solche, die
R oder C, keinen Abstandsbegriff mehr gibt. In solchen keine endliche Teilüberdeckung besitzen. Eine Teilmenge
topologischen Räumen kann man offene Mengen charak- K ⊆ K heißt überdeckungskompakt, falls jede offene
terisieren, und man definiert stetige Abbildungen durch Überdeckung von K eine endliche Teilüberdeckung ent-
die zweite Eigenschaft aus dem Kriterium für globale Ste- hält. Hierfür sagt man auch, dass K die Heine-Borel-
tigkeit von Seite 329. Gibt es hier noch eine konsistente Eigenschaft hat. Die Menge E aus dem Beispiel hat diese
Definition kompakter Mengen? Eigenschaft demnach nicht.
Der neue Begriff ist die Überdeckungskompaktheit. Ist Diese Eigenschaft hat auf den ersten Blick nichts mit Be-
K ⊆ K (K = R oder K = C), so heißt ein System U griffen wir „beschränkt“ oder „abgeschlossen“ zu tun. Es
von offenen Mengen aus K offene Überdeckung von K, gilt allerdings der folgende zentrale Satz:
falls gilt 
K⊆ V, Satz (Satz von Heine-Borel)
V ∈U
Eine Teilmenge K ⊆ K hat genau dann die Heine-Borel-
d. h., jeder Punkt k ∈ K liegt in einer offenen Menge
Eigenschaft, wenn sie kompakt ist.
V ∈ U . Eine Teilüberdeckung von U ist ein Teilsystem
U  ⊆ U , das bereits K überdeckt. Eine Überdeckung heißt Um einen Eindruck vom Beweis zu vermitteln, wollen
endlich, falls sie nur endlich viele Mengen enthält. wir kurz erläutern, dass aus der Heine-Borel-Eigenschaft
Sehen wir uns zwei Beispiele an: einer Menge A ⊆ R folgt, dass A kompakt ist. Da die
offenen Intervalle (−n, n), n ∈ N, ganz R und damit auch
Zur offenen Einheitskreisscheibe E = {z ∈ C | |z| < 1} A überdecken und diese Intervalle ineinander enthalten
und z0 ∈ C mit |z0 | = 1 definiert man sind, überdeckt bereits eines dieser Intervalle A. Somit ist
1 A beschränkt. Man zeigt, dass A auch abgeschlossen ist,
Un = {z ∈ E | |z − z0 | > } , n ∈ N.
n indem man nachweist, dass R \ A offen ist. Dazu über-
Dann ist U = {Un | n ∈ N} eine offene Überdeckung deckt man zu jedem x ∈ R \ A die Menge R \ {x} durch
von E. Endlich viele Un reichen nicht aus, um E zu die offenen Mengen R \ [x − n1 , x + n1 ], n ∈ N. Hierdurch
überdecken. ist auch A überdeckt, und man erhält aus der Heine-Borel-
Eigenschaft: [x − n1 , x + n1 ] ⊆ R \ A für n hinreichend
z0 groß. Damit ist R \ A offen.
U1
In topologischen Räumen ist die Heine-Borel-Eigenschaft
0 U2 ein vernünftiger Begriff, sodass man kompakte Mengen
durch sie definiert. Es gelingt hier auch der Beweis der
E Aussage, die wir für R und C auf Seite 330 zeigen: Das
Bild einer kompakten Menge unter einer stetigen Abbil-
Eine zweite offene Überdeckung von E erhält man, dung ist kompakt.
wenn man jedem z ∈ E die offene Kreisscheibe
Reichhaltiger als topologische Räume sind metrische
1 Räume, die wir in Kapitel 19 behandeln. In solchen
Uz = {w ∈ C | |w − z| < }
2 Räumen sind Folgenkompaktheit und Heine-Borel-Eigen-
zuordnet. Hier braucht man keinesfalls alle Uz , z ∈ E, schaft noch äquivalent. Man nennt entsprechende Men-
um E zu überdecken. Es reichen endlich viele dieser gen kompakt. Eine bloß abgeschlossene und beschränkte
Mengen aus. Die Beispiele zeigen, dass es zu einer Menge muss jedoch keine dieser beiden Eigenschaften be-
Menge sowohl offene Überdeckungen mit endlichen sitzen.
9.4 Abgeschlossene, offene, kompakte Mengen 329

Bei stetigen Funktionen gibt es lokal Wir führen dazu folgende Sprechweisen ein: Ist D ⊆ K eine
betrachtet keine „Überraschungen“ nichtleere Teilmenge, dann heißt eine Teilmenge D0 von D
offen relativ D, wenn es zu jedem a ∈ D0 eine r-Umgebung
Bevor wir uns mit globalen Eigenschaften stetiger Funktio- Ur (a) gibt, für die Ur (a) ∩ D ⊆ D0 gilt. Andere Ausdrucks-
nen beschäftigen, halten wir noch eine bemerkenswerte lo- weisen für diesen Begriff sind: D0 ist D-offen oder D0 ist
kale Abbildungseigenschaft stetiger Funktionen fest, die an offen in D.
einer Stelle einen von Null verschiedenen Funktionswert ha-
ben:

Satz a
Ist f : D → C stetig in x̂ ∈ D, und gilt f (x̂)  = 0, Ur (a) ∩ D D
dann gibt es eine δ-Umgebung Uδ (x̂) mit f (x)  = 0 für alle
x ∈ Uδ (x̂) ∩ D.

Beweis: Zum Beweis wählen wir ε = 21 |f (x̂)| > 0. Dann


gibt es wegen der Stetigkeit von f eine δ-Umgebung Uδ (x̂) Abbildung 9.27 Eine D-Umgebung des Punktes a ∈ D ist der Schnitt der
mit r-Umgebung Ur (a) mit D.
1
|f (x) − f (x̂)| < |f (x̂)|
2 Analog heißt eine Teilmenge F ⊆ D abgeschlossen relativ
für alle x ∈ Uδ (x̂) ∩ D. Mithilfe der Dreiecksungleichung D oder D-abgeschlossen, wenn der Grenzwert jeder Folge
ergibt sich von Elementen aus F , die gegen einen Punkt aus D konver-
giert, bereits in F liegt. Diese Eigenschaft ist gleichbedeutend
1 damit, dass es eine in K abgeschlossene Teilmenge A gibt,
|f (x)| ≥ |f (x̂)| − |f (x) − f (x̂)| > |f (x̂)| > 0
2 für die F = A ∩ D gilt.
für alle x ∈ Uδ (x̂) ∩ D. 
Beispiel Ist D = (0, 2] (⊆ R), dann ist D0 = (1, 2]
offen in D, aber nicht offen in R. Das Intervall (0, 1]
ist abgeschlossen relativ (0, 2], aber nicht abgeschlossen
in R. 
f (x̂)
f (xn− ) Mit diesen Begriffsbildungen ergibt sich das
x̂ − ε x̂ + ε

Kriterium für globale Stetigkeit
x̂ − δ x̂ + δ
Ist D eine nichtleere Teilmenge von K, dann sind für eine
Abbildung 9.26 Enthält der Definitionsbereich von f ein Intervall um x̂, und Funktion f : D → K folgende Aussagen äquivalent:
ist f (x̂) nicht null, so gibt es ein Intervall, in dem f sein Vorzeichen nicht 1. f ist stetig (auf ganz D).
wechselt. 2. Für jede offene Teilmenge V ⊆ K ist das Urbild
f −1 (V ) D-offen.
Die Aussage des Satzes gilt allgemein für komplexwertige 3. Für jede abgeschlossene Teilmenge B ⊆ K ist das
Funktionen. Ist f reellwertig, so ergibt sich aus dem Beweis, Urbild f −1 (B) D-abgeschlossen.
dass sich das Vorzeichen von f in einer Umgebung von x̂
nicht ändert. Ist also f (x̂) > 0, dann gilt dies auch in einer
vollen δ-Umgebung von x̂, wenn sie ganz in D liegt. Eine Beweis: Wir zeigen die Äquivalenz von 1. und 2.: Seien
analoge Aussage gilt, falls f (x̂) < 0 ist. Diese Eigenschaft f : D → K stetig und V eine beliebige offene Teilmenge
stetiger reellwertiger Funktionen werden wir häufig benöti- von K.
gen.
Wir haben zu zeigen, dass f −1 (V ) D-offen ist. Das ist sicher
der Fall, wenn f −1 (V ) = ∅ gilt.
Globale Stetigkeit lässt sich über offene oder Seien also f −1 (V ) = ∅ und a ∈ f −1 (V ). Dann ist
abgeschlossene Mengen charakterisieren f (a) ∈ V , und da V offen ist, gibt es eine -Umgebung
V (f (a)) ⊆ V .
Bei der Definition der Stetigkeit hatten wir zunächst die Ste-
Wegen der Stetigkeit von f in a gibt es daher eine δ-Um-
tigkeit einer Funktion in einer einzelnen Stelle x̂ definiert.
gebung Uδ (a) mit f (D ∩ Uδ (a)) ⊆ V (f (a)) ⊆ V .
Reichhaltigere Aussagen lassen sich über Funktionen tref-
fen, die auf ihrer gesamten Definitionsmenge stetig sind. Man Daher ist D ∩ Uδ (a) ⊆ f −1 (V (f (a))) ⊆ f −1 (V ). Nach
nennt solche Funktionen auch global stetig. unserer Definition ist also das Urbild f −1 (V ) relativ offen.
330 9 Funktionen und Stetigkeit – ε trifft auf δ

Sei umgekehrt f −1 (V ) offen für jede offene Menge V ⊆ K. Fundamentalsatz über stetige Funktionen mit kom-
Ist a ∈ D beliebig gewählt, dann ist insbesondere für jede paktem Definitionsbereich
-Umgebung V (f (a)) das Urbild f −1 (V (f (a))) D-offen,
Sind K ⊆ K kompakt und f : K → K stetig, dann ist
es gibt also ein δ > 0 mit Uδ (a) ∩ D ⊆ f −1 (V (f (a))).
das Bild f (K) ebenfalls kompakt.
Das bedeutet aber f (Uδ (a) ∩ D) ⊆ V (f (a)), und das ist
die -δ-Stetigkeit von f in a. Da dies für jedes a ∈ D gilt,
ist f global stetig. Beweis: Ist (yn ) eine Folge aus Y , dann gibt es zu jedem
Um die Implikationen 2. ⇒ 3. bzw. 3. ⇒ 2. zu zeigen, n ∈ N ein xn ∈ K mit f (xn ) = yn . Da K aber kompakt
benutzt man die Rechenregel f −1 (K \ A) = D \ f −1 (A) ist, besitzt (xn ) eine Teilfolge (xnk ), die gegen ein x ∈ K
(A ⊆ K).  konvergiert. Wegen der Stetigkeit von f konvergiert dann
die Bildfolge (f (xnk )) gegen f (x) ∈ f (K). 

?
Können Sie die beiden fehlenden Beweisschritte ausführen,
In der Einleitung zu diesem Kapitel hatten wir zwei Grund-
also den Nachweis der Implikationen 2. ⇒ 3. bzw. 3. ⇒ 2.?
aufgaben der Analysis angesprochen. Für eine davon, die
Optimierungsaufgabe, ist der obige Fundamentalsatz eine
Mithilfe des Kriteriums für globale Stetigkeit lassen sich zentrale Aussage. Um die Optimierungsaufgabe formulieren
zahlreiche offene bzw. abgeschlossene Mengen konstruieren. zu können, benötigen wir einen neuen Begriff.

Beispiel Definition des globalen Minimums/Maximums einer


Lösungsmengen von Ungleichungen Funktion
Seien D ⊆ K eine nichtleere Teilmenge und f : D → R
stetig. Dann ist für jedes c ∈ R die Menge {x ∈ D | Gegeben ist eine Funktion f : D → R. Besitzt ihr Bild
f (x) ≤ c} abgeschlossen in D und die Mengen {x ∈ D | f (D) ein Minimum, so heißt eine Zahl x − ∈ D mit
f (x) < c} bzw. {x ∈ D | f (x) > c} sind offen in D,  
f x − = min f (D)
denn z. B. ist {x ∈ D | f (x) < c} = f −1 (] − ∞, c[).
Lösungsmengen von Gleichungen mit stetigen Funk-  
Minimalstelle und der Funktionswert f x − das glo-
tionen bale Minimum von f .
Ist f : D → K stetig, dann ist für jedes c ∈ K die Lö-
Analog definieren wir eine Maximalstelle x + ∈ D und
sungsmenge L = {x ∈ D | f (x) = c} abgeschlossen
das globale Maximum von f , falls f (D) ein Maximum
in D (möglicherweise leer!), denn L = f −1 ({c}). Man
besitzt.
vergleiche hierzu auch das Lemma auf Seite 323.
Beachten Sie, dass in beiden Fällen Aussagen über Urbilder Es folgt, dass das globale Minimum bzw. globale Maximum
gemacht werden. Das Bild einer offenen Menge unter einer einer Funktion durch die Ungleichung
stetigen Abbildung muss nicht offen sein. Überlegen Sie sich
dazu ein Beispiel!  f (x − ) ≤ f (x) bzw. f (x + ) ≥ f (x) für alle x ∈ D

charakterisiert ist. Die Schreibweisen


9.5 Stetige Funktionen mit    
f x − = min f (x) bzw. f x + = max f (x)
kompaktem Definitions- x∈D x∈D

sind auch üblich und vielleicht etwas leichter zu lesen. In


bereich, Zwischenwertsatz der Literatur trifft man auch häufig auf die Formulierung
f nimmt sein Minimum an, um auszudrücken, dass f ein
In diesem letzten Abschnitt dieses Kapitels werden wir den
globales Minimum besitzt.
Begriff der Stetigkeit von Funktionen zusammenbringen mit
Eigenschaften ihrer Definitionsmengen, insbesondere mit Zusammengefasst bezeichnet man sowohl globales Maxi-
dem im letzten Abschnitt eingeführten Begriff der Kompakt- mum als auch globales Minimum als globales Extremum
heit. Wir werden sehen, dass diese Begriffe untereinander und die entsprechende Minimal- oder Maximalstelle als Ex-
gut verträglich sind und die Grundlage für einige zentrale tremalstelle.
Aussagen der Analysis bilden.
Achtung: Unterscheiden Sie die Ausdrücke Extremal-
stelle für den x-Wert und Extremum für den Funktionswert
Stetige Bilder kompakter Mengen sind an dieser Stelle. Es gibt auch lokale Extrema, auf die in Ka-
kompakt pitel 15 näher eingegangen wird.

Aus der Definition der Kompaktheit von Mengen ergibt sich Die Optimierungsaufgabe besteht nun aus der Frage, ob eine
durch eine recht kurze Begründung der folgende Satz. gegebene Funktion f : D → R ein globales Minimum oder
9.5 Stetige Funktionen mit kompaktem Definitionsbereich, Zwischenwertsatz 331

f (x)
Ist K ein nichtleeres Kompaktum in C, dann gibt es zu jedem
f (x + ) p ∈ C \ K einen Punkt b ∈ K, sodass für alle z ∈ K die
Ungleichung |b − p| ≤ |z − p| gilt.

f (x − )
a x− x+ = b x
K
Abbildung 9.28 Globales Maximum und Minimum bei einer reellwertigen z
Funktion.

b
ein globales Maximum besitzt. Die Entwicklung effizienter
p
Verfahren zur Lösung solcher, wenn auch viel komplexerer,
Optimierungsaufgaben ist noch stets aktuelles Forschungsge-
biet der Mathematik. Streng genommen sind mehrere Frage- Abbildung 9.29 Ist K nichtleer und kompakt, so gibt es zu jedem p ∈ C \ K
stellungen zu unterscheiden: Gibt es überhaupt ein globales ein b ∈ K mit |b − p| ≤ |z − p| für alle z ∈ K.
Maximum oder Minimum? Gibt es jeweils genau eine solche
Stelle? Wie berechne ich eine solche Stelle? Beweis: Die stetige Funktion K → R : z → |z − p| hat
Auf die ersten beiden Fragen gibt es je nach Situation ver- ein globales Minimum! 

schiedene Antworten, wie im Beispiel auf Seite 332 gezeigt


Es sollte hier noch erwähnt werden, dass für eine stetige
wird. Die Frage nach der Berechnung von solchen Stellen
Funktion f : K → C mit kompaktem Definitionsbereich K
müssen wir, außer in ganz einfachen Fällen, zunächst zu-
der Satz von der gleichmäßigen Stetigkeit gilt, auf den wir
rückstellen. Der Fundamentalsatz für stetige Funktionen mit
später ausführlich eingehen, der aber hier vorab formuliert
kompaktem Definitionsbereich liefert aber eine Antwort auf
sei:
die Frage nach der Existenz von Lösungen der Optimierungs-
aufgabe. Erinnern wir uns an den Begriff der ε-δ-Stetigkeit: f : D → K
heißt stetig in a, wenn es zu jedem ε > 0 ein δ > 0 gibt,
Existenzsatz für globale Extrema
sodass für alle x ∈ D mit |x − a| < δ gilt: |f (x) − f (a)|
< ε. Wie die Beispiele auf Seite 317 gezeigt haben, wird
(K. Weierstraß, 1861) das zu ε zu bestimmende δ i. A. von der betrachteten Stelle
Ist K ⊆ K kompakt und nichtleer, so besitzt jede stetige a abhängen.
Funktion f : K → R ein globales Maximum und ein
globales Minimum. Bei lipschitz-stetigen Funktionen (siehe Seite 321) kann man
das δ jedoch unabhängig von der betrachteten Stelle wählen,
ε
z. B. mittels δ = L+1 , wenn L die Lipschitz-Konstante ist.
Der Beweis ist klar, da f (K) eine nichtleere, kompakte Teil- Stetige Funktionen mit kompaktem Definitionsbereich D ha-
menge von R ist, die nach dem Satz über Maximum und Mi- ben diese Eigenschaft:
nimum kompakter Mengen (siehe Seite 327) ein Maximum
und ein Minimum besitzt.
Definition (Gleichmäßige Stetigkeit)
Wenn es zu jedem ε > 0 ein δ > 0 gibt, sodass für alle
? x, y ∈ D mit |x − y| < δ gilt: |f (x) − f (y)| < ε, dann
Bei diesem Satz sind beide Voraussetzungen essenziell. nennen wir f : D → K gleichmäßig stetig auf D
Überlegen Sie sich je ein Beispiel für eine beschränkte Funk-
tion, die entweder nicht stetig ist oder keinen kompakten √
Beispiel Die Funktion f : (0, 1) → x ist gleichmäßig
Definitionsbereich besitzt, und die zumindest eines ihrer
stetig auf (0, 1). Nimmt man nämlich 0 < y < x < 1 an, so
Extrema nicht annimmt.
gilt:
√ 
√ √
Ist f : K → C eine stetige komplexwertige Funktion mit ( x − y)2 = x − 2 xy + y ≤ x − 2 y 2 + y = x − y .
kompaktem Definitionsbereich K, so kann man den Exis-
Gilt nun zu vorgegebenem ε > 0 auch x − y < ε 2 , so folgt
tenzsatz auf die stetige Funktion |f | anwenden. Es gibt dann
x − ∈ K und x + ∈ K, sodass für alle x ∈ K gilt: √ √ √
| x − y| ≤ x − y < ε .

|f (x − )| ≤ |f (x)| ≤ |f (x + )| Die Annahme y < x bedeutet keine Einschränkung, die Rol-


len von x und y sind vertauschbar.
Als erste kleine Anwendung beweisen wir das für zahlreiche Die Funktion g : (0, 1) → 1/x ist nicht gleichmäßig stetig
Probleme wichtige Abstandslemma: auf (0, 1). Um dies zu sehen, wählen wir ε = 1. Es ist zu
332 9 Funktionen und Stetigkeit – ε trifft auf δ

Beispiel: Situationen bei der Lösung von Optimierungsaufgaben


Für eine stetige Funktion f : D → R mit D ⊆ R soll die Optimierungsaufgabe

minimiere f (x) für x ∈ D

untersucht werden. Welche typischen Fälle gibt es? Muss es eine Lösung geben?

Problemanalyse und Strategie: Ziel ist es, einfache Situationen zu identifizieren, in denen die Lösung der Opti-
mierungsaufgabe angegeben werden kann. Andererseits werden wir uns Fälle überlegen, in denen es keine Lösung
gibt.

Lösung: Abbildung links ist die einfachste Situation dargestellt: D


Zunächst betrachten wir den Fall, dass D ein abgeschlos- ist wieder ein abgeschlossenes Intervall, und es gibt eine
senes Intervall [a, b] ist und f streng monoton fällt. eindeutig bestimmte Lösung der Minimierungsaufgabe.
f (x)
f (x) f (x) f (x)

a x a b x a b x a b x
b

In der Abbildungen in der Mitte und rechts gibt es dagegen


Aus dem Graphen wird sofort klar, dass in diesem Fall die zwei Lösungen der Minimierungsaufgabe. Dabei können
Optimierungsaufgabe eine Lösung besitzt: das Minimum diese Lösungen sowohl im Innern als auch am Rand lie-
wird am rechten Rand des Intervalls b angenommen. gen.
Als zweiten Fall sei nun D = [a, ∞), also nach rechts un- Neben den bisher betrachteten globalen Extrema gibt es
beschränkt. Dann besitzt ein streng monoton fallendes f auch sogenannte lokale Extrema: Dies sind Stellen, die
kein Minimum, die Optimierungsaufgabe also keine Lö- eine Lösung der Optimierungsaufgabe wären, wenn man
sung. Dies gilt auch, wenn f nach unten beschränkt ist, die Funktion nur in einer kleinen Umgebung dieser Stelle
wie in der folgenden Abbildung. betrachtet. Die Abbildung zeigt zwei solcher lokalen Mi-
f (x) nima – nur eines davon ist ein globales Minimum.

f (x)

a x

Falls f nicht streng monoton ist, kann es auch im Inneren


a b x
von D Lösungen der Optimierungsaufgabe geben. In der

Kommentar: Als Fazit halten wir fest: Sofern Extrema existieren, können sie sowohl
auf dem Rand des Definitionsbereichs oder
im Innern des Definitionsbereichs
liegen. Es müssen stets beide Fälle untersucht werden.

zeigen, dass es für jedes δ > 0 Stellen x, y ∈ (0, 1) mit Der folgende Satz zeigt, dass die gleichmäßige Stetigkeit von

|x − y| < δ gibt, für die |g(x) − g(y)| ≥ 1 ist. x auf (0, 1) auch auf die stetige Fortsetzbarkeit der Qua-
dratwurzel auf das kompakte Intervall [0, 1] zurückgeführt
Wir wählen δ > 0 beliebig. Zu y ∈ (0, δ) setzen wir werden kann.
x = y/(y + 1) < y. Dann folgt:
Gleichmäßige Stetigkeit stetiger Funktionen mit
1 1 y+1 1 kompaktem Definitionsbereich
g(x) − g(y) = − = − = 1.
x y y y Sind K kompakt und f : K → K stetig, dann ist f
gleichmäßig stetig auf K.
Damit ist gezeigt, dass g nicht gleichmäßig stetig ist. 
9.5 Stetige Funktionen mit kompaktem Definitionsbereich, Zwischenwertsatz 333

Beispiel: Extremalwerte bei einer Funktion über C


Hat die Funktion f : D → R mit D = {z ∈ C | |z| ≤ 1} und

f (z) = |Im((2 − i)z)|

globale Extrema? Falls es Extremalstellen gibt, sollen diese berechnet werden.

Problemanalyse und Strategie: Zunächst werden wir uns eine untere und eine obere Schranke für die Funktionswerte
von f überlegen. Danach werden explizit Stellen angeben, an denen f diese Schranken als Funktionswert hat. Dies
müssen dann Extremalstellen sein.

Lösung: und daher durch Auflösen nach −4xy und abermaliges


Die Definitionsmenge D ist gerade die abgeschlossene Quadrieren:
Einheitskreisscheibe in der komplexen Zahlenebene. In
der Abbildung wird sie durch die blaue Kreislinie be- 16x 2 y 2 = (5 − x 2 − 4y 2 )2 .
grenzt. Da D beschränkt und abgeschlossen ist, ist D auch
kompakt. Die Funktion f ist stetig. Also nimmt f auf D f (z)
sein Maximum und Minimum an.

Die Funktionswerte von f sind Beträge von irgend-


welchen Zahlen, insbesondere gilt also f (z) ≥ 0 für alle
z ∈ D. Damit haben wir eine untere Schranke gefunden.

Ferner gilt für alle z ∈ D die Abschätzung


√ √
√ 5
− 2 5
f (z) ≤ |(2 − i)z| = |2 − i| |z| = 5 |z|. 5 5 i
√ √
5 2 5
√ − 5 + 5 i
Da |z| ≤ 1 ist für alle z ∈ D, folgt also f (z) ≤ 5 für
alle z ∈ D. Dies ist die obere Schranke. Re z Im z
Es ist leicht, die Stelle zu finden, in der die untere Schranke
als Funktionswert angenommen wird: Dies ist z. B. in Da |z0 | = 1 ist, folgt x 2 = 1 − y 2 . Dies eingesetzt liefert
z0 = 0 der Fall. Es gibt sogar unendlich viele solche Stel-
16x 2 − 16x 4 = (5 − x 2 − 4 + 4x 2 )2 ,
len, in der Abbildung kennzeichnet die rote Strecke alle
Minimalstellen. also 25x 4 − 10x 2 + 1 = 0

Wir suchen jetzt noch eine Stelle z0 ∈ D mit f (z0 ) = 5. und daher (5x 2 − 1)2 = 0.
Wir nehmen an, dass es tatsächlich eine solche Stelle gibt. √ √
Da f (z) = f (−z) ist, nehmen wir zusätzlich an, dass Es muss also x = ± 5/5 sein und somit y = 2 5/5.
Im(z0 ) ≥ 0 ist. Dann muss mit der Abschätzung von oben Wir setzen diese beiden Werte in f ein:
gelten: √ √  ))  √ √ ))
√ √ 5 2 5 ) 5 2 5 )
5 = f (z0 ) ≤ 5 |z0 |. f + i = )Im (2 − i) + i )
5 5 ) 5 5 )
Es folgt also |z0 | = 1. )  √ √ ) √
) 4 5 3 5 )) 3 5
)
= )Im + i )= ,
Ferner gilt: ) 5 5 ) 5
 √ √  ))   √ √ ))
1 5 2 5 ) 5 2 5 )
Im ((2 − i)z0 ) = ((2 − i) z0 − (2 + i) z0 ) f − + i = )Im (2 − i) − + i )
2i 5 5 ) 5 5 )
1 )  √ )
= (2(z0 − z0 ) − i(z0 + z0 )) ) 5 5 )) √
)
2i = )Im i ) = 5.
) 5 )
= 2 Im(z0 ) − Re(z0 ).
√ √
Wir setzen z0 = x + iy. Es folgt: Also ist eine Maximalstelle z0 = − 55 + 2 5 5 i. Diese und
die außerdem existierende zweite Maximalstelle −z0 , sind
5 = (f (z0 ))2 = 4y 2 − 4xy + x 2 in der Abbildung als graue Punkte eingezeichnet.
334 9 Funktionen und Stetigkeit – ε trifft auf δ

Beispiel Eine Anwendung der gleichmäßigen Stetigkeit tige Funktion ist und zweitens dass f ein abgeschlossenes
erhält man in dem folgenden Fortsetzungssatz: Intervall als Definitionsbereich hat. In diesem Fall nimmt f
nach dem Existenzsatz für globale Extrema (Seite 331) sein
Ist f : D → K gleichmäßig stetig, dann lässt sich f zu einer
Maximum und sein Minimum an Stellen x + bzw. x − an.
stetigen Funktion f&: D → K fortsetzen.
Ferner ist die gleichmäßige Stetigkeit ein unverzichtbares Zwischenwertsatz von Bolzano
Hilfsmittel, z. B. in der Integralrechnung.  Ist f : [a, b] → R eine stetige Funktion mit Minimum
f (x − ) und Maximum f (x + ), so gibt es für jedes y ∈
[f (x − ), f (x + )] eine Zahl x̂ ∈ [a, b] mit
Der Zwischenwertsatz garantiert die Existenz
der Lösung einer Gleichung f (x̂) = y.

Wir kehren nun zur ersten Grundaufgabe zurück, der Frage,


ob eine Gleichung lösbar ist. Auch bei dieser Frage können Beweis: Wir untersuchen zunächst den Fall f (a) < y.
wir in dem Fall, dass die Funktion f : D → R stetig ist, Wir definieren die Menge
eine Antwort geben. Hier schränken wir uns sogar auf den
A = {x ∈ [a, x + ] | f (x) ≤ y}.
Fall ein, dass der Definitionsbereich D ein abgeschlossenes
Intervall [a, b] ist. Es gilt A = ∅, da a ∈ A ist. Ferner ist A Teilmenge von [a, b]
und somit beschränkt. Es folgt, dass A ein Supremum besitzt,
Beispiel Die Funktion f : [−1, 1] → R mit f (x) = 3x 3 −x das wir mit x̂ bezeichnen. Es gibt dann auch eine Folge (xn )
ist in der Abbildung 9.30 zu sehen. Als Polynomfunktion ist aus A, die gegen x̂ konvergiert, und wegen der Stetigkeit von
sie eine stetige Funktion. In der Abbildung ist auch gut zu f gilt:
erkennen, dass das Maximum bzw. das Minimum von f in
y ≥ lim f (xn ) = f ( lim xn ) = f (x̂).
den beiden Randpunkten 1 bzw. −1 angenommen wird. Das n→∞ n→∞
Bild von f ist [−2, 2].
Wir nehmen nun an, dass y > f (x̂) ist. Es ist dann auch
x̂ < x + . Ferner gibt es wegen der Stetigkeit von f zu
f (x)
ε = (y − f (x̂))/2 ein δ > 0 mit
2
|f (x) − f (x̂)| ≤ ε für alle x ∈ (x̂ − δ, x̂ + δ).
Insbesondere gilt für ρ = min{δ/2, x + − x̂} und x̃ = x̂ + ρ,
1 dass
f (x̃) = f (x̂) + f (x̃) − f (x̂) ≤ f (x̂) + |f (x̃) − f (x̂)|
1  1 
≤ f (x̂) + y − f (x̂) = f (x̂) + y < y.
2 2
−1 1 x
Da x̃ < x + ist, folgt x̃ ∈ A. Andererseits ist x̃ > x̂ = sup A.
Dies ist ein Widerspruch. Die Annahme y > f (x̂) war falsch
−1 und es folgt f (x̂) = y.
Für den Fall f (a) > y wenden wir die obigen Überlegungen
auf die Funktion g(x) = y − f (x), x ∈ [a, b], an. Im Fall
−2 f (a) = y ist schon durch x̂ = a die gesuchte Stelle gege-
ben. 
Abbildung 9.30 Jeder Funktionswert zwischen −2 und 2 wird bei dem Polynom
f (x) = 3x 3 − x im Intervall [−1, 1] angenommen. ?
Überlegen Sie sich Beispiele dafür, dass der Zwischenwert-
Wir wählen jetzt eine beliebige Stelle y ∈ [−2, 2] auf der satz nicht gilt, wenn
vertikalen Achse aus und zeichnen eine horizontale Gerade f : [a, b] → R nicht stetig ist,
durch diese Stelle. In der Abbildung ist das für verschie- f : D → R stetig ist, aber D = (a, b) ein offenes Intervall
dene Werte von y durchgeführt worden. Egal, welches y ist,
man wählt, stets schneidet die horizontale Gerade den Gra- f : D → R stetig und D kompakt, aber kein abgeschlos-
phen von f – manchmal in einem, manchmal aber auch in senes Intervall ist.
zwei oder drei Punkten. Insgesamt aber können wir festhal-
ten: Stets gibt es ein x ∈ [−1, 1] mit f (x) = y. 
Kommentar: Man kann die Aussage des Zwischenwert-
Tatsächlich können wir diese Aussage ganz allgemein zei- satzes auch so formulieren, dass bei einer stetigen Funktion
gen, und wollen dies auch gleich tun. Dabei werden zwei jeder Wert zwischen ihrem Maximum und ihrem Minimum
Voraussetzungen entscheidend sein: erstens dass f eine ste- als Funktionswert angenommen wird.
9.5 Stetige Funktionen mit kompaktem Definitionsbereich, Zwischenwertsatz 335

Unter der Lupe: Der Zwischenwertsatz


Die Funktion f : [a, b] → R soll stetig sein und besitzt daher eine Minimalstelle x − und eine Maximalstelle x + auf [a, b]. Es
gibt dann für jedes y ∈ [f (x − ), f (x + )] eine Zahl x̂ ∈ [a, b] mit
f (x̂) = y.

Verdeutlichung der Aussage: Die Aussage ist leicht am Da a ∈ A liegt, ist diese Menge garantiert nichtleer. Au-
Graphen einer stetigen Funktion wie dem in der Abbildung ßerdem ist die Menge beschränkt, denn offensichtlich ist
einzusehen. Die Niveaulinie zu y muss bei einer stetigen A ⊆ [a, b]. Somit hat A ein Supremum, das wir mit x̂
Funktion offensichtlich den Graphen schneiden. Genau an bezeichnen.
einer solchen Stelle liegt die gesuchte Stelle x̂.
Was wissen wir über den Funktionswert von f an der Stelle
f (x) x̂ ? Wenn wir eine gegen x̂ konvergente Folge (xn ) aus A
betrachten, so folgt aufgrund der Stetigkeit von f , dass

f (x + ) f (x̂) = f ( lim xn ) = lim f (xn ) ≤ y


n→∞ n→∞

y ist.
Nun müssen wir noch zeigen, dass f (x̂) = y gilt, d. h.,
f (x − ) wir müssen f (x̂) < y ausschließen. Dazu bietet es sich
an, einen Widerspruch zu konstruieren. Nehmen wir an,
a A x̂ x+ x− b x f (x̂) < y. Dann muss wegen der Stetigkeit von f auch in
einer hinreichend kleinen Umgebung von x̂ diese Abschät-
zung gelten. Insbesondere existieren Stellen x zwischen x̂
Diskussion der Beweisidee: Da wir für eine beliebige und x + , für die f (x) < y ist. Dies ist aber ein Widerspruch
stetige Funktion die Stelle x̂ sicher nicht explizit ange- dazu, dass x̂ das Supremum von A ist. Für den formalen
ben können, müssen wir abstrakter argumentieren, um die Beweis ist diese Argumentation sauberer zu formulieren.
Existenz einer solchen Stelle zu zeigen. Es bieten sich auf Mit der ε-δ-Beschreibung der Stetigkeit wird im Beweis
Grundlage des bisher Bewiesenen zwei Möglichkeiten an, eine Zahl x̃ ∈ [x̂, x + ] konstruiert, für die f (x̃) < y gilt.
die beide wesentlich auf dem Vollständigkeitsaxiom auf- Somit ist x̃ ein Element von A, aber größer als x̂.
bauen. Entweder konstruieren wir explizit eine Folge (xn ),
zu der wir Konvergenz in [a, b] zeigen können, und ver- Mit diesen Überlegungen haben wir den Fall f (a) < y
suchen die Stetigkeit von f zu nutzen, um zu beweisen, vollständig erledigt. Für den Fall f (x̂) > y können wir
dass im Grenzfall gerade der Funktionswert y angenom- den Graphen von f an der Niveauline f (x) = y spiegeln.
men wird. Alternativ können wir versuchen, die Stetigkeit Dies entspricht dem Betrachten von g(x) = y − f (x),
zu nutzen, um eine Teilmenge von [a, b] zu finden, deren x ∈ [a, b]. Im Fall f (a) = y haben wir mit a schon
Supremum gerade die gesuchte Stelle ist. In beiden Fällen die Zwischenstelle gefunden. Insgesamt haben wir einen
besteht ein Beweis aus zwei Teilen. Man muss die Existenz vollständigen Beweis erarbeitet.
von x̂ sicherstellen und sich überlegen, dass f (x̂) = y gilt.
Im Haupttext wurde die zweite Möglichkeit für den Be- Bemerkungen:
weis gewählt. Ein erster rigoroser Beweis des Zwischenwertsat-
zes wurde vom Mathematiker Bernard Bolzano
(1781–1848) in einer Arbeit aus dem Jahre 1817 ausge-
Umsetzung der Idee: Wir beschränken uns zunächst auf
führt. Unabhängig erschien vier Jahre später ein Beweis
den in der Abbildung dargestellten Fall, dass f (a) < y
durch Augustin Louis Cauchy (1789–1857).
ist. Anschaulich ist klar, dass es zwischen a und x + min-
Das Vollständigkeitsaxiom wird nicht nur im Be-
destens einen Schnittpunkt mit der Niveaulinie f (x) = y
weis verwendet, es ist auch fundamental dafür, dass
gibt. Um diesen zu konstruieren, definieren wir die Menge
die Aussage überhaupt gilt. Konstruieren Sie selbst
A durch
ein Gegenbeispiel im Fall einer stetigen Funktion
A = {x ∈ [a, x + ] | f (x) ≤ y} . f : [a, b] ∩ Q → Q.

Beispiel Der Zwischenwertsatz hat viele Anwendungen Zur Beantwortung betrachten wir die Funktion f : [0,59] →
bei Betrachtungen zu Durchschnittswerten. Als Aufgaben- R, die jedem t diejenige Strecke f (t) zuordnet, die das Flug-
stellung betrachten wir folgendes Problem: Ein Flugzeug legt zeug im Zeitintervall [t, t + 1] zurücklegt. Die Aufgaben-
in einer Stunde eine Strecke von 240 km zurück. Gibt es eine stellung macht die Annahme plausibel, dass diese Funktion
Minute, in der es exakt 4 km zurücklegt? stetig ist.
336 9 Funktionen und Stetigkeit – ε trifft auf δ

Wäre nun f (t) > 4 für alle t ∈ [0, 59], so würde das Flug- Ist g(c) = 0, so ist f (c) = y. Ist dagegen g(c) > 0, so
zeug eine Strecke von mehr als 240 km zurücklegen. Es gibt ist g(d) < 0 und umgekehrt. Also gibt es nach dem Null-
also ein t1 mit f (t1 ) ≤ 4. Genauso überlegen wir uns, dass stellensatz ein x̂ ∈ [c, d] ⊆ [a, b] mit g(x̂) = 0. Dann ist
es ein t2 mit f (t2 ) ≥ 4 gibt. Der Zwischenwertsatz liefert f (x̂) = y. 

nun, dass es einen Wert t0 mit f (t0 ) = 4 geben muss. In der


Minute von t0 bis t0 + 1 legt das Flugzeug also genau 4 km
Beispiel Eine typische Anwendung des Nullstellensatzes
zurück. 
ist es, die Nullstellen von Polynomen zu finden. Betrachten
Weiterhin ergeben sich aus dem Zwischenwertsatz interes- wir etwa die Polynomfunktion p : [−2, 2] → R mit
sante Aussagen über die Bilder von Intervallen unter stetigen 10 3
Funktionen. p(x) = x 5 − 3x 4 − x + 10x 2 + x − 3.
3
Folgerung Die Frage ist: Wie viele Nullstellen besitzt die Funktion p?
Ist [a, b] ⊆ R ein kompaktes Intervall und f : [a, b] → R
stetig, dann ist die Bildmenge Y = [f (x − ), f (x + )] wie- Wir nützen aus, dass wir das Polynom für beliebige x ∈ R
der ein kompaktes Intervall. auswerten können, nicht nur für Zahlen aus [−2, 2]. Damit
Ist [a, b] ⊆ R kompakt und f : [a, b] → R stetig mit können wir eine Wertetabelle aufstellen:
f ([a, b]) ⊆ [a, b], dann gibt es (mindestens) ein x0 ∈ Stelle −3 −2 −1 0 1 2 3
[a, b] mit f (x0 ) = x0 . Wir sagen, f besitzt einen Fix-
punkt. Wert −312 − 55
3
16
3 −3 8
3 − 11
3 0

Eine Nullstelle haben wir also bereits gefunden, an der


Für den ersten Punkt folgt aus dem Fundamentalsatz
Stelle 3. Diese liegt aber außerhalb des Definitionsbereichs.
über stetige Funktionen mit kompaktem Definitionsbereich
Allerdings kann ein Polynom vom Grad 5 höchstens 5 Null-
(Seite 330), dass f (x − ) und f (x + ) im Bild enthalten sind.
stellen besitzen, also bleiben maximal 4 im Intervall [−2, 2]
Aus dem Zwischenwertsatz (Seite 334) ergibt sich, dass das
übrig.
Bild wieder ein Intervall ist. Auch der zweite Punkt ergibt
sich direkt aus dem Zwischenwertsatz.
f (x)

10
Der Nullstellensatz ist ein äquivalente
Formulierung des Zwischenwertsatzes

Häufig wird eine andere Formulierung des Zwischenwert- −2 −1 1 2 3 x


satzes verwendet, die auf dem ersten Blick ein klein wenig
spezieller erscheint, tatsächlich aber äquivalent ist.
−10
Nullstellensatz
Für eine stetige Funktion f : [a, b] → R gelte f (a) ·
f (b) < 0. Dann gibt es eine Nullstelle von f im Intervall −20
[a, b].
Abbildung 9.31 Die Nullstellen des Polynoms p(x) = x 5 − 3x 4 − 10
3 x +
3

10x 2 + x − 3. Es gibt genau 4 Nullstellen im Intervall [−2, 2].


Die Voraussetzung f (a) · f (b) < 0 besagt nur, dass f an
diesen beiden Stellen unterschiedliche Vorzeichen hat, d. h.,
Nun kommt der Nullstellensatz ins Spiel: Zwischen −2 und
die Zahl 0 liegt zwischen f (a) und f (b).
−1 wechselt p das Vorzeichen, also liegt dazwischen min-
destens eine Nullstelle (Abb. 9.31). Genauso zwischen −1
Beweis: Wir wollen zeigen, dass Zwischenwert- und Null-
und 0, zwischen 0 und 1 sowie zwischen 1 und 2. Also liegen
stellensatz äquivalent sind. Da 0 nach Voraussetzung zwi-
auch mindestens 4 Nullstellen im Intervall [−2, 2]. Insge-
schen f (a) und f (b) liegt, folgt der Nullstellensatz direkt
samt folgt also, dass die Funktion p insgesamt 4 Nullstellen
aus dem Zwischenwertsatz. Es bleibt die andere Richtung zu
besitzt. 
zeigen.
Vorgegeben ist eine stetige Funktion f : [a, b] → R mit glo-
baler Minimalstelle x − und globaler Maximalstelle x + . Wir
Aus dem Zwischenwertsatz lassen sich
wählen ferner y ∈ [f (x − ), f (x + )] beliebig. weitere nützliche Eigenschaften stetiger
Funktionen herleiten
Setze nun c = min{x − , x + } und d = max{x − , x + } und
definiere g : [c, d] → R durch
Aus dem Zwischenwertsatz lassen sich viele weitere Fol-
g(x) = f (x) − y . gerungen ziehen, die für die alltägliche Arbeit mit stetigen
9.5 Stetige Funktionen mit kompaktem Definitionsbereich, Zwischenwertsatz 337

Übersicht: Sätze über Funktionen mit kompaktem Definitionsbereich und Gegenbeispiele


Die Sätze aus dem Abschnitt 9.5 haben gemein, dass ihre Voraussetzungen scharf sind: Stets findet man ein Gegenbeispiel für
die Aussage, wenn nur ein kleiner Teil der Annahmen nicht erfüllt ist. Hier sind typische Fälle zusammengetragen.

Existenz von Extrema


Stetige Funktion mit kompaktem Definitionsbereich:
1
f : [1, 3] → R, f (x) = .
x
Der Satz gilt, Maximum und Minimum werden ange-
nommen.
Stetige Funktion mit beschränktem Definitionsbereich,
nicht abgeschlossen:
1
f : (0, 1) → R, f (x) = .
x
Das Maximum wird nicht angenommen.
Stetige Funktion mit abgeschlossenem Definitionsbe-
reich, nicht beschränkt:
1
f : [1, ∞) → R, f (x) = .
x
Das Minimum wird nicht angenommen.
Stetige Funktion, Definitionsbereich weder abge-
schlossen noch beschränkt:
1
f : (0, ∞) → R, f (x) = .
x
Weder Maximum noch Minimum werden angenom-
men.
Definitionsbereich kompakt, aber unstetige Funktion:

x 1 ≤ x < 2,
f : [1, 3] → R, f (x) =
1 2 ≤ x ≤ 3.

Das Maximum wird nicht angenommen.

Zwischenwertsatz
Stetige Funktion mit abgeschlossenem Intervall als De- y
finitionsbereich:

f : [1, 3] → R, f (x) = x 2 .

Der Satz gilt, jeder Zwischenwert wird angenommen.


Stetige Funktion, Definitionsbereich kein abgeschlos-
senes Intervall:

f : [1, 2] ∪ [4, 5] → R, f (x) = x 2 . y

Der Wert 9 wird z. B. nicht angenommen.


Definitionsbereich abgeschlossenes Intervall, aber
Funktion nicht stetig:

x 2 1 ≤ x ≤ 2,
f : [1, 3] → R, f (x) = 1
2 2 < x ≤ 3. y

Der Wert 3/4 wird z. B. nicht angenommen.


338 9 Funktionen und Stetigkeit – ε trifft auf δ

Funktionen nützlich sind. Wir beginnen mit einer Aussage Wir nehmen zunächst an, dass x kein Randpunkt von I ist.
über Bilder von Intervallen unter stetigen Funktionen. Für Dann können wir ε > 0 so wählen, dass [x − ε, x + ε] ⊆ I
kompakte Intervalle ist diese Aussage aus dem bereits ge- ist. Da f streng wächst erhalten wir
zeigten sofort ersichtlich, für allgemeine Intervalle sind je-
doch allgemeinere Überlegungen nötig. f (x − ε) < y < f (x + ε) .

Da (yn ) gegen y konvergiert, existiert ein N ∈ N mit yn ∈


Satz (Stetige Bilder von Intervallen)
(f (x − ε), f (x + ε)) für alle n ≥ N . Aufgrund der strengen
Sind I ein Intervall und f : I → R stetig, so ist f (I )
Monotonie von f −1 folgt hieraus:
ein Intervall.
x − ε < xn < x + ε für n ≥ N .
Beweis: Ein Intervall I ist dadurch charakterisiert, dass
aus a, b ∈ I und a < c < b auch c ∈ I folgt. Dies bedeutet, dass f −1 in y stetig ist.

Wir wählen nun u < v in f (I ). Dann gibt es x, y ∈ I mit Ist x linker bzw. rechter Randpunkt von I , so ist wegen der
f (x) = u, f (y) = v. Setze a = min{x, y}, b = max{x, y}. strengen Monotonie auch y linker bzw. rechter Randpunkt
Nach dem Zwischenwertsatz gib es nun zu jedem w ∈ (u, v) von f (I ). Beachtet man dies, so geht der Beweis in diesen
ein z ∈ [a, b] mit f (z) = w. Es folgt w ∈ f (I ), was zu Fällen ganz analog. 

zeigen war. 

Wenn Sie den Beweis der Folgerung genau durchgehen, er-


Auf Seite 312 hatten wir gezeigt, dass jede streng monotone kennen Sie, dass wir die Stetigkeit von f nur genutzt haben,
Funktion injektiv ist. Die Umkehrung dieser Aussage ist im um zu zeigen, dass f streng monoton ist. Es gilt also die allge-
Allgemeinen falsch. Allerdings ist sie richtig, wenn man sich meinere Aussage, dass f −1 stetig ist, falls f streng monoton
auf stetige, auf Intervallen definierte Funktionen beschränkt. ist und die Definitionsmenge von f ein Intervall ist.

Lemma Beispiel Wir wenden dies auf die Funktionen


Sind I ⊆ R ein Intervall und f : I → R stetig und
injektiv, so ist f streng monoton. fk (x) = x k , x∈R

Beweis: Wir betrachten drei Zahlen a < b < c aus I . für k ∈ N0 an. Für x ≥ 0 sind diese Funktionen streng mono-
ton. Nach der eben bewiesenen Aussage, sind ihre Umkehr-
Angenommen es gilt f (a) < f (b) und f (c) < f (b). Setze funktionen
y = max{f (a), f (c)}. Dann ist f (a) ≤ y < f (b), und nach  −1 √
dem Zwischenwertsatz gibt es ein x̂ ∈ [a, b] mit f (x̂) = y. fk |R≥0 (y) = k y, y ∈ R≥0
Andererseits ist auch f (c) ≤ y < f (b), und es gibt somit
nach dem Zwischenwertsatz ein x̃ ∈ [b, c] mit f (x̃) = y. ebenfalls stetig. Ist k ungerade, so ist fk sogar auf ganz R
Da y < f (b), ist x̂ = b und x̃  = b. Somit folgt x̂ < b < x̃ streng monoton, die Umkehrfunktion existiert also auf ganz
und f (x̂) = y = f (x̃). Dies ist aber im Widerspruch dazu, R und ist dort stetig. In diesem Sinne können wir für y < 0

dass f injektiv ist. die Zahl k y als eindeutig bestimmte negative Lösung der
Gleichung x k = y auffassen. Hierbei ist aber etwas zu be-
Ganz analog behandeln wir den Fall f (a) > f (b) und achten: Im Kapitel 11 werden wir die allgemeine Potenz y α
f (c) > f (b). Da Gleichheit wegen der Injektivität von f für α ∈ R und y ∈ C \ {0} erklären. Die Zahl y 1/k stimmt
ausgeschlossen werden kann, folgt entweder f (a) < f (b) dabei für y < 0 und k ∈ N nicht mit der eben gefundenen
< f (c) oder f (a) > f (b) > f (c). Somit ist f streng mo- k-ten Wurzel überein, sondern es handelt sich um eine im All-
noton.  gemeinen andere, komplexe Lösung der Gleichung x k = y.
Man spricht in diesem Zusammenhang auch von den Haupt-
Aus dem eben bewiesenen Lemma ergibt sich noch eine Fol- und Nebenwerten der k-ten Wurzeln. Mehr dazu im Kapi-
gerung zur Stetigkeit von Umkehrfunktionen. tel 11. 

Folgerung Kommentar: Die Sätze, die wir in diesem Abschnitt ken-


Sind I ⊆ R ein Intervall und f : I → R stetig und nengelernt haben, haben eine Gemeinsamkeit: Sie machen
injektiv, so ist f −1 : f (I ) → I stetig. nur eine Aussage, dass es bestimmte Zahlen (Extremstellen,
Nullstellen) gibt, wir erhalten aber kaum Informationen über
Beweis: Aufgrund des Lemmas oben wissen wir, dass f die Lage dieser Zahlen, wie wir sie berechnen können oder
streng monoton ist. Ohne Einschränkung wollen wir anneh- wie viele es gibt. Man nennt solche Aussagen Existenzsätze.
men, dass f streng monoton wächst. Dann tut dies auch f −1 .
Der hauptsächliche Wert von Existenzsätzen ist theoretischer
Wir wählen y ∈ f (I ) und eine Folge (yn ) aus f (I ), die Natur: Wir können diese Aussagen in Beweisen verwenden,
gegen y konvergiert. Wir setzen auch x = f −1 (y) und um andere Aussagen herzuleiten. Aber auch für viele nume-
xn = f −1 (yn ). Zu zeigen ist, dass (xn ) gegen x konvergiert. rische Berechnungsverfahren muss man vor der Anwendung
9.5 Stetige Funktionen mit kompaktem Definitionsbereich, Zwischenwertsatz 339

wissen, dass eine Lösung existiert. Sonst liefert der Computer dreifache Nullstelle, . . . ). Die Anzahl der Faktoren, die die-
vielleicht irgendetwas Zufälliges als Ergebnis, das mit dem selbe Nullstelle enthalten, nennt man auch Vielfachheit die-
eigentlichen Problem nichts zu tun hat. Schließlich kann man ser Nullstelle (siehe Abschnitt 3.4).
auch manchmal durch geschicktes Anwenden von Existenz-
aussagen ein Berechnungsverfahren entwickeln. Das Bei-
spiel auf Seite 340 illustriert dies. Beweis: Wir schreiben das Polynom p in der Form

!
n
p(z) = αj zj
Der Fundamentalsatz der Algebra: Jedes j =0
komplexe Polynom vom Grad n ist ein
Produkt von genau n Linearfaktoren mit Koeffizienten αj ∈ C. Wir können annehmen, dass
αn = 1 ist, denn beim Teilen der Gleichung p(z) = 0 durch
Mit dem letzten Satz dieses Kapitels, dem Fundamentalsatz αn würde sich an der Lage der Nullstelle nichts ändern.
der Algebra wollen wir noch einmal unterstreichen, wie trag- (i) Wir zeigen, dass |p| ein globales Minimum besitzt.
fähig die in diesem Kapitel gewonnen Aussagen tatsächlich
sind. Der Name Fundamentalsatz deutet bereits darauf hin, Wir setzen nun f (z) = |p(z)|. Die Funktion f : C → R
dass es sich bei dieser Aussage um einen besonders bedeuten- ist stetig und reellwertig. Wir wollen nun zeigen, dass
den Satz handelt. Umso erstaunlicher ist es, dass wir ihn mit f (z) ≥ f (0) ist, falls |z| groß genug ist. Wir setzen
den bisher gewonnen Mitteln bereits beweisen können. Der C = max{1, (2f (0))1/n , 2 n−1 j =0 |αj |} und betrachten z mit
Satz garantiert die Existenz von Nullstellen von Polynomen |z| ≥ C. Die Konstante C ist gerade so geschickt gewählt,
im Komplexen. dass wir nun abschätzen können:
) )
) )
) !
n−1
)
Fundamentalsatz der Algebra n) j −n )
f (z) = |z| )1 + αj z )
Jedes Polynom p : C → C vom Grad n ≥ 1 besitzt ) j =0 )
mindestens eine Nullstelle. ⎛ ⎞
1 ! |αj |
n−1
≥ |z|n ⎝1 − ⎠
Wichtig bei dieser Aussage ist natürlich, dass wir im Komple- |z| |z|n−j −1
j =0
xen arbeiten müssen. Es ist ja hinlänglich bekannt, dass eine ⎛ ⎞
1 !
n−1
quadratische Gleichung im Reellen eben keine Lösung haben |z|≥1
n⎝
≥ |z| 1 − |αj |⎠
muss. Sehr wohl gibt es aber immer Lösungen im Komple- |z|
j =0
xen. Z. B. gilt:
n−1
|z|≥2 |αj |} ' (
2
x + 1 = (x + i)(x − i). j =0 1
≥ |z|n 1 −
2
Es ist keine reelle Nullstelle vorhanden, aber die komplexen |z|≥(2f (0))1/n
Nullstellen ±i. ≥ f (0).
Aus dem Kapitel 4 wissen wir bereits, dass für eine Nullstelle
z0 stets ein Linearfaktor aus dem Polynom ausgeklammert Aus dieser Rechnung folgt also, dass ein globales Minimum
werden kann: von f , falls es existiert, auf jeden Fall im Kreis |z| ≤ C ange-
nommen wird. Dieser Kreis ist aber eine kompakte Menge.
p(z) = (z − z0 ) q(z),
Da f stetig ist, folgt also aus dem Existenzsatz für globale
wobei q einen um eins geringeren Grad als p besitzt. Der Extrema, dass das Minimum von f im Kreis |z| ≤ C ange-
Fundamentalsatz sagt nun aus, dass auch q wieder eine Null- nommen wird. Die zugehörige Minimalstelle bezeichnen wir
stelle besitzt, solange es noch nicht eine Konstante ist. Wie mit ẑ.
verträgt sich dies damit, dass manche Polynome nur eine ein-
(ii) Wir zeigen: Der Wert von p an der Stelle ẑ ist 0.
zige Nullstelle haben? Die Antwort ist, dass natürlich auch
q wieder z0 als Nullstelle besitzen kann. Es folgt, dass man Von Seite 309 wissen wir, dass wir das Polynom p um ẑ
bei Verwendung von komplexen Zahlen, ein Polynom vom entwickeln können, also als
Grad n stets als ein Produkt von n Linearfaktoren schreiben
kann: !
n
p(z) = β0 + βj (z − ẑ)j
p(z) = (z − z0 )(z − z1 ) · · · (z − zn−1 ), j =k

wobei die Nullstellen zj ∈ C nicht alle verschieden sein müs- schreiben. Hierbei ist k eine natürliche Zahl zwischen 1 und
sen. Kommt eine Nullstelle mehr als einmal vor, so spricht n, die so gewählt wird, dass βk = 0 ist. Da p mindestens den
man von mehrfachen Nullstellen (etwa doppelte Nullstelle, Grad 1 hat, gibt es ein solches k auch sicherlich.
340 9 Funktionen und Stetigkeit – ε trifft auf δ

Beispiel: Das Bisektionsverfahren


Gegeben ist eine Funktion f : [a, b] → R, a, b ∈ R, a < b, die die Voraussetzungen des Nullstellensatzes erfüllt. Berechnen
Sie numerisch eine Nullstelle – oder eine Approximation an den Wert einer Nullstelle – von f .

Problemanalyse und Strategie: Der Nullstellensatz garantiert die Existenz mindestens einer Nullstelle der Funktion
in im Intervall [a, b]. Zur Approximation einer Nullstelle wollen wir eine Folge konstruieren, die gegen eine Nullstelle
konvergiert. Die Grundidee ist es, den Funktionswert an der Stelle (a + b)/2 zu betrachten. Entweder liegt dort eine
Nullstelle vor, oder in einem der beiden so entstandenen Teilintervalle kann wieder der Nullstellensatz angewandt werden.
So lässt sich rekursiv fortfahren.
f (x)
Lösung:
Es ist f : [a, b] → R stetig, und es gilt f (a) · f (b) < 0.

y3 = y4

b = y0 =
Nach dem Nullstellensatz existiert eine Nullstelle x̂ von f

y1 = y2
im Intervall [a, b]. Allerdings ist es möglich, dass mehrere
Nullstellen existieren, wie die Abbildung illustriert.
x

x1

x2 = x3
a = x0

x4
f (x)

Mit dem Monotoniekriterium für Folgen (Seite 292) sehen


wir also, dass sowohl die Folge (xj ) als auch die Folge
a x (yj ) konvergiert. Außerdem kann man durch vollständige
b
Induktion schnell zeigen, dass
' (j
1
Wir betrachten nun den Mittelpunkt des Intervalls y j − xj = (b − a)
2
a+b
x1 = . ist. Damit folgt limj →∞ xj = lim yj . Wir nennen die-
2 j →∞
Es gibt drei Fälle: Am einfachsten ist der Fall f (x1 ) = 0. sen Grenzwert x̂ und sehen, dass sowohl f (x̂) ≥ 0 also
Dann haben wir schon eine Nullstelle gefunden. Die an- auch f (x̂) ≤ 0 gelten muss. Also ist x̂ eine Nullstelle von
deren beiden Fälle sind diejenigen, dass f (x1 ) dasselbe f . Auch die Folge (mj ) der Intervallmittelpunkte konver-
Vorzeichen hat wie f (b) oder aber dasselbe wie f (a). giert gegen x̂, und es gilt die Abschätzung:
Falls das erste zutrifft, muss eine Nullstelle von f im In- ' (j
1
tervall [a, x1 ] liegen, im zweiten Fall im Intervall [x1 , b]. |x̂ − mj | ≤ (b − a).
2
Wir haben also das Intervall halbiert, und können jetzt die-
selbe Überlegung für das halbierte Intervall durchführen. Wir wollen das Verfahren auf die Funktion f : [1, 2] → R,
Damit erhalten wir den folgenden Algorithmus: f (x) = x 2 − 2 anwenden.√Die Funktion f hat genau
1. Starte mit dem Intervall [xj , yj ], sodass f (xj ) · eine Nullstelle, nämlich bei 2. Es ergeben sich folgende
f (yj ) < 0 gilt. Zu Anfang des Verfahrens (j = 0) Werte für die Intervallmittelpunkte.
ist dies gerade das Intervall [a, b]. j mj f (m j ) (1/2) j (b − a)
2. Berechne mj = (xj + yj )/2. 0 1.500 00 0.250 00 1.000 0
3. Ist f (mj ) = 0, so haben wir eine Nullstelle gefunden. 1 1.250 00 −0.437 50 0.500 0
4. Ist f (xj ) · f (mj ) < 0, so setze 2 1.375 00 −0.109 38 0.250 0
..
xj +1 = xj und yj +1 = mj . .
5 1.421 88 0.021 73 0.031 3
5. Andernfalls gilt f (yj ) · f (mj ) < 0. Setze dann 6 1.414 06 −0.000 43 0.015 6
xj +1 = mj und yj +1 = yj . Es müssen bereits 6 Schritte durchgeführt werden, um
6. Erhöhe j um eins und starte wieder bei Schritt 2. zum ersten Mal zwei richtige Dezimalstellen hinter dem
Da dieses Verfahren auf der Halbierung von Intervallen be- Komma im Ergebnis zu erhalten. Wenn Sie diese Kon-
ruht, nennt man es Intervallhalbierungs- oder Bisektions- vergenzgeschwindigkeit mit der des Heron-Verfahrens
verfahren. Auch der Name Intervallschachtelung ist dafür (Seite 296) vergleichen, stellen Sie fest, dass das Bisekti-
üblich. Wir wollen nun annehmen, dass das Verfahren nie onsverfahren sehr langsam konvergiert. Zur schnellen Be-
im 3. Schritt abbricht. Dann konstruieren wir auf diese rechnung von Nullstellen ist es daher nicht geeignet. Es hat
Weise 2 Folgen (xj ) und (yj ). Mithilfe der Abbildung aber einen entscheidenden Vorteil gegenüber anderen Ver-
wird klar, dass diese die Eigenschaft fahren zur Nullstellenberechnung, die wir später im Buch
noch besprechen werden: Sofern im Anfangsintervall eine
a = x0 ≤ x1 ≤ · · · ≤ xj ≤ yj ≤ · · · ≤ y1 ≤ y0 = b
Nullstelle von f liegt, konvergiert das Bisektionsverfah-
für alle j ∈ N erfüllen. ren mit Sicherheit.
Zusammenfassung 341

Wir wollen nun annehmen, dass p keine Nullstelle besitzt. Damit wiederum erhalten wir
Dann ist insbesondere auch β0  = 0. Wir betrachten nun die  
Gleichung zk = −β0 /βk . Diese besitzt im Komplexen stets εk
|p(ẑ + εw)| ≤ |β0 | 1 − < |β0 | = |p(ẑ)|.
eine Lösung w. 2

Für ein ε > 0 können wir nun schreiben: Dies ist aber ein Widerspruch, denn ẑ ist eine Minimalstelle
von |p|. Also besitzt p mindestens eine Nullstelle. 
!
n
p(ẑ + εw) = β0 + βj (ε w)j
Kommentar: Dieser Beweis des Fundamentalsatzes, der
j =k
so im Wesentlichen im Jahre 1814 vom schweizer Mathema-
!
n
tiker Jean-Robert Argand (1768–1822) geführt wurde, ent-
= β0 + ε k βk w k + βj (ε w)j
hält zwar verschiedene technische Überlegungen, verwendet
j =k+1
aber im Wesentlichen drei fundamentale Aussagen:
!n
βj j −k j
= β0 − ε k β0 + ε k β0 ε w Der Betrag des Werts von Polynomen geht gegen unend-
β
j =k+1 0 lich, wenn das Argument gegen unendlich geht.
⎡ ⎛ ⎞⎤
!n Stetige Funktionen auf kompakten Mengen nehmen ihr
β j j −k j ⎠⎦
= β0 ⎣1 − ε k ⎝1 − ε w . Minimum an.
β0 Die Gleichung zk = u mit u ∈ C \ {0} und k ∈ N besitzt
j =k+1
in C stets eine Lösung. Dies entspricht der Existenz der
Jeder Term in der Summe enthält mindestens den Faktor ε. k-ten Wurzel in C.
Falls also ε klein genug gewählt wird, gilt:
Überlegen Sie sich, wo jede dieser Aussagen verwendet wird.
) )
) ! )
) n βj j −k j ) 1 Neben dem Beweis von Argand gibt es noch viele andere
) ε w )≤ .
) ) 2 Möglichkeiten, den Fundamentalsatz zu beweisen. Beson-
)
j =k+1
β0 )
ders einfache Beweise gelingen mit den Mitteln der Funk-
tionentheorie. Dieses Gebiet der Mathematik umfasst die
Analysis im Komplexen.

Zusammenfassung

Funktionen f : D → W mit D, W ⊆ C sind die grundlegen- lokal, d. h. sie definieren die Stetigkeit einer Funktion in einer
den Bausteine der Analysis. Durch punktweise Addition und einzelnen Stelle x̂.
eine skalare Multiplikation bilden die Funktionen einen Vek-
Ein Funktion f : D → W heißt Lipschitz-stetig, wenn eine
torraum. Zusätzliche Struktur erhalten sie durch die Möglich-
Konstante L > 0 mit der Eigenschaft
keit der Verkettung. Wichtige Klassen von Funktionen sind
die beschränkten und die monotonen Funktionen. |f (x) − f (y)| ≤ L |x − y| für alle x, y ∈ D
Indem man gegen x̂ konvergente Folgen (xn ) aus D und die existiert. Diese Eigenschaft ist global, d. h. sie gilt für den
zugehörigen Folgen der Funktionswerte (f (xn )) betrachtet, ganzen Definitionsbereich D. Insbesondere ist sie stärker als
kann der Grenzwert limx→x̂ f (x) definiert werden. Überle- die Eigenschaft einer Funktion, auf ihrem ganzen Definiti-
gungen zur Vertauschbarkeit dieses Grenzübergangs mit der onsbereich stetig zu sein.
Funktionsanwendung führen auf den Begriff der Stetigkeit.
Wichtige Beispiele stetiger Funktionen sind Polynome. Auch
Definition der Stetigkeit rationale Funktionen sind auf ihrem gesamten Definitionsbe-
reich stetig. Dies gilt ebenso für viele weitere Standardfunk-
Eine Funktion f : D → W heißt an der Stelle x̂ ∈ D
tionen, wie sie im Kapitel 11 über Potenzreihen eingeführt
stetig falls
werden. Eine wichtige Operation ist ferner die stetige Fort-
lim f (x) = f (x̂)
x→x̂ setzung von Funktionen über ihren Definitionsbereich hin-
aus.
gilt. Ist f an jedem x ∈ D stetig, so heißt f auf D stetig.
Die Menge aller auf D stetigen Funktionen bezeichnen Um Eigenschaften stetiger Funktionen zu beschreiben, müs-
wir mit C(D). sen ihre Definitionsbereiche genauer klassifiziert werden.
Hierzu definiert man offene und abgeschlossene Men-
Neben dieser Definition der Stetigkeit über Folgen gibt es gen und den Rand einer Menge. Abgeschlossene Men-
die dazu äquivalente -δ-Definition. Beide Definitionen sind gen können z. B. darüber charakterisiert werden, dass sie die
342 9 Funktionen und Stetigkeit – ε trifft auf δ

Grenzwerte aller konvergenten Folgen aus ihren Elementen Existenzsatz für globale Extrema
enthalten, dass sie ihren Rand enthalten oder dass sie mit
(K. Weierstraß, 1861)
ihrem Abschluss übereinstimmen. Eine offene Menge ent-
hält mit jedem Punkt auch eine Umgebung dieses Punktes. Ist K ⊆ K kompakt und nichtleer, so besitzt jede stetige
Das Komplement jeder abgeschlossenen Menge ist offen und Funktion f : K → R ein globales Maximum und ein
umgekehrt. globales Minimum.

Über offene Mengen lässt sich auch Stetigkeit als globale Ei-
genschaft einer Funktion charakterisieren: Eine Funktion ist Eine weitere zentrale Aussage über stetige reellwertige Funk-
genau dann auf ihrem ganzen Definitionsbereich stetig, wenn tionen ist der Zwischenwertsatz oder der dazu äquivalente
das Urbild jeder offenen Menge wieder offen ist. Diese Aus- Nullstellensatz. Hier muss der Definitionsbereich der Funk-
sage wird in der Topologie als Definition stetiger Abbildun- tion ein Intervall sein.
gen zwischen sogenannten topologischen Räumen genutzt.
Zwischenwertsatz von Bolzano
Ist eine Menge beschränkt und abgeschlossen, so nennt man
sie kompakt. Eine wichtige Charakterisierung kompakter Ist f : [a, b] → R eine stetige Funktion mit Minimum
Mengen ergibt sich aus dem Vollständigkeitsaxiom für R f (x − ) und Maximum f (x + ), so gibt es für jedes y ∈
bzw. C: [f (x − ), f (x + )] eine Zahl x̂ ∈ [a, b] mit

f (x̂) = y.
Bolzano-Weierstraß-Charakterisierung kompakter
Mengen
Eine Teilmenge K ⊆ K ist genau dann kompakt, wenn Der Zwischenwertsatz ist ein wichtiges Werkzeug der Ana-
jede Folge von Elementen aus K eine Teilfolge besitzt, lysis zur Herleitung von Existenzaussagen: Es gibt eine Null-
die gegen einen Punkt aus K konvergiert. stelle, aber wir erhalten keine Information über deren Lage.
Es ergeben sich zahlreiche bedeutende Folgerungen. Eine
sehr bekannte davon sichert die Existenz von Nullstellen von
Die Bilder von kompakten Mengen unter stetigen Funktio-
Polynomen über C.
nen sind wieder kompakt. Eine auf einer kompakten Menge
definierte stetige Funktion ist auch immer gleichmäßig ste-
tig. Da kompakte Teilmengen von R stets ihr Maximum und Fundamentalsatz der Algebra
ihr Minimum enthalten, erhalten wir eine zentrale Aussage
Jedes Polynom p : C → C vom Grad n ≥ 1 besitzt
über stetige reellwertige Funktionen mit kompaktem Defini-
mindestens eine Nullstelle.
tionsbereich.

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 9.2 • Formulieren Sie mithilfe der ε-δ-Definition der


9.1 • Bestimmen Sie jeweils den größtmöglichen Defi- Stetigkeit die Aussage, dass eine Funktion f : D → W im
nitionsbereich D ⊆ R und das zugehörige Bild der Funktio- Punkt x0 ∈ D nicht stetig ist.
nen f : D → R mit den folgenden Abbildungsvorschriften:
1 9.3 • Welche stetigen Funktionen f : R → R erfüllen
x+ x x 2 + 3x + 2
(a) f (x) = (b) f (x) = 2 die Funktionalgleichung
x x +x−2
1 %
(c) f (x) = (d) f (x) = x 2 − 2x − 1 f (x + y) = f (x) + f (y) , x, y ∈ I ?
x4 − 2x 2 + 1
Aufgaben 343

9.4 •• Welche der folgenden Teilmengen von C sind be- 2x − 3


schränkt, abgeschlossen und/oder kompakt? (b) lim
x→∞ x − 1
√ √ 
(a) {z ∈ C | |z − 2| ≤ 2 und Re(z) + Im(z) ≥ 1} (c) lim x+1− x
x→∞
(b) 2
{z ∈ C | |z| + 1 ≥ 2 Im(z)} ' (
1 1
(d) lim − 2
(c) {z ∈ C | 1 > Im(z) ≥ −1} x→0 x x
∩ {z ∈ C | Re(z) + Im(z) ≤ 0}
∩ {z ∈ C | Re(z) − Im(z) ≥ 0}
9.10 •• Verwenden Sie die ε-δ-Formulierung der Ste-
(d) {z ∈ C | |z + 2| ≤ 2} ∩ {z ∈ C | |z − i| < 1} tigkeit, um zu zeigen, dass die folgenden Funktionen stetig
sind. Ist eine von ihnen gleichmäßig stetig?
9.5 • Welche der folgenden Aussagen über eine Funk- 1
tion f : (a, b) → R sind richtig, welche sind falsch. (a) f (x) = , x ∈ (0, 1)
−x−2
x2
(a) f ist stetig, falls für jedes x̂ ∈ (a, b) der linksseitige x2 − 1
Grenzwert lim f (x) mit dem rechtsseitigen Grenzwert (b) g(x) = , x>2
x→x̂−
x+1
lim f (x) übereinstimmt.
x→x̂+
(b) f ist stetig, falls für jedes x̂ ∈ (a, b) der Grenzwert 9.11 •• Bestimmen Sie die globalen Extrema der fol-
lim f (x) existiert. genden Funktionen.
x→x̂
(c) Falls f stetig ist, ist f auch beschränkt.
(a) f : [−2, 2] → R mit f (x) = 1 − 2x − x 2
(d) Falls f stetig ist und eine Nullstelle besitzt, aber nicht
die Nullfunktion ist, dann gibt es Stellen x1 , x2 ∈ (a, b) (b) f : R → R mit f (x) = x 4 − 4x 3 + 8x 2 − 8x + 4
mit f (x1 ) < 0 und f (x2 ) > 0.
(e) Falls f stetig und monoton ist, wird jeder Wert aus dem
Bild von f an genau einer Stelle angenommen. 9.12 ••• Auf der Menge M = {z ∈ C | |z| ≤ 2} ist die
Funktion f : C → R mit
9.6 • Wie muss jeweils der Parameter c ∈ R gewählt
f (z) = Re [(3 + 4i)z]
werden, damit die folgenden Funktionen f : D → R stetig
sind? definiert.
⎧ 2
⎨ x + 2x − 3 (a) Untersuchen Sie die Menge M auf Offenheit, Abge-
, x = 1
(a) D = [−1, 1], f (x) = x 2 + x − 2 schlossenheit, Kompaktheit.

c, x=1 (b) Begründen Sie, dass f globale Extrema besitzt und be-
stimmen Sie diese.
⎧ 3
⎨ x − 2x − 5x + 6
2
, x = 1
(b) D = (0, 1], f (x) = x3 − x 9.13 • Zeigen Sie, dass das Polynom

c, x=1
82 3
p(x) = x 5 − 9x 4 − x + 82x 2 + x − 9
9
9.7 •• Gegeben ist eine Funktion f : [a, b] → R mit der
auf dem Intervall [−1, 4] genau drei Nullstellen besitzt.
folgenden Zwischenwerteigenschaft: Sind y1 , y2 ∈ f ([a, b]),
so ist y ∈ f ([a, b]) für jedes y zwischen y1 und y2 . Ist f
notwendigerweise stetig? 9.14 •• Betrachten Sie die beiden Funktionen f ,
g : R → R mit

9.8 •• Gegeben ist eine Funktion f : [0, 1] → R durch 4 − x2, x ≤ 2,
die Abbildungsvorschrift f (x) =
⎧ 4x − 24x + 36, x > 2
2

⎨ 1 , x = p , p, q ∈ N teilerfremd, und
q q
f (x) = g(x) = x + 1.
⎩0, sonst.
Zeigen Sie, dass die Graphen der Funktionen mindestens vier
In welchen Punkten ist f stetig? Schnittpunkte haben.

Rechenaufgaben
Beweisaufgaben
9.9 • Berechnen Sie die folgenden Grenzwerte:
9.15 • Gegeben sind zwei stetige Funktionen f ,
x 4 − 2x 3 − 7x 2 + 20x − 12 g : R → C mit f (x) = g(x) für alle x ∈ Q. Zeigen Sie
(a) lim 4
x→2 x − 6x 3 + 9x 2 + 4x − 12 f (x) = g(x) für alle x ∈ R.
344 9 Funktionen und Stetigkeit – ε trifft auf δ

9.16 ••• Sei D ⊆ C. 9.20 •• Es soll gezeigt werden, dass ein abgeschlosse-
nes Intervall [a, b] die Heine-Borel-Eigenschaft besitzt. Ge-
(a) Zeigen Sie: Sind f1 , . . . , fn : D → R stetig, so ist auch
geben ist ein System U von offenen Mengen mit
g mit 
[a, b] ⊆ V.
g(x) = max fj (x), x ∈ D, V ∈U
j =1,...,n
Man sagt, die Elemente V von U überdecken [a, b]. Betrach-
stetig. ten Sie die Menge
(b) Es seien fj : D → R, j ∈ N stetig, und es existiere die
Funktion g, die durch M = {x ∈ [a, b] | [a, x] wird durch
endlich viele V aus U überdeckt.} .
g(x) = sup fj (x), x ∈ D,
j ∈N
Zeigen Sie:
definiert ist. Zeigen Sie durch ein Gegenbeispiel, dass g (a) M besitzt ein Supremum.
nicht stetig sein muss. (b) Das Supremum von M ist gleich b.

9.17 •• Gegeben ist eine stetige Funktion f : [0, 1] → R 9.21 • Gegeben ist eine stetige Funktion f : [a, b] →
mit f (0) = f (1). Zeigen Sie: Für jedes n ∈ N gibt es ein R. Für alle x ∈ (a, b) soll es ein y ∈ (x, b] geben mit f (y) >
x̂ ∈ [0, (n − 1)/n] mit f (x̂) = f (x̂ + n1 ). f (x). Für a soll dies nicht gelten. Zeigen Sie, dass f (x) ≤
f (b) für alle x ∈ (a, b) gilt, sowie f (a) = f (b).
In der englischen Literatur wird diese Aussage auch als Ri-
Schinken (M2 )
sing Sun Lemma bezeichnet. Den Grund für diesen Namen
gibt die Abbildung 9.33 wieder.

f (x)

Brot (M1 )

Abbildung 9.32 Wie teilt man ein Schinkenbrot gerecht in zwei Teile?

9.18 ••• Auf einer Scheibe Brot liegt eine Scheibe Schin-
ken, wobei die beiden nicht deckungsgleich sein müssen
(Abb. 9.32). Zeigen Sie, dass man mit einem Messer das a b x
Schinkenbrot durch einen geraden Schnitt fair teilen kann, Abbildung 9.33 Die Voraussetzungen des Rising-Sun-Lemmas charakterisieren
d. h., beide Hälften bestehen aus gleich viel Brot und Schin- Intervalle, auf denen der Graph der Funktion nicht von den Strahlen der im
ken. Machen Sie zur Lösung geeignete Annahmen über ste- Unendlichen aufgehenden Sonne getroffen wird.

tige Abhängigkeiten.
9.22 • Zeigen Sie: Jedes Polynom ungeraden Grades
9.19 •• Zeigen Sie: Eine Teilmenge von R mit leerem mit reellen Koeffizienten hat mindestens eine reelle Null-
Rand ist entweder die leere Menge oder ganz R. stelle.

Antworten der Selbstfragen

S. 307 √ x = g(y): In jedem Punkt, außer denen mit horizontaler


Mit g(x) = 3 2(x − 2) und der Komposition h = f ◦ g Tangente und dem Ursprung.
wird die gewünschte Änderung erreicht. Es handelt sich ins-
S. 311
gesamt um eine Translation um 2 Einheiten nach Rechts und
Etwa f : [0, 1] → R, g : [−1, 0] → R mit f (x) = x 2 ,
eine Streckung des Graphen um den Faktor 2.
g(x) = x 2 .
S. 309
y = f (x): In jedem Punkt, außer denen mit senkrechter Tan-
gente und dem Ursprung.
Antworten der Selbstfragen 345

S. 315 S. 326
Ist f eine auf D definierte Funktion, so besagt die Existenz Aufgrund der Charakterisierung des Randes einer Menge mit
der rechten Seite, dass x̂ ∈ D liegt und diese rechte Seite dem Abschluss (Seite 324) ist
gleich f (x̂) ist. Existiert Grenzwert links und ist x̂ ∈ D, so
ist dieser definitionsgemäß ebenfalls gleich f (x̂). ∂∅ = ∂ R = ∅ ∩ R .

S. 315 Der Abschluss der leeren Menge ist aber die leere Menge,
Alle Kombinationen sind erlaubt. Es gelte z. B. die Definition da man keine konvergenten Folgen aus ihr auswählen kann
mit ≤ in den Ungleichungen. Wir geben ε > 0 vor. Dann und sie ergo auch keine Grenzwerte solcher Folgen enthält.
existiert ein δ mit |f (x) − f (x̂)| ≤ ε/2 für alle |x − x̂| ≤ δ. Es folgt ∂∅ = ∂ R = ∅.
Dann gilt erst recht |f (x) − f (x̂)| ≤ ε/2 für alle |x − x̂| < δ. In einer Beweisaufgabe zu diesem Kapitel ist zu zeigen, dass
Da ε/2 < ε für jedes ε > 0 ist, folgt die Aussage mit echten ∅ und R sogar die einzigen Teilmengen von R mit leerem
Ungleichungen. Rand sind.
Ganz analog zeigt man die Äquivalenz für alle anderen Kom-
binationen der Ungleichungszeichen. S. 327
Es ist
∞ '
 (
S. 319 1 1
− , = {0} ,
Sofern f (x) = 0 für alle x ∈ D ist, bildet 1/f eine multi- n=1
n n
plikative Inverse. Mit dieser und der Addition, mit allen zu-
und die Menge {0} ist nicht offen. Außerdem gilt:
gehörigen Regeln, handelt es sich bei C(D) um einen Ring.
Allerdings gibt es zu einer Funktion mit einzelnen Nullstel- ∞ B
 C
1 1
len keine multiplikative Inverse, obwohl diese Funktion nicht , = (0, 1] ,
n+1 n
die Nullfunktion ist. n=1

und die Menge (0, 1] ist nicht abgeschlossen.


S. 323
∂Ur (a) = {z ∈ C | |z − a| = r} enthält keinen Punkt, der in
S. 327
Ur (a) enthalten ist, da der Abstand alle Elemente aus Ur (a)
Bei Vereinigung „erbt“ die neu entstandene Menge die Ei-
echt kleiner r ist.
genschaft Kompaktheit, wenn alle Ausgangsmengen kom-
S. 323 pakt sind. Beim Durchschnitt reicht es, dass eine Menge die
Die leere Menge hat keine Elemente, also kann man auch Eigenschaft kompakt zu sein besitzt.
keine konvergente Folgen aus ihr auswählen. Somit hat jede
konvergente Folge aus der leeren Menge jede beliebige Ei- S. 330
genschaft. Die Implikation 2. ⇒ 3. ergibt sich folgendermaßen: Ist
B ⊆ K abgeschlossen, so ist V = K \ B offen. Mit 2.
S. 323 erhalten wir:
In einer endlichen Menge sind die Glieder einer konver-
f −1 (V ) = f −1 (K \ B) = D \ f −1 (B) ist D − offen.
gente Folge ab einem bestimmten Index konstant gleich dem
Grenzwert. Da die Folgenglieder alle Elemente der Menge Damit ist f −1 (B) D-abgeschlossen.
sind, ist es auch der Grenzwert.
Die Implikation 3. ⇒ 2. geht genauso.
Die Elemente von Z bzw. Z + Zi haben paarweise mindestens
den Abstand 1 voneinander. Also kann man die konvergenten S. 331
Folgen genau wie im Fall einer endlichen Teilmenge von R Nicht stetig:
oder C charakterisieren. 
x, −1 ≤ x ≤ 0,
S. 324 f (x) =
1 − x, 0<x≤1
Ist (xk ) eine konvergente Folge aus M mit Grenzwert x, so
gibt es zu diesem x eine Folge aus M, die gegen x konvergiert. nimmt Maximum 1 nicht an.
Also ist x ∈ M nach Definition von M. Somit liegt für jede
konvergente Folge aus M der Grenzwert ebenfalls in M, die Nicht kompaktes D : f (x) = x 2 auf (−1, 1) nimmt Maxi-
Menge ist also abgeschlossen. mum 1 nicht an.

S. 325 S. 334
Aus Intervallen werden Flächen. Funktion mit einem Sprung.
f : (−1, 1) → R, f (x) = x. Die Randpunkte y = −1
S. 326 bzw. y = 1 werden nicht angenommen.
Beispielsweise diese Intervalle: D = (0, 1) und D = [0, 1]∪ f : [−2, 0] ∪ [1, 2] → R, f (x) = x. Der Wert y = 1/2
[2, 3]. zwischen −2 und 2 wird nicht angenommen.
Reihen – Summieren
bis zum Letzten 10
Schon wieder Achilles und die
Schildkröte?
Wie definiert man eine Summe
mit unendlich vielen
Summanden?
Was ändert eine Umordnung
der Reihenglieder?
Was besagt das
Quotientenkriterium?

10.1 Motivation und Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348


10.2 Kriterien für Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355
10.3 Absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
10.4 Kriterien für absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . 368
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
348 10 Reihen – Summieren bis zum Letzten

In diesem Kapitel kehren wir wieder zu den Folgen zurück. Maß nachlässt? Anders gefragt, wie viel ist
Allerdings werden wir uns nun mit einer Klasse von Folgen be- 1 1 1 1
schäftigen, bei denen die Folgenglieder als Summen dargestellt S =1+ + + + + . . .?
2 3 4 5
werden. Solche Objekte nennt man Reihen.
1
Man stößt bei mathematischen Betrachtungen, aber auch in 1
Anwendungen, auf ganz natürliche Art und Weise auf Reihen: 2
1
Die Dezimaldarstellung der reellen Zahlen kann man als eine 3
1
Reihe auffassen. Ein Beispiel wird die korrekte Austarierung 4 1
eines Mobiles betreffen. Und schließlich werden wir es in vielen 5 1
6 1
der folgenden Kapitel zur Analysis mit Reihen zu tun bekommen, 7

sei es bei der Darstellung von Standardfunktionen wie Sinus, Abbildung 10.1 Grafische Darstellung von 1 + 21 + 13 + 41 + 15 + . . .
Kosinus und der Exponentialfunktion oder bei der Definition von
Integralen. Der Schildkröte geht es noch viel schlechter. Nicht nur
lässt ihre Leistung im gleichen Maß nach wie die von
Im Gegensatz zu den meisten Beispielen, die wir im Kapitel über
Achilles, es ist auch ihr Orientierungssinn so beeinträch-
Folgen kennengelernt haben, ist es bei typischen Beispielen
tigt, dass sie immer, nachdem sie eine Minute in eine Rich-
für Reihen oft sehr schwierig, den Grenzwert tatsächlich zu
tung marschiert ist, plötzlich kehrtmacht und in die genau
bestimmen. Aber es gibt ausgefeilte Werkzeuge, sogenannte
entgegengesetzte Richtung aufbricht. Wie weit wird sie
Konvergenzkriterien, um festzustellen, ob eine Reihe konvergiert
damit letztendlich kommen? Wiederum in Zahlen gegos-
oder divergiert.
sen, wie viel ist
Die historische Schreibweise für Reihen ist die als eine Summe 1 1 1 1
mit unendlich vielen Summanden. Diese Notation ist gleicher- S = 1 − + − + ∓ . . .?
2 3 4 5
maßen praktisch wie verwirrend, suggeriert sie doch eine Ana-
logie zwischen Summen und Reihen. Allerdings gibt es ent- 1
scheidende Unterschiede. Zum Beispiel darf die Reihenfolge der 1/2
Glieder bei einer Reihe im Gegensatz zu einer Summe im All- 1/3
1/4
gemeinen nicht vertauscht werden. Eine Ausnahme von dieser 1/5
1/6
Regel bilden die absolut konvergenten Reihen. Solchen Reihen 1/7

begegnet man in Gestalt von Potenzreihen, die das Thema des Abbildung 10.2 Grafische Darstellung von 1 − 21 + 13 − 41 + 15 ∓ . . . 
Kapitels 11 bilden, sehr häufig. Da sie ein wesentliches Hilfs-
mittel zur Darstellung vieler Funktionen sind, bilden sie einen
Derartige Fragestellungen haben uns in Kapitel 8 auf den
zentralen Bestandteil des Fundaments der Analysis.
Begriff der Folge und letztlich zu den Konzepten von Kon-
vergenz und Grenzwert geführt. Folgen können ganz allge-
meine Bildungsgesetze haben, während sich die obigen Bei-
spiele dadurch auszeichnen, dass zu einem vorangegangenen
10.1 Motivation und Definition Wert ständig Zahlen, manchmal eben auch negative, addiert
werden.
Viele Probleme scheinen auf das Summieren Was spricht denn nun dagegen, mit „unendlichen Summen“
unendlich vieler Zahlen hinauszulaufen der Art
1 1 1 1 1
Wir hatten es bereits mit Aufgabenstellungen zu tun, bei de- S = 1 − + − + − ± . . .
2 3 4 5 6
nen es darum ging, eine unendlich große Menge von Zah- genauso zu hantieren, wie mit bekannten endlichen Summen?
len aufzusummieren. Das Paradoxon über den Wettlauf von Wir wollen zeigen, in welche Widersprüche man sich beim
Achilles und der Schildkröte in Abschnitt 8.2 ist ein Beispiel naiven Umgang mit solchen Konstrukten verstricken kann.
dafür, das sich auch noch in verschiedener Art und Weise Dazu addieren wir das 1/2-fache von S  zu S  :
variieren lässt:
S  = 1 − 21 + 13 − 41 + 15 − 16 ± . . .
1  1
Beispiel 2S = 2 − 41 + 16 ∓ . . .
Nach dem Wettkampf mit der Schildkröte ist Achilles er- 3 
2S = 1 + 13 − 21 + 15 ±...
schöpft, und das Laufen wird auf dem Weg nach Hause
mit jedem Meter anstrengender. Während er in der ersten Alle Summanden aus S  mit positivem Vorzeichen sind auch
Minute noch einen Kilometer schafft, ist es in der zweiten in der Summe unverändert. Die Summanden mit negativem
Minute nur noch ein halber, in der dritten nur noch ein drit- Vorzeichen tauchen ebenfalls alle wieder auf, nur an anderen
tel, in der vierten gar nur noch ein viertel Kilometer. Wie Stellen. Wir scheinen als Ergebnis der Addition wieder S  er-
weit kommt Achilles, wenn sein Tempo weiter in diesem halten zu haben, denn alle Glieder der ursprünglichen Summe
10.1 Motivation und Definition 349

kommen, wenn auch in veränderter Reihenfolge, wieder vor. Für die Reihe selbst schreiben wir
Damit erhielten wir  n ∞ ∞ 
3 ! !
S = S ak oder kurz ak .
2 k=1 k=1
n=1
und daher S  = 0. Das kann aber nicht sein, da
Es ist allerdings in der Literatur auch üblich, sowohl die Reihe
1 1 1 1 1 1
S = 1 − + − + − ± . . . > als auch, im Falle der Konvergenz, ihren Wert mit dem Sym-
2 3 4 5 6
   2 bol
!∞
= 21 >0 >0
ak
ist. Auch die Lösung Unendlich kommt nicht infrage, denn k=1
wir erhalten ja zu bezeichnen. Die ak nennt man Reihenglieder.
1 1 1 1 1 1
S  = 1 − + − + − + ∓ . . . < 1.
Kommentar: Die Notation für Reihen und für den Rei-
3 4 5 6 7
2
<0 <0 <0 henwert erinnert stark an die Vereinigung oder den Schnitt
von abzählbar vielen Mengen:
Woher dieser Widerspruch kommt, werden wir in Abschnitt
10.3 aufklären. ∞
 ∞

An bzw. An .
Um die Arbeit mit unendlichen Summen auf eine solide n=1 n=1
Grundlage zu stellen, werden wir das Konzept der Reihen
Es handelt sich aber um mathematisch grundverschiedene
als Zahlenfolgen mit speziellen Bildungsgesetzen einführen.
Konstruktionen: Im Fall der Mengen kann zum Beispiel die
Über die Begriffe der Konvergenz und des Grenzwerts wird
Vereinigung mit Mitteln der elementaren Mengenlehre ex-
ein widerspruchsfreies Arbeiten möglich sein.
plizit geschrieben werden:


Reihen werden als spezielle Folgen definiert An = {x | x ∈ An für ein n ∈ N} .
n=1
Statt nun also mit unendlichen Summen zu arbeiten, werden
Im Falle des Reihenwerts geht es um Grenzwerte. Der Um-
wir Folgen endlicher Summen betrachten. Wir gehen dazu
gang mit dem Ausdruck und sogar dessen Existenz ist hier
von einer beliebigen Folge (ak ) aus. Zu dieser Folge definie-
an Bedingungen geknüpft.
ren wir die Folge der Partialsummen mittels
s1 = a1 Ob der Summationsindex der Reihe k oder anders heißt, spielt
s2 = a1 + a2 natürlich keine Rolle, und auch ob die Summation bei eins
s3 = a1 + a2 + a3 oder einer anderen ganzen Zahl beginnt, ändert nichts an der
grundlegenden Definition – je nach Art der Summationsvor-
..
. schrift aber oft den Wert der Reihen.
Allgemein gilt also:
sn sn
!
n
sn = ak .
k=1
Die Folge (sn ) kann nun auf Konvergenz untersucht und mög-
licherweise ihr Grenzwert bestimmt werden.

Definition der Reihen n n


Für eine beliebige Zahlenfolge (ak ) aus C heißt die Folge
Abbildung 10.3 Die Visualisierung von Reihen erfolgt meist durch das Plotten
(sn ) der Partialsummen
der Folge der Partialsummen. Hier sind die beiden Reihen aus dem Beispiel von
! n Seite 348 dargestellt.
sn = ak
k=1
Beispiel Betrachten wir den Fall
eine unendliche Reihe. Konvergiert die Folge (sn ), so
heißt auch die Reihe konvergent, andernfalls divergent. S  = 1 − 1 + 1 − 1 + 1 − 1 ± . . .
Konvergiert die Reihe, so schreibt man für den Grenz-
wert im Lichte dieser Definition. Die zugrunde liegende Folge ist
!∞ hier (ak ) mit ak = (−1)k+1 , k ∈ N0 . Für die Partialsummen
ak = lim sn erhalten wir
k=1
n→∞ 
1 wenn n ungerade,
und nennt ihn den Wert der Reihe. sn =
0 wenn n gerade.
350 10 Reihen – Summieren bis zum Letzten

Von dieser Folge können wir sofort sagen, dass sie sicher Diese Formel wird uns in der gesamten Analysis in den unter-
nicht konvergiert. Damit besitzt die Reihe keinen Grenzwert schiedlichsten Zusammenhängen immer wieder begegnen.
und das Symbol Für den Spezialfall q = 21 ergibt sich
!∞
(−1)n !∞
1 1
n=0 = = 2,
 ∞ n
 2k 1− 1
hat keine Bedeutung. ist eine divergente k=0 2
n=0 (−1)
Reihe. 
wie es auch die grafische Anschauung in der Abbildung 10.4
Mathematisch gesehen gibt es keine Summen mit unendlich nahelegt.
vielen Summanden, sondern eben Folgen von Partialsum-
men. Trotzdem wird die Schreibweise

! 1
ak = a1 + a2 + a3 + . . . 2
k=1
häufig verwendet, und auch wir werden uns dieser Praxis 1
manchmal anschließen. Sie ist als ein neues Symbol für den 1
8
Grenzwert einer konvergenten Folge von Partialsummen zu 1
sehen, sofern dieser existiert. 4
1
16

Manchen wichtigen Reihen begegnet man Abbildung 10.4 Grafische Darstellung des Werts einer geometrischen Reihe
immer wieder mit q = 1/2.

Bestimmte Typen von Reihen sind in der Mathematik und Für |q| ≥ 1 divergiert die geometrische Folge (q n+1 ) und da-
ihren Anwendungen von großer Bedeutung. Die wichtigsten mit auch die geometrische Reihe. Das Konvergenzverhalten
werden wir nun kennenlernen und dabei auch gleich den Um- der geometrischen Reihe wird in Abbildung 10.5 dargestellt.
gang mit Reihen üben.
Nehmen
 wir
 als erstes konkretes Beispiel die Reihe
∞ 1
k=0 2k . Für endliche Summen von analoger Gestalt mit
beliebigem q ∈ C gilt die geometrische Summenformel
(siehe Seite 129) Divergenz
i
!
n
1 − q n+1
qk = .
1−q
k=0

Falls |q| < 1 ist, geht q n+1 gegen null für n → ∞. Daher Konvergenz
konvergiert in diesem Fall die entsprechende Reihe, und es
gilt: −1 0 1

! !
n
1 − q n+1 1
q k = lim q k = lim = .
n→∞ n→∞ 1 − q 1−q
k=0 k=0
Für |q| > 1 ist der mit der geometrischen Summenformel −i
gewonnene Ausdruck unbeschränkt. Für |q| = 1 erhält man
die Divergenz der Reihe mit dem Nullfolgenkriterium (siehe
Seite 353). Im Vorgriff darauf erhalten wir die folgende all-
gemeine Aussage.

Abbildung 10.5 Konvergenzverhalten der geometrischen Reihe in der komple-


Geometrische Reihe xen Ebene: Die Reihe konvergiert in |q| < 1 und divergiert für |q| ≥ 1.
Für q ∈ C mit |q| < 1 erhält man als Wert für die
geometrische Reihe: Aber auch für jede komplexe Zahl q mit Betrag kleiner als

1 kann der Reihenwert der geometrischen Reihe sofort be-
! 1 stimmt werden, so gilt etwa:
qk = .
1−q
k=0 ∞ '
! (
1 − 2i n 1 3 3
= = = (1 − i) .
Für |q| ≥ 1 divergiert die Reihe. 3 1− 1−2i 2 + 2i 4
n=0 3
10.1 Motivation und Definition 351

Hintergrund und Ausblick: Wie baut man ein Mobile?


Mobiles sind sehr beliebte Dekorationsgegenstände, die man auch selbst aus verschiedensten Gegenständen basteln kann.
Dies erfordert natürlich ein wenig handwerkliches Geschick und etwas Fingerspitzengefühl, aber auch die Mathematik kann
hier weiterhelfen – zumindest bei manchen Typen von Mobiles.

Als Modell untersuchen wir ein Mobile aus (unendlich Drehmomente: einerseits verursacht durch die Gewichts-
vielen) gleichartigen Stäben konstanter Massendichte, die kraft des Stabes selbst, die in unserer Skizze gegen den
untereinander hängen und bei gleichbleibender Dicke je- Uhrzeigersinn drehen würde, andererseits durch die Ge-
weils um einen konstanten Faktor q kürzer werden. Die wichtskraft aller darunter hängenden Stäbe, die im Uhr-
Stäbe nummerieren wir beginnend bei null durch und be- zeigersinn dreht.
zeichnen die Hälfte ihrer Längen mit Lj , j = 0, 1, 2, . . .
Für das erste Moment erhalten wir g d Mj , wobei Mj
Es gilt dann:
die Gesamtmasse des j -ten Stabes ist, die wir uns am
Ln = L0 q n , n ∈ N0 .
Schwerpunkt x = 0 vereinigt denken können. g ist
dabei die Erdbeschleunigung. Das zweite Moment ist
g (a − d) ∞ n=j +1 Mn .

Da wir Stäbe mit konstanter Massendichte ρ betrachten,


erhalten wir für die Gleichgewichtsbedingung

!
g d ρ 2Lj = g (a − d)ρ Ln .
n=j +1

Diese Länge können wir aber sofort bestimmen:



! ∞
! ∞
!
Wir betrachten nun den j -ten Stab der Länge 2Lj und be- Ln = 2L0 q n = 2 L0 q j +1 qn
ziehen unsere Positionsangaben x auf die Mitte des Stabes. n=j +1 n=j +1 n=0
Der nächste Stab ist mit einem dünnen Faden an einem q
= 2Lj .
Punkt x = a mit 0 ≤ a ≤ Lj befestigt. Den Wert a kann 1−q
man innerhalb der Grenzen frei wählen. Da an diesem Stab Damit ergibt sich:
letztlich auch alle anderen hängen, greift an diesem Punkt q
d ρ 2Lj = (a − d) ρ 2Lj .
das Gesamtgewicht aller verbleibenden Stäbe an. 1−q
Kürzen und Umformen liefert
' (
q q
d · 1+ =a·
1−q 1−q
1 q
d· =a·
1−q 1−q
d = q a.
Die Abstände der Aufhängepunkte zum Schwerpunkt ste-
hen also im gleichen Verhältnis zueinander wie die Län-
gen der Stäbe. Im Grenzfall q = 1 würden die beiden
Punkte zusammenfallen – aber für diese Situation gilt un-
sere Herleitung nicht mehr, die ja von der Summenformel
für geometrische Reihen Gebrauch macht.
Völlig vernachlässigt hatten wir in unseren Überlegungen
Damit das Mobile stabil hängen kann, muss es sich im die Masse der Fäden. Um weiter mit geometrischen Rei-
statischen Gleichgewicht befinden, d. h., alle vertikal an- hen arbeiten zu können, sollen auch die Fäden im gleichen
greifenden Kräfte und Drehmomente müssen sich exakt Verhältnis wie die Stäbe kürzer werden.
kompensieren. Die Gewichtskräfte werden genau durch
Unser Modell kann man natürlich auch auf zwei- und drei-
die Kräfte in den Fäden ausgeglichen (die natürlich trag-
dimensionale Objekte ausdehnen. Dabei wird die Bestim-
fähig genug sein müssen).
mung des Schwerpunkts komplizierter, und es müssen sich
Entscheidend ist nun, dass sich auch die Drehmomente ge- mehr Drehmomente ausgleichen. Im Prinzip kann man
nau kompensieren, also die Produkte aus Kraft mal Kraft- aber wieder auf analoge Weise die Aufhängepunkte be-
arm. Im Aufhängepunkt x = d des Stabes wirken zwei stimmen.
352 10 Reihen – Summieren bis zum Letzten

Eine reelle Zahl lässt sich als Dezimalzahl gilt. Für x = 0 ist dies offensichtlich. Nach der Konstruktion
schreiben der an für x > 0 gilt für alle N ∈ N
' (N !
N −1 ' (n ' (N
Im Kapitel 4 haben wir schon die Dezimalschreibweise für 1 1 1
aN <x− an ≤ (aN + 1) .
natürliche Zahlen kennengelernt. Wir wollen diese jetzt mit 10 10 10
n=1
Hilfe von Reihen auf beliebige reelle Zahlen erweitern. Da
wir auf die Darstellung natürlicher Zahlen zurückgreifen Somit folgt
können, reicht es aus, das Intervall [0, 1] zu betrachten.
!
N ' (n ' (N
Unter einer Dezimaldarstellung einer Zahl x ∈ [0, 1] verste- 1 1
0<x− an ≤ , N ∈ N.
hen wir eine Reihe 10 10
n=1
!∞ ' (n
1
x= an Da die obere Schranke gegen null geht, bedeutet dies die
10 Konvergenz der Reihe gegen x.
n=1

mit an ∈ {0, . . . , 9}, n ∈ N. Zunächst halten wir fest, dass Die Zahl 10 im Nenner bei diesen Überlegungen führt zwar
jede Reihe dieser Form konvergiert (siehe Aufgabe 10.14). auf die wohlbekannte Dezimaldarstellung, ist aber willkür-
lich gewählt. Wie auch bei der Darstellung der natürlichen
Allerdings stellt man fest, dass die Dezimaldarstellung in
Zahlen können wir stattdessen eine beliebige Zahl g ∈ N≥2
dieser Allgemeinheit nicht eindeutig ist. Offensichtlich ist
verwenden und die Überlegung funktioniert analog.
1
= 0.5 = 0.500 000 000 000 . . .
2 g-adische Entwicklung der reellen Zahlen
Andererseits erhält man aber auch: Gegeben sei g ∈ N≥2 . Zu jeder reellen Zahl x ∈ [0, 1] gibt
4 9 9 9 es eine eindeutig bestimmte Folge (an ) aus {0, . . . , g−1}
0.499 999 99 . . . = + + + + ... mit
10 100 '1 000 10 000 ( ∞
!
=
4
+
9
· 1+
1
+
1
+ ... x= an g −n
10 100 10 100 n=1
∞ ' (
4 9 ! 1 k mit
= + · !
N
10 100 10
k=0 x> an g −n , N ∈ N, für x > 0
4 9 1 n=1
= + · 1
10 100 1 − 10 und an = 0, n ∈ N für x = 0.
4 9 10 5 1
= + · = =
10 100 9 10 2
Achtung: Im Falle von Zahlen mit nicht abbrechender g-
Man hat also zwei unterschiedliche Dezimaldarstellungen adischer Entwicklung (irrationale Zahlen oder solche mit pe-
derselben Zahl gefunden. riodischer Entwicklung) entspricht die so konstruierte Dar-
Wir wollen daher eine Vorschrift angeben, die einerseits eine stellung der üblicherweise verwendeten, etwa in der Dezi-
eindeutige Darstellung garantiert, mit der sich aber anderer- maldarstellung
seits auch nachweisen lässt, dass es für jede reelle Zahl aus
[0, 1] tatsächlich eine Dezimaldarstellung gibt. Dies geht fol- π = 3.141 592 653 589 793 238 462 643 383 279 . . .
gendermaßen:
Im Falle einer rationalen Zahl, bei der die übliche Darstel-
Ist x = 0, so setze an = 0 für alle n ∈ N. lung abbricht, erhalten wir durch die obige Konstruktion eine
Ist x > 0, so wähle aN rekursiv jeweils so, dass ungewohnte Darstellung, etwa in der Dezimalentwicklung
!
N ' (n !
N ' (n
1 1 1
an = max bn <x| = 0.499 999 999 999 999 999 999 999 999 999 . . .
10 10 2
n=1 n=1

bn ∈ {0, . . . , 9}, n = 1, . . . , N . Als eine überraschende Konsequenz der g-adischen Entwick-
lung ergibt sich die Mächtigkeit der Cantor-Menge, die wir
Die Abbildung x → (an )n ist somit wohldefiniert, d. h.die auf Seite 325 als Beispiel für eine komplizierte abgeschlos-
Dezimaldarstellung zu jedem x ist eindeutig. Wir müssen sene Menge kennengelernt haben.
noch zeigen, dass mit obiger Konstruktion

! ' (n Beispiel Die Cantor-Menge C ergibt sich als Schnitt der
1
x= an auf Seite 325 konstruierten Mengen Cn , n ∈ N, d. h.jedes
10
n=1 Element von C ist in jedem der Cn enthalten.
10.1 Motivation und Definition 353

Wir bringen diese Konstruktion jetzt mit der 3-adischen Ent- Die Umkehrung dieser Aussage ist nicht richtig. Es gibt viele
wicklung der Zahlen aus [0, 1] in Verbindung. Wir betrachten Reihen ∞ 
die Menge !
⎧ ⎫ an ,
⎨!∞
aj ⎬ n=0
[0, 1] = C0 = | aj ∈ {0, 1, 2} , j ∈ N . für die zwar
⎩ 3 j ⎭
j =1 lim an = 0
n→∞
Wollen wir genau die Zahlen aus (1/3, 2/3) herausschneiden, ist, die aber trotzdem divergieren. Als Kriterium zum Nach-
müssen wir, unter Beachtung von weis der Konvergenz einer Reihe ist die obige Aussage also

! ungeeignet. Wir haben aber immerhin eine notwendige Be-
2
1/3 = , dingung für die Konvergenz von Reihen gefunden. Aus der
3j Umkehrung der Aussage ergibt sich nämlich:
j =2

ausschließen, dass a1 = 1 ist. Es ist also Ist lim an = 0 oder existiert der Grenzwert gar nicht, so
n→∞
⎧ ⎫ ∞
⎨!∞ ⎬ ist die Reihe ( n=0 an ) auf jeden Fall divergent.
aj
C1 = | aj ∈ {0, 1, 2} , j ∈ N , a 1  = 1 .
⎩ 3j ⎭
j =1 ?
Ist die Reihe
Mit einer einfachen vollständigen Induktion überzeugt man  ∞

sich nun davon, dass ! i n2 + 3n + 2 − i
⎧ ⎫ 2n2 − (1 − 2i) n + 1
⎨ !∞
aj ⎬ n=1
C= x= | aj ∈ {0, 2} .
⎩ 3 j ⎭ konvergent oder divergent? Begründen Sie Ihre Antwort.
j =1

Damit haben wir implizit eine bijektive Abbildung zwischen


C und der Menge der Folgen aus {0, 2} gefunden. Es ist tri- Das bekannteste Beispiel für eine divergente Reihe mit
vial, diese bijektiv auf die Menge der Folgen aus {0, 1} ab- an → 0 (n → ∞) ist die harmonische Reihe.
zubilden, und nach der 2-adischen Entwicklung gibt es eine
bijektiver Abbildung zwischen einer Teilmenge hiervon und Harmonische Reihe  

!
dem Intervall [0, 1]. Andererseits ist C ⊆ [0, 1] und damit 1
Die harmonische Reihe ist divergent.
gleichmächtig zu diesem Intervall. Insbesondere folgt, dass n
n=1
die Cantor-Menge keine abzählbare Menge ist. 

Es gibt viele weitere Beispiele und Anwendungen für die


Beweis: Wir betrachten die Partialsummen, deren Index
geometrische Reihe, zum Beispiel die im Essay auf Seite 351
eine Zweierpotenz ist:
dargestellte Berechnung eines Mobiles. Daneben ist die geo-
metrische Reihe auch ein wichtiges Hilfsmittel, um über die n j +1 n−1 2j
!
2
1 ! 2!
n−1
1 !! 1
Konvergenz oder Divergenz anderer Reihen zu entscheiden. s2n = =1+ =1+
k k 2j + k
k=1 j =0 k=2j +1 j =0 k=1
Das hauptsächliche Ziel in diesem Kapitel wird es sein,
allgemeine Aussagen über die Konvergenz oder Divergenz !!
n−1 2j !
n−1
1 1 n
von Reihen zu finden, sogenannte Konvergenzkriterien. Den ≥1+ =1+ =1+ .
2j + 2j 2 2
größten Teil dieser Arbeit werden wir in den Abschnitten j =0 k=1 j =0
10.2 und 10.4 erledigen. Was man sich aber sofort überlegen Damit ist die Folge (sn ) unbeschränkt, die harmonische Reihe
kann, das ist, dass die aufzusummierenden Glieder (an ) auf divergiert. 
jeden Fall eine Nullfolge bilden müssen.

Satz (Nullfolgenkriterium) Kommentar: Um eine Abschätzung, wie im Beweis dar-


 ∞ 
n=0 an konvergiert, dann ist lim an = 0.
Wenn die Reihe gestellt, zu finden, wird auch ein geübter Mathematiker die
n→∞
Summe für kleine Werte von n explizit ausschreiben, um zu
 ∞  sehen, wie vereinfacht oder abgeschätzt werden kann. Füh-
Beweis: Wir bezeichnen den Wert der Reihe n=0 an ren Sie dies selbst durch, um die Umformungen im Beweis
mit A. Dann gilt nach den Rechenregeln für Grenzwerte für
besser zu verstehen.
Folgen

!
n !
n−1
Mit dieser Aussage haben wir auch das erste Beispiel von
an = ak − ak −→ A − A = 0 Seite 348 analysiert: Achilles kommt trotz der Verringerung
k=0 k=0
seiner Geschwindigkeit beliebig weit. Die Antwort für das
für n → ∞.  zweite Beispiel findet sich in Abschnitt 10.2.
354 10 Reihen – Summieren bis zum Letzten

Beispiel: Der harmonische Turmbau


Wie weit kann ein Stapel Bücher auf einem Tisch über den Rand des Tisches hinausragen? Wie weit kann man die Spitze eines
Turms von der Grundfläche weg verschieben? Diese Fragen sollen mithilfe eines einfachen Modells beantwortet werden. Das
Ergebnis wird manchen Leser wohl überraschen.

Problemanalyse und Strategie: Als einfaches Modell für den Turm betrachten wir einen Stapel von Brettern der
Länge 2L, die wir nun so gegeneinander verschieben wollen, dass das oberste Brett möglichst weit rechts liegt, der
Stapel aber eben noch stabil bleibt. Es ist überraschend schwierig, dieses Beispiel von unten her anzugehen, deswegen
betrachten wir lieber den obersten Teil des Stapels. Dazu nummerieren wir die Bretter von oben nach unten mit 1
beginnend durch. Indem wir unten am Stapel jeweils ein Brett hinzufügen, konstruieren wir eine Reihe, und bestimmen
dabei die Gesamtverschiebung des obersten Bretts.

Lösung: Für das erste Brett gilt dann:


Wir wissen, dass jedes Brett so positioniert sein muss,
B1 = S1 = L .
dass der gemeinsame Schwerpunkt aller Bretter darüber
zumindest noch über dessen Kante liegt. Den Schwerpunkt des zweiten Bretts dürfen wir also ge-
genüber S1 um L nach links verschieben, d. h. B2 =
2L S1 + L, und wir erhalten
B1 + B 2 L + (L + L) L
L S2 = = =L+ ,
2 2 2
und das dritte Brett darf gegenüber dem zweiten nur noch
um L/2 verschoben werden.
Allgemein haben wir die Rekursionsvorschrift
3L nSn + Bn+1
2 Bn+1 = Sn + L, Sn+1 = , n ∈ N.
n+1
Die erste Formel in die zweite eingesetzt liefert
L
Sn+1 = Sn + n ∈ N,
11L n+1
6 woraus sich durch vollständige Induktion die Darstellung
!
n
L
Wir legen den Ursprung unseres Koordinatensystems in Sn =
n
j =1
den rechten Rand des ersten Bretts und messen Verschie-
bungen und Abstände von dort nach links. Mit Bn be- ergibt. Das ist eine Summe, die für n → ∞ in eine har-
zeichnen wir den Schwerpunkt des n-ten Bretts, mit Sn monische Reihe übergeht, also divergiert. Mit genügend
den Gesamtschwerpunkt der Bretter 1, . . . , n für n ∈ N. vielen Brettern kommt man also beliebig weit nach rechts.

Den Wert einer Reihe kann man nur in ermitteln wir im Beispiel auf Seite 357, und mit ein wenig
seltenen Fällen bestimmen Geschick können wir auch den Wert von manchen anderen
Reihen bestimmen.
Im Fall der geometrischen Reihe hatten wir das Glück, eine
explizite Formel für die Partialsummen sn zur Hand zu haben. Beispiel Um etwa
In diesem Fall konnten wir nicht nur definitive Aussagen über

!
die Konvergenz der Reihe machen, sondern im Fall der Kon- 1
vergenz sogar noch ihren Wert bestimmen. In den meisten k (k + 1)
Fällen wird das nicht ohne Weiteres möglich sein, und oft ist k=1

man schon mit einer Beantwortung der Kernfrage konvergent


zu berechnen, benutzen wir einen kleinen Trick und spalten
oder divergent vollauf zufrieden.
auf:
Die Ausnahmen von dieser Regel sind selten. Geometrische
1 k+1−k k+1 k
Reihen gehören dazu, den Wert der Exponentialreihe = = − =
∞ k (k + 1) k (k + 1) k (k + 1) k (k + 1)
! 1
= e ≈ 2, 718 281 8 1
= −
1
.
n! k k+1
n=0
10.2 Kriterien für Konvergenz 355

Wir betrachten nun also die Reihe benötigen wir aber Hilfsmittel, die wir uns erst im Kapi-
∞ ' ( tel 19 erarbeiten. Sind diese Mittel bereitgestellt, dann fallen
! 1 1
− . uns solche Ergebnisse allerdings als Nebenprodukte anderer
k k+1 Rechnungen fast ohne Aufwand in den Schoß.
k=1

Für die Partialsummen sn ergibt sich mithilfe einer Index-


transformation:
n ' ( !
10.2 Kriterien für Konvergenz
! 1 1
n
1 ! 1
n
sn = − = −
k k+1 k k+1 Im vorherigen Abschnitt haben wir verschiedene Reihen auf
k=1 k=1 k=1
Konvergenz oder Divergenz untersucht und manchmal sogar
!
n
1 !
n+1
1 1
= − =1− . ihren Wert bestimmen können. Wir wollen nun systemati-
k k n+1 scher vorgehen und Aussagen allgemeiner Natur formulie-
k=1 k=2
ren. Dabei wäre es angenehm, auf möglichst einfachem Weg
Ein solche Summe nennt man eine Teleskopsumme, da wie feststellen zu können, ob eine Reihe konvergent ist oder nicht.
beim Zusammenschieben eines Teleskops die mittleren An- Konvergenzkriterien liefern genau dies.
teile verschwinden. Wegen
n ' ( Reihen sind Folgen, daher dürfen wir die Rechenregeln für
!n
1 ! 1 1
lim = lim − Grenzwerte von Folgen anwenden. Speziell erhalten wir die
n→∞ k (k + 1) n→∞ k k+1 folgenden Aussagen.
k=1 k=1
B C
1
= lim 1 − = 1, Satz  ∞   ∞ 
n→∞ n+1 (a) Sind n=0 an und  ∞n=0 bn konvergente Reihen, so
erhalten wir konvergieren auch n=0 (a n ± b n ) , und für den Rei-

! 1 henwert gilt die Gleichung
= 1. 
k (k + 1) ∞ ∞ ∞
k=1 ! ! !
(an ± bn ) = an ± bn .
? n=0 n=0 n=0

Für eine Folge (bn ) betrachten wir die Reihe  ∞ 


∞  (b) Ist n=0 an eine konvergente Reihe und λ ∈ C
!  eine
 ∞beliebige  Zahl, so konvergiert auch die Reihe
bk − bk+1 . (λan , und für den Reihenwert gilt die Glei-
)
n=0
k=1 chung

! ∞
!
Gibt es eine einfache Bedingung, wann diese Reihe konver-
(λan ) = λ an .
giert?
n=0 n=0

Nach diesem Satz bilden die konvergenten Reihen einen Vek-


Damit sind unsere Möglichkeiten, Reihenwerte zu bestim-
torraum über C, die konvergenten Reihen mit reellen Glie-
men, aber nahezu erschöpft. Einige Reihen ermöglichen viel-
dern einen Vektorraum über R. Es ergibt sich auch, dass eine
leicht noch andere trickreiche Umformungen, zumeist aber
Reihe mit komplexen Gliedern genau dann konvergiert, wenn
werden wir uns auf ein Überprüfen der Konvergenz beschrän-
die Reihen über die Real- und die Imaginärteile der Glieder
ken. Eine Bestimmung des Werts ist dann nur auf nume-
dies tun.
rischem Wege möglich, d. h. man berechnet eine Partial-
summe, die auf hinreichend viele Dezimalstellen mit dem
Achtung: Das Produkt von zwei Reihen erhält man nicht
Grenzwert übereinstimmt.
durch gliedweises Multiplizieren. Im Allgemeinen ist
Sehr viel später werden wir allerdings Wege kennenlernen, 2∞ 3 2∞ 3
! !
den Wert von sehr viel mehr Reihen zu bestimmen. Mit der an · bn
Abschätzung n=1 n=1

!
n !
n−1 !
n−1 etwas ganz anderes als
1 1 1
= ≤ 1 + ∞
!
k2 (k + 1)(k + 1) k(k + 1)
k=1 k=0 k=1 an bn .
und dem Beispiel oben erhalten wir mit dem Monotoniekrite- n=1
 
∞ 1 Dass eine solche Formel falsch sein muss, wird einem sofort
rium für Folgen (siehe Seite 292, dass die Reihe k=1 k 2
klar, wenn man sich daran erinnert, dass Reihenwerte Grenz-
konvergiert. Für den Nachweis von Formeln wie
werte von Partialsummen sind. Und bei Summen ist schon

! ∞
!
1 π2 (−1)k+1 π2 im einfachsten Fall
= oder =
k2 6 k2 12
(a1 + a2 ) · (b1 + b2 ) = a1 b1 + a2 b2 .
k=1 k=1
356 10 Reihen – Summieren bis zum Letzten

Beispiel Wir wollen die Reihe sn


∞ 
! 1 + 2−n n2
n2
n=1

auf Konvergenz untersuchen. Die Reihenglieder haben die


Form
1 + 2−n n2 1 1
2
= 2 + n.
n n 2 n

Von der Reihe über 1/n2 wissen wir bereits, dass sie kon- Abbildung 10.6 Das Monotoniekriterium für Reihen: Die Folge der Partial-
vergiert. Die Reihe über den zweiten Summanden entspricht summen wächst monoton, überschreitet aber niemals die gestrichelte obere
Schranke. Die Reihe konvergiert.
einer geometrischen Reihe, die ebenfalls konvergiert. Nach
den Rechenregeln konvergiert also auch die gesamte Reihe,
und für den Reihenwert gilt:  ∞ 
soll bekannt sein, dass die Reihe n=0 bn konvergiert. Da
∞ ∞ ∞ alle Reihenglieder positiv sind, gilt natürlich die Abschät-
! 1 + 2−n n2 ! 1 ! 1
= + zung
n2 n2 2n !N !N
n=1 n=1
'
n=1
( an ≤ bn
π2 1 n=0 n=0
= − −1
6 1 − 1/2 für alle N ∈ N. Die Voraussetzung des Monotoniekriteriums
π2 sind also erfüllt, wobei die Schranke
 ∞ C gerade der Reihen-
= − 1.  wert der konvergenten Reihe
6  ∞  n=0 bn ist. Da die Partial-
summen der Reihe
 ∞ 
n=0 bn hierbei stets größer sind als
die der Reihe n=0 an , und die Reihe über die bn konver-
Hat eine Reihe eine konvergente Majorante, giert, bezeichnet man sie als konvergente Majorante, siehe
so konvergiert sie auch Abbildung 10.7.
Nun drehen wir die Situation
 ∞ um und nehmen an, dass wir
Ein zweites einfaches Kriterium für Konvergenz, zumindest wissen, dass die Reihe n=0 an divergiert. Da die Partial-
von Reihen mit reellen Gliedern, beruht auf dem Monotonie- summen der Reihe über die bn stets größer sind, muss also
kriterium für Folgen. Wir erinnern uns daran, dass jede be-
schränkte, monotone Folge konvergiert.
 ∞ Diese  Tatsache kön-
nen wir auf diejenigen Reihen n=0 an übertragen, deren sn
Partialsummen monoton wachsend sind. Dies bedeutet, dass
alle Reihenglieder an ≥ 0 sind. Dabei ist es allerdings nicht
wichtig, dass die Folge der Partialsummen immer monoton
wächst, es reicht wenn sie dies ab einem bestimmten Index
n0 tut. Dargestellt ist die Situation auch in der Abbildung
10.6. Wir formulieren sie als Satz.

Satz (Monotoniekriterium n
 ∞  für reelle Reihen)
Ist eine Reihe n=0 a n gegeben, und gibt es ferner Abbildung 10.7 Die blau dargestellte Reihe bildet eine konvergente Majorante.
einen Index n0 ∈ N mit an ∈ R≥0 für alle n ≥ n0 sowie eine Die rot dargestellte Reihe darunter muss ebenfalls konvergieren.
Schranke C > 0 mit
sn
!
N
an ≤ C für alle N ∈ N≥n0 ,
n=n0

so konvergiert die Reihe.

Das Monotoniekriterium stellt ein sehr nützliches Werkzeug


zur Untersuchung von Reihen dar. Ein Beispiel dafür ist der
Nachweis, dass die Exponentialreihe konvergiert, den wir auf
Seite 357 führen.
Häufig wird das Monotoniekriterium in einem speziellen n
 ∞ Fall
verwendet:
 ∞ Angenommen,
 man hat zwei Reihen, n=0 an Abbildung 10.8 Die blau dargestellte Reihe bildet eine divergente Minorante.
und n=0 bn . Es soll hierbei 0 ≤ an ≤ bn gelten, und es Die rot dargestellte Reihe darüber muss auch divergieren.
10.2 Kriterien für Konvergenz 357

Beispiel: Die Exponentialreihe


 
∞ 1
Eine der wichtigsten Reihen überhaupt ist die Exponentialreihe n=0 n! , für die wir nun den erstaunlichen Zusammenhang

! ' (
1 1 n
= lim 1 +
n! n→∞ n
n=0

zeigen wollen.

Problemanalyse und Strategie: Zunächst zeigen wir, dass die Reihe überhaupt konvergiert. Dazu untersuchen wir
die Folge der Partialsummen auf Beschränktheit mit dem Ziel, das Monotoniekriterium für Folgen anwenden zu können.
Eine zusätzliche Überlegung liefert dann die Aussage, dass die obere Schranke auch gleichzeitig der Reihenwert sein
muss.
 n 
Lösung: ! 1 ∞
Die Zahl e ist uns schon verschiedentlich begegnet. Für Somit ist die Folge der Partialsummen durch
k!
k=0 n=0
uns entscheidend sind die Beispiele auf Seite 281 und 292 1
im Kapitel über Folgen. Zusammen liefern diese Beispiele e nach oben beschränkt. Da die Brüche k! alle positiv
die Konvergenz der Folge oben, deren Grenzwert als die sind, ist es auch eine monoton wachsende Folge. Mit dem
Zahl e bezeichnet wird: Monotoniekriterium erhalten wir die Aussage, dass die
' (n Folge der Partialsummen, also die Reihe
1
e := lim 1 + . ∞ 
n→∞ n ! 1
Die Folgenglieder werden wir jetzt mithilfe der binomi- ,
k!
k=0
schen Formel umschreiben:
' ( n ' ( ' (k
1 n ! n 1 konvergiert und dass der Reihenwert kleiner oder gleich e
1+ = ist.
n k n
k=0
Nun zur zweiten Abschätzung. Auch hier starten wir mit
!
n
n! 1
= ⎡ ⎤
k! (n − k)! nk ' (
1 n ! 1 ⎣ n − j ⎦
n k−1
k=0
⎡ ⎤ 1+ = .
! n k! n
1 ⎣ n − j ⎦
n k−1 k=0 j =0
= .
k! n Nun ersetzen wir jeden Faktor (n − j )/n durch 1 und ma-
k=0 j =0
chen dadurch das Produkt auf der rechten Seite größer. Es
Mit dieser Darstellung gelingen uns jetzt schnell zwei Ab- gilt somit
' (
schätzungen. Zunächst setzen wir m > n voraus. Dann gilt 1 n ! 1
n
die Ungleichung 1+ ≤
⎡ ⎤ n k!
' ( k=0
1 m ! 1 ⎣ m − j ⎦
m k−1
1+ = für jedes n. Somit bleibt diese Ungleichung erhalten, wenn
m k! m wir zum Grenzwert für n → ∞ übergehen:
k=0 j =0
⎡ ⎤
! ' (n ∞
1 ⎣ m − j ⎦ !
n k−1
1 1
≥ . e = lim 1+ ≤ .
k! m n→∞ n k!
k=0 j =0 k=0

In dieser Ungleichung lassen wir jetzt m → ∞ gehen. Da Insgesamt haben wir gezeigt, dass die Exponentialreihe
m−j j konvergiert und dass für ihren Reihenwert die Unglei-
=1− →1 (m → ∞) chungskette
m m ∞ ∞
für jedes j = 0, . . . , n, folgt: ! 1 ! 1
' ( ≤e≤
1 m ! 1 k! k!
n
k=0 k=0
e = lim 1 + ≥ .
m→∞ m k! gilt. Also ist der Reihenwert selbst gleich e.
k=0

Kommentar: Das Beispiel liefert zwei völlig unterschiedliche Darstellungen für die irrationale Zahl e ≈
2, 718 281 828 459 05. Je nach der Situation können wir die eine oder andere Darstellung in einer Überlegung ver-
wenden. Mit einem Taschenrechner kann man sich zum Beispiel schnell davon überzeugen, dass zur Bestimmung der
Dezimaldarstellung die Darstellung als Reihe geeigneter ist: Sie konvergiert deutlich schneller.
358 10 Reihen – Summieren bis zum Letzten

auch diese Reihe divergieren. In dieser Situation nennt man Zusammengefasst spricht man bei diesen Kriterien von Ver-
die Reihe über die an eine divergente Minorante. gleichskriterien, da hier verschiedene Reihen miteinander
verglichen werden. Ein weiteres Kriterium dieser Art ver-
Wir fassen all diese Überlegungen zusammen:
gleicht die Quotienten der Glieder von zwei Reihen.

Das Majoranten-/Minorantenkriterium Satz (Grenzwertkriterium)


 ∞  ∞   ∞ 
Für eine Reihe ∈ R≥0 gelten folgende
n=0 an mit an
Sind n=0 an und n=0 bn zwei Reihen mit positiven
Konvergenzaussagen: reellen Reihengliedern und gilt
Gibt es eine Folge (bn ) mit an ≤ bn für alle n ≥ n0 , an
und konvergiertdie Reihe  ∞ n=0 bn , so konvergiert bn
n→∞
= C > 0,
lim

auch die Reihe n=0 an .  ∞   ∞ 
Gibt es eine divergente Reihe n=0 bn mit so konvergiert
 ∞ die  Reihe n=0 an genau dann, wenn die
0 ≤ bn ≤ an für alle
 n ≥ n 0 , so divergiert auch Reihe n=0 bn dies tut.

die Reihe n=0 an .
Beweis: Aus der Existenz des Grenzwerts der Folge
(an /bn ) ergibt sich, dass es ein n0 ∈ N gibt mit
Im Fall der Konvergenz beider Reihen erhalten wir zusätzlich
noch die Abschätzung C an
≤ ≤ 2C , n ≥ n0 .
∞ ∞ 2 bn
! !
an ≤ bn Somit gilt wegen C > 0 auch
n=0 n=0
1 2
für die Reihenwerte. an ≤ bn ≤ an , n ≥ n0 .
2C C
 ∞   ∞ 
Beispiel Damit erfüllen die Reihen n=0 an und n=0 bn die
Wir betrachten die Reihe Voraussetzungen des Majoranten-/Minorantenkriteriums.
∞  Aus diesem ergibt sich die Aussage des Grenzwertkriteri-
! 1 ums. 
.
n2 − n + 1
n=1
Beispiel Wir wollen die Reihe
Da der dominante Term im Nenner der Summand n2
ist, ∞ 
! n2 − 7n + 1
liegt die Vermutung nahe, dass die Reihe konvergiert, denn
schließlich konvergiert auch die Reihe über 1/n2 . Wir ver- 4n4 + 3n3 + 2n2 + n
n=1
suchen also eine konvergente Majorante zu finden. Dazu
überlegen wir uns: auf Konvergenz untersuchen.
Die höchste Potenz im Zähler ist n2 , die höchste im Nenner
n2 − n + 1 = (n − 1)2 + n ≥ (n − 1)2 .
n4 ; man kann also vermuten, dass die Reihe ein analoges
Also gilt: Verhalten haben wird wie die Reihe
∞  ∞ 
! n2 ! 1
1 1 = ,
0≤ ≤ . n4 n2
n2 − n + 1 (n − 1)2 n=1 n=1

1 dass also Konvergenz vorliegt.


Die Reihe über (n−1)2
ist aber vom Konvergenzverhalten
1 Mit dem Grenzwertkriterium können wir dies nachweisen.
her dieselbe wie die Reihe über (Indexverschiebung),
n2
d. h., sie ist eine konvergente Majorante. Mit
Bei der Reihe ∞  n2 − 7n + 1 1
! 1 an := und bn :=
√ 4n4 + 3n3 + 2n2 + n n2
n
n=1
erhält man:
vermutet man aus der Kenntnis der harmonischen Reihe,
dass Divergenz vorliegt. In der Tat ist an n2 − 7n + 1 n2
= 4 ·
bn 4n + 3n + 2n + n 1
3 2
√ 1 1
n≤n und daher √ ≥ n4 − 7n3 + n2
n n = 4
4n + 3n3 + 2n2 + n
für alle n ∈ N. Daher ist die harmonische Reihe eine di- 1 − n7 + n12
√ 1
vergente Minorante, und auch die Reihe über 1/ n diver- = 3 2 1
→ ∈ R>0 (n → ∞).
giert. 
4 + n + n2 + n3 4
10.2 Kriterien für Konvergenz 359

Hintergrund und Ausblick: Fast-harmonische Reihen


Wir möchten der Vorstellung ganz entschieden entgegentreten, dass es sich bei Reihen um Summen mit unendlich vielen
Summanden handelt. So verhalten sich Reihen beim Weglassen einzelner Reihenglieder zum Beispiel überhaupt nicht so,
wie man es vielleicht von einer Summe erwarten würde. Dies wollen wir anhand zweier Reihen vorführen, die eng mit der
harmonischen Reihe verwandt sind.
Wir wollen uns mit Reihen beschäftigen, die aus der har- Die letzte Summe ist eine Partialsumme der geometrischen
monischen Reihe dadurch entstehen, dass man einzelne Reihe. Jetzt können wir eine Variante des Majoranten-
Reihenglieder bei der Bildung der Partialsummen auslässt. kriteriums
 anwenden. Es garantiert uns, dass die Reihe
Dazu führen wir zunächst die Menge J aller natürlichen 1
n∈J n im Gegensatz zur harmonischen Reihe kon-
Zahlen ein, deren Dezimaldarstellung keine Null enthält, vergiert.
also J = {1, 2, . . . , 9, 11, . . . , 19, 21, . . .}.
Jetzt betrachten wir eine zweite Reihe, nämlich
Wir betrachten nun die Reihe ∞ 
  !
!1 1
. .
n 1 000n + 1
n∈J n=0

Wir bilden also die Partialsummen nicht über die Kehr- Auch bei dieser Reihe sind gegenüber der harmonischen
werte aller natürlichen Zahlen, sondern nur über diejeni- Reihe viele Reihenglieder gestrichen worden: Von jeweils
gen aus J . Es werden also gegenüber der harmonischen 1 000 Gliedern der harmonischen Reihe kommt nur eines
Reihe einige Summanden ausgelassen: vor:
1 1 1
1 1 1 1 1 1+ + + + ···
1+ + ··· + + + ··· + + + ··· 1 001 2 001 3 001
2 9 11 19 21
Vom Gefühl her hat man hier noch viel weniger Reihen-
Konvergiert diese Reihe oder nicht?
glieder, als im ersten Beispiel. Aber es stellt sich heraus,
Wir betrachten diejenigen Partialsummen, die alle natürli- dass diese Reihe trotzdem divergiert.
chen Zahlen mit maximal N Stellen berücksichtigen, und
Dazu schätzen wir die Partialsummen nach unten ab:
schreiben diese um:
! 1 !
N p −1
10!
1 !
N
1 1 !
N
1
= =
n n 1 000n + 1 1 000 1
n + 1 000
n∈J p=1 n=10p−1 n=0 n=0
n≤10N −1 n∈J
1 ! 1
N
Die innere Summe rechts berücksichtigt alle Zahlen mit ≥
genau p Stellen. Für jede Stelle kommen nur die Ziffern 1 000 n+1
n=0
1, . . . , 9 infrage, also gibt es genau 9p solcher Zahlen. N +1
1 ! 1
Damit können wir abschätzen: = .
p −1 p −1 1 000 n
!
N 10!
1 !
N 10!
1 n=1
≤ Hier können wir also das Minorantenkriterium anwenden
n 10p−1
p=1 n=10p−1 p=1 n=10p−1 und erhalten die Divergenz der Reihe.
n∈J n∈J

!
N Als Fazit halten wir fest: Die Vorstellung von einer Reihe
1
≤ · 9p als unendliche Summe kann schnell aufs Glatteis führen,
10p−1 da sich Reihen anders verhalten können, als man es in-
p=1

!
N −1 ' (p tuitiv von einer Summe erwarten würde. Man ist dagegen
9
=9 . stets auf der sicheren Seite, wenn man die Reihe als Folge
10 und ihren Wert als Grenzwert betrachtet.
p=0

Die beiden Folgen haben also gleiches Konvergenzverhalten, asymptotische Faktor 1/4 zu einer Verschiebung der Gra-
und wie erwartet konvergiert die betrachtete Reihe tatsäch- phen, denn aus
lich.
an 1 1
In der Abbildung 10.9 sind einzelne Glieder der Folgen (an ) ln ≈ ln folgt ln an ≈ ln bn + ln .
bn 4 4
(blau) und (bn ) (grün) in einem logarithmischen Koordina-
tensystem eingezeichnet. Wir greifen hier auf die Definition Die Aussage des Grenzwertkriteriums ist dann, dass zwei
der natürlichen Logarithmusfunktion ln vor, die in Kapitel 11 Reihen dasselbe Konvergenzverhalten haben, wenn ihre Glie-
gegeben wird bzw. verweisen auf das Schulwissen zu Loga- der asymptotisch in einem Plot mit logarithmischen Skalen
rithmen. In Darstellung mit logarithmischen Skalen wird der durch eine Verschiebung auseinander hervorgehen.
360 10 Reihen – Summieren bis zum Letzten

Glieder Die allgemeine harmonische Reihe


10−2
bn
konvergiert für α > 1

10−4 an Die Vergleichskriterien beruhen darauf, einen direkten Bezug


zu einer bereits bekannten Reihe herzustellen. Es gibt aber
10−6 auch subtilere Möglichkeiten, einen solchen Bezug zu er-
zeugen. Dazu wollen wir uns nun noch einmal das Vorgehen
10−8 anschauen, das wir bei der harmonischen Reihe angewandt
n haben. Dort hatten wir bestimmte Summen von Brüchen ab-
101 102 103 104 geschätzt:
Abbildung 10.9 Glieder zweier Reihen in einer logarithmischen Skala. Für j
große n sind die Glieder um einen konstanten Betrag verschoben, sie haben !
2
1 1 1
also dasselbe Abfallverhalten. Nach dem Grenzwertkriterium haben die Reihen ≥ 2j · j +1 = .
darüber dasselbe Konvergenzverhalten. 
2j + k 2 2
k=1

Können wir dieses


 ∞ Vorgehen
 verallgemeinern? Betrachten
Eine Reihe konvergiert genau dann, wenn sie wir eine Reihe n=0 an , bei der die Reihenglieder (an )
eine Cauchy-Reihe ist eine monoton fallende Nullfolge bilden. Nun definieren wir
b2k +m := a2k+1
In Kapitel 8 hatten wir die konvergenten Folgen komplexer für k ∈ N0 , m = 0, . . . , 2k − 1.
c2k +m := a2k
Zahlen dadurch charakterisiert, dass sie Cauchy-Folgen sind.
Für Reihen folgt daraus, dass eine Reihe genau dann konver- Es gilt also:
giert, wenn die Folge ihrer Partialsummen eine Cauchy-Folge
b1 = a2 , b2 = b3 = a4 , b4 = · · · = b7 = a8 , . . .
ist. Wir wollen genauer aufschreiben, was dies für Reihen be-
deutet. c1 = a1 , c2 = c3 = a2 , c4 = · · · = c7 = a4 , . . .
 ∞  Wie sehen nun die Reihen über bn bzw. cn aus?
Wir betrachten die Reihe j =1 aj und bezeichnen die
Folge ihrer Partialsummen mit (sn ). Dies ist genau dann eine  ∞  ⎛ ∞ 2k −1 ⎞ ⎛
∞ 2!k −1

! !! !
Cauchy-Folge, wenn es zu jedem ε > 0 ein N ∈ N gibt mit bn = ⎝ b2k +m ⎠ = ⎝ a2k+1 ⎠
|sn − sm | ≤ ε für n, m ≥ N. n=1 k=0 m=0 k=0 m=0
 ∞
  ∞

Wir setzen die Partialsummen ein, wobei wir ohne Beschrän- ! 1!
k k+1
= 2 a2k+1 = 2 a2k+1
kung m ≤ n annehmen, und erhalten 2
) ) k=0
 ∞ 
k=0
) ! )
) n ) !1
) a ) ≤ ε für n ≥ m ≥ N. = k
2 a2k .
) j )
)j =m+1 ) 2
k=1
Eine Reihe mit dieser Eigenschaft nennen wir auch Cauchy- Analog erhalten wir
Reihe. Die Konvergenzaussage für Cauchy-Folgen liefert so- ∞  ∞ 
! !
fort das folgende Pendant für Reihen. cn = k
2 a2 k .
n=1 k=0
Cauchy-Kriterium
 ∞  Es handelt sich also bei den Reihen über bn bzw. über cn um
Eine Reihe j =1 aj mit Gliedern aus C konvergiert praktisch dieselbe Reihe. Die beiden unterscheiden sich nur
genau dann, wenn sie eine Cauchy-Reihe ist, wenn also durch den Startindex und einen konstanten Vorfaktor.
zu jedem ε > 0 ein N ∈ N existiert mit
) ) Nun gilt aber auch b2k +m = a2k+1 ≤ a2k +m und c2k +m =
) ! )
) n ) a2k ≥ a2k +m , da ja (an ) eine monoton fallende Folge ist.
) a )
j ) ≤ ε für alle n ≥ m ≥ N.
) Insgesamt also
)j =m+1 )
bn ≤ an ≤ cn für alle n ∈ N.
Das Cauchy-Kriterium ist hauptsächlich theoretischer Natur. Jetzt sind wir genau in der Situation des Majoranten-/Mino-
Wir werden es an verschiedenen Stellen zur Herleitung wei- rantenkriteriums. Dessen Anwendung liefert uns die fol-
terführender Aussagen verwenden. Eine direkte Folgerung gende Aussage.
ist zum Beispiel, dass eine Reihe genau dann konvergiert,
wenn die Folge der Reihenreste Verdichtungskriterium
∞ 
! Ist (an ) eine
ak  monoton
∞  fallende Nullfolge, so konvergiert
∞ k

die Reihe n=0 an genau dann, wenn k=0 2 a2k
k=n n
konvergiert.
eine Nullfolge ist.
10.2 Kriterien für Konvergenz 361

1 · a1 a1
a3
2 · a2
1
2 · a1
4 · a4
a2 1 · a2 8 · a8
2 · a4 4 · a8
a4

Abbildung 10.10 Das Verdichtungskriterium: Für jedes k ∈ N0 ist die Summe aus 2k Reihengliedern zwischen 2k a2k nach oben und 2k−1 a2k nach unten
eingeschlossen. Die Reihe über an hat daher das gleiche Konvergenzverhalten wie die Reihe über 2k a2k .

Das Verdichtungskriterium ist das Werkzeug der Wahl, eine bei dem sich das Vorzeichen der Reihenglieder immer ändert.
Aussage über die Konvergenz von Reihen der Form Allgemein definiert man: Ist (an ) eine Folge mit positiven
∞  reellen Gliedern, so heißt eine Reihe der Form
! 1 ∞ 
, α ∈ Q>0 , !
nα n
(−1) an
n=1
n=1
zu treffen. Diese Reihen nennen wir zusammengefasst allge-
meine harmonische Reihe. eine alternierende Reihe.
Eine schöne Eigenschaft alternierender Reihen ist, dass es
Kommentar: Die Voraussetzung α ∈ Q ist hier notwen- für ihre Konvergenz schon ausreicht, dass die Folge (an )
dig, da wir bisher nur für solche Exponenten Potenzen erklärt eine monoton fallende Nullfolge ist. Der Satz, der dies als
haben. In Kapitel 11 werden wir Potenzen für allgemeine re- Konvergenzkriterium formuliert, wurde nach dem deutschen
elle Exponenten erklären. Auch für solche bleiben die Aus- Mathematiker Gottfried Wilhelm Leibniz (1646–1716) be-
sagen zur allgemeinen harmonischen Reihe richtig. nannt.

Satz
Leibniz-Kriterium
Die allgemeine harmonische Reihe konvergiert für α > 1,
für α ≤ 1 divergiert sie. Ist die Folge (an ) eine monoton fallende Nullfolge, so
konvergiert die Reihe
Beweis: Mit dem Verdichtungskriterium erhalten wir die ∞ 
!
Aussage, dass die allgemeine harmonische Reihe dasselbe n
(−1) an .
Konvergenzverhalten hat, wie die Reihe n=1
∞  ∞  ∞ ' (k 
! ! ! Für ihren Reihenwert gilt die Abschätzung
k 1 1 1
2 k α = = .
(2 ) 2k(α−1) 2α−1 )∞ )
k=0 k=0 k=0 )! !
N )
) n n )
) (−1) an − (−1) an ) ≤ aN +1
Auf der rechten Seite steht nun eine geometrische Reihe, ) )
1 n=1 n=1
von der wir bereits wissen, dass sie genau für 2α−1 < 1
konvergiert. Das ist genau für α > 1 der Fall.  für alle N ∈ N.

Die Abschätzung, die auch grafisch in der Abbildung 10.11


veranschaulicht ist, gibt an, wie gut eine Partialsumme den
Alternierende Reihen konvergieren schon, Reihenwert approximiert. Die Differenz zwischen Reihen-
wenn die Beträge der Glieder eine monotone wert und Partialsumme ist also höchstens so groß wie der
Nullfolge bilden Betrag des ersten weggelassenen Reihenglieds. Diese Ab-
schätzung ist ein geeignetes Werkzeug für eine numerische
Viele der bisher betrachteten Kriterien gehen von Reihen mit Approximation. Man kann von vornherein sagen, wie viele
positiven reellen Gliedern aus. Was können wir aber in Fällen Reihenglieder berechnet werden müssen, um eine ge-
sagen, bei denen die Glieder nicht positiv sind? Ein Fall, den wünschte Genauigkeit zu garantieren.
wir ja schon kennengelernt haben, ist der Weg der Schildkröte
aus dem Beispiel von Seite 348, ?
Ist folgende Formulierung des Leibniz-Kriteriums korrekt:
∞ 
! (−1)n Besitzt die Folge (an ) nur negative Glieder und wächst
 sie
, ∞ na ?
n monoton, so konvergiert die Reihe n=1 (−1) n
n=1
362 10 Reihen – Summieren bis zum Letzten

Übersicht: Wichtige Reihen


Einigen Reihen begegnet man häufig in Anwendungen und Aufgaben. Diese sind hier zusammengestellt.

Geometrische Reihe Konvergent für 0 < α ≤ 1.


∞  Reihenwerte nur in Spezialfällen anzugeben, etwa:
!
qn mit q ∈ C.

! ∞
!
n=0 (−1)n+1 (−1)n+1 π2
= ln 2, 2
= .
Konvergent für |q| < 1; Reihenwert n n 12
n=1 n=1

! 1
qn = .
1−q
n=0 Exponentialreihe
Divergent für |q| ≥ 1.  ∞

! 1
Allgemeine harmonische Reihe .
n!
∞  n=0
! 1
mit α > 0.
nα Konvergiert absolut.
n=1
Der Reihenwert ist:
Konvergent für α > 1, Reihenwerte nur in speziellen

!
Fällen anzugeben, etwa: 1
e= ≈ 2,718 281 828 459

! ∞
! n!
1 π2 1 π4 n=0
2
= , 4
= .
n 6 n 90
n=1 n=1
Bernoulli’sche Zahlen
Divergent für α ≤ 1.

(2n)! ! 1
Allgemeine alternierende harmonische Reihe Bn = , n ∈ N.
∞  22n−1 π 2n k 2n
k=1
!
n+1 1
(−1) mit α > 0
nα Die Bernoulli’schen Zahlen tauchen als Koeffizienten in
n=1
Reihenentwicklungen zahlreicher mathematischer Funk-
Absolut konvergent für α > 1. tionen auf.

sn und
s2N+1 − s2N−1 = −a2N+1 + a2N ≥ 0,
s + an da ja (an ) eine monoton fallende Folge ist. Außerdem gilt
noch:
s sn
s2N − s2N−1 = a2N ≥ 0, also s2N ≥ s2N−1 .
s − an
Wir fassen das eben Gezeigte zusammen: Die Folge (s2N )
n
ist monoton fallend und nach unten beschränkt, zum Beispiel
durch s1 . Die Folge (s2N−1 ) ist monoton wachsend und nach
Abbildung 10.11 Die Abschätzung des Leibniz-Kriteriums garantiert, dass die oben beschränkt, zum Beispiel durch s2 . Beide Teilfolgen
Partialsummen sn den Reihenwert s besser approximieren als s ± an .
sind also konvergent (Abb. 10.12).

Beweis: Wir definieren die Folge der Partialsummen (sN ) (S2n−1 ) (S2n )
durch
S1 S3 S5 S S4 S2
!
N
n
sN := (−1) an
n=1 Abbildung 10.12 Grafische Darstellung der Folgenglieder sN im Beweis des
Leibniz-Kriteriums.
und betrachten die Teilfolgen (s2N ) und (s2N −1 ). Es gilt
dann: Die Grenzwerte sind ebenfalls gleich. Das folgt aus der Glei-
s2N+2 − s2N = a2N +2 − a2N +1 ≤ 0 chung s2N − s2N−1 = a2N , da (an ) eine Nullfolge ist.
10.3 Absolute Konvergenz 363

Wir haben somit die Folge (sn ) vollständig in zwei konver- 10.3 Absolute Konvergenz
gente Teilfolgen zerlegt. Da beide Teilfolgen konvergieren,
ist (sn ) beschränkt, und da beide Teilfolgen denselben Grenz-
Schon im ersten Abschnitt dieses Kapitels hatten wir gese-
wert besitzen, hat (sn ) nur einen einzigen Häufungspunkt.
hen, dass bei Reihen die Reihenfolge der Reihenglieder nicht
Also (siehe die Folgerung auf Seite 295) konvergiert die
vertauscht werden darf, zumindest nicht, wenn man erwartet,
Folge (sn ) selbst, die ja gerade unsere alternierende Reihe
dass sich der Reihenwert nicht ändert. In diesem Abschnitt
ist – den Reihenwert nennen wir S.
wollen wir diese Fragestellung näher untersuchen. Ziel ist es,
Aus unseren Überlegungen folgt auch, dass S für alle N zwi- solche Reihen zu finden, bei denen man wie bei einer end-
schen sN und sN+1 liegt. Es gilt eine der beiden Unglei- lichen Summe die Reihenfolge der Glieder beliebig ändern
chungsketten kann, ohne dass sich der Reihenwert ändert. Es wird sich
herausstellen, dass sich solche Reihen alle durch eine ein-
sN ≤ S ≤ sN+1 oder sN +1 ≤ S ≤ sN . fache gemeinsame Eigenschaft charakterisieren lassen, die
wir absolute Konvergenz nennen wollen.
Es folgt daher:
Definition der absoluten Konvergenz
|S − sN | ≤ |sN +1 − sN | = aN +1 .
Ist
 ∞ (an ) eine  Folge in C und konvergiert
 ∞ die Reihe
Damit ist auch die Abschätzung für den Grenzwert be- n=1 |a n | , so nennen wir die Reihe n=1 an abso-
wiesen.  lut konvergent.

? Beispiel Viele der Reihen, die wir kennengelernt haben,


An welcher Stelle des Beweises wird die Monotonieforde- sind absolut konvergent. Dazu zählen zum Beispiel alle kon-
rung benutzt? vergenten Reihen mit positiven reellen Gliedern, wie etwa
∞  ∞ ' ( 
! 1 ! 1 n
oder .
Wir wollen uns jetzt einige Fälle anschauen, in denen die n2 3
n=1 n=0
Anwendung des Leibniz-Kriteriums ins Auge gefasst werden
könnte – auch wenn das manchmal gar nicht erlaubt ist. Weil Konvergent, aber nicht absolut konvergent ist dagegen die
es so einfach ist, verleitet das Leibniz-Kriterium häufig dazu, alternierende harmonische Reihe
es unerlaubterweise anzuwenden. ∞ 
! (−1)n
. 
Beispiel n
n=1
Zunächst ein Beispiel, bei dem die Anwendung erlaubt
ist: ∞ 
! i2n Wie sieht nun der Zusammenhang zwischen herkömmlicher
√ . und absoluter Konvergenz aus? Ein wichtiges Resultat ist das
n
n=1 folgende.
Hinter dem komplexen
 Ausdruck i2n verbirgt sich (−1)n .
Die Folge √1n ist eine monoton fallende Nullfolge, also Absolute Konvergenz und Konvergenz
liegt nach dem Leibniz-Kriterium Konvergenz vor. Jede absolut konvergente Reihe ist auch konvergent.
Ein Fall, bei dem man genau hinsehen muss, ist die Reihe
∞ 
! Beweis:
(−1) n n
.  ∞  Wir geben uns die absolut konvergente Reihe
n+1 k=1 ak vor. Wir werden zeigen, dass dies eine Cauchy-
n=1
Reihe ist. Dann folgt die Aussage aus dem Cauchy-Kri-
Hier liegt das Problem darin, dass (n/(n + 1)) gar keine terium.
Nullfolge ist, was man schnell einmal übersehen kann. Die Differenz der Partialsummen zu m, n mit m ≤ n ist
Nach dem Nullfolgenkriterium divergiert die Reihe. 
!
n !
m !
n
ak − ak = ak .
Zum Ende dieses Abschnitts noch ein Wort zu Reihen mit
k=1 k=1 k=m+1
komplexen Gliedern. Man hat hier zwei Vorgehensweisen
zur Verfügung: Die eine Möglichkeit besteht darin, Real- und Wir schätzen den Betrag durch die Dreiecksungleichung ab:
Imaginärteil der Reihe getrennt zu untersuchen. Die zweite ) )
Möglichkeit besteht darin, solche Reihen auf absolute Kon- ) n ) ∞
) ! ) !n !
vergenz zu untersuchen, der wir uns im nächsten Abschnitt ) a )≤ |a | ≤ |ak | .
) k ) k
widmen wollen. )k=m+1 ) k=m+1 k=m+1
364 10 Reihen – Summieren bis zum Letzten

Damit ist die Arbeit schon getan: Wegen der absoluten Kon- erhalten die Abschätzung
vergenz der Reihe gibt es zu jedem ε > 0 ein n0 ∈ N, sodass ) )
) 2 ! N
(−1)n ))

!
für alle n ≥ n0 gilt: ) 1
)ln − ) ≤
)∞ ) ) 3 n2 n ) 2n
)! !
n ) !∞ n=1 n=N+1
) ) ∞
!
) |ak | − |ak |) = |ak | ≤ ε . 1 1
) ) =
k=1 k=1 k=n+1 2N +1 2n
n=0
Indem man nur n, m ≥ n0 wählt, sieht man, dass die Reihe 1 1 1
= · = .
eine Cauchy-Reihe ist.  2N +1 1− 1
2
2N
Hier haben wir die Reihe durch eine Indexverschiebung auf
Die Umkehrung gilt, wie wir bereits gesehen haben, nicht. Es die geometrische Reihe zurückgeführt, deren Reihenwert wir
gibt auch konvergente Reihen, die nicht absolut konvergent ausrechnen können.
sind. In diesem Fall spricht man von bedingter Konvergenz.
Wir halten fest: Wenn wir die N -te Partialsumme berechnen,
erhalten wir eine Näherung an ln 23 , die höchstens 2−N vom
richtigen Ergebnis entfernt ist. Für N = 10 ist etwa der Wert
Bei absolut konvergenten Reihen gilt die der Partialsumme
Dreiecksungleichung
!
10
(−1)n
≈ −0,4054346,
Eine weitere Eigenschaft, die wir sofort von endlichen Sum- n 2n
n=1
men auf absolut konvergente Reihen
 ∞ übertragen
 können, ist
die korrekte Dezimaldarstellung ist
die Dreiecksungleichung. Ist n=1 an eine absolut kon-
vergente Reihe, so gilt natürlich für alle Partialsummen 2
ln = −0,4054651 . . .
)N ) 3
)! ) ! N
) ) Der Fehler ist ungefähr 3,046 · 10−5 , unsere Abschätzung
) an ) ≤ |an |.
) ) garantiert einen Fehler von höchstens 9,766 · 10−4 .
n=1 n=1
Solche oder ähnliche Abschätzungen benötigt man, wenn
Nach den Regeln für Grenzwerte bleibt diese Ungleichung
Reihenwerte numerisch berechnet werden sollen, wobei aber
erhalten, wenn N → ∞  Es gilt also für jede absolut
geht.
∞ eine gewünschte Genauigkeit garantiert werden soll. Ein Ver-
konvergente Reihe n=1 n die Dreiecksungleichung in
a
gleich des tatsächlichen Fehlers und der Abschätzung für ver-
der Form )∞ )
)! ) ! ∞ schiedene Werte von N ist in der Abbildung 10.13 dargestellt.
) ) Die Abschätzung gibt den Fehler gut wieder, bis N ≈ 60. Das
) an ) ≤ |an |.
) ) Verhalten für größere Werte von N liegt an Rundungsfeh-
n=1 n=1
lern bei der Bestimmung des korrekten Werts für ln(2/3): In
der heute üblichen Standardarithmetik bestimmen Computer
Beispiel Ein möglicher Weg zur Berechnung der Zahl Funktionswerte auf maximal 16 Dezimalstellen genau.
ln(2/3) ist die Reihendarstellung
∞ Fehler
2 ! (−1)n 1
ln = ,
3 n 2n 10−4
Abschätzung
n=1
10−8 Fehler
die wir einer mathematischen Formelsammlung entnommen
haben. Die Funktion ln ist der natürliche Logarithmus, den 10−12
wir in Kapitel 11 definieren werden. 10−16

Wenn wir irgendeine Partialsumme dieser Reihe berechnen, N


101 102 103
erhalten wir eine Näherung an den Wert von ln(2/3). Aber
wie gut ist diese Näherung? Abbildung 10.13 Der tatsächliche Fehler und die Abschätzung für die Berech-
nung von ln(2/3). Die Abschätzung gibt das Verhalten des Fehlers gut wieder,
Mit der Dreiecksungleichung erhalten wir die Abschätzung bis Rundungsfehler eine Rolle spielen.

) ) )) ∞ )
)
) 2 !
)
N
(−1)n )) )) ! (−1)n ))

! 1 ?
) ln − =
) ) ) ≤ . Welche andere Möglichkeit gibt es, den Unterschied zwi-
) 3 n2 ) )
n n
n2 ) n 2n
n=1 n=N +1 n=N +1 schen Partialsumme und exaktem Reihenwert in obigem
Beispiel abzuschätzen? Welche Variante liefert eine bessere
Den Faktor n im Nenner der Reihenglieder ersetzen wir jetzt Schranke?
durch 1, dadurch werden alle Reihenglieder größer, d. h., wir
10.3 Absolute Konvergenz 365

Der Begriff der absoluten Konvergenz erlaubt es uns auch, wobei die Zahlen PN und QN rekursiv definiert sind:
eine Variante des Majorantenkriteriums für Reihen mit kom-
P1 = Q1 = 0
plexen Gliedern zu formulieren.
und
Satz (Majorantenkriterium für Reihen mit komplexen
Gliedern) PN +1 = PN , QN +1 = QN + 1, falls SN ≥ S
 ∞ 
Falls es zu einer Reihe n=0 an mit an ∈ C eine sowie
Folge (bn ) aus R≥0 mit |an | ≤ bn für alle n ≥ n0 gibt, und

konvergiert
 ∞  die Reihe n=0 bn , so konvergiert die Reihe PN +1 = PN + 1, QN +1 = QN falls SN < S
n=0 a n .
für N ≥ 2. Es folgt, dass sowohl (PN ) als auch (QN ) mono-

Beweis: Das ursprüngliche Majorantenkriterium für Rei-  ∞ in Nsind. Ferner ist


ton wachsende, unbeschränkte Folgen
(SN ) eine Umordnung der Reihe n=1 an .
hen (siehe Seite 358) liefert unter den gegebenen Vorausset-
zungen die absolute Konvergenz der Reihe über die an . Da Nun wählen wir ein ε > 0. Dann gibt es ein M ∈ N mit
absolut konvergente Reihen auch konvergieren, ist der Satz bm ≤ ε und cm ≤ ε für alle m ≥ M. Außerdem gibt es eine
bewiesen.  Zahl N0 ∈ N mit PN ≥ M und QN ≥ M für alle N ≥ N0 .
Ist für N ≥ N0 nun die Bedingung S − ε ≤ SN −1 < S
erfüllt, so folgt:
Durch Umordnungen der Glieder erhält man
S − ε ≤ SN = SN −1 + bPN ≤ S + ε .
bei bedingt konvergenten Reihen jeden
beliebigen Reihenwert Ist andererseits die Bedingung S + ε ≥ SN −1 ≥ S erfüllt, so
folgt
Wir wenden uns nun dem Phänomen zu, das wir auf Seite 348 S + ε ≥ SN = SN −1 − cQN ≥ S − ε .
angesprochen haben: Ordnet man die Glieder einer Reihe um, Schließlich existiert nach Konstruktion aber auch ein
so kann sich unter Umständen der Reihenwert ändern. In dem N1 ≥ N0 mit |S − SN1 | ≤ ε, da sich aufeinanderfolgende
Beispiel wird die alternierende harmonische Reihe betrach- Partialsummen stets höchstens um ε voneinander unterschei-
tet. In der Tat wird sich herausstellen, dass diese Situation den. Somit gilt für alle N ≥ N1 die Bedingung
genau für solche Reihen auftritt, die zwar konvergent, aber
nicht absolut konvergent sind. |S − SN | ≤ ε .
Zunächst erklären wir,
 ∞ was wir unter einer Umordnung ver- Damit ist gezeigt, dass die Reihe (SN ) gegen S konver-
stehen: Eine
 Reihe k=1 bk heißt Umordnung der Reihe giert. 

n=1 an , falls es eine bijektive Abbildung u : N → N gibt
mit an = bu(n) , n ∈ N.

Bei absolut konvergenten Reihen sind


Riemann’scher Umordnungssatz
 ∞  beliebige Umordnungen der Reihenglieder
Ist n=1 an eine bedingt konvergente Reihe mit reel-
len Gliedern, also konvergent, aber nicht absolut konver-
erlaubt
gent, so gibt es zu jedem S ∈ R eine Umordnung dieser
Wir überlegen uns nun, dass die Voraussetzung im Umord-
Reihe mit Reihenwert S.
nungssatz, dass die Reihe nicht absolut konvergieren darf,
notwendig ist, genauer, dass man bei einer absolut konver-
Beweis: Wir definieren genten Reihe die Reihenfolge der Reihenglieder beliebig än-
  dern kann, ohne dass sich der Reihenwert dabei verändert.
an , an ≥ 0, 0, an ≥ 0,
bn := und cn := In dieser Hinsicht verhalten sich absolut konvergente Reihen
0, an < 0 −an , an < 0. also ganz ähnlich wie endliche Summen.
Dann gilt: Wir wollen uns den Grund für diese Eigenschaft
∞ ∞  ∞überlegen.

! ! Wir wählen eine absolut konvergente Reihe
an = (bn − cn ). n=1 an , ih-
ren Reihenwert wollen wir mit A bezeichnen. Nun sei (bn )
n=1 n=1
 ∞   ∞  eine Folge, die aus genau denselben Folgengliedern wie
Die Reihen n=1 bn bzw. n=1 cn divergieren, weil (an ) besteht, nur eben in einer
andernfalls die Reihe über die (an ) absolut konvergent wäre.  anderen
∞  Reihenfolge. Dann
konvergiert auch die Reihe n=1 bn (siehe Übungsauf-
Zu S ∈ R setze nun gabe 10.18), ihren Reihenwert bezeichnen wir mit B. Wir
müssen nun zeigen, dass nun A = B ist.
!
PN !
QN
SN := bn − cn , Wir
 ∞geben uns dazu ε > 0 beliebig vor. Da die Reihe
n=1 n=1 n=1 an absolut konvergiert, gibt es eine Zahl N ∈ N,
366 10 Reihen – Summieren bis zum Letzten

Unter der Lupe: Der Riemann’sche Umordnungssatz


 ∞ 
Ist n=1 an eine bedingt konvergente Reihe mit reellen Gliedern, also konvergent, aber nicht absolut konvergent, so gibt es
zu jedem S ∈ R eine Umordnung dieser Reihe mit Reihenwert S.

Verdeutlichung der Aussage Die Reihenfolge der Glie- Umsetzung der Idee
der bei einer konvergenten, aber nicht absolut konvergen- Wir spalten die Reihe auf in ihren positiven und negativen
ten Reihe ist für den Reihenwert entscheidend. Es kommt Anteil. Dazu definieren wir
dabei darauf an, dass eine andere Folge von Partialsum-  
an , an ≥ 0, 0, an ≥ 0,
men entsteht. Bringt man nur endlich viele Glieder in eine bn = und cn =
andere Reihenfolge, so ist klar, dass die Partialsummen 0, an < 0 −an , an < 0
für einen genügend großen Abschneideindex unverändert und schreiben
bleiben.
!
N !
N !
N
Dabei ist es möglich, jeden betragsmäßig noch so großen an = bn − cn .
Reihenwert zu erzielen. Entscheidend für die Aussage ist n=1 n=1 n=1
also die Divergenz der Reihe über die Beträge, denn da- Hier dürfen wir nicht einfach N → ∞ gehen lassen.
durch lässt sich jeder noch so große potenzielle Reihen- Würde nämlich beispielsweise die Reihe über die bn kon-
wert übertreffen. vergieren, so folgt aus den Rechenregeln für Folgen, dass
Diskussion der Beweisidee Das Musterbeispiel für eine auch die Reihe über die cn konvergiert. Dies wiederum
bedingt konvergente Reihe ist die alternierende harmoni- bedeutet die absolute Konvergenz der Reihe über die an .
sche Reihe. Im Beweis des Leibniz-Kriteriums, das die Jetzt ändern wir auf der rechten Seite die Abschneide-
Konvergenz dieser Reihe sicherstellt, hatten wir gesehen, indizes und bilden
dass die Partialsummen den Reihenwert umspringen und !
PN !
QN
abwechselnd Werte darüber und darunter annehmen (siehe SN = bn − cn .
die Abbildungen 10.11 und 10.12). Es erscheint sinnvoll n=1 n=1
dieses Verhalten irgendwie nachzubilden. Dabei sind die PN und QN so zu wählen, dass sie monoton
Geht man davon aus, dass der zu erzielende Reihenwert wachsen (denn sonst läge keine Umordnung der ursprüng-
S positiv ist, so bildet man dazu zunächst Partialsummen lichen Reihe vor) und dass SN +1 ≥ SN ist für SN ≤ S
nur aus positiven Gliedern, bis der Wert der Partialsumme und SN +1 ≤ SN für SN > S. Im Beweis ist die genaue
erstmalig größer als S ist. Anschließend addiert man ne- Konstruktion angegeben.
gative Glieder, bis der Wert wieder kleiner als S ist. Die Es bleibt noch zu überlegen, dass die so konstruierte Reihe
Abbildung stellt dies beispielhaft für die alternierende har- tatsächlich gegen S konvergiert. Auch hier geht man im
monische Reihe und den Grenzwert S = 1.2 dar. Prinzip vor wie im Beweis des Leibniz-Kriteriums. Ist
SN SN ≥ S ≥ SN +1 , so ist
|S − SN | ≤ |SN − SN +1 | = |aQN+1 | .
S
Da die Reihe über die an konvergiert, bilden die an aber
eine Nullfolge. Somit geht dieser Abstand gegen null.
N
Nachdem so S unterschritten wurde, wird |S − SN +k |
Für dieses Vorgehen ist es entscheidend, dass es überhaupt solange kleiner, bis S durch SN +K wieder überschritten
möglich ist, den Wert S immer wieder zu überschreiten wird. Dann erhält man |S − SN +K | ≤ |aPN+K+1 | und hat
und zu unterschreiten. Dazu benötigen wir, dass die Rei- wieder durch ein Glied der Folge (an ) abgeschätzt.
hen über die positiven bzw. über die negativen Glieder von Im Beweis wird dieses Vorgehen formal durch Wahl von
(an ) jeweils divergieren. geeigneten Indizes zu vorgegebenem ε > 0 durchgeführt.

sodass für den Reihenrest der Betragsreihe gilt: Nun untersuchen wir die Folge (bn ). Wir suchen uns eine
∞ Zahl M ∈ N, sodass die Folgenglieder a1 , . . . , aN unter den
!
|an | ≤ ε. Zahlen b1 , . . . , bM sind. Das geht, da ja die Folgenglieder
n=N+1 von (an ) und (bn ) dieselben sind. Dann gilt aber auch
)M )
Damit ist nach der Dreiecksungleichung )! ) ∞
! ∞
!
) )
)N ) )) ∞ )
) )
)
bn − B ) ≤
)
|bn | ≤ |an | ≤ ε.
)! ) ) ! ) !∞
) ) ) n=1 n=M+1 n=N+1
) an − A) = ) an )) ≤ |an | ≤ ε.
) ) )
n=1 n=N +1 ) n=N +1
10.3 Absolute Konvergenz 367

Schließlich ist auch einen führt dies auf keine angenehme Darstellung des Pro-
)N ) dukts, aber es ist auch nicht klar, ob dieses Vorgehen über-
)! !
M ) ∞
!
) ) haupt sinnvoll ist.
) an − bn ) ≤ |an | ≤ ε,
) )
n=1 n=1 n=N +1
Um eine schöne, eingängige Formel zu erhalten, müssen wir
denn in der ersten Differenz bleiben nur Glieder übrig, die in die Reihenglieder in der Produktreihe umordnen. Nach dem
den aN +1 , aN+2 , . . . enthalten sind. bisher Gesagten ist klar: Das dürfen wir nur tun, wenn diese
Reihe absolut konvergiert.
Nun schätzen wir die Differenz der beiden Reihenwerte durch
die Dreiecksungleichung ab: Auf der rechten Seite der Abbildung 10.14 ist dieses Um-
) ) )N ) ordnen schematisch dargestellt. Als Formel
)
) !N ) )!
) ) !M )
) ∞  schreibt
 sich

die
|A − B| ≤ )A − an ) + ) an − bn ) Produktreihe für zwei Reihen a
n=1 n und b
n=1 n
) ) ) ) dann als
n=1 n=1 n=1
)M )  ∞ n−1 
)! ) !!
) )
+) bn − B ) ak bn−k .
) )
n=1 n=1 k=1
≤ 3ε.
Diese Reihe nennen wir Cauchy-Produkt der beiden Rei-
Wir rekapitulieren: Für jedes ε > 0 ist also |A − B| ≤ 3ε. hen.
Also muss A = B sein. Als Schlussfolgerung können wir
festhalten, dass sich der Reihenwert bei absolut konvergen-
ten Reihen durch eine Umordnung der Reihenglieder nicht Konvergenz des Cauchy-Produkts
 ∞   ∞ 
ändert. Sind die Reihen n=1 an und n=1 bn absolut kon-
vergent, dann konvergiert auch ihr Cauchy-Produkt ab-
solut, und für die Grenzwerte gilt:
Zur Berechnung von Produkten von Reihen 2 3 2 3

! ∞
! ∞ n−1
! !
dient das Cauchy-Produkt
an · bn = ak bn−k .
n=1 n=1 n=1 k=1
Von der Möglichkeit, die Glieder einer absolut konvergen-
ten Reihe umzuordnen, wollen wir gleich Gebrauch machen.
Dazu wollen wir uns mit Produkten von Reihen beschäftigen.
Beweis: Wir betrachten eine bijektive Abbildung σ : N →
Nach den Rechenregeln für Grenzwerte von Folgen wissen
N × N mit j  → (σ1 (j ), σ2 (j )). Eine solche Abbildung ist
wir, dass das Produkt zweier konvergenter Reihen stets auch
uns zum Beispiel beim Nachweis der Abzählbarkeit von Q
konvergieren muss. Allerdings ist das Ausmultiplizieren der
schon begegnet (siehe Seite 122). Dann konvergiert die Reihe
Partialsummen problematisch: Man hat es mit zwei Grenz-
prozessen zu tun, von denen nicht klar ist, ob sie unabhängig ⎛ ⎞

!
voneinander sind:
⎛ ⎞  ⎝ aσ1 (j ) bσ2 (j ) ⎠
∞ ∞

! ! !
N ! M j =1
⎝ aj ⎠ · aj = lim lim aj bk
N →∞ M→∞
j =0 k=0 j =1 k=1 absolut, denn setzen wir für alle N ∈ N
Die Abbildung 10.14 stellt links die Bildung der Produkt-
reihe schematisch dar, wenn man bei beiden Reihen die Par- PN = max{σ1 (1), . . . σ1 (N )} ,
tialsummen für dasselbe N miteinander multipliziert. Zum QN = max{σ2 (1), . . . σ2 (N )} ,

a1 b1 a2 b1 a3 b1 a4 b1 a5 b1 ··· a1 b1 a2 b1 a3 b1 a4 b1 a5 b1 ···

a1 b2 a2 b2 a3 b2 a4 b2 a5 b2 ··· a1 b2 a2 b2 a3 b2 a4 b2 ··· ···

a1 b3 a2 b3 a3 b3 a4 b3 a4 b3 .. a1 b3 a2 b3 a3 b3 .. ··· ···
. .
a1 b4 a2 b4 a3 b4 a4 b4 a5 b4 .. a1 b4 a2 b4 .. .. .. ..
. . . . .
a1 b5 a2 b5 a3 b5 a4 b5 a5 b5 .. a1 b5 .. .. .. .. ..
. . . . . .
.. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . .
Abbildung 10.14 Die Ordnung der Reihenglieder in einer Produktreihe. Links ist die Abfolge der Glieder nach der Definition der Reihen abgebildet, rechts die Abfolge
im Cauchy-Produkt.
368 10 Reihen – Summieren bis zum Letzten

so ist für jedes p ∈ N gilt. Im nächsten Kapitel dieses Buches,


⎛ ⎞⎛ ⎞ das sich mit Potenzreihen beschäftigt, wollen wir uns dieses
!
N !
PN !
QN
Ergebnis für alle p ∈ C erarbeiten. 
|aσ1 (j ) bσ2 (j ) | ≤ ⎝ |aj |⎠ ⎝ |bj |⎠
j =1 j =1 j =1
⎛ ⎞⎛ ⎞

! ∞
! Kommentar: Von beiden Reihen im Cauchy-Produkt ab-
≤⎝ |aj |⎠ ⎝ |bj |⎠ . solute Konvergenz zu verlangen, ist eine recht scharfe Forde-
j =1 j =1 rung. Konvergiert von zwei Reihen eine absolut, die andere
hingegen nur bedingt, so konvergiert ihr Cauchy-Produkt im-
Nach dem Umordnungssatz konvergiert für jedes bijektive mer noch – allerdings im Allgemeinen nicht mehr absolut.
σ : N → N × N die oben definierte Reihe gegen denselben
Grenzwert. Die beiden Reihen
N N ∞  N n−1 ∞ ?
!! !! Können Sie eine Reihe angeben, deren Cauchy-Produkt mit
an bk bzw. an bn−k
jeder beliebigen anderen Reihe konvergiert?
n=1 k=1 N=1 n=1 k=1 N =1

sind aber jeweils Teilfolgen solcher Reihen für eine geeignete


Wahl von σ (siehe dazu Abbildung 10.14). Somit haben beide
Reihen denselben Wert. Es ist aber 10.4 Kriterien für absolute
 ∞  ∞ 
! N ! N ! ! Konvergenz
lim an bk = an bk .
N→∞
n=1 k=1 n=1 k=1
Im Abschnitt 10.2 ging es um die Frage, wie man auf einfa-
Somit hat auch das Cauchy-Produkt diesen Wert. 
chem Wege entscheiden kann, ob eine Reihe konvergiert oder
nicht. Wir wollen uns jetzt ganz analog damit beschäftigen,
Beispiel Das Quadrat der Euler’schen Zahl können wir als Kriterien zu finden, mit denen wir eine Reihe auf absolute
Produkt der Exponentialreihe mit sich selbst schreiben: Konvergenz überprüfen können.
∞  ∞  Das Wurzel- und das Quotientenkriterium, die wir jetzt vor-
! 1 ! 1
2
e = · . stellen wollen, erledigen diese Aufgabe und sind leicht zu
n! n! handhaben. Bei vielen Reihen stellen sie den bei Weitem
n=0 n=0
einfachsten Weg dar, die Konvergenz zu überprüfen. Beide
Mithilfe des Cauchy-Produkts folgt Kriterien sind allerdings nicht sehr fein: Bei vielen Reihen,
∞ !
! n die „gerade noch“ oder „gerade nicht mehr“ konvergent sind,
1 1
e2 = · erhält man keine Aussage. Da beide Kriterien eben auf abso-
k! (n − k)! lute Konvergenz prüfen, können sie über bedingt konvergente
n=0 k=0
!∞ !n Reihen niemals Aussagen treffen.
1 n!
= .
n! k! (n − k)!
n=0 k=0

Der letzte Bruch ist aber gerade ein Binom. Also gilt mit der Das Wurzelkriterium folgt aus dem Vergleich
allgemeinen binomischen Formel: mit der geometrischen Reihe

! n ' (
1 ! n k n−k Vergleichskriterien sind immer nur so gut wie die Reihen,
e2 = 1 1
n! k die man zum Vergleichen zur Verfügung hat. Eine Reihe, die
n=0 k=0

sich für Vergleiche anbietet – weil wir ja ihre Konvergenz-
! 1
= (1 + 1)n eigenschaften ganz genau kennen – ist die geometrische. Wir
n! werden aus diesem Vergleich sogar ein ganz allgemeines Kri-
n=0
∞ terium gewinnen, eben das Wurzelkriterium.
! 2n
= . Betrachten wir dazu eine Reihe mit nicht negativen Gliedern
n!
n=0 an . Mit Sicherheit wissen wir, dass diese konvergiert, wenn
Ausgehend von diesem Ergebnis kann man nun eine Reihen- es eine positive Zahl q < 1 gibt, sodass ab einem bestimmten
darstellung von e3 berechnen, anschließend dann für e4 , usw. Index n0
Mit vollständiger Induktion lässt sich dabei beweisen, dass an ≤ q n

! ist. Diese Bedingung kann man aber sofort umschreiben zu
pn
ep =
n! √
n=0 n an ≤ q.
10.4 Kriterien für absolute Konvergenz 369

Hintergrund und Ausblick: Der große Umordnungssatz


Wir haben gezeigt, dass bei absolut konvergenten Reihen die Folge der Reihenglieder beliebig umsortiert werden darf. Man
betrachtet also als zulässige Umordnung eine Bijektion von N. Es sind aber auch kompliziertere Umordnungen denkbar, bei
denen zunächst Reihen über Teilfolgen der Reihenglieder gebildet und diese Grenzwerte dann addiert werden. Auch dann gilt
die Aussage, dass der Grenzwert der Reihe sich bei einer absolut konvergenten Reihe nicht ändert. Diese Aussage nennt man
den großen Umordnungssatz.
 ∞ 
Wir betrachten eine konvergente Reihe m=1 am mit {a1 , . . . , aM } ⊆ {an(j,k) | k ∈ N, j ≤ J } .
nicht-negativen Gliedern am . Insbesondere folgt, dass die
Reihe absolut konvergiert. Somit ist
!M !J !∞

Wir formulieren zunächst genauer, was wir unter einer am ≤ b j ≤ bj .


m=1 j =1 j =1
Umordnung im Sinne des großen Umordnungssatzes ver-
stehen. Dazu betrachten wir eine Bijektion Im Grenzübergang M → ∞ erhalten wir

! ∞
!
n: N × N → N .
am ≤ bj .
Die Menge {an(j,k) | j, k ∈ N} enthält dann genau die m=1 j =1
Reihenglieder an und zu jedem Index m gibt es nur ein
Damit haben wir den folgenden großen Umordnungssatz
Paar (j, k) mit am = an(j,k) .
bewiesen:
Wir können nun Teilreihen der ursprünglichen Reihe bil-
den, für festes j ∈ N nämlich Satz 

∞  Ist m=1 am eine konvergente Reihe mit am ≥ 0,
! m ∈ N, und ist n : N × N → N bijektiv, so gilt
an(j,k) .
k=1 ∞
! ∞ !
! ∞
am = an(j,k) .
Jede dieser Reihen konvergiert, da die Folge der Partial-
j =1 k=1
summen monoton wächst und durch ∞
m=1
m=1 am nach oben
beschränkt ist. Wir schreiben bj für den Grenzwert. Bildet
man nun, Wir haben hier eine Formulierung des Satzes gewählt,
⎛ ⎞ ⎛ ⎞ die von einer Aufteilung von (am ) in abzählbar unend-
! ∞ !∞ ! ∞
⎝ lich viele Teilfolgen ausgeht. Klar ist, dass wir ganz ana-
bj ⎠ = ⎝ an(j,k) ⎠ ,
log argumentieren können, um die Aussage auch für eine
j =1 j =1 k=1
Aufteilung in endlich viele Teilfolgen zu erhalten.
so tauchen alle ursprünglichen Reihenglieder wieder ge-
nau einmal auf. Offen ist, ob auch die Reihenwerte über- In der Literatur (zum Beispiel Walter, Analysis I) sind
einstimmen. auch allgemeinere Formulierungen des großen Umord-
nungssatzes zu finden. Es reicht aus, zu verlangen, dass
Zunächst zeigen wir, dass die Reihe über die bj konver- die Reihe über die am absolut konvergiert. Insbesondere
giert. Da die Folge ihrer Partialsummen ebenfalls monoton können die Glieder auch komplexe Zahlen sein.
wächst, ist nur zu zeigen, dass diese Folge beschränkt ist.
Dazu wählen wir ε > 0. Zu jedem j ∈ N existiert dann Anwendungen dieses Satzes finden sich zum einen in der
ein K ∈ N mit Berechnung von Reihenwerten. So ist für |q| < 1 etwa
!∞ !K ∞ ∞ ∞ ∞
ε ! ! ! !
bj = an(j,k) ≤ an(j,k) + j . (n + 1) q n = qn + qn + qn + · · ·
2
k=1 k=1 n=0 n=0 n=1 n=2
Somit gilt für J ∈ N !∞ !∞ !∞
= qn + q n+1 + q n+2 + · · ·
!
J !
J !
K !
J ∞
!
1 n=0 n=0 n=0
bj ≤ an(j,k) + ε ≤ am + ε .
2j !∞ !∞
j =1 j =1 k=1 j =1 m=1
= qj qk
Jetzt können wir zunächst den Grenzübergang J → ∞ j =0 k=0
durchführen, um zu sehen, dass die Reihe über die bj kon- !∞ j
q 1
vergiert. Anschließend liefert ε → 0 die Abschätzung = = .
∞ ∞ 1−q (1 − q)2
! ! j =0
bj ≤ am . Der Große Umordnungssatz findet unter anderem in der
j =1 m=1 Stochastik Anwendung, wenn es darum geht, diskrete
Es ist noch die umgekehrte Abschätzung zu zeigen. Zu Wahrscheinlichkeitsräume durch Angabe der Wahrschein-
M ∈ N existiert aber ein J ∈ N mit lichkeiten aller Elementarereignisse zu konstruieren.
370 10 Reihen – Summieren bis zum Letzten

Gäbe es umgekehrt eine Zahl Q > 1, sodass Um uns von der Richtigkeit der letzten Aussage des Krite-
√ riums zu überzeugen, werden wir in den folgenden Beispie-
n an ≥ Q len konvergente und eine divergente Reihe vorstellen, die

lim sup n |an | = 1 erfüllen. 
ab einem bestimmten Index n0 wäre, dann hätten wir sofort n→∞
die Abschätzung √
Ein wichtiger Spezialfall liegt vor, wenn die Folge ( n |an |)
!
N !
N
sogar konvergiert. In diesem Falle können wir den Limes
an ≥ Qn , superior durch den Grenzwert ersetzen. Das lässt sich knapp
n=n0 n=n0
und kompakt schreiben als
und auf der rechten Seite stünde eine divergente Minorante. ⎧
√ ⎪
⎨< 1 absolute Konvergenz,
Es wird also für viele Reihen genügen, n an zu betrachten, %
um Aussagen über Konvergenz oder Divergenz zu treffen. lim n |an | = 1 keine Aussage,
n→∞ ⎪

> 1 Divergenz.
Wurzelkriterium
In dieser Formulierung mit einem Grenzwert wird das Wur-
Erfüllt eine Folge (an ) aus C die Bedingung
zelkriterium aber am häufigsten verwendet.
%
lim sup n |an | < 1 ,
n→∞ Beispiel

∞  Wir untersuchen die Reihe
so konvergiert
√ die Reihe n=1 an absolut. Ist dagegen ∞ ' (
die Folge ( |an |) unbeschränkt oder gilt
n ! 1 1 n
−√
% 3
n=1
n
lim sup n |an | > 1 ,
n→∞ auf Konvergenz. Das Wurzelkriterium liefert
so divergiert die Reihe. Im Falle 1) ) ) )
% n )) 1 1 )n ) 1 1 ) 1
% n
|an | = ) − √ )) = )) − √ )) → (n → ∞).
lim sup n |an | = 1 3 n 3 n 3
n→∞
Der Grenzwert ist kleiner als 1, diese Reihe ist also absolut
ist keine Aussage möglich. konvergent.
Nun untersuchen wir die Reihe
Kommentar: Wie wir im Beweis gleich sehen werden, !∞ ' ( 2
1 n
reicht für die 1+
√ Divergenz der Reihe die schwächere Bedin- n
gung, dass n |an | ≥ 1 für unendlich viele n ist. n=1

auf Konvergenz:
? 1
' ( 2 ' (
Für eine Reihe ( ∞n=1 an ), eine Zahl q < 1 und ein n0 ∈ N
%n n 1 n 1 n
|an | = 1+ = 1+ →e (n → ∞).
gilt % n n
n
|an | ≤ q, n ≥ n0 .
Hier ist der Grenzwert größer als 1, die Reihe ist divergent.
Ist diese Reihe absolut konvergent? Welche Aussage können wir mit dem Wurzelkriterium
über die allgemeine harmonische Reihe treffen? Es gilt
1) ) ' (
√ ) )
Beweis: Ist lim sup n |a n| < 1, so gibt es ein q < 1 und n ) 1 ) 1 α
n→∞ ) nα ) = √
n n −→ 1α = 1 (n → ∞)
ein N ∈ N mit
%
n für alle α > √0. Wir haben also stets den Fall vorliegen,
|an | ≤ q für alle n ≥ N .
dass lim sup n |an | = 1 ist. Im Fall α ≤ 1 divergiert die
n→∞
Nach unseren
 ∞ Vorüberlegungen
 ist also die geometrische allgemeine harmonische Reihe, im Fall α > 1 konver-
Reihe q n eine konvergente Majorante der Reihe
 ∞ 
n=0 giert sie. Somit sehen wir an diesem Beispiel, das im Fall
n=1 |an | . Hieraus folgt die absolute Konvergenz der „gleich 1“ mit dem Wurzelkriterium keine Aussage über
Reihe über die an . Konvergenz und Divergenz möglich ist. 

Ist lim sup n |an | > 1, so gibt es eine Teilfolge und somit √
n→∞ √ Nicht immer ist man in der Situation, dass die Folge ( n |an |)
unendlich viele Folgenglieder mit n |an | ≥ 1. Für diese gilt konvergiert. Dann muss der größte Häufungspunkt – so er
dann auch |an | ≥ 1, folglich bildet (an ) keine Nullfolge. denn existiert – auf anderem Wege gefunden werden. Wir
Daher divergiert die Reihe über die (an ). sehen uns auch dazu einige Beispiele an.
10.4 Kriterien für absolute Konvergenz 371

Beispiel Quotientenkriterium
Untersuchen wir etwa die Reihe
Wir betrachten eine Folge (an ) aus C\{0}. Gibt es Zahlen
∞ ' ( 2
! (−1)n n q < 1 und N ∈ N mit
1+ ) )
n ) an+1 )
n=1 ) )
) a ) ≤ q für alle n ≥ N,
n
auf Konvergenz. Durch das wechselnde Vorzeichen erhal-
 ∞ 
ten wir für gerade und ungerade n jeweils unterschiedliche so konvergiert die Reihe n=1 an absolut. Gibt es da-
Ergebnisse: gegen ein N ∈ N mit
⎧ n ) )
% ⎨ 1 + 1 , wenn n gerade, ) an+1 )
) )
|an | =  n ) a ) ≥ 1 für alle n ≥ N,
n n
⎩ 1 − 1 , wenn n ungerade. n
n
so divergiert die Reihe.
Damit erhalten wir
' (2k
% 1
lim |a2k | = lim
2k
1+ = e. Beweis: Wir betrachten zunächst den Fall q < 1 und N ∈ N
k→∞ k→∞ 2k mit ) )
) an+1 )
) )
Es gibt also einen Häufungspunkt, der größer ist als 1. ) a ) ≤ q für alle n ≥ N.
Nach dem Wurzelkriterium divergiert die Reihe. n
Bei der Reihe Damit gilt auch, dass für beliebige n > N
∞  |an | |aN +1 | |aN +2 | |an |
! 1 + (1 + i)n = · ··· ≤ q n−N
|aN | |aN | |aN +1 | |an−1 |
2n
n=0
ist. Demnach ist
|aN | n
können wir den Betrag des Zählers abschätzen durch |an | ≤ q ,
qN
|1 + (1 + i)n | ≤ 1 + 2n/2 ≤ 2(n/2)+1 . und man hat eine geometrische Reihe als konvergente Majo-
rante gefunden.
Somit ist
1) 1 Gibt es dagegen ein N ∈ N mit
) √ √ ) )
) n)
n ) 1 + (1 + i) ) n 2(n/2)+1 √
n 2 2 ) an+1 )
≤ = 2 → ) )
) 2n ) 2n 2 2 ) a ) ≥ 1 für alle n ≥ N,
n

für n → ∞. Es folgt: so folgt |an+1 | ≥ |an | ≥ · · · ≥ |aN | für n ≥ N. Die Folge


1) (|an |)∞
n=N ist also monoton wachsend und durch |aN | > 0
) √
) n)
n ) 1 + (1 + i) ) 2 nach unten beschränkt. Hieraus folgt, dass (an ) keine Null-
lim sup ) n ) ≤ < 1. folge ist, die Reihe über die an divergiert also. 
n→∞ 2 2

Die Reihe konvergiert nach dem Wurzelkriterium. 


Auch die Voraussetzungen im Quotientenkriterium sind be-
sonders leicht zu überprüfen, falls die Folge (|an+1 /an |) kon-
Diese Beispiele illustrieren auch schon, in welchen Fällen
vergiert. Ist der Grenzwert kleiner als 1, so ist die Bedingung
das Wurzelkriterium besonders praktisch ist, nämlich dann,
für Konvergenz erfüllt, ist er größer als 1, so liegt Divergenz
wenn die Reihenglieder an einen Exponenten wie n oder
vor. Ist der Grenzwert gleich 1, so ist im Allgemeinen keiner
n2 beinhalten und daher beim Ziehen der n-ten Wurzel eine
der beiden Fälle des Quotientenkriteriums erfüllt. Auch hier
einfachere Gestalt erhalten.
ist die allgemeine harmonische Reihe ein Beispiel, das zeigt,
Ist das nicht der Fall, so kann oft das zweite wichtige Kri- dass in diesem Fall sowohl Konvergenz als auch Divergenz
terium dieses Abschnitts weiterhelfen, das Quotientenkrite- möglich ist. Wieder gibt es zusammenfassend eine knappe
rium. und einprägsame Schreibweise:

) ) ⎪< 1 absolute Konvergenz,
) an+1 ) ⎨
Das Quotientenkriterium ist noch einfacher lim ) ) = 1 keine Aussage,
n→∞ ) an ) ⎪ ⎩
anzuwenden als das Wurzelkriterium > 1 Divergenz.

Das Ziehen von n-ten Wurzeln kann gelegentlich ein wenig Aufgrund der Leichtigkeit in seiner Handhabung ist das Quo-
mühsam sein. Stattdessen kann es ausreichen, den Betrag des tientenkriterium das wahrscheinlich beliebteste Konvergenz-
Quotienten zweier aufeinanderfolgender Glieder |an+1 /an | kriterium für Reihen überhaupt – es ist jenes, das man im
zu betrachten. Normalfall als erstes einmal versucht.
372 10 Reihen – Summieren bis zum Letzten

Übersicht: Konvergenzkriterien für Reihen


In dieser Übersicht sind die wichtigsten Konvergenzkriterien kurz zusammengefasst. Zusätzlich wollen wir noch eine kleine
Orientierungshilfe geben, wann welches Kriterium am ehesten einen Versuch wert ist.

Für die Kurzvorstellung


 ∞ der Kriterien betrachten wir eine Verdichtungskriterium
Reihe der Form n=0 an mit Reihengliedern an ∈ C. Anwendungen: Eine der Reihen
Quotientenkriterium   ∞ 

! !
Anwendungen: Reihenglieder mit Fakultäten, Binomial- k
an und 2 a2 k
koeffizienten oder Potenzen.
n=0 k=0

) )
) an+1 ) ⎨ ≤ q < 1 absolute Konvergenz,
) ) ist eine geometrische.
) a ) . . . ⎩ ≥ 1 Divergenz, Voraussetzungen: (an ) ist monoton fallende Nullfolge.
n sonst keine Aussage.
Dann haben die Reihen das gleiche Konvergenzverhalten.
Wurzelkriterium
Anwendungen: Reihenglieder sind Potenzausdrücke mit Leibniz-Kriterium
Exponenten wie n oder n2 . Anwendungen: Alternierende Reihen.
Voraussetzung: Die Reihenglieder haben die Form
⎧ (−1)n an mit einer monoton fallenden Nullfolge (an ).
% ⎨ < 1 absolute Konvergenz, Eine Reihe dieser Form konvergiert.
lim sup n |an | . . . = 1 keine Aussage,
n→∞ ⎩
> 1 Divergenz. Nullfolgenkriterium
Damit die Reihe überhaupt konvergieren kann, muss
Grenzwertkriterium an → 0 (n → ∞) gelten.
Anwendungen: Reihenglieder sind als rationaler Ausdruck
in n gegeben. Fahrplan für die Kriterien
Voraussetzungen: an , bn reell und positiv. Das folgende Diagramm enthält einen Fahrplan für das
an Ausprobieren der Kriterien.
Betrachte lim .
n→∞ bn

Grenzwert existiert und ist > 0: Die Reihen Nullfolgenkriterium


∞  ∞ 
! !
an und bn
n=0 n=0 Quotientenkriterium
Wurzelkriterium
haben das gleiche Konvergenzverhalten.
Grenzwert existiert und ist = 0:
   
∞ ∞
bn konvergiert $⇒ an konvergiert. Hat die Reihe
n=0 n=0 besondere Eigen-
schaften?
Grenzwert ist unendlich:
    rational in n alternierend
∞ ∞
nein

bn divergiert $⇒ an divergiert.
n=0 n=0
Grenzwertkriterium Leibniz-Kriterium
Majoranten-/Minorantenkriterium
Anwendungen: Vergleich mit einfacher bekannter Reihe
ist möglich. Majoranten-/
Minorantenkriterium
Voraussetzungen: bn reell mit 0 ≤ |an | ≤ bn für alle
Verdichtungskriterium
n ≥ n0 .
   
∞ ∞
bn konvergiert $⇒ an konv. abs. weiterführende Kriterien
n=0 n=0
    anderere Methoden
∞ ∞
|an | divergiert $⇒ bn divergiert.
n=0 n=0
10.4 Kriterien für absolute Konvergenz 373

Beispiel Achtung: Vor einem sehr verbreiteten Fehler bei der Hand-
Wir wissen bereits, dass die Reihe habung beider Kriterien wollen wir hier ganz ausdrücklich
  warnen. In den Kriterien wurde verlangt, dass der Grenzwert
∞ n
! für n → ∞ von
2
n! %
n |an+1 |
n=1 |an | bzw.
|an |
absolut konvergiert, ihr Reihenwert ist e2 . Liefert auch das existiert und für Konvergenz echt kleiner bzw. für Divergenz
Quotientenkriterium die Aussage über die Konvergenz? echt größer als eins ist. Es genügt zum Feststellen der Kon-
n
Dazu bilden wir mit an = 2n ! : vergenz nicht, dass
) ) ' n (−1 % |an+1 |
) an+1 ) n+1 2n+1 n!
)= 2 2 n
) · = · n |an | < 1 bzw. <1
) a ) (n + 1) ! n! (n + 1) ! 2 |an |
n
2 · 2n n! 2 für alle n ab einem bestimmten Index ist.
= · = → 0 < 1.
(n + 1) · n ! 2n n+1

Die Reihe konvergiert demnach absolut. ?


Weiter untersuchen wir die Reihe Untersuchen Sie eine bedingt konvergente Reihe Ihrer Wahl
∞  mit Wurzel- und Quotientenkriterium. Welches Ergebnis er-
! nn warten Sie?
2n n!
n=1

auf Konvergenz:
Wurzel- und Quotientenkriterium sind nahe
) ) verwandt
) an+1 )
) = (n + 1) 2n n !
n+1
) · =
) a ) 2n+1 (n + 1)! nn
n
Sowohl Wurzel- als auch Quotientenkriterium erhält man aus
(n + 1) (n + 1)n 2n n ! (n + 1)n
= = = dem Vergleich mit einer geometrischen Reihe. Die Vermu-
2 · 2 (n + 1) n ! n
n n 2 nn
' ( ' ( tung, dass es zwischen den beiden Kriterien gewisse Zusam-
1 1+n n 1 1 n e menhänge gibt, ist naheliegend und richtig.
= = 1+ → > 1.
2 n 2 n 2
Von den beiden ist das Wurzelkriterium das stärkere, weil
Diese Reihe divergiert also. es auch für Fälle, in denen das Quotientenkriterium keine
Betrachten wir die Reihe Entscheidung bringt, noch manchmal Aussagen ) erlaubt. ) Das
gilt allerdings )nur, wenn) der Grenzwert von )an+1 /an ) nicht
∞ 
! 3 + (−1)n existiert. Falls )an+1 /an ) → 1 (n → ∞) gilt, so liefern beide
. Kriterien keine Aussage.
5n
n=0
Das sieht man so: Zu jedem ε > 0 gibt es dann ein N ∈ N
Wir müssen gerade und ungerade n unterscheiden: mit ) )
) an+1 )
1 − ε ≤ )) ) ≤ 1+ε, n ≥ N .
a2k+1 3 + (−1)2k+1 52k 2 1 1 an )
= · = · = .
a2k 52k+1 3 + (−1)2k 5 4 10 Wie im Beweis des Quotientenkriteriums folgert man daraus
3 + (−1)2k 52k−1 ) )
a2k
= ·
4 1 2
= · = . ) an )
a2k−1 52k 3 + (−1)2k−1 5 2 5 (1 − ε)N −n ≤ )) )) ≤ (1 + ε)N −n , n ≥ N ,
aN
In beiden Fällen gilt: und hieraus
) ) 1 1
) an+1 ) 2 |a | % |aN |
) ) (1−ε) n
N
≤ n |an | ≤ (1+ε) n n ≥ N.
) a ) ≤ 5 < 1, (1 − ε)N (1 + ε)N
n

die Reihe konvergiert also absolut.  Jetzt lässt man zunächst n gegen unendlich
√ und danach ε
gegen null gehen und erhält, dass auch n |an | → 1 gilt.
Generell ist das Auftreten von Fakultäten in den Reihenglie- Ferner gilt: Macht das Wurzelkriterium keine Aussage, so ist
dern ein fast sicheres Zeichen dafür, dass man das Quotien- dies auch sicher für das Quotientenkriterium der Fall. Macht
tenkriterium benutzen sollte. Auch Potenzen kürzen sich, wie jedoch das Quotientenkriterium
) ) keine Aussage und existiert
man auch an den Beispielen oben sieht, auf saubere Weise. der Grenzwert von )an+1 /an ) nicht, so ist es in manchen
374 10 Reihen – Summieren bis zum Letzten

Beispiel: Anwendung der Kriterien für absolute Konvergenz


Es soll gezeigt werden, dass die Reihe

  ⎪ −1
∞ ⎪
⎨ n n gerade,
! 2
an mit an =


n=0 ⎩1 n ungerade.
4n
absolut konvergiert, und ihr Reihenwert soll berechnet werden.

Problemanalyse und Strategie: Es gibt verschiedene Möglichkeiten die absolute Konvergenz nachzuweisen, allen
voran das Quotienten- und das Wurzelkriterium. Man muss ausprobieren, welches Kriterium im konkreten Fall geeignet
ist bzw. funktioniert. Die Berechnung des Reihenwerts kann wegen der absoluten Konvergenz durch eine Umordnung
der Reihenglieder erfolgen.

Lösung: Eine andere Möglichkeit, die absolute Konvergenz zu zei-


Für das Quotientenkriterium erhalten wir für gerades n gen, bietet übrigens das Majorantenkriterium. Es gilt ja
) ) stets: ' (n
) an+1 ) 1 2n
) ) 1
) a ) = 4n+1 · 1 |an | ≤ ,
n 2
2n
= 2n+2 also ist
2 ∞
! ∞ ' (n
! 1
1 1 |an | ≤ = 2.
= n+2 ≤ < 1. 2
2 2 n=0 n=0

Allerdings gilt für ungerades n Da die Reihe absolut konvergiert, darf man die Summan-
) ) ) ) den umtauschen. Z. B. kann man eine Reihe bilden, die
) an+1 ) ) 1 4n ))
) )=) · nur die Glieder für gerades n und eine, die nur die Glieder
) a ) ) 2n+1 1 )
n für ungerades n umfasst. Damit ist
= 2n−1 > 1.

! ∞
! ∞
!
1 −1
Also kann das Quotientenkriterium nicht angewandt wer- an = + =
42n+1 22n
den. n=0 n=0 n=0

! !∞
Mit dem Wurzelkriterium erhält man für gerades n 1 1 1
= − =
4 16n 4n
% 1 n=0 n=0
n
|an | = 1 1 1
2 = · − =
4 1− 1 1
und für ungerades n 16 1− 4
4 4 16
% 1 1 = − =− .
n
|an | = ≤ . 15 3 15
4 2
Da 1/2 < 1, ist das Wurzelkriterium anwendbar: Die
Reihe konvergiert absolut.

Fällen möglich, mit dem Wurzelkriterium die Konvergenz |a2k+1 | 2 + (−1)2k+1 22k−1
= · =
einer Reihe nachzuweisen. Es folgt ein Beispiel für solch |a2k | 22k 2 + (−1)2k
einen Fall.
2−1 22k−1 2
= · = .
Beispiel Untersuchen wir die Reihen 2·2 2k−1 2+1 3
∞ 
! 2 + (−1)n |a2k | 2 + (−1)2k 22k−2
= · =
2n−1 |a2k−1 | 22k−1 2 + (−1)2k−1
n=1
2+1 22k−2 3
auf Konvergenz, zunächst mit dem Quotientenkriterium. Das = · = .
wechselnde Vorzeichen im Zähler sorgt dafür, dass der Quo- 2·2 2k−2 2−1 2
tient für gerade und ungerade n unterschiedlich aussieht:
10.4 Kriterien für absolute Konvergenz 375

Der Grenzwert der Quotienten existiert nicht, und auch mit konvergent. Es ist aber
der allgemeinen Version des Quotientenkriteriums erhalten
wir keine Aussage.
(1 − β) |an | = (n − 1) |an | − (n − β) |an |
Benutzen wir nun das Wurzelkriterium:
≤ (n − 1) |an | − n |an+1 |
. √
%
n n 2 + (−1)
n n
2 + (−1)n 1
|an | = n−1
= n−1
→ ,
2 2 n 2
für n ≥ N . Da β > 1 vorausgesetzt ist, ist die Teleskopreihe
√ √ bis auf den Faktor 1 − β eine konvergente Majorante der
weil ja n 3 → 1 ebenso wie n 1 → 1 gilt. Die Reihe ist also
konvergent, was auch durch einen Vergleich mit der geome- Reihe über |an |.
trischen Reihe ∞ 
! 3 Im zweiten Fall ist n an+1 ≥ (n − 1) an > 0 für n ≥ N , d. h.,
die Folge (nan+1 ) ist eine wachsende Folge. Somit gibt es
2n−1
n=1 ein c > 0 mit
ersichtlich ist. 
c
an+1 ≥ ,n ≥ N .
Dass das Quotientenkriterium trotz dieser Einschränkungen n
meist als erstes angewandt wird, liegt an seiner einfachen
Handhabbarkeit. Das Quotientenkriterium ist recht schnell
Somit ist die harmonische Reihe eine divergente Minorante
angewandt, und oft gelangt man bereits auf diesem Weg zu
der Reihe über die an . 
einer eindeutigen Aussage über Konvergenz oder Divergenz.

Es gibt noch weitere Konvergenzkriterien Weitere Kriterien


 befassen sich
 mit der Konvergenz von Rei-

hen der Form n=1 an bn mit geeigneten Voraussetzun-
Neben den Konvergenzkriterien, die wir bisher in diesem Ka- gen an die Folgen (an ) und (bn ). Zwei dieser Kriterien, das
pitel vorgestellt haben, gibt es noch weitere, die in der Praxis Abel’sche Kriterium und das Dirichlet’sche Kriterium haben
meist nur eine untergeordnete Rolle spielen. So kann man wir als Aufgabe 10.15 formuliert.
zum Beispiel das Quotientenkriterium noch verfeinern und
erhält dann den folgenden Satz. Für zwei Folgen (an ) und (bn ) erhalten wir durch Anwen-
dung der sogenannten Cauchy-Schwarz’schen Ungleichung
Satz (Kriterium von Raabe)
Ist (an ) eine Folge aus C \ {0}, und gibt es ein β > 1  1/2  1/2
und ein N ∈ N mit !
N !
N !
N
2 2
|an bn | ≤ |an | |bn |
) )
) an+1 ) β n=1 n=1 n=1
) )
) a )≤1− n , n ≥ N,
n

so konvergiert die Reihe über die an absolut. Sind alle an für jedes N ∈ N. Die Cauchy-Schwarz’sche-Ungleichung
reell und positiv, und gibt es ein N ∈ N mit ergibt sich aus Überlegungen zu Skalarprodukten in der Li-
nearen Algebra. Wir werden sie im Abschnitt 17.2 beweisen.
an+1 1
≥1− , n ≥ N,  ∞ 
n=1 |an | , so nennt man die Folge
an n Konvergiert die Reihe 2

(an ) quadrat-summierbar. Sind (an ) und (bn ) quadrat-


so divergiert die Reihe. summierbar, so ergibt sich, indem wir nun N gegen unendlich
streben lassen, aus obiger Abschätzung das Kriterium, dass
Beweis: Im ersten Fall schreiben wir die Voraussetzung die Reihe über die Produkte an bn absolut konvergiert, falls
um zu (an ) und (bn ) quadrat-summierbar sind.

n |an+1 | ≤ (n − β) |an | , n≥N. Weiterführend lässt sich so auf dem Vektorraum der quadrat-
summierbaren Folgen ein Skalarprodukt definieren. Man er-
Hieraus folgt n |an+1 | < (n − 1) |an |, n ≥ N, d. h., die Folge hält damit den Hilbert-Raum 2 , der in der Funktionalanaly-
(n |an+1 |)∞
n=N ist monoton fallend. Zudem ist sie durch null sis eine wichtige Rolle spielt.
nach unten beschränkt und konvergiert daher. Somit ist die
Teleskopreihe Schließlich gibt es auch einen engen Zusammenhang zwi-
∞ schen der Konvergenz von Reihen und der Integration von
! * + * +
(n − 1) |an | − n |an+1 | = lim −n |an+1 | . Funktionen über unbeschränkte Intervalle. Dieser wird durch
n=1
n→∞ das Integralkriterium ausgedrückt (siehe Kapitel 16).
376 10 Reihen – Summieren bis zum Letzten

Zusammenfassung

Eine Reihe ist definiert als eine Folge von Partialsummen. Eine spezielle Klasse konvergenter Reihen sind die absolut
Die Reihe konvergiert, wenn es diese Folge tut. Der Grenz- konvergenten Reihen.
wert heißt in diesem Fall Reihenwert. Nur in wenigen Fällen
kann der Reihenwert explizit bestimmt werden, meist ist nur Definition der absoluten Konvergenz
die Aussage möglich, dass die Reihe konvergiert oder diver-
giert. Reihen sind ein wichtiges Hilfsmittel in der Analysis
Ist
 ∞  Folge in C und konvergiert
(an ) eine  ∞ die Reihe
und dienen zum Beispiel zur Definition der Standardfunktio- n=1 |an | , so nennen wir die Reihe n=1 an abso-
lut konvergent.
nen wie den trigonometrischen oder hyperbolischen Funk-
tionen oder der Exponentialfunktion (siehe Kapitel 11).
Für solche Reihen gelten viele Eigenschaften, die von ge-
Wichtige Beispiele für Reihen sind etwa die geometrische wöhnlichen Summen her vertraut sind. So gilt die Dreiecks-
Reihe und die harmonische Reihe, ungleichung und man kann die Glieder solcher Reihen nach
∞  ∞  dem Riemann’schen Umordnungssatz in beliebiger Rei-
! !1 henfolge aufsummieren, ohne dass sich der Reihenwert än-
n
q bzw. .
n dert. Für das Produkt zweier absolut konvergenter Reihen
n=0 n=1
gibt es mit dem Cauchy-Produkt eine einfache Darstellung.
Diese werden in vielen Beispielen und Abschätzungen im- Für die Feststellung absoluter Konvergenz gibt es besonders
mer wieder verwendet. Auch die Dezimaldarstellung reeller einprägsame Kriterien.
Zahlen lässt sich auf eine Darstellung dieser Zahlen als Reihe
einer bestimmten Form zurückführen.
Wurzelkriterium
Bei der Analyse von Reihen sind Konvergenzkriterien von Erfüllt eine Folge (an ) aus C die Bedingung
zentraler Bedeutung. Sie dienen als Hilfsmittel, um durch %
Überprüfung einfacher Voraussetzungen schnell festzustel- lim sup n |an | < 1 ,
n→∞
len, ob eine Reihe konvergiert oder divergiert. Das einfachste  ∞ 
von ihnen ist das Nullfolgenkriterium, welches besagt, dass so konvergiert
√ die Reihe n=1 an absolut. Ist dagegen
die Glieder jeder konvergenten Reihe eine Nullfolge bilden. die Folge ( n |an |) unbeschränkt oder gilt
%
Das grundlegendste Kriterium zur Feststellung von Konver- lim sup n |an | > 1 ,
genz ist das Majorantenkriterium. n→∞

so divergiert die Reihe. Im Falle


%
Das Majoranten-/Minorantenkriterium lim sup n |an | = 1
 ∞  n→∞
Für eine Reihe n=0 an mit an ∈ R≥0 gelten folgende
Konvergenzaussagen: ist keine Aussage möglich.
Gibt es eine Folge (bn ) mit an ≤ bn für alle n ≥ n0 ,
und konvergiertdie Reihe  ∞ n=0 bn , so konvergiert
∞ Quotientenkriterium
auch die Reihe n=0 an .  ∞ 
Gibt es eine divergente Reihe n=0 bn mit Wir betrachten eine Folge (an ) aus C\{0}. Gibt es Zahlen
0 ≤ bn ≤ an für alle n ≥ n , so divergiert auch q < 1 und N ∈ N mit
∞  0
) )
die Reihe n=0 an . ) an+1 )
) )
) a ) ≤ q für alle n ≥ N,
n
Hieraus lassen sich wieder andere Kriterien, wie zum Bei-  ∞ 
so konvergiert die Reihe n=1 an absolut. Gibt es da-
spiel das Grenzwertkriterium ableiten. Die Aussage, dass
gegen ein N ∈ N mit
eine Reihe genau dann konvergiert, wenn die Folge ihrer ) )
Partialsummen eine Cauchy-Folge ist, macht das Cauchy- ) an+1 )
) )
Kriterium. ) a ) ≥ 1 für alle n ≥ N,
n
 
∞ 1
Die verallgemeinerte harmonische Reihe n=1 nα lässt so divergiert die Reihe.
sich über das Verdichtungskriterium analysieren. Hier-
durch ist ein Vergleich mit der geometrischen Reihe möglich, Allerdings treffen diese Kriterien nur die grobe Unterschei-
wodurch über Konvergenz entschieden kann. Es ergibt sich dung zwischen absoluter Konvergenz und Divergenz. Für
Konvergenz genau dann, wenn α > 1 gilt. Für alternierende Reihen, die nur bedingt konvergieren, machen sie keine Aus-
Reihen gibt es schließlich das Leibniz-Kriterium. sage.
Aufgaben 377

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 10.6 • Zeigen Sie, dass die folgenden Reihen konver-


gieren und berechnen Sie ihren Wert:
10.1 • Ist es möglich, eine divergente Reihe der Form ∞ '
! 1 (
1

! (a) √ −√
(−1)n an n=1
n n+1
∞ ' ( 
n=1 ! 3 + 4i n
(b)
zu konstruieren, wobei alle an > 0 sind und an → 0 gilt. n=1
6
Beispiel oder Gegenbeweis angeben.
10.7 •• Zeigen Sie, dass die folgenden Reihen absolut
10.2 ••• Welche Teilmenge von R wird dadurch charak- konvergieren:
terisiert, dass ihre Elemente g-adische Entwicklungen ha- ∞ 
! 2 + (−1)n
ben, die ab irgendeinem Index m periodisch sind (d.h. es gilt (a)
aj +k = aj für ein 2n−1
 k ∈ N und alle j ≥ m in einer Entwicklung n=1
∞ −j ∞ ' ( 
j =1 aj g )? ! 1 n
n1 1
(b) (−1) +
n 3 n
10.3 • Kann man die Reihe n=1
∞ ' ( 
∞  ! 4n −1
! (−1)n+1 (c)
3n
n=1
n
n=1
10.8 • Untersuchen Sie die Reihe
so umordnen, dass die umgeordnete Reihe divergiert? ∞ 
! 1 · 3 · 5 · . . . · (2n + 3)
10.4 •• Zeigen Sie dass, dass die Reihe n!
n=1
∞ 
! (−1)n+1 auf Konvergenz.

n
n=1
Achtung: In den folgenden vier Aufgaben kommen der na-
zwar konvergiert, ihr Cauchy-Produkt mit sich selbst aller- türliche Logarithmus und trigonometrische Funktionen vor,
dings divergiert. Warum ist das möglich? die erst im Kapitel 11 definiert werden. Da solche Aufgaben
aber insbesondere als Klausuraufgaben oft gestellt werden,
haben wir sie hier mit aufgenommen. Die Aufgaben sind mit
Rechenaufgaben elementaren Kenntnissen über diese Funktionen, wie sie in
10.5 • Sind die folgenden Reihen konvergent? der Schule vermittelt werden, lösbar.
∞ 
! 1
(a) 10.9 •• Stellen Sie fest, ob die folgenden Reihen kon-
n + n2 vergieren.
n=1
∞  ∞ 
! 3n ! 1
(b) (a) , α>0
n3 k (ln k)α
n=1
∞ B ' ( C ∞
k=2

! 1 n ! 1
n
(c) (−1) e − 1 + (b)
n (ln k)ln k
n=1 k=2
378 10 Reihen – Summieren bis zum Letzten

10.10 •• Stellen Sie fest, ob die folgenden Reihen di-


vergieren, konvergieren oder sogar absolut konvergieren:
∞ ' ( 
! 2n
−3n−1
(a) 2
n
n=1
∞ 
! n · (√n + 1)
(b) Abbildung 10.16 Die ersten drei Iterationen bei der Konstruktion der
n2 + 5n − 1
n=1 Koch’schen Schneeflocke.
∞ √ 
!
n sin n
(c) (−1)
n5/2 Bestimmen Sie den Umfang und den Flächeninhalt der
n=1
Koch’schen Schneeflocke.

10.11 •• Zeigen Sie, dass die folgenden Reihen konver-


gieren. Konvergieren sie auch absolut? Beweisaufgaben
∞ √  10.14 • Gegeben ist eine Folge (an ) mit Gliedern an ∈
!
k k+2 k {0, 1, 2, . . . , 9}. Zeigen Sie, dass die Reihe
(a) (−1) 2
k + 4k + 3 ∞ 
! ' 1 (n
k=1
∞ 2 3
! (−1)k cos(kπ) an
(b) − 10
k+3 k+2 n=0
k=1
konvergiert.

10.12 •• Bestimmen Sie die Menge M aller x ∈ I , für


10.15 •• Gegeben sind zwei Folgen (an ) und (bn ) aus
die die Reihen
C.
∞ 
! (a) Zeigen Sie: Für alle n ∈ N gilt:
n
(a) (sin 2x) I = (−π, π ),
n=0
  !
n !
n
!∞  n aj bj = bn+1 aj
(b) x2 − 4 I = R, j =1 j =1
n=0
 ∞
 !
n !
k
! nx + 1 + (bk − bk+1 ) aj .
(c) I = (0, ∞)
n + n2 + n + 1
3 k=1 j =1
n=0

konvergieren. (b) Beweisen Sie das Abel’sche


 Konvergenzkriterium: Kon-

vergiert n=1 a n , und ist (bn ) monoton und be-
10.13 •• Unter einer Koch’schen Schneeflocke versteht schränkt
 ∞ (insbesondere
 also reell), so konvergiert auch
man eine Menge, die von einer Kurve eingeschlossen wird, n=1 an bn .
(c) Beweisen Sie das Dirichlet’sche Konvergenzkriterium:
die durch den folgenden iterativen Prozess entsteht: Ausge-  N 
hend von einem gleichseitigen Dreieck der Kantenlänge 1 Ist die Folge der Partialsummen n=1 an N be-
schränkt, und ist (bn ) aus R und  konvergiert  monoton

1 gegen null, so konvergiert auch n=1 an bn .
 ∞ 
10.16 •• Eine Reihe k=1 ak heißt Cesàro-sum-
mierbar, falls die Folge der Mittelwerte aus den ersten n
Partialsummen konvergiert, wenn n gegen unendlich geht,
also der Grenzwert
1 1
1 !!
n m
3 3
C = lim ak
1 1 n→∞ n
3 3 m=1 k=1

Abbildung 10.15 In jedem Iterationsschritt wird eine Kante durch den roten existiert. Zeigen Sie:
Streckenzug ersetzt.
(a) Jede konvergente Reihe ist Cesàro-summierbar, und C
wird jede Kante durch den in Abbildung 10.15 gezeigten ist gleich dem
 ∞Reihenwert.
Streckenzug ersetzt. Die Abbildung 10.16 zeigt die ersten (b) Die Reihe k+1 ist Cesàro-summierbar. Be-
k=1 (−1)
drei Iterationen der Kurve. rechnen Sie auch den Wert von C.
Antworten der Selbstfragen 379

 ∞   ∞ 
10.17 •• Sei n=1 an eine konvergente Reihe und u : 10.18 • Ist n=1 an absolut konvergent und (bn )
N → N eine bijektive Abbildung mit folgender Eigenschaft: eine∞ Umordnung
 der Folge (an ), so konvergiert auch

Es gibt ein C ∈ N mit |n − u(n)| ≤ C, n ∈ N. Zeigen Sie, n=1 b n . Zeigen Sie, dass die Reihe n=1 bn sogar

dass die Reihe n=1 au(n) ebenfalls konvergiert und die absolut konvergiert.
Reihenwerte beider Reihen übereinstimmen.

Antworten der Selbstfragen

S. 353 die sogar für alle x ∈ C mit Re (x) > 1/2 gültig ist. Die
Da Methode aus dem Beispiel ist prinzipiell für jedes solche
i + n3 + 2−i x anwendbar. Die Anwendung des Leibniz-Kriteriums be-
in2 + 3n + 2 − i n2 i
lim = lim = = 0 schränkt sich auf reelle x mit x > 1.
n→∞ 2n2 − (1 − 2i) n + 1 n→∞ 2 − 1−2i + 1 2
n 2 n
S. 368  ∞ 
ist, bilden die Glieder der Reihe keine Nullfolge. Die Reihe
Diese Eigenschaft hat nur die Nullreihe k=1 0 , deren
ist demnach divergent.
Glieder alle verschwinden. Das Cauchy-Produkt dieser Reihe
S. 355 mit jeder anderen ergibt wieder die Nullreihe, und diese kon-
Die Partialsummen der Reihe sind Teleskopsummen mit vergiert selbstverständlich.
!
n
 
bk − bk+1 = b1 − bn+1 S. 370 √
k=1 Die Folge ( n |an |)∞n=n0 ist nach Voraussetzung durch q be-
schränkt. Also ist auch jeder Häufungspunkt dieser Folge
für alle n ∈ N. Somit konvergiert die Reihe genau dann, wenn
kleiner oder gleich√q. Für Häufungspunkte% spielen die end-
die Folge (bn ) konvergiert.
lich vielen Glieder 1 |a1 |, . . . , n0 −1 |an0 −1 | aber keine Rolle,
S. 361 daher ist
Ja, dies entspricht ja nur einem Ausklammern eines Faktors %
lim sup n |an | ≤ q < 1 .
−1 aus den Partialsummen und ist daher für die Konvergenz n→∞
der Reihe unerheblich. Wichtig ist nur, dass alle an dasselbe
Vorzeichen haben und dass die Folge eine monotone Null- Die Reihe über die an konvergiert nach dem Wurzelkriterium
folge ist. also absolut.
S. 363 S. 373
Für die Abschätzung der Differenzen s2N +2 − s2N und Wenn die beiden Kriterien eine Konvergenzaussage machen,
s2N +1 − s2N−1 wird von der Monotonie der Folge (an ) Ge- so liegt immer absolute Konvergenz vor. Es ist also zu er-
brauch gemacht. warten, dass bei einer nur bedingt konvergenten Reihe keine
S. 364 Aussage nach diesen beiden Kriterien gemacht werden kann.
Die Reihe für ln(2/3) ist eine alternierende Reihe, die die
Voraussetzungen für die Anwendung des Leibniz-Kriteriums Das Musterbeispiel einer bedingt konvergenten Reihe ist die
erfüllt. Damit erhält man die Abschätzung alternierende harmonische Reihe
) )
) !N
(−1)n ))

! (−1)n
) 1
)ln(2/3) − )≤ , N ∈ N. .
) n 2n ) (N + 1) 2N +1 n=1
n
n=1
Der Faktor im Zähler ist hier etwas kleiner, die Abschätzung
Wir erhalten
also etwas besser. Gegenüber dem Beispiel gewinnen wir
einen zusätzlichen Faktor 2(N + 1) im Nenner. % 1
n
|an | = n√ → 1,
Der Vorteil der Rechnung im Beispiel ist folgendermaßen n
begründet: Es gibt eine allgemeine Darstellung |an+1 | n

= → 1.
! (x − 1)n |an | n+1
ln(x) = ,
n xn
n=1 Beide Kriterien liefern wie erwartet keine Aussage.
Potenzreihen –
Alleskönner unter 11
den Funktionen
Was ist ein Konvergenzradius?
Wie werden Standard-
funktionen im Komplexen
definiert ?
Wo steckt der Zusammenhang
zwischen den trigonome-
trischen Funktionen und
der Exponentialfunktion?

11.1 Definition und Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382


11.2 Die Darstellung von Funktionen durch Potenzreihen . . . . . . . . . 389
11.3 Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
11.4 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
11.5 Der Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
382 11 Potenzreihen – Alleskönner unter den Funktionen

Die bisher in Beispielen betrachteten Funktionen, Polynom- man durch die Werte der Reihe eine Funktion in Abhängigkeit
funktionen, rationale Funktionen und ihre Umkehrungen, sind von x. Die Situation in (11.1) ist allerdings spezieller. Jede
dadurch gekennzeichnet, dass ihre Auswertung durch Lösen der Partialsummen sn der Reihe ist ein Polynom in x, und
algebraischer Gleichungen beschrieben werden kann. Man fasst beim Übergang von der Partialsumme sn−1 zur Partialsumme
all diese Abbildungen zur Klasse der algebraischen Funktionen sn kommt genau ein Term n-ten Grades hinzu. Dies ist die
zusammen. Dem gegenüber steht die Klasse der transzendenten Situation, in der man von einer Potenzreihe spricht.
Funktionen – Funktionen, deren Definition einen Grenzprozess
erfordert. Die wichtigsten Vertreter in dieser Klasse lassen sich Die Abbildung 11.1 zeigt für das Intervall (−1, 1) die Funk-
durch spezielle Reihen, die Potenzreihen, darstellen. tion f und einige der Polynome, die Partialsummen der Rei-
hendarstellung bilden. Man erkennt, dass schon für recht ge-
Neben der Definition solcher Reihen und dem Studium ihres ringe Werte von n die Graphen der Polynome den Graphen
Konvergenzverhaltens wird es in diesem Kapitel vor allem darum der Funktion in der Nähe der Stelle 0 recht gut approxi-
gehen, wie man Funktionen mit ihrer Hilfe darstellt und welche mieren. Weiter weg von der Null hin zum Rand des Inter-
Funktionen durch sie dargestellt werden können. Dabei stoßen valls (−1, 1), in dem die Reihe konvergiert, gibt es auch für
wir auf gute Bekannte, wie die Exponentialfunktion und die n = 10 erhebliche Unterschiede. Diese Frage der Approxi-
trigonometrischen Funktionen. Wir gehen sogar noch einen mation einer Funktion durch Reihen wird im Kapitel 15 über
Schritt weiter. Erst die Potenzreihen liefern uns die Möglichkeit, Differenzierbarkeit wieder eine Rolle spielen und führt dort
diese Funktionen zu definieren. Dabei erlauben wir von Beginn auf die sogenannten Taylorreihen.
an auch komplexe Argumente und werden dadurch einige neue
Ergebnisse über die komplexen Zahlen entdecken. f (x)
1
Potenzreihen sind Alleskönner – so behauptet es unsere Über- 1 + x + x 2 + · · · + x 10
x−1
schrift. Am Ende des Kapitels werden wir das so verstehen, dass 4 1 + x + x2 + x3
sich die bekannten Standardfunktionen durch Potenzreihen dar-
stellen lassen. Dass diese Reihen noch viel mehr können, werden
3 1 + x + x2
wir in den folgenden Kapiteln sehen, wenn durch Differenzie-
ren und Integrieren die funktionalen Zusammenhänge genauer
durchleuchtet werden. Die Potenzreihen sind zentral in der Ana- 2 1+x
lysis und erlauben weitreichende mathematische Aussagen, die
vor allem in der Funktionentheorie zum Tragen kommen.
1

−1  x
11.1 Definition und Grundlagen
−1
Zum Einstieg in das Thema Potenzreihen rekapitulieren wir
Abbildung 11.1 Die Funktion f (x) = 1/(1 − x) und einige ihrer Partialsum-
noch einmal ein Beispiel aus dem Kapitel über Reihen, die men auf dem Intervall (−1, 1). In der Nähe der Null bilden die Partialsummen
geometrische Reihe. Wir wissen, dass für jedes x ∈ C mit gute Approximationen.
|x| < 1 die geometrische Reihe konvergiert, und wir kennen
auch ihren Reihenwert:

! Definition einer Potenzreihe
1
xn = . (11.1) Unter einer Potenzreihe versteht man eine Reihe der
1−x
n=0 Form ∞ 
!
n
Die rechte Seite dieses Ausdrucks ist ein Term, wie wir ihn an (z − z0 ) .
schon oft in den Kapiteln über Funktionen gesehen haben. n=0
Der Ausdruck macht für alle x ∈ C mit x  = 1 Sinn. Wir Hierbei ist z ∈ C ein Parameter, (an ) eine Folge von
haben es also mit einer Funktion f : C=1 → C zu tun, wobei komplexen Koeffizienten, die feste Zahl z0 ∈ C heißt
1
f (x) = 1−x gilt. Entwicklungspunkt.
Die linke Seite in Gleichung (11.1) macht jedoch nur für
|x| < 1 Sinn, also nur für einen Teil des Definitionsbereichs
Neu hinzugekommen ist bei der Definition der Entwicklungs-
der Funktion. Für diese Teilmenge des Definitionsbereichs
punkt z0 . Er erlaubt es, eine Potenzreihe an den verschiede-
haben wir eine andere Abbildungsvorschrift für die Funktion
nen Stellen der komplexen Zahlenebene zu lokalisieren. Im
f gefunden, nämlich als Wert einer speziellen Reihe.
Fall z0 = 0 ist natürlich (z − z0 )n = zn . Sofern eine Potenz-
Immer wenn die Reihenglieder einer konvergenten Reihe in reihe für ein z ∈ C konvergiert, hängt dieser Reihenwert von
irgendeiner Form von einem Parameter x abhängen, erhält z ab. Wir erhalten eine Funktion mit z als Argument.
11.1 Definition und Grundlagen 383

? Wert z besitzt. Ist dagegen q > 0, so konvergiert die Potenz-


Welche dieser Reihen sind Potenzreihen? reihe absolut für
∞  ∞ ' ( |z − z0 | <
1
.
! (x − 2)n ! 1 q
n
(a) (c) z + n
2n2 z
n=1 n=0
Ist dagegen |z − z0 | > 1/q, so divergiert die Potenzreihe.
 ∞ n%
  ∞

! 2 1 − y 2 2n ! (x − 1)n
(b) y (d)
n! x 2 − 2x + 1
n=0 n=2
divergent

Eine große Klasse von Potenzreihen kennen wir bereits: Jedes


Polynom lässt sich als eine Potenzreihe auffassen. Es handelt
sich um den speziellen Fall, dass nur endlich viele Koeffizi-

q
1/
enten an von null verschieden sind. Ab einem bestimmten z0
Index ändern sich dann die Partialsummen nicht mehr. Wir
können übrigens zu einer Polynomfunktion eine endliche Po- absolut
tenzreihe um jeden beliebigen Entwicklungspunkt z ∈ C an- konvergent
geben, in dem wir x n = (x − z + z)n = nj=0 zn−j (x − z)j keine Aussage
ersetzen (siehe Seite 309).
Für den Rest dieses Abschnitts werden uns zwei zentrale Abbildung 11.2 Die Potenzreihe konvergiert nach dem Quotientenkriterium
Fragen beschäftigen: für |z − z0 | < 1/q absolut, außerhalb dieses Kreises divergiert sie. Auf der
Kreislinie selbst macht das Kriterium keine Aussage.
Kann man die Menge derjenigen z, für die eine Potenz-
reihe konvergiert, charakterisieren? Man spricht auch vom
Konvergenzbereich der Potenzreihe. Diese Ungleichungen beschreiben genau die Mengen in-
Welche Eigenschaften hat die durch die Reihenwerte auf nerhalb oder außerhalb des Kreises mit z0 als Mittelpunkt
diesem Konvergenzbereich definierte Funktion? und Radius 1/q. Im Innern des Kreises konvergiert die Po-
tenzreihe absolut, außerhalb des Kreises divergiert sie. Auf
der Kreislinie selbst kann die Potenzreihe konvergieren oder
divergieren, zumindest mit dem Quotientenkriterium erhält
Zu jeder Potenzreihe gehört ein man keine Aussage (siehe Abbildung 11.2).
Konvergenzradius
Die Aussage haben wir
) unter
) der Prämisse hergeleitet, dass
)a )
Um die Konvergenz einer Potenzreihe zu untersuchen, be- der Grenzwert lim ) n+1
an ) existiert. Sie gilt ganz allgemein,
n→∞
dient man sich am sinnvollsten genau jener Kriterien, die wir erfordert zum Beweis aber das Wurzelkriterium in seiner all-
schon für allgemeine Reihen entwickelt haben. Beginnen wir gemeinen Form.
mit dem Quotientenkriterium. Zu untersuchen ist der Quo-
tient ) ) )
)a n+1 ) )
) n+1 (z − z0 ) ) )) an+1 )) Der Konvergenzradius einer Potenzreihe
) )= |z − z0 |.
) a (z − z )n ) ) a ) Zu jeder Potenzreihe ∞ n=0 an (z − z0 ) gehört genau
n 0 n n

eine Zahl r ∈ R≥0 ∪ {∞}, die Konvergenzradius ge-


Wir nehmen nun an, dass die Koeffizientenfolge (an ) so be-
nannt wird. Für alle z aus der Kreisscheibe
schaffen ist, dass die Folge der Quotienten (|an+1 /an |) kon-
vergiert, etwa K = {z ∈ C | |z − z0 | < r}
) )
) an+1 )
lim )) ) = q.
n→∞ a ) n konvergiert die Potenzreihe absolut. Für alle z ∈ C mit
|z − z0 | > r divergiert die Reihe. Die Menge K wird
Die Zahl q ist dann auf jeden Fall reell und nicht negativ. Das
Konvergenzkreis der Potenzreihe genannt (siehe Abbil-
Quotientenkriterium besagt, dass die Reihe absolut konver-
dung 11.3).
giert, falls
q |z − z0 | < 1
Man beachte, dass der Satz für Randpunkte, d. h. für z mit
ist. Ist dieser Ausdruck größer als 1, so divergiert die Reihe,
|z − z0 | = r keine Aussage macht. Sowohl Konvergenz als
ist er gleich 1 macht das Kriterium keine Aussage.
auch Divergenz sind möglich. Im Fall r = ∞ konvergiert die
Im einfachsten Fall ist q = 0. Dann ist der Ausdruck q |z−z0 | Potenzreihe für alle z ∈ C, im Fall r = 0 nur im Entwick-
stets gleich null, die Potenzreihe konvergiert, egal welchen lungspunkt z = z0 und hat dort den Wert a0 .
384 11 Potenzreihen – Alleskönner unter den Funktionen

im Komplexen ?
Welche der folgenden Mengen können im Reellen den Kon-
im Reellen vergenzkreis einer Potenzreihe darstellen?
(−2, 2), (0, ∞), {−1}, [1, 3], R.
z0 − r z0 + r r
Überlegen Sie sich jeweils auch den Konvergenzradius und
z0 z0
den Entwicklungspunkt.

Abbildung 11.3 Im Reellen ist der Konvergenzkreis ein Intervall mit dem
Entwicklungspunkt als Mittelpunkt. Im Komplexen ist der Konvergenzkreis auch Zur Bestimmung des Konvergenzradius
geometrisch ein Kreis. behandelt man Potenzreihen am besten wie
gewöhnliche Reihen
Beweis: Wir betrachten die Folge
Um den Konvergenzkreis einer Potenzreihe zu ermitteln, las-
% % sen sich die Kriterien nutzen, die wir im Kapitel über Reihen
n
|an (z − z0 )n | = n |an | |z − z0 |
schon kennengelernt haben.
für n ∈ N und unterscheiden drei Fälle: Beispiel
√ Bei der Potenzreihe
1.√Fall: Die Folge ( n |an |)n∈N ist unbeschränkt. Dann ist auch ∞ 
( |an (z − z0 )n |) unbeschränkt, wenn z  = z0 ist, und die
n ! 2 n! + 1
n
(z − 1)
Reihe divergiert (Seite 353). Also ist der Konvergenzradius n!
n=1
r = 0. Man beachte, dass in diesem Fall die Potenzreihe nur
für z = z0 absolut konvergiert, denn dann sind alle Reihen- bietet es sich an, das Quotientenkriterium anzuwenden.
glieder außer möglicherweise dem allerersten null. Diese Untersuchung ergibt:
) )
) 2 (n + 1)! + 1 n! )
2. Fall: Es gelte für den größten Häufungspunkt: ) · · (z − 1)))
) (n + 1)! 2 n! + 1
% ) )
) 2 (n + 1)! + 1 )
lim sup n
|an | = a > 0. = )) · (z − 1)))
n→∞ (2 n! + 1) (n + 1)
) )
) 2 (n + 1) + 1 )
In diesem Fall ist ) n! )
=) · (z − 1) )
) (2 + 1 ) (n + 1) )
% n!
lim sup n
|an (z − z0 )n | = a |z − z0 | < 1, ) )
)2 + 1 )
n→∞ ) (n+1)! )
=) · (z − 1) )
) (2 + 1 ) )
n!
wenn |z − z0 | < a1 gilt. Nach dem Wurzelkriterium (Seite
→ 1 |z − 1| , n → ∞.
370) konvergiert die Reihe absolut. Andererseits divergiert
die Reihe nach dem Wurzelkriterium, wenn |z − z0 | > a1 ist. Die Potenzreihe konvergiert also absolut für
Also folgt r = a1 für den Konvergenzradius. |z − 1| < 1,
3. Fall: Im letzten Fall nehmen wir an, dass d. h., für alle z in einem Kreis mit Radius 1 und dem Ent-
% wicklungspunkt z0 = 1 als Mittelpunkt. Für alle z mit
lim sup n |an | = 0 |z − 1| > 1 divergiert die Potenzreihe. Der Konvergenz-
n→∞
radius ist r = 1.
ist. Dann erhalten wir für jede Zahl z ∈ C den Grenzwert Die Potenzreihe
∞ 
!
% % n
2 (z − i) n
lim sup n
|an (z − z0 )n | = lim sup n
|an ||z − z0 | = 0 < 1.
n→∞ n→∞ n=0
kann mit dem Wurzelkriterium untersucht werden. Es ist
Insbesondere besagt das Wurzelkriterium, die Reihe konver- %
giert absolut für jedes z ∈ C. 
n
|2n (z − i)n | = 2 |z − i|.
Die Potenzreihe konvergiert nach dem Wurzelkriterium
Häufig werden Potenzreihen nur im Reellen betrachtet. Es absolut für alle z ∈ C mit
sind dann alle Koeffizienten und der Entwicklungspunkt re- 1
|z − i| < .
ell, und man untersucht nur die Konvergenz für z ∈ R. In 2
diesem Fall ist der Konvergenzkreis stets ein symmetrisches Ist |z − i| > 1/2, so divergiert sie. Demnach beträgt der
Intervall mit dem Entwicklungspunkt z0 als Mittelpunkt. Konvergenzradius 1/2. 
11.1 Definition und Grundlagen 385

1
Die im zweiten Fall des Beweises gezeigte Formel r = a, durch Potenzreihen gegebene Funktionen auf Stetigkeit hin
mit % untersuchen. Dazu betrachten wir eine Potenzreihe
a = lim sup n |an | > 0 ∞ 
n→∞ !
n
an z ,
wird als Formel von Hadamard bezeichnet. Eine entspre- n=0
chende, nicht ganz so allgemeine Formel lässt sich auch
aus dem Quotientenkriterium gewinnen. Beiden Formeln ge- die einen Konvergenzradius r > 0 haben soll. Weiterhin wäh-
meinsam ist, dass sie den Konvergenzradius allein aus den len wir eine Stelle ẑ mit |ẑ| < r und eine Folge (zk ) mit
Koeffizienten der Potenzreihe bestimmen, die vordergründig |zk | < r und lim zk = ẑ. Zur Abkürzung setzen wir noch
k→∞
lästige Behandlung des Terms (z − z0 )n entfällt. Allerdings
haben diese Formeln ihre Tücken, die ihre korrekte Hand- ∞
!
habung manchmal schwierig machen. Untersuchen Sie dazu f (z) = an zn , |z| < r.
das folgende Beispiel. n=0

? Wir untersuchen nun die Funktion f an der Stelle ẑ auf Ste-


Bestimmen Sie den Konvergenzradius der Potenzreihe
tigkeit. Dafür müssen wir lim f (zk ) betrachten. Vorsicht ist
∞  k→∞
! 2k geboten: Einerseits haben wir es mit dem Grenzprozess zur
(z − 1)2k , Bestimmung der Reihenwerte zu tun, andererseits mit dem
k2
k=1 Grenzprozess zk → ẑ. Dieses gleichzeitige Auftreten ver-
schiedener Grenzprozesse ist typisch für die Analysis. Es ist
einmal direkt und dann mit der Formel von Hadamard.
eines ihrer Grundprobleme, wann solche Grenzprozesse ver-
tauscht werden dürfen – genau das, was wir hier tun wollen.
Die in der Selbstfrage vorgestellte Reihe, bei der jeder zweite Da wir über das Verhalten der Potenzreihe auf dem Rand des
Koeffizient null ist, ist nicht etwa eine außergewöhnliche Konvergenzkreises ohne explizite Kenntnis der Koeffizien-
Konstruktion. Im Abschnitt 11.4 werden wir uns unter an- ten (an ) nichts aussagen können, stellen wir zunächst sicher,
derem mit Darstellungen der trigonometrischen Funktionen dass wir ein Stückchen davon entfernt sind. Dazu wählen wir
Sinus oder Kosinus als Potenzreihen beschäftigen, welche ρ > 0 mit |ẑ| < ρ < r. Da (zn ) gegen ẑ konvergiert, muss
genau diese Gestalt besitzen. auch |zk | ≤ ρ sein, zumindest für alle k größer oder gleich
Die Formel von Hadamard wird in der Literatur häufig als die einer geeignet gewählten Zahl K ∈ N. Die Situation finden
Methode der Wahl zur Bestimmung der Konvergenzradien Sie in der Abbildung 11.4 veranschaulicht.
dargestellt. Wir empfehlen dagegen, einfach das gewöhnliche
Quotienten- oder Wurzelkriterium für Reihen zu verwenden,
was zweierlei unterstreicht: (zk )

Potenzreihen sind Spezialfälle gewöhnlicher Reihen. Für ẑ


die Methoden zur Untersuchung auf Konvergenz gibt es 0
nichts Neues zu lernen. ρ
Re (z)
Die Kriterien aus dem Kapitel 10 sind allgemeiner Natur
r
und kommen mit Potenzreihen, die nicht in Standardform
vorliegen, besser zurecht.

Eine Potenzreihe definiert eine stetige Abbildung 11.4 Der Punkt ẑ im Inneren des Konvergenzkreises liegt sogar
noch innerhalb des etwas kleineren Kreises mit Radius ρ (grün). Auch die Glieder
Funktion der Folge (zk ), die gegen ẑ konvergiert, liegen ab einem bestimmten Index alle
innerhalb des grünen Kreises.
Als Fazit der bisherigen Untersuchungen können wir festhal-
ten, dass durch eine Potenzreihe eine Funktion definiert ist, Wir wählen nun ein ε > 0. Auch ρ liegt im Konvergenzkreis
deren Definitionsbereich durch das Innere des Konvergenz- der Potenzreihe, die Reihe konvergiert für z = ρ sogar ab-
kreises definiert wird. Die grundlegenden Eigenschaften der solut. Das bedeutet, es gibt insbesondere eine Zahl m ∈ N
so gegebenen Funktionen müssen wir genau untersuchen. mit

!
Wobei das Thema hier keinesfalls abschließend behandeln ε
|an | ρ n < .
werden kann; es wird sich wie ein roter Faden durch die wei- 4
n=m+1
teren Kapitel ziehen, die sich mit Analysis beschäftigen.
Als eine ganz wesentliche Eigenschaft von Funktionen haben Zusammen mit der Dreiecksungleichung für absolut konver-
wir in Kapitel 9 die Stetigkeit kennengelernt. Wir wollen nun gente Reihen können wir so die Differenz zwischen f (zn )
386 11 Potenzreihen – Alleskönner unter den Funktionen

und f (ẑ) abschätzen: Der Abel’sche Grenzwertsatz liefert im


)∞ ) Reellen Stetigkeit bis zum Randpunkt
)! !∞ )
) )
|f (ẑ) − f (zk )| = ) an ẑn − an zkn )
) ) Bisher haben wir den Rand des Konvergenzkreises außer
n=0 n=0
) m )
)! !m ) Acht gelassen. Es stellt sich heraus, dass unterschiedliche
) ) Konvergenzvarianten in Randpunkten z ∈ C mit |z − z0 | = r
≤) an ẑn − an zkn )
) ) und Konvergenzradius r auftreten können. In den Beispielen
n=0 n=0
) ) ) )
) ∞ ) ) ∞ ) auf Seite 388 sind einige Situationen zusammengestellt. Es
) ! ) ) ! )
+ )) an ẑn )) + )) an zkn )) lässt sich keine allgemeine Aussage machen, und es ist erfor-
)n=m+1 ) )n=m+1 ) derlich die Konvergenz der Potenzreihe in den Randpunkten
) m ) im Einzelfall zu untersuchen.
)! !m )
) )
≤) an ẑn − an zkn )
) ) Die Beispiele zeigen, dass in bestimmten Situationen für
n=0 n=0
ẑ ∈ C mit |ẑ − z0 | = r die Potenzreihe konvergiert. Damit

! ∞
! ergibt sich die Frage, welcher Zusammenhang zwischen dem
+ |an | |ẑ|n + |an | |zk |n .
Grenzwert ∞ n=0 an (ẑ − z0 ) und der durch die Potenzreihe
n
n=m+1 n=m+1
im Inneren definierten Funktion f : {z ∈ C | |z − z0 | < r}
Da |ẑ| ≤ ρ und |zk | ≤ ρ, gilt nach der Überlegung von oben, mit f (z) = ∞ n=0 an (z − z0 ) besteht. Betrachten wir nur
n

dass reelle Potenzreihen, so lässt sich zeigen, dass die Funktion f


) m ) stetig in ẑ fortsetzbar ist mit dem entsprechenden Grenzwert.
)! !m ) ε Dies ist die Aussage des Abel’schen Grenzwertsatzes.
) n n)
|f (ẑ) − f (zk )| < ) an ẑ − an zk ) + .
) ) 2
n=0 n=0
Abelscher Grenzwertsatz
Die beiden verbleibenden Summen stellen nun aber Poly- Wenn für eine reelle Potenzreihe
nome dar, und zwar dieselbe Polynomfunktion einmal an ẑ
und einmal an zk ausgewertet. Polynome sind stetig, daher ∞
!
muss auch diese erste Differenz kleiner als ε/2 werden für an (x − x0 )n
alle k ≥ L ∈ N. Es gilt damit: n=0

mit Konvergenzradius r > 0 und Entwicklungspunkt


|f (ẑ) − f (zk )| < ε für k ≥ max{K, L}.
x0 ∈∞R gilt, dass für x̂ ∈ R mit |x̂ − x0 | = r die Reihe
n=0 an ( x̂ − x 0 ) n konvergiert, so ist
Wir rekapitulieren: Zu einem ε > 0 finden wir eine Zahl
N = max{K, L}, sodass |f (ẑ) − f (zk )| < ε für alle k ≥ N. ∞
! ∞
!
Dies gilt für jede beliebige Folge (zk ) im Konvergenzkreis lim an (x − x0 )n = an (x̂ − x0 )n .
x→x̂
der Potenzreihe, die ẑ als Grenzwert besitzt. Also ist f an |x−x0 |<r n=0 n=0
der Stelle ẑ stetig.
Bei dieser Überlegung haben wir den Entwicklungspunkt z0
zu null gesetzt. Wenn man diesen mit in die Überlegung ein-
bezieht, ergeben sich aber keine neuen Schwierigkeiten. Er Beweis:
stellt nur eine Translation der Potenzreihe dar, die auf die (i) Zunächst zeigen wir, dass im Wesentlichen nur der Fall
Frage nach Stetigkeit keinen Einfluss besitzt. Wir haben so- r = 1 und x̂ = 1 betrachtet werden muss. Dies ergibt
mit das folgende Ergebnis bewiesen. sich mit der Variablentransformation x̃ = 1r (x − x0 ), die
den Entwicklungspunkt auf den Ursprung durch x − x0
verschiebt und den Konvergenzradius normiert. Dann ist
Stetigkeit von Potenzreihen

! ∞
!
Durch eine Potenzreihe ist in ihrem Konvergenzkreis
an (x − x0 )n = an r n x̃ n ,
eine stetige Funktion definiert. 
n=0 n=0 :=ã
n

Wir betonen noch einmal, dass die Stetigkeit von Potenzrei-


und die rechte Potenzreihe hat die gewünschten Eigen-
hen Vertauschung von Grenzprozessen bedeutet. Das Resul-
schaften. Wir können somit ohne Einschränkungen vor-
tat kann daher so gelesen werden:
aussetzen r = 1 und x̂ = 1.

! ∞
! (ii) Wir definieren die Partialsummen und den Grenzwert
lim an (z − z0 )n = an ( lim (z − z0 ))n ,
z→ẑ z→ẑ !
j ∞
!
n=0 n=0
sj = an und s = an
sofern zk und ẑ im Inneren des Konvergenzkreises liegen. n=0 n=0
11.1 Definition und Grundlagen 387

Unter der Lupe: Stetigkeit von Potenzreihen und gleichmäßige Konvergenz


Im Beweis zur Stetigkeit von Potenzreihen kommt ein wenig versteckt ein stärkerer Konvergenzbegriff zum Tragen, die
gleichmäßige Konvergenz. Da das Konzept der Gleichmäßigkeit später an verschiedenen Stellen eine wichtige Rolle spielen
wird, schauen wir genauer hin.

Wir gehen den Beweis auf Seite 385 zur Stetigkeit noch gleichzeitig einen festen Wert für m, um den ersten Sum-
einmal durch. Es genügt, einen Entwicklungspunkt z0 = 0 manden zu kontrollieren.
zu betrachten, da die Aussage mit der Transformation
Es ist also im Beweis erforderlich, dass die Reihenreste
z̃ = z−z0 auf diese Situation zurückgeführt werden kann.
unabhängig von den Stellen zk bzw. ẑ abgeschätzt werden
Um Stetigkeit zu zeigen, müssen wir die Differenz können. Zumindest in einer Umgebung U um den Punkt
ẑ muss sich der Index m so wählen lassen, dass für alle

! ∞
! z ∈ U die Abschätzung
|f (ẑ) − f (zk )| = | an ẑn − an zkn |
n=0 n=0 ∞
!
|an ||z|n ≤ ε
gegen den Abstand |ẑ − zk | abschätzen; denn das Einzige,
n=m+1
was wir über die Folge (zk ) voraussetzen können, ist die
Konvergenz gegen ẑ. gilt. Diese Eigenschaft einer Folge von Funktionen nennt
man gleichmäßige Konvergenz, in diesem Fall der Funk-
Wir haben es mit ineinander geschachtelten Grenzwerten ∞
tionenfolgen gn : U → C mit gm (z) = m+1 |an ||z|
n
zu tun. Um letztendlich die beiden Grenzprozesse von-
gegen die Nullfunktion. Anders ausgedrückt: Die Folge
einander zu separieren, wird die Dreiecksungleichung ge-
der Partialsummen fm (z) = m n
n=0 an z konvergiert ab-
nutzt. Die Reihen lassen sich zerlegen in eine endliche
solut und gleichmäßig auf U gegen die Funktion f .
Summe bis zu einem noch frei wählbaren Wert m ∈ N
und den Reihenresten. Wir erhalten mit der Dreiecksun- Um im Beweis diese gleichmäßige Konvergenz zu garan-
gleichung tieren, ist es erforderlich, den Parameter ρ < r einzufüh-
) m ) ren. Denn gleichmäßige Konvergenz lässt sich nur zeigen,
)! !
m )
) ) wenn wir Punkte am Rand ausschließen. Mit ẑ im Inne-
|f (ẑ) − f (zk )| ≤ ) an ẑn − an zkn )
) ) ren des Konvergenzkreises können wir immer einen Wert
n=0 n=0
∞ ∞ ρ > 0 finden, sodass ẑ < ρ < r gilt. Wegen der absoluten
! !
+ |an | |ẑ|n + |an | |zk |n . Konvergenz der Potenzreihen insbesondere an der Stelle
n=m+1 n=m+1 z = ρ lässt sich bei Vorgabe eines Werts ε > 0 stets ein
m ∈ N wählen, sodass für alle z ∈ {z ∈ C : |z| ≤ ρ} die
Damit wir so argumentieren dürfen, muss sichergestellt Abschätzung
sein, dass die beiden Reihen absolut konvergieren. Dies

! ∞
!
gilt aber allgemein für Potenzreihen im Inneren des Kon-
vergenzkreises. |an ||z|n ≤ |an |ρ n ≤ ε
n=m+1 n=m+1
In dieser Abschätzung ist der erste Summand die Diffe-
renz eines Polynoms an den Stellen ẑ und zk . Da Polynome gilt. Mit dieser Zahl m und der Stetigkeit des Polynoms
m n
stetige Funktionen sind, wird deutlich, dass wir diesen Bei- n=0 an z kann der Beweis abgeschlossen werden.
trag bei einem fest gewähltem Grad m mit k → ∞ „klein“ Es wird im präsentierten Beweis noch ε durch ε/4 bzw. ε/2
machen können. ersetzt, damit letztlich die Ungleichung |f (ẑ)−f (zk )| < ε
Wenden wir uns den beiden anderen Termen zu. Es sind elegant aussieht, wie bei der Definition der Stetigkeit.
beides Reihenreste konvergenter Reihen. Ist m nur hinrei- Kommentar: Wir werden dem Konzept der Gleichmäßig-
chend groß, so müssen auch diese Beiträge klein werden. keit noch in vielen verschiedenen Situationen begegnen.
Wo steckt nun das Problem? Es handelt sich um eine wesentliche Schwierigkeit, die zu
Geben wir uns ε > 0 vor, so lässt sich ein m ∈ N wählen berücksichtigen ist, wenn Grenzprozesse vertauscht wer-
mit den sollen. Wir werden später im Kapitel über Integration

! und im Kapitel über Funktionenräume sehen, dass bei Fol-
|an ||zk |n ≤ ε. gen von Funktionen zwischen verschiedenen Konvergenz-
n=m+1 begriffen unterschieden werden muss. Die gleichmäßige
Aber der Wert m hängt von der Stelle zk ab und ändert Konvergenz ist eine dieser Konvergenzarten. Für Potenz-
sich, wenn ein anderes Folgenglied zl betrachtet wird. reihen zumindest haben wir gezeigt, dass auf abgeschlos-
Für die Stetigkeitsabschätzung müssen wir aber unendlich senen und beschränkten Teilmengen des Konvergenzkrei-
viele verschiedene Stellen zk zulassen, und wir benötigen ses gleichmäßige Konvergenz vorliegt.
388 11 Potenzreihen – Alleskönner unter den Funktionen

Beispiel: Auf dem Rand des Konvergenzkreises ist jedes Verhalten möglich
Für welche x ∈ R konvergieren die folgenden Potenzreihen?
∞  ∞   ∞

! (x − 1)n ! n ! (x − 3)n
n
(x − 2)
n n+1 n2 + 1
n=1 n=0 n=0

Problemanalyse und Strategie: Die Konvergenzradien können in allen drei Fällen mit dem Quotientenkriterium
bestimmt werden. Die Fragestellung bedeutet aber, dass nicht nur der Konvergenzradius ermittelt werden muss, sondern
auch eine Untersuchung des Randes des Konvergenzkreises erforderlich ist. Dies muss man separat durchführen. Auf-
grund der Aufgabenstellung müssen wir aber nur reelle Randpunkte untersuchen, nicht die gesamte Kreislinie in der
komplexen Ebene.

Lösung: Nun setzen wir den zweiten Randpunkt für x ein:


Zunächst wollen wir für alle drei Reihen das Quotienten-    

! ∞
!
kriterium anwenden, um den Konvergenzradius zu bestim- (2 − 1)n 1
men. Es gilt: = .
n n
) ) n=1 n=1
) (x − 1)n+1 )
) n ) n
) · )= |x − 1| → |x − 1|,
) n+1 (x − 1) ) n + 1
n Dies ist die harmonische Reihe, von der wir wissen, dass
sie divergiert. Also konvergiert die erste Reihe genau für
) ) x ∈ [0, 2), für alle anderen x ∈ R divergiert sie.
) (n + 1) (x − 2)n+1 n + 1 )) (n + 1)2
)
) · ) = |x − 2|
) n+2 n (x − 2)n ) n (n + 2) Nun zur zweiten Reihe: Der Konvergenzkreis ist das In-
→ |x − 2|, tervall (1, 3), die Randpunkte sind also 1 und 3. Setzt man
diese Werte für x ein, erhält man die Reihen
) )
) (x − 3)n+1 n2 + 1 )) n2 + 1    
) ∞
! (−1)n n

!
) · ) = |x − 3| n
) (n + 1)2 + 1 (x − 3)n ) n2 + 2n + 2 bzw. .
n+1 n+1
n=0 n=0
→ |x − 3|,
jeweils für n → ∞. Nach dem Quotientenkriterium kon- In beiden Fällen bilden die Glieder keine Nullfolge, die
vergieren die Reihen absolut, falls der Grenzwert kleiner Reihen müssen divergieren. Also konvergiert die zweite
als 1 ist, etwa Reihe genau für x ∈ (1, 3), für alle anderen x divergiert
|x − 1| < 1 sie.
im Fall der ersten Reihe. Also ist in allen drei Fällen der Bei der dritten Reihe ist der Konvergenzkreis (2, 4), die
Konvergenzradius 1. Randpunkte also 2 und 4. Wieder setzen wir diese Werte
Wir müssen nun die Randpunkte separat untersuchen. Im für x ein und erhalten
Fall der ersten Reihe ist der Konvergenzkreis das Intervall ∞  ∞ 
(0, 2), die Randpunkte also 0 und 2. Wir setzen zunächst ! (−1)n ! 1
bzw. .
null für x ein und erhalten die Reihe n2 + 1 n2 + 1
∞  ∞  n=0 n=0
! (0 − 1)n ! (−1)n
= . Jetzt konvergieren beide Reihen absolut, dies folgt zum
n n
n=1 n=1 Beispiel mit dem Grenzwertkriterium. Also konvergiert
Dies ist genau die alternierende harmonische Reihe, von diese Potenzreihe für x ∈ [2, 4], für alle anderen x diver-
der wir wissen, dass sie konvergiert. giert sie.

Kommentar: Das Beispiel verdeutlicht, dass auf dem Rand des Konvergenzkreises jedes Verhalten möglich ist: Die
erste Reihe konvergiert in einem Randpunkt, im anderen aber nicht, die zweite divergiert in beiden Randpunkten, die
dritte konvergiert in beiden absolut. Alle drei haben aber denselben Konvergenzradius. Bei solchen Untersuchungen ist
wirklich jeder Randpunkt separat zu untersuchen. Nimmt man noch die komplexen Zahlen hinzu, bedeutet dies natürlich
mehr Aufwand, denn dann besteht der Rand aus einer Kreislinie und nicht nur aus zwei Punkten.
11.2 Die Darstellung von Funktionen durch Potenzreihen 389

sowie die Funktion f : (−1, 1) → R mit f (x) = Die Aussage des Grenzwertsatzes besagt, dass die beiden
∞ n
n=0 an x . Gesucht ist nun eine Darstellung der Dif- Grenzprozesse z → ẑ und ∞ n=0 vertauscht werden dürfen.
ferenz s − f (x), die eine Abschätzung gegenüber der Wieder begegnen wir dem Vertauschen von Grenzwerten.
Differenz |1 − x| erlaubt. Aber so unproblematisch wie im Inneren des Konvergenz-
kreises ist die Situation beim Grenzwertsatz nicht. Man ent-
Mit der geometrischen Reihe gilt:
deckt die Schwierigkeit, wenn man versucht, den Satz ins

! ∞
! Komplexe zu verallgemeinern.
1
xn = bzw. (1 − x) xn = 1
1−x
n=0 n=0 Beispiel Wir ersetzen versuchsweise alle reellen Argu-
mente im obigen Beweis durch komplexe Zahlen. Zunächst
für |x| < 1. Da beide Reihen, die Potenzreihe und die
können wir analog vorgehen, indem wir den Entwicklungs-
geometrische Reihe, für |x| < 1 absolut konvergieren,
punkt ẑ durch die Transformation z̃ = 1r (z − z0 )e−i arg(z−z0 )
erhalten wir mit dem Cauchy Produkt (Seite 367):
in die Stelle 1 + i0 drehen. Erst bei der Abschätzung (siehe

∞ ∞  (11.2)) sehen wir das Problem.
! ! !
n n n
an x = (1 − x) x an x
Der Term |1 − z|/(1 − |z|) bleibt in einer Umgebung von
n=0 n=0 n=0
⎛ ⎞ ẑ = 1 nicht beschränkt. Dies ergibt sich etwa mit der Folge

! !
n
zn = 1 − n12 + ni . Denn es gilt:
= (1 − x) ⎝ aj ⎠ x n
n=0 j =0 .
∞ 2 1 1 1 1
! |zn | = 1 − 2 (1 − 2 ) < 1, |1 − zn | = 1+ 2
= (1 − x) sn x n . n n n n
n=0
und
Damit folgt für |x| < 1 die Identität .
1 1
∞ ∞
(1 − |zn |) = 1 − 1− (1 − 2 )
! ! n2 n
s − f (x) = s (1 − x) x n − (1 − x) sn x n (1 − n12 )
1
n=0 n=0 =  .
∞ n2 1 + 1 − 1
(1 − n12 )
! n2
= (1 − x) (s − sn )x n .
n=0 Also ist |1 − zn |/(1 − |zn |) unbeschränkt. Für die Beweisidee
des Grenzwertsatzes wird aber eine Schranke unabhängig
(iii) Als letzten Schritt im Beweis schätzen wir nun die Dif-
von N benötigt. Da eine solche gleichmäßige Abschätzung
ferenz ab. Mit der Dreiecksungleichung und |x| < 1 ist
hier nicht möglich ist, versagt das Argument an dieser Stelle.
⎛ ⎞
!
N ∞
! Es lässt sich nach diesen Überlegungen nur dann eine stetige
|s −f (x)| ≤ |1−x| ⎝ |s − sn | + |s − sn ||x| ⎠.
n
Fortsetzung bis in den Punkt ẑ erwarten und auch zeigen,
n=0 n=N +1
wenn durch arg(ẑ − z) ∈ [−ϕ, ϕ] mit 0 ≤ ϕ < π/2 der
Nun lässt sich zu ε > 0 ein N ∈ N wählen, sodass Definitionsbereich von f so eingeschränkt wird, dass der
|s − sn | < 2ε für alle n > N gilt, und es folgt mit der betrachtete Quotient beschränkt bleibt, denn mit Methoden
geometrischen Reihe: der Differenzialrechnung lässt sich zeigen, dass der Quotient
lokal durch 1/ cos ϕ abschätzbar ist.
!
N ∞
!
ε Oft sind beim Vertauschen von Grenzwerten zusätzliche Be-
|s − f (x)| ≤ |1 − x| |s − sn | + |1 − x| |x|n
2 dingungen, wie in diesem Beispiel, erforderlich, um in einem
n=0 n=N +1
passenden Sinn ein gleichmäßiges asymptotisches Verhalten
!
N
ε |1 − x| zu garantieren (siehe Seite 387). 
≤ |1 − x| |s − sn | + . (11.2)
2 1 − |x|
n=0

Für 0 < x < 1 ist |1−x| = 1. Wählen wir weiter 11.2 Die Darstellung von Funk-
 N 1−|x|
δ = ε/ 2 n=0 |s−sn | , so folgt für |1−x| ≤ min{δ, 1},
dass tionen durch Potenzreihen
!
N
ε Im einführenden Beispiel dieses Kapitels haben wir einen
|s − f (x)| ≤ δ |s − sn | + = ε,
2 Fall kennengelernt, in dem sich eine Funktion einerseits
n=0
durch eine Potenzreihe, andererseits durch eine explizite Ab-
und wir haben die stetige Fortsetzbarkeit im Grenzfall bildungsvorschrift darstellen lässt. In der Tat sind Darstellun-
x → 1 gezeigt.  gen von Funktionen durch Potenzreihen wichtige Hilfsmittel.
390 11 Potenzreihen – Alleskönner unter den Funktionen

Sie dienen zur Lösung von Differenzialgleichungen, zur Be- Potenzreihendarstellung erlauben, werden auch als analyti-
rechnung von Integralen oder zur numerischen Auswertung sche Funktionen bezeichnet.
von Funktionen. Gibt man den Entwicklungspunkt z0 vor,
Für die Multiplikation von Potenzreihen machen wir uns zu
spricht man auch von der Potenzreihenentwicklung einer
Nutze, dass Potenzreihen im Innern ihres Konvergenzkrei-
Funktion um z0 .
ses stets absolut konvergieren. Damit steht uns das Cauchy-
Produkt zur Verfügung. Dieselben Voraussetzungen wie
Potenzreihen mit demselben Entwicklungs- oben sollen gelten: Beide Reihen haben denselben Entwick-
lungspunkt z0 , und wir betrachten nur den kleineren der bei-
punkt kann man addieren und multiplizieren den Konvergenzkreise. Dann gilt die Formel:
2∞ 3 2∞ 3 ∞
Da Potenzreihen nichts anderes sind als spezielle Reihen, ! ! !
n n
steht uns das gesamte Arsenal der Rechenregeln für Reihen an (z − z0 ) · bn (z − z0 ) = cn (z − z0 )n ,
und Reihenwerte zur Verfügung. Eine einfache Konsequenz n=0 n=0 n=0
ist die Tatsache, dass man Potenzreihen oder Vielfache von
wobei die Koeffizienten cn durch
ihnen addieren kann und als Ergebnis wieder eine Potenz-
reihe erhält. !
n
cn = ak bn−k
Einige Voraussetzungen sind zu beachten: Zunächst müssen
k=0
beide Potenzreihen denselben Entwicklungspunkt z0 besit-
zen. Ferner gehört zu jeder der beiden ursprünglichen Po- gegeben sind. Das Produkt zweier Potenzreihen liefert also
tenzreihen ein Konvergenzkreis, und es können nur solche auch wieder eine analytische Funktion.
z betrachtet werden, die im kleineren dieser beiden Kreise
liegen. Dann gilt die Formel: Beispiel Für x ∈ C\{−i, i} gilt die Gleichung

! ∞
! 1 1 1
λ an (z − z0 )n + μ bn (z − z0 )n = · .
1 + x2 1+ix 1−ix
n=0 n=0

! Die beiden hinteren Faktoren können wir für |x| < 1 mit der
= (λan + μbn ) (z − z0 )n geometrischen Reihe als Potenzreihen schreiben:
n=0
! ∞
1
für alle λ, μ ∈ C. = (−i)n x n ,
1+ix
n=0
Beispiel Wir betrachten die reellwertige Funktion ! ∞
1
= in x n .
1 1 1−ix
n=0
f (x) = + , |x| < 1.
1−x 1 − x2
Die Koeffizienten im Cauchy-Produkt sind
Für beide Summanden kennen wir schon eine Darstellung als
Potenzreihe mit dem Entwicklungspunkt Null: !
n !
n
cn = (−i)k (i)n−k = in (−1)k .
! ∞ k=0 k=0
1
= xn,
1−x Die in der Summe auftretenden Terme sind abwechselnd
n=0
∞ 1 und −1. Damit ergibt sich für n = 2k die Darstellung
1 !
= x 2n .
1 − x2 c2k = i2k · 1 = (−1)k ,
n=0

Also hat f die Darstellung und für n = 2k + 1 ist c2k+1 = 0. Also gilt:
∞ ! ∞ ! ∞ ! ∞
! 1
f (x) = an x n = cn x n = c2k x 2k = (−1)k x 2k .
1+x 2
n=0 n=0 k=0 k=0

mit an = 2 für gerades n und an = 1 für ungerades n.  Allerdings kann man die geometrische Reihe auch direkt auf
den Bruch 1/(1 + x 2 ) anwenden:
Dieses einfache Resultat bedeutet algebraisch, dass die
Menge der Funktionen, die sich in einer Umgebung um einen 1 1 ! ∞ n ! ∞
2
= = −x = (−1)n x 2n .
Punkt als Potenzreihe schreiben lassen, einen Vektorraum 1 + x2 1 − (−x 2 )
n=0 n=0
bildet. Wir können diesen als einen Unterraum der stetigen
Funktionen auffassen (siehe Kapitel 11). Funktionen, die eine Beide Rechnungen liefern die gleiche Potenzreihe. 
11.2 Die Darstellung von Funktionen durch Potenzreihen 391

Kommentar: Die durch den Ausdruck Wir beweisen dies durch vollständige Induktion. Mit z = z0
folgt sofort die Gleichung a0 = b0 . Dies ist der Induktions-
1
f (x) = anfang.
1 + x2
Nun nehmen wir an, dass wir wissen, dass aj = bj ist für
definierte Funktion kann auf ganz R definiert werden. Be- j = 1, . . . , N und wollen zeigen, dass dann auch aN +1 =
trachtet man dagegen ihre Potenzreihendarstellung bN +1 sein muss. Aufgrund der Annahme gilt:

! !
N !
N
f (x) = (−1)n x 2n , aj (z − z0 )j = bj (z − z0 )j .
n=0 j =0 j =0

so ist diese nur für |x| < 1 gültig. In den reellen Zahlen gibt Dies sind zwei Polynome, deren Koeffizienten übereinstim-
es für dieses Phänomen keine Erklärung. Erst durch Betrach- men. Also folgt
tung der Potenzreihe im Komplexen wird der Grund klar: Die

! ∞
!
Potenzreihe sieht die komplexen Nullstellen des Nenners bei
an (z − z0 )n = bn (z − z0 )n
±i, auch wenn nur reell gerechnet wird. Diese Nullstellen
n=N+1 n=N+1
schränken den Konvergenzkreis ein. Die komplexen Zahlen
bilden also das natürliche Umfeld, um Potenzreihen zu be- für alle z mit |z − z0 | < r. Auf beiden Seiten kann nun der
trachten und ihre Eigenschaften zu verstehen. Term (z − z0 )N +1 ausgeklammert werden:

!
(z − z0 )N +1 aN +1+n (z − z0 )n
n=0
Der Identitätssatz belegt die Eindeutigkeit ∞
!
der Koeffizienten = (z − z0 )N +1 bN +1+n (z − z0 )n .
n=0

Im ersten Abschnitt des Kapitels haben wir gesehen, dass Auch diese Gleichung gilt für alle z mit |z − z0 | < r. Für
durch jede Potenzreihe innerhalb ihres Konvergenzkreises z = z0 ist der ausgeklammerte Faktor ungleich null, daher
eine Funktion definiert wird. Jetzt wollen wir die Frage stel- muss
len: Falls eine Funktion durch eine Potenzreihe dargestellt

! ∞
!
wird, ist diese Darstellung dann eindeutig? Es ist entschei-
aN +1+n (z − z0 )n = bN +1+n (z − z0 )n
dend, dass diese Frage mit ja beantwortet werden kann, denn
n=0 n=0
so wird garantiert, dass sich aus der Kenntnis der Funktion die
Koeffizienten der Potenzreihe bestimmen lassen, wobei man sein. Die beiden identischen Potenzreihen sind stetig in z0 ,
sich natürlich auf einen Entwicklungspunkt festlegen muss. also gilt die Identität auch für z = z0 , und es folgt aN +1 =
Die entsprechende Aussage nennt man den Identitätssatz für bN +1 . Damit ist der Induktionsschritt durchgeführt. 

Potenzreihen.

Identitätssatz für Potenzreihen


Durch Koeffizientenvergleich lassen sich
Gilt für zwei Potenzreihen und r > 0 die Gleichung
Darstellungen von Funktionen gewinnen

! ∞
!
an (z − z0 )n = bn (z − z0 )n Der Identitätssatz liefert uns eine wichtige Technik zur Be-
n=0 n=0 stimmung der Koeffizienten von Potenzreihen, den Koeffi-
zientenvergleich. Wir illustrieren die Technik an zwei Bei-
für alle z mit |z−z0 | < r, so sind die Koeffizientenfolgen spielen.
(an ) und (bn ) identisch.
Beispiel
Gesucht ist eine Potenzreihendarstellung der Funktion
Beweis: Wir gehen aus von zwei Potenzreihen mit dem-
selben Entwicklungspunkt z0 und Koeffizientenfolgen (an ) 1 + z2
bzw. (bn ). Wir müssen zeigen: Falls es ein r > 0 gibt mit f (z) = , |z| < 1,
1−z

! ∞
! um den Entwicklungspunkt z0 = 0, d. h. eine Folge von
an (z − z0 )n = bn (z − z0 )n Koeffizienten (an ) mit
n=0 n=0

! 1 + z2
für alle z mit |z − z0 | < r, dann sind die beiden Koeffi- an z n = , |z| < 1.
1−z
zientenfolgen identisch. n=0
392 11 Potenzreihen – Alleskönner unter den Funktionen

Beispiel: Bestimmung einer Potenzreihendarstellung mit dem Cauchy-Produkt


Bestimmen Sie eine Potenzreihendarstellung der Funktion

z2
f (z) = für z ∈ {w ∈ C | |w| < 1}
2 − 3z + z2
mit Entwicklungspunkt z0 = 0.

Problemanalyse und Strategie: Die Funktion wird als ein Produkt geschrieben, wobei wir für jeden Faktor eine
Potenzreihe angeben können. Die Berechnung der Produktreihe kann dann mit dem Cauchy-Produkt erfolgen.

Lösung: die Reihe in der Darstellung des ersten Faktors beginnt erst
Faktorisiert man den Nenner, beim Index 2 und entspricht somit nicht ganz genau der
Darstellung in der Definition des Cauchy-Produkts. Wir
2 − 3z + z2 = (1 − z) (2 − z), schreiben
∞  ∞ 
erkennt man, dass die Funktion wohldefiniert ist, denn ! !  z n !∞ !
n
n
keine dieser Nullstellen liegt im Definitionsbereich. z · = zn ak bn−k
2
n=2 n=0 n=0 k=0
Somit lässt sich f umschreiben zu
mit
z2 1 
f (z) = · .
1−z 2−z 0, k = 0, 1, 1
ak = und bk = .
Die beiden Faktoren erinnern an die geometrische Reihe. 1, sonst 2n
Wenn wir beim zweiten Faktor 1/2 ausklammern, so er-
halten wir Damit erhalten wir:

1 !  z n
∞ !
n !
n !
n−2 !
n−2
1 1 1 1 1 1
= = ak bn−k = = = 2k .
2−z 2 1− z
2 2 2 2n−k 2n−k−2 2n−2
n=0 k=0 k=2 k=0 k=0

für alle z aus dem Definitionsbereich von f . Die Summe im letzten Term lässt sich mit der geometri-
Den ersten Faktor in der Darstellung von f schreiben wir schen Summenformel explizit berechnen. Es ergibt sich
als für n ≥ 2:
!∞ !∞ ∞
!
z2
= z2 zn = zn+2 = zn . !
n
1 1 − 2n−1 2n−1 − 1 1
1−z ak bn−k = · = = 2− n−2 .
n=0 n=0 n=2 2n−2 1−2 2 n−2 2
k=0
Diese Darstellung ist ebenfalls für alle z aus dem Defini-
tionsbereich von f gültig. Für n = 0 oder 1 ist die Summe null. Damit erhalten wir:
∞  ∞  ∞ ' (
Da beide Potenzreihen für |z| < 1 absolut konvergieren, 1 ! n !  z n ! 1
kann man die Produktreihe mit dem Cauchy-Produkt be- f (z) = z · = 1 − n−1 zn .
2 2 2
stimmen. Dabei muss man allerdings vorsichtig sein, denn n=2 n=0 n=2

Der Nenner ist uns schon von der geometrischen Reihe Es gilt für die gesuchte Potenzreihendarstellung:
her bekannt, es gilt: ∞ ∞ ∞ ∞
! ! ! !
! ∞ an zn = zn + zn = 1 + z + 2 zn .
1
= zn , |z| < 1. n=0 n=0 n=2 n=2
1−z
n=0 Aufgrund des Identitätssatzes müssen die beiden Potenz-
Daher können wir die Funktion folgendermaßen darstel- reihen die gleichen Koeffizienten haben. Also ist a0 = 1,
len: a1 = 1 und für alle n ≥ 2 gilt an = 2.

! Insgesamt haben wir die folgende Potenzreihendarstel-
1
f (z) = (1 + z2 ) · = (1 + z2 ) zn lung für f gefunden:
1−z
n=0 ∞
!

! ∞
! ∞
! ∞
! f (z) = 1 + z + 2 zn .
= zn + zn+2 = zn + zn . n=2
n=0 n=0 n=0 n=2
11.2 Die Darstellung von Funktionen durch Potenzreihen 393

Durch Koeffizientenvergleich sehen wir, dass im Vektor- für |1 − z| < 1. Auch das Polynom z2 + 1 muss hier um
raum V der Funktionen, die sich als Potenzreihen um den Punkt z0 = 1 entwickelt werden. Mit z = z − 1 + 1
z0 = 0 mit Konvergenzradius r > 0 schreiben lassen, die folgt:
Monome, also die Funktionen der Form fn (z) = zn , line- z2 + 1 = (z − 1)2 + 2(z − 1) + 2.
ar unabhängig sind (s. Seite 201). Denn für eine endliche
Also muss gelten:
Linearkombination dieser Funktionen mit N n=0 an fn =
0 ∈ V gilt: ∞
! ∞
!
bn (z − 1)n = (−1)n (z − 1)n+2
!
N !
N
an fn (z) = an zn = 0 n=0 n=0
!∞
n=0 n=0
+ 2(−1)n (z − 1)n+1
für |z| < r ∈ R. Der Koeffizientenvergleich liefert n=0
an = 0 für n = 1, . . . , N. Also sind die Funktionen fn , !∞
n = 0, 1, . . . , N als Elemente des Vektorraums V linear + 2(−1)n (z − 1)n .
unabhängig.  n=0

Die Beispiele sind einfach, doch sie zeigen die wesentlichen Mit einer Indexverschiebung
Prinzipien der Methode des Koeffizientenvergleichs: Aus- ∞ ∞
! !
gangspunkt ist immer eine Gleichung, bei der auf beiden (−1)n (z − 1)n+2 = (−1)n (z − 1)n ,
Seiten eine Potenzreihe mit demselben Entwicklungspunkt n=0 n=2
steht. Dann stimmen die Koeffizienten links und rechts für ∞ ∞
! !
dieselben Potenzen überein. (−1)n (z − 1)n+1 = − (−1)n (z − 1)n
Ein paar Dinge sind dabei zu beachten: n=0 n=1

Die Potenzreihen links und rechts können die Gestalt von stimmen die Potenzen überein, allerdings starten die
Polynomen oder, was häufig vorkommt, der Nullfunktion Summen bei unterschiedlichem Index. Das wird dadurch
annehmen, wie im zweiten Beispiel. Dann sind unendlich aufgelöst, dass die überzähligen Summanden getrennt auf-
viele Koeffizienten bzw. sogar alle null. geführt werden. Damit ergibt sich:
Steht auf einer Seite eine Summe von Potenzreihen, so ∞
sind gegebenenfalls Indexverschiebungen notwendig, um !
bn (z − 1)n = 2 + (2 − 2) · (z − 1)
diese Reihen zusammenzufassen (siehe Beispiel auf Seite
n=0
394). ∞
! * +
Wichtig ist, dass man wirklich Koeffizienten für dieselben + (−1)n − 2 (−1)n + 2(−1)n (z − 1)n
Potenzen vergleicht – das ist nicht unbedingt dasselbe, wie n=2
Koeffizienten für das gleiche n. ∞
!
=2+ (−1)n (z − 1)n .
? n=2
Angenommen es gilt die Gleichung
Also ist b0 = 2, b1 = 0 und bn = (−1)n für n ≥ 2. 

! ∞
! ∞
! ∞ 2n+1
! x
an x n = bn (x − 1)n = cn x n =
n!
n=0 n=0 n=1 n=0
Konvergenzradius und Entwicklungspunkt
für alle x aus einem Intervall I ⊆ R. Welche Aussagen kann hängen eng zusammen
man über die Koeffizientenfolgen (an ), (bn ) bzw. (cn ) durch
Koeffizientenvergleich treffen? Je nachdem, wie der Entwicklungspunkt gewählt wird, erhält
man für eine Funktion ganz unterschiedliche Darstellungen
als Potenzreihe. Dementsprechend ergeben sich auch ganz
Beispiel unterschiedliche Konvergenzradien.
Eine Koeffizientenfolge (bn ) mit
Allgemein lässt sich dabei nicht formulieren, wie sich der

!
nz2 + 1 Zusammenhang zwischen Entwicklungspunkt und Konver-
bn (z − 1) = , |z − 1| < 1,
z genzradius darstellt. Die Eigenschaften der jeweiligen Funk-
n=0
tion bestimmen dies entscheidend. Für ein einfaches Beispiel
soll gefunden werden. Dazu schreiben wir den Nenner können wir den Zusammenhang aber klar darstellen.
geschickt um:
Wir betrachten die Funktion

!
z2 + 1 z2 + 1
= = (z2 + 1) (1 − z)n 1
z 1 − (1 − z) f (z) = , z ∈ C \ {i}.
n=0 i−z
394 11 Potenzreihen – Alleskönner unter den Funktionen

Beispiel: Bestimmung einer Potenzreihe durch Koeffizientenvergleich


Bestimmen Sie eine Potenzreihendarstellung der Funktion
1 z2 − 2z + 5
f (z) = , z ∈ C \ {3},
2 z2 − 6z + 9
um den Entwicklungspunkt z0 = 1.

Problemanalyse und Strategie: Mit einem Ansatz für f als Potenzreihe kann man durch Koeffizientenvergleich
eine Rekursionsformel für die Koeffizienten herleiten. Dazu müssen auch die auftretenden Polynome um z0 entwickelt
werden.

! ∞
Lösung: 1
(z − 1)2 + 2 = (an−2 − 4an−1 + 4an ) (z − 1)n
Der Ansatz für f lautet: 2
n=2

! + (4a1 − 4a0 ) (z − 1) + 4a0 .
f (z) = an (z − 1)n .
n=0 Jetzt haben wir die Voraussetzung für den Koeffizienten-
Multipliziert man mit dem Nenner aus der Abbildungs- vergleich geschaffen: Auf beiden Seiten des Gleichheits-
vorschrift von f , so ergibt sich: zeichens steht eine Potenzreihe in (z − 1). Daher müssen
∞ die Koeffizienten gleich sein. Für die beiden einzelnen
1 2 !
(z − 2z + 5) = (z2 − 6z + 9) an (z − 1)n . Terme bedeutet dies:
2
n=0 1
4a0 = 2, also a0 = ,
Zunächst müssen jetzt auch die Polynome in Potenzen von 2
z − 1 geschrieben werden. Es gilt: 1
4a1 − 4a0 = 0, also a1 = .
2
z2 − 6z + 9 = (z − 1)2 − 4(z − 1) + 4,
1 2 1 Für die Potenz (z − 1)2 erhält man noch:
(z − 2z + 5) = (z − 1)2 + 2.
2 2 1 3 1
Somit können wir jetzt auf der rechten Seite ausmultipli- = a0 − 4a1 + 4a2 = − + 4a2 , also a2 = .
2 2 2
zieren und erhalten:
1 Für alle größeren n gilt 0 = an−2 − 4an−1 + 4an , was die
(z − 1)2 + 2 Rekursionsformel
2
, -!∞ 1
= (z − 1)2 − 4(z − 1) + 4 an (z − 1)n an = an−1 − an−2 , n ≥ 3,
4
n=0
∞ ∞ liefert. Man kann jetzt noch versuchen, ob sich aus der Re-
! !
= an (z − 1) n+2
−4 an (z − 1) n+1 kursionsformel auch eine explizite Darstellung der Koef-
n=0 n=0 fizienten bestimmen lässt. Meist ist das sehr schwer, hier

! aber ist es möglich. Die nächsten paar Koeffizienten ab
+4 an (z − 1)n . n = 3 lauten nämlich:
n=0 3 4 5
Im nächsten Schritt werden die drei Reihen durch Index- , , , ...
8 16 32
verschiebungen so umgeschrieben, dass in ihnen jeweils
(z − 1)n als Faktor steht. Dies ergibt: Dies legt die Vermutung nahe, dass an = n/2n gilt. Zum
Nachweis, dass dies richtig ist, verwenden wir vollstän-
! ∞
1 dige Induktion. Der Induktionsanfang ist schon erbracht,
(z − 1)2 + 2 = an−2 (z − 1)n
2 für den Induktionsschritt nehmen wir an, dass diese Dar-
n=2
∞ stellung für n − 1 und n − 2 stimmt. Dann gilt:
!
−4 an−1 (z − 1)n n−1 n−2 2n − 2 − n + 2 n
an = − = = n.
n=1 2n−1 4 · 2n−2 2n 2
!∞
+4 an (z − 1)n . Damit ist gezeigt, dass die Koeffizienten für alle n ≥ 3 die-
n=0 ser Darstellung genügen. Da auch a1 und a2 sich genauso
Ab dem Index n = 2 können die Reihen jetzt zusam- schreiben lassen, erhält man:

mengefasst werden. In der zweiten und dritten Reihe blei- 1 ! n
ben dabei Terme übrig, die einzeln hingeschrieben werden f (z) = + (z − 1)n .
2 2n
müssen: n=1
11.2 Die Darstellung von Funktionen durch Potenzreihen 395

Die Darstellung als Potenzreihe um den Entwicklungspunkt Im


z0 = 0 können wir sofort über die geometrische Reihe ge-
winnen. Es gilt:
i 1
2 +i
1 1
= −i
i−z 1 − (−iz)

und daher:
0 1 Re

!
n
f (z) = −i (−iz) für |z| < 1.
n=0

Der Konvergenzradius ist r = 1, was mit dem Wurzelkrite-


rium unmittelbar ermittelt werden kann.
Abbildung 11.5 Die Konvergenzkreise der Darstellungen als Potenzreihe von
Wir wollen nun versuchen, die Potenzreihe für den Entwick- 1/(i − z) für die Entwicklungspunkte 0 (blau), 1 (grün) und i + 1/2 (orange).
lungspunkt z0 = 1 zu bestimmen. Dazu ist eine kleine Um- Alle drei Kreise treffen den Punkt i, in dem die Funktion eine Singularität besitzt.
formung notwendig, um wiederum die geometrische Reihe
anwenden zu können:
Um das Verhalten einer Funktion für kleine
1 1 1 1 Argumente zu beschreiben, gibt es eine
= = · .
i−z i − 1 − (z − 1) i − 1 1 − z−1 spezielle Notation
i−1

Damit erhalten wie die Reihendarstellung Aus der Darstellung einer Funktion als Potenzreihe lassen
sich viele Dinge direkt ablesen. Der Funktionswert im Ent-
∞ ' (n
1 ! 1 wicklungspunkt ist zum Beispiel gerade der Koeffizient a0 .
f (z) = (z − 1)n ,
i−1 i−1 Im Abschnitt 15.5 werden wir feststellen, dass die anderen
n=0
Koeffizienten im Zusammenhang mit Ableitungen der Funk-
die für tion im Entwicklungspunkt stehen.

|z − 1| < |i − 1| = 2 Für numerische Zwecke ist eine Anwendung der Potenz-
reihen die Approximation von Funktionen: Statt der vollen
konvergiert. Potenzreihe wählt man nur eine Partialsumme, also ein Poly-
nom. Der Fehler bei dieser Rechnung ist gerade der Reihen-
Mit einer analogen Überlegung erhalten wir noch
rest. Kennt man die volle Potenzreihendarstellung, hat man

! ' ' (( auch diesen Reihenrest im Griff.
1 n
f (z) = 2 2n z − i + Häufig benötigt man allerdings gar nicht den vollen Reihen-
2
n=0 rest, sondern es genügt, den ersten Koeffizienten im Rest zu
kennen. Betrachten wir noch einmal die Funktion
für ) ' ()
) ) 1
)z − i + 1 ) < 1 . f (x) = , x ∈ R, |x| < 1.
) 2 ) 2 1 + x2
Sie hat die Potenzreihendarstellung
In Abbildung 11.5 sind alle 3 Konvergenzkreise eingezeich- ∞
!
net. Man erkennt, dass die Konvergenzradien sich so ergeben, f (x) = (−1)n x 2n .
dass der Konvergenzkreis immer durch i geht. Das ist gerade n=0
die Stelle, an der die Funktion f nicht definiert ist, da der Diese können wir benutzen, um f für kleine Werte von x
Ausdruck 1/(i − z) dort unbeschränkt ist. näherungsweise zu bestimmen, etwa über ein Polynom vier-
ten Grades:
Kommentar: Heuristisch kann man das Verhalten folgen- ∞
!
dermaßen beschreiben: Ausgehend vom Entwicklungspunkt f (x) = 1 − x 2 + x 4 + (−1)n x 2n
dehnt sich der Konvergenzkreis aus, bis er auf eine Stelle n=3
stößt, an der es eine Unregelmäßigkeit in der Funktion gibt. ∞
!
Beispiele dafür sind Polstellen oder Unstetigkeitsstellen. Im = 1 − x2 + x4 − x6 (−1)n x 2n
Abschnitt 15.5 werden wir im Kontext der sogenannten Tay- n=0
lorreihen genauer klären können, welche Eigenschaften einer 1
= 1 − x2 + x4 − x6 für |x| < 1.
Funktion den Konvergenzradius beeinflussen. 1 + x2
396 11 Potenzreihen – Alleskönner unter den Funktionen

Im zweiten Schritt haben wir nur eine Indexverschiebung Die Definition des Symbols O(·) ist die folgende: Man
gemacht. schreibt
Der Faktor, mit dem x 6 multipliziert wird, ist nun stets kleiner f (x) = O((x − x0 )p ) für x → x0 ,
oder gleich eins, egal wie wir x wählen. Damit folgt: falls die Funktion f (x)
) ) (x − x0 )p
) )
)f (x) − (1 − x 2 + x 4 )) ≤ |x|6 für |x| < 1. beschränkt ist für alle x aus einer Umgebung von x0 und
x = x0 .
Allgemein gilt für die Differenz zwischen Partialsumme und
Funktion die Abschätzung ?
Bestimmen Sie ein Polynom q, sodass gilt:
) )
) !n ) x
) k) = q(x) + O(x 6 ) für x → 0.
)f (x) − ak (x − x0 ) ) ≤ C |x − x0 |n+1 ,
) ) 1 − x2
k=0

wobei die Konstante C eine Schranke für die verbleibende Es gibt auch eine entsprechende Notation, die ein kleines „o“
Reihe ∞  verwendet. Ihre Definition ist:
!
ak+n+1 (x − x0 )k f (x) = o((x − x0 )p ) für x → x0 ,
k=0 falls f (x)
lim = 0, x = x0 .
darstellt. Kennen wir C, können wir den Fehler also kom- (x − x0 )p
x→x0
plett kontrollieren. Beachten Sie aber, dass diese verblei- In Worten ausgedrückt bedeutet dies, dass f (x) schneller
bende Reihe nur auf einer kompakten Teilmenge des Inneren gegen null geht als (x − x0 )p . Auch die Sprechweise f ist
des Konvergenzkreises beschränkt sein muss. „klein o“ von (x − x0 )p ist gebräuchlich.
Anders als für numerische Zwecke, ist es für die Analysis Um sich ein Verhalten der Form O(x p ) zu veranschaulichen,
häufig nicht wichtig, den Wert von C zu kennen, sondern es ist ein Plot in logarithmischen Skalen am besten geeignet. Die
spielt nur eine Rolle, dass und mit welcher Potenz von x − x0 Definition des Logarithmus, der Umkehrfunktion zur Expo-
der Fehler für x → x0 gegen null geht. Auch in den Natur- nentialfunktion, wird in Abschnitt 11.5 diskutiert. Wendet
wissenschaften ist dies für die Herleitung von Naturgesetzen man in der Abschätzung
) )
eine ganz wichtige Technik. Betrachtet man die komplizier- ) f (x) )
) )
ten Gesetze, die das elastische Verhalten von Körpern allge- ) xp ) ≤ C
mein beschreiben, kann man sich zum Beispiel auf die ersten
auf beiden Seiten den Logarithmus an, so ergibt sich:
beiden Summanden in den Partialsummen beschränken. Das
Ergebnis ist die lineare Elastizitätstheorie, die nur für kleine ln |f (x)| ≤ ln C + p ln |x|.
Verformungen angewandt werden kann. Der Grund ist jetzt Ist also f (x) = O(x p ) (und ist das p hier das größtmögli-
klar: Für kleine Verformungen ist die Differenz zwischen der che), so ist der Plot von f in logarithmischen Skalen in der
gewählten Partialsumme und der eigentlichen Funktion klein Nähe von x0 eine Gerade. Die Abbildung 11.6 zeigt dies am
genug, sodass sich eine gute Näherung an die Wirklichkeit Beispiel der Differenz R(x) = 1/(1 + x 2 ) − nj=0 (−x)2j .
ergibt. Ein weiteres Beispiel findet sich auch in dem Beispiel
auf Seite 397.
R(x)
Es hat sich für diese Art der Näherung eine eigene Nota-
tion eingebürgert, die Landau-Symbolik nach dem deut- 1 1
2
schen Mathematiker Edmund Landau (1877–1938). Statt
den kompletten Fehlerterm aufzuschreiben, geben wir etwa
im Beispiel oben an, dass 10−4

f (x) = 1 − x 2 + x 4 + O(x 6 ) für x → 0,


10−8
in Worten: Der Fehler zwischen f und dem angegebenen
Polynom ist von der Ordnung x 6 für x gegen null. Auch die
10−12
Sprechweise groß O von x 6 ist gängig.
n=1 n=2 n=3
Achtung: Die Angabe x → x0 ist bei dieser Notation 10−4 10−3 10−2 10−1 1 10 x
eigentlich essentiell, wird in der Literatur aber häufig ausge-
lassen, da die Autoren der Ansicht sind, dass aus dem Kon- Abbildung 11.6 Differenz zwischen der Funktion 1/(1 + x 2 ) und einige Par-
tialsummen ihrer Potenzreihe mit Entwicklungspunkt x0 = 0. Die Fehlerkurven
text klar ist, welches x0 gemeint ist. Hier ist Vorsicht ange- in logarithmischen Skalen sind annähernd Geraden, was auf einen Fehler der
bracht. Form O(x p ) hinweist.
11.2 Die Darstellung von Funktionen durch Potenzreihen 397

Beispiel: Das Newton’sche Gravitationsgesetz


Mit dem Newton’schen Gravitationsgesetz kann der Betrag der Gravitationskraft der Erde durch eine gebrochen rationale
Funktion der Höhe über der Erdoberfläche beschrieben werden. Andererseits kennt man die Formel, dass die Gewichtskraft von
Körpern auf der Erde proportional zu ihrer Masse ist, insbesondere also unabhängig von der Höhe. Wie sind beide Aussagen
miteinander zu vereinbaren?
Problemanalyse und Strategie: Der durch das Gravitationsgesetz gegebene funktionale Zusammenhang zwischen
Kraft und Höhe lässt sich als Potenzreihe schreiben. Ein Vergleich zwischen dem konstanten ersten Summanden und
dem Wert der Potenzreihe liefert eine Fehlerabschätzung zwischen den beiden Modellen.

Lösung: Also ist mit der geometrischen Reihe


Das Newton’sche Gravitationsgesetz beschreibt die Kraft,

 ' ( n
die zwischen zwei punktförmigen Körpern wirkt. Dabei GM ! R+h 2
ist es für kugelförmige Körper wie die Erde erlaubt, sie F (h) = m 1−
R2 R
als punktförmige Objekte zu betrachten, deren Masse in n=0

 ' ( n
ihrem Schwerpunkt konzentriert ist. Betrachtet man die GM GM ! R+h 2
Erde als Kugel mit Radius R, so ergibt sich die Formel = m+ 2 m 1− .
R2 R R
n=1
m
F (h) = G M , h ≥ 0,
(R + h)2 Damit ist der Widerspruch aufgelöst: Die einfache Formel
für einen Körper der Masse m in der Höhe h über der ist gerade die erste Partialsumme dieser Potenzreihe, die
Erdoberfläche. Die Konstanten G und M sind die Gravi- restliche Reihe stellt eine Korrektur dar. In der Tat ist
tationskonstante:
GM m
m3 2
= 9.823 2 .
G = 6.674 3 · 10−11 , R s
kg s2
Wie groß ist nun aber die Korrektur? Dazu verwenden wir
sowie die Masse der Erde:
die geometrische Reihe
M = 5.973 6 · 1024 kg.
∞ 
! n 1 − x2
Der Radius der Erde beträgt im Mittel: 1 − x2 =
x2
n=1
R = 6.371 0 · 106 m.
Zunächst lernt man jedoch eine viel einfachere Aussage: für |1 − x 2 | < 1. Mit x = (R + h)/R ist dies gerade
Die Gravitationskraft, die auf einen Körper auf der Erd- der relative Fehler (F (h) − m g)/(m g). Die Abbildung
oberfläche einwirkt, ist proportional zu seiner Masse m: zeigt einen Plot dieses Fehlers in logarithmischen Skalen
für Höhen zwischen 1cm und 1 000 km.
F = g m,
mit der Erdbeschleunigung g als Proportionalitätsfaktor, Fehler
1
die im Mittelwert
m 10−2
g = 9.81 2 10−4
s ln(102 )
10−6
beträgt. Die Gravitationskraft ist jedoch unabhängig von ln(102 )
10−8
der Höhe. Stehen die beiden Formeln nicht in einem Wi-
derspruch zueinander?
10−4 10−2 1 102 h [km]
Um eine Antwort zu finden, schreiben wir die Funktion F
im Newton’schen Gravitationsgesetz so um, dass wir sie
als Potenzreihe darstellen können: Der Fehlerterm stellt sich für relativ kleine Werte von h in
logarithmischen Skalen als eine Gerade dar. Die Steigung
GM 1
F (h) = 2  2 m ist 1, wie wir durch Vergleich mit dem Rot eingezeich-
R R+h neten Steigungsdreieck ablesen können (Beachten Sie die
R
unterschiedlichen Skalen auf den Achsen). In der Landau-
GM 1
= '  2 ( m. Symbolik liegt also ein relativer Fehler der Ordnung O(h)
R2 vor. Selbst in Höhen von 10 km und mehr liegt er noch
1 − 1 − R+h
R
unter einem Prozent.
398 11 Potenzreihen – Alleskönner unter den Funktionen

11.3 Die Exponentialfunktion f (z)


Im (z)
Bei den bisher untersuchten Funktionen hatten wir es mit
einer herkömmlichen expliziten Abbildungsvorschrift und
gegebenenfalls äquivalenten Darstellungen als Potenzreihen
zu tun. Wir wenden uns nun komplizierteren Funktionen zu:
den transzendenten Standardfunktionen wie der Exponential-
funktion oder den trigonometrischen Funktionen. Eine zen- Re (z)
trale Rolle spielt die Exponentialfunktion, auch e-Funktion
genannt. Wir definieren diese Funktion mittels ihrer Potenz-
reihe.

Definition der Exponentialfunktion


Die Exponentialfunktion exp : C → C ist für alle z ∈ C
definiert durch die Potenzreihe
Abbildung 11.7 Der Realteil Re(ez ) als Funktion über der komplexen Ebene.

! Die rote Kurve ist der Graph von x → exp(x), die gelbe Kurve der Graph von
1 n y → cos(y), jeweils für x, y ∈ R.
exp(z) = z .
n!
n=0
Zwei Eigenschaften charakterisieren die reelle
Bevor wir Eigenschaften der Funktion genauer ansehen, müs- Exponentialfunktion
sen wir sicherstellen, dass die Potenzreihe auch wirklich kon-
vergiert. Mit dem Quotientenkriterium und dem Grenzwert Zwei Eigenschaften der Exponentialfunktion sind zentral
) )
) n! zn+1 ) und lassen sich direkt aus der Definition ableiten. Mit dem
) ) 1
) )= |z| → 0 für n → ∞ Cauchy-Produkt ergibt sich die Funktionalgleichung.
) (n + 1)! zn ) n + 1

ergibt sich, dass die Reihe für jede komplexe Zahl z ∈ C Funktionalgleichung der Exponentialfunktion
absolut konvergiert. Der Konvergenzradius dieser Reihe ist Für x, y ∈ C gilt:
unendlich.
exp(x + y) = exp(x) exp(y).
Beispiel Wir nutzen die Definition um die Euler’sche Zahl
e = exp(1) ∈ R und den Wert exp(1 + i) zu approximieren.
Beweis: Da beide Potenzreihen auf der rechten Seite der
Um eine Näherung an die Funktionswerte zu bekommen,
Identität absolut konvergieren, erhalten wir mit dem Cauchy-
rechnen wir die Partialsumme der Potenzreihe bis zu einem
Produkt (Seite 367)
N ∈ N aus. So erhalten wir auf acht Dezimalstellen gerundet: ⎛ ⎞
∞ j ∞ k
 ∞
! x ! y !
!
N
1 !
N
1 exp(x) exp(y) = ⎝ ⎠ = cn
N e≈ e1+i ≈ (1 + i)n j! k!
n! n! j =0 k=0 n=0
n=0 n=0
2 2.500 000 0 2.000 000 0 + 2.000 000 0 i mit
1.468 694 9 + 2.287 354 5 i ! n ' (
1 ! n l n−l
5 2.716 666 7 n
x l y n−l 1
10 2.718 281 8 1.468 693 9 + 2.287 355 2 i cn = = xy = (x + y)n ,
l! (n − l)! n! l n!
20 2.718 281 8 1.468 693 9 + 2.287 355 2 i l=0 l=0

wobei wir die allgemeine binomische Formel verwendet ha-


Es scheint, dass wir relativ schnell eine gute Approximation
ben. 
an den wahren Wert der Zahl e oder der Zahl exp(1 + i) ∈ C
bekommen. Wir können diese Vermutung mit der auf Seite
396 entwickelten Abschätzung für die Differenz zwischen Bei der zweiten Eigenschaft handelt es sich um eine Un-
Partialsumme und Wert einer Potenzreihe schnell bestätigen. gleichung für reelle Argumente. Diese Ungleichung bietet
Der Grund ist, dass der Ausdruck n! im Nenner der Reihen- zusammen mit der Funktionalgleichung eine Möglichkeit,
glieder viel schneller wächst als die Potenzen im Zähler. die Exponentialfunktion eindeutig festzulegen (siehe Hinter-
grund und Ausblick auf Seite 400).
Eine Möglichkeit den Funktionswert der Exponentialfunk-
tion zumindest anzunähern (Abb. 11.7), liegt also darin, ein
Polynom von hinreichend hohem Grad auszuwerten, denn Ungleichung zur Exponentialfunktion
nichts anderes ist die Partialsumme. Wir werden sehen, dass Für x ∈ R gilt:
nicht nur die Exponentialfunktion eine solche Approxima- 1 + x ≤ exp(x).
tion durch Partialsummen erlaubt. 
11.3 Die Exponentialfunktion 399

Beweis: Für positive Argumente x ≥ 0 sehen wir die Be- Aus unseren Überlegungen ergibt sich, dass
dingung direkt aus der Potenzreihe mit
en = exp(n)
∞ n
! ∞ n
!
x x
exp(x) = =1+x+ ≥ 1 + x, ist.
n! n!
n=0 n=2
Betrachten wir in einem weiteren Schritt noch die Identität
da alle Summanden positiv sind.
' ( ' ( ' ' ((n
Außerdem ergibt sich aus der Funktionalgleichung 1 1 1
exp(x) = exp x . . . exp x = exp x ,
exp(z) exp(−z) = exp(z − z) = exp(0) = 1, d. h., es gilt: n n n

1 n-mal
exp(−z) = .
exp(z) so sehen wir, dass offensichtlich der Funktionswert exp(x)
Insbesondere ist exp(x) > 0 für alle reellen Zahlen x ∈ R; zu einem Wert x ∈ R die Gleichung
denn für x > 0 sehen wir dies aus der eben gezeigten Un- ' (
1 %
gleichung exp(x) ≥ x + 1. Im Fall x < 0 gilt exp(x) = exp x = n exp(x)
1/ exp(−x) > 0. Daher gilt die gesuchte Ungleichung of- n
fensichtlich für x ≤ −1, denn in diesem Fall ist die linke erfüllt. Setzen wir x = m ∈ Z, und fassen wir diese Beob-
Seite der Ungleichung negativ. achtungen zusammen, so definieren diese Eigenschaften die
Es verbleibt noch das Intervall (−1, 0) zu untersuchen. Wir übliche Schreibweise
betrachten für x ∈ (−1, 0) die Differenz m √
n
e n = em ,
∞ n
! ∞
!
x (−1)n |x|n
exp(x) − x − 1 = = indem sie den Ausdruck in eine algebraische Beziehung zur
n! n!
n=2 n=2 Euler’schen Zahl e stellen. Auf diesem Weg liefert die Ex-
zwischen der Exponentialfunktion und dem Ausdruck 1 + x. ponentialfunktion die gewohnte Potenzrechnung zur Basis e
Fassen wir je zwei aufeinanderfolgende Reihenglieder zu- und ihre Fortsetzung auf C. Die Notation
sammen, so ergibt sich:
' ( ez = exp(z) für z ∈ C,
|x|2k |x|2k+1 |x|2k |x|
− = 1− . ist damit wohldefiniert. Wesentliche Eigenschaften der Ex-
(2k)! (2k + 1)! (2k)! 2k + 1
 |x| 
ponentialfunktion und seiner Umkehrung, dem Logarithmus,
Da der Faktor 1− 2k+1 > 0 stets positiv ist für x ∈ (−1, 0) finden Sie in der Übersicht auf Seite 403.
und k ∈ N, sind diese Summanden positiv. Zusammen mit
der absoluten Konvergenz der Reihe für die Differenz ergibt
sich auch in diesem Fall exp(x) ≥ 1 + x. Wir haben damit Der Kosinus hyperbolicus ist gerade und der
die Ungleichung für jedes x ∈ R gezeigt.  Sinus hyperbolicus ungerade

Mit der Zerlegung


Die Euler’sche Zahl
f (z) + f (−z) f (z) − f (−z)
Aus den beiden Eigenschaften ergeben sich eine Reihe von f (z) = +
2
 2

Folgerungen, die wir kurz zusammenstellen. Im letzten Be-
gerade ungerade
weis haben wir bereits festgestellt, dass exp(0) = 1 und
1
exp(−z) = exp(z) gelten, und daraus die Positivität exp(x) > lässt sich jede Funktion f : C → C in einen geraden und
0 für x ∈ R abgeleitet. einen ungeraden Anteil aufspalten.
Weiter erhalten wir induktiv für natürliche Zahl n ∈ N mit
der Funktionalgleichung Gerade und ungerade Funktionen

exp(n) = exp(1 + · · · + 1) Eine Funktion f : {z ∈ C | |z| < r} → C mit r > 0


 heißt gerade, wenn für z ∈ C
n-mal
= exp(1) . . . exp(1) = (exp(1))n . f (z) = f (−z)

n-mal
gilt.
Man erahnt, dass der Funktionswert exp(1) eine besondere Die Funktion heißt ungerade, wenn
Rolle spielt. Dieser reellen Zahl wird deshalb ein Name gege-
ben, die Euler’sche Zahl, nach dem Mathematiker Leonhard f (z) = −f (−z)
Euler (1707–1783). Wir halten fest:
ist.
e = exp(1).
400 11 Potenzreihen – Alleskönner unter den Funktionen

Hintergrund und Ausblick: Charakterisierung der Exponentialfunktion


Neben der Definition der Exponentialfunktion mithilfe Ihrer Potenzreihendarstellung, wie wir es in diesem Abschnitt betrachtet
haben, gibt es zumindest auf R weitere Varianten, die Exponentialfunktion zu definieren. So wird etwa durch die beiden
Bedingungen exp(x + y) = exp(x) exp(y) und exp(x) ≥ 1 + x genau eine Funktion n exp : R → R festgelegt, oder wir
definieren für x ∈ R die Exponentialfunktion über den Grenzwert ex = lim 1 + xn . Wir wollen zeigen, dass auch diese
n→∞
Varianten im Reellen auf die durch die Potenzreihe gegebene Exponentialfunktion führen.

Es wurde gezeigt, dass die durch die Potenzreihe gegebene Mit der Monotonie der allgemeinen Potenzfunktion erhal-
Exponentialfunktion f : R → R die beiden Bedingungen ten wir die Abschätzung
' ( mn ' (mn +1
f (x + y) = f (x)f (y) und f (x) ≥ 1 + x 1 1 1
1+ < (1 + an ) an < 1+ .
mn + 1 mn
für alle x, y ∈ R erfüllt. Legen wir also für die weiteren
Überlegungen diese Bedingungen zugrunde. Wir beobachten, dass die so konstruierten Zahlen mn mit
n → ∞ auch gegen Unendlich streben. Da die Folge (bm )
Aus den Bedingungen lassen sich, wie im Text bewie- mit bm = (1 + 1/m)m gegen die so festlegbare Euler’sche
sen, weitere Eigenschaften belegen. So folgen aus den Zahl e konvergiert, lässt sich das Einschließungskriterium
Bedingungen f (0) = 1, f (x) = 1/f (−x) und induktiv anwenden, und aus
(f (x/n))n = f (x) bzw.
 mn +1
x  % 1 + mn1+1
f = n f (x) e = lim 
1
 ≤ lim (1 + an ) an
n n→∞ 1 n→∞
1 + mn +1
für n ∈ N und x ∈ R. Damit erhalten wir die Abschätzung
x  % und
x 1 1 ' (mn ' (
1+ ≤f = n f (x) = x ≤ . 1 1
n n f (− n ) 1− x
n lim (1 +
1
an ) an ≤ lim 1+ 1+ =e
n→∞ n→∞ mn mn
Also gilt die Einschließung
folgt die Konvergenz
 x n 1
1+ ≤ f (x) ≤  n 1
n 1 − xn (1 + an ) an → e, n → ∞.

für alle n ∈ N und alle x ∈ R. Wenden wir dieses Resultat auf die Nullfolgen an = x/n
x/n
Um die Behauptung, dass es nur eine Funktion f mit die- bzw. auf an = 1−x/n an, so folgt aus der Einschließung
sen Eigenschaften gibt, zu beweisen, zeigen wir, dass für für die Funktion f , dass für alle x ∈ R
jedes x ∈ R beide Folgen gegen denselben Grenzwert ' (
x  xn x  x n
konvergieren. Damit haben wir insbesondere die Identität ex = lim 1+ = lim 1 + ≤ f (x)
n→∞ n n→∞ n
 x n 
ex = lim 1+ . 1 x x n
n→∞ n ≤ lim  n = lim 1 + 1 − = ex
n→∞ 1 − x n→∞ n n
n
für x ∈ R bewiesen.
gilt. Die Funktion f ist also die Exponentialfunktion.
Die Existenz des Grenzwerts auf der rechten Seite im Fall
Kommentar: Da im Beweis die allgemeine Potenzfunk-
x = 1 haben wir schon auf Seite 292 gezeigt. Wir verall-
tion verwendet wird, benötigen wir hier die Exponential-
gemeinern diese Konvergenz für beliebige Nullfolge (an )
funktion und ihre Umkehrfunktion definiert durch die Po-
positiver reeller Zahlen an ∈ R>0 . Da (an ) eine Nullfolge
tenzreihe. Es folgt, dass diese Funktion die einzige ist, die
ist, gibt es zu jedem n eine natürliche Zahl mn ∈ N mit
die beiden charakterisierenden Bedingungen erfüllt. Will
der Eigenschaft
man die Exponentialfunktion nur über die beiden Bedin-
1 gungen definieren, muss man die Argumentation entspre-
mn ≤ < mn + 1. chend modifizieren.
an
11.3 Die Exponentialfunktion 401

Hintergrund und Ausblick: Die Szegö-Kurve


Bricht man die Potenzreihe zur Exponentialfunktion ab, so ergibt sich ein Polynom pn : C → C mit pn (z) = nj=0 j1! zj .
Das Polynom besitzt n Nullstellen, aber ez hat keine Nullstelle. Was passiert mit den Nullstellen für n → ∞? Fragestellungen
nach dem Verhalten von Polynomen und ihren Nullstellen bei wachsendem Grad tauchen in unterschiedlichen Bereichen auf
und bilden ein weites mathematisches Forschungsfeld. Für die durch die Exponentialfunktion generierten Polynome hat Gábor
Szegö (1895–1985) in einer Arbeit von 1924 eine Antwort gegeben.

Da ez keine Nullstellen besitzt, lässt sich vermuten, dass


die Beträge der Nullstellen von pn mit wachsendem n
gegen unendlich streben. Um dies zu sehen konstruieren
wir einen Widerspruch zu der Annahme, dass (ẑn )n∈N
eine beschränkte Folge von Nullstellen zu pn ist, etwa
|ẑn | ≤ b ∈ R>0 für alle n ∈ N. Da die Folge beschränkt
ist, gibt es eine konvergente Teilfolge (ẑn(j ) )j ∈N . Wir defi-
nieren ẑ = limj →∞ ẑn(j ) . Weil die Exponentialfunktion
stetig ist, gibt es zu ε > 0 ein j0 ∈ N mit |eẑ − eẑn(j ) | ≤ 2ε
für alle j ≥ j0 . Außerdem gilt
=0
)  ∞
! 1 k ))
|e ẑn(j )
| = ) pn(j ) (ẑn(j ) ) + ẑ
k! n(j )
k=n(j )+1

! ∞
!
1 1 k
≤ |ẑn(j ) |k ≤ b . einer Kurve in der komplexen Ebene annähern. Diese wird
k! k!
k=n(j )+1 k=n(j )+1 Szegö-Kurve genannt und ist gegeben durch die Menge
Wegen der Konvergenz der Potenzreihe zu eb geht der Rei-
= {z ∈ C | |ze1−z | = 1 und |z| ≤ 1} .
henrest auf der rechten Seite für j → ∞ gegen null. Also
lässt sich j0 so wählen, dass |eẑn(j ) | < 2ε für j ≥ j0 gilt. Die Definition und Beschreibung von Kurven werden wir
Zusammen ergibt sich mit der Dreiecksungleichung in Kapitel 23 noch diskutieren. Auf eine Erläuterung des
|eẑ | ≤ |eẑ − eẑn(j ) | + |eẑn(j ) | ≤ ε Beweises von Szegö müssen wir hier verzichten, da erheb-
liche Kenntnisse aus der Funktionentheorie erforderlich
für j ≥ j0 . Die Abschätzung erreichen wir für jedes ε > 0 sind.
und es folgt der Widerspruch |eẑ | = 0. Also gibt es keine
beschränkte Folge von Nullstellen. Abschließend zeigen wir aber noch den Satz von
Eneström-Kakeya: Für eine Nullstelle z̃ ∈ C eines Poly-
Das Verhalten von Nullstellen ẑn können wir noch genauer noms p(z) = nj=1 aj zj mit a0 ≥ a1 ≥ · · · ≥ an ≥ 0
eingrenzen. Es gilt n1 |ẑn | ≤ 1 für alle n ∈ N. Um dies zu gilt |z̃| ≥ 1.
beweisen betrachten wir das Polynom q : C → C mit
Beweis: Für eine Nullstelle z̃ zu p gilt
!
n
nj n−j ! nn−j j
n
n −1
q(z) = z pn (nz )= z = z !
n
j! (n − j )!
j =0 j =0 0 = (z̃ − 1)p(z̃) = −a0 + (aj −1 − aj )z̃j + an z̃n+1 .
Die Koeffizienten des Polynoms q sind monoton fallend, j =1
nn−j nn−(j +1) n nn−(j +1)
da (n−j )! = (n−(j +1))! (n−j ) ≥ (n−(j +1))! gilt. Nehmen wir an |z̃| < 1, so folgt mit dieser Identität und
der Dreiecksungleichung der Widerspruch
Nach einem allgemeinen Satz, der in der Literatur als Satz
) )
von Eneström-Kakeya bezeichnet wird (siehe unten), liegt ) n )
keine Nullstelle von q im Einheitskreis, d.h. |z̃| ≥ 1 für )! )
a0 = |a0 + 0| = )) (aj −1 − aj )z̃j + an z̃n+1 ))
q(z̃) = 0. Somit gilt für Nullstellen ẑn = nz̃−1 von pn die )j =1 )
Abschätzung n1 |ẑn | = |z̃−1 | ≤ 1.
!
n
Eine Vorstellung vom Verhalten der Nullstellen ergibt sich, ≤ |aj −1 − aj | |z̃|j + |an | |z̃|n+1
wenn man zu verschiedenen Graden n die Lage der mit j =1
1/n skalierten Nullstellen in der komplexen Ebene ansieht ! n
(siehe die folgende Abbildung mit freundlicher Genehmi- < (aj −1 − aj ) + an = a0 ,
gung aus Glaeser, Polthier, Bilder der Mathematik, 2. A.). j =1

In seiner Abhandlung beweist Szegö unter anderem, dass wobei die Monotonie der Koeffizienten genutzt wird. Also
sich die skalierten Nullstellen mit n → ∞ immer besser gilt für Nullstellen solcher Polynome |z̃| ≥ 1.
402 11 Potenzreihen – Alleskönner unter den Funktionen

Bei der Exponentialfunktion werden die beiden Anteile Ko- Genauso ergibt sich der ungerade Sinus hyperbolicus:
sinus hyperbolicus und Sinus hyperbolicus genannt. Wir er- ∞ ∞

halten ersteren für den geraden Anteil: 1 z −z 1 ! zn ! (−z)n
sinh z = (e − e ) = −
∞  2 2 n! n!
∞ n=0 n=0
1 z −z 1 ! zn ! (−z)n ∞  ∞
cosh z = (e + e ) = + 1 ! zn ! z2k+1
2 2 n! n! = (1 − (−1)n ) = .
∞
n=0

n=0 2 n! (2k + 1)!
∞ n=0 k=0
1 ! zn ! z2k
= (1 + (−1)n ) = .
2 n! (2k)! Wiederum mit dem Quotientenkriterium zeigt sich, dass die
n=0 k=0
Potenzreihen für alle z ∈ C konvergieren.
Mit dem Quotienten Eine gerade Funktion weist Achsensymmetrie des Graphen
) ) auf. Der Graph einer ungeraden Funktion ist punktsymme-
) (2k)!z2(k+1) )
) ) 1 trisch zum Ursprung (Abb. 11.8 und 11.9). Beachten Sie,
) )= |z|2 → 0
) (2(k + 1))!z2k ) (2k + 1)(2k + 2) dass bei einer Potenzreihe zu einer geraden Funktion nur ge-
rade Potenzen auftauchen und bei einer ungeraden Funktion
für k → ∞ folgt sofort, dass der Konvergenzradius unend- umgekehrt nur ungerade Potenzen in der darstellenden Po-
lich ist, d. h., die Potenzreihe konvergiert für jede Zahl z ∈ C tenzreihe einen Beitrag leisten (siehe Aufgabe 11.16).
absolut.
Beispiel Mit der Funktionalgleichung der Exponential-
funktion oder aus den Potenzreihendarstellungen lässt sich
die Identität
1
sinh z cosh z = sinh(2z)
2
zeigen.
Wir rechnen nach:

ez − e−z ez + e−z 1 z z 
sinh z cosh z = = e e − e−z e−z
2 2 4
1  2z  1
= e − e−2z = sinh(2z). 
4 2

Der Betrag von ez hängt nur von Re(z) ab


Abbildung 11.8 Der Realteil von cosh als Funktion über der komplexen Zahlen-
ebene. Die roten Punkte markieren die Punkte auf dem Graphen für z und −z.
Der Realteil von cosh ist gerade, es gilt Re cosh z = Re cosh(−z). Mit der Potenzreihendarstellung können wir die Exponen-
tialfunktion weiter untersuchen. Betrachten wir die konju-
giert komplexe Zahl zu ez mit z ∈ C. Die Rechenregeln zum
Konjugieren komplexer Zahlen und die Stetigkeit dieser Ope-
ration führen auf
∞ n
! ∞ n
!
z z
ez = = = ez .
n! n!
n=0 n=0

Diese Gleichung lässt sich verwenden, um den Betrag von ez


zu bestimmen. Es gilt:

|ez |2 = ez ez = ez ez = ez+z = e2Re(z) .

Da es sich bei der Identität um positive reelle Zahlen handelt,


können wir die Quadratwurzel ziehen und erhalten:

|ez | = eRe(z) .
Abbildung 11.9 Der Realteil von sinh z als Funktion über der komplexen
Zahlenebene. Die roten Punkte markieren die Punkte auf dem Graphen für z und Der Betrag von ez ist also allein durch den Realteil der Zahl
−z. Der Realteil von sinh ist ungerade, es gilt Re sinh z = −Re sinh(−z). z bestimmt.
11.4 Trigonometrische Funktionen 403

Übersicht: Exponentialfunktion und Logarithmus


Einige Eigenschaften der Exponentialfunktion und des Logarithmus werden ständig genutzt. Daher ist ein routinierter Umgang
mit den aufgelisteten Identitäten unumgänglich.

Exponentialfunktion exp : C → C, für w, z ∈ C gilt: cosh2 z − sinh2 z = 1,


%
ew+z = ew ez (Funktionalgleichung), arcosh(x) = ln(x + x 2 − 1), x ≥ 1,
%
ewz = (ew )z , für Im(w) ∈ (−π, π], arsinh(x) = ln(x + x 2 + 1).
1
e−z = z ,
e Logarithmus (Hauptzweig)
ez = ez , Die Umkehrfunktion ln : C\{0} → C zur e-Funktion:
|ez | = eRe(z) ,
ln(z) = ln |z| + i arg(z),
arg(ez ) = Im(z) + 2πm ∈ (−π, π]
eln z = z für z = 0,
mit passendem m ∈ Z. z
ln(e ) = z für Im(z) ∈ (−π, π].
Eigenschaften in R:

ex ≥ 1 + x für x ∈ R, ln w + ln z = ln(wz) + 2πβi (Funktionalgleichung)


x y ⎧
für x < y ∈ R ⎪
⎨−1 arg(w) + arg(z) ≤ −π,
e <e (Monotonie).

Graphen zu exp, sinh, cosh : R → R und mit β = 0 −π < arg(w) + arg(z) ≤ π,




ln : R>0 → R: 1 arg(w) + arg(z) > π.
f (x) exp cosh Eigenschaften in R:

ln x ≤ x − 1 x > 0,
1 ln x < ln y für 0 < x < y (Monotonie).
ln
Exponentialfunktionen zur Basis a, b ∈ C\{0}:
Für w, z ∈ C gilt:
−1 1 x

a z = ez ln a ,
−1 a w+z = a w a z ,
(ab)z = a z bz , für arg a + arg b ∈ (−π, π],
sinh a wz = (a w )z , für Im(w ln a) ∈ (−π, π ],
ln z
loga (z) = , a ∈ {0, 1},
Kosinus und Sinus hyperbolicus ln a
1 z  loga (wz) = loga (w) + loga (z)
cosh z = e + e−z ,
2 für arg(w) + arg(z) ∈ (−π, π].
1 z 
sinh z = e − e−z ,
2

11.4 Trigonometrische Aus der Funktionalgleichung folgt die Identität

Funktionen ez = ex+iy = ex eiy .

Da ex für x ∈ R reell ist, bleibt der Term eiy mit einer reellen
Nachdem wir den Betrag und die konjugiert komplexe Zahl Zahl y zu untersuchen. Mit dem oben ermittelten Betrag
zu ez ∈ C bestimmt haben, fehlen uns noch der Real- und der
Imaginärteil. Wir suchen also im Folgenden die Zerlegung ex = |ez | = ex |eiy |
einer Zahl ez mit z = x + iy und x, y ∈ R in Real- und
Imaginärteil. erhalten wir:
|eiy | = 1 für y ∈ R.
404 11 Potenzreihen – Alleskönner unter den Funktionen

Also liegt eiy auf dem Einheitskreis in der komplexen Zahlen- sammenhang zwischen Exponentialfunktion und den trigo-
ebene. Damit gibt es eine Polarkoordinatendarstellung dieser nometrischen Funktionen. Sicherlich ist dies ein Höhepunkt
Zahl von der Form eiy = cos t + i sin t, wobei t ∈ [0, 2π ) der Analysis – die Euler’sche Formel:
gerade das Argument der komplexen Zahl eiy ist, also der
Winkel zur reellen Achse im Bogenmaß. Die Euler’sche Formel
Für t ∈ R gilt:
Definition der trigonometrischen Funktionen eit = cos t + i sin t.
Betrachten wir Real- und Imaginärteil der Potenzreihendar-
Aus der Euler’schen Formel folgt auch:
stellung der Exponentialfunktion, so folgt:

e−it = cos t − i sin t, t ∈ R.
! 1
iy
cos t + i sin t = e = (iy)k und betrachten wir die oben berechnete Zerlegung der Po-
k!
k=0 tenzreihen mit z ∈ C anstelle von y ∈ R, so ergibt sich

! ∞
!
(−1)k (−1)k 2k+1 allgemein die Identität:
= y 2k + i y ,
2k! (2k + 1)! eiz = cos z + i sin z.
k=0 k=0

wobei mit dem Quotientenkriterium leicht Konvergenz der


Beispiel Schreiben wir mit der Euler’schen Formel
Reihen gezeigt werden kann. Es ist naheliegend zu vermu-
1 = ei2mπ für m ∈ Z, so ergeben sich die n-ten Einheits-
ten, dass y = t + 2πn für ein n ∈ Z ist, und es erweist
wurzeln durch
sich als sinnvoll. Dies erfordert aber unter anderem eine De-
m m m
finition des Begriffs Bogenlänge bzw. Bogenmaß, also der zm = e2π n i = cos 2π + i sin 2π .
n n
Länge eines Kreisbogenstücks. Später, wenn Integration und
der Begriff einer Kurve eingeführt sind, werden wir den Zu- Dies sind alle komplexen Zahlen mit
sammenhang abschließend klären.
zn = 1 = ei2mπ .
An dieser Stelle gehen wir einen anderen Weg. Wir nutzen die
Die Gleichung zn = 1 hat also genau die n verschiedenen
anschauliche Identität, um die trigonometrischen Funktionen
Lösungen
zu definieren.
z0 = e0 = 1, z1 = ei2π/n , ... zn−1 = ei2π(n−1)/n .
Definition der Kosinus- und der Sinusfunktion
Für m ≥ n oder m < 0 wiederholen sich die Zahlen, da
Durch die Potenzreihen sich die Argumente dann nur um Vielfache von 2π von den

! oben aufgelisteten Lösungen unterscheiden. In der Abbil-
(−1)k
cos z = z2k , dung 11.10 sind die Einheitswurzeln für n = 5 eingezeich-
(2k)! net. 
k=0

! (−1)k 2k+1
sin z = z Im
(2k + 1)! e2πi/5
k=0

sind die trigonometrischen Funktionen für alle z ∈ C e4π i/5


definiert.

5 1
Bei beiden Potenzreihen folgt die Konvergenz für jede kom-
Re
plexe Zahl z ∈ C direkt aus dem Quotientenkriterium, wie
oben bemerkt. Also besitzen die Potenzreihen einen unend-
lichen Konvergenzradius, die Definition ist sinnvoll auf ganz e6π i/5
C. Außerdem sehen wir direkt aus den beiden Potenzreihen-
darstellungen die Symmetrien, dass der Kosinus gerade und e8π i/5
der Sinus ungerade ist, d.h.:
Abbildung 11.10 Die 5 Einheitswurzeln für n = 5 bilden die Eckpunkte eines
cos(−z) = cos z und sin(−z) = − sin z. gleichseitigen Fünfecks auf dem Einheitskreis.

Die Euler’sche Formel ?


Bestimmen Sie alle Lösungen z ∈ C der Gleichung
Betrachten wir nochmal die Motivation zu unserer Defini- z3 − 2 = 0.
tion. Wir erhalten einen überraschenden und zentrale Zu-
11.4 Trigonometrische Funktionen 405

Kehren wir zurück zur anfänglichen Frage nach dem Real- Auch andere zentrale Eigenschaften der trigonometrischen
und dem Imaginärteil des Bilds ez einer komplexen Zahl z. Funktionen sind direkt aus der Potenzreihendarstellung her-
Wir erhalten mit der Euler’schen Formel aus leitbar. Sehr angenehm ist, dass sich nebenbei die Additions-
theoreme für die trigonometrischen Funktionen aus der Funk-
ez = ex eiy = ex (cos y + i sin y) tionalgleichung der Exponentialfunktion ergeben. Denn aus

für eine komplexe Zahl z = x + iy ∈ C die Zerlegung cos(w+z) ± i sin(w+z) = e±i(z+w) = e±iw e±iz

Re(ez ) = ex cos y und Im(ez ) = ex sin y. = (cos w ± i sin w)(cos z ± i sin z)


= (cos w cos z − sin w sin z)
Genauso lassen sich die Polarkoordinaten von ez angeben ± i(cos w sin z + sin w cos z)
durch
|ez | = ex und arg(ez ) = y + 2πm lassen sich, wenn wir die Summe oder die Differenz dieser
für eine ganze Zahl m ∈ Z, die so zu wählen ist, dass der beiden Gleichungen betrachten, die Additionstheoreme
Hauptwert des Arguments im Intervall (−π, π] erreicht wird.
Der Betrag der komplexen Zahl ez ist durch ex , also durch cos(w + z) = cos w cos z − sin w sin z,
den Realteil der Zahl z festgelegt, und das Argument von ez sin(w + z) = cos w sin z + sin w cos z
wird ausschließlich durch den Imaginärteil von z bestimmt.
Übrigens lässt sich so für jede komplexe Zahl z ∈ C ihre ablesen. Insbesondere folgt die häufig verwendete Identität
Polarkoordinatendarstellung angenehmer schreiben.
cos2 z + sin2 z = 1

Polarkoordinatendarstellung komplexer Zahlen


für alle komplexen Zahlen z ∈ C, indem wir im ersten Addi-
Für eine komplexe Zahl z ∈ C gilt: tionstheorem w = −z setzen.
z = r(cos ϕ + i sin ϕ) = reiϕ ,
Beispiel Viele Beziehungen zwischen den elementaren
wobei r der Betrag und ϕ das Argument der Zahl z sind. Funktionen ergeben sich aus dem Zusammenhang zwischen
Exponentialfunktion und trigonometrischen Funktionen. Wir
Beispiel Für komplexe Zahlen z, die in der komplexen können zum Beispiel das Konjugieren bei den trigonometri-
Ebene auf der Kreislinie mit Radius 2 um den Ursprung lie- schen Funktionen betrachten. Es gilt:
gen, soll der Betrag |eiz | bestimmt werden.
1 iz 1
Die Kreislinie mit Radius 2 lässt sich durch cos z = (e + e−iz ) = (e−iz + eiz ) = cos(z)
2 2
 
K = z = 2eiϕ ∈ C | 0 ≤ ϕ < 2π und

1 iz 1
beschreiben. Somit folgt mit der Euler’schen Formel für sin z = − (e − e−iz ) = − (e−iz − eiz ) = sin(z).
z ∈ K, dass 2i 2i

|eiz | = |ei2e | = |ei2(cos ϕ+i sin ϕ) | Auch der Real- und der Imaginärteil etwa der komplexen
= |e−2 sin ϕ+i2 cos ϕ | = e−2 sin ϕ Zahl cos z für z = x + iy ∈ C ergibt sich aus der Euler’schen
Formel. Für den Realteil erhalten wir aus der Summe der
gilt.  komplexen Zahl mit ihrer konjugiert komplexen Zahl die
Gleichung:
Nutzen wir die Symmetrien des Kosinus und des Sinus, so
ergeben sich aus eiz = cos z + i sin z die nützlichen Identitä- 1 1
Re cos z = (cos z + cos z) = (cos z + cos z)
ten 2 2
1  i(x+iy) 
1 iz 1 iz = e + e−i(x+iy) + ei(x−iy) + e−i(x−iy)
cos z = (e + e−iz ) und sin z = (e − e−iz ). 4
2 2i 1  ix −y 
= e e + e−ix ey + eix ey + e−ix e−y
4
? 1  y ix 
= e (e + e−ix ) + e−y (eix + e−ix )
Überlegen Sie sich die Identitäten cos(iz) = cosh z und 4
sin(iz) = i sinh z. 1 y
= (e + e−y )(eix + e−ix ) = cos x cosh y
4
406 11 Potenzreihen – Alleskönner unter den Funktionen

Übersicht: Euler’sche Formel und Trigonometrische Funktionen


Wesentliche Eigenschaften der Sinus- und der Kosinusfunktion haben wir im Text gezeigt. Da sie oft genutzt werden, stellen
wir sie nochmal zusammen und ergänzen dies durch einige weitere Folgerungen aus den Additionstheoremen.

Euler’sche Formel (z ∈ C) Additionstheoreme (z, w ∈ C)

eiz = cos z + i sin z, sin(w + z) = sin w cos z + cos w sin z,


−iz cos(w + z) = cos w cos z − sin w sin z.
e = cos z − i sin z,
1  iz 
cos z = e + e−iz , Folgerungen aus den Additionstheoremen
2
1  iz 
sin2 z + cos2 z = 1,
sin z = e − e−iz .
2i π
sin(z + ) = cos z,
Polarkoordinatendarstellung 2
π
cos(z + ) = − sin z,
z = r(cos ϕ + i sin ϕ) = reiϕ 2
sin 2z = 2 sin z cos z,
mit r = |z| und ϕ = arg(z).
cos 2z = cos2 z − sin2 z = 2 cos2 z − 1,
Graphen in R w±z w∓z
sin w ± sin z = 2 sin cos ,
2 2
w+z w−z
1
cos sin cos w + cos z = 2 cos cos ,
2 2
w+z w−z
cos w − cos z = 2 sin sin ,
2 2
π
2
π 3π 2π x 1
2
sin w sin z = (cos(w − z) − cos(w + z)) ,
−1 2
1
cos w cos z = (cos(w − z) + cos(w + z)) ,
2
2π-Periodizität 1
sin w cos z = (sin(w − z) + sin(w + z)) .
2
sin(z + 2π) = sin z, cos(z + 2π) = cos z.
Weitere trigonometrische Funktionen
Symmetrie
sin z π
tan z = , z = (2n + 1) , n ∈ Z,
sin(−z) = − sin z, cos(−z) = cos z. cos z 2
cos z
Nullstellen cot z = , z = nπ, n ∈ Z,
sin z
π
sin(nπ) = 0, cos( + nπ) = 0 für n ∈ Z. 1 π
2 sec z = , z = (2n + 1) , n ∈ Z,
cos z 2
Wertetabelle
1
π π π π csc z = , z = nπ, n ∈ Z.
ϕ 0 sin z
6 4 √3 2
1 1 3 Umkehrfunktionen im Reellen
sin 0 √ 1
2 2 2
√ arccos : [−1, 1] → [0, π ],
3 1 1
cos 1 √ 0 , π π-
2 2 2 arcsin : [−1, 1] → − , ,
2 2
Maxima und Minima auf R , π π-
 arctan : R → − , ,
2 2
sin( π2 + nπ) = (−1)n
für n ∈ Z.
cos(nπ) = (−1)n arccot : R → [0, π].
11.4 Trigonometrische Funktionen 407

und die Fehlerabschätzung:


) )
1 1 ) sin x ) 2
Im cos z = (cos z − cos z) = (cos z − cos z) ) − 1 ) ≤ x ≤ 2 für reelle |x| ≤ 2.
2i 2i ) x ) 6 3

1 i(x+iy) 
= e + e−i(x+iy) − ei(x−iy) − e−i(x−iy) Somit ist sin x > 0 für x ∈ (0, 2]. Aus den Additionstheore-
4i
1  ix −y  men folgt:
= e e + e−ix ey − eix ey − e−ix e−y ' ( ' (
4i x+y y−x
cos(x) − cos(y) = 2 sin sin >0
1  y  2 2
= e (−eix + e−ix ) + e−y (eix − e−ix )
4i für alle x, y ∈ (0, 2) mit y > x. Also ist die Kosinusfunktion
1
= − (ey − e−y )(eix − e−ix ) = − sin x sinh y. streng monoton fallend auf dem Intervall (0, 2), und es kann
4i nur eine Nullstelle x̂ ∈ [0, 2] geben (Abb. 11.11). 

f (x)

Nullstellen der trigonometrischen Funktionen 1

Wir haben die Exponentialfunktion, Kosinus und Sinus über


ihre Potenzreihendarstellungen definiert, ohne die geometri-
sche Anschauung. Weiter ergibt sich die Möglichkeit einer
exakten Definition der Zahl π. −2 −1 1 2 x
cos x
Aus den allgemeinen Eigenschaften von Potenzreihen wissen
wir, dass cos : R → R eine stetige Funktion ist. Um eine
Nullstelle dieser Funktion zu charakterisieren, können wir −1 1 − 12
x
also den Nullstellensatz anwenden.
Abbildung 11.11 Die Funktionen cos(x) und 1 − x 2 /2 im Vergleich.

Die Zahl π
Beispiel Setzen wir in der Euler’schen Formel t = π, so
Die Funktion cos : R → R besitzt genau eine Nullstelle
erhalten wir die schöne Identität
x̂ im Intervall [0, 2] ⊆ R. Diese Nullstelle definiert die
Zahl π = 2x̂. eiπ = −1,
(siehe Titelbild des Kapitels). 
Beweis: Mit der Potenzreihe zum Kosinus ist für reelle Zah-
len durch Aus sin2 π
= cos2 π
+ sin2 π
= 1 folgt weiter, dass
2 2 2

! ∞
! π
(−1)n (−1)n sin =1
1 − cos x = x 2n = x 2 x 2n 2
(2n + 2)! (2n + 2)!
n=1 n=0
ist, da sin π2 > 0 gelten muss, wie wir im obigen Beweis ge-
eine alternierende Reihe gegeben. Außerdem fällt die Folge sehen haben. Alle weiteren reellen Nullstellen und Extrema
(x 2n /(2n + 2)!) für |x| ≤ 2 monoton und konvergiert gegen der trigonometrischen Funktionen sin und cos, wie sie in der
0. Also lässt sich das Leibniz-Kriterium (siehe Seite 361) Übersicht auf Seite 406 aufgelistet sind, folgen nun aus der
anwenden, und wir erhalten die Fehlerabschätzung: Identität
 π n  π n
) ) π π
) ein 2 = ei 2 = cos + i sin = in .
x2 ) x 2 )) x4 16 2 2 2
cos x − 1 + ≤ )1 − cos x − ) ≤ ≤ =
2! ) 2! ) 4! 24 3 So sehen wir etwa aus eiπ = −1 die Werte

für x ∈ R mit |x| ≤ 2. Somit ist cos 2 ≤ 1 − 22 /2! + 2/3 = cos π = −1 und sin π = 0.
−1/3 < 0.
Beispiel Aus den speziellen Werten und den Additions-
Andererseits erkennen wir aus der Definition, dass cos 0 = theoremen ergeben sich weitere nützliche Beziehungen der
1 > 0 ist. Damit existieren nach dem Nullstellensatz (siehe trigonometrischen Funktionen. So erhalten wir mit den Ad-
Seite 336) Nullstellen im Intervall [0, 2]. ditionstheoremen bei einer Phasenverschiebung um π2 :
Nun bleibt noch zu zeigen, dass es nur eine einzige Nullstelle  π π π
ist. Wiederum nach dem Leibniz-Kriterium gilt für die Reihe cos z + = cos z cos − sin z sin = − sin z
2 2 2

! und
(−1)n  π
sin x
= x 2n π π
x (2n + 1)! sin z + = cos z sin − sin z cos = cos z. 
n=0 2 2 2
408 11 Potenzreihen – Alleskönner unter den Funktionen

Beispiel: Rechnen mit der Euler’schen Formel


Bestimmen Sie alle z ∈ C mit
cos z = 4.

Problemanalyse und Strategie: Es gibt zwei Wege zur Berechnung der Lösungen. Zum einen kann der Kosinus
direkt durch die Exponentialfunktion ausgedrückt werden, was auf eine quadratische Gleichung führt. Der zweite Weg
ist die Aufspaltung der Gleichung in Real- und Imaginärteil, was zu einem Gleichungssystem mit zwei Unbekannten
führt. In beiden Fällen ist die Euler’sche Formel das zentrale Werkzeug.

Lösung: oder
Wir wollen beide Lösungswege vorführen. Im ersten Fall √
verwenden wir die Darstellung der Kosinus-Funktion, die z = 2π n − i ln(4 ± 15), n ∈ Z.
wir aus der Euler’schen Formel gewonnen haben:
Für den zweiten Weg schreiben wir z = x + iy mit x,
1  iz 
y ∈ R. Dann haben wir schon mit der Euler’schen Formel
cos z = e + e−iz .
2 berechnet, dass
Dies setzt man in die Gleichung ein und multipliziert auf
Re cos z = cos x cosh y
beiden Seiten mit 2eiz :

e2iz + 1 = 8eiz . und

Wenn wir w = eiz substituieren, erkennen wir, dass es Im cos z = − sin x sinh y
sich um eine quadratische Gleichung handelt:
ist. Wir können also Real- und Imaginärteil der Gleichung
2 getrennt betrachten, d. h.,
w − 8w + 1 = 0.

Mit quadratischer Ergänzung bestimmen wir die Lösun- cos x cosh y = 4, sin x sinh y = 0.
gen
Dies ist ein Gleichungssystem in x, y ∈ R. Die zweite

(w − 4)2 − 15 = 0, d. h., w = 4 ± 15. Gleichung kann nur erfüllt sein, falls y = 0 oder aber
sin x = 0 ist. Die Annahme y = 0 bedeutet cosh y = 1.
Wir müssen noch resubstituieren: Dann kann die erste Gleichung für ein reelles x nicht gel-
√ ten. Also muss sin x = 0 sein, d. h., x = π n mit n ∈ Z.
4 ± 15 = w = eiz . Es gilt cos x = cos(nπ ) = (−1)n . Da cosh y > 0 ist,
muss cos x ≥ 0 sein, damit die erste Gleichung erfüllt ist.
Gesucht sind alle z ∈ C, die diese Gleichung erfüllen.
Es folgt, dass n gerade und somit cos x = 1 ist. Damit er-
Ist allerdings eine Lösung gefunden, so unterscheidet sich
gibt sich schließlich y = ± arcosh 4 – beachten Sie, dass
jede weitere davon nur durch ein Vielfaches von 2πi. Eine
cosh nur abschnittsweise umkehrbar ist. Die Lösung auf
besondere Lösung z ist diejenige, bei der iz reell ist. Diese
dem zweiten Weg ist also
erhält man durch Anwendung des natürlichen Logarith-
mus. Daher gilt: z = x + iy = 2π n ± i arcosh 4, n ∈ Z.

iz = ln(4 ± 15) + 2πi n, n ∈ Z,

Kommentar: Auf den ersten Blick sehen die Lösungen, die wir auf den zwei Wegen gewonnen haben, unterschiedlich
aus. Es gilt aber:
' (  √ 
 √  1  ln(4±√15) √  1 √ 1 1 √ 4 ∓ 15
− ln(4± 15)
cosh ln 4 ± 15 = e +e = 4 ± 15 + √ = 4 ± 15 + = 4.
2 2 4 ± 15 2 16 − 15

Es handelt sich also um dieselbe Lösung in zwei verschiedenen Darstellungen.


11.5 Der Logarithmus 409

11.5 Der Logarithmus Außerdem gilt für den Hauptwert des Logarithmus stets
Im(ln z) ∈ (−π, π].
Aus den anschaulichen Abbildungseigenschaften der Expo- Wir müssen noch prüfen, ob der so definierte Logarithmus
nentialfunktion auch im Komplexen eine Umkehrfunktion zur Exponential-
funktion ist. Dies ergibt sich direkt aus der Euler’schen For-
|ez | = eRe(z) und arg (ez ) = Im(z) + 2nπ, mel und Polarkoordinaten.
wobei n ∈ N so zu wählen ist, dass arg (ez ) ∈ (−π, π] gilt, Folgerung: Es gilt:
können wir uns eine Definition der Umkehrfunktion der Ex-
ponentialfunktion, den Logarithmus, verschaffen. Dazu müs- eln z = z für z = 0,
sen die beiden Beziehungen umgekehrt werden. Offensicht- ln(ez ) = z für Im(z) ∈ (−π, π].
lich benötigen wir zunächst den Logarithmus im Reellen.

Lemma
Beweis: Die Identitäten lassen sich mit der Euler’schen
Die Funktion exp : R → R ist streng monoton steigend.
Formel nachrechnen. Für z ∈ C\{0} ist

exp(ln z) = eln |z|+iarg(z)


Beweis: Die Monotonie der Exponentialfunktion ergibt
sich direkt aus der charakterisierenden Ungleichung (siehe = eln |z| (cos(arg(z)) + i sin(arg(z))) = z.
Seite 398). Denn für h > 0 gilt eh ≥ 1 + h > 1. Mit der
Funktionalgleichung folgt Monotonie durch Und für alle z ∈ C mit Im(z) ∈ (−π, π] folgt:

ex+h = ex eh > ex ln(exp(z)) = ln |ez | + i arg(ez ) = ln(eRe z ) + iIm(z)


= Re(z) + i Im(z) = z. 
für alle x ∈ R. 

Monotonie von exp liefert die Somit ist der Logarithmus die Umkehrfunktion zu exp :
Umkehrfunktion für reelle Argumente {z ∈ C | −π < Im z ≤ π } → C\{0}.

Im Im
Mit der Folgerung auf Seite 312 existiert die Umkehrfunk- C \ {0} ln
tion zu exp : R → R>0 . Die Surjektivität der Abbildung π
sieht man aus exp(x) → ∞ für x → ∞, dem Grenzwert
lim exp(−x) = lim 1/ exp(x) = 0 und dem Zwischen-
x→∞ x→∞
Re Re
wertsatz. Wir bezeichnen diese Umkehrfunktion als den
natürlichen Logarithmus ln : R>0 → R. −π

Die Umkehrung der Exponentialfunktion Abbildung 11.12 Das Bild des Hauptwerts des komplexen Logarithmus auf
C\{0}.
Mithilfe des Logarithmus auf R lässt sich nun diese Funk-
tion auch auf die komplexe Ebene fortsetzen. Betrachten wir Eine Translation des Imaginärteils im Argument der Expo-
die ersten beiden Identitäten im Abschnitt, so wird deutlich, nentialfunktion um ganzzahlige Vielfache von 2π ändert den
wie der komplexe Logarithmus als Umkehrung dieser beiden Funktionswert nicht, denn mit der Euler’schen Formel ist
Gleichungen zu bilden ist.
ex+i(y+2πn) = ex (cos(y + 2π n) + i sin(y + 2π n))

Der komplexe Logarithmus = ex (cos y + i sin y) = ex+iy


Für eine komplexe Zahl z ∈ C\{0} ist durch für n ∈ Z. Dies zeigt, dass die Beschränkung im Bild auf den
Streifen −π < Im z ≤ π für die Umkehrung der Exponen-
ln z = ln |z| + i arg(z)
tialfunktion nötig ist (Abb. 11.12), damit wir eine bijektive
der Hauptwert des Logarithmus gegeben, wenn Abbildung betrachten.
arg(z) ∈ (−π, π] den Hauptwert des Arguments von Im Reellen ist eln x+ln y = eln x · eln y = xy für x, y > 0.
z bezeichnet. Mit der Definition überträgt sich die Funktionalgleichung des
Logarithmus auch ins Komplexe. Wir müssen aber aufpassen,
Beachten Sie, dass die Definition für den Realteil ln |z| den dass die auftretenden Argumente im Definitionsbereich des
Logarithmus auf den reellen positiven Zahlen voraussetzt. Hauptwerts bleiben.
410 11 Potenzreihen – Alleskönner unter den Funktionen

Funktionalgleichung des komplexen Logarithmus Im (ln(z))

Für w, z ∈ C gilt:

ln w + ln z = ln(wz) + 2πβi, Im (z)

für Re (z)

⎨ 1, falls arg(w) + arg(z) > π,
β= 0, falls − π < arg(w) + arg(z) ≤ π,

−1, falls arg(w) + arg(z) ≤ −π.

Die Fallunterscheidung wird notwendig, da sich beim Pro-


dukt wz die Argumente der komplexen Zahlen addieren, d. h.,
arg w + arg z ∈ (−2π, 2π]. Auf der anderen Seite ist aber Abbildung 11.13 Der Imaginärteil des Hauptzweigs beim Logarithmus mit der
nach Definition stets das Argument arg(wz) ∈ (−π, π]. Um Unstetigkeit auf der negativen reellen Achse.
also den Hauptwert des Arguments von wz zu bekommen,
muss gegebenenfalls der Wert der Summe der beiden Winkel
um 2π vergrößert oder verkleinert werden.
Über den Logarithmus ist die allgemeine
Potenzfunktion definiert
Beispiel Für die Zahlen
√ iπ Behalten wir diese Einschränkung im Hinterkopf, so er-
v =1+i= 2e 4 , schließt sich mit dem Hauptzweig des Logarithmus auch die
√ −i 3π
w = −1 − i = 2e 4 , allgemeine Potenzrechnung.

z = −2 = 2eiπ
Die allgemeine Potenzfunktion
erhalten wir die Produkte: Für a ∈ C\{0} ist durch
i π4 −i 3π −i π2
vw = 2e e = 2e = −2i,
4
√ i π iπ √ i 5π a z = ez ln a
vz = 2 2e 4 e = 2 2e 4 = −2 − 2i.
der Hauptwert der allgemeinen Potenz definiert. Im
Damit folgt für den Hauptwert des Logarithmus aus diesen Fall a = 0 und z = 0 definieren wir a z = 0.
beiden Produkten:
√ π √ 3π
ln v + ln w = ln 2 + i + ln 2 − i Achtung: Bei dieser Definition ist zu beachten, dass dem
4 4
π Ausdruck 00 keine sinnvolle Bedeutung zugeordnet werden
= ln 2 − i = ln(−2i) = ln(vw) kann. Wenn Ihnen bei Grenzwerten ein solcher Ausdruck
2
begegnen sollte, müssen Sie genau hinsehen und die Konver-
und
√ genz analysieren.
π
ln v + ln z = ln 2 + i + ln 2 + iπ
4
√ 5π Beispiel Gesucht sind Real- und Imaginärteil der Zahl ii .
= ln 2 2 + i Wir verwenden den Hauptwert des Logarithmus und erhalten
'4 (
√ 3π  
= ln 2 2 + −i + i2π = ln(vz) + i2π. ln 1+i π2 π
4 ii = ei ln(i) = ei = e− 2 . 

Wegen der Einschränkung des Definitionsbereichs beim
Logarithmus, ist beim Wurzelzeichen Vorsichtig geboten.
Da der Hauptwert des Logarithmus nur auf dem Streifen
Wählen wir den Hauptwert, so erhalten wir etwa die Identität
−π < Im(z) ≤ π als Umkehrfunktion der Exponentialfunk-
tion betrachtet werden kann, sind manchmal auch sogenannte 1 1 1 π
(−1) 3 = e 3 ln(−1) = e 3 (ln 1+iπ) = ei 3 .
Nebenzweige, also Phasenverschiebungen um ganzzahlige
Vielfache von 2π, zu betrachten, d. h.: Andererseits wird man im Zusammenhang√mit der reellen
ln(z) + i2πm, mit m ∈ Z. Umkehrfunktion häufig auch die Notation 3 −1 = −1 fin-
den, bei der ein Nebenzweig der dritten Wurzel genutzt
In Abbildung 11.13 bedeutet dies, dass wir an der Nahtstelle wird. Wir verwenden die Potenzschreibweise im ersten Fall
1
bei der negativen reellen Achse die gezeigte Fläche stetig ausschließlich für den Hauptzweig, d. h., (−1) 3 = −1.
nach oben oder unten ankleben. Auch beim Symbol für die Quadratwurzel legen wir den
11.5 Der Logarithmus 411

Beispiel: Arcussinus und der komplexe Logarithmus


Gesucht ist D ⊆ C, sodass sin : D → C umkehrbar ist mit sin−1 : C → D und der Darstellung
1  
sin−1 (z) = arcsin(z) = ln iz + (1 − z2 )1/2 .
i
 iw 
1
Problemanalyse und Strategie: Die angegebene Formel lässt sich durch Auflösen von z = sin w = 2i e − e−iw
herleiten. Wenn sin(sin−1 (z)) = z für z ∈ C und sin−1 (sin(w)) = w für w ∈ D gilt, so folgt Bijektivität von
sin : D → C, falls noch sin−1 (z) ∈ D für alle z ∈ C gezeigt wird.

Lösung: Mit sin(sin−1 (z)) = z ergibt sich die Surjektivität von


Wir zeigen zunächst die Umkehreigenschaften. Da sin : D → C. Setzen wir z = x + iy, so ist nach einigen
eln(v) = v für alle v ∈ C\{0} und iz + (1 − z2 )1/2 = 0 Umformungen mit der komplexen Wurzel (s. Aufgabe ):
keine Lösung besitzt, ist
% ' %  (
  ' (
1
1  1 Re(iz + 1 − z2 ) = iz + 1 − z2 − iz + 1 − z2
sin sin−1 (z) = sin ln iz + (1 − z2 ) 2 2
i . 
1     1
1 = −y + √ 1 − x 2 + y 2 + (1 − x 2 − y 2 )2 + 4y 2 .
= exp ln iz + (1 − z2 ) 2 2
2i   
1
− exp − ln iz + (1 − z2 ) 2 Weiter schätzen wir ab im Fall y 2 ≥ 1−x 2 : 1−x 2 +y 2 +
%
  (1 − x 2 − y 2 )2 + 4y 2 ≥ 1 − x 2 + y 2 + y 2 − (1 − x 2 ) =
1 2 21 1
= iz + (1 − z ) − 1
=z 2y 2 . Im anderen Fall, y 2 < 1 − x 2 , folgt:
2i iz + (1 − z2 ) 2 
1−x 2 +y 2 + (1 − x 2 − y 2 )2 + 4y 2 ≥ 1−x 2 +y 2 ≥ 2y 2 .
für alle z ∈ C. Bei der Berechnung
1  1

In jedem Fall ist der Ausdruck größer als 2y 2 , und wir
sin−1 (sin w) = ln i sin w + (1 − sin2 w) 2
i erhalten für alle z ∈ C die Abschätzung:
1 1 
= ln (i sin w + cos w) = ln(eiw ) = w  1

i i Re iz + (1 − z2 ) 2 ≥ −y + y 2 = −y + |y| ≥ 0.
müssen wir an zwei Stellen aufpassen und Bedingun-
gen an w ∈ D voraussetzen: In der letzten Zeile wird Die beiden in D enthaltenen Strahlen auf dem Rand er-
ln(eiw ) = w genutzt. Dies ist korrekt, wenn Im(iw) ∈ geben sich durch Einsetzen von z = s mit s > 1 bzw.
(−π, π] bzw. Re(w) ∈ (−π, π]. Ein weiteres Problem s < −1. Die folgende Abbildung illustriert, wie Geraden
versteckt sich in der zweiten Zeile. Es wird (1 − mit konstantem Realteil durch sin z auf Hyperbeln abge-
sin2 w)1/2 = cos w verwendet. Die Gleichung ist rich- bildet werden.
tig, wenn cos w der Hauptzweig der Wurzel von cos2 w
ist. Dies gilt nur unter der zusätzlichen Einschränkung Im Im
Im(2 ln(cos w)) ∈ (−π, π] bzw. arg(cos w) ∈ (− π2 , π2 ] sin
(siehe Seite 412). Damit ist entweder Re(cos(w)) =
cos(Re(w)) cosh(Im(w)) > 0, also Re(w) ∈ (− π2 , π2 ),
oder im Fall Re(cos(w)) = 0, d. h., Re(w) = ± π2 , gilt
− π2 π Re −1 1 Re
Im cos(w) = − sin(Re(w)) sinh(Im(w)) > 0 (siehe Seite 2
407). Im zweiten Fall ergeben sich die beiden Möglich-
keiten Re(w) = π2 und Im(w) < 0 oder Re(w) = − π2
und Im(w) > 0. Daher sind auf dem Rand zwei Strahlen
auszuschließen. Es folgt die Definitionsmenge:
Bemerkung: Würden wir im Ausdruck für w ein ne-
 π π  F  π  
D = w ∈ C | − ≤ Re(w) ≤ ± + it : t > 0 . gatives Vorzeichen vor der Wurzel wählen, so erhalten
2 2 2 wir die Umkehrung des Sinus auf dem Definitionsbereich
Die Injektivität von sin : D → C ergibt sich aus den {z ∈ C | −π < Re(z) < −π/2} ∪ {z ∈ C | π/2 <
Umkehrformeln. Mit sin v = sin w für v, w ∈ D folgt Re(z) < π} → C. Die Umkehrungen auf anderen Strei-
v = sin−1 (sin v) = sin−1 (sin w) = w. fen ergeben sich durch entsprechende Nebenzweige. Mit
der Translation cos w = sin(w + π/2) lassen sich die Er-
1 1
Es ist noch zu zeigen, dass w = 1i ln(iz + (1 − z2 ) 2 ) ∈ D, gebnisse auf den Kosinus mit w = 1i ln(z + (z2 − 1) 2 )
1
d. h., Re(iz + (1 − z2 ) 2 ) ≥ 0 für alle z ∈ C gilt. übertragen.
412 11 Potenzreihen – Alleskönner unter den Funktionen

Hauptzweig fest, also insbesondere die übliche Konvention, Andererseits erhalten wir:

dass mit a die positive Wurzel einer reellen Zahl a ≥ 0  √ 
1
ln 2−i 43 π √ 3
gemeint ist. Nur mit√dieser Festlegung ist die häufig verwen- 2 e−i 8 π ,
1/2 4
(−1 − i) =e 2
=
dete Schreibweise −1 = i sinnvoll. Bei einer Verwendung
des Wurzelsymbols sollten Sie stets berücksichtigen, wel- d. h., wir berechnen die zweite Lösung der quadratischen
cher Zweig des Logarithmus der Notation zugrunde liegt, Gleichung z2 = −1 − i. 
um Fehler zu vermeiden.
Die Funktionalgleichung der Exponentialfunktion überträgt Achtung: Aus dem Reellen geläufige Rechenregeln für
sich direkt auf die allgemeine Potenz und wir erhalten für Potenzen übertragen sich teilweise nur mit Einschränkungen
a ∈ C\{0}: ins Komplexe. Im Zweifelsfall müssen neben dem Hauptwert
a w a z = ew ln a ez ln a = e(w+z) ln a = a w+z des Logarithmus auch Nebenwerte mit überprüft werden.

für alle w, z ∈ C.
Für die Umkehrung der allgemeinen Potenzfunktion nutzen
Mit der allgemeinen Definition lassen sich auch weitere wir die Definition des natürlichen Logarithmus und erhalten
Regeln zur Potenzrechnung nachvollziehen. Es gilt: für z ∈ C\{0} und a ∈ C\{0, 1} die Darstellung des Haupt-
x )y werts
(ex )y = e(ln e = exy ln z
loga z = .
für alle x, y ∈ C mit Im(x) ∈ (−π, π]. Analog gilt die Be- ln a
ziehung für die allgemeine Potenz zu einer Basis a ∈ C\{0}, Mit dem natürlichen Logarithmus ergeben sich aus der De-
wenn Im(x ln a) ∈ (−π, π] ist. finition die Umkehreigenschaften

? ln z
a loga (z) = eln a ln a = z
Was ergibt sich für (ex )y , wenn Im(x)  ∈ (−π, π ]?
und
ln(ez ln a ) 2π m
Achtung: Beachten Sie, dass (a x )y  = a (x y )
ist. Klammern loga (a z ) = =z+ i,
ln a ln a
sind bei solchen Ausdrücken also stets erforderlich.
wenn m ∈ Z so gewählt wird, dass Im(z ln a) + 2π m ∈
Aufpassen müssen wir auch bei der Anwendung einer ande- (−π, π] ist.
ren aus dem Reellen geläufigen Regel zur Potenzrechnung.
Es gilt für a, b ∈ C\{0} mit arg a + arg b ∈ (−π, π] die
?
Wie lautet die Funktionalgleichung für loga und welche Vor-
Gleichung:
aussetzungen müssen gelten?
a z bz = ez ln a ez ln b = ez(ln a+ln b) = ez ln(ab) = (ab)z .
Dabei ist die Voraussetzung arg a + arg b ∈ (−π, π] not- In den letzten drei Abschnitten haben wir gesehen, dass sich
wendig, denn wir haben die Funktionalgleichung des Loga- die grundlegenden Funktionen wie die Exponentialfunktion,
rithmus angewandt. Sobald die Bedingung nicht erfüllt ist, der Kosinus oder der Sinus alle mittels Potenzreihen defi-
muss man den zusätzlichen Term der Funktionalgleichung nieren lassen. Weitere Darstellungen von Funktionen durch
für β = 0 berücksichtigen. Potenzreihen um passende Entwicklungspunkte etwa zum
Logarithmus wollen wir an dieser Stelle noch aufschieben.
Beispiel Betrachten wir a = i und b = (−1 + i), so ist Indem wir uns zunächst mit dem Differenzieren beschäfti-
die Bedingung für das Argument verletzt. In der Tat gilt mit gen, ergibt sich über die Taylorreihe ein eleganter Weg, um
dem Hauptwert des Logarithmus im einen Fall: sich explizit Potenzreihen zu gegebenen Funktionen zu ver-

π ln 2 3π √ 5π
schaffen.
i1/2 (−1 + i)1/2 = ei 4 e 2 +i 8 = 2 ei 8 .
4
Zusammenfassung 413

Zusammenfassung

Potenzreihen sind Reihen mit einer speziellen Gestalt. Definition der Kosinus- und der Sinusfunktion
Durch die Potenzreihen
Definition einer Potenzreihe

!
Unter einer Potenzreihe versteht man eine Reihe der (−1)k
cos z = z2k ,
Form ∞  (2k)!
k=0
! ∞
n
an (z − z0 ) . ! (−1)k 2k+1
sin z = z
n=0 (2k + 1)!
k=0
Hierbei ist z ∈ C ein Parameter, (an ) eine Folge von
komplexen Koeffizienten, die feste Zahl z0 ∈ C heißt sind die trigonometrischen Funktionen für alle z ∈ C
Entwicklungspunkt. definiert.

Jeder Potenzreihe lässt sich ein Konvergenzradius r ∈ Höhepunkt ist der Zusammenhang zwischen der Exponen-
R≥0 ∪ {∞} zuordnen, sodass die Reihe im Konvergenzkreis tialfunktion und den trigonometrischen Funktionen, der etwa
um den Entwicklungspunkt z0 , also für längs der imaginären Achse durch die Euler’sche Formel be-
schrieben ist
z ∈ {z ∈ C | |z − z0 | < r} ,
Die Euler’sche Formel
absolut konvergiert und außerhalb für |z − z0 | > r divergiert.
Auf dem Kreisrand mit |z − z0 | = r kann keine allgemeine Für t ∈ R gilt:
Konvergenzaussage gemacht werden.
eit = cos t + i sin t.
Innerhalb des Konvergenzkreises ist durch
∞ Alle möglichen Varianten, diesen Zusammenhang in der
!
wie etwa e = cos z +
n komplexen Ebene auszudrücken, iz
f (z) = an (z − z0 ) 
1 iz
i sin z oder cos z = 2 e + e −iz sind nützlich. Auch die
n=0
Polarkoordinatendarstellung komplexer Zahlen lässt sich
eine stetige Funktion f : {z ∈ C | |z − z0 | < r} → C ge- mit der Euler’schen Formel elegant in der Form z = reiϕ mit
geben. Funktionen, die eine Darstellung als Potenzreihe be- Radius r und Winkel ϕ angeben.
sitzen, heißen analytisch.
Neben diesen Verbindungen zwischen exponentiellen und
Der Identitätssatz besagt, dass Potenzreihen um denselben trigonometrischen Funktionen, sind ihre Umkehrfunktionen
Entwicklungspunkt auf einem Kreis mit Radius r > 0 dann von zentraler Bedeutung. Im Mittelpunkt steht dabei der all-
und nur dann identisch sind, wenn alle Koeffizienten über- gemeine komplexe Logarithmus.
einstimmen. Damit ergibt sich die Möglichkeit des Koeffi-
zientenvergleichs, wenn zwei analytische Funktionen über-
Der komplexe Logarithmus
einstimmen.
Für eine komplexe Zahl z ∈ C\{0} ist durch
Die Exponentialfunktion wird durch ihre Potenzreihe defi-
niert. ln z = ln |z| + i arg(z)

Definition der Exponentialfunktion der Hauptwert des Logarithmus gegeben, wenn


Die Exponentialfunktion exp : C → C ist für alle z ∈ C arg(z) ∈ (−π, π] den Hauptwert des Arguments von
definiert durch die Potenzreihe z bezeichnet.

!
exp(z) =
1 n
z . Zu beachten ist, dass die Umkehreigenschaft exp(ln z) = z
n! für alle z ∈ C\{0} gilt, aber ln(exp(z)) = z für den Hauptwert
n=0
nur unter der Einschränkung z ∈ {z ∈ C | Im(z) ∈ (−π, π]}
richtig ist. Aus diesem Grund sind auch Nebenzweige, also
Eigenschaften der Exponentialfunktion wie etwa die Funk- Phasenverschiebungen um ganzzahlige Vielfache von 2π ,
tionalgleichung, exp(x + y) = exp(x) exp(y) ergeben sich d.h. ln(z) + i2π m, mit m ∈ Z , manchmal zu berücksich-
direkt aus der Potenzreihendarstellung. tigen. Bei der Funktionalgleichung für den Logarithmus und
Auch die trigonometrischen Funktionen sind durch Potenz- einigen anderen Rechenregeln zu Potenzfunktionen ist des-
reihen gegeben. wegen Vorsicht geboten.
414 11 Potenzreihen – Alleskönner unter den Funktionen

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen Rechenaufgaben
11.1 • Handelt es sich bei den folgenden, für z ∈ C 11.6 •• Bestimmen Sie den Konvergenzradius und den
definierten Reihen um Potenzreihen? Falls ja, wie lautet die Konvergenzkreis der folgenden Potenzreihen:
Koeffizientenfolge und wie der Entwicklungspunkt? ∞ 
! (k!)4
∞  ∞  (a) z k
! 3n 1 ! n (z − 1)n (4k)!
(a) (b) k=0
n! zn z2 ∞ 
n=0 n=2 !
⎛ ⎞ ∞  (b) n
n (z − 2) n
!∞ ! n ' ( !
⎝ 1 n j⎠ 2n n=1
(c) z (d) z cos z  ∞ ' ( 
n=0 j =0
n! j
n=0
! n + i 2n 2n
(c) √ z
n=0
( 2 i)n n
 ∞

11.2 • Welche der folgenden Aussagen über eine Po- ! (2 + i)n − i
tenzreihe mit Entwicklungspunkt z0 ∈ C und Konvergenz- (d) (z + i)n
in
radius ρ sind richtig? n=0

(a) Die Potenzreihe konvergiert für alle z ∈ C mit 11.7 •• Bestimmen Sie den Konvergenzradius der Po-
|z − z0 | < ρ absolut. tenzreihe ∞ 
(b) Durch die Potenzreihe ist auf dem Konvergenzkreis eine !
n 2n+1
beschränkte Funktion gegeben. 3 (x − x0 )
(c) Durch die Potenzreihe ist auf jedem Kreis mit Mittel- n=0
punkt z0 und Radius r < ρ eine beschränkte Funktion einmal direkt durch das Wurzelkriterium und einmal mit der
gegeben. Formel von Hadamard.
(d) Die Potenzreihe konvergiert für kein z ∈ C mit
|z − z0 | = ρ. 11.8 • Für welche x ∈ R konvergieren die folgenden
(e) Konvergiert die Potenzreihe für ein ẑ ∈ C mit Potenzreihen?
∞ ( 
|ẑ − z0 | = ρ absolut, so gilt dies für alle z ∈ C mit ! (−1)n (2n + 1) ' 1 n
|z − z0 | = ρ. (a) x−
n 2
n=1
∞ 
11.3 •• Bestimmen Sie mithilfe der zugehörigen Po- ! 1 − (−2)−n−1 n!
n
tenzreihen die folgenden Grenzwerte: (b) (x − 2)
n!
n=0
∞ 
! 1 ,% -n
4
1 − cos x esin(x ) − 1 %
n
(a) lim
x→0 x sin x
, (b) lim
x→0 x 2 (1 − cos(x))
. (c) n2 + n − n2 + 1 (x + 1)
n2
n=1

11.4 •• Berechnen Sie mit dem Taschenrech- 11.9 ••• Für welche z ∈ C konvergiert die Potenzreihe
ner die Differenz sin(sinh(x)) − sinh(sin(x)) für ∞ 
x ∈ {0.1, 0.01, 0.001}. Erklären Sie Ihre Beobachtung, ! (2i)n
n
(z − 2i) ?
indem Sie das erste Glied der Potenzreihenentwicklung n2 + in
n=1
dieser Differenz um den Entwicklungspunkt 0 bestimmen.
11.10 •• Gegeben ist die Funktion f : D → C mit
11.5 • Finden Sie je ein Paar (w, z) von komplexen
Zahlen, sodass die Funktionalgleichung des Logarithmus für z−1
f (z) = , z ∈ D.
β = 0, β = 1 und β = −1 erfüllt ist. z2 + 2
Antworten der Selbstfragen 415

(a) Bestimmen Sie den maximalen Definitionsbereich D ⊆ 11.15  •• Gesucht  ist eine Potenzreihendarstellung der
∞ n zu der Funktion
C von f . Form n=0 a n x
(b) Stellen Sie f als eine Potenzreihe mithilfe des Ansatzes
∞ ex
! f (x) = , x ∈ R \ {1}.
z − 1 = (z2 + 2) an zn 1−x
n=0 n 1
(a) Zeigen Sie an = k=0 k! .
dar. Was ist der Konvergenzradius dieser Potenzreihe?
(b) Für welche x ∈ R konvergiert die Potenzreihe?
11.11 ••• Bestimmen Sie die ersten beiden Glieder der
Potenzreihenentwicklung von 11.16 • Zeigen Sie: Eine durch eine Potenzreihe mit
f (x) = (1 + x) 1/n
, x > −1, Entwicklungspunkt 0 gegebene Funktion ist genau dann ge-
rade, wenn in der Potenzreihe alle Koeffizienten für ungerade
um den Entwicklungspunkt x0 = 1. Exponenten null sind.

11.12 •• Bestimmen Sie alle z ∈ C, die der folgenden 11.17 •• Die Funktion f : D → C sei durch eine Po-
Gleichung genügen: tenzreihe mit Konvergenzkreis D und Entwicklungspunkt z0
(a) cosh(z) = −1 gegeben. Ferner gelte für eine gegen z0 konvergente Folge
1 (xn ) aus D mit xn = z0 , n ∈ N, dass f (xn ) = 0 ist für alle
(b) cosh z − (1 − 8i) e−z = 2 + 2i n ∈ N. Zeigen Sie, dass f die Nullfunktion ist.
2

11.13 • Bestimmen Sie jeweils alle z ∈ C, die Lösun- 11.18 • Zeigen Sie die Formel von Moivre:
gen der folgenden Gleichung sind:
(cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ)
(a) cos z = cos z, (b) eiz = eiz .
für alle ϕ ∈ R, n ∈ Z. Benutzen Sie diese Formel, um die
Beweisaufgaben Identität
!
n ' (
11.14 • Beweisen Sie, dass die rationale Funktion 2n
cos(2nϕ) = (−1)n−k cos2(n−k) (ϕ) sin2k (ϕ)
1 + z3 2k
k=0
f (z) = , z ∈ C \ {1},
2−z
für alle ϕ ∈ R, n ∈ N0 zu beweisen.
für |z| < 2 durch die Potenzreihe
∞  
!
z z2 z n 11.19 • Zeigen Sie das Additionstheorem
f (z) = 1 + + +9
2 4 2
n=3 w+z w−z
darstellbar ist. sin w + sin z = 2 sin cos , w, z ∈ C .
2 2

Antworten der Selbstfragen

S. 383 S. 384
(a) Ja. % (−2, 2): Radius 2, Entwicklungspunkt 0.
(b) Nein: Der Term 1 − y 2 hängt von y ab, ist aber keine (0, ∞): Kein möglicher Konvergenzkreis.
Potenz von y. {−1}: Radius 0, Entwicklungspunkt −1.
(c) Nein: Der Term 1/zn passt nicht ins Schema. [1, 3]: Radius 1, Entwicklungspunkt 2.
(d) Ja: Da x 2 − 2x + 1 = (x − 1)2 ist, kann man die Reihe R: Radius ∞, Entwicklungspunkt könnte jede Zahl aus R
auch in der Form sein.
∞  ∞ 
! !
n−2 n
(x − 1) = (x − 1)
n=2 n=0
schreiben.
416 11 Potenzreihen – Alleskönner unter den Funktionen

S. 385 S. 404 √
Betrachtet man die Potenzreihe als eine gewöhnliche Reihe, Es muss z3 = 2 sein, also z = 3 2 u, wobei u ∈ C mit u3 = 1
so liefert das Wurzelkriterium das Ergebnis, dass die Reihe ist. Die dritten komplexen Einheitswurzeln sind:
absolut konvergiert, falls
0 1 2
1) ) 1) k ) e2π 3 i , e2π 3 i , e2π 3 i ,
) k
k )2
) ) )
k )2 )
) 2 2
) k 2 (z − 1) ) = ) k 2 ) |z − 1| → 2 |z − 1| < 1,
2k
also ist die Lösungsmenge der Gleichung:
√  √ √ 2π √ 4π 
3 3 3
also wenn |z − 1| < 1/ 2 ist. 2, 2 e 3 i , 2 e 3 i .
Die Potenzreihe hat aber eine etwas andere Form, als dieje-
nige aus der Definition: Es tauchen nur Potenzen mit gera-
S. 405
dem Exponenten auf. Wenn man es genau nimmt, lauten die
Es gilt:
Koeffizienten:
 1 i(iz) 1
0 n = 0 oder n = 2k − 1, k ∈ N, cos(iz) = (e + e−i(iz) ) = (e−z + ez ) = cosh(z)
an = 2 k 2 2
k2
n = 2k, k ∈ N.
und entsprechend:
Mit dieser Beobachtung lässt sich auch die Formel von Ha- 1 −z 1
damard anwenden, und wir erhalten: sin(iz) = (e − ez ) = − sinh z = i sinh z.
G 2i i
H n √
% H 22 2 √
n I
lim sup |an | = lim sup  2 = lim sup
n
= 2.
n→∞ n→∞ n n→∞ ( ) nn 2 S. 412
2 2
Für x ∈ C beliebig wähle man m ∈ Z so, dass Im(x) −
2π m ∈ (−π, π] ist. Dann folgt mit dem Hauptzweig des
Ein gern gemachter Fehler ist jedoch die Rechnung
Logarithmus:
1) ) ln(ex ) = x − 2π m i.
) k)
k )2 ) 2
) k2 ) = (√
k
k)2
−→ 2 (k → ∞),
Wir erhalten:

= exy e−2πmy i .
x )y
die nahelegt, dass der Konvergenzradius 1/2 sein könnte. (ex )y = e(ln e

S. 393
Aus der letzten Gleichheit folgt mit Koeffizientenvergleich S. 412
c2k = 0 und c2k−1 = 1/(k − 1)! für k ∈ N. Ebenfalls durch Mit a ∈ C\{0, 1} folgt im Fall arg(w) + arg(z) ∈ (−π, π]
Koeffizientenvergleich folgt a0 = 0 und an = cn für n ∈ N. die Identität
Über die Koeffizientenfolge (bn ) kann man durch Koeffizi-
loga (wz) = loga (w) + loga (z) ;
entenvergleich keine Aussage treffen, da der Entwicklungs-
punkt in dieser Potenzreihe ein anderer ist.
denn es gilt:
S. 396 ln(wz)
Wegen der geometrischen Reihe ist loga (wz) =
ln a

ln(w) ln(z)
1 ! = + = loga w + loga z.
= x 2n , |x| < 1. ln a ln a
1−x 2
n=0 Analog erhalten wir für arg(w) + arg(z) ∈ (−3π, −π]:
Damit ist 2π i
loga (wz) = loga (w) + loga (z) +
x ln a
= x + x 3 + x 5 + O(x 7 )
1 − x2
und für arg(w) + arg(z) ∈ (π, 3π]:
für x gegen 0. Da ein Ausdruck O(x 7 )
auch O(x 6 ) ist, ist
2π i
q(x) = x + x 3 + x 5 das gesuchte Polynom. loga (wz) = loga (w) + loga (z) − .
ln a
Lineare Abbildungen und
Matrizen – Brücken 12
zwischen Vektorräumen
Wie lassen sich lineare
Abbildungen durch Matrizen
darstellen?
Was besagt die
Dimensionsformel?
Wie wirkt sich ein Basiswechsel
auf die Matrix einer linearen
Abbildung aus?

12.1 Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418


12.2 Verknüpfungen von linearen Abbildungen . . . . . . . . . . . . . . . . . 422
12.3 Kern, Bild und die Dimensionsformel . . . . . . . . . . . . . . . . . . . . . 425
12.4 Darstellungsmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
12.5 Das Produkt von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
12.6 Das Invertieren von Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446
12.7 Elementarmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451
12.8 Basistransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455
12.9 Der Dualraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464
418 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Den Begriff Homomorphismus haben wir bereits im Zusammen- Anstelle von einer K-linearen Abbildung spricht man oft auch
hang mit Gruppen, Ringen und Körpern im Kapitel 4 kennenge- kurz von einer linearen Abbildung, wenn klar ist, welcher
lernt. Der Begriff ist also sehr allgemein. Ins Deutsche übersetzt Körper zugrunde liegt.
man ihn wohl am besten mit strukturerhaltende Abbildung. Ein
Homomorphismus ist also eine Abbildung zwischen Mengen, ?
welche kompatibel ist mit der Struktur, d. h. die Verknüpfungen Wieso muss V und W derselbe Körper K zugrunde liegen?
auf den zugrunde liegenden Mengen berücksichtigt. Anders gefragt: Was sollte ein Homomorphismus zwischen
einem komplexen und einem reellen Vektorraum sein?
In einem Vektorraum haben wir zwei Verknüpfungen, die Ad-
dition von Vektoren und die Multiplikation von Vektoren mit
Skalaren. Ein Homomorphismus, im Zusammenhang mit Vek- Eine K-lineare Abbildung ϕ : V → W zwischen K-Vektor-
torräumen sprechen wir auch von einer linearen Abbildung, ist räumen V und W heißt
hier eine additive und multiplikative Abbildung zwischen zwei
Vektorräumen. Monomorphismus, wenn ϕ injektiv ist,
Epimorphismus, wenn ϕ surjektiv ist,
In dieser Sichtweise ist ein Homomorphismus durchaus abstrakt. Isomorphismus, wenn ϕ bijektiv ist,
Jedoch gelingt es zumindest in endlichdimensionalen Vektor- Endomorphismus, wenn V = W ist,
räumen, nach Wahl einer Basis jedem Homomorphismus eine Automorphismus, wenn V = W und ϕ bijektiv ist.
sehr anschauliche und vertraute Gestalt zu geben. Zu jedem
Homomorphismus gehört bezüglich gewählter Basen der Vek- Ist ϕ : V → W ein Isomorphismus zwischen den K-Vektor-
torräume eine Matrix – Matrizen haben sich bereits beim Lösen räumen V und W , so sagt man, die beiden Vektorräume V und
von linearen Gleichungssystemen als sehr nützlich erwiesen. W sind isomorph zueinander. Man schreibt dann V ∼ = W
Diese den Homomorphismus darstellende Matrix charakterisiert (vgl. auch den Isomorphiebegriff zu Gruppen auf Seite 72) –
die Abbildung eindeutig. Wir können so Homomorphismen end- zwei zueinander isomorphe Vektorräume unterscheiden sich
lichdimensionaler Vektorräume bezüglich gewählter Basen mit nur in der Bezeichnung der Elemente.
Matrizen identifizieren. Das Abbilden ist dann letztlich eine
einfache Matrizenmultiplikation. Durch diesen Prozess werden
Homomorphismen bezüglich gewählter Basen durch Matrizen Wie erkennt man die Linearität einer
dargestellt. Die Eigenschaften eines Homomorphismus finden Abbildung?
sich in der Darstellungsmatrix wieder.
Jede lineare Abbildung ϕ : V → W bildet den Nullvektor
Wählt man verschiedene Basen, so erhält man im Allgemei-
0V von V auf den Nullvektor 0W von W ab, d. h.,
nen verschiedene Matrizen. In den folgenden Kapiteln werden
wir untersuchen, welche Eigenschaften der Darstellungsmatri-
ϕ(0V ) = 0W .
zen bei verschiedenen Basen erhalten bleiben. Welche Basis
vorzugsweise zu wählen ist, wird das Thema des Kapitels 14 Dies sieht man etwa wie folgt: Wegen der Additivität von ϕ
sein. gilt:

ϕ(0V ) = ϕ(0V + 0V ) = ϕ(0V ) + ϕ(0V ) .


12.1 Definition und Beispiele
Die Behauptung folgt nun nach Subtraktion von ϕ(0V ), d. h.
Der zentrale Begriff dieses Kapitels ist der Begriff der linea- Addition von −ϕ(0V ) auf beiden Seiten.
ren Abbildung.
Dieses Ergebnis eignet sich gut, um viele Abbildungen als
nicht linear zu erkennen: Die Abbildung
Lineare Abbildungen sind jene Abbildungen ⎧ 2

⎪ R → ⎛ R3 , ⎞
zwischen Vektorräumen, die additiv und ⎨' (
v1 + 1
homogen sind ϕ: v1 ⎝ v2 ⎠

⎪  →
⎩ v2
v1
Lineare Abbildungen existieren nur zwischen Vektorräumen
⎛ ⎞
über dem gleichen Körper. 1
kann nicht linear sein, da ϕ(0R2 ) = ⎝0⎠ = 0R3 gilt, also
Definition einer linearen Abbildung
0
Eine Abbildung ϕ : V → W zwischen K-Vektorräumen 0R2 nicht auf 0R3 abgebildet wird.
V und W heißt K-lineare Abbildung oder Homomor-
phismus, wenn für alle v, w ∈ V und λ ∈ K gilt: In Zukunft schreiben wir wieder einfacher 0 für den Null-
ϕ(v + w) = ϕ(v) + ϕ(w) (Additivität), vektor. Man sollte dann immer kurz nachdenken, ob 0 nun
ϕ(λ v) = λ ϕ(v) (Homogenität). ein Nullspaltenvektor, das Nullpolynom, die Nullabbildung,
die Nullmatrix oder eine andere Null darstellt.
12.1 Definition und Beispiele 419

Übersicht: Homo-, Mono-, Epi-, Iso-, Endo-, Automorphismen


Man unterscheidet Morphismen je nach Injektivität, Surjektivität und auch danach, ob Definitionsmenge und Bildmenge
übereinstimmen.

injektiv surjektiv Def.menge = Bildmenge Beispiel



R2 → R3
Homomorphismus nicht notwendig nicht notwendig nicht notwendig a  a+b 
b → 0
 0
R → 2
Ra 
Monomorphismus ja nicht notwendig nicht notwendig a → 0

Ra  → R
2
Epimorphismus nicht notwendig ja nicht notwendig
b → a
⎧ 4
⎨ 'Ra ( → R
2×2

Isomorphismus ja ja nicht notwendig  

b → ac db
⎩ dc
 2
Endomorphismus nicht notwendig nicht notwendig ja Ra  →  a−b
R2 
b → 0
 2
R
a → R
 
2
Automorphismus ja ja ja
b → a
b

Den Begriff der linearen Abbildung kann man auf verschie- ses in zwei getrennte Schritte, man zeigt die Additivität und
dene Arten definieren. die Homogenität nacheinander.
Wir untersuchen einige einfache Abbildungen auf Linearität.
Kriterien für die Linearität einer Abbildung
Für K-Vektorräume V und W und eine Abbildung Beispiel
ϕ : V → W sind die folgenden Aussagen äquivalent: Für alle K-Vektorräume V und W ist die Abbildung

V → W,
(i) Die Abbildung ϕ ist linear. ϕ:
v → 0
(ii) Für alle v, w ∈ V und λ, μ ∈ K gilt:
linear, da für alle λ ∈ K und alle v, w ∈ V die Gleichung
ϕ(λ v + μ w) = λ ϕ(v) + μ ϕ(w) .
ϕ(λ v + w) = 0 = λ 0 + 0 = λ ϕ(v) + ϕ(w)
(iii) Für alle v, w ∈ V und λ ∈ K gilt: gilt. Die lineare Abbildung ϕ ist nur dann surjektiv, wenn
W = {0} gilt. Außerdem ist sie nur dann injektiv, wenn
ϕ(λ v + w) = λ ϕ(v) + ϕ(w) . V = {0} ist.
Analog begründet man, dass in jedem K-Vektorraum V
die Identität, also die Abbildung
Beweis: Gegeben sind λ, μ ∈ K und v, w ∈ V . 
V → V,
(i) ⇒ (ii): Man wende zuerst die Additivität und dann (zwei id :
v → v
Mal) die Homogenität von ϕ an:
linear ist. Diese lineare Abbildung id ist für jeden Vektor-
ϕ(λ v + μ w) = ϕ(λ v) + ϕ(μ w) = λ ϕ(v) + μ ϕ(w) . raum V ein Automorphismus.
Für den reellen Vektorraum R2 ist die Abbildung

(ii) ⇒ (iii): Man wähle μ = 1 in (ii). ⎪
⎨ R → R ,
2 2
' ( ' 2(
(iii) ⇒ (i): Mit λ = 1 folgt die Additivität von ϕ und mit ϕ: v1 v1

⎩ v →
w = 0 folgt die Homogenität von ϕ.  2 v2
' (
1
nicht linear, wir erhalten für λ = −1 und v =
Oftmals sind Nachweise der Linearität einer Abbildung lang- 0
wierig und unübersichtlich. Wenn der Nachweis einfach zu ' ( ' (
1 −1
führen ist, empfiehlt sich die dritte Version, wenn er jedoch ϕ(λ v) = und λ ϕ(v) = ,
unübersichtlich wird, dann sollte man auf unsere Definition 0 0
zurückgreifen, sie entspricht einer Zerlegung des Nachwei- also ϕ(λ v) = λ ϕ(v).
420 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Aus der Schule ist das Differenzieren von Polynomen be- als Linearkombination von verschiedenen Basisvektoren dar-
kannt: stellen:
⎛ ⎞ v = λ1 b1 + · · · + λr br
d ⎝! !
n n
an X n ⎠ = n an X n−1 . mit λ1 , . . . , λr ∈ K und b1 , . . . , br ∈ B.
dX
j =0 j =1 Wegen der Additivität und Homogenität von ϕ gilt nun für
das Bild von v:
Im reellen Vektorraum R[X] der Polynome über R ist die-
ses Differenzieren ϕ(v) = ϕ(λ1 b1 + · · · + λr br )

d R[X] → R[X], = λ1 ϕ(b1 ) + · · · + λr ϕ(br ) .
: d
dX p  → dX p
Also ist ϕ(v) durch die Linearkombination bezüglich der Ba-
eine lineare Abbildung, da nach den bekannten Differen- sis B und die Bilder der Basisvektoren bestimmt. Wir machen
ziationsregeln für alle λ ∈ R und p, q ∈ R[X] die Glei- uns das zunutze: Ist ϕ eine lineare Abbildung von V nach W ,
chung und kennt man ϕ(b) für jedes Element b einer Basis B von
d d d V , so kennt man ϕ(v) für jedes v aus V , da sich jedes v ∈ V
(λ p + q) = λ p+ q bezüglich der Basis B darstellen lässt. Salopp lässt sich dies
dX dX dX
auch formulieren als: Wenn man weiß, was die lineare Abbil-
gilt. Diese Abbildung ist nicht injektiv, da etwa
dung mit den Elementen einer Basis macht, dann weiß man
d d auch, was die lineare Abbildung mit allen Vektoren macht.
(X + 1) = 1 = (X − 1) Dies lässt sich als Prinzip der linearen Fortsetzung noch wei-
dX dX
ter verschärfen.
gilt. Sie ist jedoch surjektiv, da für jedes Polynom p =
a0 + a1 X + · · · + an X n das Polynom Das Prinzip der linearen Fortsetzung
1 1 Ist σ eine Abbildung von der Basis B von V nach W
P = a0 X + a1 X 2 + · · · + an X n+1 ∈ R[X] 
2 n+1
B → W,
σ:
offenbar dX d d
(P ) = p erfüllt ist. Die Abbildung dX ist b → σ (b),
somit ein Epimorphismus.
so gibt es genau eine lineare Abbildung ϕ : V → W mit
Die Menge V aller konvergenter reeller Folgen bildet
ϕ|B = σ . Man nennt ϕ die lineare Fortsetzung von σ
einen Untervektorraum von RN0 , da Summe und skalare
auf V .
Vielfache konvergenter Folgen wieder konvergente Fol-
gen sind. Die Abbildung ϕ : V → R, die einer konver-
genten Folge (xn )n ∈ V ihren Grenzwert x ∈ R zuordnet, Achtung: Für σ ist nur vorausgesetzt, dass es eine Abbil-
ist linear.  dung von der Menge B in die Menge W ist.

Beweis: Wir definieren eine Abbildung ϕ : V → W wie


Auf Seite 421 geben wir in einem ausführlichen Beispiel
folgt: Schreibe jedes v ∈ V als Linearkombination bezüglich
eine lineare Abbildung an, die für alles Weitere sehr wichtig
der Basis B:
ist. Tatsächlich sind nämlich lineare Abbildungen zwischen
endlichdimensionalen Vektorräumen letztlich alle von der in v = λ 1 b 1 + · · · + λr b r ∈ V
diesem Beispiel angegebenen Form.
und setze
?
Ist ϕ eine lineare Abbildung, so gilt: ϕ(v) = λ1 σ (b1 ) + · · · + λr σ (br ) ∈ W .
ϕ(v − w) = ϕ(v) − ϕ(w) . Wir begründen, dass die so definierte Abbildung ϕ von
V nach W linear und als solche eindeutig bestimmt ist.
Ist das richtig?
Dazu seien λ ∈ K und v = λ1 b1 + · · · + λr br , w =
μ1 c1 + · · · + μs cs ∈ V mit b1 , . . . , br , c1 , . . . ., cs ∈ B
und λ1 . . . , λr , μ1 , . . . , μs ∈ K. Dann gilt:

Eine lineare Abbildung ist durch die Bilder der ϕ(λ v + w) = λ λ1 σ (b1 ) + · · · + λ λr σ (br )
Basisvektoren bereits eindeutig bestimmt + μ1 σ (c1 ) + · · · + μs σ (cs )
= λ ϕ(v) + ϕ(w) .
Wir betrachten eine lineare Abbildung ϕ zwischen zwei K-
Vektorräumen V und W . Ist B eine endliche oder unendliche Folglich ist ϕ linear, es ist noch die Eindeutigkeit zu begrün-
Basis von V , so lässt sich jedes v ∈ V auf genau eine Weise den. Sind ϕ und ψ zwei lineare Fortsetzungen von σ , so gilt
12.1 Definition und Beispiele 421

Beispiel: Die durch eine Matrix erklärte lineare Abbildung


Jede m × n Matrix A mit Einträgen aus K, d. h. A ∈ Km×n , erklärt eine lineare Abbildung vom Kn in den Km ,
 n
K → Km ,
ϕA :
v → A · v.
Dabei ist noch zu klären, was eigentlich A · v sein soll.

Problemanalyse und Strategie: Wir erklären eine Multiplikation zwischen einer Matrix mit n Spalten und einem
Spaltenvektor aus dem Kn .

Lösung: 6 · 4 + 4 · 1 + 0 · 3 = 28 .
Wir betrachten zuerst den Fall m = 1, d. h., wir erklären
vorab das Produkt einer 1 × n-Matrix Nun sei allgemeinen wieder A = (aij ) ∈ Km×n . Durch
das eben erklärte Produkt ist durch A eine Abbildung
A = z = (aj ) = (a1 , . . . , an )  n
⎛ ⎞ K → Km ,
v1 ϕA :
⎜ .. ⎟ v → A · v
mit einem Spaltenvektor v = (vj ) = ⎝ . ⎠. Für das Pro-
erklärt. Diese Abbildung ist linear, da für alle λ ∈ K und
vn
dukt setzen wir alle v = (vj ), w = (wj ) ∈ V gilt:
⎛ ⎞
v1 ⎛ ⎞
⎜ .. ⎟ !
n λ v 1 + w1
z · v = (a1 , . . . , an ) · ⎝ . ⎠ = aj vj . ⎜ .. ⎟
ϕA (λ v + w) = A · (λ v + w) = A · ⎝ . ⎠
vn j =1
λ vn + wn
Die Definition dieser Multiplikation fordert, dass die An- ⎛ n ⎞ ⎛ n ⎞ ⎛ n ⎞
zahl der Spalten von z gleich der Anzahl der Zeilen von v ⎜ a1j (λ vj + wj )⎟ ⎜ a1j vj ⎟ ⎜ a1j wj ⎟
ist, z. B. ⎜j =1 ⎟ ⎜ j =1 ⎟ ⎜ j =1 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎛ ⎞ =⎜ .. ⎟=λ⎜ .. ⎟+⎜ .. ⎟
−1 ⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟
⎜ n ⎟ ⎜ n ⎟ ⎜ n ⎟
(2, 3, 1) · ⎝ 1 ⎠ = 2 · (−1) + 3 · 1 + 1 · 2 = 3 . ⎝
amj (λvj + wj )
⎠ ⎝
amj vj
⎠ ⎝
amj wj

2 j =1 j =1 j =1
Nun erklären wir ein Produkt für Matrizen = λ (A · v) + A · w = λ ϕA (v) + ϕA (w) .
⎛ ⎞
z1 Damit ist bereits die Linearität von ϕA begründet.
⎜ .. ⎟
A = (aij ) = ⎝ . ⎠ ∈ Km×n
zm Kommentar:
Ob die lineare Abbildung ϕA injektiv oder surjektiv ist,
mit m solchen Zeilen für jede dieser Zeilen: kann man anhand der Matrix A entscheiden. Das wer-
⎛ n ⎞
den wir später untersuchen.
⎛ ⎞ ⎛ ⎞ ⎜ a v
1j j ⎟
z1 z1 · v ⎜ j =1 ⎟ Den Punkt · für diese Multiplikation einer Matrix mit
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ einer Spalte werden wir in Zukunft weglassen, wir
A · v = ⎝ ... ⎠ · v = ⎝ ... ⎠ = ⎜ ⎜
..
.


⎜ n ⎟ schreiben also kürzer A v anstelle von A · v.
zm zm · v ⎝ ⎠ Die Multiplikation einer Matrix mit einer Spalte er-
amj vj
j =1 möglicht es, lineare Gleichungssysteme in kurzer Form
Man beachte: Die Spaltenzahl von A ist gleich der Zeilen- darzustellen. Das System
zahl von v, und die Zeilenzahl von A · v ist die Zeilenzahl
a11 x1 + a12 x2 + · · · + a1n xn = b1
von A. .. .. .. ..
Man nennt den Spaltenvektor b = A · v ∈ Km das Pro- . . . .
dukt von A mit v, z. B. gilt mit der folgenden Matrix am1 x1 + am2 x2 + · · · + amn xn = bm
A ∈ R4×3 und v ∈ R3 :
⎛ ⎞ ⎛ ⎞ mit aij , bi ∈ K für 1 ≤ i ≤ m und 1 ≤ j ≤ n lässt
2 6 1 ⎛ ⎞ 17
⎜6 4 0⎟ 4 ⎜28⎟ sich mit den Abkürzungen
⎜ ⎟ ⎝ ⎠ ⎜ ⎟
⎝0 3 3⎠ · 1 = ⎝12⎠ ⎛
a11 · · · a1n
⎞ ⎛ ⎞
b1
⎛ ⎞
x1
3
4 1 2 23 ⎜ .. .. ⎠ , b = ⎝ .. ⎠ , x = ⎝ ... ⎟
. ⎟ ⎜ . ⎟ ⎜
A=⎝ . ⎠
Beispielsweise bestimmen die blau eingezeichneten Zif- am1 · · · amn bm xn
fern der zweiten Zeile in der Matrix den Eintrag in der
zweiten Zeile des Produkts: kurz schreiben als A x = b.
422 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

für jedes v ∈ V :
ϕ(v) = ϕ(λ1 b1 + · · · + λr br )
e2
= λ1 σ (b1 ) + · · · + λr σ (br ) ϕ(e2 )

= ψ(λ1 b1 + · · · + λr br ) ϕ(e1 )
30◦
= ψ(v) .
30◦
Folglich gilt ϕ = ψ. 
e1

Beispiel
Es sei En = {e1 , . . . , en } die kanonische Basis des Rn .
Dann ist die eindeutig bestimmte lineare Fortsetzung der
Abbildung v = v1 e 1 + v 2 e 2
 
E n → Rn E n → Rn ϕ(v)
σ0 : bzw. σ1 :
ei  → 0 ei  → ei Abbildung 12.1 Eine Drehung ist durch Angabe der Bilder einer Basis eindeutig
die Nullabbildung bzw. die Identität. bestimmt.

Wir betrachten im R2 mit der kanonischen Basis E2 =


{e1 , e2 } die Abbildung σ mit σ (e1 ) = e2 und σ (e2 ) = e1 . ?
2
' ( ϕ von σ auf R ist'die(Spiegelung
Die lineare Fortsetzung Gibt es eine lineare Abbildung ϕ vom R2 in den R2 mit
1 v ϕ −1 ({0}) = ϕ(R2 ) ?
an der Geraden R , da für jedes v = 1 ∈ R2 gilt:
1 v2
' (
v
ϕ(v) = v1 ϕ(e1 ) + v2 ϕ(e2 ) = v1 e2 + v2 e1 = 2 .
v1
12.2 Verknüpfungen von
Wir bestimmen die einzige lineare Abbildung ϕ vom R3
in den R2 mit der Eigenschaft linearen Abbildungen
' ( ' (
1 2
ϕ(e1 ) = 0, ϕ(e2 ) = , ϕ(e3 ) = . (12.1) Man kann lineare Abbildung unter gewissen Voraussetzun-
1 2
gen auf verschiedene Arten miteinander oder mit Skalaren
Für das Bild des Elements verknüpfen und erhält erneut eine lineare Abbildung. Wir
⎛ ⎞
v1 behandeln die drei Methoden:
v = ⎝v2 ⎠ = v1 e1 + v2 e2 + v3 e3 ∈ R3
ψ ◦ ϕ, wobei ϕ, ψ lineare Abbildungen sind.
v3
λ ϕ, wobei λ ein Skalar und ϕ eine lineare Abbildung ist.
gilt wegen den Forderungen in Gleichung (12.1): ϕ + ψ, wobei ϕ, ψ lineare Abbildungen sind.
ϕ(v) = v1 ϕ(e1 ) + v2 ϕ(e2 ) + v3 ϕ(e3 ) =
' ( ' (
= v1 0 + v2
1
+ v3
2
. Das Produkt ψ ◦ ϕ linearer Abbildungen ϕ und
1 2
ψ ist eine lineare Abbildung
Damit erhalten wir die gesuchte Abbildung:
⎧ 3 Die Hintereinanderausführung ◦ von Abbildungen haben wir

⎪ R → R2 ,
⎨⎛ ⎞ ' ( in einem Abschnitt auf Seite 47 behandelt. Damit ψ ◦ ϕ über-
v
ϕ : ⎝ 1⎠ 1 haupt erklärt ist, ist es notwendig, dass das Bild von ϕ in der

⎪ v  → (v2 + 2 v3 ) .
⎩ 2 1 Definitionsmenge von ψ liegt.
v3
Wir drehen im R2 die Vektoren der Standardbasis E2 = ϕ ψ
{e1 , e2 } um 30° gegen den Uhrzeigersinn, wie in Abbil- V 
dung 12.1 dargestellt. '√ ( ' ( V 
3/2 −1/2

Wir erhalten also σ (e1 ) = und σ (e2 ) = .
1/2 3/2 ψ (V  )
Damit können wir'für ( die lineare Fortsetzung ϕ von σ auf V
ϕ(V )
v1
das Bild von v = schließen:
v2
'√ ( ' (
3/2 −1/2 ` ´
ϕ(v) = v1 + v2 √ . ψ ϕ(V )
1/2 3/2 ψ ◦ϕ
Also wird jeder Punkt des R2
bei dieser linearen Abbil- Abbildung 12.2 Das Produkt ψ ◦ ϕ existiert nur dann, wenn die Bildmenge
dung um 30° gegen den Uhrzeigersinn gedreht.  ϕ(V ) in der Definitionsmenge V  von ψ liegt.
12.2 Verknüpfungen von linearen Abbildungen 423

Das Produkt linearer Abbildungen Für das Inverse ψ von ϕ schreibt man ϕ −1 – und auch ϕ −1
ist bijektiv. Man beachte hierzu den Satz von der Umkehrab-
Sind ϕ : V → V  und ψ : V  → V  linear, so ist auch
bildung auf Seite 48. Ist die Abbildung ϕ nicht nur bijektiv,
die Hintereinanderausführung ψ ◦ ϕ : V → V  linear.
sondern auch linear, so ist die existierende Umkehrabbildung
ϕ −1 automatisch auch linear, das besagt der folgende Satz:
Beweis: Sind v, w ∈ V und λ ∈ K, so gilt:
(ψ ◦ ϕ)(λ v + w) = ψ(ϕ(λ v + w)) Das Inverse eines Isomorphismus
= ψ(λ ϕ(v) + ϕ(w)) Ist ϕ ein Isomorphismus, so ist auch ϕ −1 : V  → V ein
= ψ(λ ϕ(v)) + ψ(ϕ(w)) Isomorphismus.
= λ ψ(ϕ(v)) + ψ(ϕ(w))
= λ ψ ◦ ϕ(v) + ψ ◦ ϕ(w) . Beweis: Es sei ϕ bijektiv. Dann existiert die Umkehrab-
bildung ϕ −1 : V  → V . Es ist zu zeigen, dass ϕ −1 linear ist.
Das begründet, dass ψ ◦ ϕ linear ist. 
Dazu wählen wir beliebige v  , w  ∈ V  und ein λ ∈ K. Zu
Man beachte, dass ϕ ◦ ψ nicht erklärt sein muss, auch wenn v  , w  existieren v, w ∈ V mit ϕ(v) = v  und ϕ(w) = w  ,
ψ ◦ ϕ existiert. d. h., v = ϕ −1 (v  ) und w = ϕ −1 (w  ). Dann gilt:
ϕ −1 (λ v  + w  ) = ϕ −1 (λ ϕ(v) + ϕ(w))
Beispiel Wir betrachten die linearen Abbildungen
⎧ 2 = ϕ −1 (ϕ(λ v + w))

⎪ R → ⎛ R3 , ⎞
⎨' ( = λv + w
x1 − x2
ϕ: x1 und

⎪  → ⎝ 0 ⎠ = λ ϕ −1 (v  ) + ϕ −1 (w )
⎩ x2
2x1 − x2
⎧ Damit ist gezeigt, dass ϕ −1 linear ist. 

⎪ R 3 → ⎛ R4 , ⎞

⎪⎛ ⎞
⎨ x1 + 2x3
ψ:
x1 ⎜ x2 − x3 ⎟ . ?
⎪ ⎝ x2 ⎠  → ⎜

⎟ Was ist das Inverse von ψ ◦ ϕ, falls ϕ : V → V  und
⎪ ⎝ x1 + x2 ⎠

⎩ x3 ψ : V  → V  Isomorphismen sind ?
2x1 + 3x3
Wegen ϕ(R2 ) ⊆ R3 ist das Bild von ϕ in der Definitions- Folgerung
menge von ψ. Somit ist die lineare Abbildung ψ ◦ ϕ erklärt. Für jeden K-Vektorraum V bildet die Menge
Wir ermitteln die Abbildungsvorschrift für ψ ◦ ϕ. Es gilt:
⎛ ⎞ GLK (V ) = {ϕ : V → V | ϕ ist ein Isomorphismus}
⎛⎛ ⎞⎞ 5x1 − 3x2
'' (( x1 − x2 ⎜ ⎟ bezüglich der Komposition ◦ eine Gruppe – die allgemeine
ψ ◦ϕ
x1
= ψ ⎝⎝ 0 ⎠⎠ = ⎜ x2 − 2x1 ⎟ .
x2 ⎝ x1 − x 2 ⎠ lineare Gruppe von V .
2x1 − x2
8x1 − 5x2
Damit gilt Summe ϕ + ψ und skalares Vielfaches λ ϕ von
⎧ 2

⎪ R → ⎛ R4 , ⎞ linearen Abbildungen sind lineare


⎨' ( 5x1 − 3x2 Abbildungen
ψ ◦ ϕ: x1 ⎜ x2 − 2x1 ⎟ .
⎪ ⎜
→ ⎝ ⎟

⎪ x2 x1 − x 2 ⎠


Wir bezeichnen mit HomK (V , W ) die Menge aller linearen
8x1 − 5x2 Abbildungen von V nach W .
Die Abbildung ϕ ◦ ψ ist nicht erklärt.  In einem Abschnitt auf Seite 195 haben wir gezeigt, dass die
Menge aller Abbildungen von einer Menge in einen Körper
? einen Vektorraum bildet (vgl. auch das Lemma auf Seite 308).
Sind ϕ und ψ sogar Isomorphismen, so ist auch ψ ◦ ϕ ein In ganz ähnlicher Weise bildet die Menge
solcher – ist das richtig ?
HomK (V , W ) = {ϕ : V → W | ϕ ist linear }
aller linearen Abbildungen eines K-Vektorraums V in einen
Das Inverse ϕ −1 eines Isomorphismus ϕ ist ein K-Vektorraum W wieder einen K-Vektorraum.
Isomorphismus Wir erklären eine Addition von Elementen aus HomK (V ,W ).
Sind ϕ und ψ zwei lineare Abbildungen von V nach W , also
Eine bijektive Abbildung ϕ ist umkehrbar, d. h., es existiert Elemente aus HomK (V , W ), so setzen wir
eine Abbildung ψ mit 
V → W,
ϕ +ψ:
ϕ ◦ ψ = id und ψ ◦ ϕ = id . v → (ϕ + ψ)(v) = ϕ(v) + ψ(v).
424 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Wir benötigen weiter eine skalare Multiplikation. Sind λ ∈ K eine Basis von V , und es gilt:
und ϕ ∈ HomK (V , W ), so definieren wir  ' ( ' ( ' ( ' (
 0 1 0 1
V → W, W = w1 = , w2 = , w3 = , w4 = .
λϕ: 0 0 1 1
v  → (λ ϕ)(v) = λ ϕ(v).
Jede Wahl
Mit dieser Addition + und skalaren Multiplikation · gilt nun:
ϕ ϕ ϕ
e1  → w i , e2  → w j , e3  → w k
Der K-Vektorraum der linearen Abbildungen
erklärt eine lineare Abbildung ϕ von Z32 nach Z22 . Da zwei
Es ist HomK (V , W ) ein K-Vektorraum.
verschiedene Wahlen auch verschiedene lineare Abbildun-
gen liefern, gibt es genau 43 = 64 lineare Abbildungen,
d. h.,
Beweis: Die Menge HomK (V , W ) ist nichtleer, weil die | HomZ2 (Z32 , Z22 )| = 64 . 
Nullabbildung 0 : V → W , v  → 0 eine lineare Abbildung
ist.
Wir müssen weiter zeigen, dass für beliebige ϕ, ψ ∈
HomK (V , W ) und λ ∈ K sowohl ϕ + ψ als auch λ ϕ wie- Die Menge aller Endomorphismen eines
der Elemente von HomK (V , W ) sind. Wir zeigen zuerst Vektorraums bilden einen Ring
ϕ + ψ ∈ HomK (V , W ):
Im letzten Abschnitt haben wir gezeigt, dass die Menge
Sind v, w ∈ V und μ ∈ K, so gilt:
HomK (V , W ) aller Homomorphismen ϕ : V → W bei ge-
(ϕ + ψ)(μ v + w) = ϕ(μ v + w) + ψ(μ v + w) eigneter Definition einer Addition + und Multiplikation ·
mit Skalaren aus K einen Vektorraum bildet. Wir setzen nun
= μ ϕ(v) + ϕ(w) + μ ψ(v) + ψ(w)
V = W , lassen die Multiplikation · mit Skalaren weg und
= μ (ϕ + ψ)(v) + (ϕ + ψ)(w) . nehmen die Multiplikation ◦ aus dem Abschnitt von Seite 422
hinzu und erhalten:
Nun zeigen wir noch, dass λ ϕ ∈ Hom K (V , W ). Sind
v, w ∈ V und μ ∈ K, so gilt: Der Endomorphismenring EndK (V )
Die Menge
(λ ϕ)(μ v + w) = λ ϕ(μ v + w)
= λ (μ ϕ(v) + ϕ(w)) EndK (V ) = HomK (V , V )
= λ μ ϕ(v) + λ ϕ(w)
aller Endomorphismen von V ist mit punktweiser Ad-
= μ (λ ϕ)(v) + (λ ϕ)(w) .
dition + und der Multiplikation ◦ ein Ring mit Einsele-
ment id.
Es ist nun nicht mehr schwer, die verbleibenden Vektorraum-
axiome nachzuweisen.
Es ist (Hom K (V , W ), +) eine abelsche Gruppe: Die Addi- Beweis: Es ist (EndK (V ), +) eine abelsche Gruppe (be-
tion + ist assoziativ, das Nullelement ist die Nullabbildung achte den Beweis zu obigem Satz, wonach HomK (V , V ) ein
0, die jedem Element v ∈ V den Nullvektor aus W zuordnet, Vektorraum ist). Die Multiplikation ◦ ist assoziativ (beachte
und das einem ϕ ∈ HomK (V , W ) entgegengesetzte Element den Satz auf Seite 47), weiterhin gilt
ist die lineare Abbildung −ϕ = (−1) ϕ.
id ◦ϕ = ϕ = ϕ ◦ id
Die Vektorraumaxiome (V1)–(V4) von Seite 222 sind offen-
bar erfüllt.  für jedes ϕ ∈ EndK (V ), sodass id ein Einselement ist.
Nach der Definition eines Rings auf Seite 85 bleiben nun
Beispiel Nach dem Prinzip der linearen Fortsetzung ist nur noch die Distributivgesetze nachzuweisen: Für beliebige
jede lineare Abbildung zwischen K-Vektorräumen V und W ϕ, ψ, ϑ ∈ EndK (V ) und v ∈ V gilt:
eindeutig durch Angabe der Bilder der Basisvektoren einer
((ϕ + ψ) ◦ ϑ)(v) = (ϕ + ψ)(ϑ(v))
Basis B von V bestimmt. Wir können folglich explizit alle
linearen Abbildungen zwischen endlichen Vektorräumen an- = ϕ(ϑ(v)) + ψ(ϑ(v))
geben. Wir betrachten den Fall V = Z32 und W = Z22 . Es ist = (ϕ ◦ ϑ + ψ ◦ ϑ)(v) ,
⎧ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
⎨ 1 0 0 ⎬ sodass (ϕ + ψ) ◦ ϑ = ϕ ◦ ϑ + ψ ◦ ϑ gilt. Den Nachweis des
B = e1 = ⎝0⎠ , e2 = ⎝1⎠ , e3 = ⎝0⎠ zweiten Distributivgesetzes ϑ ◦ (ϕ + ψ) = ϑ ◦ ϕ + ϑ ◦ ψ
⎩ ⎭
0 0 1 führt man analog. 
12.3 Kern, Bild und die Dimensionsformel 425

Man beachte, dass der Ring (EndK (V ), +, ◦) im Allgemei- Der Kern von ϕ besteht aus jenen Vektoren,
nen weder kommutativ noch nullteilerfrei ist, wie das fol- die auf den Nullvektor abgebildet werden
gende Beispiel zeigt.
Jede lineare Abbildung ϕ : V → W hat einen Kern. Dies
Beispiel Nach dem Prinzip der linearen Fortsetzung ist ist ein Untervektorraum von V , er erlaubt es, auf weitere
jeder Endomorphismus des Z2 -Vektorraums Z22 eindeutig Eigenschaften der linearen Abbildung zu schließen.
durch Angabe der Bilder der Basisvektoren e1 und e2 von
Z22 bestimmt. Wir betrachten die beiden Endomorphismen ϕ
Der Kern und das Bild einer linearen Abbildung
und ψ, die durch die folgenden Zuordnungen gegeben sind:
Ist ϕ eine lineare Abbildung von einem K-Vektorraum
' ( ' ( ' ( ' (
1 ϕ 0 0 ϕ 0 V in einen K-Vektorraum W , so nennt man
→ , → ,
0 1 1 1
' ( ' ( ' ( ' ( ker ϕ = ϕ −1 ({0}) = {v ∈ V | ϕ(v) = 0} ⊆ V
1 ψ 1 0 ψ 0
→ , → .
0 0 1 0 den Kern von ϕ und

Es gilt nun: Bild ϕ = ϕ(V ) = {ϕ(v) | v ∈ V } ⊆ W


'' (( ' ( ' ( '' ((
1 0 0 1 das Bild von ϕ.
ψ ◦ϕ = = =ϕ◦ψ ,
0 0 1 0

sodass ψ ◦ ϕ = ϕ ◦ ψ gilt. Somit ist die Multiplikation ◦ auf Vielfach schreibt man auch Im(ϕ) für das Bild der linea-
EndZ2 (Z22 ) nicht kommutativ. ren Abbildung ϕ; Im kürzt dabei die englische Bezeichnung
Image für das Bild ab.
Außerdem gilt:
ϕ = 0 = ψ , Der Kern von ϕ ist die Urbildmenge des Nullvektors aus W ,
d. h. die Menge aller Vektoren, die auf 0 ∈ W abgebildet
aber für das Produkt ψ ◦ ϕ gilt: werden, und das Bild die Gesamtheit der Vektoren aus W ,
' ( ' ( ' ( ' ( die durch ϕ getroffen werden.
1 ψ◦ϕ 0 0 ψ◦ϕ 0
→ , → ,
0 0 1 0 ϕ

sodass ψ ◦ ϕ = 0 gilt. Somit ist EndZ2 (Z22 ) auch nicht null-


W
teilerfrei.  V

ϕ(V )
Kommentar: Der Ring EndK (V ) ist, wenn man die ϕ −1 ({0}) 0
Multiplikation mit Skalaren berücksichtigt, auch ein K-
Vektorraum. Es gilt zudem für alle λ ∈ K und ϕ, ψ ∈
EndK (V ):

λ (ϕ ◦ ψ) = (λ ϕ) ◦ ψ = ϕ ◦ (λ ψ) . Abbildung 12.3 Der Kern und das Bild einer linearen Abbildung.

D. h., EndK (V ) ist eine K-Algebra (vgl. auch den Kommen- Weil jede lineare Abbildung ϕ(0) = 0 erfüllt, ist der Kern
tar auf Seite 198). einer linearen Abbildung niemals leer, er enthält mindestens
den Nullvektor aus V . Entsprechend ist das Bild einer linea-
ren Abbildung nichtleer,

12.3 Kern, Bild und die {0} ⊆ ϕ −1 ({0}) ⊆ V und {0} ⊆ ϕ(V ) ⊆ W .
Dimensionsformel Es gibt Beispiele, in denen der Nullvektor der einzige Vektor
im Kern bzw. Bild ist, der Kern bzw. das Bild kann aber
Wie bei Abbildungen können wir bei einer linearen Abbil- durchaus auch sehr groß sein.
dungen ϕ : V → W vom Bild der Abbildung ϕ, also von
der Menge ϕ(V ) ⊆ W , und auch vom Urbild einer Menge Beispiel
A ⊆ W unter ϕ, also von ϕ −1 (A) ⊆ V sprechen. Tatsächlich Bei der Spiegelung
ist es so, dass diese Mengen für die spezielle Wahl A = {0} ⎧ 2
sehr eng miteinander zusammenhängen. Dieser Zusammen- ⎨ 'R ( → 'R2 ,(
hang drückt sich in der sogenannten Dimensionsformel aus, σ: v v2
⎩ 1 →
die wir in diesem Abschnitt herleiten wollen. v2 v1
426 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

x3

ϕ −1 ({0})

x2
x1

ϕ(R3 )

Abbildung 12.5 Der Kern ϕ −1 ({0}) = R e3 und das Bild ϕ(R3 ) = R e1 + R e2


der linearen Abbildung ϕ : R3 → R2 .

Abbildung 12.4 Der Kern kann auch sehr groß sein. aus all jenen Vektoren v des Kn , die das homogene lineare
Gleichungssystem
Av = 0
an der Geraden ' R (e(1 + e'
2 ) besteht
( der Kern nur aus dem
v2 0 über K lösen:
Nullvektor, da = nur im Fall v1 = 0 = v2
v1 0 −1
ϕA ({0}) = {v ∈ Kn | A v = 0} .
−1
gilt, d. h., ϕ ({0}) = {0}. Der Kern ist hier so klein wie
möglich. Das Bild ist so groß wie möglich, da ϕ(R2 ) = R2 Für das Bild ϕA (Kn ) gilt:
gilt.
ϕA (Kn ) = {A v | v ∈ Kn }
Ist ϕ die lineare Abbildung ⎧ ⎛ ⎞ ⎫
 ⎪
⎨ λ1 ⎪

V → W, ⎜ ⎟
ϕ: = (s 1 , . . . , s n ) ⎝ ... ⎠ | λ1 , . . . , λn ∈ K
v  → 0, ⎪
⎩ ⎪

λn
so ist ϕ −1 ({0}) = V , da jeder Vektor aus V auf den Null- = {λ1 s 1 + λn s n | λ1 , . . . , λn ∈ K}
vektor abgebildet wird. Hier ist der Kern so groß wie mög-
= -s 1 , . . . , s n . .
lich und das Bild so klein wie möglich, da ϕ(V ) = {0} gilt.
Der Kern der linearen Abbildung Das Bild ϕA (Kn ) besteht also aus allen Linearkombination
⎧ der Spalten von A = (s 1 , . . . , s n ),

⎪ R3 → R2 ,
⎨⎛ ⎞ ' (
v1 ϕA (Kn ) = -s 1 , . . . , s n . .
ϕ: ⎝v2 ⎠  → v1 + v2


⎩ v2
v3
Wir bestimmen den Kern des Differenzierens von reellen
⎛ ⎞
v1 Polynomen:
besteht aus all jenen ⎝v2 ⎠ mit v3 ∈ R, v2 = 0 und 
d R[X] → R[X],
v3 : d
v1 + v2 = 0, also: dX p → dX (p).
⎧⎛ ⎞ ⎫ Der Kern besteht aus all jenen Polynomen, die durch das
⎨ 0 ⎬
Differenzieren auf das Nullpolynom abgebildet werden:
ϕ −1 ({0}) = ⎝ 0 ⎠ ∈ R3 | v3 ∈ R .
⎩ ⎭ ' (
v3 d −1 d
({0}) = {p ∈ R[X] | (p) = 0} .
dX dX
Da ϕ surjektiv ist, gilt für das Bild ϕ(R3 ) = R2 . Das ist
in Abbildung 12.5 dargestellt. Polynome vom Grad 1 oder höher werden durch das Dif-
ferenzieren nicht zum Nullpolynom. Hingegen wird jedes
? konstante Polynom c durch das Differenzieren auf das
Begründen Sie ausführlich, warum ϕ surjektiv ist. Nullpolynom abgebildet, also gilt:
' (
Ist A = (s 1 , . . . , s n ) ∈ Km×n , so besteht der Kern der d −1
({0}) = R .
linearen Abbildung dX
 n d
K → Km , Nach dem Beispiel auf Seite 420 ist das Bild von dX gleich
ϕA :
v → A v R[X]. 
12.3 Kern, Bild und die Dimensionsformel 427

? Für ϕ −1 ({0}) = {0} sagt man auch: Der Kern von ϕ ist trivial.
Ist die Sprechweise Je größer der Kern, desto kleiner das Das Kriterium ist sehr gut dafür geeignet, die Injektivität
Bild gerechtfertigt ? linearer Abbildungen nachzuweisen. Man beachte, dass die
Inklusion {0} ⊆ ϕ −1 ({0}) für jede lineare Abbildung ϕ erfüllt
Wir untersuchen Kern und Bild einer linearen Abbildung ϕ ist. Will man also von einer linearen Abbildung ϕ nachwei-
zwischen K-Vektorräumen V und W etwas genauer. sen, dass sie injektiv ist, so hat man nur die Implikation

Da stets der Nullvektor von V im Kern liegt, gilt aus ϕ(v) = 0 folgt v = 0
ϕ −1 ({0}) = ∅.
Sind v und w zwei Elemente des Kerns von ϕ, d. h., ϕ(v) = zu begründen.
0 und ϕ(w) = 0, so liegt wegen der Additivität von ϕ auch
deren Summe v + w im Kern, da ?
Im Beispiel ab Seite 425 werden fünf lineare Abbildungen
ϕ(v + w) = ϕ(v) + ϕ(w) = 0 + 0 = 0 .
vorgestellt. Können Sie angeben, welche dieser fünf linearen
Sind v ein Element des Kerns von ϕ und λ ∈ K ein Skalar, Abbildungen injektiv sind ?
so liegt wegen der Homogenität von ϕ auch λ v im Kern,
da
ϕ(λ v) = λ ϕ(v) = λ 0 = 0 .
Damit haben wir die erste Aussage des folgenden Satzes ge- Die Dimension von V ist die Summe der
zeigt. Mit einem analogen Vorgehen zeigt man die zweite Dimensionen von Kern und Bild einer linearen
Aussage.
Abbildung
Kern und Bild einer linearen Abbildung sind Vektor-
Bei allen bisher betrachteten linearen Abbildungen von V
räume
nach W mit endlichdimensionalem Vektorraum V haben wir
Ist ϕ eine lineare Abbildung von V nach W , so ist der die Beobachtung gemacht, dass die Dimension des Bildes
Kern ϕ −1 ({0}) ein Untervektorraum von V , und das Bild umso kleiner ist, je größer die Dimension des Kerns ist. Die
ϕ(V ) ist ein solcher von W . Nullabbildung und die Identität sind Extremfälle. Bei der
Nullabbildung hat der Kern maximale Dimension und das
Bild die Dimension Null, bei der Identität ist dies gerade
Eine lineare Abbildung ist genau dann anders herum.
injektiv, wenn der Kern trivial ist
Dieser Zusammenhang ist kein Zufall, er ist Inhalt der wich-
Mithilfe des Kerns lässt sich ein wichtiges Kriterium für die tigen Dimensionsformel, die wir nun herleiten. Sie schildert
Injektivität einer linearen Abbildung formulieren. den Zusammenhang von Kern und Bild einer linearen Abbil-
dung ϕ : V → W und der Dimension des Vektorraums V .
Um nachzuweisen, dass eine Abbildung ϕ : A → B für be-
liebige Mengen A und B injektiv ist, ist für alle x, y ∈ A mit
ϕ(x) = ϕ(y) die Gleichheit x = y zu folgern. Bei linearen Die Dimensionsformel
Abbildungen zwischen Vektorräumen vereinfacht sich dieser Ist V ein endlichdimensionaler Vektorraum, so gilt für
Nachweis, man kann y = 0 setzen. jede lineare Abbildung ϕ : V → W die Gleichung

dim(V ) = dim(ϕ −1 ({0})) + dim(ϕ(V )) .


Kriterium für Injektivität  
Kern
Eine lineare Abbildung ϕ : V → W ist genau dann in- Bild

jektiv, wenn ϕ −1 ({0}) = {0} gilt.


Beweis: Es seien {b1 , . . . , br } ⊆ V eine Basis des Kerns
ϕ −1 ({0}) von ϕ und {c1 , . . . , cs } ⊆ W eine Basis des Bildes
Beweis: Wenn ϕ injektiv ist, dann kann der Kern von ϕ ϕ(V ) von ϕ. Wir wählen zu jedem dieser ci ∈ W ein bi ∈ V
wegen ϕ(0) = 0 keinen weiteren Vektor als den Nullvektor mit
enthalten, d. h., ϕ −1 ({0}) = {0}.
ϕ(bi ) = ci für i = 1, . . . , s (12.2)
Und ist nun umgekehrt ϕ −1 ({0}) = {0} vorausgesetzt, so
folgt aus ϕ(v) = ϕ(w) für v, w ∈ V sogleich: und behaupten, dass B = {b1 , . . . , br , b1 , . . . , bs } eine
Basis von V ist.
0 = ϕ(v) − ϕ(w) = ϕ(v − w) ,
Wir zeigen, dass die Menge B linear unabhängig ist. Es gelte:
also wegen der Voraussetzung v − w = 0, d. h., v = w.
Folglich ist ϕ injektiv.  λ1 b1 + · · · + λr br + λ1 b1 + · · · + λs bs = 0 (12.3)
428 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

mit λ1 , . . . , λr , λ1 , . . . , λs ∈ K. Wir wenden die lineare Es gilt also für jede lineare Abbildung ϕ von einem endlich-
Abbildung ϕ auf diese Gleichung an und erhalten dimensionalen Vektorraum V in irgendeinen (nicht näher be-
stimmten) Vektorraum: Die Dimension von V ist die Summe
0 = ϕ(0) = ϕ(λ1 b1 + · · · + λr br + λ1 b1 + · · · + λs bs ) der Dimensionen des Kerns und des Bildes von ϕ.
= λ1 ϕ(b1 ) + · · · + λr ϕ(br ) + λ1 ϕ(b1 ) + · · · + λs ϕ(bs )
In der Abbildung 12.6 zeigen wir diesen Zusammenhang für
= λ1 c1 + · · · + λs cs . V = R2 = W und eine lineare Abbildung ϕ = ϕA : v →
A v für die drei möglichen Fälle rg A = 2, rg A = 1 und
Wegen der linearen Unabhängigkeit der Vektoren c1 , . . . , cs rg A = 0.
folgt nun:
λ1 = · · · = λs = 0 . x2 ϕA x2
Die Gleichung (12.3) lautet damit ' (
1 1 ϕA (R2 )
A=
0 1
λ1 b1 + · · · + λr br = 0 . ker ϕA x1 x1

Nun folgt aus der linearen Unabhängigkeit der Vektoren


b1 , . . . , br weiter x2 ϕA x2
ker ϕA ' (
2 −2
λ1 = · · · = λr = 0 . A=
1 −1
x1 ϕA (R2 ) x1
Damit ist gezeigt, dass B linear unabhängig ist.
Zweitens müssen wir nachweisen, dass die Menge B ein Er-
zeugendensystem von V ist: Es sei ein v ∈ V gegeben. Da x2 ϕA x2
' (
{c1 , . . . , cs } ein Erzeugendensystem des Bildes ϕ(V ) ist, ker ϕA 0 0
A=
existieren λ1 , . . . , λs ∈ K mit 0 0
x1 ϕA (R2 ) x1
ϕ(v) = λ1 c1 + · · · + λs cs .
Abbildung 12.6 Die Summe der Dimensionen von Kern und Bild ist jeweils 2.
Wir betrachten nun das Element

v̂ = v − (λ1 b1 + · · · + λs bs ) ∈ V (12.4)


?
(man beachte die Gleichung (12.2)). Wenden wir nun die Gibt es eine surjektive lineare Abbildung ϕ : R11 → R7 mit
lineare Abbildung ϕ auf v̂ an, so erhalten wir: einem 5-dimensionalen Kern ?

ϕ(v̂) = ϕ(v) − ϕ(λ1 b1 + · · · + λs bs )


= ϕ(v) − (λ1 ϕ(b1 ) + · · · + λs ϕ(bs )) Ist U ein Untervektorraum eines K-Vektorraums V , so kön-
nen wir nach dem Satz auf Seite 221 den Faktorraum V /U
= ϕ(v) − (λ1 c1 + · · · + λs cs ) bilden:
= ϕ(v) − ϕ(v) = 0 , V /U = {v + U | v ∈ V } .
sodass v̂ ein Element des Kerns von ϕ ist. Da {b1 , . . . , br } Ist V endlichdimensional, so zeigten wir bereits auf Seite 221,
ein Erzeugendensystem des Kerns von ϕ ist, gibt es nun dass dim V /U = dim V − dim U , wir begründen das Ergeb-
λ1 , . . . , λr ∈ K mit nis erneut mithilfe der Dimensionsformel.

v̂ = λ1 b1 + · · · + λr br .
Der kanonische Epimorphismus
Setzen wir das in die Gleichung (12.4) ein, so erhalten wir: Für jeden Untervektorraum U eines K-Vektorraums V
ist die Abbildung
v = v̂ + (λ1 b1 + · · · + λs bs )

= λ1 b1 + · · · + λr br + λ1 b1 + · · · + λs bs . V → V /U,
π:
v → v + U
Folglich ist B ein Erzeugendensystem von V .
ein Epimorphismus mit Kern U . Man nennt π den ka-
Nun beachten wir nonischen Epimorphismus bezüglich U . Ist V endlich-
dimensional, so gilt:
dim V = |B| = r + s = dim(ϕ −1 ({0})) + dim(ϕ(V )) .
dim V /U = dim V − dim U .
Das ist die Dimensionsformel. 
12.3 Kern, Bild und die Dimensionsformel 429

Unter der Lupe: Die Dimensionsformel


Die Methoden, die wir zum Beweis der Dimensionsformel benutzt haben, sind typisch für die lineare Algebra. Daher ist es
angebracht, diese Methoden genauer zu betrachten und sie zu verinnerlich. Die Aussage der Dimensionsformel ist die folgende:
Ist V ein endlichdimensionaler Vektorraum, so gilt für jede lineare Abbildung ϕ : V → W die Gleichung
dim(V ) = dim(ϕ −1 ({0})) + dim(ϕ(V )) .
 
Kern Bild

Bei den vielen Beispielen von linearen Abbildungen ha- gegeben, so folgt wegen der Linearität von ϕ die Glei-
ben wir diese Formel bereits vermutet, beachten Sie die chung:
Selbstfrage auf Seite 427. Will man die Formel beweisen,
so sind mehrere Ansätze naheliegend: ϕ(λr+1 br+1 + · · · + λn bn ) = 0 .
Wir wählen eine Basis {b1 , . . . , br } des
Kerns ϕ −1 ({0}), ergänzen diese zu einer Basis Also gilt:
{b1 , . . . , br , br+1 , . . . , bn } von V und zeigen, dass
n − r = dim ϕ(V ) gilt. λr+1 br+1 + · · · + λn bn ∈ ϕ −1 ({0}) = -b1 , . . . , br . .
Wir wählen eine Basis {b1 , . . . , br } des Kerns
Dies besagt, dass es λ1 , . . . , λr ∈ K mit
ϕ −1 ({0}), eine Basis {b1 , . . . , bs } des Bildes ϕ(V ) und
zeigen, dass r + s = dim V gilt. λ1 b1 + · · · + λr br + λr+1 br+1 + · · · + λn bn = 0
Bei der ersten Methode ist eine (n − r)-elementige Ba-
sis von ϕ(V ) anzugeben, bei der zweiten Methode eine gibt. Wegen der linearen Unabhängigkeit der Vektoren aus
(r + s)-elementige Basis von V . Im Text haben wir die B folgt nun:
zweite Methode für den Beweis der Dimensionsformel be-
nutzt. Wir wollen nun die erste Methode verwenden, um λ1 = · · · = λr = λr+1 = · · · = λn = 0 ,
zu zeigen, dass letztlich die gleichen Schlüsse gezogen
werden. also insbesondere die lineare Unabhängigkeit der Vekto-
ren ϕ(br+1 ), . . . , ϕ(bn ).
Die Dimension des Vektorraums V bezeichnen wir mit
n. Der Kern ϕ −1 ({0}) von ϕ ist ein Untervektorraum von Nun zeigen wir noch, dass diese Vektoren ein Erzeugen-
V mit einer Dimension r ≤ n. Wir wählen eine Basis densystem von ϕ(V ) bilden. Ist w ∈ ϕ(V ) vorgegeben, so
C = {b1 , . . . , br } des Kerns ϕ −1 ({0}) und ergänzen diese gibt es ein v ∈ V mit ϕ(v) = w. Dieses Element v ∈ V
zu einer Basis B des ganzen Vektorraums V : lässt sich aber bezüglich der Basis B von V darstellen:

B = C ∪ {br+1 , . . . , bn } . v = λ1 b1 + · · · + λr br + λr+1 br+1 + · · · + λn bn .

Und es gilt wegen der Linearität von ϕ:


V ϕ(V )
w = ϕ(v) = λ1 0 + · · · + λr 0
Ker ϕ
0 + λr+1 ϕ(br+1 ) + · · · + λn ϕ(bn ) .
b1 , . . . , br ϕ(br+1 ), . . . , ϕ(bn )
Also ist
br+1 , . . . , bn
w ∈ -ϕ(br+1 ), . . . , ϕ(bn ). ,
insbesondere ist {ϕ(br+1 ), . . . , ϕ(bn )} ein Erzeu-
Die Basisvektoren des Kerns werden auf die Null ab- gendensystem von ϕ(V ). Damit ist gezeigt, dass
gebildet, die Basisvektoren außerhalb des Kerns wer- {ϕ(br+1 ), . . . , ϕ(bn )} eine Basis von ϕ(V ) ist. Hieraus
den nicht auf die Null abgebildet. Wir wollen nun zei- folgt die Behauptung.
gen, dass diese Bilder sogar ϕ(V ) erzeugen, d. h., dass
{ϕ(br+1 ), . . . , ϕ(bn )} eine Basis des Bildes ϕ(V ) ist. Kommentar: Die Formel gilt auch für einen unendlich-
Hieraus folgt dann bereits die Behauptung, denn in die- dimensionalen Vektorraum V . Dabei besteht eine Schwie-
sem Fall ist rigkeit, über die wir uns noch gar keine Gedanken gemacht
haben: Wie addiert man unendliche Zahlen? Wir halten
n = dim(V ) = dim(ϕ −1 ({0})) + dim(ϕ(V )) . hier nur fest: Ist eine der beiden Zahlen α, β unendlich,
  so setzt man
=r =n−r
α + β = max{α, β} .
Sind λr+1 , . . . , λn ∈ K mit
Mit dieser Vereinbarung gilt die Dimensionsformel für be-
λr+1 ϕ(br+1 ) + · · · + λn ϕ(bn ) = 0 liebige Vektorräume.
430 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Beweis: Die Abbildung π ist offenbar surjektiv. Wir be- Im R-Vektorraum RN0 aller reellen Folgen sind die Ab-
gründen, dass π auch linear ist. Für v, w ∈ V und λ ∈ K gilt bildungen
nämlich: 
RN 0 → RN0 ,
π(λ v + w) = (λ v + w) + U r:
(a0 , a1 , . . .) → (0, a0 , a1 , . . .)
= ((λ v) + U ) + (w + U )
und 
= λ (v + U ) + (w + U )
RN0 → R N0 ,
= λ π(v) + π(w) . l:
(a0 , a1 , . . .) → (a1 , a2 , . . .),
Somit ist π ein Epimorphismus. Wir bestimmen nun den Kern bei der die Folgenglieder um eine Stelle „nach rechts ver-
von π. Es gilt: schoben“ bzw. „nach links verschoben“ werden, lineare
Abbildungen.
v ∈ ker π ⇔ π(v) = v + U = U ⇔ v ∈ U . Die Abbildung r ist injektiv, aber nicht surjektiv, die Ab-
bildung l ist surjektiv, aber nicht injektiv. Insbesondere
Somit ist U der Kern von π.
ist der Vektorraum RN0 aller reellen Folgen nicht endlich-
Mit der Dimensionsformel folgt nun unmittelbar wegen dimensional. 
Bild π = V /U und ker π = U die angegebene Formel. 

Wir ziehen schließlich eine nützliche Folgerung aus der Di- Zeilen- und Spaltenraum einer Matrix sind die
mensionsformel:
Vektorräume, die von den Zeilen und Spalten
Kriterium für Bijektivität einer linearen Abbildung
einer Matrix erzeugt werden
Haben V und W gleiche und endliche Dimension, so sind
Nach dem Beispiel auf Seite 421 ist für jede Matrix
für eine lineare Abbildung ϕ : V → W die folgenden
A ∈ Km×n die Abbildung
Aussagen äquivalent:
(i) ϕ ist injektiv. 
Kn → Km ,
(ii) ϕ ist surjektiv. ϕA :
v → A v
(iii) ϕ ist bijektiv.
linear. Für eine Matrix A ∈ Km×n mit den Zeilen z1 , . . . , zm
Beweis: (i) ⇒ (ii): Es sei ϕ injektiv. Dann gilt ϕ −1 ({0})
= und den Spalten s 1 , . . . , s n , d. h.,
{0} und somit dim(ϕ −1 ({0})) = 0. Nach der Dimensionsfor-
⎛⎞
mel gilt dim(ϕ(V )) = dim(V ) = dim(W ). Somit ist ϕ sur- z1
⎜ ⎟
jektiv (beachten Sie die Kennzeichnungen endlicher Basen A = ⎝ ... ⎠ = (s 1 , . . . , s n ),
auf Seite 209).
zm
(ii) ⇒ (iii): Ist ϕ surjektiv, d. h., gilt ϕ(V ) = W , so
folgt mit der Dimensionsformel aus dim(V ) = dim(W ) = nennen wir den Untervektorraum
dim(ϕ(V )) sogleich dim(ϕ −1 ({0})) = 0, folglich ist ϕ auch
injektiv und somit bijektiv. -z1 , . . . , zm . ⊆ Kn , der von den Zeilenvektoren erzeugt
wird, den Zeilenraum von A bzw.
(iii) ⇒ (i): Ist ϕ bijektiv, so ist ϕ insbesondere auch in- -s 1 , . . . , s n . ⊆ Km , der von den Spaltenvektoren erzeugt
jektiv.  wird, den Spaltenraum von A.

Kommentar: Man beachte die Analogie zu endlichen Die Dimension des Zeilenraums nennen wir den Zeilenrang
gleichmächtigen Mengen A und B: Für eine Abbildung von A und die Dimension des Spaltenraums den Spaltenrang
f : A → B sind nach dem Lemma auf Seite 46 die Eigen- von A.
schaften injektiv, surjektiv und bijektiv gleichwertig. In dem Abschnitt auf Seite 175 haben wir den Rang rg A
einer Matrix A ∈ Km×n eingeführt. Der Rang rg A ist die
Bei unendlichdimensionalen Vektorräumen ist die Aussage
Anzahl der Nichtnullzeilen der Matrix in Zeilenstufenform
des obigen Satzes nicht korrekt. Man kann im Allgemeinen
und damit die Dimension des Zeilenraums, d. h., der Rang
aus der Injektivität eines Endomorphismus nicht auf die Sur-
von A ist der Zeilenrang von A. Wir zeigen nun, dass auch
jektivität schließen – dasselbe gilt auch andersherum. Man
der Spaltenrang von A gleich diesem Rang von A ist.
beachte die folgenden Beispiele.
Insbesondere haben wir damit den schuldig gebliebenen
Beispiel Nachweis der Wohldefiniertheit des Rangs von A nachge-
d
Im Fall V = K[X] = W ist das Differenzieren dX eine liefert: Der Rang von A ist die Dimension des Zeilenraums
surjektive, nicht injektive lineare Abbildung. und hängt damit nur von A ab.
12.3 Kern, Bild und die Dimensionsformel 431

Mit der Dimensionsformel folgt Der Kern ist die Lösungsmenge des homogenen linearen
Zeilenrang = Spaltenrang Gleichungssystems
Ax = 0.
Wir werden feststellen, dass letztlich jede lineare Abbildung Wir erhalten eine Basis des Kerns durch elementare Zeilen-
zwischen endlichdimensionalen Vektorräumen von der Form umformungen. Dazu vertauschen wir die ersten beiden Zeilen
ϕA mit einer Matrix A ist. Daher ist das vierte Beispiel von und addieren zum Doppelten der dritten Zeile das Dreifache
Seite 425 sehr bedeutend. Wir formulieren die dort gemach- der zweiten Zeile:
ten Feststellungen erneut mit den nun zur Verfügung stehen- ⎛ ⎞ ⎛ ⎞
0 −3 2 0 −2 −3 0 2
den Begriffen.
⎜−2 −3 0 2 ⎟ ⎜ 0 −3 2 0⎟
⎜ ⎟ ⎜ ⎟
⎝ 3 0 3 −3⎠ −→ ⎝ 0 −9 6 0⎠
Kern und Bild einer Matrix 0 3 −2 0 0 0 0 0
Ist A = (s 1 , . . . , s n ) ∈ Km×n , so gilt für den Kern und
Nun ist die dritte Zeile ein Vielfaches der zweiten Zeile, durch
das Bild von ϕA :
eine elementare Umformung erhalten wir nun die Zeilenstu-
−1 fenform
ϕA ({0}) = {v ∈ Kn | A v = 0},
⎛ ⎞ ⎛ ⎞
ϕA (Kn ) = -s 1 , . . . , s n . . −2 −3 0 2 −2 −3 0 2
⎜ 0 −3 2 0⎟ ⎜ 0 −3 2 0⎟
⎜ ⎟ ⎜ ⎟
Man spricht in diesem Zusammenhang auch vom Kern ⎝ 0 −9 6 0⎠ −→ ⎝ 0 0 0 0⎠
und Bild der Matrix A. 0 0 0 0 0 0 0 0
Es gilt: 
−1 =:A
dim(ϕA ({0})) = n − rg A
Die Dimension des Kerns ist somit
und
dim ker A = 4 − rg A = 4 − 2 = 2,
dim ϕA (Kn ) = rg A = dim-s 1 , . . . , s n . .
und für eine Basis des Kerns wählen wir zwei linear unab-
hängige Lösungsvektoren des Systems A x = 0, etwa
Beweis: Die Formel ⎛ ⎞ ⎛ ⎞
? −3 1 @
−1
({0})) = n − rg A ⎜ 2 ⎟ ⎜0⎟
dim(ϕA ker ϕA = ⎝ ⎠ , ⎝ ⎟
⎜ ⎟ ⎜ .
3 0⎠
ist wohlbekannt (siehe Seite 184). Weil die Dimension des 0 1
Bildes von ϕA die Dimension des Spaltenraums -s 1 , . . . , s n .
Das Bild von A ist der Spaltenraum von A, d. h. das Erzeugnis
der Matrix A ist, folgt aus der Dimensionsformel die zweite
der Spaltenvektoren von A. Wir erhalten durch elementare
Formel:
Spaltenumformungen eine Basis. Da wir aber wissen, dass
rg A = dim-s 1 , . . . , s n . . 
der Spaltenrang, d. h. die Dimension des Spaltenraums, 2
ist, weil der Spaltenrang gleich dem Zeilenrang ist, reicht
es aus,wenn wir zwei linear unabhängige Vektoren aus dem
Insbesondere haben also Zeilen- und Spaltenraum einer Ma-
Bild von A angeben. Dazu können wir offenbar die ersten
trix die gleiche Dimension. Das halten wir fest:
beiden Spalten von A wählen, d. h.
⎛ ⎞ ⎛ ⎞
Zeilenrang = Spaltenrang ? 0 −3 @
⎜−2⎟ ⎜−3⎟
Für alle natürlichen Zahlen m, n und jede Matrix A ∈ Bild ϕA = ⎜ ⎟ ⎜ ⎟
⎝3⎠, ⎝0⎠ . 
Km×n gilt:
0 3
Zeilenrang = Spaltenrang .
Kommentar: Ist ϕ eine lineare Abbildung zwischen K-
Ein direkter Nachweis dieser Formel (also ohne Rückgriff auf Vektorräumen V und W , so sind für die Dimensionen des
den Dimensionssatz) ist möglich, aber ziemlich aufwendig. Bildes ϕ(V ) und des Kerns ϕ −1 ({0}) auch die Bezeichnun-
gen Rang und Defekt üblich:
Beispiel Wir bestimmen den Kern und das Bild der Matrix
Rg ϕ = dim ϕ(V ) und Df ϕ = dim ϕ −1 ({0}) .
⎛ ⎞
0 −3 2 0 Mit diesen Bezeichnungen lautet die Dimensionsformel für
⎜−2 −3 0 2⎟
A=⎜
⎝3
⎟ ∈ R4×4 . einen endlichdimensionalen Vektorraum V :
0 3 −3⎠
0 3 −2 0 dim V = Rg ϕ + Df ϕ .
432 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Nach dem Homomorphiesatz liefert jeder Die Aussage in (iii) ist offensichtlich.
Homomorphismus einen Isomorphismus (iv) Es seien v + U, w + U ∈ V /U und λ ∈ K. Dann gilt:

Auf Seite 77 haben wir den Homomorphiesatz für Grup- ψ(λ (v + U ) + (w + U )) = ψ(((λ v) + w) + U ))
pen begründet. Ein entsprechender Satz gilt auch für Vek-
= ϕ(λ v + w)
torräume:
= λ ϕ(v) + ϕ(w)
Der Homomorphiesatz = λ ψ(v + U ) + ψ(w + U ) .
Ist ϕ : V → V
eine lineare Abbildung von einem K-
Vektorraum V in einen K-Vektorraum V  , so ist Damit gilt (iv). 


V / ker ϕ → ϕ(V ),
ψ: Jeder Homomorphismus ϕ : V → V  induziert somit einen
v + ker ϕ  → ϕ(v)
Isomorphismus ψ : V / ker ϕ → ϕ(V ).
ein Isomorphismus vom Faktorraum V / ker ϕ auf das
Bild von ϕ, insbesondere gilt: Kommentar: Man beachte, dass die Injektivität (ϕ(v) =
ϕ(v  ) ⇒ v + U = v  + U ) die Umkehrung der Wohldefi-
V / ker ϕ ∼
= ϕ(V ) .
niertheit (v + U = v  + U ⇒ ϕ(v) = ϕ(v  )) ist.

Beweis: Im Einzelnen ist zu begründen: Beispiel


(i) ψ ist eine Abbildung. Jede Matrix A = (s 1 , . . . , s n ) ∈ Km×n definiert eine
(ii) ψ ist injektiv. lineare Abbildung ϕA : Kn → Km . Der Kern U = ker ϕA
dieser linearen Abbildung ϕA ist der Kern der Matrix A:
(iii) ψ ist surjektiv.
(iv) ψ ist linear. U = {v ∈ Kn | A v = 0} .

Wir schreiben kürzer U = ker ϕ. Und das Bild ϕA (Kn ) ist der Spaltenraum -s 1 , . . . , s n .
(i) Die Elemente aus V /U haben die Form v +U . Eine solche der Matrix A. Nach dem Homomorphiesatz gilt:
Nebenklasse ist nicht eindeutig durch den Repräsentanten v
Kn /U ∼
= -s 1 , . . . , s n . .
erklärt; es kann durchaus v + U = v  + U und v  = v 
gelten. Damit ψ eine Abbildung ist, muss gewährleistet sein,
dass jedem v + U aus V /U genau ein Element aus ϕ(V ) d
Das Differenzieren dX ist im K-Vektorraum K[X] eine
zugeordnet wird, d. h.,
surjektive lineare Abbildung mit dem Kern K. Nach dem
aus v + U = v  + U folgt ϕ(v) = ϕ(v  ) . Homomorphiesatz gilt:

Es seien also v, v  ∈ V . Dann gilt: K[X]/K ∼


= K[X] . 
 
v+U =v +U ⇒ v−v ∈U
⇒ ϕ(v − v  ) = 0
12.4 Darstellungsmatrizen
⇒ ϕ(v) − ϕ(v  ) = 0
⇒ ϕ(v) = ϕ(v  ) .
In diesem Abschnitt betrachten wir nur endlichdimensionale
Damit gilt (i). Vektorräume.
(ii) Es ist zu zeigen Wir ordnen einer linearen Abbildung ϕ : V → W zwischen
endlichdimensionalen K-Vektorräumen V und W nach Wahl
aus ϕ(v) = ϕ(v  ) folgt v + U = v  + U . von Basen der Vektorräume eine Matrix A zu – die soge-
Dies gilt, da sich die Implikationen in (i) umkehren lassen: nannte Darstellungsmatrix der linearen Abbildung bezüglich
Es seien v, v  ∈ V . Dann gilt: der gewählten Basen.

ϕ(v) = ϕ(v  ) ⇒ ϕ(v) − ϕ(v  ) = 0 Anstelle des Vektors v ∈ V betrachten wir den zu v gehörigen
Koordinatenvektor B v bezüglich einer Basis B – das ist ein
⇒ ϕ(v − v  ) = 0
Spaltenvektor.
⇒ v − v ∈ U
Dann ist das Abbilden des Vektors v, also das Bilden von
⇒ v + U = v + U .
ϕ(v), im Wesentlichen die Multiplikation der Matrix A mit
Damit gilt (ii). dem Koordinatenvektor B v.
12.4 Darstellungsmatrizen 433

' (
In diesem Sinne werden die im Allgemeinen durchaus ab- 1
Der Vektor v = hat bezüglich der geordneten Stan-
strakten Objekte der linearen Abbildungen zwischen endlich- 1
dimensionalen Vektorräumen greifbar – eine lineare Abbil- dardbasis E2 den Koordinatenvektor
dung ist im Wesentlichen eine Matrix und das Abbilden eines ' (
1
Vektors die Multiplikation dieser Matrix mit einem Spalten- E2 v = ,
1
vektor. Damit erklärt sich die bereits betonte Bedeutung des
ausführlichen Beispiels auf Seite 421. '' ( ' ((
1 −1
bezüglich der geordneten Basis B = , den
1 1
Koordinatenvektor
Durch Koordinatenvektoren wird jeder Vektor ' (
1
zu einem Spaltenvektor Bv = .
0
'' ( ' ((
In Mengen sind die Elemente nicht angeordnet, es gilt −1 1
Und bezüglich der Basis C = , hat v
{a, b} = {b, a}. Im Folgenden wird es für uns aber wichtig 2 −1
sein, in welcher Reihenfolge die Elemente einer Basis an- den Koordinatenvektor
' (
geordnet sind. Dazu benutzen wir Tupel. Für verschiedene 2
Elemente a, b einer Menge A gilt nämlich: C v = ,
3

(a, b), (b, a) ∈ A × A aber (a, b)  = (b, a) . vgl. Abbildung 12.7.

Man spricht auch von geordneten Tupeln (siehe den Ab-


schnitt auf Seite 38). Mit den geordneten Tupeln führen wir 2 c1 4
geordnete Basen von Vektorräumen ein.
3
Ist {b1 , . . . , bn } eine Basis eines K-Vektorraums V , ins-
besondere also dim(V ) = n, so nennen wir das n-Tupel −1
= c1 2
B = (b1 , . . . , bn ) eine geordnete Basis von V . 2

1 2
Achtung: Es sind dann z. B. (e1 , e2 , e3 ) und (e2 , e1 , e3 ) 1 C 1 = 3
beides geordnete Basen des R3 . Als geordnete Basen sind die
beiden verschieden, als Mengen betrachtet aber sehr wohl
−2 −1 1 2 3
gleich. 1
−1 c2 = −1
Nach einem Ergebnis auf Seite 204 ist jeder Vektor eines Vek-
torraums eindeutig als Linearkombination einer Basis dar- −2
stellbar. Diese Darstellung liefert den Koordinatenvektor.
−3 3 c2

Der Koordinatenvektor bezüglich einer Basis B


Abbildung 12.7 Der Vektor e1 +e2 = 2 c1 +3 c2 hat bezüglich der geordneten
Ist B = (b1 , . . . , bn ) eine geordnete Basis eines K- Basis C = (c1 , c2 ) die Koordinaten 2 und 3.
Vektorraums V , so besitzt jedes v ∈ V genau eine Dar-
stellung Für die geordneten Basen B = (i, i X, X + X2 ) und
v = v1 b1 + · · · + vn bn B  = (2, 3 X, 4 X2 ) des komplexen Vektorraums C[X]2
⎛ ⎞ der Polynome vom Grad kleiner oder gleich 2 und das
v1
⎜ .. ⎟ Polynom
mit v1 , . . . , vn ∈ K. Es heißt B v = ⎝ . ⎠ ∈ Kn der
vn p = 4 X2 + 2
Koordinatenvektor von v bezüglich B. = (−2 i) i + (4 i) (i X) + 4 (X + X 2 )
= 1 (2) + 0 (3 X) + 1 (4 X2 )
Beispiel gilt: ⎞⎛ ⎛ ⎞
Für die geordneten Basen E2 = (e1 , e2 ) – die geordnete −2 i 1
Standardbasis – und E = (e2 , e1 ) des R2 und den Vektor p = ⎝ 4 i ⎠ und  p = ⎝ 0 ⎠.
' ( B B
2 4 1
v= = 2 e1 + 1 e2 = 1 e2 + 2 e1 gilt:
1 ' (
1 2
' ( ' ( Die Matrix A = ∈ R2×2 hat bezüglich der geord-
2 1 3 4
E2 v = und E v = .
1 2 neten Standardbasis E = (E11 , E12 , E21 , E22 ) des R2×2
434 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

den Koordinatenvektor Damit ist B ϕ nach dem Injektivitätskriterium auf Seite 427
⎛ ⎞ injektiv. ⎛ ⎞
1 λ1
⎜2⎟ ⎜ ⎟
⎜ ⎟
EA = ⎝ ⎠ . Zur Surjektivität: Der Vektor ⎝ ... ⎠ ∈ Kn ist das Bild des
3
4  λn
Vektors
Kommentar: Ein Vertauschen des i-ten Elementes mit v = λ1 b1 + · · · + λn bn ∈ V ,
dem j -ten Element einer geordneten Basis führt also zu sodass die Abbildung B ϕ auch surjektiv ist. 
einem Vertauschen der i-ten Komponente mit der j -ten Kom-
ponente des Koordinatenvektors.
Die eben bewiesene Isomorphie zwischen einem beliebi-
gen n-dimensionalen K-Vektorraum V und dem Kn besagt,
dass die beiden Vektorräume V und Kn sich nur durch die
Jeder n-dimensionale Vektorraum über K ist Bezeichnung der Elemente unterscheiden. Jeder n-dimen-
zu Kn isomorph sionale K-Vektorraum hat die gleiche Struktur wie der Kn . Ist
die Dimension von V endlich, so beschreibt die Dimension
Ordnet man jedem Vektor v aus V seinen Koordinatenvektor den Vektorraum V eindeutig bis auf Isomorphie.
B v bezüglich einer geordneten Basis B zu, so hat man eine
Damit sind die endlichdimensionalen K-Vektorräume durch
Abbildung von V in den Kn definiert, hierbei ist n = dim V .
ihre Dimension klassifiziert. Zu jeder natürlichen Zahl n gibt
Diese Abbildung liefert ein zentrales Ergebnis der linearen
es im Wesentlichen nur einen einzigen K-Vektorraum der
Algebra:
Dimension n, nämlich den Vektorraum Kn mit den vertrauten
Spaltenvektoren.
Jeder n-dimensionale K-Vektorraum ist zum Kn iso-
morph Nun ist es nur naheliegend, wie wir weiter vorgehen werden:
Den Wunsch, alle linearen Abbildungen ϕ zwischen zwei
Ist B = (b1 , . . . , bn ) eine geordnete Basis des n-di- Vektorräumen V und W beschreiben, erfassen und greifbar
mensionalen K-Vektorraums V , so ist die Abbildung machen zu können, erfüllen wir uns im Fall dim V = n ∈ N
 und dim W = m ∈ N wie folgt: Wir identifizieren V mit
V → Kn ,
Bϕ : Kn und W mit Km und beschreiben den Zusammenhang
v → B v
ϕ(v) = w mit v ∈ V und w ∈ W durch eine Darstel-
eine bijektive und lineare Abbildung, d. h. ein Isomor- lungsmatrix A:
phismus. ϕ(v) = w ←→ Bv = A Cw .

Kommentar: In der Algebra will man sogenannte alge-


Beweis: Es ist zu zeigen, dass B ϕ linear, injektiv und sur-
braische Strukturen wie etwa Gruppen, Ringe, Körper oder
jektiv ist.
K-Vektorräume durch Invarianten klassifizieren. Bei den
Zur Homomorphie: Es seien v, w ∈ V , und es gelte endlichdimensionalen K-Vektorräumen ist uns dies mithilfe
der Dimension gelungen. Bei z. B. den endlichen Gruppen ist
v = λ1 b1 + · · · + λn bn , keine so einfache Klassifikation möglich. Die Gruppenord-
w = μ1 b1 + · · · + μn bn . nung beschreibt eine endliche Gruppe nicht eindeutig bis auf
Isomorphie. So gibt es zwei wesentlich verschiedene Grup-
Dann gilt für jedes λ ∈ K: pen der Ordnung 4.

λ v + w = (λ λ1 + μ1 ) b1 + · · · + (λ λn + μn ) bn . Wir erklären nun die Darstellungsmatrix einer linearen Ab-


bildung. Dabei behandeln wir zuerst den einfacheren Fall
Damit erhalten wir:
V = Kn und W = Km mit den zugehörigen Standardbasen
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
λ λ1 + μ1 λ1 μ1 En und Em .
⎜ . ⎟ ⎜ . ⎟ ⎜ . ⎟
B ϕ(λ v + w) = ⎝ .. ⎠ = λ ⎝ .. ⎠ + ⎝ .. ⎠
λ λn + μn λn μn Jede lineare Abbildung vom Kn in den Km ist
= λ B ϕ(v) + B ϕ(w) . durch eine Matrix gegeben

Somit ist B ϕ eine lineare Abbildung. Sind ϕ eine


⎛ beliebige
⎞ lineare Abbildung von Kn in den Km
v1
Zur Injektivität: Aus B ϕ(v) = 0 für ein v ∈ V folgt ⎜ ⎟
und v = ⎝ ... ⎠ ∈ Kn , so erhalten wir nach Darstellung von
v = 0 · b1 + · · · + 0 · bn = 0 . vn
12.4 Darstellungsmatrizen 435

v bezüglich der Standardbasis En des Kn für das Bild von v Die Matrix, die eine lineare Abbildung
wegen der Linearität von ϕ darstellt, erhält man spaltenweise
ϕ(v) = ϕ(v1 e1 + · · · + vn en )
Wie eben gezeigt, können wir jeder linearen Abbildung ϕ
= v1 ϕ(e1 ) + · · · + vn ϕ(en ) von Kn in den Km eine Matrix zuordnen, mit der wir die
⎛ ⎞
v1 lineare Abbildung ϕ beschreiben können. Mit der Matrix
⎜ ⎟ A = (ϕ(e1 ), . . . , ϕ(en )) ∈ Km×n gilt:
= (ϕ(e1 ), . . . , ϕ(en )) ⎝ ... ⎠

=:A vn ϕ = ϕA .
= A v = ϕA (v) ,
Wir wollen dies auf endlichdimensionale beliebige K-Vek-
also ϕ = ϕA . torräume V und W verallgemeinern.

Darstellung linearer Abbildungen von Kn in den Km Die Darstellungsmatrix einer linearen Abbildung
bezüglich der Standardbasen
Es seien V ein n-dimensionaler und W ein m-dimen-
Zu jeder linearen Abbildung ϕ von Kn in Km gibt es sionaler K-Vektorraum mit den geordneten Basen B =
eine Matrix A ∈ Km×n mit ϕ = ϕA . Diese Matrix A ist (b1 , . . . , bn ) von V und C = (c1 , . . . , cm ) von W .
gegeben als Und ϕ sei eine lineare Abbildung von V nach W . Man
nennt die Matrix
A = (ϕ(e1 ), . . . , ϕ(en )) ∈ Km×n .
C M(ϕ)B = (C ϕ(b1 ), . . . , C ϕ(bn )) ∈ Km×n
Die i-te Spalte von A ist das Bild des i-ten Basisvektors
der Standardbasis. die Darstellungsmatrix von ϕ bezüglich der Basen B
und C.
Beispiel
Zur Nullabbildung Die i-te Spalte von C M(ϕ)B ist der Koordinatenvektor
 des Bildes des i-ten Basisvektors.
R3 → R 2 ,
ϕ:
v → 0 Wir drücken das noch etwas ungenauer in einer Form aus,
in der man sich die Konstruktion der Darstellungsmatrix gut
gehört die Nullmatrix 0 aus R2×3 . merken kann: „Die Spalten der Darstellungsmatrix sind die
Zur Identität  3 Bilder der Basisvektoren.“
R → R3 ,
id :
v → v
?
gehört die Einheitsmatrix E3 ∈ R3×3 . Inwiefern verallgemeinert dies die Konstruktion von
Zur linearen Abbildung Seite 435?
⎧ 3

⎪ R → R2 ,
⎨⎛ ⎞ ' (
x Zu jeder linearen Abbildung zwischen endlichdimensiona-
ϕ : ⎝ 1⎠ x1 + x 2

⎪ x  → len Vektorräumen existiert eine Darstellungsmatrix. Inwie-
⎩ 2 x2
x3 fern eine Darstellungsmatrix die lineare Abbildung darstellt,
klären wir gleich nach den folgenden Beispielen.
gehört wegen
' ( ' ( ' ( Beispiel
1 1 0
ϕ(e1 ) = , ϕ(e2 ) = , ϕ(e3 ) = Als Darstellungsmatrix der Nullabbildung ϕ : R2 → R3 ,
0 1 0
v → 0 bezüglich der geordneten Standardbasen E2 des
' (
1 1 0 R2 und E3 des R3 erhalten wir
die Matrix A = . Es gilt:
0 1 0
⎛⎛ ⎞⎞ ⎛ ⎞ E2 M(ϕ)E3 = (E2 ϕ(e1 ), . . . , E2 ϕ(e2 ), E2 ϕ(e3 )) =
x1 x1 ' (
0 0 0
ϕ ⎝⎝x2 ⎠⎠ = A ⎝x2 ⎠ .  =
0 0 0
x3 x3
Allgemeiner gilt: Die Darstellungsmatrix der Nullabbil-
? dung eines n-dimensionalen Vektorraums in einen m-
Können auch Zeilen oder Spalten, also Matrizen aus K1×n dimensionalen Vektorraum ist die m × n-Nullmatrix.
oder Kn×1 , solche Darstellungsmatrizen sein? Nun bilden wir die Darstellungsmatrix der Identität
ϕ = idR2 : v → v bezüglich verschiedener geordneter
436 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

' (' ( ' (' (


Basen E2 = (e1 , e2 ) und E = (e2 , e1 ). Dann gilt 0 −1 0 0 0 0 0 −1
ϕ(E21 ) = −
' ( 1 0 1 0 1 0 1 0
1 0 ' ( ' (
E2 M(ϕ)E2 = (E2 ϕ(e1 ), ϕ(e )) = , −1 0 0 0
E2 2
0 1 = − = −E11 + E22
' ( 0 0 0 −1
1 0 ' (' ( ' (' (
E M(ϕ)E = (E ϕ(e2 ), E ϕ(e1 )) = , 0 −1 0 0 0 0 0 −1
0 1 ϕ(E22 ) = −
' ( 1 0 0 1 0 1 1 0
0 1 ' ( ' (
E2 M(ϕ)E = (E2 ϕ(e2 ), E2 ϕ(e1 )) = , 0 −1 0 0
1 0 = − = −E12 − E21
' ( 0 0 1 0
0 1
E M(ϕ)E2 = (E ϕ(e1 ), E ϕ(e2 )) = . Die Darstellungsmatrix E M(ϕ)E von ϕ ist demnach
1 0
⎛ ⎞
0 −1 −1 0
Ist ϕ die lineare Abbildung Kn → Km , v  → A v mit einer ⎜1 0 0 −1⎟
E M(ϕ)E = ⎝
⎜ ⎟. 
Matrix A ∈ Km×n , so gilt mit den Standardbasen En und 1 0 0 −1⎠
Em : 0 1 1 0
Em M(ϕ)En = A.
Beispiel Wir betrachten eine Projektion vom R3 auf eine
Es bezeichne ϕ = dX d
: R[X]2 → R[X]2 das Diffe- Ebene E ⊆ R3 (wir benutzen Begriffe aus dem Kapitel 7 zur
renzieren von Polynomen. Im reellen Vektorraum R[X]2 analytischen Geometrie):
betrachten wir die beiden geordneten Basen B =  3
R → E,
(1, X, X 2 ) und C = (X 2 + X + 1, X + 1, 1). Dann π:
v → π(v),
gilt wegen ϕ(1) = 0, ϕ(X) = 1, ϕ(X2 ) = 2 X:
⎛ ⎞ wobei jeder Punkt des R3 parallel zu einer Normalen der
0 1 0 Ebene E, d. h. zu einem Vektor n = 0, der senkrecht auf
B M(ϕ)B = (B ϕ(1), B ϕ(X), B ϕ(X 2 )) = ⎝0 0 2⎠ allen Vektoren der Ebene E steht, auf die Ebene E abgebildet
0 0 0 wird (Abb. 12.8).

und analog

C M(ϕ)C = (C ϕ(X 2 + X + 1), C ϕ(X + 1), C ϕ(1))


⎛ ⎞
0 0 0
= ⎝ 2 0 0⎠ .
−1 1 0 n

Wir erklären eine lineare Abbildung ϕ : K2×2 → K2×2


durch
' (
0 −1
ϕ(A) = M A − A M mit M = .
1 0

Im K2×2 wählen wir die geordnete Standardbasis E =


(E11 , E12 , E21 , E22 ); Koordinatenvektoren sind also
Spaltenvektoren aus K4 .
Wir berechnen der Reihe nach die Bilder der Basisvekto- Abbildung 12.8 Die Punkte des R3 werden parallel zur Normalen n auf die
ren und stellen diese Bilder dann als Linearkombinationen Ebene projiziert.
der Vektoren der Basis E dar.
Es ergibt sich: Die Ebene E ist gegeben durch eine Gleichung
' (' ( ' (' ( a1 x1 + a2 x2 + a3 x3 = 0
0 −1 1 0 1 0 0 −1
ϕ(E11 ) = −
1 0 0 0 0 0 1 0 mit a1 , a2 , a3 ∈ R. Da die Ebene E den Nullpunkt ent-
' ( ' ( hält, ist sie ein Untervektorraum des R3 . Eine Normale dieser
0 0 0 −1
= − = E12 + E21 Ebene E können wir leicht angeben. Der Vektor
1 0 0 0
' (' ( ' (' ( ⎛ ⎞
0 −1 0 1 0 1 0 −1 a1
ϕ(E12 ) = − n = ⎝a2 ⎠
1 0 0 0 0 0 1 0
' ( ' ( a3
0 0 1 0
= − = −E11 + E22
0 1 0 0 erfüllt die Bedingung n ⊥ v für jedes v ∈ E.
12.4 Darstellungsmatrizen 437

Nun untersuchen wir, wie diese Projektion dargestellt werden Eine lineare Abbildung wird durch eine Darstellungs-
kann. Wir wählen eine Basis {b, c} der Ebene E. Es ist dann matrix beschrieben
B = {n, b, c} offenbar eine Basis des R3 . Nun können wir
Gegeben ist eine lineare Abbildung ϕ : V → W zwi-
jeden Vektor v ∈ R3 als Linearkombination von B darstellen,
schen zwei endlichdimensionalen K-Vektorräumen V
⎛ ⎞
λ1 und W .
v = λ1 n + λ2 b + λ3 c d. h., B v = ⎝λ2 ⎠ .
Ist B = (b1 , . . . , bn ) bzw. C = (c1 , . . . , cm ) eine
λ3
Basis von V bzw. W , so gilt:
Das Durchführen der Projektion ist ganz einfach, beachte = C M(ϕ)B B v .
C ϕ(v)
Abbildung 12.9:
⎧ Der Koordinatenvektor von ϕ(v) ist das Produkt der
⎛ ⎞ →
R3 3


⎨ ⎛R ,⎞ Darstellungsmatrix mit dem Koordinatenvektor von v.
λ1 0
π: ⎝λ2 ⎠  → ⎝λ2 ⎠ .

⎪ B v = ⎛ ⎞
⎩ v1
λ3 λ3
⎜ ⎟
Beweis: Gilt B v = ⎝ ... ⎠, so erhalten wir wegen
n vn
C M(ϕ)B = (C ϕ(b1 ), . . . , C ϕ(bn )):

C M(ϕ)B B v = v1 C ϕ(b1 ) + · · · + vn C ϕ(bn ) .

Und wegen des Satzes auf Seite 434:


c
C ϕ(v) = C (ϕ(v1 b1 + · · · + vn bn ))
= v1 C ϕ(b1 ) + · · · + vn C ϕ(bn ) .
b Also gilt die angegebene Gleichheit. 

Mithilfe der Koordinatenvektoren bezüglich der Basen B und


Abbildung 12.9 Die Projektion auf eine Ebene. C von V und W und der Darstellungsmatrix C M(ϕ)B können
wir die (abstrakte) lineare Abbildung ϕ : V → W (konkret)
Und die Darstellungsmatrix dieser Projektion π bezüglich darstellen, man beachte das folgende Diagramm (zu B ϕ und
der Basis B erhalten wir nun auch ganz einfach, C ϕ vgl. den Satz auf Seite 434):
⎛ ⎞
0 0 0
B M(π)B = ⎝0 1 0⎠ .
0 0 1

?
Was sind Kern und Bild der Projektion?


Nachdem klar ist, wie man die Darstellungsmatrix einer li- Kommentar: Die Formel
nearen Abbildung bestimmt, überlegen wir uns, in welcher
C ϕ(v) = C M(ϕ)B B v
Art und Weise die Darstellungsmatrix nun benutzt werden
kann, um die lineare Abbildung, aus der sie gewonnen wurde, kann man sich einfach merken – das B kürzt sich durch das
auszudrücken. Aufeinandertreffen weg.

Eine lineare Abbildung auf einen Vektor


?
anzuwenden, bedeutet, die Darstellungs- Was bedeutet
matrix mit dem Koordinatenvektor zu
multiplizieren C ϕ(v) = B M(ϕ)B B v ?

Inwiefern stellt die Darstellungsmatrix C M(ϕ)B einer linea-


ren Abbildung ϕ die Abbildung dar? Es gilt der folgende Beispiel Wir betrachten erneut das obige Beispiel zur
d
einfache Zusammenhang. Differenziation ϕ = dX : R[X]2 → R[X]2 . Es ist
438 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

C = (c1 = X 2 + X + 1, c2 = X + 1, c3 = 1) eine Basis Der Kern und das Bild von ϕ


von R[X]2 , und es gilt:
Mit den eingeführten Bezeichnungen gilt für v ∈ V und
⎛ ⎞ w ∈ W:
0 0 0
C M(ϕ)C = ⎝ 2 0 0⎠ v ∈ ker(ϕ) ⇔ ∈ ker A ,
Bv
−1 1 0 n
w ∈ ϕ(V ) ⇔ C w ∈ ϕA (K ) .

Nun betrachten wir das Polynom p = X2 + 2 X − 1. Wegen

p = 1 · c1 + 1 · c2 + (−3) · c3 Beweis: Nach dem Satz zur Darstellungsmatrix auf


Seite 437 gilt:
⎛ ⎞
1
ist C p = ⎝ 1 ⎠ der Koordinatenvektor von p bezüglich der Bv ∈ ker A ⇔ C ϕ(v) = 0 ⇔ ϕ(v) = 0
−3 ⇔ v ∈ ker ϕ .
Basis C. Nun bilden wir zum einen den Koordinatenvektor
von ϕ(p) = 2 X + 2 bezüglich C: Das beweist die erste Äquivalenz. Wir begründen die zweite
Äquivalenz; dazu sei A = (s 1 , . . . , s n ):
⎛ ⎞
0
C ϕ(p) = ⎝2⎠
ω ∈ ϕ(V ) ⇔ ω = ϕ(v), v = v1 b1 + · · · + vn bn , vi ∈ K
0 ⇔ ω = v1 ϕ(b1 ) + · · · + vn ϕ(bn ), vi ∈ K
⇔ C ω = v1C ϕ(b1 ) + · · · + vnC ϕ(bn ), vi ∈ K
und zum anderen das Produkt ⎛ ⎞
v1
⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎜ .. ⎟
0 0 0 1 0 ⇔ C ω = A ⎝ . ⎠ , vi ∈ K 

C M(ϕ) CC p = ⎝ 2 0 0 ⎠ ⎝ 1 ⎠ = ⎝2 ⎠ . 
vn
−1 1 0 −3 0

Beispiel Wir bestimmen den Kern und das Bild der auf
Die Formel im obigen Satz liefert im Fall ϕ = id auch Ko- Seite 435 gegebenen linearen Abbildung
ordinatenvektoren von Vektoren eines K-Vektorraums V be- 
züglich einer Basis C, wenn jene bezüglich einer Basis B K2×2 → K2×2 ,
ϕ:
bekannt sind. A → M A − A M,
⎛ ⎞ ('
1 0 −1
wobei M =
Beispiel Der Vektor E3 v = ⎝2⎠, dargestellt bezüglich 1 0
3 Die lineare Abbildung ϕ hat bezüglich der geordneten Stan-
3
der Standardbasis E3 des R , hat bezüglich der geordneten dardbasis E = (E11 , E12 , E21 , E22 ) die Darstellungsma-
Basis C = (e1 + e2 , e2 + e3 , e1 ) den Koordinatenvektor trix ⎛ ⎞
0 −1 −1 0
Cv = C M(id)E3 E3 v ⎜1 0 0 −1⎟
⎛ ⎞⎛ ⎞ ⎛ ⎞ E M(ϕ)E = ⎝
⎜ ⎟
0 1 −1 1 −1 1 0 0 −1⎠
= ⎝0 0 1 ⎠ ⎝2⎠ = ⎝ 3 ⎠ .  0 1 1 0
1 −1 1 3 2
(Seite 435).
Durch elementare Zeilenumformungen erhalten wir den Kern
von A = E M(ϕ)E :
Der Kern und das Bild einer linearen
⎛ ⎞ ⎛ ⎞
Abbildung ist durch den Kern und das Bild 0 −1 −1 0 1 0 0 −1
einer Darstellungsmatrix gegeben ⎜1 0 0 −1⎟ ⎜0 1 1 0⎟
⎜ ⎟→⎜ ⎟
⎝1 0 0 −1⎠ ⎝0 0 0 0⎠
Die Eigenschaften einer linearen Abbildung ϕ finden sich 0 1 1 0 0 0 0 0
in ihrer Darstellungsmatrix wieder. Ist ϕ z. B. eine lineare
Abbildung zwischen zwei endlichdimensionalen K-Vektor- Somit gilt:
⎛ ⎞ ⎛ ⎞
räumen V und W mit dim V = n und dim W = m, so ist ? 1 0 @
jede Darstellungsmatrix von ϕ eine m × n-Matrix. Es sei ⎜0⎟ ⎜1⎟
ker A = ⎜ ⎟
⎝0⎠ ,
⎜ ⎟ .
⎝−1⎠
A = C M(ϕ)B eine solche Darstellungsmatrix mit Basen B
von V und C von W . Wir zeigen: 1 0
12.4 Darstellungsmatrizen 439

Wegen Beweis: Wir wählen


⎛ ⎞ ⎛ ⎞ eine geordnete Basis (b1 , . . . , bs ) des Kerns ker ϕ ⊆ V
1 ' ( 0 ' (
⎜0⎟ 1 0 ⎜1⎟ von ϕ und
⎜ ⎟=E und ⎜ ⎟=E 0 1 eine geordnete Basis (c1 , . . . , cr ) des Bildes ϕ(V ) ⊆ W
⎝0⎠ 0 1 ⎝−1⎠ −1 0
1 0 von ϕ.
Zu den r Vektoren c1 , . . . , cr aus W gibt es r Vektoren
haben wir damit auch den Kern von ϕ bestimmt: a 1 , . . . , a r in V mit
' ( ' (
1 0 0 1 ϕ(a 1 ) = c1 , . . . , ϕ(a r ) = cr .
ker ϕ = - , ..
0 1 −1 0
Wegen der linearen Unabhängigkeit von c1 , . . . , cr ∈ W
Durch elementare Spaltenumformungen erhalten wir das sind auch die Vektoren a 1 , . . . , a r ∈ V linear unabhängig.
Bild von A = E M(ϕ)E : Aus
λ1 a 1 + · · · + λr a r = 0
⎛ ⎞ ⎛ ⎞
0 −1 −1 0 0 −1 0 0 folgt durch Anwenden von ϕ:
⎜1 0 0 −1⎟ ⎜1 0 0 0⎟
⎜ ⎟→⎜ ⎟
⎝1 0 0 −1⎠ ⎝1 0 0 0⎠ λ1 c1 + · · · + λr cr = 0 .
0 1 1 0 0 1 0 0
Das liefert λ1 = · · · = λr = 0.
Somit gilt:
⎛ ⎞ ⎛ ⎞ Nun ist B = (a 1 , . . . , a r , b1 , . . . , bs ) eine Basis von V
0 −1 (beachte die Dimensionsformel auf Seite 427).
⎜1⎟ ⎜0⎟
ϕA (K ) = -⎜
4 ⎟
⎝1⎠ ,
⎜ ⎟. .
⎝0⎠ Wir ergänzen nun noch die linear unabhängige Teilmenge
{c1 , . . . , cr } von W zu einer Basis C = {c1 , . . . , cm } von
0 1
W und bestimmen die Darstellungsmatrix C M(ϕ)B von ϕ
Wegen bezüglich dieser Basen:
⎛ ⎞ ⎛ ⎞ Wegen ϕ(a 1 ) = c1 , . . . , ϕ(a r ) = cr sind die ersten r Spal-
0 ' ( −1 ' (
⎜1⎟ ⎜ ⎟ ten von der gewünschten Form:
⎜ ⎟ = E 0 1 und ⎜ 0 ⎟ = E −1 0
⎝1⎠ 1 0 ⎝0⎠ 0 1 C ϕ(a 1 ) = e1 ∈ Km , . . . , C ϕ(a r ) = er ∈ Km .
0 1
Und wegen ϕ(b1 ) = · · · = ϕ(bs ) = 0 sind die restlichen
haben wir damit auch das Bild von ϕ bestimmt: s = n − r Spalten von C M(ϕ)B Nullspalten. Damit hat die
' ( ' ( Darstellungsmatrix die gewünschte Form. 

2×2 0 1 −1 0
ϕ(K )=- , .. 
1 0 0 1
Beispiel Gegeben ist die Matrix
⎛ ⎞
−2 3 2 3
A = ⎝−3 5 0 1 ⎠ ∈ R3×4 .
−1 2 −2 −2
Jede lineare Abbildung zwischen
endlichdimensionalen Räumen kann durch Wir wollen geordnete Basen B von R4 und C von R3 bestim-
men, sodass die Darstellungsmatrix C M(ϕA )B der linearen
eine sehr einfache Matrix dargestellt werden
Abbildung ϕA : R4 → R3 , v → A v die im obigen Satz
angegebene Form hat.
Wir können zu jeder linearen Abbildung ϕ : V → W zwi-
schen endlichdimensionalen K-Vektorräumen V und W eine Dazu ermitteln wir Basen von ker ϕA und ϕA (R4 ):
ganz einfache Darstellungsmatrix angeben, die von Einsen ⎛ ⎞ ⎛ ⎞
12 10 ⎛ ⎞ ⎛ ⎞
auf einer Diagonalen abgesehen, nur aus Nullen besteht: ⎜7⎟ ⎜6⎟ 1 0
ker ϕA = -⎜ ⎟ , ⎜ ⎟. und ϕ(R4 ) = -⎝ 0 ⎠ , ⎝1⎠..
⎝0⎠ ⎝1⎠
−1 1
Die einfachste Darstellungsmatrix 1 0
Es seien n = dim V und m = dim W , ϕ : V → W linear Wir bestimmen nun Urbilder der angegeben Basisvektoren
und r = dim ϕ(V ). Es existieren Basen B von V und C vom Bild ϕA (R4 ). Es gilt:
von W mit ' ( ⎛⎛ ⎞⎞ ⎛⎛ ⎞⎞
Er 0 −5 ⎛ ⎞ 3 ⎛ ⎞
C M(ϕ) B = 1 0
0 0 ⎜⎜−3⎟⎟ ⎜⎜2⎟⎟
ϕA ⎜ ⎜ ⎟⎟ = ⎝ 0 ⎠ und ϕA ⎜⎜ ⎟⎟ = ⎝1⎠ .
⎝⎝ 0 ⎠⎠ ⎝⎝0⎠⎠
wobei Er die r × r-Einheitsmatrix ist. −1 1
0 0
440 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Beispiel: Die Darstellungsmatrix einer Spiegelung an einer Geraden durch den Ursprung
Wir betrachten im R2 , mit dem üblichen kartesischen
Koordinatensystem, den Endomorphismus ϕ, den wir x2
durch lineare Fortsetzung der Abbildung σ (e1 ) = e2
und σ (e2 ) = e1 erhalten. Bei dieser 'Abbildung wird ϕ(e1 ) = e2
(
1
jeder Punkt des R2 an der Geraden R gespiegelt.
1 ϕ(v) = v1 ϕ(e1 ) + v2 ϕ(e2 )
v1
Man beachte die nebenstehende Abbildung.
v1
Wir bestimmen die Darstellungsmatrizen dieser linearen
Abbildung zum einen bezüglich der Standardbasis E2
v2 e1 = ϕ(e2 ) x1
und zum anderen bezüglich der geordneten Basis
' ' ( ' (( v2
1 1 v = v1 e1 + c2 e2
B = b1 = , b2 = .
1 −1

Problemanalyse und Strategie: Wir bestimmen die Bilder von e1 , e2 und b1 , b2 und stellen diese Bilder jeweils als
Linearkombinationen der Basen E2 und B dar.

Lösung: Damit hat ϕ bzgl. B die Darstellungsmatrix


Als lineare Fortsetzung von σ ist ϕ eine lineare Abbildung.
' (
Wegen 1 0
' ( ' ( A=
0 1 0 −1
ϕ(e1 ) = = e2 und ϕ(e2 ) = = e1
1 0
und es gilt:
erhalten wir als Darstellungsmatrix für ϕ
' ( '' (( ' ( ' (' (
0 1 v1 v1 1 0 v1
A= ϕ = = ,
1 0 v2 −v2 0 −1 v2

Es gilt: ' (
'' (( ' ( ' ( ' ( v1
v1 v 0 1 v1 für B v = .
ϕ = 2 = , v2
v2 v1 1 0 v2 Anstelle der speziellen Basis B hätten wir auch jede an-
d. h., ϕ(v) = A v. dere Basis wählen und eine entsprechende ϕ darstellende
Matrix angeben können. Tatsächlich liegt gerade hierin
Wir wählen nun eine andere Basis B: der Kern des Kapitels 14: Wie bestimmt man eine Ba-
 ' ( ' (
1 1 sis mit der Eigenschaft, dass die eine lineare Abbildung
B = b1 = , b2 = .
1 −1 darstellende Matrix bezüglich dieser Basis eine besonders
einfache Gestalt hat? Dabei ist die einfachste Gestalt eine
Da b1 kein Vielfaches von b2 ist, ist B in der Tat eine
Diagonalgestalt. In den praktischen Anwendungen der li-
Basis des R2 . Der Punkt b1 liegt auf der Geraden, an der
nearen Algebra wird dies meistens möglich sein. Die Vor-
gespiegelt wird, und die Strecke vom Ursprung zum Punkt
teile liegen auf der Hand: Mit Diagonalmatrizen ist das
b2 steht senkrecht auf der Geraden, an der wir spiegeln,
Rechnen wesentlich einfacher.
es ist nämlich das Skalarprodukt b1 · b2 gleich null.
Also erhalten wir: x2
ϕ(v)
ϕ(b1 ) = b1 und ϕ(b2 ) = −b2 .
ϕ(w)
x2
b1 x1
ϕ(b2 ) = −b2 w
1 b1 = ϕ(b1 )

b2 v

−1 1 x1

Man beachte, dass die Spiegelung ϕ bezüglich der Basis


−1 b2 B eine Diagonalmatrix als Darstellungsmatrix hat.
12.4 Darstellungsmatrizen 441

Insgesamt haben wir damit die folgende geordnete Basis B ψ ◦ ϕ mit ϕ, ψ lineare Abbildungen.
des R4 : λ ϕ mit λ ein Skalar, ϕ eine lineare Abbildung.
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞ ϕ + ψ mit ϕ, ψ lineare Abbildungen.
−5 3 12 10
⎜⎜−3⎟ ⎜2⎟ ⎜ 7 ⎟ ⎜ 6 ⎟⎟
B=⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝ 0 ⎠ , ⎝0⎠ , ⎝ 0 ⎠ , ⎝ 1 ⎠⎠ .
Wir behandeln zuerst die letzteren beiden Verknüpfungen.
Um das Produkt ψ ◦ ϕ durch die Darstellungsmatrizen von
0 0 1 0 ψ und ϕ auszudrücken, benötigen wir das Produkt von Ma-
trizen.
Weiter ergänzen wir die Basis des Bildes im R3 zu einer
geordneten Basis C des R3 : Wir betrachten zwei endlichdimensionale K-Vektorräume
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞ V und W mit den Basen B = (b1 , . . . , bn ) und C =
1 0 0
(c1 , . . . , cm ).
C = ⎝⎝ 0 ⎠ , ⎝1⎠ , ⎝0⎠⎠ .
−1 1 1 Ist ϕ eine lineare Abbildung von V in W , so gilt für jedes
λ ∈ K nach der Definition von Darstellungsmatrizen:
Nun gilt: ⎛ ⎞
1 0 0 0
C M(ϕA )B = ⎝0 1 0 0⎠  C M(λ ϕ)B = (C (λ ϕ(b1 )), . . . , C (λ ϕ(bn )))
0 0 0 0 = (λ C ϕ(b1 ), . . . , λ C ϕ(bn ))
= λ (C ϕ(b1 ), . . . , C ϕ(bn ))
Achtung: Man beachte, dass wir hier die bisherige Auf- = λ C M(ϕ)B .
gabenstellung umdrehen: Bisher waren Basen gegeben, und
wir haben die Darstellungsmatrix dazu bestimmt. Hier ha- Somit ist die Darstellungsmatrix von λ ϕ gleich dem λ-
ben wir die Basen so gewählt, dass die Darstellungsmatrix Fachen der Darstellungsmatrix von ϕ.
eine besondere Form hat. Im Kapitel 14 werden wir Endo-
morphismen ϕ eines endlichdimensionalen Vektorraums V Für die Summe ϕ + ψ zweier linearer Abbildungen
betrachten. Nach dem hier geschilderten Ergebnis können ϕ, ψ : V → W erhalten wir
wir auf jeden Fall Basen B und C finden bzgl. der die Dar-
stellungsmatrix von ϕ eine Diagonalgestalt wie im obigen + ψ)B
C M(ϕ
Satz hat. Dabei werden wir uns auch mit der Frage auseinan-
= (C (ϕ + ψ)(b1 ), . . . , C (ϕ + ψ)(bn ))
dersetzen, wann es eine Basis B (also der Fall B = C) gibt,
bezüglich der ϕ Diagonalgestalt hat. = (C (ϕ(b1 ) + ψ(b1 )), . . . , C (ϕ(bn ) + ψ(bn )))
= (C ϕ(b1 ), . . . , C ϕ(bn )) + (C ψ(b1 ), . . . , C ψ(bn ))
= C M(ϕ)B + C M(ψ)B .
Der Vektorraum der Homomorphismen ist
isomorph zum Vektorraum der Matrizen
Die Darstellungsmatrix von ϕ + ψ ist somit die Summe der
Sind V ein n-dimensionaler und W ein m-dimensionaler K- Darstellungsmatrizen von ϕ und ψ.
Vektorraum, so gilt nach dem Satz auf Seite 434:
Achtung: Man beachte, in welchen Vektorräumen die
V ∼
= Kn und W ∼
= Km . Multiplikation mit Skalaren und die Addition von Vektoren
stattfinden: λ ϕ ist die Multiplikation mit Skalaren im Vek-
Bis auf Isomorphie handelt es sich somit bei den Vektoren aus
torraum HomK (V , W ) und λ C M(ϕ)B ist die Multiplikation
V und W um Spaltenvektoren. Für eine lineare Abbildung ϕ
mit Skalaren im Vektorraum Km×n . Und ϕ + ψ ist die Addi-
von V in W gilt mit der Darstellungsmatrix A = C M(ϕ)B
tion von linearen Abbildungen im Vektorraum HomK (V , W )
nach dem Satz auf Seite 437:
und C M(ϕ)B + C M(ψ)B ist die Addition von Matrizen im
= C M(ϕ)B B v . Vektorraum Km×n .
C ϕ(v)

Die Bilder einer linearen Abbildung erhält man also bis auf Wir erklären in Abhängigkeit von den gewählten Basen B
Isomorphie durch Produktbildung einer Matrix mit einem und C eine Abbildung, nämlich
Spaltenvektor.

Nun stellt sich natürlich die Frage, ob die im Abschnitt 12.2 HomK (V , W ) → Km×n ,
C !B :
besprochenen Verknüpfungen von linearen Abbildungen sich ϕ → C M B (ϕ).
auch durch entsprechende Verknüpfungen der Matrizen be-
schreiben lassen. Unter gewissen Voraussetzungen kann man Gezeigt ist bereits, dass diese Abbildung C !B homogen und
ja lineare Abbildung miteinander oder mit Skalaren verknüp- additiv, d. h. linear ist. Wir zeigen noch, dass C !B bijektiv
fen, wir behandelten die drei Verknüpfungen: ist:
442 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Die Vektorräume HomK (V , W ) und Km×n sind iso- ben. Das Aussehen der Darstellungsmatrix hängt natürlich
morph von der Wahl der Basis ab, und es stellt sich die Frage, was
der Zusammenhang zwischen den Darstellungsmatrizen ein
Es seien V ein n-dimensionaler und W ein m-dimen-
und derselben linearen Abbildung bezüglich verschiedener
sionaler K-Vektorraum mit den Basen B und C. Die
Basen ist. Aber bevor wir auf diesen Zusammenhang zu spre-
Abbildung
chen kommen, diskutieren wir die Injektivität, Surjektivität,
 Bijektivität und Invertierbarkeit von linearen Abbildungen
HomK (V , W ) → Km×n ,
C !B : im Zusammenhang mit ihren Darstellungsmatrizen – letzt-
ϕ  → C M(ϕ)B
lich sind lineare Abbildungen ja nichts anderes als Matrizen,
ist ein Isomorphismus, insbesondere gilt HomK (V,W ) diese Eigenschaften von Abbildungen müssen damit als Ei-

= Km×n . genschaften der Darstellungsmatrizen erkennbar sein.
Weil die Bijektivität einer Abbildung ϕ zur Umkehrbarkeit
der linearen Abbildung ϕ äquivalent ist, d. h., es existiert eine
Beweis: Es ist nur noch die Bijektivität von C !B nachzu- Abbildung ϕ −1 mit
weisen:
ϕ −1 ◦ ϕ = id = ϕ ◦ ϕ −1 ,
Zur Injektivität: Für ein ϕ ∈ HomK (V , W ) gelte C !B (ϕ) = 0.
Wegen
müssen wir uns zunächst überlegen, was die Darstellungs-
matrix der Komposition von Abbildungen ist.
C !B (ϕ) = (C ϕ(b1 ), . . . , C ϕ(bn )) = (0, . . . , 0)

gilt ϕ(b1 ) = · · · = ϕ(bn ) = 0 und somit ϕ = 0. Nach dem


Injektivitätskriterium von Seite 427 ist die Abbildung C !B 12.5 Das Produkt von Matrizen
injektiv.
Zur Surjektivität: Es sei A ∈ Km×n eine (beliebige) Matrix Neben der Addition von linearen Abbildungen und der Mul-
mit den Spalten tiplikation von linearen Abbildungen mit Skalaren haben wir
auch das Produkt ◦ von linearen Abbildungen betrachtet:
⎛ ⎞ ⎛ ⎞
a11 a1n
⎜ ⎟ ⎜ ⎟ ϕ: V → W , ψ: W → U ⇒ ψ ◦ ϕ: V → U .
s 1 = ⎝ ... ⎠ , . . . , s n = ⎝ ... ⎠ .
am1 amn Wie sieht die Darstellungsmatrix von ψ ◦ ϕ aus? Ein na-
heliegender Wunsch ist, dass diese Darstellungsmatrix das
Die Abbildung Produkt der beiden Darstellungsmatrizen von ϕ und ψ ist.
 Wir erklären nun das Produkt von Matrizen einfach so, dass
B → W,
σ: dieser Wunsch erfüllt ist.
bi → ai1 c1 + · · · + aim cm
Mit dieser Multiplikation · von Matrizen wird die abelsche
ist nach dem Prinzip der linearen Fortsetzung auf Seite 420 Gruppe (Kn×n , +) der quadratischen Matrizen zu einem
zu einer linearen Abbildung ϕ von V in W fortsetzbar. Wir Ring (Kn×n , +, ·). Wir entscheiden, welche Matrizen in die-
bestimmen die Darstellungsmatrix von ϕ. Es gilt: sem Ring invertierbar sind, geben verschiedene Kriterien an
⎛ ⎞ ⎛ ⎞ und besprechen Verfahren, wie man gegebenenfalls das In-
a11 a1n verse einer quadratischen Matrix bestimmen kann.
⎜ . ⎟ ⎜ . ⎟
C ϕ(b1 ) = ⎝ .. ⎠ , . . . , C ϕ(bn ) = ⎝ .. ⎠ .
Natürlich wird das Inverse der Darstellungsmatrix einer li-
am1 amn nearen Abbildung dann die Darstellungsmatrix der inversen
Abbildung sein.
Damit gilt C !B = C M(ϕ)B = A. Folglich ist C !B auch
surjektiv. 

Beim Produkt von Matrizen werden Zeilen mit


? Spalten multipliziert
Welche Dimension hat der K-Vektorraum HomK (V , W ) un-
ter den Voraussetzungen an V und W des obigen Satzes ? Wir betrachten vorab der Einfachheit halber die K-Vektor-
räume Kn , Km und Kr mit den jeweiligen kanonischen Basen
En , Em und Er . Sind ϕ : Kn → Km und ψ : Km → Kr li-
Damit haben wir eine konkrete Beschreibung der linearen neare Abbildungen mit den Darstellungsmatrizen B ∈ Km×n
Abbildungen durch Matrizen erreicht. Wir können jede li- und A ∈ Kr×m bezüglich der kanonischen Basen,
neare Abbildungen zwischen endlichdimensionalen K-Vek-
torräumen nach Wahl von Basen durch eine Matrix beschrei- ϕ(v) = B v und ψ(w) = A w , v ∈ V , w ∈ W ,
12.5 Das Produkt von Matrizen 443

so sollte A B die Darstellungsmatrix von ψ ◦ ϕ : V → U be- den k-ten Spaltenvektor von B bezeichnen:
züglich der kanonischen Basen En und Er sein, insbesondere
⎛ ⎞
sollte also A B eine r × n-Matrix sein mit z1
⎛ ⎞
⎜ .. ⎟ ..
⎜ . ⎟ · · · . · · ·
(A B) v = (ψ ◦ ϕ)(v) = ψ(ϕ(v)) = A (Bv) , v ∈ V . ⎜ ⎟ ⎜ ⎟
⎜ zi ⎟ (s 1 , . . . , s k , . . . , s r ) = ⎜· · · zi · s k · · ·⎟ .
⎜ ⎟ ⎝ ⎠
⎜ . ⎟ ..
Nun erklären wir das Produkt A B von A mit B so, dass ⎝ .. ⎠ ··· . ···
diese Gleichheit erfüllt ist. Damit wird eine Multiplikation zm 
der Matrizen A und B definiert.  C
AB
Setzen wir in die obige gewünschte Gleichheit nacheinander
Um die Matrix C zu bilden, ist also jede Zeile von A mit
die Basisvektoren e1 , . . . , en der kanonischen Basis ein, so
jeder Spalte von B zu multiplizieren. Das sind m r Multipli-
erhalten wir, wenn wir beachten, dass B ei gleich der i-ten
kationen, wobei jede solche Multiplikation von Vektoren aus
Spalte s i der Matrix B = (s 1 , . . . , s n ) ist:
einer Summe von n Produkten besteht.
(A B) e1 = A (Be1 ) = A s 1 ,
(A B) e2 = A (Be2 ) = A s 2 , Zeilen- und Spaltenzahl des Produkts

.. .. Eine m × n-Matrix mal einer n × r-Matrix ergibt eine


. . m × r-Matrix:
(A B) en = A (Ben ) = A s n .
[m × n] · [n × r] = [m × r] .
Da (A B) ei die i-te Spalte von A B ist, haben wir so-
mit die Matrix A B ermittelt. Die n Spalten von A B = Die folgende Illustration verdeutlicht dies:
(t 1 , . . . , t n ) ∈ Kr×n sind durch die folgenden Spaltenvek-
toren gegeben: r
n r
m · n = m
t 1 = A s1, . . . , t n = A sn .

A · B = C
Damit haben wir die folgende Multiplikation von Matrizen
motiviert.
Achtung: Das Matrixprodukt ist nur für Matrizen A und
B mit der Eigenschaft
Das Matrixprodukt
Spaltenzahl von A = Zeilenzahl von B
Es seien A ∈ Km×n und B = (s 1 , . . . , s r ) ∈ Kn×r .
Dann ist definiert.

A B = (A s 1 , . . . , A s r ) ∈ Km×r ?
Für Matrizen A und B existiere sowohl das Produkt A B als
das Matrixprodukt oder auch nur kurz Produkt von A auch das Produkt B A. Müssen die Matrizen A und B dann
und B. quadratisch sein?
Man beachte: Die Spaltenzahl von A ist gleich der Zei-
lenzahl von B.
Beispiel Die folgenden Matrizen sollen alle reell sein.
Beim ersten Produkt benutzen wir Farbe, um das Prinzip
Wir haben das Produkt von Matrizen auf das r-fache Produkt Zeile mal Spalte deutlich zu machen:
einer Matrix mit einer Spalte zurückgeführt.
⎛ ⎞ Ausformuliert ⎛ ⎞ ⎛ ⎞
z1 2 6 1 ⎛ ⎞ 23 17
⎜ .. ⎟ ⎜6 ⎟ 2 4 ⎜24
lautet die Produktbildung von A = ⎝ . ⎠ ∈ Km×n mit ⎜ 4 0⎟ ⎝ 28⎟
⎝0 · 3 1⎠ = ⎜ ⎟
zm 3 3⎠ ⎝12 12⎠
1 3
B = (s 1 , . . . , s r ) ∈ K :
n×r 4 1 2 13 23

!
n Beispielsweise bestimmen die blau eingezeichneten Zif-
A B = (cik )m,p mit cik = zi · s k = aij bj k . fern der zweiten Zeile in der ersten Matrix und zweiten
j =1 Spalte der zweiten Matrix den Eintrag in der zweiten Zeile
und zweiten Spalte des Produkts:
An der Stelle (i, k) des Produkts C = A B steht also die
Zahl zi · s k , wobei zi den i-ten Zeilenvektor von A und s k 6 · 4 + 4 · 1 + 0 · 3 = 28 .
444 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Die Faktoren des folgenden Produkts kann man nicht ver- Wir bestimmen eine Matrix A ∈ R2×2 , sodass sich die
tauschen: Rekursion in der Form
⎛ ⎞ ' ( ' (
' ( 1 2 3 1 ' ( an an−1
2 3 1 ⎝
1 0 0 1⎠ =
7 9 6 9 =A
3 5 0 8 6 9 8 an+1 an
2 5 0 4
schreiben lässt.
Eine Spalte mal eine Zeile ergibt eine Matrix: Wegen an = 0 an−1 + 1 an und an+1 = −4 an−1 + 4 an
⎛ ⎞ ⎛ ⎞
−1 −2 −3 −1 leistet ' (
⎝ 1 ⎠ (2, 3, 1) = ⎝ 2 3 1 ⎠ 0 1
A= ∈ R2×2
−4 4
2 4 6 2
das Gewünschte.
Beliebige Matrizen kann man nicht miteinander multipli-
Und nun gilt:
zieren:
' (' ( ' ( ' ( ' ( ' (
2 3 1 1 2 3 1 an an−1 an−2 a0
ist nicht definiert. =A = A2 = · · · = An .
3 5 0 1 0 0 1 an+1 an an−1 a1
' (
b11 b12
Eine Diagonalmatrix vervielfacht die Zeilen, wenn sie Ist also An = , so können wir an+1 aus den Start-
b21 b22
links im Produkt steht:
werten berechnen:
⎛ ⎞⎛ ⎞ ⎛ ⎞
a 0 0 1 2 3 1a 2a 3a
⎝0 b 0⎠ ⎝4 5 6⎠ = ⎝4 b 5 b 6 b ⎠ an+1 = b21 a0 + b22 a1
0 0 c 7 8 9 7c 8c 9c
Durch diese Beschreibung gelingt es uns mit noch zu ent-
wickelnden Methoden, an auch explizit für große n anzu-
Eine Diagonalmatrix vervielfacht die Spalten, wenn sie
geben. Es ist z. B. bereits a20 = 20 · 219 . Es wäre müh-
rechts im Produkt steht:
⎛ ⎞⎛ ⎞ ⎛ ⎞ sam, diesen Wert für a20 mit der Folgenvorschrift zu be-
1 2 3 a 0 0 1a 2b 3c stimmen. 
⎝4 5 6⎠ ⎝0 b 0⎠ = ⎝4 a 5 b 6 c⎠
7 8 9 0 0 c 7a 8b 9c
Zum Produkt von linearen Abbildungen
Potenzieren von Diagonalmatrizen führt zum Potenzieren gehört das Produkt der Darstellungsmatrizen
der Diagonalelemente:
⎛ ⎞⎛ ⎞⎛ ⎞ ⎛ ⎞ Wir können nun auch die folgende Multiplikativität nachwei-
a 0 0 a 0 0 a 0 0 a3 0 0
⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟ sen:
⎜0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜
b 0⎠ ⎝0 b 0⎠ ⎝0 b 0⎠=⎝ 0 b3 0 ⎟ 
⎝ ⎠
0 0 c 0 0 c 0 0 c 0 0 c3
Die Darstellungsmatrix eines Produkts linearer Ab-
bildungen
Ausgehend vom letzten Beispiel definieren wir allgemeiner
für eine quadratische Matrix A ∈ Kn×n : Für jede natürliche Für K-Vektorräume V , W und U mit den geordneten
Zahl k bezeichne Basen B, C und D und lineare Abbildungen ϕ : V → W
Ak = A und ψ : W → U gilt:
·
· · A
k-mal
D M(ψ ◦ ϕ)B = D M(ψ)C C M(ϕ)B .
die k-te Potenz von A. Weiter setzen wir

A0 = En .
Beweis: Es seien

? B = (b1 , . . . , bn ) eine Basis von V , dim V = n,


Wieso muss die Matrix A quadratisch sein?
C = (c1 , . . . , cm ) eine Basis von W , dim W = m und
D = (d 1 , . . . , d r ) eine Basis von U , dim U = r.
Beispiel Mit Matrizen lassen sich rekursiv definierte Fol- Wir zeigen, dass die beiden r × n-Matrizen D M(ψ ◦ ϕ)B
gen beschreiben. und D M(ψ)C C M(ϕ)B die gleichen Spalten haben, d. h.,
Gegeben ist die reelle Folge (an )n∈N0 mit dass für jedes i = 1, . . . , n gilt:

a0 = 0, a1 = 1, an+1 = −4 an−1 + 4 an für n ∈ N . D (ψ ◦ ϕ)(bi ) = D M(ψ)C C ϕ(bi ) .


12.5 Das Produkt von Matrizen 445

Dazu formen wir beide Seiten zu gleichen Ausdrücken um. Beweis: (i) Es seien A ∈ Km×n , B ∈ Kn×r und
Für ein i ∈ {1, . . . , n} gelte: C∈K r×p . In den K-Vektorräumen Kn , Km , Kr , Kp wäh-
⎛ ⎞ len wir die Basen N, M, R, P . Nach dem Isomorphiesatz
b1
⎜ .. ⎟ auf Seite 442 sind
ϕ(bi ) = b1 c1 + · · · + bm cm , d. h., C ϕ(bi ) = ⎝ . ⎠ . ρ = (M !N )−1 (A) , ψ = (N !R )−1 (B) , ϕ = (R !P )−1 (C)
bm lineare Abbildungen,
Damit erhalten wir zum einen ρ : Kn → Km , ψ : Kr → Kn , ϕ : Kp → Kr .
◦ ϕ)(bi ) = D (ψ(ϕ(bi ))) = D (ψ(b1 c1 + · · · + bm cm )) Nun gilt aufgrund des obigen Satzes und der Assoziativität
D (ψ
der Hintereinanderausführung von Abbildungen:
und zum anderen  
(AB)C = M M(ρ)N N M(ψ)R R M(ϕ)P
⎛ ⎞  
b1 = M M(ρ ◦ ψ)R · R M(ϕ)P = M M (ρ ◦ ψ) ◦ ϕ P
⎜ . ⎟  
D M(ψ)C C ϕ(bi ) = (D ψ(c1 ), . . . , D ψ(cm )) ⎝ .. ⎠ = M M ρ ◦ (ψ ◦ ϕ) P = M M(ρ)N N M(ψ ◦ ϕ)P
 
bm = M M(ρ)N N M(ψ)R R M(ϕ)P = A(BC).
= b1D ψ(c1 ) + · · · + bmD ψ(cm ) (ii) Das beweist man analog. 

= D (ψ(b1 c1 + · · · + bm cm )) .
Beispiel Durch Ausnutzen der Assoziativität (A B) C =
Damit ist die Gleichheit der beiden Matrizen gezeigt. 
A (B C) kann man sich reichlich Rechenarbeit ersparen.
Wir berechnen das folgende Matrixprodukt auf 2 Arten:
⎛ ⎞
⎛ ⎞ 2
Viele Rechenregeln für Matrizen sind analog 3 ⎜0⎟
zu den Rechenregeln für z. B. ganze Zahlen, es ⎝−2⎠ (1, −1, −2, 1) ⎜ ⎟ .
⎝2⎠
gibt aber auch Ausnahmen 2
3

Wir begründen nun, dass bezüglich der von uns erklärten Mit der Klammerung (A B) C ergibt sich:
Matrizenmultiplikation und der Addition von Matrizen die ⎛ ⎞
⎛ ⎞ 2 ⎛ ⎞ ⎛ ⎞
Menge aller quadratischen Matrizen einen Ring bildet (siehe 3 −3 −6 3 ⎜ ⎟ 6 + 0 − 12 + 9 3
⎜ ⎟ ⎜0⎟ ⎜ ⎟ ⎜ ⎟
⎜−2 2 4 −2⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
Seite 85). Dazu ist nachzuweisen, dass das Assoziativgesetz ⎝ ⎠ ⎜2⎟=⎝−4 + 0 + 8 − 6⎠=⎝−2⎠ .
⎝ ⎠
für die Multiplikation und die Distributivgesetze gelten. Ein 2 −2 −4 2 4+0−8+6 2
3
direkter Nachweis dieser Gesetze ist möglich aber deutlich
aufwendiger als die Methode, die wir nun verwenden werden. Mit der Klammerung A (B C) ergibt sich dasselbe, aber die
Wir benutzen die Tatsache, dass EndK (V ) mit der punkt- Rechnung ist kürzer (4 + 3 = 7 gegenüber 12 + 12 = 24
weisen Addition und der Hintereinanderausführung einen Multiplikationen):
⎛ ⎞ ⎛ ⎞
Ring bildet. Dabei entspricht diese Addition der Addition 3 3
von Matrizen und die Hintereinanderausführung der Mul- ⎝−2⎠ (2 − 0 − 4 + 3) = ⎝−2⎠ . 
tiplikation von Matrizen. So übertragt sich die Ringstruktur 2 2
mit einer bijektiven, additiven und multiplikativen Abbildung
von EndK (Kn ) auf Kn×n . Wir betrachten nun den Fall V = W = U , B = C = D
In den Anwendungen braucht man das Assoziativgesetz aber und beachten, dass HomK (V , V ) = EndK (V ) mit der Hin-
nicht nur für quadratische Matrizen. Daher beweisen wir all- tereinanderausführung ◦ von Abbildungen sogar einen Ring
gemeiner die folgenden Rechenregeln für die Matrizenmul- bildet (siehe Seite 424). Wir erhalten für den additiven Iso-
tiplikation. morphismus B !B von Seite 442 aus obigem Ergebnis:

Rechenregeln für die Matrixmultiplikation Der Endomorphismenring ist zum Matrizenring iso-
morph
(i) Wenn für Matrizen A, B, C die Produkte A B
und B C erklärt sind, existieren auch (A B) C und Die Menge Kn×n aller n × n-Matrizen bildet mit der
A (B C), und es gilt: Addition + und Multiplikation · von Matrizen einen
Ring mit Einselement En , und für jeden n-dimensionalen
(A B) C = A (B C) . K-Vektorraum V gilt:

EndK (V ) ∼
= Kn×n .
(ii) Für quadratische Matrizen A, B, C ∈ Kn×n gelten
Im Fall n > 2 ist Kn×n nicht kommutativ und besitzt
A (B + C) = A B + A C,
Nullteiler, d. h., es gibt Elemente A = 0 = B mit
(A + B) C = A C + B C . A B = 0.
446 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Beweis: Nach den obigen Rechenregeln für die Matrizen- Lemma


multiplikation gelten das Assoziativgesetz und die Distribu- Es ist 
tivgesetze in (Kn×n , +, ·). Folglich ist (Kn×n , +, ·) ein Ring. K → Kn×n ,
ι:
Wegen λ → diag(λ, . . . , λ)
En A = A = A En ein Ringmonomorphismus.
für jedes A ∈ Kn×n ist En ein Einselement in (Kn×n , +, ·). Beweis: Für beliebige λ, μ ∈ K gilt:
Für jede Basis B von V ist die additive und bijektive Abbil-
ι(λ + μ) = diag(λ + μ, . . . , λ + μ)
dung aus dem Satz von Seite 442:
= diag(λ, . . . , λ) + diag(μ, . . . , μ)

EndK (V ) → Kn×n , = ι(λ) + ι(μ)
B !B :
ϕ → B M(ϕ)B
und analog:
nach dem Satz zur Darstellungsmatrix eines Produkts von
linearen Abbildungen auf Seite 444 auch multiplikativ, d. h., ι(λ μ) = ι(λ) ι(μ) ,
B !B (ψ ◦ ϕ) = B !B (ψ) B !B (ϕ). Somit ist B !B ein Iso- sodass ι ein Ringhomomorphismus ist. Aus ι(λ) = ι(μ) folgt
morphismus. sogleich λ = μ, d. h., ι ist auch injektiv und somit ein Ring-
Die Multiplikation von'Matrizen ist nicht kommutativ: Mit monomorphismus. 
' ( (
1 0 0 0
A= und B = gilt: Es gilt also insbesondere die Isomorphie
0 0 1 0
' (' ( ' ( K∼
= ι(K) ⊆ Kn×n .
1 0 0 0 0 0
AB = =
0 0 1 0 0 0 Wie so oft unterscheidet man zueinander isomorphe Struk-
turen nicht und fasst somit K als einen Teilring von Kn×n
aber ' (' ( ' ( auf.
0 0 1 0 0 0
BA= = .
1 0 0 0 1 0
Im Fall n ≥ 3 füge man diesen hier gegebenen Matrizen A
und B entsprechend viele Nullspalten und Nullzeilen an.
12.6 Das Invertieren von
' ( Matrizen
1 0
Es gibt Nullteiler: Wir können wieder A = und
0 0
' (
0 0 Wie wir gesehen haben, lässt sich ein reelles lineares Glei-
B= wählen und erhalten A B = 0. 
chungssystem mit n Gleichungen in n Unbestimmten kurz in
1 0
der Form
Ax = b
?
Gilt in Kn×n die Kürzregel mit einer Matrix A ∈ Rn×n und b ∈ Rn sowie der Unbe-
stimmten x schreiben. Die entsprechende Gleichung im Fall
A C = B C , C = 0 ⇒ A = B ? n = 1 lautet
ax = b
mit reellen Zahlen a und b. Die Lösung dieser letzten Glei-
Etwas vereinfacht ausgedrückt bedeutet obiger Satz: In end- chung ist bekannt: Ist a = 0, so ist a −1 b die eindeutig be-
lichdimensionalen Vektorräumen können wir die linearen stimmte Lösung. Und ist a = 0, so ist diese Gleichung nur für
Abbildungen als Matrizen auffassen. Wir zeigen gleich, dass b = 0 lösbar; die Lösungsmenge ist in diesem Fall ganz R.
den invertierbaren Endomorphismen die invertierbaren Ma-
Tatsächlich liegt für das System A x = b mit einer qua-
trizen entsprechen. Vorab halten wir aber noch ein Ergebnis
dratischen Matrix A eine ähnliche Situation vor: Ist die
fest, das wir später benötigen werden.
Matrix A invertierbar, d. h., existiert eine Matrix A−1 mit
Wir können die Menge aller Diagonalmatrizen A−1 A = E n , so folgt durch Multiplikation der Gleichung
⎛ ⎞ A x = b von links mit A−1 :
λ
⎜ .. ⎟ x = A−1 b ,
diag(λ, . . . , λ) = ⎝ . ⎠ , λ ∈ K,
λ also die eindeutig bestimmte Lösung des Systems A x = b.
Ist die Matrix A nicht invertierbar, so ist dieses System nur
für jedes n ∈ N als einen kommutativen Teilkörper des für dann lösbar, wenn rg A = rg(A | b) gilt, die Lösungsmenge
n ≥ 2 nicht kommutativen Rings Kn×n auffassen: ist in diesem Fall unendlich groß (siehe Seite 180).
12.6 Das Invertieren von Matrizen 447

Die zu A inverse Matrix A−1 ist eindeutig Beweis: Ist A ∈ Kn×n invertierbar mit dem Inversen A−1 ,
durch A A−1 = En = A−1 A bestimmt so gilt
ϕA−1 ◦ ϕA = ϕA−1 A = ϕEn = idKn
In K gibt es zu jedem Element a ∈ K \ {0} genau ein Ele- und analog:
ment a  ∈ K mit a a  = 1 = a  a, wobei das Einselement ϕA ◦ ϕA−1 = idKn ,
in K durch die Eigenschaft 1 a = a = a 1 ausgezeichnet
ist. Es gibt auch ein solches Einselement in Kn×n , nämlich sodass
−1
die Einheitsmatrix En , sie erfüllt für jedes A ∈ Kn×n die ϕA = ϕA−1 .
Gleichung Ist nun umgekehrt ϕA invertierbar, so gilt nach dem Darstel-
En A = A = A En . lungssatz linearer Abbildungen auf Seite 435 für die Um-
kehrabbildung ψ von ϕA :
Aber im Gegensatz zum Körper K, existiert zu einer Matrix
A ∈ Kn×n \ {0} im Allgemeinen kein Inverses A , d. h. eine ψ = ϕB mit einem B ∈ Kn×n .
Matrix A mit A A = En = A A.
' ( Nun folgt aus
1 0
Die reelle Matrix A = ist so ein Beispiel. Ist A =
0 0
 ) ∈ R2×2 , so gilt: ϕA B = ϕA ◦ ϕB = idKn = ϕB ◦ ϕA = ϕB A
(aij
' ('  a
( '  a
( sogleich
A A =
1 0 a11 12 =
a11 12  = E2 . A B = En = B A ,
0 0  a
a21 0 0
22
sodass also B = A−1 gilt. 

Die Nullzeile in A erzeugt im Produkt A A stets eine Null-


zeile – und zwar in derselben Zeile. Kommentar: Eigentlich haben wir für das Inverse A−1
Wir untersuchen in diesem Abschnitt, welche Matrizen in- einer Matrix A ∈ Kn×n zu viel gefordert. Wir verlangen,
vertierbar sind, führen aber erst die entsprechenden Begriffe dass die beiden Gleichungen
ein.
A A = En = A A
Man nennt eine quadratische Matrix A ∈ Kn×n invertierbar
oder regulär, wenn es eine Matrix A ∈ Kn×n mit der Eigen- erfüllt sind. Tatsächlich folgt aber aus der Gleichung
schaft A A = En mit einem A die Gleichung A A = En für dieses
A A = En = A A gleiche A . In der Aufgabe 12.20 sollen Sie das beweisen.

gibt. Die Matrix A wird durch diese Eigenschaft eindeutig


bestimmt, ist nämlich A eine zweite solche Matrix, so gilt Beispiel Wir zeigen an Beispielen, dass nicht jede Matrix
nach dem Assoziativgesetz: invertierbar ist und geben Inverse einiger invertierbarer Ma-
trizen an:
A = A En = A (A A ) = (A A) A = En A = A . Die folgende reelle Matrix A ist nicht invertierbar:
' (
Man nennt diese Matrix A die zu A inverse Matrix und 4 −3
schreibt A−1 anstelle von A : A=
0 0

A A−1 = En = A−1 A . Die zweite Zeile von A, also die Nullzeile, erzwingt eine
Nullzeile in jedem Produkt A A , insbesondere kann für
Eine Matrix, die nicht invertierbar ist, nennt man auch sin- keine Matrix A die Gleichung A A = E2 erfüllt sein.
gulär. Allgemeiner ist jede Matrix, die eine Nullzeile enthält,
nicht invertierbar.
Wir stellen gleich einen Zusammenhang zwischen einer in-
Es ist E2 ∈ K2×2 zu sich selbst invers, da
vertierbaren Matrix A und der Invertierbarkeit des Endomor-
phismus ϕA dar, dazu beachte man den Invertierbarkeitsbe- ' (' ( ' (
1 0 1 0 1 0
griff einer Abbildung auf Seite 48. E2 E2 = = = E2 .
0 1 0 1 0 1

Lemma Auch −E2 ∈ K2×2 ist zu sich selbst invers, da


Eine Matrix A ∈ Kn×n ist genau dann invertierbar, ' (' (
wenn der Endomorphismus ϕA : Kn → Kn invertierbar ist. −1 0 −1 0
(−E2 ) (−E2 ) =
In diesem Fall gilt: 0 −1 0 −1
' (
1 0
−1
ϕA = ϕA−1 . = = E2 .
0 1
448 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

' ( ' (
2 1 1 −1 Beweis: (i) Wegen En = A A−1 = A−1 A ist A das
Zu A = ∈ R2×2 ist das Inverse, da
1 1 −1 2 Inverse zu A−1 , d. h., (A−1 )−1 = A.
' (' ( ' (
2 1 1 −1 1 0 (ii) Wir weisen nach, dass (B −1 A−1 ) das Inverse zu A B
= = E2 .
1 1 −1 2 0 1 ist, es gilt dann (A B)−1 = B −1 A−1 .
⎛ ⎞ ⎛ ⎞
i 1 0 −i i 1 Wegen der Assoziativität der Matrizenmultiplikation gilt fol-
Zu A = ⎝0 1 i ⎠ ∈ C3×3 ist ⎝ 0 1 −i⎠ das Inverse, gende Gleichung:
0 0 1 0 0 1
da (A B) (B −1 A−1 ) = A (B B −1 ) A−1
⎛ ⎞⎛ ⎞ ⎛ ⎞
i 1 0 −i i 1 1 0 0 = A En A−1 = A A−1 = En .
⎝0 1 i ⎠ ⎝ 0 1 −i⎠ = ⎝0 1 0⎠ = E3 .
0 0 1 0 0 1 0 0 1
' ( (iii) Das gilt wegen En En = En . 

1 1
Die Matrix A = ∈ K2×2 ist nicht invertierbar, da
1 1
die Gleichung ?
' (' ( ' ( Sind A und B invertierbare n × n-Matrizen, so ist ϕA ◦ ϕB
1 1 a b 1 0
= = E2 eine invertierbare Abbildung. Was ist die Umkehrabbildung
1 1 c d 0 1
von ϕA ◦ ϕB ?
zu dem nicht lösbaren Gleichungssystem

a+c =1 b+d =0
Da die Multiplikation von quadratischen Matrizen assoziativ
a+c =0 b+d =1 ist, ist auch die Multiplikation von invertierbaren Matrizen
führt. Allgemeiner sind Matrizen mit zwei gleichen Zeilen assoziativ. Somit gilt:
niemals invertierbar.
Wir betrachten für ein α ∈ [0, 2 π[ die Matrix Folgerung
' ( Die Menge
cos α − sin α
A= ∈ R2×2 .
sin α cos α
GLn (K) = {A ∈ Kn×n | A ist invertierbar}
' (
cos(−α) − sin(−α)
Dann ist das Inverse von A (man
sin(−α) cos(−α) der invertierbaren n × n-Matrizen über dem Körper K ist mit
beachte cos(−α) = cos α und sin(−α) = − sin α), da der Multiplikation von Matrizen eine Gruppe.
' (' (
cos α − sin α cos(−α) − sin(−α)
sin α cos α sin(−α) cos(−α) Achtung: Im Allgemeinen gilt:
' (
1 0
= = E2 .  (A B)−1 = A−1 B −1 .
0 1

Bevor wir zeigen, wie man das Inverse einer invertierbaren Als Beispiel betrachten wir
Matrix bestimmt, geben wir noch wichtige Eigenschaften in- '( ' (
vertierbarer Matrizen an. 2 1 1 1
A= , B= .
1 1 0 1
Eigenschaften invertierbarer Matrizen
Dann gilt:
(i) Wenn A ∈ Kn×n invertierbar ist, so auch A−1 , und
es gilt: ' ( ' (
(A−1 )−1 = A . 1 −1 1 −1
A−1 = , B −1 = .
−1 2 0 1
(ii) Wenn A und B aus Kn×n invertierbar sind, so ist
auch A B invertierbar, und es gilt: Nun rechnen wir nach:
' ( ' (
(A B)−1 = B −1 A−1 2 3 2 −3
AB = , (A B)−1 = B −1 A−1 =
1 2 −1 2
– man beachte die Reihenfolge!
(iii) Es ist En ∈ Kn×n invertierbar, und es gilt: und
' (
En−1 = En . 1 −2
A−1 B −1 = = (A B)−1 .
−1 3
12.6 Das Invertieren von Matrizen 449

Das Inverse einer n × n-Matrix bestimmt man Folgerung


durch Lösen von n linearen Gleichungs- Es seien V und W endlichdimensionale Vektorräume
systemen mit dim V = dim W . Eine lineare Abbildung ϕ : V → W
ist genau dann bijektiv, wenn eine Darstellungsmatrix von ϕ
invertierbar ist.
Bei den bisherigen Beispielen invertierbarer Matrizen hatten
wir das Inverse der jeweiligen Matrix gegeben. Nun beschrei-
ben wir ein Verfahren, wie man das Inverse einer invertierba- Beweis: Ist ϕ bijektiv, so gilt ker ϕ = {0}. Nach dem Satz
ren Matrix bestimmen kann. Es gibt verschiedene Methoden. vom Kern und Bild einer linearen Abbildung auf Seite 438
Die wohl einfachste entspringt dem Algorithmus von Gauß hat jede Darstellungsmatrix von ϕ den Rang n = dim V und
und Jordan zur Lösung von Gleichungssystemen. ist somit invertierbar.

Ist Ist eine Darstellungsmatrix A von ϕ invertierbar, so ist ihr


⎛ ⎞
a11 · · · a1n Rang gleich n = dim V . Wir wenden erneut den Satz von
⎜ .. .. ⎟ ∈ Kn×n Seite 438 an und erhalten ker ϕ = {0}, d. h., ϕ ist injek-
A=⎝ . . ⎠
tiv (siehe das Kriterium auf Seite 427). Da im vorliegenden
an1 · · · ann
Fall Bijektivität und Injektivität gleichwertig sind (beachte
eine invertierbare Matrix mit dem Inversen das Kriterium auf Seite 430), folgt hieraus die Bijektivität
⎛ ⎞ von ϕ. 
b11 · · · b1n
⎜ .. ⎟ = (s , . . . . s ) ∈ Kn×n ,
A−1 = ⎝ ... . ⎠ 1 n Zum Invertieren einer Matrix A ∈ Kn×n können wir die n
bn1 · · · bnn Gleichungssysteme A x = ek für k = 1, . . . , n simultan
lösen, d. h., wir machen den Ansatz (A | En ), ausführlich
so gilt die Gleichung ⎛ ⎞
a11 · · · a1n 1 ··· 0
⎛ ⎞ ⎜ .. .. .. . . .. ⎟
1 ··· 0 ⎝ . . . . .⎠
⎜ ⎟
A (s 1 , . . . , s n ) = ⎝ ... . . . ... ⎠ = En ∈ Kn×n . an1 · · · ann 0 ··· 1
0 ··· 1
und lösen diese n Gleichungssysteme mit dem bekannten
Diese Gleichung zerfällt in die n Gleichungen Verfahren von Gauß und Jordan.
⎛ ⎞ Dabei bringen wir aber die Matrix A links der Hilfslinie nicht
0
⎜ .. ⎟ nur auf Zeilenstufenform, sondern gehen mit den elementa-
⎜.⎟
⎜ ⎟ ren Zeilenumformungen so weit, bis wir die Einheitsmatrix
A sk = ⎜ ⎟
⎜1⎟ = e k mit k = 1, . . . , n . links der Hilfslinie erhalten, d. h., bis wir die Form
⎜.⎟
⎝ .. ⎠ ⎛ ⎞
0 1 ··· 0 b11 · · · b1n
⎜ .. .. .. .. .. ⎟
⎝. . . . . ⎠
Die k-te Spalte von A−1 ist also Lösung des linearen Glei- 0 ··· 1 bn1 · · · bnn
chungssystems
A x = ek . erhalten. Dass dies möglich ist, besagt gerade das eben be-
Die Lösung s k ist eindeutig bestimmt, weil das Inverse einer gründete Kriterium für Invertierbarkeit.
Matrix eindeutig bestimmt ist. Dies gilt für alle n Gleichun- Ist dies getan, so steht rechts der Hilfslinie das Inverse
gen. Nach dem Satz auf Seite 184 hat A den Rang n. A−1 = (bij ) ∈ Kn×n von A, da für jedes k = 1, . . . , n
Ist eine Matrix A ∈ Kn×n invertierbar, so hat diese Matrix die k-te Spalte s k der so nach allen Umformungen rechts ent-
also den Rang n. Hat eine Matrix A andererseits den Rang n, standenen Matrix der entsprechende Lösungsvektor der k-ten
so sind die n Gleichungssysteme A x = ek für k = 1, . . . , n Gleichung A x = ek ist.
eindeutig lösbar, d. h., es existiert das Inverse A−1 zu A. Bevor wir zu den Beispielen kommen, beantworten wir noch
die Frage, wie man entscheiden kann, ob eine Matrix über-
Kriterium für Invertierbarkeit haupt invertierbar ist.
Eine Matrix A ∈ Kn×n ist genau dann invertierbar, wenn Und in der Tat liefert das beschriebenen Verfahren hier zu-
der Rang von A gleich n ist. gleich diese Antwort: Sieht man es der Matrix nicht an, ob
sie invertierbar ist, so beginnt man einfach mit dem Inver-
Hieraus können wir folgern, dass zu den invertierbaren Ma- tieren, d. h., man macht den Ansatz (A | En ) und bringt die
trizen die invertierbaren linearen Abbildungen gehören. Matrix A durch elementare Zeilenumformungen auf obere
450 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Dreiecksgestalt, also auf die Form Wieder notieren wir (A | E 3 ), addieren zur ersten Zeile
⎛ ⎞ das (−x)-Fache der dritten Zeile, zur zweiten Zeile das
∗ ∗ ... ∗ ∗ ∗ ... ∗ (−z)-Fache der dritten Zeile und setzen schließlich die
⎜ . . ⎟
⎜ 0 ∗ . . .. ∗ ∗ . . . ∗⎟ dritte Zeile als erste Zeile:
⎜ ⎟
⎜. . . ⎟ ⎛ ⎞
⎝ .. . . . . ∗ ∗ ∗ . . . ∗⎠ x y 1 1 0 0
0 ... 0 ∗ ∗ ∗ ... ∗ ⎝z 1 0 0 1 0⎠ →
 1 0 0 0 0 1
=:D ⎛ ⎞
1 0 0 0 0 1
⎝ 0 y 1 1 0 −x ⎠ .
Stellt sich hierbei heraus, dass der Rang von A kleiner als n
ist, d. h., die links stehende Matrix D eine Nullzeile enthält, 0 1 0 0 1 −z
so ist nach dem Kriterium für Invertierbarkeit die Matrix A
Wir addieren in einem zweiten Schritt das (−y)-Fache
nicht invertierbar. Enthält D hingegen keine Nullzeile, so ist
der dritten Zeile zur zweiten und vertauschen schließlich
die Matrix invertierbar. Man setzt in diesem Fall die Zeilen-
diese beiden Zeilen:
umformungen fort und ermittelt das Inverse von A. Die ge-
⎛ ⎞
ringfügige Mehrarbeit, die Zeilenumformungen an der rechts 1 0 0 0 0 1
stehenden Einheitsmatrix im Ansatz (A | En ) durchzuführen, ⎝ 0 y 1 1 0 −x ⎠ →
sollte man in Kauf nehmen. 0 1 0 0 1 −z
⎛ ⎞
1 0 0 0 0 1
Das Bestimmen des Inversen einer Matrix A ∈ Kn×n ⎝0 1 0 0 1 −z ⎠ .
1. Man schreibe (A | En ). 0 0 1 1 −y y z − x
2. Mit elementaren Zeilenumformungen bringe man
(A | En ) auf die Form (D | B), mit einer oberen Drei- Folglich ist
ecksmatrix D. ⎛ ⎞
3. Enthält D eine Nullzeile, so ist A nicht invertierbar. 0 0 1
Enthält D keine Nullzeile, so setze man mit elemen- A−1 = ⎝0 1 −z ⎠ .
taren Zeilenumformungen fort, um das Inverse A−1 1 −y yz − x
von A zu erhalten:
Wir versuchen das Inverse von
(A | En ) → · · · → (En | A−1 ) . ⎛ ⎞
1 2 0 4
⎜1 1 0 2 ⎟
Beispiel A=⎜ ⎟
⎝0 2 1 0⎠ ∈ R
4×4

Wir invertieren die Matrix 2 5 1 6


' (
2 1
A= ∈ R2×2 . zu bestimmen. Wir machen wieder den Ansatz (A | E4 ),
1 1
addieren zur zweiten Zeile das (−1)-Fache der ersten Zeile
Zuerst notieren wir (A | E2 ), vertauschen dann die Zeilen und zur vierten Zeile das (−2)-Fache der ersten Zeile:
und addieren zur zweiten Zeile das (−2)-Fache der neuen ⎛ ⎞
ersten Zeile: 1 2 0 4 1 0 0 0
' ( ' ( ⎜1 1 0 2 0 1 0 0⎟
⎜ ⎟
2 1 1 0

1 1 0 1
. ⎝0 2 1 0 0 0 1 0⎠ →
1 1 0 1 0 −1 1 −2 2 5 1 6 0 0 0 1
⎛ ⎞
Weil die Matrix den Rang 2 hat, ist sie invertierbar. Wir 1 2 0 4 1 0 0 0
setzen nun das Invertieren fort. In einem zweiten Schritt ⎜ 0 −1 0 −2 −1 1 0 0 ⎟
⎜ ⎟
addieren wir zur ersten Zeile die zweite Zeile und multi- ⎝0 2 1 0 0 0 1 0⎠ .
plizieren dann die zweite Zeile mit dem Faktor −1: 0 1 1 −2 −2 0 0 1
' ( ' (
1 1 0 1 1 0 1 −1 Nun erkennt man, dass durch Addition der zweiten zur
→ .
0 −1 1 −2 0 1 −1 2 dritten Zeile die vierte Zeile entsteht, d. h., der Rang von
' ( A ist nicht vier. Die Matrix ist also nicht invertierbar. 
−1 1 −1
Also ist A = .
−1 2
Kommentar: Beim Invertieren von Matrizen hat man bei
Schließlich invertieren wir die Matrix
⎛ ⎞ den Zeilenumformungen im Allgemeinen viele Wahlmög-
x y 1 lichkeiten. Wir haben bei den Beispielen jeweils einen Weg
A = ⎝ z 1 0⎠ ∈ R3×3 . vorgegeben. Natürlich gelangt man auch mit anderen Zeilen-
1 0 0 umformungen zum Ziel.
12.7 Elementarmatrizen 451

Wir heben zwei Merkregeln für das Inverse spezieller Matri- Man kann auch das Addieren eines Vielfachen einer Zeile zu
zen hervor. einer anderen Zeile durch eine Matrizenmultiplikation aus-
drücken, so ist etwa
Die Inversen von 2 × 2- und Diagonalmatrizen
' ( ⎛ ⎞⎛ ⎞ ⎛ ⎞
a b 1 0 0 3 3 3 3 3 3
Die Matrix ∈ K2×2 ist genau dann invertier- ⎝−1/3 1 0⎠ ⎝3 3 3⎠ = ⎝2 2 2⎠
c d
bar, wenn a d = b c. Es gilt in diesem Fall: 0 0 1 3 3 3 3 3 3
' (−1 ' (
a b 1 d −b die Addition des (−1/3)-fachen der ersten Zeile zur zweiten.
=
c d ad −bc −c a
?
Die Matrix diag(a1 , . . . , an ) ∈ Kn×n ist genau dann
Welche Zeile ändert sich, wenn der Faktor −1/3 an der Stelle
invertierbar, wenn alle ai  = 0 sind, und es gilt in
(3, 1) dieser Matrix steht?
diesem Fall:
⎛ ⎞−1 ⎛ ⎞
a1 0 a1−1 0
⎜ .. ⎟ ⎜ .. ⎟ Ein Vertauschen der Matrizen bewirkt wieder eine entspre-
⎝ . ⎠ =⎝ . ⎠
chende Umformung an den Spalten:
0 an 0 an−1
⎛ ⎞⎛ ⎞ ⎛ ⎞
3 3 3 1 0 0 2 3 3
Diese Aussagen prüft man einfach durch Multiplikation der ⎝3 3 3⎠ ⎝−1/3 1 0⎠ = ⎝2 3 3⎠ .
jeweiligen Matrizen mit den angegebenen Inversen nach. 3 3 3 0 0 1 2 3 3

?
Ist mit zwei invertierbaren Matrizen A, B ∈ Kn×n auch die ?
n × n-Matrix A + B invertierbar ? An welcher Stelle muss der Faktor −1/3 stehen, damit die
zweite Spalte des Produkts nur 2 als Komponenten hat ?
Kommentar: Ist A x = b ein lineares Gleichungssystem
mit invertierbarer Matrix A, so ist die dann eindeutig be-
stimmte Lösung durch A−1 b gegeben. Tatsächlich ist es im In der Tat lässt sich jede elementare Zeilenumformung bzw.
Allgemeinen aber viel aufwendiger, erst A−1 zu bestimmen elementare Spaltenumformung an einer Matrix A ∈ Km×n
und diese Matrix dann mit b zu multiplizieren, als das Glei- durch Multiplikation einer Matrix von rechts bzw. von links
chungssystem mit dem Algorithmus von Gauß und Jordan zu darstellen. Matrizen, die dies bewirken, werden wir Elemen-
lösen. tarmatrizen nennen.

12.7 Elementarmatrizen Elementarmatrizen stellen elementare


⎞ ⎛ Zeilenumformungen bzw.
3 3 3 Spaltenumformungen dar
Wir betrachten die Matrix A = ⎝3 3 3⎠ ∈ R3×3 .
3 3 3
Die elementaren Zeilenumformungen bzw. elementaren
Die folgende Multiplikation reeller Matrizen Spaltenumformungen an einer Matrix A ∈ Km×n sind die
⎛ ⎞⎛ ⎞ ⎛ ⎞ Umformungen:
1 0 0 3 3 3 3 3 3
⎝0 1/3 0⎠ ⎝3 3 3⎠ = ⎝1 1 1⎠
(i) zwei Zeilen bzw. Spalten von A werden vertauscht,
0 0 1 3 3 3 3 3 3
(ii) eine Zeile bzw. Spalte wird mit einem Faktor λ = 0
bewirkt eine elementare Zeilenumformung an A, nämlich das multipliziert,
Multiplizieren der zweiten Zeile von A mit dem Faktor 1/3. (iii) zu einer Zeile bzw. Spalte wird das Vielfache einer an-
deren Zeile bzw. Spalte addiert.
Vertauscht man die Matrizen, berechnet man also
⎛ ⎞⎛ ⎞ ⎛ ⎞
3 3 3 1 0 0 3 1 3 Wir untersuchen nun, welche Matrizen diese Zeilen- bzw.
⎝3 3 3⎠ ⎝0 1/3 0⎠ = ⎝3 1 3⎠ Spaltenumformungen an der Matrix A ∈ Km×n durch Mul-
3 3 3 0 0 1 3 1 3 tiplikation von rechts bzw. links bewirken.

so bewirkt diese Multiplikation eine elementare Spaltenum- Für λ ∈ K und i, j ∈ {1, . . . , m} mit i = j nennt man die
formung an A. m × m-Matrizen der Form
452 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Beispiel: Invertieren einer Matrix


Man bestimme das Inverse der Matrix ⎛ ⎞
6 8 3
A = ⎝4 7 3⎠ ∈ R3×3 .
1 2 1

Problemanalyse und Strategie: Man beachte das auf Seite 450 beschriebene Verfahren.

Lösung: Nun erkennen wir, dass A den Rang 3 hat, also auch tat-
Wieder notieren wir zuerst (A | E3 ), tauschen dann die ers- sächlich invertierbar ist. Es folgt der letzte Schritt, in dem
te mit der dritte Zeile und addieren zur zweiten Zeile das wir die dritte Zeile zur ersten Zeile addieren und zur zwei-
(−4)-Fache der neuen ersten Zeile und zur neuen dritten ten Zeile das (−1)-Fache der dritten Zeile hinzufügen:
Zeile das (−6)-Fache der neuen ersten Zeile: ⎛ ⎞
⎛ ⎞ 1 0 −1 0 2 −7
6 8 3 1 0 0 ⎝ 0 1 1 0 −1 4 ⎠ →
⎝4 7 3 0 1 0⎠ → 0 0 1 1 −4 10
1 2 1 0 0 1 ⎛ ⎞
⎛ ⎞ 1 0 0 1 −2 3
1 2 1 0 0 1 ⎝ 0 1 0 −1 3 −6 ⎠
⎝ 0 −1 −1 0 1 −4 ⎠ 0 0 1 1 −4 10
0 −4 −3 1 0 −6
Folglich ist ⎛ ⎞
In einem zweiten Schritt addieren wir zur ersten Zeile das 1 −2 3
2-Fache der zweiten Zeile und zur dritten Zeile das (−4)- A−1 = ⎝−1 3 −6⎠
Fache der zweiten Zeile und multiplizieren schließlich die 1 −4 10
zweite Zeile mit −1:
⎛ ⎞ Kommentar: Beim Invertieren einer Matrix A ∈ Kn×n
1 2 1 0 0 1 passieren leicht Rechenfehler. Man kann sein Ergebnis
⎝ 0 −1 −1 0 1 −4 ⎠ → aber einfach überprüfen, da die Gleichung A A−1 = E n
0 −4 −3 1 0 −6 erfüllt sein muss. Diese Gleichung ist im Allgemeinen sehr
⎛ ⎞ leicht nachzuvollziehen, wir tun dies für unser Beispiel:
1 0 −1 0 2 −7
⎝ 0 1 1 0 −1 4 ⎠ ⎛ ⎞⎛ ⎞ ⎛ ⎞
6 8 3 1 −2 3 1 0 0
0 0 1 1 −4 10 ⎝4 7 3⎠ ⎝−1 3 −6⎠ = ⎝0 1 0⎠
1 2 1 1 −4 10 0 0 1

⎛ ⎞
1 Kommentar: Die Matrizen D i (λ) für λ ∈ K \ {0} und
⎜ .. ⎟ N i,j (λ) für λ ∈ K sind invertierbar, so ist D i (λ−1 ) das In-
⎜ . ⎟
⎜ ⎟ verse zu D i (λ) und N i,j (−λ) jenes zu N i,j (λ).
⎜ 1 ⎟
⎜ ⎟
D i (λ) = ⎜ λ ⎟ ← i
⎜ ⎟ ⎛ ⎞
⎜ 1 ⎟ z1
⎜ .. ⎟ ⎜ ⎟
⎝ . ⎠ Für die m × n-Matrix A = ⎝ ... ⎠ mit den Zeilenvektoren
1 zm
↑ z1 , . . . , zm ∈ Kn erhält man die folgenden Matrizenpro-
i dukte:
und ⎛ ⎞ ⎛ ⎞
⎛ ⎞ z1 z1
1 ⎜ . ⎟
. ⎜ . ⎟
⎜ .. ⎟ ⎜ . ⎟ ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ . ⎟ ⎜zi−1 ⎟ ⎜ zi−1 ⎟
⎜ ⎟ ← i ⎜ ⎟ ⎜ ⎟
⎜ 1 λ ⎟ D i (λ) A = ⎜ ⎟ ⎜ ⎟
⎜ λ zi ⎟ und N i,j (λ) A = ⎜zi + λ zj ⎟ .
⎜ .. ⎟ ⎜zi+1 ⎟ ⎜ zi+1 ⎟
N i,j (λ) = ⎜ . ⎟ ⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ . ⎟ ⎜ ⎟
⎜ 1 ⎟ ⎝ .. ⎠ ⎝ .. ⎠
⎜ ⎟ .
⎜ .. ⎟
⎝ . ⎠ zm zm
1 Also bewirkt die Matrizenmultiplikation von D i (λ) von links
↑ an A die Multiplikation der i-ten Zeile von A mit λ bzw.
j die Matrizenmultiplikation von N i,j (λ) von links an A die
m × m-Elementarmatrizen. Addition des λ-Fachen der j -ten Zeile zur i-ten Zeile.
12.7 Elementarmatrizen 453

Diese beiden Multiplikationen bewirken also gerade für Das Invertieren von Matrizen kann man auch
λ = 0 im ersten Fall die elementaren Zeilenumformungen mit Elementarmatrizen beschreiben
der Art (ii) und (iii) an A.
Wir überlegen uns nun, welche Matrix das Vertauschen Eine invertierbare Matrix A ∈ Kn×n hat nach einem Ergebnis
zweier Zeilen zi und zj für i  = j von A bewirkt. auf Seite 449 den Maximalrang n.
Wir multiplizieren an A von links Elementarmatrizen: Dann ⎛ kann A mit⎞ elementaren Zeilenumformungen auf die
⎛.⎞ ⎛ . ⎞ ⎛ ⎞ 1 ∗ ∗
.. .. .. ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ . ⎟ Form ⎝ . . . ∗ ⎠ gebracht werden und mit weiteren solchen
⎜ zi ⎟ ⎜z i + z j ⎟ ⎜ zi + zj ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 0 1
⎜ .. ⎟ ⎜ .. ⎟ ⎜ . ⎟
A=⎜.⎟→⎜ . ⎟→⎜ .. ⎟ Umformungen schließlich in die Einheitsmatrix En umge-
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜z ⎟ ⎜ z ⎟ ⎜z + (−1) (z + z )⎟ wandelt werden. Jede Umformung bedeutet eine Multiplika-
⎝ j⎠ ⎝ j ⎠ ⎝ j i j ⎠
.. .. .. tion von links mit einer Elementarmatrix. Daher existieren zu
. . . der invertierbaren Matrix A Elementarmatrizen T 1 , . . . , T k
 
=N i,j (1) A =N j,i (−1) N i,j (1) A mit
⎛ .. ⎞ ⎛ .. ⎞ ⎛.⎞ T k · · · T 1 A = En ,
.
⎜ . ⎟ ⎜ . ⎟ ⎜.⎟
⎜z i + z j ⎟ ⎜zi + zj + (−zi )⎟ ⎜zj ⎟ sodass
⎜ ⎟ ⎜ ⎟ D j (−1) ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
= ⎜ ... ⎟ → ⎜
..
. ⎟ → ⎜ ... ⎟ . T k · · · T 1 = T k · · · T 1 En = A−1 .
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ −z ⎟ ⎜ −zi ⎟ ⎜z ⎟
⎝ i ⎠ ⎝ ⎠ ⎝ i⎠
.. .. ..
. . . Invertieren von Matrizen

=N i,j (1)N j,i (−1) N i,j (1) A Jede invertierbare Matrix A lässt sich mittels elementarer
Zeilenumformungen in die Einheitsmatrix E n überfüh-
Damit führen also die Elementarmatrizen auch zum Vertau-
ren. Wendet man dieselben Umformungen in derselben
schen der Zeilen zi mit zj , also zur elementaren Zeilenum-
Reihenfolge auf En an, so erhält man A−1 .
formung (i). Diese Vertauschung bewirkt also letztlich die
Matrix
Dieses Vorgehen zum Invertieren einer invertierbaren Matrix
P i,j = D j (−1) N i,j (1) N j,i (−1) N i,j (1) =
⎛ ⎞ ist genau dasselbe, das wir in der Merkbox auf Seite 450
1 geschildert haben.
⎜ . ⎟
⎜ .. ⎟
⎜ ⎟ Man schreibt En rechts neben A, also (A | En ) und wendet
⎜ ⎟ ← i
⎜ 0 1 ⎟ die Umformungen, die A in En überführen, gleichzeitig auf
⎜ ⎟
⎜ .. ⎟ E n an, man erhält also (En | A ). Die Matrix A ist dann das
⎜ . ⎟
= ⎜ ⎟ Inverse A−1 von A.
⎜ 1 0 ⎟ ← j
⎜ ⎟
⎜ .. ⎟ Wir haben damit auch gezeigt:
⎝ . ⎠
1
↑ ↑ Folgerung
i j Jede invertierbare Matrix ist ein Produkt von Elemen-
tarmatrizen, d. h., die Gruppe GLn (K) der invertierbaren
Man nennt P i,j eine Permutationsmatrix, sie vertauscht n × n-Matrizen über dem Körper K wird von den Elemen-
durch Multiplikation von links an A die Zeilen zi und zj . tarmatrizen erzeugt.

? Wir halten eine weitere Folgerung fest: Da jede invertierbare


Warum gilt P 2 = En für jede n × n-Permutationsmatrix ? Matrix S ∈ Kn×n ein Produkt von Elementarmatrizen ist,
S = T 1 · · · T k , bewirkt die Multiplikation von S an eine
Matrix A ∈ Kn×n von links bzw. von rechts,
Analog kann man nun auch elementare Spaltenumformungen
von A durch Multiplikation von n×n-Elementarmatrizen von
S A bzw. A S ,
rechts an A ∈ Km×n darstellen.
So bewirkt die n × n-Matrix D i (λ) mit λ  = 0 durch Multi- entsprechende elementare Zeilen- bzw. Spaltenumformun-
plikation von rechts an A eine Multiplikation der i-ten Spalte gen an A, da jede Elementarmatrix T i eine solche Umfor-
von A mit dem Faktor λ. Und die Multiplikation von N i,j (λ) mung darstellt. Da elementare Zeilen- bzw. Spaltenumfor-
von rechts an A bewirkt die Addition des λ-Fachen der i-ten mungen den Rang der Matrix A nicht ändern, erhalten wir
Spalte zur j -ten Spalte. damit:
454 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Beispiel: Der Körper der komplexen Zahlen in Gestalt von Matrizen


Wir betrachten die Menge ' ( 
a −b
G := | a, b ∈ R
b a
von 2 × 2-Matizen über R und zeigen, dass wir diese Menge mit dem Körper C der komplexen Zahlen identifizieren können.

Problemanalyse und Strategie: Man gebe eine bijektive additive und multiplikative Abbildung von C nach G an.
' ( ' ( ' (
Lösung: a −b 1 0 0 −1
=a +b −
Wir betrachten die Abbildung b a 0 1 1 0
⎧ ' ( ' (
⎨ C → ' G, ( 1 0 0 −1
bildet die Menge , eine Basis von G.
ϕ: a −b 0 1 1 0
⎩ z = a + i b → Es folgt erneut dimR (C) = 2.
b a
und überzeugen uns von den folgenden vier Tatsachen: Wir heben ein weiteres Resultat hervor: Weil die Multi-
1. ϕ ist injektiv: Aus ϕ(a + i b) = ϕ(a  + i b ) folgt so- plikation in C kommutativ ist, ist es auch jene in G, denn
gleich a = a  und b = b . zu beliebigen g, g  ∈ G gibt es z, z ∈ C mit ϕ(z) = g
2. ϕ ist'surjektiv: und ϕ(z ) = g  . Damit erhalten wir g g  = ϕ(z) ϕ(z ) =
( ϕ(z z ) = ϕ(z z) = ϕ(z ) ϕ(z) = g  g .
a b
Zu ∈ G wähle z = a + i b ∈ C.
−b a Also ist die Multiplikation in G kommutativ, wenngleich
3. Für alle z, z ∈ C gilt ϕ(z + z ) = ϕ(z) + ϕ(z ):
 die Multiplikation in R2×2 nicht kommutativ ist.
Sind z = a + i b und z = a  + i b ∈ C, so ist Nach Abschnitt 5.2 können wir komplexe Zahlen auch als
' ( Vektoren des R2 interpretieren. Damit haben wir für jede
 a + a  −(b + b )
ϕ(z + z ) = = ϕ(z) + ϕ(z ) . komplexe Zahl z ∈ C die drei Schreibweisen
b + b a + a  ' ( ' (
a a −b
z = a + i b, z = ,z=
4. Für alle z, z ∈ C gilt ϕ(z z ) = ϕ(z) ϕ(z ): b b a
Sind z = a + i b und z = a  + i b ∈ C, so ist
Die Multiplikation einer komplexen Zahl z = a + i b mit
ϕ(z z ) = ϕ((a a  − b b ) + i (b a  + a b )) der imaginären Einheit i ist die Drehung der komplexen
'  (
' R (um π/2, also i z = −b + i a, da hierzu der
Zahl z im 2
a a − b b −(b a  + a b )
= −b
b a  + a b a a  − b b Vektor gehört:
' ('  ( a
a −b a −b
= = ϕ(z) ϕ(z ) .
b a b a  iz a

Wir können nun die Elemente aus C durch jene aus G


ausdrücken. Zu jedem Element aus C gehört genau ein b z
Element aus G. Der Summe bzw. dem Produkt zweier
komplexer Zahlen z und z entspricht die Summe bzw. das −b a
Produkt der beiden Matrizen ϕ(z) und ϕ(z ). Also sind
G und C von der Bezeichnung der Elemente abgesehen Dasselbe leistet in G die zu i gehörige Matrix ϕ(i):
dasselbe. Aber in G taucht die imaginäre Einheit
' i nicht
( ' (' ( ' (
0 −1 0 −1 a −b −b −a
explizit auf. Zu i gehört die Matrix ϕ(i) = , und = ,
1 0 1 0 b a a −b
der haftet nichts Imaginäres mehr an. ' (
−b
Der Körper der komplexen Zahlen' kann also da hierzu ebenso der Vektor gehört.
( gedeutet wer- a
a −b
den als die Menge aller Matrizen ∈ R2×2 . Schließlich entspricht dem Inversen einer komplexen Zahl
b a
z = a + i b = 0 das Inverse der zu z gehörigen Matrix
Die Menge G bildet einen Untervektorraum von R2×2 . Es ϕ(z), da
ist also G insbesondere
' ( ein reeller Vektorraum. Weil je-
a −b E 2 = ϕ(1) = ϕ(z z−1 ) = ϕ(z) ϕ(z−1 )
des Element ∈ G eine Linearkombination der ' (
b a ' ( a −b
1 0 gilt. D. h., die Matrix ϕ(z) = ist invertierbar mit
beiden über R linear unabhängigen Matrizen und b a
' ( 0 1 ' (
0 −1 a b
ist, – es gilt nämlich: dem Inversen ϕ(z)−1 = ϕ(z−1 ) = a 2 +b 1
.
1 0 2
−b a
12.8 Basistransformation 455

Folgerung sie stellen ja auch dieselbe lineare Abbildung dar, nur eben
Ist A ∈ Kn×n eine beliebige und S ∈ Kn×n eine bezüglich verschiedener Basen. Zu dem Begriff Äquivalenz-
invertierbare Matrix, so gilt: relation beachte man die Definition auf Seite 53:

rg(S A) = rg(A) = rg(A S) . Lemma


Für jeden Körper K und für jede natürliche Zahl n definiert
die Ähnlichkeit ∼ von Matrizen eine Äquivalenzrelation auf
12.8 Basistransformation der Menge Kn×n .

Beweis: Reflexivität: Für jedes A ∈ Kn×n gilt:


Das wesentliche Ziel von Kapitel 14 wird es sein, zu einer ge-
gebenen Abbildung ϕ eine Basis B zu bestimmen, bezüglich En−1 A En = A ,
der die Darstellungsmatrix B M(ϕ)B eine besonders einfache d. h., dass A zu sich selbst ähnlich ist, A ∼ A.
Gestalt, etwa Diagonalgestalt, hat. Der Vorteil einer solchen
einfachen Gestalt liegt auf der Hand: Ist die Darstellungs- Symmetrie: Ist A zu B ähnlich, A ∼ B, so existiert eine
matrix eine Diagonalmatrix, also invertierbare Matrix S ∈ Kn×n mit A = S −1 B S. Es folgt:
⎛ ⎞
λ1 · · · 0 B = S A S −1 ,
⎜ . . . .. ⎟
B M(ϕ)B = ⎝ .. . .⎠ d. h., dass also auch B zu A ähnlich ist, B ∼ A.
0 · · · λn
⎛ ⎞ Transitivität: Es sei A zu B ähnlich, A = S −1 B S, und B
v1
⎜ .. ⎟ zu C, B = T −1 C T . Dann folgt:
so erhält man den Koordinatenvektor B ϕ(v) = ⎝ . ⎠ des
vn A = (T S)−1 C (T S) ,
Bildes eines Vektors v unter der Abbildung ϕ durch eine d. h., dass A zu C ähnlich ist, A ∼ C. 
sehr einfache Multiplikation:
⎛ ⎞
λ 1 v1 ?
⎜ . ⎟ Welche Matrizen sind zu En ähnlich ?
B ϕ(v) = B M(ϕ)B B v = ⎝ .. ⎠ .
λ n vn
Auch Potenzen von Diagonalmatrizen sind sehr einfach zu Die Basistransformationsformel
bilden – dies hat in den Anwendungen der linearen Algebra Sind ϕ : V → V eine lineare Abbildung und B und C
eine fundamentale Bedeutung; wir gehen darauf noch ein. zwei geordnete Basen von V , so gilt:

C M(ϕ)C = S −1 B M(ϕ)B S ,
Je zwei Darstellungsmatrizen einer linearen
Abbildung sind ähnlich wobei S = B M(idV )C gilt.

In den Beispielen auf Seite 435 zu den Darstellungsmatri-


zen haben wir mehrfach ein und dieselbe lineare Abbildung Beweis: Es gilt:
bezüglich verschiedener Basen dargestellt. Darstellungs- C M(ϕ)C = C M(idV ◦ ϕ ◦ idV )C =
matrizen bezüglich verschiedener Basen sehen im Allgemei-
= C M(idV )B B M(ϕ)B B M(idV )C .
nen ganz unterschiedlich aus.
Wegen
Wir untersuchen nun, welcher algebraische Zusammenhang
zwischen den verschiedenen Darstellungsmatrizen besteht. C M(idV )B B M(idV )C = B M(idV )B = En
In der Tat ist dies ein sehr einfacher. Die zwei im Allgemei-
nen verschiedenen Darstellungsmatrizen ein und derselben erhalten wir also (B M(idV )C )−1 = C M(idV )B . Wir kürzen
linearen Abbildung bezüglich verschiedener Basen sind sich B M(idV )C mit S ab und erhalten die Behauptung. 

nämlich ähnlich; dabei sagt man, dass eine n×n-Matrix A zu Wir stellen die Situation der Basistransformationsformel in
einer n × n-Matrix B ähnlich ist, wenn es eine invertierbare einem Diagramm dar:
n × n-Matrix S mit

A = S −1 B S

gibt. Wir schreiben hierfür auch kurz A ∼ B.


Der Begriff der Ähnlichkeit besagt schon, dass der geschil-
derte Zusammenhang zwischen diesen Matrizen ein sehr en-
ger ist – man braucht solche Matrizen kaum zu unterscheiden,
456 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Übersicht: Die linearen Abbildungen ϕA : v  → A v mit einer Matrix A


Jede Matrix A = (s 1 , . . . , s n ) ∈ Km×n induziert eine lineare Abbildung ϕA vom K-Vektorraum Kn in den K-Vektorraum
Km :  n
K → Km ,
ϕA :
v → A v.
Diese Abbildungen verdienen eine besondere Beachtung, weil, wie wir bald sehen werden, letztlich jede Abbildung von einem
n-dimensionalen K-Vektorraum in einen m-dimensionalen K-Vektorraum von dieser Art ist.
Wir fassen wesentliche Ergebnisse aus den Kapiteln 5, 6 und 12 zu einer Übersicht zusammen.
⎛ ⎞
v1 ses Zusammenhangs nennt man den Kern der linearen
⎜ .. ⎟ Abbildung ϕA auch den Kern der Matrix A.
Für jeden Vektor v = ⎝ . ⎠ ∈ Kn gilt:
Für die Dimension des Kerns von ϕA gilt:
vn
ϕA (v) = A v = v1 s 1 + · · · + vn s n , −1
dim ϕA ({0}) = n − rg(A) .
insbesondere gilt für die Standard-Einheitsvektoren
e1 , . . . , en des Km : Dies folgt unmittelbar aus der Dimensionsformel.
In der Sprechweise der linearen Gleichungssysteme
ϕA (ei ) = A ei = s i für i = 1, . . . , m . lautet dies: Ist A ∈ Km×n , so ist die Dimension des
Die i-te Spalte der Matrix A ist das Bild des i-ten Lösungsraums des homogenen linearen Gleichungs-
Standardbasis-Einheitsvektors ei . systems
Das Bild von ϕA ist die Menge aller Linearkombina- Av = 0
tionen von s 1 , . . . , s n , also der Spaltenraum von A:
ϕA (Kn ) = -s 1 , . . . , s n . . gleich n − rg(A).
Insbesondere ist ein lineares homogenes Gleichungs-
Die Dimension des Bildes von A ist die Dimension des system mit einer Koeffizientenmatrix A ∈ Km×n genau
Spaltenraums von A: dann eindeutig lösbar, wenn n = rg(A) ist.
Für eine quadratische Matrix A ∈ Kn×n sind die fol-
dim(ϕA (Kn )) = rg A .
genden Aussagen äquivalent:
Ein Element v ∈ Kn liegt genau dann im Kern von ϕA , – A ist invertierbar,
wenn A v = 0 gilt: – rg(A) = n,
−1 – ϕA ist bijektiv,
ϕA ({0}) = {v ∈ Kn | A v = 0} .
– ϕA ist surjektiv,
Der Kern von ϕA ist die Lösungsmenge des homoge- – ϕA ist injektiv,
−1
nen linearen Gleichungssystems A v = 0. Wegen die- – ϕA ({0}) = {0}.

Man nennt S = B M(idV )C auch Basistransformationsma- von ϕ bezüglich einer Basis B, so gilt:
trix. Die i-te Spalte von S ist der Koordinatenvektor bezüg-
lich der Basis B des i-ten Basisvektors der Basis C. [M]∼ = {N ∈ Kn×n | N ∼ M}

Aus der Basistransformationsformel ergibt sich Folgendes: = {N ∈ Kn×n | N = S −1 M S für ein S ∈ GLn (K)} .

Jedes N ∈ [M]∼ ist Darstellungsmatrix von ϕ bezüglich


Ähnlichkeit von Darstellungsmatrizen einer Basis C von V . Unser Ziel im Kapitel 14 wird es sein,
aus jeder Äquivalenzklasse einen möglichst einfachen Re-
Je zwei Darstellungsmatrizen B M(ϕ)B und C M(ϕ)C
präsentanten zu bestimmen.
einer linearen Abbildung ϕ bezüglich der Basen B und
C sind zueinander ähnlich.
Beispiel Wir bestimmen alle zu
' (
Andererseits stellen je zwei ähnliche n × n-Matrizen über K 0 0
M= ∈ Z2×2
2
ein und dieselbe lineare Abbildung dar. Somit gehört zu jeder 1 1
linearen Abbildung ϕ eines n-dimensionalen K-Vektorraums
V in sich eine Äquivalenzklasse [M]∼ von Matrizen bezüg- ähnliche Matrizen, d. h. die Äquivalenzklasse [M]∼ von M
lich der Äquivalenzrelation ∼. Ist M die Darstellungsmatrix bezüglich ∼.
12.8 Basistransformation 457

In Z2×2
2 sind genau die Matrizen Matrizen zu berechnen. Der Rechenaufwand steigt mit der
' ( ' ( ' ( Größe der Matrizen. Viel einfacher ist es zumeist, die Dar-
1 0 1 1 1 0
A= ,B= ,C= , stellungsmatrix bezüglich einer anderen Basis direkt zu er-
0 1 0 1 1 1 mitteln. So erhalten wir etwa bei der Spiegelung im Beispiel
' ( ' ( ' (
1 1 0 1 0 1 sogleich, wenn wir die Elemente der Basis C mit c1 und c2
D= ,E= ,F = bezeichnen:
1 0 1 0 1 1
' (
invertierbar. 1 0
C M(ϕ)C = (C ϕ (c1 ) , C ϕ (c2 )) =
0 −1
?
Warum sind das genau die invertierbaren Matrizen ?
Die Basistransformationsformel hat aber dennoch einen un-
schätzbaren Wert. Angenommen, es gibt eine Basis C, be-
Wegen züglich der die Darstellungsmatrix eine Diagonalmatrix D =
' ( ' ( diag(λ1 , . . . , λn ) ist. Es ist dann einfach, für eine beliebige
0 0 1 0
A−1 MA = , B −1 MB = , Darstellungsmatrix M jede Potenz M k zu berechnen:
1 1 1 0
' ( ' (
0 0 0 1 M k = (S −1 D S)k
C −1 MC = , D −1 MD = ,
0 1 0 1 −1 −1 −1
=S
DSS D S . . . S D S
' ( ' (
1 1 1 0
E −1 ME = F −1 MF =
k-mal
,
0 0 0 0 = S −1 D k S = S −1 diag(λk1 , . . . , λkn ) S .
sind diese sechs Matrizen die Elemente der Äquivalenzklasse
Wir werden dies noch mehrfach vor allem im Kapitel 14
[M]∼ . 
benutzen.
Die Basistransformationsformel gibt an, wie wir die Darstel- Wir formulieren die Basistransformationsformel erneut für
lungsmatrix einer linearen Abbildung bezüglich einer Basis den wichtigen Fall einer linearen Abbildung der Form:
C erhalten, wenn wir diese bezüglich einer Basis B kennen.  n
Wir schildern dies an einem einfachen Beispiel. K → Kn ,
ϕ = ϕA :
v → A v.
Beispiel Wir betrachten die Abbildung
⎧ 2
⎨'R ( → 'R2( , Die Transformationsformel für quadratische
ϕ: x1 x2 Matrizen
⎩ → .
x2 x1
Die Darstellungsmatrix der linearen Abbildung
= (
Ist B '' (e1 ,'e2 ) ((
die geordnete Standardbasis des R2
und
1 1 ϕA : Kn → Kn , v → A v
C= , eine weitere geordnete Basis, so erhal-
1 −1
ten wir bezüglich einer geordneten Basis B = (b1 , . . . , bn ) des
' ( ' ( Kn lautet
0 1 1 1 B M(ϕA )B = S −1 A S ,
B M(ϕ)B = , S = B M(idR2 )C =
1 0 1 −1
' ( wobei S = (b1 , . . . , bn ) gilt.
1/2 1/2
S −1 = C M(idR2 )B =
1/2 −1/2
Beispiel
' Zu einer(reellen Zahl t betrachten wir die Matrix
und schließlich aus diesen drei Matrizen durch Produktbil- cos t sin t
A= . Ein Element v ∈ R2 schreiben wir in
dung die Darstellungsmatrix von ϕ bezüglich der Basis C: sin t − cos t
' (
C M(ϕ)C = S −1 B M(ϕ)B S v
der Form v = 1 . Damit ist eine lineare Abbildung vom
' (' (' ( v2
1/2 1/2 0 1 1 1
= R2 in den R2 definiert:
1/2 −1/2 1 0 1 −1
' ( '' (( ' ( ' (
1 0 v1 v1 v1 cos t + v2 sin t
=  ϕA =A = .
0 −1 v2 v2 v1 sin t − v2 cos t

Dieses einfache Beispiel zeigt bereits, dass die Basistrans- Es ist '' ( ' ((
cos t/2 − sin t/2
formationsformel an sich nicht sehr geeignet ist, die Darstel- B= ,
sin t/2 cos t/2
lungsmatrix bezüglich einer Basis C aus derjenigen bezüg-
lich einer Basis B zu berechnen. Es sind die Basistransfor- wegen der linearen Unabhängigkeit der beiden Elemente von
mationsmatrix, ihr Inverses und zudem das Produkt dreier B eine geordnete Basis des R2 . Tatsächlich stehen die beiden
458 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Vektoren b1 und b2 der Basis B sogar senkrecht aufeinander Der Dualraum von V ist die Menge aller
– dies sieht man, indem man ihr Skalarprodukt bildet (siehe linearen Abbildungen von V in K
Seite 235).
Wir berechnen nun die Darstellungsmatrix B M(ϕA )B . Die Für beliebige K-Vektorräume V und W ist HomK (V , W )
Basistransformationsmatrix S hat als Spalten gerade der nach dem Satz auf Seite 424 ein K-Vektorraum. Da W =
Reihe nach die Elemente b1 und b2 der geordneten Basis B: K natürlich auch ein (eindimensionaler) K-Vektorraum ist,
' ( erhalten wir den K-Vektorraum
cos t/2 − sin t/2
S= . V ∗ = HomK (V , K) = {ϕ : V → K | ϕ ist linear} .
sin t/2 cos t/2
Man nennt V ∗ den Dualraum von V . Die Elemente von V ∗
Das Inverse zu S ist dann
heißen Linearformen, eine Linearform ist damit eine lineare
' (
cos t/2 sin t/2 Abbildung von V in den Grundkörper K.
S −1 = .
− sin t/2 cos t/2
Beispiel
Damit erhalten wir: Im Fall V = Kn ist jede Linearform ϕ : Kn → K durch
' ( einen Zeilenvektor z = (a1 , . . . , an ) ∈ K1×n gegeben:
−1 1 0
B M(ϕA )B =S AS = .
0 −1 ϕ(v) = z v , v ∈ V .

Wegen der Basistransformationsformel erhalten wir damit Umgekehrt definiert jeder Vektor z ∈ K1×n eine Linear-
die sehr einfache Darstellung der linearen Abbildung ϕ durch form. Daher erhalten wir V ∗ ∼= K1×n .
' ( ' (' ( ' ( Der K-Vektorraum V = K[X] hat die Basis {Xk | k ∈ N0 }.
B v =
v1
 → ϕ
B A (v) =
1 0 v1
=
v1
, Ist ϕ ∈ V ∗ eine Linearform:
v2 0 −1 v2 −v2 ⎧
⎨ V → K,
n
d. h. ϕ:
ϕA : v1 b1 + v2 b2 → v1 b1 − v2 b2 . ⎩p = ai X i → ϕ(p),
i=0
Folglich ist ϕA die Spiegelung an der Geraden R b1 , denn b1 so wird durch
steht senkrecht auf b2 (Abb. 12.10).
b0 = ϕ(1) , b1 = ϕ(X) , b2 = ϕ(X2 ) , . . .
x2
eine Folge b = (bi )i∈N0 erklärt. Damit haben wir eine
lineare Abbildung  von V ∗ in den K-Vektorraum K[[X]]
aller Folgen über K erklärt,
 ∗
V → K[[X]],
:
ϕ → (ϕ(X i ))i∈N0 .
Nun gehen wir von einer Folge b = (bi )i∈N0 ∈ K[[X]]
aus. Zu jedem Polynom p = ni=0 ai X i ∈ K[X] betrach-
ten wir das Körperelement ni=0 ai bi ∈ K. Dadurch wird
x1 eine lineare Abbildung von V = K[X] in K, also eine
Linearform ϕb erklärt:

⎨ V → K,
n n
ϕb :
⎩p = ai X i → ai bi .
i=0 i=0

Abbildung 12.10 Die Spiegelung an der Geraden R b1 (blau).  Da jede Folge (bi )i∈N0 ∈ K[[X]] eine solche Linearform
liefert, erhalten wir somit eine Abbildung

K[[X]] → V ∗ ,
!:
(bi )i∈N0 → ϕ,
12.9 Der Dualraum
die linear ist. Offenbar gilt:
Jeder K-Vektorraum V hat einen Partner, den Dualraum V∗ ! ◦  = idV ∗ und  ◦ ! = idK[[X]] ,
von V , das ist die Menge aller linearen Abbildungen von V
in K. Falls V endlichdimensional ist, so hat V ∗ die gleiche d. h., dass V ∗ = K[X]∗ ∼
= K[[X]]. Der Dualraum des
Dimension wie V , und eine Basis von V ∗ ist mithilfe einer Vektorraums aller Polynome über K ist somit bis auf die
Basis von V leicht anzugeben. Im unendlichdimensionalen Bezeichnung der Elemente der Vektorraum aller Folgen
Fall sind die Verhältnisse komplizierter. über K. 
12.9 Der Dualraum 459

Beispiel: Die beiden Methoden zur Bestimmung von Darstellungsmatrizen


Wir schildern die beiden wichtigsten Lösungsmethoden zur Bestimmung der Darstellungsmatrix einer linearen Abbildung. Bei
der ersten Methode gehen wir direkt anhand der Definition der Darstellungsmatrix vor. Bei der zweiten Methode benutzen wir
die Basistransformationsformel. Die zweite Methode ist meist umständlicher.
Wir geben uns reelle Polynome vor:
p 1 = X3 + 6 X, p2 = X2 − X + 2, p 3 = 2 X2 + X + 4, p 4 = −3 X + 1 .
Dann ist B = (p 1 , p 2 , p 3 , p 4 ) eine geordnete Basis von R[X]3 . Wir bestimmen die Darstellungsmatrix der Differenziation
d 
dX : R[X]3 → R[X]3 , p  → p bezüglich B.

Problemanalyse und Strategie: Wie üblich bezeichne E = (1, X, X 2 , X 3 ) die kanonische Basis von R[X]3 .
d
Zuerst bestimmen wir die Darstellungsmatrix von dX anhand der Definition, also die Matrix, deren Spalten gerade
die Koordinatenvektoren bezüglich B der Bilder der Basisvektoren sind. Bei der zweiten Lösungsmethode bestimmen
d d
wir die Darstellungsmatrix E M( dX )E von dX bezüglich der Standardbasis, die Basistransformationsmatrix S, deren
Inverses und schließlich das Produkt der drei Matrizen: S −1 E M( dX
d
)E S, und dies ist dann die Darstellungsmatrix
bezüglich der Basis B.
⎛ ⎞
Lösung: 1 0 0 0 0 0 0 1
1. Lösungsweg mit der Definition der Darstel- ⎜0 1 0 0 −2 − 23 13 4⎟
... → ⎜
⎝0
3 ⎟
lungsmatrix: Wir bestimmen die Darstellungsmatrix 0 1 0 1 3 − 3 −2 ⎠
1 5
d
B M( dX )B , indem wir die Bilder der Basisvektoren 0 0 0 1 1 0 −2 0
d d d d
dX (p 1 ), dX (p 2 ), dX (p 3 ), dX (p 4 ) der Reihe nach als Folglich ist das Inverse von S:
Linearkombinationen von p1 , p 2 , p 3 , p 4 darstellen: ⎛ ⎞
0 0 0 1
d ⎜−2 − 2 13
(p 1 ) = 3 X2 + 6 = p2 + p 3 , 4⎟
dX S =⎜
−1
⎝ 1 1 −5
3 3 ⎟
3 3 −2⎠
d
(p 2 ) = 2 X − 1 = −X + (3 X − 1) 1 0 −2 0
dX
1 2 1 d
Die Darstellungsmatrix von dX bezüglich der Standard-
= − (p 3 − 2 p2 ) − p 4 = p2 − p3 − p 4 ,
3 3 3 basis E ist einfach zu bestimmen:
d ⎛ ⎞
(p 3 ) = 4 X + 1 = 7 X + (−3 X + 1) ' ( 0 1 0 0
dX d ⎜0 0 2 0⎟
7 14 7 EM E =⎝
⎜ ⎟
= (p 3 − 2 p2 ) + p 4 = − p 2 + p3 + p 4 , dX 0 0 0 3⎠
3 3 3 0 0 0 0
d
(p 4 ) = −3 = −9 X + (9 X − 3) Damit bleibt nun folgende Rechnung auszuführen:
dX
' ( ' (
= −3 (p3 − 2 p2 ) − 3 p 4 = 6 p2 − 3 p3 − 3 p4 . d −1 d
B M B = S E M S.
Folglich ist dX dX E
' ( Wir multiplizieren zuerst die beiden hinteren Matrizen und
d ' (
d d d d
B M B = B dX (p1 ), B dX (p2 ), B dX (p3 ), B dX (p4 ) erhalten dann
dX ' (
⎛ ⎞ d
0 0 0 0 BM B =
⎜1 2 − 14 6 ⎟ dX
=⎜ 3
⎝1 − 1 7 −3⎠
3 ⎟ ⎛ ⎞⎛ ⎞
3 3
0 0 0 1 6 −1 1 −3
0 −1 1 −3 ⎜−2 − 2 13
4⎟ ⎜ ⎟
=⎜ 3 3 ⎟ ⎜0 2 4 0 ⎟
⎝ 1 1 − 5 −2⎠ ⎝3 0 0 0 ⎠
2. Lösungsweg mit der Transformationsformel: Da wir die 3 3
Inverse von S = E M(ϕ)B brauchen, um die Transforma- 1 0 −2 0 0 0 0 0

 
tionsformel anwenden zu können, starten wir gleich mit d
=E M dX ES
der Berechnung von S −1 – die Zwischenschritte lassen ⎛ ⎞
0 0 0 0
wir jedoch aus: ⎜1 2 − 14 6⎟
⎛ ⎞ =⎜ 3
⎝1 − 1 7
3 ⎟
0 2 4 1 1 0 0 0 3 3 −3⎠
⎜ 6 −1 1 −3 0 1 0 0 ⎟ 0 −1 1 −3
(S | E 4 ) = ⎜ ⎟
⎝ 0 1 2 0 0 0 1 0 ⎠ → ...
Natürlich erhalten wir wieder die gleiche Matrix wie beim
1 0 0 0 0 0 0 1 ersten Lösungsweg.
460 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Zu jeder Basis B von V gibt es eine Dualbasis Im endlichdimensionalen Fall ist B ∗ aber eine Basis von V ∗ :
B ∗ von V ∗
Satz von der Dualbasis
Ist B eine Basis des K-Vektorraums V , so lässt sich jeder
Ist B eine Basis des K-Vektorraums V , so gilt:
Vektor v ∈ V eindeutig darstellen als
(i) B ∗ ⊆ V ∗ ist linear unabhängig.
!
v= λb b , (ii) Im Fall dim V ∈ N0 ist B ∗ eine Basis von V ∗ , ins-
b∈B besondere gilt V ∼ = V ∗.
wobei nur endlich viele der Koeffizienten λb ungleich null
sind. Nun ordnen wir jedem Basiselement b ∈ B eine Line- Beweis: Im Fall B = ∅ gilt B ∗ = ∅, sodass alle Behaup-
arform b∗ zu:  tungen richtig sind. Wir setzen nun B = ∅ voraus.
V → K,
b∗ : , (i) Es seien b1 , . . . , bn ∈ B verschiedene Elemente der mög-
v  → λb ,
licherweise unendlichen Menge B und
wobei λb eben der Koeffizient von b in der eindeutig be-
stimmten Darstellung von v = b∈B λb b bezüglich der Ba- ϕ = λ1 b∗1 + · · · + λn b∗n = 0
sis B ist.
mit λ1 , . . . , λn ∈ K. Wir setzen auf beiden Seiten die Basis-
Beispiel elemente b1 , . . . , bn ein:
Im Fall V = K3 ist (e1 , e2 , e3 ) eine geordnete Basis, und
es gilt:
ϕ(bi ) = λ1 b∗1 (bi ) + · · · + λn b∗n (bi ) = 0(bi ) = 0.
⎛⎛ ⎞⎞ ⎛⎛ ⎞⎞ ⎛⎛ ⎞⎞
1 1 1
e∗1 ⎝⎝2⎠⎠ = 1, e∗2 ⎝⎝2⎠⎠ = 2, e∗3 ⎝⎝2⎠⎠ = 3 . Wegen λ1 b∗1 (bi )+· · ·+λn b∗n (bi ) = λi für alle i = 1, . . . , n
3 3 3 erhalten wir
λ1 = · · · = λn = 0 .
Im Fall V = R[X] ist (1, X, X 2 , . . .) eine geordnete
Basis, und es gilt für das Polynom p = 2 + 3 X 2 : Somit ist jede endliche Teilmenge {b∗1 , . . . , b∗n } von B ∗ li-
near unabhängig, also auch B ∗ .
(1)∗ = 2 , (X)∗ = 0 , (X2 )∗ = 3 , (X3 )∗ = 0 , . . . 
(ii) Es ist zu zeigen, dass B ∗ im Fall dim V ∈ N ein Erzeu-
Für jede Basis B eines K-Vektorraums V nennt man die gendensystem von V ∗ ist. Es sei dazu ϕ ∈ V ∗ gegeben. Für
Menge jedes b ∈ B setzen wir
B ∗ = {b∗ | b ∈ B} ⊆ V ∗
λb = ϕ(b) ∈ K
die Dualbasis zu B, für je zwei Elemente b, b ∈ B gilt

1 , falls b = b , und betrachten nun die Linearform
b∗ (b ) = δb,b =
0 , sonst. !
ψ= λb b∗ ∈ -B ∗ . .
b∈B

Achtung: Die Dualbasis B ∗ ist im Fall |B| = ∞ keine


Wenn wir zeigen, dass ϕ = ψ, folgt daraus die Behauptung.
Basis, beachte das folgende Beispiel.
Für alle Elemente b ∈ B gilt:
 
Beispiel Es sei V ein unendlichdimensionaler K-Vektor- ! !
raum mit der Basis B. Die Abbildung ψ(b ) = λb b∗ (b ) = λb b∗ (b )
b∈B b∈B

V → K, = λb = ϕ(b ) .
ϕ: v = λb b  → λb , ,
b∈B b∈B
Somit stimmen die beiden linearen Abbildungen ϕ und ψ auf
die der eindeutig bestimmten endlichen Darstellung v = der Basis B überein. Nach dem Prinzip der linearen Fortset-
b∈B λb b ∈ V bezüglich der Basis B die Summe der zung von Seite 420 gilt damit ϕ = ψ.
Koeffizienten b∈B λb zuordnet, ist eine Linearform, d. h.
ϕ ∈ V ∗ , und es gilt: Da die beiden K-Vektorräume V und V ∗ die gleiche endliche
  Dimension haben, sind sie insbesondere isomorph (beachte
! den Satz auf Seite 434). 
∗ ∗
ϕ ∈ -B . = λb b | λb ∈ K ,
b∈B
?
da die Summen in -B ∗ .
endlich sind. Es folgt, dass B ∗ kein Können Sie auch explizit einen Isomorphismus angeben ?
Erzeugendensystem von V ∗ ist. 
12.9 Der Dualraum 461

Zu jeder linearen Abbildung gibt es eine duale Anstelle von (V ∗ )∗ schreiben wir einfacher V ∗∗ und nennen
Abbildung diesen K-Vektorraum den Bidualraum zu V . Ein Element
ψ des Bidualraums zu V ordnet damit jeder Linearform ϕ
Zu jedem Vektorraum gibt es den Dualraum, zu jeder Basis von V jeweils ein Körperelement ψ(ϕ) zu,
die Dualbasis. Es wundert nun nicht mehr, dass wir auch  ∗
V → K,
zu jeder linearen Abbildung zwischen Vektorräumen eine ψ:
ϕ → ψ(ϕ).
duale Abbildung angeben können. Zu einer linearen Abbil-
dung ϕ : V → W erklären wir die Abbildung
 ∗ Satz vom Bidualraum
∗ W → V ∗,
ϕ : Es sei V ein K-Vektorraum. Die Abbildung
ψ  → ψ ◦ ϕ.
⎧ ∗∗
Man nennt diese lineare Abbildung ϕ ∗ die zu ϕ duale Ab- ⎨V → V ∗ ,
bildung. : V → K,
⎩ v → (v) :
ϕ → ϕ(v)
Die duale Abbildung ϕ ∗ ordnet also jeder Linearform aus
W ∗ eine Linearform aus V ∗ zu. Die Linearform aus V ∗ wird ist linear und injektiv. Im Fall dim V ∈ N0 ist  auch
dabei durch ihre Wirkung auf einen Vektor aus V definiert: surjektiv und somit ein Isomorphismus.
ϕ ∗ (ψ) angewandt auf v ist per Definitionem gleich ψ(ϕ(v)).

Beispiel Zu einer Matrix A ∈ Km×n betrachten wir die Beweis: Die Abbildung (v) ist linear: Sind ϕ, ψ ∈ V ∗
lineare Abbildung und λ ∈ K, so gilt:
 n
K → Km , (v)(λ ϕ + ψ) = (λ ϕ + ψ)(v) = λ ϕ(v) + ψ(v)
ϕA :
v  → A v. = λ (v)(ϕ) + (v)(ψ) .
Jede Linearform ψ ∈ (Km )∗ ist durch einen Zeilenvektor
zψ ∈ K1×m gegeben (beachte das Beispiel auf Seite 458): Die Abbildung  ist linear: Sind v, w ∈ V und λ ∈ K, so
gilt für alle ϕ ∈ V ∗ :
ψ(v) = zψ v , d. h. ψ = ϕzψ .
(λ v + w)(ϕ) = ϕ(λ v + w) = λ ϕ(v) + ϕ(v)
∗ : (Km )∗ → (Kn )∗
Somit ist die zu ϕA duale Abbildung ϕA = λ (v)(ϕ) + (w)(ϕ) .
gegeben durch
 n Die Abbildung  ist injektiv: Es sei (v) = 0 für ein v ∈ V .
∗ K → K,
ϕA (ψ) : Dann gilt ϕ(v) = 0 für alle ϕ ∈ V ∗ . Angenommen v = 0.
v  → zψ A v.
Aufgrund des Basisergänzungssatzes können wir die linear
Wir bezeichnen mit En∗ und Em ∗ die Dualbasen zu den kano- unabhängige Menge {v} zu einer Basis B von V ergänzen.
nischen Basen En und Em von Kn und Km . Die i-te Spalte Mit der Linearform v ∗ ∈ B ∗ gilt dann v ∗ (v) = 1 – ein
der Darstellungsmatrix En∗ M(ϕA∗ ) ∗ von ϕ ∗ bezüglich dieser Widerspruch. Somit muss v = 0 gelten. Mit dem Injekti-
Em A
Dualbasen ist wegen ze∗i = (0, . . . , 1, . . . , 0) = e0
i
vitätskriterium von Seite 427 folgt hieraus die Injektivität
von .
∗ ∗
En∗ ϕA (ei ) = En∗ (e∗i ◦ ϕA ) = En∗ (ϕe0 ◦ ϕA )
i Gilt nun darüber hinaus dim V = n ∈ N0 , so erhalten wir
= En∗ (ϕe0 A ) = En∗ (ϕ(ai1 ... ain ) ) mit obigem Satz
i
⎛ ⎞
ai1 dim V = dim V ∗ = dim V ∗∗ .
⎜ ⎟
= ⎝ ... ⎠ .
Damit folgt die Surjektivität von  in diesem Fall mit dem
ain Bijektivitätskriterium von Seite 430. 

Somit gilt
∗ ∗
En∗ M(ϕA )Em = A0 .  Achtung: Im Fall dim V = ∞ ist die im Satz zum Bi-
dualraum angegebene injektive Abbildung  nicht surjektiv,
beachte das folgende Beispiel.

Der Dualraum zum Dualraum ist der Beispiel Ist B eine Basis eines unendlichdimensionalen K-
Bidualraum Vektorraums V , so ist B ∗ eine linear unabhängige Teilmenge
von V ∗ (beachte den Satz zur Dualbasis auf Seite 460). Wir
Für jeden K-Vektorraum V ist V ∗ wieder ein K-Vektorraum. können die linear unabhängige Menge B ∗ mit dem Basis-
Daher können wir den Dualraum zum Dualraum V ∗ bilden. ergänzungssatz zu einer Basis von V ∗ ergänzen. Nach dem
462 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Prinzip der linearen Fortsetzung gibt es somit eine lineare mit nur endlich vielen λb ∈ K \ {0}, mit ϕ = (v). Wegen
Abbildung ϕ mit
(v)(b∗ ) = b∗ (v) = λb
ϕ(b∗ ) = 1 für alle b∗ ∈ B ∗ . (∗)

Somit gilt ϕ ∈ V ∗∗ . Angenommen, ϕ ∈ (V ). Dann exis- nimmt (v) nur für endliche viele b∗ von null verschiedene
tiert ein v ∈ V , ! Werte an. Das ist ein Widerspruch zu (∗). 
v= λb b ,
b∈B

Zusammenfassung

Eine Abbildung zwischen K-Vektorräumen heißt linear, falls Der Kern und das Bild einer linearen Abbildung
sie additiv und homogen ist, genauer:
Ist ϕ eine lineare Abbildung von einem K-Vektorraum
V in einen K-Vektorraum W , so nennt man
Definition einer linearen Abbildung
Eine Abbildung ϕ : V → W zwischen K-Vektorräumen ker ϕ = ϕ −1 ({0}) = {v ∈ V | ϕ(v) = 0} ⊆ V
V und W heißt K-lineare Abbildung oder Homomor-
phismus, wenn für alle v, w ∈ V und λ ∈ K gilt: den Kern von ϕ und
ϕ(v + w) = ϕ(v) + ϕ(w) (Additivität),
ϕ(λ v) = λ ϕ(v) (Homogenität). Bild ϕ = ϕ(V ) = {ϕ(v) | v ∈ V } ⊆ W

das Bild von ϕ.


Sind ϕ und ψ lineare Abbildungen zwischen K-Vektor-
räumen und λ ein Skalar aus K, so kann man im Fall von
passenden Definitions- und Wertemengen auch die Hinter- Es ist nicht schwer zu begründen, dass eine lineare Abbil-
einanderausführung ψ ◦ ϕ und die Summe ψ + ϕ und das dung genau dann injektiv ist, wenn der Kern trivial, also
skalare Vielfache λ ϕ bilden und somit auch von inversen ker ϕ = {0} gilt, etwas anspruchsvoller hingegen ist der
Abbildungen sprechen. Dabei ist bemerkenswert, dass die Nachweis der Dimensionsformel
Summe, das Produkt, das skalare Vielfache und auch das In-
verse einer invertierbaren linearen Abbildung stets wieder Die Dimensionsformel
lineare Abbildungen sind, es gilt sogar: Ist V ein endlichdimensionaler Vektorraum, so gilt für
jede lineare Abbildung ϕ : V → W die Gleichung
Der K-Vektorraum der linearen Abbildungen
dim(V ) = dim(ϕ −1 ({0})) + dim(ϕ(V )) .
Die Menge HomK (V , W ) aller linearen Abbildungen  
von V nach W ist ein K-Vektorraum. Kern Bild

Eine lineare Abbildung nennt man im Fall V = W auch Im Fall dim V = dim W können wir hieraus folgern, dass
Endomorphismus, man schreibt dann EndK (V ) anstelle von eine Abbildung schon dann bijektiv ist, wenn sie injektiv
HomK (V , V ). In diesem Fall ist stets auch ψ ◦ ϕ und ϕ ◦ ψ oder surjektiv ist. Eine weitere Folgerung aus der Dimen-
für alle Elemente ϕ, ψ ∈ EndK (V ) erklärt und es gilt: sionsformel ist, dass der Zeilen- und der Spaltenrang einer
Matrix stets gleich sind.
Der Endomorphismenring EndK (V )
Ist B = (b1 , . . . , bn ) eine geordnete Basis eines K-Vektor-
Die Menge raums V , so besitzt jedes v ∈ V genau eine Darstellung
EndK (V ) = HomK (V , V )
v = v1 b1 + · · · + vn bn
aller Endomorphismen von V ist mit punktweiser Addi- ⎛ ⎞
v1
tion + und der Multiplikation ◦ ein Ring mit Einselement ⎜ ⎟
id. mit v1 , . . . , vn ∈ K. Es heißt B v = ⎝ ... ⎠ ∈ Kn der Koor-
vn
Zu jeder linearen Abbildung ϕ : V → W gehört der Kern dinatenvektor von v bezüglich B. Hierdurch wird eine Ab-
und das Bild von ϕ; der Kern ist ein Untervektorraum von V bildung von V in den Kn erklärt, für diese Abbildung gilt der
und das Bild ist ein solcher von W . zentrale Satz:
Zusammenfassung 463

Jeder n-dimensionale K-Vektorraum ist zum Kn iso- Wir treiben diese Isomorphie noch weiter, indem wir eine
morph Multiplikation von Matrizen einführen, sodass die Komposi-
tion von linearen Abbildungen mit dieser Multiplikation ver-
Ist B = (b1 , . . . , bn ) eine geordnete Basis des n-di-
träglich ist in dem Sinne, dass das Produkt der Matrizen die
mensionalen K-Vektorraums V , so ist die Abbildung
Darstellungsmatrix des Produktes der linearen Abbildungen
 ist. Dabei stellt sich heraus, dass die Zeilen der ersten Ma-
V → Kn ,
ϕ: trix mit den Spalten der zweiten Matrix multipliziert werden
v → B v
müssen. Man erhält dann:
eine bijektive und lineare Abbildung, d. h. ein Isomor-
phismus. Der Endomorphismenring ist zum Matrizenring iso-
morph
Durch diesen Satz können wir jeden endlich-dimensionalen Die Menge Kn×n aller n×n-Matrizen bildet mit der Ad-
K-Vektorraum V , etwa dim V = n, als den Kn auffas- dition + und Multiplikation · von Matrizen einen Ring
sen. In einem weiteren Schritt bildet man dann die Darstel- mit Einselement En , und für jeden n-dimensionalen K-
lungsmatrix A einer linearen Abbildung ϕ zwischen endlich- Vektorraum V gilt:
dimensionalen Vektorräumen V und W und erhält damit eine
konkrete Beschreibung der linearen Abbildung ϕ: EndK (V ) ∼
= Kn×n .

ϕ : V → W ←→ ϕA : Kn → Km . Im Fall n > 2 ist Kn×n nicht kommutativ und besitzt


Nullteiler, d. h., es gibt Elemente A = 0 = B mit
A B = 0.
Die Darstellungsmatrix einer linearen Abbildung
Es seien V ein n-dimensionaler und W ein m-dimen- Zu den invertierbaren Endomorphismen gehören die inver-
sionaler K-Vektorraum mit den geordneten Basen B = tierbaren Matrizen. Dabei berechnet man das Inverse einer
(b1 , . . . , bn ) von V und C = (c1 , . . . , cm ) von W . Matrix durch simultanes Lösen von linearen Gleichungs-
Und ϕ sei eine lineare Abbildung von V nach W . Man systemen.
nennt die Matrix
Mithilfe der Inversen kann man nun einfach darstellen, wie
m×n
C M(ϕ)B = (C ϕ(b1 ), . . . , C ϕ(bn )) ∈ K verschiedene Darstellungsmatrizen ein und derselben linea-
ren Abbildung zusammenhängen:
die Darstellungsmatrix von ϕ bezüglich der Basen B
und C. Die Basistransformationsformel
Die i-te Spalte von C M(ϕ)B ist der Koordinatenvektor
Sind ϕ : V → V eine lineare Abbildung und B und C
des Bildes des i-ten Basisvektors.
zwei geordnete Basen von V , so gilt:

Dabei findet man etwaige Eigenschaften der Abbildung ϕ, C M(ϕ)C = S −1 B M(ϕ)B S ,


z. B. Injektivität oder Surjektivität, in der Darstellungsma-
trix wieder, so ist der Kern und das Bild einer linearen Abbil- wobei S = B M(idV )C gilt.
dung durch den Kern und das Bild einer Darstellungsmatrix
gegeben. Man kann die linearen Abbildungen durch Matrizen
identifizieren:

Die Vektorräume HomK (V , W ) und Km×n sind iso-


morph
Es seien V ein n-dimensionaler und W ein m-
dimensionaler K-Vektorraum mit den Basen B und C.
Die Abbildung

HomK (V , W ) → Km×n ,
C !B :
ϕ  → C M(ϕ)B

ist ein Isomorphismus, insbesondere gilt HomK (V,W ) ∼


=
Km×n .
464 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

⎛ ⎞
Verständnisfragen 0 1 1
12.6 •• Zeigen Sie, dass für M = ⎝1 0 1⎠ gilt:
12.1 • Für welche u ∈ R2 ist die Abbildung 1 1 0
 2
R → R2 , M n = an M + bn E3
ϕ:
v → v + u
und bestimmen Sie eine Rekursionsformel für an und bn .
linear?
12.7 • Wir betrachten die lineare Abbildung ϕ :
12.2 • Gibt es eine lineare Abbildung ϕ : R2 → R2 R4 → R4 , v  → A v mit der Matrix
mit ⎛ ⎞
3 1 1 −1
(a) ⎜1 3 −1 1⎟
'' (( ' ( '' (( ' ( '' (( ' ( A=⎜
⎝1

2 2 2 1 6 4 −1 3 1⎠
ϕ = ,ϕ = ,ϕ = −1 1 1 3
3 2 0 1 3 3
bzw. Gegeben sind weiter die Vektoren
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
(b) 1 1 4
'' (( ' ( '' (( ' ( '' (( ' ( ⎜1⎟ ⎜−1⎟ ⎜4⎟
ϕ
1
=
2

2
=
1

5
=
4
? a=⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝1⎠ , b = ⎝−1⎠ und c = ⎝4⎠ .
3 1 0 1 3 3
1 1 4
12.3 • Folgt aus der linearen Abhängigkeit der Zeilen (a) Berechnen Sie ϕ(a) und zeigen Sie, dass b im Kern von
einer reellen 11 × 11-Matrix A die lineare Abhängigkeit der ϕ liegt. Ist ϕ injektiv?
Spalten von A? (b) Bestimmen Sie die Dimensionen von Kern und Bild der
linearen Abbildung ϕ.
Rechenaufgaben (c) Bestimmen Sie Basen des Kerns und des Bildes von ϕ.
(d) Bestimmen Sie die Menge L aller v ∈ R4 mit ϕ(v) = c.
12.4 • Welche der folgenden Abbildungen sind linear ?
⎧ 2
⎨ 'R ( → ' R2 , ( 12.8 • Wir betrachten den reellen Vektorraum R[X]3
(a) ϕ1 : v v2 − 1 aller Polynome über R vom Grad kleiner oder gleich 3, und es
⎩ 1 → d
: R[X]3 → R[X]3 die Differenziation. Weiter
v2 −v1 + 2 bezeichne dX
⎧ 2
⎪ R → ⎛ R3 , sei E = (1, X, X 2 , X 3 ) die Standardbasis von R[X]3 .

⎨' ( ⎞
13 v2 d
(a) Bestimmen Sie die Darstellungsmatrix E M( dX )E .
(b) ϕ2 : v1

⎪ → ⎝ 11 v1 ⎠ d
⎩ v2 (b) Bestimmen Sie die Darstellungsmatrix B M( dX )B
−4 v2 − 2 v1
⎧ 2 d
von dX bezüglich der geordneten Basis B =

⎪ R → ⎛ R3 , ⎞
⎨' ( (X3 , 3 X 2 , 6 X, 6) von R[X]3 .
v1
(c) ϕ3 : v1 ⎝ −v 2 v2 ⎠

⎪  → 12.9 •• Gegeben sind die geordnete
⎩ v2 1
⎛⎛ ⎞ ⎛ Standardbasis
⎞ ⎛ ⎞⎞
v2 − v1 '' ( ' (( 1 1 1
1 0
E2 = , des R2 , B = ⎝⎝1⎠ , ⎝1⎠ , ⎝0⎠⎠
12.5 • Welche Dimensionen haben Kern und Bild der 0 1
1 0 0
folgenden linearen Abbildung? ⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
⎧ 2 1 1 1 1
⎨ 'R ( → ' R2 , ( ⎜⎜1⎟ ⎜1⎟ ⎜1⎟ ⎜0⎟⎟
des R3 und C = ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝1⎠ , ⎝1⎠ , ⎝0⎠ , ⎝0⎠⎠ des R .
4
ϕ: v v1 + v 2
⎩ 1 → .
v2 v1 + v 2 1 0 0 0
Aufgaben 465

Nun betrachten wir zwei lineare Abbildungen ϕ : R2 → R3 (b) Zeigen Sie, dass
und ψ : R3 → R4 definiert durch '
⎛ ⎞ X(X − 1)
'' (( v1 − v2 B = 1, X, ,
v1 2
ϕ = ⎝ 0 ⎠ und (
v2 X(X − 1)(X − 2) X(X − 1)(X − 2)(X − 3)
2 v1 − v2 ,
⎛ ⎞ 6 24
⎛⎛ ⎞⎞ v1 + 2 v3
v1 ⎜ v2 − v3 ⎟ eine geordnete Basis von R[X]4 ist, und berechnen Sie
ψ ⎝⎝v2 ⎠⎠ = ⎜ ⎝ v1 + v2 ⎠ .
⎟ die Darstellungsmatrix B M(6)B von 6 bezüglich B.
v3 (c) Angenommen, Sie sollten auch noch die Darstellungs-
2 v1 + 3 v3
matrizen der Endomorphismen 62 , 63 , 64 , 65 berech-
Bestimmen Sie die Darstellungsmatrizen B M(ϕ)E2 , nen – es bedeutet hierbei 6k = 6 ◦ · · · ◦ 6 – Ihnen sei

C M(ψ)B und C M(ψ ◦ ϕ)E2 . k-mal
dafür aber die Wahl der Basis von R[X]4 freigestellt.
12.10 •• Gegeben ist eine lineare Abbildung ϕ : Welche Basis würden Sie nehmen? Begründen Sie Ihre
R3 → R3. Die Darstellungsmatrix von ϕ bezüglich der ge- Wahl.
ordneten Standardbasis E3 = (e1 , e2 , e3 ) des R3 lautet:
⎛ ⎞
4 0 −2 Beweisaufgaben
E3 M(ϕ)E3 = ⎝1 3 −2⎠ ∈ R3×3 .
1 2 −1 12.13 •• Es seien K ein Körper, V ein endlichdimensio-
naler K-Vektorraum, ϕ1 , ϕ2 ∈ EndK (V ) mit ϕ1 + ϕ2 = idV .
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
2 1 2 Zeigen Sie:
(a) Zeigen Sie: B = ⎝⎝2⎠ , ⎝1⎠ , ⎝1⎠⎠ ist eine geord-
(a) dim(Bild ϕ1 ) + dim(Bild ϕ2 ) ≥ dim(V ).
3 1 1
3 (b) Falls „=“ in (a) gilt, so ist
nete Basis des R .
(b) Bestimmen Sie die Darstellungsmatrix B M(ϕ)B
ϕ1 ◦ ϕ1 = ϕ1 ,
und die Transformationsmatrix S mit B M(ϕ)B =
S −1 E3 M(ϕ)E3 S. ϕ2 ◦ ϕ2 = ϕ2 ,
ϕ1 ◦ ϕ2 = ϕ2 ◦ ϕ1 = 0 ∈ EndK (V ).
12.11 •• Gegeben sind zwei geordnete Basen A und B
des R3
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞ 12.14 •• Wenn A eine linear unabhängige Menge eines
8 −16 9 K-Vektorraums V und ϕ ein injektiver Endomorphismus von
A = ⎝⎝ −6 ⎠ , ⎝ 7 ⎠ , ⎝ −3 ⎠⎠ V ist, ist dann auch A = {ϕ(v) | v ∈ A} linear unabhängig ?
7 −13 7
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
1 3 2 12.15 ••• Gegeben ist eine lineare Abbildung ϕ : R2 →
B = ⎝⎝ −2 ⎠ , ⎝ −1 ⎠ , ⎝ 1 ⎠⎠ R2 mit ϕ ◦ ϕ = idR2 (d. h., für alle v ∈ R2 gilt ϕ(ϕ(v)) = v),
1 2 2 aber ϕ = ±idR2 (d. h. ϕ ∈ {v → v, v → −v}). Zeigen Sie:

und eine lineare Abbildung ϕ : R3 → R3 , die bezüglich der (a) Es gibt eine Basis B = {b1 , b2 } des R2 mit ϕ(b1 ) = b1 ,
Basis A die folgende Darstellungsmatrix hat ϕ(b2 ) = −b2 .
(b) Ist B  = {a 1 , a 2 } eine weitere Basis mit der in (a) an-
⎛ ⎞
1 −18 15 gegebenen Eigenschaft, so existieren λ, μ ∈ R \ {0} mit
A M(ϕ)A = ⎝−1 −22 15⎠ a 1 = λ b1 , a 2 = μ b2 .
1 −25 22
12.16 •• Es seien K ein Körper und n ∈ N. In
(a) Bestimmen Sie die Darstellungsmatrix B M(ϕ)B von ϕ
dem K-Vektorraum V = Kn seien die Unterräume U =
bezüglich der geordneten Basis B.
-u1 , . . . , ur . und W = -w1 , . . . , wt . gegeben. Weiter seien
(b) Bestimmen Sie die Darstellungsmatrizen A M(ϕ)B und
m = r + t und
B M(ϕ)A .
⎛ ⎞
u1 u1
12.12 ••• Es bezeichne 6 : R[X]4 → R[X]4 den durch ⎜ .. .. ⎟
6(f ) = f (X + 1) − f (X) erklärten Differenzenoperator. ⎜ . . ⎟
⎜ ⎟
⎜ ur ur ⎟
(a) Zeigen Sie, dass 6 linear ist, und berechnen Sie die Dar- A=⎜
⎜ w1
⎟ ∈ Km×2n
⎜ 0 ⎟ ⎟
stellungsmatrix E M(6)E von 6 bezüglich der kanoni- ⎜ . .. ⎟
schen Basis E = (1, X, X 2 , X 3 , X 4 ) von R[X]4 sowie ⎝ .. . ⎠
die Dimensionen des Bildes und des Kerns von 6. wt 0
466 12 Lineare Abbildungen und Matrizen – Brücken zwischen Vektorräumen

(wobei die ui , wi als Zeilen geschrieben sind). Zeigen Sie: U = -(0, 1, 0, −1)0 , (1, 0, 1, −2)0, (−1, −2, 0, 1)0 .
Bringt man A durch elementare Zeilenumformungen auf die W = -(−1, 0, 1, 0)0 , (1, 0, −1, −1)0 , (2, 0, −1, 0)0 .
Form ⎛ ⎞
v1 " des R-Vektorraums V = R4 gegeben.
⎜ .. .. ⎟
⎜ . . ⎟
⎜ ⎟ 12.18 ••• Für A, B ∈ Kn×n sei En − A B invertierbar.
⎜ vl " ⎟
A =⎜

⎜ 0 y1 ⎟ ,

Zeigen Sie, dass dann auch En − B A invertierbar ist und
⎜ ⎟
⎜ . .. ⎟ bestimmen Sie das Inverse.
⎝ .. . ⎠
0 y m−l 12.19 ••• Es sei A ∈ Km×n und B ∈ Kn×p . Zeigen Sie:
wobei v 1 , . . . , v l paarweise verschieden und linear unab-
rg(A B) = rg(B) − dim(ker A ∩ Bild B) .
hängig sind, so ist {v 1 , . . . , v l } eine Basis von U + W und
-y 1 , . . . , y m−l . = U ∩W . Zeigen Sie weiter: Ist dim(U ) = r
und dim(W ) = t, so ist {y 1 , . . . , y m−l } eine Basis von 12.20 •• Zeigen Sie: Sind A und A zwei n×n-Matrizen
U ∩ W. über einem Körper K, so gilt

A A = En ⇒ A A = En .
12.17 • Bestimmen Sie eine Basis von U ∩ W . Dabei
seien die beiden Untervektorräume Insbesondere ist A = A−1 das Inverse der Matrix A.

Antworten der Selbstfragen

S. 418 S. 427
λ v ) = λ ϕ(v) wäre bei verschiede-
Die Gleichung ϕ(  Die erste Abbildung ist injektiv. Die zweite Abbildung ist im

∈V ∈W Fall V = {0} injektiv, im Fall V  = {0} ist sie nicht injektiv.
nen Körpern nicht immer sinnvoll. Wäre etwa V ein C- Die dritte Abbildung ist nicht injektiv. Die vierte Abbildung
Vektorraum und W ein R-Vektorraum, so würde λ = i die ist im Fall rg A = n injektiv, im Fall rg A = n ist sie nicht in-
Homogenität unmöglich machen. jektiv. Die fünfte Abbildung ist nicht injektiv. Man betrachte
jeweils den Kern der linearen Abbildung.
S. 420
Ja, man schreibe v − w = v + (−1) w. S. 428
Nein, man beachte die Dimensionsformel: Ist ϕ surjektiv, so
S. 422
gilt dim(ϕ(R11 )) = 7. Wäre dim(ϕ −1 ({0})) = 5, so folgte
Ja, man wähle die lineare Fortsetzung von σ mit σ (e1 ) = e2
mit der Dimensionsformel 11 = 5 + 7, ein Widerspruch.
und σ (e2 ) = 0.
S. 435
S. 423
Ja. Die Darstellungsmatrix ist dann eine Spalte, wenn man
Ja, beachte den Satz zur Komposition bijektiver Abbildungen
eine Abbildung vom eindimensionalen K-Vektorraum K in
auf Seite 49.
einen n-dimensionalen K-Vektorraum hat, z. B.
S. 423 ⎛ ⎞
v
Das Inverse ist ϕ −1 ◦ ψ −1 wegen ϕ −1 ◦ ψ −1 ◦ ψ ◦ ϕ = id = ⎜0 ⎟
ψ ◦ ϕ ◦ ϕ −1 ◦ ψ −1 . ⎜ ⎟
ϕ : v → ⎜ . ⎟ .
⎝ .. ⎠
S. 426 ' (
v 0
Es sei 1 ∈ R2 . Dann gilt:
v2 Und sie ist dann eine Zeile, wenn man eine Abbildung von
⎛⎛ ⎞⎞ einem n-dimensionalen K-Vektorraum in den eindimensio-
v1 − v2 ' (
v nalen K-Vektorraum K hat, z. B.
ϕ ⎝⎝ v2 ⎠⎠ = 1 , ⎛ ⎞
v2 v1
0
⎜ .. ⎟
ϕ : ⎝ . ⎠ → v1 .
somit gilt ϕ(R3 ) = R2 .
vn
S. 427
Im endlichdimensionalen Fall schon, als Maß scheint die Di- S. 435
mension zu dienen. Dass dem tatsächlich so ist, wird die Dort sind V = Kn , W = Km und B und C die jeweiligen
Dimensionsformel zeigen. Standardbasen.
Antworten der Selbstfragen 467

S. 437 S. 451
Der Kern ist der eindimensionale Untervektorraum -n. des Nein. E2 und −E2 sind invertierbar, die Summe aber nicht.
R3 , und das Bild ist die zweidimensionale Ebene E als Un-
tervektorraum des R3 . S. 451
Die dritte Zeile.
S. 437
Das bedeutet, dass C = B gilt. S. 451
An der Stelle (1, 2) – es geht aber auch die Stelle (3, 2).
S. 442
Wegen der obigen Isomorphie HomK (V , W ) ∼
= Km×n gilt S. 453
Weil P 2 bedeutet, dass zwei Mal vertauscht wird, damit wird
dim HomK (V , W ) = dim Km×n = m n = dim V dim W . die ursprüngliche Vertauschung gerade rückgängig gemacht.

S. 455
S. 443 Nur En selbst, da für jedes invertierbare S ∈ Kn×n gilt:
Nein. Es reicht A ∈ Km×n und B ∈ Kn×m .
S En S −1 = En .
S. 444
Weil sonst das Produkt nicht definiert ist.
S. 457
S. 446 ' ( ' ( ' ( Eine Matrix ist genau dann invertierbar, wenn die Spalten-
1 0 0 0 0 0 vektoren linear unabhängig sind. Damit hat man für die ers-
Nein, wir wählen A = ,B = und C = .
0 0 1 0 1 1 te Spalte die drei möglichen vom Nullvektor verschiedenen
Hiermit gilt Vektoren des Z22 zur Auswahl. Für die zweite Spalte hat man
jeweils noch zwei mögliche, von der ersten Spalte linear un-
A C = 0 = B C und A  = B . abhängige Vektoren zur Auswahl. Insgesamt erhält man die
angegebenen sechs Matrizen, die invertierbar sind.

S. 448 S. 460
Wegen Es ist
ϕA ◦ ϕB = ϕA B 
V → V ∗,
ist : λb b → λb b∗
−1 b∈B b∈B
ϕA B = ϕ(A B )−1 = ϕB −1 A−1 = ϕB −1 ◦ ϕA−1

die Umkehrabbildung. ein Isomorphismus.


Determinanten –
Kenngrößen von 13
Matrizen
Wie lautet die Leibniz’sche
Formel?
Wie kann man entscheiden, ob
eine Matrix invertierbar ist?
Was ist eine Multilinearform?

13.1 Die Definition der Determinante . . . . . . . . . . . . . . . . . . . . . . . . . 470


13.2 Determinanten von Endomorphismen . . . . . . . . . . . . . . . . . . . . . 475
13.3 Berechnung der Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . 476
13.4 Anwendungen der Determinante . . . . . . . . . . . . . . . . . . . . . . . . . 483
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
470 13 Determinanten – Kenngrößen von Matrizen

Zu jeder quadratischen Matrix A über einem Körper K gibt es Die Elemente aus Sn sind die Permutationen
eine Kenngröße – ihre Determinante. Diese Zahl aus K gibt der Zahlen 1, . . . , n
Aufschluss über Eigenschaften der Matrix. So ist etwa eine
Matrix A genau dann invertierbar, wenn ihre Determinante von Wir erinnern kurz an die symmetrische Gruppe (Sn , ◦) aller
null verschieden ist. Und genau diese Eigenschaft ist es, welche Bijektionen der endlichen Menge
die Determinante so wertvoll macht.
In = {1, . . . , n} ⊆ N
Die Determinante hat viele weitere Anwendungen. Mit ihrer
Hilfe kann man lineare Gleichungssysteme lösen, das Inverse (siehe Seite 67). Die Menge Sn ist gegeben durch:
einer Matrix bilden, n-dimensionale Volumina berechnen, und
selbst beim Interpolationsproblem liefert sie eine Existenz- und Sn = {σ : In → In | σ ist bijektiv} .
Eindeutigkeitsaussage. Aber tatsächlich sind diese Anwendun-
gen im Allgemeinen mit effizienteren Methoden realisierbar. Der Die Elemente von Sn nennt man Permutationen. Die Ver-
Nutzen der Determinante innerhalb der linearen Algebra liegt im knüpfung ◦ der Gruppe Sn ist die Hintereinanderausführung
Wesentlichen in der Bestimmung der Eigenwerte einer Matrix – der Permutationen
das ist ein Thema des nächsten Kapitels. Die Determinante wird 
uns auch in der Analysis wieder begegnen, sie ist etwa bei der In → In ,
τ ◦σ:
mehrdimensionalen Integration eine Art Skalierungsfaktor bei i → τ (σ (i)).
der Koordinatentransformation.
Wir definieren die Determinante durch eine explizite Formel Jede Permutation σ ∈ Sn lässt sich übersichtlich in der Form
– die sogenannten Leibniz’sche Formel. Diese Formel ist –
außer für die Fälle von zwei- und dreireihigen Matrizen – für σ : (1, 2, . . . , n) → (σ (1), σ (2), . . . , σ (n))
die Berechnung ungeeignet, da die Zahl der zu addierenden
darstellen. Links stehen die Elemente von In in der natürli-
Ausdrücke mit der Reihenzahl der Matrix enorm schnell wächst.
chen Reihenfolge und rechts die jeweiligen Bilder der Ele-
Wir leiten Methoden und Formeln her, die es gestatten, die
mente aus In unter der Bijektion σ , also alle n Elemente aus
Determinante einer n × n-Matrix für n ∈ N auf die Bestimmung
In in der durch σ festgelegten Reihenfolge.
der Determinanten einer Summe von (n−1)×(n−1) -Matrizen
zurückzuführen. So fortfahrend gelangen wir zu der Aufgabe, Weil σ eine Bijektion ist, hat man nach Festlegung von
Determinanten von möglicherweise zahlreichen 2 × 2-Matrizen σ (1) ∈ {1, . . . , n} für das Element σ (2) die n − 1 verschie-
zu berechnen. Durch trickreiches Rechnen bleibt die Bestimmung denen Möglichkeiten aus {1, . . . , n}\{σ (1)}. So fortfahrend
der Determinante auch einer großen Matrix übersichtlich. erkennt man:

Die Mächtigkeit der symmetrischen Gruppe


13.1 Die Definition der Die symmetrische Gruppe hat n ! Elemente, d. h.,

Determinante |Sn | = n !

Wir untersuchen quadratische Matrizen über einem Körper Beispiel


K genauer und ordnen jeder solchen quadratischen Matrix Die Elemente aus S2 sind
A ∈ Kn×n ein Element aus K zu – ihre sogenannte Deter-
minante det A. Diese Kenngröße det A gibt Aufschluss über id = σ1 : (1, 2) → (1, 2) , σ2 : (1, 2) → (2, 1) .
Eigenschaften der Matrix A. So ist etwa A genau dann in-
vertierbar, wenn det A  = 0 gilt. Es gilt:
Weil es für spätere Zwecke sinnvoll ist, führen wir Deter- σ2 ◦ σ2 : (1, 2) → (1, 2) , also σ2 ◦ σ2 = id .
minanten nicht nur für Matrizen über einem Körper K ein.
Wir behandeln etwas allgemeiner Matrizen über einem kom- Die Elemente aus S3 lauten
mutativen Ring R mit einem Einselement 1. Der Fall, dass
R sogar ein Körper ist, ist ein Spezialfall, da jeder Körper σ1 : (1, 2, 3) → (1, 2, 3) , σ2 : (1, 2, 3) → (2, 3, 1) ,
insbesondere ein kommutativer Ring ist. σ3 : (1, 2, 3) → (3, 1, 2) , σ4 : (1, 2, 3) → (3, 2, 1) ,
In diesem Kapitel bezeichne R stets einen kommutativen σ5 : (1, 2, 3) → (2, 1, 3) , σ6 : (1, 2, 3) → (1, 3, 2) .
Ring mit einem Einselement 1. Um ein konkretes Beispiel
vor Augen zu haben, kann man sich für R den Ring Z der Z. B. gilt:
ganzen Zahlen oder auch einen der vertrauten Körper R oder
σ4 (σ5 (1)) = σ4 (2) = 2 ,
C vorstellen. Wesentlich wird später das Beispiel R = K[X]
aus Kapitel 3 sein – der (kommutative) Polynomring über σ4 (σ5 (2)) = σ4 (1) = 3 ,
einem Körper K. σ4 (σ5 (3)) = σ4 (3) = 1 .
13.1 Die Definition der Determinante 471

Damit erhalten wir: Es ist (j, i) ein Fehlstand.


Jedes Paar (j, a) mit i + 1 ≤ a ≤ j − 1 ist ein Fehlstand.
σ4 ◦ σ5 : (1, 2, 3)  → (2, 3, 1) , also σ4 ◦ σ5 = σ2 . Jedes Paar (a, i) mit i + 1 ≤ a ≤ j − 1 ist ein Fehlstand.
Man beachte die Reihenfolge. Wir berechnen als weiteres Weitere Fehlstände gibt es nicht. Damit haben wir genau
Beispiel 2 (j − i − 1) + 1 Fehlstände. Folglich hat jede Transposi-
tion das Signum −1 – eine solche hat nämlich eine ungerade
σ2 ◦ σ3 : (1, 2, 3)  → (1, 2, 3) , also σ2 ◦ σ3 = σ1 .
Anzahl von Fehlständen.
Die Seite 66 zeigt übrigens die Gruppentafel von S3 . Die geraden Permutationen sind jene mit positivem Signum,
Die Menge S4 enthält bereits 4 ! = 24 Elemente.  wir schreiben
Auf Seite 73 haben wir jeder Permutation σ ∈ Sn das soge- An = {σ ∈ Sn | sgn(σ ) = +1}
nannte Signum zugeordnet,
 σ (j ) − σ (i) und nennen die Gruppe An die alternierende Gruppe vom
sgn σ = , Grad n.
j −i
i<j
?
und bereits gezeigt, dass die Abbildung Wieso ist An eine Gruppe?

sgn : Sn → {1, −1}


Die ungeraden Permutationen sind jene Permutationen mit
ein Homomorphismus ist, d. h.,
negativem Signum, es gilt
sgn(τ ◦ σ ) = sgn(τ ) · sgn(σ ) für alle τ, σ ∈ Sn .
Sn = An ∪ τ ◦ An

? für jede ungerade Permutation τ .


Warum gilt
sgn(σ −1 ) = sgn(σ )
Die Determinante einer Matrix A ist eine
für jedes σ ∈ Sn ?
Differenz von Summen von Produkten von
Einträgen von A
Beispiel Wir bestimmen das Signum einiger Elemente aus
Wir definieren die Determinante einer Matrix A = (aij ) ∈
S2 und S3 :
R n×n durch die sogenannte Leibniz’sche Formel:
2−1
σ : (1, 2) → (1, 2) ⇒ sgn = = 1,
2−1
1−2 Definition der Determinante
σ : (1, 2) → (2, 1) ⇒ sgn = = −1 ,
2−1
Für jede quadratische Matrix A ∈ R n×n mit Einträgen
3−1 2−1 2−3
σ : (1, 2, 3) → (1, 3, 2) ⇒ sgn = = −1, aus einem kommutativen Ring R heißt
2−1 3−1 3−2
3−2 1−2 1−3
σ : (1, 2, 3) → (2, 3, 1) ⇒ sgn = = 1. ! 
n
2−1 3−1 3−2
 det(A) = sgn(σ ) ai σ (i)
σ ∈Sn i=1

Wie auf Seite 73 gezeigt, kann man das Signum einer Permu- die Determinante von A.
tation σ ∈ Sn durch die Anzahl f der Fehlstände bestimmen.
Es gilt nämlich:
Anstelle von det(A) schreibt man auch etwas kürzer det A
sgn(σ ) = (−1)f . oder |A|.
Die Formel wirkt sehr kompliziert. Daher ist es angebracht,
Dabei spricht man vom Fehlstand (σ (i), σ (j )), wenn für das
auf die einzelnen Symbole und Details einzugehen:
Paar (i, j ) von Indizes aus In einerseits i < j und anderer-
seits σ (i) > σ (j ) gilt. Ist σ ∈ Sn , so ist σ (i) ∈ {1 . . . , n}, und ai σ (i) ist der
Eintrag an der Stelle (i, σ (i)) der Matrix A.
Eine Permutation aus Sn , die zwei verschiedene Zahlen i und
j aus In vertauscht und alle anderen Zahlen festlässt
n σ ∈ Sn , so wird bei den Faktoren des Produkts
Ist
i=1 ai σ (i) aus jeder Zeile der Matrix A genau ein Ele-
τ : (. . . , i − 1, i, i + 1, . . . , j − 1, j , j + 1, . . .)  → ment ausgewählt.
(. . . , i − 1, j , i + 1, . . . , j − 1, i, j + 1, . . .) Die Summe wird über alle möglichen Permutationen σ
der Menge In = {1, . . . , n} gebildet.
nennt man Transposition. Wir zählen die Fehlstände einer Wegen |Sn | = n ! besteht die Summe det(A) aus n ! Sum-
solchen Transposition: manden.
472 13 Determinanten – Kenngrößen von Matrizen

Bildet man die Summen über die geraden und ungeraden Formel kaum für Berechnungen der Determinanten mehrrei-
Permutationen getrennt, so erhält man higer Matrizen. Selbst Computer-Algebra-Systeme benutzen
andere Methoden.
! 
n ! 
n
det(A) = ai σ (i) − ai σ (i) .
σ ∈An i=1 σ ∈Sn \An i=1 Wie schon auf Seite 240 festgestellt, kann man sich die For-
Wenn wir die n ! Permutationen aus Sn durchnummerie- mel zur Berechnung der Determinante einer 2 × 2-Matrix
ren, leicht merken. Die Determinante ist die Differenz der Pro-
Sn = {σ1 , . . . , σn! } , dukte der Diagonalen, kurz Hauptdiagonale minus Neben-
diagonale:
so können wir die Summenformel für die Determinante
⎛ ⎞
auch wie folgt schreiben: ) ) + −
)a11 a12 )
) ) = ⎝ a11 a12 ⎠
!
n! 
n )a21 a22 )
a 21 a22
det(A) = sgn(σk ) ai σk (i)
k=1 i=1

n 
n
Auch die Formel zur Berechnung der Determinante einer
= sgn(σ1 ) ai σ1 (i) + · · · + sgn(σn! ) ai σn! (i)
3 × 3-Matrix kann man schematisch darstellen in der bereits
i=1 i=1
auf Seite 243 vorgestellten Regel von Sarrus:
= sgn(σ1 ) a1 σ1 (1) · · · an σ1 (n) + · · ·
⎛ ⎞
· · · + sgn(σn! ) a1 σn! (1) · · · an σn! (n) . ) )
) a11 a12 a13 ) +a13 +a11 +
a12
− −
a13 ⎟ a11

) ) ⎜
) a21 a22 a23 ) = ⎜ ⎟
) ) a23 ⎝ a21 a22 a23 ⎠ a21
Beispiel ) a31 a32 a33 )
Im Fall n = 1 gilt S1 = {id }, sodass wegen sgn(id ) = 1 a33 a31 a32 a33 a31
für jede Matrix A = (a11 ) ∈ R 1×1 gilt:

! 
1 Achtung: Für die Berechnung von 4- oder mehrreihigen
det(A) = sgn(σ ) ai σ (i) = 1 · a11 = a11 . Determinanten gibt es keine ähnlich einfachen Merkregeln.
σ ∈S1 i=1 Man berechnet 4- oder mehrreihige Determinanten mit Me-
thoden, die wir erst noch auf den folgenden Seiten entwickeln
Im Fall n = 2 gilt S2 = {id = σ1 , σ2 }, sodass wegen
werden.
sgn(σ1 ) = 1 und sgn(σ2 ) = −1 (siehe das Beispiel auf
Seite 470) für jede Matrix A = (aij ) ∈ R 2×2 gilt:
Beispiel
! 
1 Für die Einheitsmatrix E2 aus Z2×2 gilt:
det(A) = sgn(σ ) ai σ (i)
) )
σ ∈S2 i=1 )1 0))
det(E2 ) = )) = 1 · 1 − 0 · 0 = 1.
= 1 · a11 a22 + (−1) · a12 a21 0 1)
= a11 a22 − a12 a21 .
' (
2 3
Das stimmt überein mit der Definition auf Seite 240. Für die Matrix ∈ Z2×2
5 gilt:
1 4
Im Fall n = 3 gilt S3 = {σ1 , . . . σ6 } (wir verwenden
die Nummerierung aus dem Beispiel von Seite 470), so- ) )
)2 3))
dass wegen sgn(σ1 ) = 1, sgn(σ2 ) = 1, sgn(σ3 ) = 1, ) = 2 ·4−3·1 = 5 = 0.
)1 4)
sgn(σ4 ) = −1, sgn(σ5 ) = −1, sgn(σ6 ) = −1 für jede
Matrix A = (aij ) ∈ R 3×3 gilt: ' (
i −4
! 
n Für die Matrix ∈ C2×2 gilt:
0 −1
det(aij ) = sgn σ ai σ (i) =
σ ∈S3 i=1 ) )
) i −4)
) )
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 )0 −1) = i · (−1) − (−4) · 0 = −i .
− (a13 a22 a31 + a23 a32 a11 + a33 a12 a21 ) .

Dieser Sonderfall der allgemeinen Determinantenformel Für die Einheitsmatrix E3 aus Z3×3 gilt:
wurde auf Seite 243 bereits vorweggenommen. 
) )
)1 0 0 )
) )
Kommentar: Bereits bei n = 4 besteht die Formel aus det(E3 ) = ))0 1 0)) = 1 · 1 · 1 + 0 · 0 · 0 + 0 · 0 · 0
)0 0 1)
4 ! = 24 Summanden, und jeder Summand enthält vier Fak-
toren. Wegen des hohen Rechenaufwands eignet sich diese − (0 · 1 · 0 + 0 · 0 · 1 + 1 · 0 · 0) = 1 .
13.1 Die Definition der Determinante 473

⎛ ⎞
1 4 6 Beweis: Wir setzen A0 in die Definition der Determinante
Für die Matrix ⎝0 2 5⎠ ∈ R3×3 gilt: ein und beachten, dass das Transponieren das Vertauschen
0 0 3 von Zeilen- und Spaltenindex ist:
) )
)1 4 6) ! 
n
) ) det(A0 ) =
)0 2 5) = 1 · 2 · 3 + 4 · 5 · 0 + 6 · 0 · 0 sgn(σ ) aσ (i) i .
) )
)0 0 3) σ ∈Sn i=1

− (6 · 2 · 0 + 5 · 0 · 1 + 3 · 4 · 0) = 6 . Nun beachten wir, dass ni=1 aσ (i) i = ni=1 ai σ −1 (i) gilt,


⎛ ⎞ da aσ (i) i = aj σ −1 (j ) für σ (i) = j , d. h., dass die Produkte
2 −3 4 über die gleichen Faktoren gebildet werden, nur sind diese
Für die Matrix ⎝−4 6 4 ⎠ ∈ R3×3 gilt: einmal nach den Spaltenindizes geordnet und das andere Mal
0 0 12 nach den Zeilenindizes. Aus obiger Gleichung erhalten wir
) )
) 2 −3 4 ) ! 
n ! 
n
) ) sgn(σ ) aσ (i) i = sgn(σ ) ai σ −1 (i) .
)−4 6 4 ) = 2 · 6 · 12 + (−3) · 4 · 0 + 4 · (−4) · 0
) ) σ ∈Sn σ ∈Sn
) 0 0 12) i=1 i=1

− (4 · 6 · 0 + 4 · 0 · 2 + 12 · (−3) · (−4)) = 0 .  Die Summe wird über alle σ ∈ Sn gebildet. Da mit σ auch
σ −1 die Gruppe Sn durchläuft und sgn(σ ) = sgn(σ −1 ) gilt,
erhalten wir weiter
? ! 
n ! 
n
Gibt es für obere und untere 3 × 3-Dreiecksmatrizen, also für sgn(σ ) ai σ −1 (i) = sgn(σ −1 ) ai σ −1 (i) .
Matrizen der Form
σ ∈Sn i=1 σ −1 ∈Sn i=1
⎛ ⎞ ⎛ ⎞
∗ ∗ ∗ ∗ 0 0
⎝0 ∗ ∗⎠ und ⎝∗ ∗ 0⎠ Nun benennen wir den Summationsindex um,
0 0 ∗ ∗ ∗ ∗ ! 
n ! 
n
sgn(σ −1 ) ai σ −1 (i) = sgn(τ ) ai τ (i) .
eine einfache Formel zur Berechnung der Determinante? σ −1 ∈S n i=1 τ ∈Sn i=1

Der letzte Ausdruck ist die Leibniz’sche Formel für die De-
Ist A = (aij ) ∈ R n×n eine Diagonalmatrix, also aij = 0 terminante von A:
für alle i = j , so liefert die Leibniz’sche Formel ! 
n
nur höchstens

einen von null verschiedenen Summanden sgn(τ ) ai τ (i) = det(A) .
sgn(σ ) ni=1 ai σ (i) , nämlich jenen mit σ (i) = i , also τ ∈Sn i=1
σ = idIn . Damit ist die Determinante einer Diagonalmatrix
gleich dem Produkt der Diagonalelemente Damit ist det(A0 ) = det(A) begründet. 

det (diag(a11 , . . . , ann )) = a11 a22 . . . ann .

Insbesondere ist det(En ) = 1 . Vertauscht man zwei Zeilen oder Spalten, so


wird die Determinante negativ
Die Determinante einer Matrix ändert sich In den weiteren Beweisen werden wir gelegentlich vor dem
nicht durch Transponieren folgenden Problem stehen: Wir kennen die Determinante
einer Matrix A ∈ R n×n . Und nun permutieren wir die Spal-
Es wird sich als sehr nützlich erweisen, dass die Determi- ten von A und erhalten dadurch eine Matrix B, z. B.:
nante einer Matrix sich nicht durch das Transponieren ändert,
det(A) = det(A0 ). Da beim Transponieren aus den Zeilen A = (s 1 , s 2 , . . . , s n ) −→ B = (s 4 , s n , . . . , s 1 ) .
Spalten und aus den Spalten Zeilen werden, erschlagen wir
Was ist die Determinante von B? Zu dieser Vertauschung von
dadurch zwei Fliegen mit einer Klappe: Aussagen über die
Spalten gehört genau eine Permutation σ ∈ Sn der Zahlen
Determinante, die für die Zeilen einer Matrix gelten, gelten
{1, . . . , n}, es ist
dann automatisch auch für die Spalten der Matrix, wir mer-
ken uns: B = (s σ (1) , . . . , s σ (n) ) .

Die Determinante einer transponierten Matrix Wir zeigen nun det(B) = sgn(σ ) det(A):
Für jede quadratische Matrix A ∈ R n×n gilt:
Lemma
det(A) = det(A ) . 0 Gegeben seien eine Matrix A = (aij ) ∈ R n×n und
eine Permutation σ ∈ Sn . Dann gilt für die Determinante
474 13 Determinanten – Kenngrößen von Matrizen

der Matrizen B = (bij ) mit bij = ai σ (j ) und C = (cij ) mit Und hieraus, so könnte man meinen, kann man det(A) = 0
cij = aσ (i) j : folgern. Tatsächlich geht das aber nur, falls 1 = −1 in R
gilt. Den Fall eines Rings mit 1 = −1 hat man dann aber
det(B) = sgn(σ ) det(A) , nicht berücksichtigt. Wir führen nun einen Beweis, der auch
det(C) = sgn(σ ) det(A) . diesen Fall einschließt.

Man beachte, dass die Matrix B aus der Matrix A durch Ver- Beweis: Wir begründen die Behauptung nur für zwei glei-
tauschen von Spalten gemäß der Permutation σ hervorgeht, che Spalten einer Matrix A = (aij )i,j ∈ R n×n . Durch Über-
die Matrix C wird analog aus A durch Vertauschen von Zei- gang zum Transponierten A0 erhält man die Behauptung
len gebildet. dann für die Zeilen.
Bei der Matrix A seien die k-te und j -te Spalte gleich, d. h.
Beweis: Wir bestimmen die Determinante der Matrix B aij = aik für j = k und i = 1, . . . , n. Mit τ bezeichnen wir
mit der Leibniz’schen Formel. Dabei benutzen wir ähnliche die Transposition aus Sn , die die Zahlen j und k vertauscht,
Schlüsse wie im letzten Beweis: τ (j ) = k, τ (k) = j und τ (i) = i für alle i ∈ {1, . . . , n} \
{j, k}. Es gilt sgn(τ ) = −1. Es ist dann Sn die disjunkte
! 
n
det(B) = sgn(τ ) bi τ (i) Vereinigung von An = {σ ∈ Sn | sgn(σ ) = 1} und τ ◦ An :
τ ∈Sn i=1 Sn = An ∪ τ ◦ An .
! n
= sgn(τ ) ai σ (τ (i)) Wegen ai l = ai τ (l) für alle i, l ∈ {1, . . . , n} gilt nun mit
τ ∈Sn i=1 der Leibniz’schen Formel
 
ρ:=σ ◦τ ! 
n ! n n
= sgn(σ −1 ◦ ρ) ai ρ(i) det(A) = sgn(σ ) ai σ (i) + sgn(τ ◦ σ ) ai τ (σ (i))
ρ∈Sn i=1 σ ∈An i=1 i=1
 
! 
n ! n 
n
−1 = ai σ (i) − = 0.
= sgn(σ ) sgn(ρ) ai ρ(i) sgn(σ ) ai τ (σ (i))
ρ∈Sn i=1 σ ∈An i=1 i=1
! n
Das ist die Behauptung. 
= sgn(σ −1 ) sgn(ρ) ai ρ(i)
ρ∈Sn i=1

= sgn(σ −1
) det(A) Die Determinante eines Produkts von
= sgn(σ ) det(A) . Matrizen ist das Produkt der Determinanten

Wegen det(A) = det(A0 ) gilt die Aussage ebenso für die Wir stehen immer noch vor dem großen Problem, die De-
Zeilen.  terminante einer großen Matrix auszurechnen. Wenn wir er-
kennen, dass zwei Zeilen oder Spalten gleich sind, so sind
wir mit dem letzten Ergebnis einen Schritt weiter, die Deter-
Dieses Lemma wird uns mehrfach von großem Nutzen sein.
minante ist dann null. Aber das sind natürlich sehr spezielle
Wir untersuchen den speziellen Fall einer Transposition
Matrizen. Der sogenannte Determinantenmultiplikationssatz
τ ∈ Sn . Weil eine Transposition τ aus Sn nur zwei der Zah-
wird uns ein ganz wichtiges Hilfsmittel bei der Berechnung
len {1, . . . , n} vertauscht und alle anderen festlässt und das
der Determinante allgemeiner Matrizen sein. Der Satz hat
Signum einer Transposition −1 ist, liefert das obige Lemma
neben der Berechnung von Determinanten auch wesentliche
die erste der folgenden beiden Regeln:
theoretische Bedeutung.

Regeln für die Determinante Determinantenmultiplikationssatz


Entsteht die Matrix B aus der Matrix A ∈ R n×n Sind A, B ∈ R n×n , so gilt:
durch Vertauschen zweier Zeilen oder Spalten, so gilt
det(B) = − det(A). det(A B) = det(A) det(B).
Hat eine Matrix A ∈ R n×n zwei gleiche Zeilen oder
Spalten, so ist ihre Determinante null. Die Determinante eines Produkts von Matrizen ist das
Produkt der Determinanten.
Der Beweis der zweiten Aussage scheint mithilfe der ersten
Aussage sehr einfach zu sein: Hat die Matrix A etwa zwei
Beweis: Die Einträge der Matrizen A, B und A B seien
gleiche Spalten, so gilt nach Vertauschen dieser beiden Spal-
ten nach der ersten Aussage: !
n
A = (aij ) , B = (bij ) , A B = (cij ) mit cij = aik bkj .
det(A) = − det(A) . k=1
13.2 Determinanten von Endomorphismen 475

Nun setzen wir das Produkt A B in die Leibniz’sche Formel Durch mehrfaches Anwenden des Determinantenmultiplika-
für die Determinante ein und zeigen durch einige Umformun- tionssatzes erhalten wir:
gen, dass dies genau die Formel für das Produkt der Deter-
minanten von A und B ist. Unterhalb der Rechnung erfolgen Folgerung
kurze Erläuterungen zu den benutzten Umformungen: Für jede Matrix A ∈ R n×n und jedes k ∈ N gilt:

(i) ! 
n
det(Ak ) = (det A)k .
det(A B) = sgn(σ ) ci σ (i)
σ ∈Sn i=1
 n  Ist R = K ein Körper, so folgt insbesondere aus Ak = 0
(ii) ! n ! sofort det A = 0, weil ein Produkt von Körperelementen nur
= sgn(σ ) ai k bk σ (i)
dann 0 ist, wenn einer der Faktoren 0 ist.
σ ∈Sn i=1 k=1

(iii) ! !
n 
n
  Beispiel Für die Matrix
= sgn(σ ) ai ki bki σ (i)
⎛ ⎞
σ ∈Sn k1 ,...,kn =1 i=1 0 1 1 0
!n ! n 
n ⎜−1 2 0 1⎟
(iv) M=⎜ ⎝−1 0
⎟ ∈ R4×4
= sgn(σ ) ai ki bkj σ (j ) −2 1⎠
k1 ,...,kn =1 σ ∈Sn i=1 j =1 0 −1 −1 0
(v) ! n  n ! n
= ai ki sgn(σ ) bkj σ (j ) gilt M 3 = 0, also folgt det M = 0. 
k1 ,...,kn =1 i=1 σ ∈Sn j =1
Ist die Matrix A ∈ R n×n invertierbar, so folgt aus
(vi) ! n n
= ai ki det((bkj l )j,l=1,...,n )
A A−1 = En
k1 ,...,kn =1 i=1

(vii) ! n mit dem Determinantenmultiplikationssatz durch Anwenden


= ai τ (i) det((bτ (j ) l )j,l=1,...,n ) der Determinante:
τ ∈Sn i=1
det(A) det(A−1 ) = det(En ) = 1 ,
(viii) ! 
n
= sgn(τ ) ai τ (i) det(B)
da En eine Diagonalmatrix ist (Seite 473). Damit ist gezeigt:
τ ∈Sn i=1
(ix) Folgerung
= det(A) det(B) .
Ist A ∈ R n×n invertierbar, so ist det(A) ∈ R inver-
(i) Einsetzen von A B = (cij ) in die Leibniz’sche Formel. tierbar, und es gilt:
(ii) Einsetzen der Darstellung der cij (siehe oben).

det(A−1 ) = (det A)−1 .
(iii) Ausmultiplizieren des Produkts ni=1 Ai mit Ai =
n
k=1 ai k bk σ (i) . ?
(iv) Ändern der Reihenfolge der Summen- und Produktbil- Gilt für alle A, B ∈ Rn×n auch det(A+B) = det A+det B ?
dung.

(v) Da ni=1 ai ki unabhängig



n von σ ∈ Sn ist, können wir
σ ∈Sn sgn(σ ) und i=1 ai ki vertauschen.
13.2 Determinanten von
(vi) Der hintere Teil der Formel ist die Leibniz’sche Formel
für det((bkj l )j,l=1,...,n ). Endomorphismen
(vii) Wegen der zweiten Determinantenregel von Seite 474
gilt det((bkj l )j,l=1,...,n ) = 0, falls k1 , . . . , kn nicht vonein- Wir haben Determinanten für quadratische Matrizen defi-
ander verschieden sind. Daher müssen wir bei der Summe niert. Man kann aber auch einem Endomorphismus eine De-
n terminante zuordnen.
k1 ,...,kn =1 nur diejenigen k1 , . . . , kn berücksichtigen, die
voneinander verschieden sind. Die Zahlen k1 , . . . , kn sind
dann alle Zahlen von 1 bis n. Daher erhalten wir durch die
Die Determinante eines Endomorphismus ist
Festlegung τ (i) = ki eine Permutation τ ∈ Sn .
die Determinante einer und damit jeder
(viii) Die Matrix (bτ (j ) l )j,l=1,...,n geht aus der Matrix B
Darstellungsmatrix des Endomorphismus
durch Vertauschen der Spalten gemäß der Permutation τ her-
vor. Daher können wir das Lemma auf Seite 473 anwenden:
Eine lineare Abbildung eines K-Vektorraums V in sich nennt
det((bτ (j ) l )j,l=1,...,n ) = sgn(τ ) det(B).
man auch Endomorphismus. Den Endomorphismen end-
(ix) Der vordere Teil der Formel ist die Leibniz’sche Formel lichdimensionaler K-Vektorräume kann man Determinanten
für det(A).  zuordnen.
476 13 Determinanten – Kenngrößen von Matrizen

Die Determinante eines Endomorphismus Determinantenmultiplikationssatz


Ist ϕ : V → V ein Endomorphismus eines n-dimensiona- Sind ϕ, ψ ∈ EndK (V ) Endomorphismen eines n-
len K-Vektorraums mit der Darstellungsmatrix B M(ϕ)B dimensionalen Vektorraums V , so gilt:
von ϕ bezüglich einer geordneten Basis B von V , so
nennt man det(ψ ◦ ϕ) = det(ψ) det(ϕ) .
det(ϕ) = det(B M(ϕ)B )
die Determinante von ϕ. Beweis: Die Behauptung folgt aus der Formel für die
Darstellungsmatrix eines Produkts von linearen Abbildungen
? von Seite 444 mit dem Determinantenmultiplikationssatz für
Sind die Darstellungsmatrizen von Endomorphismen stets Matrizen. Ist nämlich B irgendeine geordnete Basis von V,
quadratisch ? so gilt:

det(ψ ◦ ϕ) = det(B M(ψ ◦ ϕ)B )


Bei dieser Definition ist jedoch zu zeigen, dass sie unab- = det(B M(ψ)B B M(ϕ)B )
hängig von der Wahl der Basis B ist, d. h., ist C eine andere
= det(B M(ψ)B ) det(B M(ϕ)B )
geordnete Basis, so sollen die Determinanten der beiden Dar-
stellungsmatrizen von ϕ bezüglich B und C übereinstimmen; = det(ψ) det(ϕ) . 

die Definition wäre sonst nicht sinnvoll. Dass dies auch tat-
sächlich so ist, wollen wir nun nachweisen.
Sind B und C beliebige geordnete Basen des K-Vektorraums
V , so betrachten wir die beiden im Allgemeinen verschiede- 13.3 Berechnung der
nen Darstellungsmatrizen B M(ϕ)B und C M(ϕ)C . Nach der Determinante
Basistransformationsformel auf Seite 455 gibt es eine inver-
tierbare Matrix S mit
Determinanten von mehrreihigen Matrizen kann man mit der
C M(ϕ)C = S −1 B M(ϕ)B S . Leibniz’schen Formel kaum berechnen. Das ist zum Glück
auch gar nicht nötig. Wir zeigen, dass wir die Determinante
Und nun folgt mit dem Determinantenmultiplikationssatz einer n × n-Matrix rekursiv berechnen können: Die Berech-
(Seite 474): nung der Determinante einer n × n-Matrix wird auf die
Berechnung von n Determinanten von (n − 1) × (n − 1)-
det(C M(ϕ)C ) = det(S −1 B M(ϕ)B S)
Matrizen zurückgeführt. Das Bestimmen der Determinante
= det(S −1 ) det(B M(ϕ)B ) det(S) einer (n − 1) × (n − 1) -Matrix wird auf das Bestimmen von
= det(S)−1 det(S) det(B M(ϕ)B ) n − 1 Determinanten von (n − 2) × (n − 2) -Matrizen redu-
ziert. Das führen wir so lange fort, bis wir die Berechnung
= det(B M(ϕ)B ) . der Determinante einer n×n-Matrix auf das Problem zur Be-
stimmung von Determinanten von 1 × 1-Matrizen reduziert
Also ist die Determinante eines Endomorphismus tatsächlich haben.
unabhängig von der gewählten Basis bei der Darstellungsma-
trix. Beim tatsächlichen Berechnen von Determinanten werden
wir uns aber gewisser Tricks bedienen, die die Vielzahl der
Beispiel Die Spiegelung bei diesen Schritten entstehenden Matrizen begrenzt. Im All-
gemeinen wird man auch nicht bis zur kleinsten Einheit, also
⎧ 2
⎨ 'R ( → 'R2( bis zu 1×1-Matrizen, reduzieren. Vielfach sind schon Deter-
σ: v v2 minanten von 3 × 3-Matrizen einfach abzulesen, sodass das
⎩ 1 →
v2 v1 Verfahren zur Bestimmung der Determinante übersichtlich
bleibt.
an der Geraden R (e1 + e2 ) hat bezüglich der geordneten
' (
0 1
kanonischen Basis (e1 , e2 ) die Darstellungsmatrix .
1 0
Wegen Bei der Berechnung der Determinante kann
' (
0 1 man nach einer beliebigen Spalte oder Zeile
det = −1
1 0 entwickeln
gilt somit det(σ ) = −1. 
Für jede quadratische Matrix A ∈ R n×n und i, j ∈
Der Determinantenmultiplikationssatz für Endomorphismen {1, . . . , n} bezeichne Aij ∈ R (n−1)×(n−1) diejenige Matrix,
lautet: die aus A durch Entfernen der i-ten Zeile und j -ten Spalte
13.3 Berechnung der Determinante 477

entsteht. nach der ersten Spalte:


⎛ ⎞ ⎛ ⎞
a1i !
n
⎜ ⎟ ⎜ ⎟ det A = (−1)i+1 ai1 det(Ai1 )
⎜ .. ⎟ ⎜ ⎟
⎜ . ⎟ ⎜ ⎟ i=1
⎜ ⎟
A=⎜
⎜ aj 1 · · · aj i · · · aj n ⎟
⎟, Aj i = ⎜ ⎟ = a11 det(A11 ) − a21 det(A21 ) + a31 det(A31 ) + · · ·
⎜ ⎟ ⎜ ⎟
⎝ .. ⎠ ⎜ ⎟
. ⎝ ⎠
Die in der Summe auftauchenden ai1 sind die Komponenten
ani
der ersten Spalte.
Offenbar ist es besonders geschickt, wenn man nach einer
Beispiel Wir streichen aus der Matrix
⎛ ⎞ Zeile oder Spalte entwickelt, in der möglichst viele Nullen
1 2 3 4 stehen. Eine Matrix der Gestalt
⎜5 6 7 8⎟ ⎛ ⎞
A=⎜ ⎝4 3 2 1⎠
⎟ 4 2 −3 4
⎜ 5 6 1 4⎟
8 7 6 5 A=⎜ ⎝ 0 0 2 0⎠ ∈ R
⎟ 4×4

die zweite Zeile und dritte Spalte bzw. die dritte Zeile und −2 −2 3 6
zweite Spalte und erhalten
⎛ ⎞ ⎛ ⎞ wird man nach der dritten Zeile entwickeln wollen:
) )
1 2 4 1 3 4 ) 4 2 −3 4)
) )
A23 = ⎝4 3 1⎠ bzw. A32 = ⎝5 7 8⎠ .  ) 5 6 1 4)
8 7 5 8 6 5 det A = )) )
)
) 0 0 2 0)
)−2 −2 3 6)
Die folgende Methode zur Bestimmung der Determinante = (−1)1+3 · 0 · det(A13 )
wird auch der Entwicklungssatz von Laplace genannt – die
Berechnung der Determinante einer n × n-Matrixwird durch + (−1)2+3 · 0 · det(A23 )
Streichen von Zeilen und Spalten auf das Berechnen von n + (−1)3+3 · 2 · det(A33 )
Determinanten von (n−1)×(n−1)-Matrizen zurückgeführt.
+ (−1)4+3 · 0 · det(A43 )
) )
) 4 2 4)
Entwicklungssatz von Laplace ) )
= (−1)3+3 2 )) 5 6 4))
Für A = (aij ) ∈ R n×n und beliebige i, j ∈ {1, . . . , n} )−2 −2 6)
gilt:
Also gilt:
Entwicklung nach der i-ten Zeile ) )
)4 2 −3 4)) ) )
) ) 4 2 4)
!
n )5 6 1 4)) ) )
) = (−1)3+3 2 ) 5 6 4)
det A = (−1)i+j aij det Aij . )0 0 2 0)) ) )
) )−2 −2 6)
j =1 )−2 −2 3 6)
Entwicklung nach der j -ten Spalte Nun zum Beweis der Aussage, dass diese Entwicklung nach
!
n beliebigen Zeilen und Spalten funktioniert.
det A = (−1)i+j aij det Aij .
i=1 Beweis: Wegen det(A0 ) = det(A) reicht es aus, die Aus-
sage für die Entwicklung nach einer beliebigen Zeile zu be-
Bevor wir uns an den Beweis dieser Aussagen machen, er- weisen – die Entwicklung gilt nach Übergang zur Transpo-
läutern wir diese Entwicklung, wobei wir beachten, dass die nierten auch für beliebige Spalten. Es sei i ∈ {1, . . . , n} ein
Vorzeichen (−1)i+j schachbrettartig über der Matrix A ver- Zeilenindex der Matrix A.
teilt sind:
+ − + − ··· Die Einträge der Matrix A, deren Determinante wir bestim-
− + − + ··· men wollen, seien akl , d. h. A = (akl ). Wir benutzen die
+ − + − ··· Leibniz’sche Formel und fassen jeweils jene Permutationen
− + − + ··· σ zusammen, die den fest vorgegebenen Zeilenindex i auf
.. .. .. .. . . dieselbe Zahl j abbilden:
. . . . .
! 
n
Wir entwickeln die Determinante der Matrix det(A) = sgn(σ ) ak σ (k)
⎛ ⎞
a11 a12 · · · a1n σ ∈Sn k=1
⎜a21 a22 · · · a2n ⎟ ! n ! 
n
⎜ ⎟
A=⎜ . .. .. ⎟ ∈ R n×n = sgn(σ ) ak σ (k) aij .
⎝ .. . . ⎠
j =1 σ ∈Sn k=1
an1 an2 · · · ann σ (i)=j k=i
478 13 Determinanten – Kenngrößen von Matrizen

Wir zeigen nun für jedes j ∈ {1, . . . , n} die Gleichheit Spalten, so suche man nach der Zeile oder Spalte, in der die
meisten Nullen auftauchen und entwickle nach dieser. Sind
! 
n
keine oder nur wenige Nullen in der Matrix vorhanden, so
sgn(σ ) ak σ (k) = (−1)i+j det(Aij ) . (∗)
σ ∈Sn k=1
ist es oftmals sinnvoll, durch geschickte Zeilenumformungen
σ (i)=j k=i weitere Nullen zu erzeugen. Wie dies funktioniert, zeigen wir
nach den folgenden Beispielen.
Damit ist dann der Entwicklungssatz von Laplace bewiesen.
Für ein j ∈ {1, . . . , n} und den Zeilenindex i ∈ {1, . . . , n} Beispiel
betrachten wir zwei ganz bestimmte Permutationen σ1 und Für die Determinante der Matrix
⎛ ⎞
σ2 aus der symmetrischen Gruppe Sn : 1 0 2 0
⎜1 0 3 0⎟
σ1 : ( . . . , i − 1, i + 1, . . . , n − 1, n )  → A=⎜ ⎝−1 2 3

i, 4⎠
( . . . , i − 1, i + 1, i + 2, . . . , n, i ), 2 0 5 1
σ2 : ( . . . , j − 1, j, j + 1, . . . , n − 1, n )  →
erhalten wir nach Entwickeln nach der zweiten Spalte
( . . . , j − 1, j + 1, j + 2, . . . , n, j ). ) )
) 1 0 2 0) ) )
) ) )1 2 0 )
Durch Zählen der Fehlstände erhalten wir ) 1 0 3 0) ) )
det A = )) ) = (−1)3+2 2 )1 3 0)
) ) )
sgn(σ1 ) = (−1)n−i und sgn(σ2 ) = (−1)n−j . )−1 2 3 4) )2 5 1)
) 2 0 5 1)

Wir setzen Nun entwickeln wir weiter nach der dritten Spalte und
bkl = aσ1 (k) σ2 (l) erhalten
) )
)1 2 0 ) ) )
und erhalten wegen der obigen Wahl von i (die i-te Zeile wird ) ) )1 2))
übersprungen) und von j (die j -te Spalte wird übersprungen) det A = (−2) ))1 3 0)) = (−2) · (−1)3+3 )) = −2 .
)2 5 1) 1 3)
die Matrix
Aij = (bkl )k,l=1,...,n−1 . Die Determinante der Nullmatrix 0 ist null.
Für jede Permutation σ ∈ Sn gilt: Für die Einheitsmatrix En ∈ Kn×n gilt in Übereinstim-
mung mit Seite 473:
σ (i) = j ⇔ σ2−1 ◦ σ ◦ σ1 (n) = n ) )
)1 · · · 0 )
) )
⇔ σ2−1 ◦ σ ◦ σ1 |{1,...,n−1} ∈ Sn−1 . ) )
det En = ) ... . . . ... ) = 1 det En−1
) )
)0 · · · 1)
Also gilt:
= 12 det En−2
! 
n
sgn(σ ) ak σ (k) = · · · = 1n−1 det E1
σ ∈Sn
σ (i)=j
k=1
k=i
= 1.
⎛ ⎞
! 
n 4 3 2 1
= sgn(σ2 ◦ τ ◦ σ1−1 ) ak σ −1 . ⎜3 2 1 4 ⎟
τ ∈Sn−1 k=1
2 (τ (σ1 (k)))
Für die Matrix A = ⎜ ⎟
⎝2 1 4 3⎠ ∈ R
4×4 gilt:
k=i
1 4 3 2
In diesem letzten Ausdruck setzen wir l = σ1−1 (k), d. h., )
)2 1 4)
) )
)3
)
) ) ) 2 1))
σ1 (l) = k, und erhalten wegen der Homomorphie des Sig-
det A =(−1)1+1 4 ))1 4 3)) + (−1)1+2 3 ))1 4 3))
nums nach Seite 73, also wegen der Multiplikativität von sgn, )4 3 2 ) )4 3 2)
und wegen sgn(σ1−1 ) = sgn(σ1 ): ) ) ) )
)3 2 1) )3 2 1))
) ) )
! 
n−1 +(−1)1+3 2 ))2 1 4)) + (−1)1+4 1 ))2 1 4))
sgn(σ2 ) sgn(σ1 ) sgn(τ ) aσ1 (l) σ2 (τ (l)) )4 3 2 ) )1 4 3)

τ ∈Sn−1 l=1
=bl τ (l) So bleiben also vier Determinanten von 3 × 3-Matrizen
= (−1)n−j (−1)n−i det(Aij ) = (−1)i+j det(Aij ) .
zu bestimmen. ⎛ ⎞
2 −3 4
Für die Matrix A = ⎝−4 6 4 ⎠ ∈ R3×3 gilt:
Damit ist die Gleichheit in (∗) gezeigt und die Behauptung
0 0 12
bewiesen. 
) )
) 2 −3 4 ) ) )
) ) ) )
)−4 6 4 ) = (−1)3+3 12 ) 2 −3) = 0
Diese Entwicklung der Determinante nach einer Zeile oder ) ) )−4 6 )
) 0 0 12)
Spalte ist das wesentliche Hilfsmittel zur Berechnung der De-
terminante. Hat man eine Matrix mit mehr als drei Zeilen und (vgl. das Beispiel auf Seite 473). 
13.3 Berechnung der Determinante 479

Man nennt eine Matrix A ∈ R n×n eine obere Dreiecks-


(b) Entsteht A aus A durch Addition eines Vielfachen
matrix, wenn alle Einträge aij von A unter der Hauptdiago-
einer Zeile (bzw. Spalte) zu einer anderen, so gilt
nalen null sind, d. h., aij = 0 für alle (i, j ) mit j < i. Analog
det A = det A.
nennt man A eine untere Dreiecksmatrix, falls alle Einträge
(c) Entsteht A aus A durch Multiplikation einer Zeile
oberhalb der Hauptdiagonalen null sind, d. h. aij = 0 für alle
oder Spalte mit einem Element λ ∈ R, so gilt
(i, j ) mit j > i. Durch sukzessive Entwicklung der Deter-
det A = λ det A.
minante nach der ersten Spalte einer oberen Dreiecksmatrix
bzw. nach der ersten Zeile einer unteren Dreiecksmatrix er-
halten wir: Beweis: Wir begründen die Regeln für die Zeilenumfor-
mungen. Wegen det(A) = det(A0 ) gelten die Regeln dann
Die Determinante einer Dreiecksmatrix auch für die Spaltenumformungen. Die Aussage (a) haben
wir bereits auf Seite 474 begründet, wir zeigen diese Aus-
⎛ ⎞ sage erneut mit anderen Methoden.
a11 ∗ . . . ∗
⎜ . .. ⎟ Nach dem Abschnitt auf Seite 451 entspricht jeder elementa-
⎜ 0 a22 . . . ⎟ 
n
det ⎜
⎜ . . .
⎟=
⎟ aii , ren Zeilenumformung eine Multiplikation einer Elementar-
⎝ .. . . . . ∗ ⎠ i=1 matrix von links.
0 ... 0 ann So werden die i-te und j -te Zeile der Matrix A vertauscht,
⎛ ⎞ indem man A von links mit der Permutationsmatrix P ij
a11 0 . . . 0
⎜ . .. ⎟

n (Seite 451) multipliziert. Es gilt:
⎜ ∗ a22 . . . ⎟
det ⎜
⎜ . . .
⎟=
⎟ aii .
⎝ .. . . . . A = P ij A .
0 ⎠ i=1
∗ ... ∗ ann Wegen det(P ij ) = −1 folgt die Aussage (a) mit dem Deter-
minantenmultiplikationssatz von Seite 474.
Die Determinante ist das Produkt der Diagonalele-
mente. Die Addition des λ-Fachen der i-ten Zeile zur j -ten Zeile
geschieht durch Multiplikation der Matrix A mit der Matrix
N ij (λ) (Seite 451). Es gilt:
Die Eigenschaften der Determinante
ermöglichen es, ihre Berechnung zu A = N ij (λ) A .
vereinfachen Wegen det(N ij (λ)) = 1 folgt die Aussage (b) mit dem De-
terminantenmultiplikationssatz.
Die Berechnung der Determinante einer Matrix A = (aij )
wird dann einfacher, wenn in einer Spalte oder Zeile von A Die Multiplikation der i-ten Zeile mit λ geschieht durch Mul-
zahlreiche Nullen stehen. Stehen etwa unterhalb von a11 nur tiplikation der Matrix A mit der Matrix D i (λ) (Seite 451).
Nullen, so ist die Determinante einer n×n-Matrix gleich dem Es gilt:
Produkt von a11 mit der Determinante der (n − 1) × (n − 1)- A = D i (λ) A .
Matrix A11 : Wegen det(D i (λ)) = λ folgt auch die Aussage (c) mit dem
) )
)a11 a12 · · · a1n ) ) ) Determinantenmultiplikationssatz. 
) ) )a22 · · · a2n )
) 0 a22 · · · a2n ) ) )
) ) ) . .. )
) .. .. ) = a11 ) .. . )
) . ··· . )) ) )
) )a · · · ann ) Achtung: Für Matrizen A ∈ R n×n und λ ∈ R ist
) 0 a ··· a ) n2
n2 nn
det(λA) = λn det(A),
Bei der Lösung von linearen Gleichungssystemen haben wir
durch elementare Zeilenumformungen Nullen in einer Ma- nachdem jede Zeile von A mit λ zu multiplizieren ist, wenn
trix erzeugt. Dabei wird natürlich die Matrix verändert. Die man λA berechnet.
Frage ist, ob und wenn ja, wie sich bei solchen elementaren
Umformungen die Determinante ändert. Mithilfe dieser Regeln kann man oft leicht Nullen in den
Zeilen und Spalten auch von großen Matrizen erzeugen. Ent-
Die Determinante nach elementaren Zeilen-/Spalten- wickelt man dann nach den Zeilen oder Spalten, in denen fast
umformungen nur Nullen stehen, so bleibt das Verfahren zur Berechnung der
Für jede Matrix A ∈ R n×n und λ ∈ R gilt: Determinante übersichtlich. Man darf dabei Spalten- und Zei-
(a) Entsteht A aus A durch Vertauschen zweier Zeilen lenumformungen abwechseln, man muss nur aufpassen, dass
(bzw. Spalten), so gilt det A = − det A. man bei Vertauschungen den Vorzeichenwechsel berücksich-
tigt. Es folgen Beispiele.
480 13 Determinanten – Kenngrößen von Matrizen

Beispiel: Bestimmung von Determinanten


Wir berechnen die Determinanten der Matrizen
⎛ ⎞
⎛ ⎞ 3 0 0 0 0 2
3 1 3 0 ⎜0 3 0 0 2 0⎟
⎜ ⎟
⎜2 4 1 2⎟ ⎜ 0⎟
A=⎜ ⎟ , B = ⎜0 0 3 2 0 ⎟
⎝1 0 0 −1 ⎠ ⎜0 0 2 3 0 0⎟
⎜ ⎟
4 2 −1 1 ⎝0 2 0 0 3 0⎠
2 0 0 0 0 3

Problemanalyse und Strategie: Man entwickelt vorzugsweise nach Zeilen bzw. Spalten, in denen bereits viele Nullen
stehen. Eventuell erzeugen wir uns durch geschickte Zeilen- bzw. Spaltenumformungen zuerst Nullen.

Lösung: neten Zeilen bzw. Spalten:


Wir bestimmen die Determinante der Matrix A, indem wir ) )
)3 0 0 0 2))
0
zuerst zur letzten Spalte die erste addieren – dies ändert )
)0 3 0 2 0))
0
die Determinante von A nicht – und dann nach der dritten )
)0 0 3 0 0))
2
Zeile entwickeln: det B = ))
)0 0 2 0 0))
3
)0 3 0))
) ) ) ) ) 2 0 0
)3 1 0 )) ))3 1
3 3 3)) )2 0) 3)
) 0 0 0 )
)2 4 2 )) ))2 4
1 1 4)) )3 0 0 2 0 )
det A = )) = ) )
)1 0 −1)) ))1 0
0 0 0)) )0 3 2 0 0)
)4 ) )
2 1 ) )4 2
−1 −1 5) = (−1) 1+1 3 ))0 2 3 0 0))
) ) )2 0 0 3 0 )
) 1 3 3) ) )
) ) )0 0 0 0 3)
= (−1)1+3 1 ))4 1 4)) ) )
)2 −1 5) )0 3 0 0 2 )
) )
)0 0 3 2 0 )
) )
+ (−1)1+6 2 ))0 0 2 3 0))
Wir führen die Rechnung fort: Mithilfe der Eins an der ) 0 2 0 0 3)
) )
Stelle (1, 1) der verbleibenden 3 × 3-Matrix erzeugen wir ) )
) 2 0 0) 0 0
Nullen an den Stellen (2, 1) und (3, 1) und entwickeln )3 0 0 2 )
) )
schließlich nach der ersten Spalte: )0 3 2 0)
= (32 − 22 ) )) )
)
)0 2 3 0)
) ) ) ) )2 0 0 3 )
)1 3 3) )1 3 3 ) ) )
) ) ) ) B )3 2 0 )
det A = ))4 1 4)) = ))0 −11 −8)) ) )
= (32 − 22 ) (−1)1+1 3 ))2 3 0))
)2 −1 5) )0 −7 −1) ) )
) ) ) ) ) ) 0 0 3
)−11 −8) )
2 )11 8)
) )0 3 2 ) C
=) ) ) = (−1) ) = −45 . ) )
−7 −1) 7 1) + (−1)1+4 2 ))0 2 3))
) )
) 2 )0 0
) 3 2 )
Wir bestimmen nun det B. = (32 − 22 )2 )) )) = (32 − 22 )3 = 125.
2 3
Wir berechnen die Determinante der Matrix B mittels Ent-
wicklung nach den jeweils mit blauen Ziffern eingezeich- Also gilt det B = 125.

Beispiel Zeile das 2-Fache der ersten Zeile addieren:


Wir betrachten die reelle Matrix ) ) ) )
) 1 3 6 ) )1 3 6 )
⎛ ⎞ ) ) ) )
1 3 6 det(A) = )) 4 8 −12)) = ))0 −4 −36))
A = ⎝ 4 8 −12⎠ ∈ R3×3 . )−2 0 −3 ) )0 6 9 )
−2 0 −3
Nun entwickeln wir nach der ersten Spalte:
Wegen der zweiten Determinantenregel ändert sich die ) )
Determinante von A nicht, wenn wir zur zweiten Zeile )−4 −36)
det A = 1 )) ) = 180 .
von A das (−4)-Fache der ersten Zeile und zur dritten 6 9 )
13.3 Berechnung der Determinante 481

Nun bestimmen wir die Determinante der reellen Matrix wobei 0 ∈ R (n−m)×m die Nullmatrix ist und A ∈ R m×m ,
⎛ ⎞ C ∈ R m×(n−m) , B ∈ R (n−m)×(n−m) sind.
4 3 2 1
⎜3 2 1 4 ⎟
A=⎜ ⎟ 4×4 Es gilt die nützliche Regel:
⎝2 1 4 3⎠ ∈ R .
1 4 3 2
Die Determinante von Blockdreiecksmatrizen
Wegen der zweiten Determinantenregel bleibt die Deter- Für alle quadratischen Matrizen A ∈ R s×s , B ∈ R r×r
minante unverändert, wenn wir zur ersten Zeile das (−4)- und passenden Matrizen 0, C gilt:
Fache der letzten Zeile, zur zweiten Zeile das (−3)-Fache ' ( ' (
der letzten Zeile und schließlich zur dritten Zeile das (−2)- A C A 0
det = det A det B = det
Fache der letzten Zeile addieren: 0 B C B
) ) ) )
)4 3 2 1) )0 −13 −10 −7)
) ) ) )
)3 2 1 4) )0 −10 −8 −2)
det(A) = )) )=)
) )
)
)
Beweis: Mit den Einheitsmatrizen Er und Es und den
)2 1 4 3) )0 −7 −2 −1) passenden Nullmatrizen gilt
) 1 4 3 2 ) )1 4 3 2)
' ( ' (' (
A C Es 0 A C
Damit erhalten wir nun nach Definition der Determi- =
0 B 0 B 0 Er
nante und dreimaligem Anwenden der dritten Regel mit
λ = −1: Wegen
) ) ) )
)−13 −10 −7) )13 10 7) ' ( ' (
) ) ) )
det A = (−1)4+1 ))−10 −8 −2)) = ))10 8 2)) Es 0 A C
det = det(B) und det = det(A)
) −7 −2 −1) ) 7 2 1) 0 B 0 Er

Wir wenden die erste Regel an, vertauschen die erste mit (man entwickle nach den ersten Spalten bzw. letzten Zei-
der dritten Spalte und beachten das Minuszeichen: len) folgt die Behauptung mit dem Determinantenmultiplika-
) ) tionssatz.
)7 10 13)
) )
det A = − ))2 8 10)) . Wegen det(M) = det(M 0 ) gilt die Formel auch für untere
)1 2 7 ) Blockdreiecksmatrizen. 

Nun wenden wir erneut die zweite Regel an und addieren


zur ersten Zeile das (−7)-Fache der letzten und zur zwei-
ten Zeile das (−2)-Fache der letzten Zeile – dies ändert Beim Berechnen der Determinante einer
die Determinante nicht:
) ) ) ) großen Matrix sollte man systematisch
)7 10 13) )0 −4 −36)
) ) ) ) vorgehen
det A = − ))2 8 10)) = − ))0 4 −4 ))
)1 2 7 ) )1 2 7 )
Die Determinante ist eine wichtige Kenngröße einer Ma-
Also erhalten wir nun: trix A. Sie zu bestimmen ist nicht immer einfach. Die Leib-
) ) niz’sche Formel, durch die sie definiert ist, eignet sich nicht
)−4 −36)
det A = −(−1)3+1 )) ) zur Berechnung von mehrreihigen Matrizen. Die wesent-
4 −4 ) lichen Hilfsmittel, die man zur Berechnung von Determinan-
= −((−4) · (−4) − (−36) · 4) = −160 .  ten solcher Matrizen hat, haben wir hergeleitet. Man sollte
zur Berechnung von det(A) wie folgt vorgehen:
? Hat die Matrix A linear abhängige Zeilen oder Spalten?
Sind die Zeilen oder Spalten einer quadratischen Matrix A Falls ja, so gilt det(A) = 0, falls dies nicht offensichtlich
über einem Körper K linear abhängig, so gilt det(A) = 0 – ist:
wieso? Hat A eine Blockdreiecksgestalt? Falls ja, so berechne die
Determinanten der Blöcke, falls nein:
Gibt es eine Zeile oder Spalte mit vielen Nullen? Falls ja,
entwickle nach dieser Zeile oder Spalte, falls nein:
Die Determinante einer Blockdreiecksmatrix Erzeuge durch elementare Zeilen- oder Spaltenumfor-
ist das Produkt der Determinanten der Blöcke mungen Nullen in einer Zeile oder Spalte und beginne
von vorne.
Wir betrachten eine Blockdreiecksmatrix, d. h. eine Matrix
der Form ' ( Wir stellen in der Übersicht auf Seite 482 alle wesentlichen
A C Regeln und Eigenschaften der Determinante von n × n-
M= ∈ R n×n ,
0 B Matrizen zusammen.
482 13 Determinanten – Kenngrößen von Matrizen

Übersicht: Eigenschaften der Determinante


Wir listen alle wesentlichen Eigenschaften der Determinante auf. Viele von ihnen haben wir bereits begründet.

Ist A eine Dreiecksmatrix oder eine Diagonalmatrix, Ist die Matrix A invertierbar, so ist die Determinante
also von der Form der inversen Matrix das Inverse der Determinante:
⎛a11 ∗ . . . ∗ ⎞ ⎛a11 0 . . . 0 ⎞
. . det(A−1 ) = (det A)−1 .
⎜0 a22 . . ⎟
.. . ⎜ ∗ a22 . . ⎟
.. .
⎜ ⎟ oder ⎜ ⎟
⎝ .. .. .. ⎠ ⎝ . . . ⎠
. . . ∗ .
.
.. ..
0 Ist die Koeffizientenmatrix A eines linearen Glei-
0 . . . 0 ann ∗ . . . ∗ ann chungssystems (A | b) quadratisch, so ist (A | b) genau
dann eindeutig lösbar, wenn det A = 0 gilt.
so ist die Determinante von A das Produkt der Diago-
Sind zwei Zeilen oder Spalten einer Matrix linear ab-
nalelemente
hängig, so ist ihre Determinante 0.
det A = a11 · · · ann . Hat die Matrix eine Nullzeile oder Nullspalte, so ist
ihre Determinante 0.
Die Determinante einer Matrix bleibt unverändert,
Die Determinante ändert ihr Vorzeichen beim Vertau- wenn man zu einer Zeile (bzw. Spalte) das Vielfache
schen zweier Zeilen oder Spalten. einer anderen Zeile (bzw. Spalte) addiert.
Die Determinante der Einheitsmatrix En ∈ R n×n ist 1: Die Determinante eines Produkts zweier quadratischer
Matrizen ist das Produkt der Determinanten der beiden
det En = 1.
Matrizen: Für alle A, B ∈ R n×n gilt:
Für jede Matrix A ∈ R n×n und λ ∈ R gilt:
det(A B) = det(A) det(B).
det(λ A) = λn det A ,
Für jede Matrix A ∈ R n×n und jede natürliche Zahl k
insbesondere det(−A) = (−1)n det A. gilt:
Die Determinante einer Matrix ändert sich nicht durch
det(Ak ) = (det A)k .
das Transponieren:
Für eine invertierbare Matrix S ∈ R n×n und jede Ma-
det A = det A0 .
trix A ∈ R n×n gilt:
Eine Matrix A ist genau dann invertierbar, wenn ihre
Determinante von null verschieden ist. det(S −1 A S) = A.

Wir haben die Determinante einer Matrix durch die Leib-


(a) Linearität in jeder Zeile und Spalte:
niz’sche Formel definiert. Auf Seite 484 erläutern wir eine
Ist zi = λ x + y, so gilt:
alternative Definition der Determinante. Um diese Defini- ⎛ ⎞ ⎛ ⎞
tion verstehen zu können, fassen wir die Determinante für z1 z1
jedes n ∈ N als eine Abbildung von R n×n nach R auf: ⎜ .. ⎟ ⎜ .. ⎟
⎜.⎟ ⎜.⎟
⎜ ⎟ ⎜ ⎟
 n×n det A = λ det ⎜ x
⎜ ⎟
⎟ + det ⎜ y ⎟ ← i-te Zeile.
⎜ ⎟
R → R, ⎜.⎟ ⎜.⎟
det : ⎝ .. ⎠ ⎝ .. ⎠
A  → det(A).
zn zn
Ist s j = λ x + y, so gilt:
Die Determinante ist eine normierte,
alternierende Multilinearform det A = λ det((s 1 , . . . , x, . . . , s n ))+
+ det((s 1 , . . . , y, . . . , s n )) .
Wir geben vorab einige Eigenschaften der Abbildung det an:
Man sagt, die Abbildung det : R n×n → R ist eine
Determinantenregeln Multilinearform.
⎛ ⎞ (b) Entsteht A aus A durch Vertauschen zweier Zeilen
z1
⎜ ⎟ (bzw. Spalten), so gilt det A = − det A.
Für A = ⎝ ... ⎠ = (s 1 , . . . , s n ) ∈ R n×n und λ ∈ R Man sagt, det ist alternierend.
zn (c) det(En ) = 1.
gilt: Man sagt, det ist normiert.
13.4 Anwendungen der Determinante 483

Beweis: (a) Wegen det(A) = det(A0 ) reicht es, die Aus- Aber die Determinante hat durchaus noch andere Anwendun-
sage nur für Zeilen zu zeigen. Die i-te Zeile der Matrix A gen. Zum Beispiel lassen sich lineare Gleichungssysteme mit
sei quadratischer Koeffizientenmatrix mithilfe von Determinan-
λ x + y = (λ x1 + y1 , . . . , λ xn + yn ) . ten lösen, und ist eine Matrix invertierbar, so können wir auch
das Inverse einer Matrix mit Determinanten bestimmen. Wir
Wir setzen dies in die Leibniz’sche Formel ein: wollen aber darauf hinweisen, dass diese Methoden nicht
⎛ ⎞ sehr effizient sind. Der Algorithmus von Gauß und Jordan
..
⎜ . ⎟ ! n führt im Allgemeinen viel schneller zur Lösung eines Glei-
det(A) = det ⎜ ⎝ λ x + y ⎟=
⎠ sgn(σ ) ak σ (k) . chungssystems, und die Methoden aus dem Abschnitt 12.6
.. σ ∈Sn k=1 zur Bestimmung des Inversen einer Matrix sind meist deut-
.
lich effizienter als die Methode, die wir nun mittels Determi-
nanten vorstellen.
Wegen aiσ (i) = λ xσ (i) + yσ (i) erhält man nach Ausmulti-
plizieren:
⎛ ⎞ ⎛ ⎞ Eine Matrix ist genau dann invertierbar, wenn
.. ..
⎜.⎟ ⎜.⎟ ihre Determinante von null verschieden ist
det(A) = λ det ⎜ ⎟ ⎜ ⎟
⎝x ⎠ + det ⎝y ⎠ .
.. ..
. . Es gibt viele Invertierbarkeitskriterien für (quadratische) Ma-
trizen über einem Körper K. Wir geben eines mithilfe der
(b) und (c) haben wir bereits auf den Seiten 473 und 473 Determinante an.
bewiesen. 

Invertierbarkeitskriterium
Kommentar: Oftmals werden Determinanten als normier- Für eine Matrix A ∈ Kn×n sind die folgenden Aussagen
te, alternierende Multilinearformen eingeführt. Man kann gleichwertig:
zeigen, dass wenn es eine normierte, alternierende Multi- Die Matrix A ist invertierbar.
linearform gibt, sie eindeutig bestimmt ist. Man nennt diese Es gilt det A = 0.
multilineare Abbildung dann Determinante und beweist ihre
Existenz mittels der Leibniz’schen Formel. Diese Einfüh-
rung der Determinante (siehe Seite 484) hat Vorteile und Beweis: Man bringe A mit elementaren Zeilenumformun-
Nachteile: Ein klarer Vorteil ist, dass die Nachweise für die gen auf Zeilenstufenform Z = (zij ). Wegen des Satzes zur
Eigenschaften der Determinante, wie zum Beispiel der Deter- Determinante nach elementaren Zeilen- oder Spaltenumfor-
minantenmultiplikationssatz, übersichtlicher dargestellt wer- mungen auf Seite 479 gilt dann det(A) = a det(Z) für ein
den können – die Anzahl der Indizes bei den Nachweisen ist a ∈ K \ {0}. Es folgt:
geringer. Ein Nachteil ist: Bis man überhaupt den Begriff
einer Determinante hat, muss man sich durch einen Urwald det(A) = 0 ⇔ det(Z) = z11 · · · znn = 0
mit ungewohnten und nicht einfachen Begriffen schlagen. ⇔ z11 , . . . , znn = 0
Wir haben der direkten Einführung der Determinante über ⇔ rg A = rg Z = n
die Leibniz’sche Formel den Vorzug gegeben und haben so- ⇔ A ist invertierbar
mit in Kauf genommen, dass die Beweise manchmal einer
Schlacht mit Indizes gleichen. Dafür bleibt es klar und ver- Zur letzten Äquivalenz siehe das Kriterium zur Invertierbar-
ständlich, was die Determinante einer Matrix A eigentlich keit auf Seite 449. 
ist – eine wohlsortierte Summe von Produkten von Einträgen
in A.
Kommentar: Die Aussage des Satzes gilt in einer entspre-
chenden Formulierung auch für einen kommutativen Ring R
mit 1. Aber der Beweis ist dann anders zu führen, da oben-
13.4 Anwendungen der stehender Beweis bei der Erzeugung der Zeilenstufenform
durch elementare Zeilenumformungen wesentlich benutzt,
Determinante dass jedes von null verschiedene Element aus K invertierbar
ist. Die allgemeinere Aussage werden wir später mithilfe der
Wir behandeln in diesem Abschnitt einige Anwendungen der Adjunkten zeigen.
Determinante. Zuerst zeigen wir, dass die Determinante ein
Invertierbarkeitskriterium liefert: Eine Matrix ist genau dann ?
invertierbar, wenn ihre Determinante von null verschieden Wenn A B mit A, B ∈ Kn×n invertierbar ist, müssen dann
ist. Den Nutzen dieses Kriteriums lernen wir erst im nächsten auch A und B invertierbar sein?
Kapitel zu den Eigenwerten richtig zu schätzen.
484 13 Determinanten – Kenngrößen von Matrizen

Hintergrund und Ausblick: Determinanten als alternierende Multilinearformen


Auf Seite 471 wurden die Determinanten von Matrizen über kommutativen Ringen mithilfe der Leibniz’schen Formel definiert.
Im Folgenden wird ein alternativer Zugang gezeigt. Man kann die Determinanten auf Vektorräumen auch als normierte
alternierende Multilinearformen einführen und daraus die Leibniz’sche Summenformel herleiten.
!
Sei V ein K-Vektorraum mit dim V = n. Eine Abbildung (x 1 , . . . , x n ) = a1σ (1) . . . anσ (n) (bσ (1) , . . . , bσ (n) )
σ ∈Sn !
 : V n → K, (x 1 , . . . , x n )  → (x 1 , . . . , x n ) , (∗)
= (b1 , . . . , bn ) sgn σ · a1σ (1) . . . anσ (n)
σ ∈Sn
die jedem n-Tupel von Vektoren aus V ein Element aus K
zuordnet, heißt eine Multilinearform, wenn gilt: mit n! Summanden übrig. Eine alternierende Multilinear-
form muss also bis auf den Faktor (b1 , . . . , bn ) durch
(D1) (x 1 , . . . , λx i , . . . , x n ) = λ (x 1 , . . . , x n ),
die Leibniz’sche Formel zu berechnen sein; dabei muss im
(D2) (x 1 , . . . , x i + y i , . . . , x n ) = (. . . , x i , . . . )
nicht trivialen Fall (b1 , . . . , bn ) = 0 sein.
+ (. . . , y i , . . . ).
Dies reicht hin, denn die Regeln von Seite 482 zeigen,
Gilt außerdem
dass der durch die Summenformel errechnete Wert einer
(D3) (. . , x i , . . . , x j , . .) = 0, falls x i = x j , i  = j , Matrix (aik ) in der Tat die Regeln (D1) bis (D3) erfüllt.
so nennt man die Multilinearform  alternierend. Nicht triviale alternierende Multilinearformen auf V n sind
also bis auf einen Faktor eindeutig bestimmt und durch
Eine alternierende Multilinearform mit
die Leibniz’sche Formel zu berechnen. Wie kommen wir
(x 1 , . . . , x n ) = 0 für alle (x 1 , . . . , x n ) ∈ V n von der alternierenden Multilinearform auf V zur Deter-
minante einer Matrix? Wir sehen die Matrix A als n-Tupel
heißt trivial; wir sind natürlich an nicht trivialen alternie- ihrer Zeilenvektoren z1 , . . . , zn ∈ Kn und berechnen die-
renden Multilinearformen interessiert. jenige alternierende Multilinearform 1 , welche der ka-
Der Begriff „alternierend“ ist gerechtfertigt: nonischen Basis (e1 , . . . , en ) den Wert 1 zuweist. Dann
(D3) ist offensichtlich det A = 1 (z1 , . . . , zn ).
0 = (. . . , x i + x j , . . . , x i + x j , . . . )
(D2) Im Folgenden zeigen wir noch zwei wichtige Eigenschaf-
= (. . . , x i , . . . , x i , . . . ) + (. . . , x i , . . . , x j , . . . )
+ (. . . , x j , . . . , x i , . . . ) + (. . . , x j , . . . , x j , . . . ) ten von alternierenden Multilinearformen, die wir von den
(D3) Determinanten der Matrizen bereits kennen:
= (. . . , x i , . . . , x j , . . . ) + (. . . , x j , . . . , x i , . . . ).
1) Ist  eine nicht triviale alternierende Multilinearform
Somit ist bei i = j
auf dem Vektorraum V , so kennzeichnet (x 1 , . . . , x n )
(. . . , x i , . . . , x j , . . . ) = −(. . . , x j , . . . , x i , . . . ). = 0 die lineare Abhängigkeit von {x 1 , . . . , x n }.
Sind nämlich {x 1 , . . . , x n } linear unabhängig, so bil-
Wird die Reihenfolge von (x 1 , . . . , x n ) durch eine Per-
den sie eine Basis, und bei (x 1 , . . . , x n ) = 0
mutation σ ∈ Sn zu (x σ (1) , . . . , x σ (n) ) verändert, so ist
wäre  trivial. Bei linear abhängigen {x 1 , . . . , x n }
dies nach Aufgabe 13.14 schrittweise durch Transpositio-
gilt – gegebenenfalls nach einer Umreihung – x n =
nen erreichbar. Jede ändert das Vorzeichen der Multiline- n−1
λ x . Dann folgt mit den Regeln (D1) bis (D3)
arform. Mit den Ergebnissen von Seite 73 folgt i=1 i i 
 x 1 , . . . , x n−1 , n−1
i=1 λi x i = 0 .
(x σ (1) , . . . , x σ (n) ) = sgn σ · (x 1 , . . . , x n ). (∗)
2) Alternierende Multilinearformen führen direkt zum Be-
Nun sei B = (b1 , . . . , bn ) eine geordnete Basis von V .
griff der Determinante der Endomorphismen von V , also
Dann gibt es für jeden Vektor x i eine Darstellung
der linearen Abbildungen f : V → V : Ausgehend von
!
n
einer nicht trivialen alternierenden Multilinearform  de-
xi = aik bk für i = 1, . . . , n . finieren wir
k=1
f : V n → K, (x 1 , . . . , x n ) →  (f (x 1 ), . . . , f (x n )).
Die auftretenden Koeffizienten (ai1 , . . . , ain ) bilden die
i-te Zeile in der n-reihigen Matrix (aik ). Nun gilt Offensichtlich erfüllt auch f wegen der Linearität von
!
n !
n  f die Forderungen (D1) bis (D3). Daher unterscheidet
(x 1 , . . . , x n ) =  a1k1 bk1 , . . . , ankn bkn sich f (x 1 , . . . , x n ) nur durch einen von (x 1 , . . . , x n )
k =1 kn =1 unabhängigen Faktor von (x 1 , . . . , x n ), und diesen de-
!
n n 1
!
(D1,D2)
= ··· a1k1 . . . ankn (bk1 , . . . , bkn ). finieren wir als Determinante von f :
k1 =1 kn =1
 (f (x 1 ), . . . , f (x n ))
Sobald in einem n-Tupel (bk1 , . . . , bkn ) zwei gleiche Ba- det f = .
 (x 1 , . . . , x n )
sisvektoren vorkommen, ist mit (D3) (bk1 , . . . , bkn ) = 0.
Also bleiben nur die Fälle mit paarweise verschiedenen Setzt man die obige Summenformel für  ein, so kürzt
(k1 , . . . , kn ) übrig. Dann aber handelt es sich um das Bild sich  (b1 , . . . , bn ). Der Wert det f ist somit unabhän-
(σ (1), . . . , σ (n)) unter einer Permutation σ ∈ Sn . Von gig von der Wahl der Basis B und übrigens gleich den
der obigen n-fachen Summe mit nn Summanden bleibt Determinanten aller Darstellungsmatrizen von f .
13.4 Anwendungen der Determinante 485

Beispiel Wir prüfen, ob die drei Vektoren x3


⎛ ⎞ ⎛ ⎞ ⎛ ⎞
2 1 0
u = ⎝2⎠ , v = ⎝3⎠ , w = ⎝5⎠ ∈ R3
4 6 2
linear abhängig sind. Wegen α x
⎛ ⎞ ⎛ ⎞
2 1 0 2 1 0 x
det ⎝2 3 5⎠ = det ⎝0 2 5⎠ = 2 (2 · 2 − 5 · 4)  = 0
4 6 2 0 4 2 o α
α
ist die Matrix A mit den Spalten u, v, w invertierbar. Somit
gilt rg A = 3, d. h., die angegebenen Vektoren sind linear x2
unabhängig.  x1

Abbildung 13.1 Drehung um die x3 -Achse.


Die spezielle lineare Gruppe ist die Menge der
Matrizen mit Determinante 1
Mit der Determinante lässt sich das Inverse
Wir greifen die Menge GLn (K) der invertierbaren n × n- einer Matrix bestimmen
Matrizen über einem Körper K erneut auf (Seiten 448 und
453). Die Menge GLn (K) bildet mit der Matrizenmultiplika- Ist A ∈ R n×n eine invertierbare Matrix, so lässt sich A−1
tion eine Gruppe, die allgemeine lineare Gruppe vom Grad anhand der folgenden Formel ermitteln. Dabei bezeichne Aj i
n. Da die Determinante multiplikativ ist, ist die nach dem die Matrix, die aus A durch Streichen der j -ten Zeile und
Invertierbarkeitskriterium von Seite 483 wohldefinierte Ab- i-ten Spalte hervorgeht.
bildung 
GLn (K) → K \ {0}, Die adjunkte Matrix
det :
A  → det(A) Für jede quadratische Matrix A = (aij )i,j ∈ R n×n
ein Gruppenhomomorphismus. Den Kern dieses Homomor- nennt man die n × n-Matrix
phismus bezeichnen wir mit
∗ ∗
SLn (K) = ker(det) = {A ∈ GLn (K) | det(A) = 1} . ad(A) = (aij )i,j mit aij = (−1)i+j det(Aj i )

Es ist SLn (K) nach dem Lemma auf Seite 74 eine Unter- die adjunkte Matrix zu A. Es gilt:
gruppe von Gln (K) – man nennt sie die spezielle lineare
Gruppe vom Grad n. A ad(A) = ad(A) A = det(A) En .
Die Abbildung det ist surjektiv, da für jedes λ ∈ K \ {0} die Falls A invertierbar ist, so gilt:
Matrix ⎛ ⎞
λ 0 ··· 0 A−1 =
1
ad(A) .
⎜ 0 1 · · · 0⎟ det A
⎜ ⎟
⎜ .. . . .. ⎟
⎝. . .⎠
0 0 ··· 1 Beweis: Die adjunkte Matrix lautet ausführlich
⎛ ⎞
ein Element aus GLn (K) ist und die Determinante λ hat. Nach (−1)1+1 det(A11 ) · · · (−1)1+n det(An1 )
dem Homomorphiesatz für Gruppen von Seite 77 gilt damit: ⎜ .. .. ⎟
ad(A) = ⎝ . . ⎠
GLn (K)/ SLn (K) ∼
= K \ {0} . (−1)n+1 det(A1n ) · · · (−1)n+n det(Ann )

Kommentar: Die linearen Gruppen GLn (K) (später Beachten Sie, dass hier in der adjunkten Matrix der erste
kommen noch weitere hinzu) beschreiben Symmetrien. Die Index von Aj i der Spaltenindex ist und der zweite der Zei-
SLn (K) enthält z. B. die volumen- und orientierungstreuen lenindex.
linearen Abbildungen (Kapitel 7). Wir bezeichnen die Einträge in dem Matrizenprodukt
A ad(A) mit cij , d. h.,
Beispiel Für jedes α ∈ [0, 2 π [ ist
⎛ ⎞ A ad(A) = (cij ) ,
' ( cos α − sin α 0
cos α − sin α
bzw. ⎝ sin α cos α 0⎠ und zeigen
sin α cos α
0 0 1 
1 , falls i = j,
ein Element von SL2 (R) bzw. SL3 (R). Die Matrix beschreibt cij = det(A) δij mit δij =
0 , sonst.
jeweils eine Drehung um den Winkel α. Im R2 wird um den
Nullpunkt gedreht, im R3 um die x3 -Achse (Abb. 13.1).  Es gilt dann A ad(A) = det(A) En .
486 13 Determinanten – Kenngrößen von Matrizen

Für jedes i ∈ {1, . . . , n} ist cii das Produkt der i-ten Zeile Beispiel Wir berechnen ad(A) und damit A−1 für
von A mit der i-ten Spalte von ad(A): ⎛ ⎞
1 2 1
⎛ ⎞
(−1)1+i det(Ai1 ) A = ⎝−2 1 4⎠ ∈ R3×3 .
⎜ .. ⎟ 1 3 2
cii = (ai1 , . . . , ain ) ⎝ . ⎠
(−1) n+i det(Ain ) ∗ der Adjunkten von A:
Wir ermitteln die Komponenten aij
!
n
' (
= aik (−1)k+i det(Aik ) . ∗ 1 4
a11 = (−1)1+1 det A11 = det = −10 ,
k=1 3 2
' (
∗ −2 4
Nach dem Entwicklungssatz von Laplace (Entwicklung nach a21 = (−1)2+1 det A12 = − det = 8,
i-ter Zeile) von Seite 477 gilt daher für jedes i ∈ {1, . . . , n}: 1 2
' (
∗ −2 1
cii = det(A) . a31 = (−1)3+1 det A13 = det = −7 ,
1 3
' (
∗ 2 1
Und für i = j gilt analog: a12 = (−1)1+2 det A21 = − det = −1 ,
3 2
' (
!
n
∗ 1 1
cij = aik (−1)k+j det(Aj k ) = det(A ) , a22 = (−1)2+2 det A22 = det = 1,
1 2
k=1 ' (
∗ 1 2
a32 = (−1)3+2 det A23 = − det = −1 ,
wobei A ∈ R n×n aus A durch Ersetzen der j -ten Zeile durch 1 3
' (
die i-te Zeile entsteht. Da die Determinante einer Matrix ∗ 2 1
mit gleichen Zeilen null ist, erhalten wir det(A ) = 0, also a13 = (−1)1+3 det A31 = det = 7,
1 4
cij = 0 für i = j . Damit ist gezeigt: ' (
∗ 1 1
a23 = (−1)2+3 det A32 = − det = −6 ,
A ad(A) = det(A) En . −2 4
' (
∗ 1 2
a33 = (−1)3+3 det A33 = det = 5.
Die Formel ad(A) A = det(A) En erhält man analog durch −2 1
Entwicklung nach der i-ten Spalte.
Damit erhalten wir:
Ist schließlich A ∈ R n×n invertierbar, so ist auch det(A) ∈ R ⎛ ⎞
invertierbar (siehe die Folgerung auf Seite 475). Wir multipli- −10 −1 7
zieren die bewiesene Gleichung ad(A) A = det(A) En mit ad(A) = ⎝ 8 1 −6⎠
(det(A))−1 durch und erhalten −7 −1 5
, -
1 und wegen det(A) = −1 folgt:
ad(A) A = En .
det A ⎛ ⎞
10 1 −7
ad(A)
Folglich ist
1
ad(A) das zu A inverse Element A−1 .  A−1 = = ⎝−8 −1 6 ⎠ 
det A det A
7 1 −5
Der Satz zur adjunkten Matrix liefert eine Formel zum In-
vertieren von Matrizen. Für eine invertierbare 2 × 2-Matrix Die Methoden aus dem Abschnitt 12.6 zum Invertieren von
über einem Körper K lautet die Formel: Matrizen führen im Allgemeinen deutlich schneller zum Ziel
als die hier vorgestellte Methode mit der adjunkten Matrix.
Das Inverse einer 2 × 2-Matrix Aber der Satz zur adjunkten Matrix hat eine wichtige theore-
tische Bedeutung, mit ihm folgt nun ein allgemeines Inver-
Für A ∈ K2×2 mit det(A)  = 0 gilt:
tierbarkeitskriterium für Matrizen über einem kommutativen
' ( ' ( Ring R mit 1.
a b −1 1 d −b
A= ⇒ A =
c d ad − bc −c a
Folgerung
Für eine Matrix A ∈ R n×n sind die folgenden Aussa-
Die Elemente auf der Hauptdiagonalen werden vertauscht, gen gleichwertig:
die anderen Elemente werden mit einem Minuszeichen ver-
Die Matrix A ist invertierbar.
sehen, und es wird durch die Determinante geteilt.
Die Determinante det A ∈ R ist invertierbar in R.
Bei einer 3 × 3-Matrix ist das Invertieren mit der adjunk-
ten Matrix deutlich komplizierter, wir zeigen dies an einem Man vergleiche dieses Resultat mit dem Invertierbarkeitskri-
Beispiel. terium für eine Matrix A über einem Körper K.
13.4 Anwendungen der Determinante 487

Kommentar: In der Zahlentheorie und ihren Anwendun- Nun ist aber nach der zweiten Regel für die Determinanten
gen in der Kryptologie und Codierungstheorie wird dieses von Seite 474 die Determinante einer Matrix mit gleichen
Ergebnis wie auch die im Folgenden behandelte Cramer’sche Spalten null, sodass in dieser letzten Summe für jedes j = i
Regel mehrfach benutzt. Wir können hier die Ergebnisse lei- aus {1, . . . , n}
der nur etwas unmotiviert darstellen und müssen darauf hof-
det((s 1 , . . . , s i−1 , s j , s i+1 , s n )) = 0
fen, dass ein Leser an unsere Ausführungen hier zurückdenkt
und auf diesen Seiten nachblättert, sobald in der Zahlentheo- gilt und in dieser Summe somit nur der i-te Summand ver-
rie, Kryptologie oder Codierungstheorie darauf verwiesen bleibt, d. h.,
wird, dass man diese Dinge ja im ersten Semester in der
det(Ai ) = vi det(A) .
linearen Algebra gelernt habe.
Da det(A) ∈ R invertierbar ist, können wir diese Gleichung
mit dem Inversen davon multiplizieren und erhalten wie ge-
1
wünscht vi = det(Ai ) . 
det A

Die Cramer’sche Regel liefert die eindeutig


bestimmte Lösung eines linearen Will man die Cramer’sche Regel zum Lösen eines Glei-
chungssystems A x = b mit invertierbarer Matrix A anwen-
Gleichungssystems komponentenweise
den, so ist die Determinante der Koeffizientenmatrix A und
für jede Komponente vi des Lösungsvektors v die Determi-
Eine weitere Anwendung der Determinante betrifft das Lö- nante der Matrix
sen von linearen Gleichungssystemen mit quadratischer und
invertierbarer Koeffizientenmatrix. Ai = (s 1 , . . . , s i−1 , b, s i+1 , s n )
zu bestimmen. Damit läuft das Lösen eines solchen Glei-
Die Cramer’sche Regel chungssystems auf das Bestimmen von n + 1 Determinanten
Es sei von n × n-Matrizen hinaus. Der Algorithmus von Gauß und
Ax = b Jordan führt im Allgemeinen schneller zur Lösung. Interes-
ein lineares Gleichungssystem mit siert man sich aber etwa nur für eine oder einzelne Kom-
ponenten des Lösungsvektors, so kann der Einsatz der Cra-
A = (s 1 , . . . , s n ) ∈ R n×n , b ∈ R n . mer’schen Regel durchaus sinnvoll sein. Wir zeigen dies an
Falls det(A) ∈ R invertierbar in R ist, so hat das System einem Beispiel.
A x = b genau eine Lösung v = (vi ).
Beispiel Wir bestimmen die x2 -Komponente der Lösung
Man erhält die Komponenten vi der Lösung v durch des reellen linearen Gleichungssystems:
1 −x1 + 8 x2 + 3 x3 = 2
vi = det(Ai ) für i = 1, . . . , n ,
det A 2 x1 + 4 x2 − 1 x3 = 1
wobei −2 x1 + x2 + 2 x3 = −1

Ai = (s 1 , . . . , s i−1 , b, s i+1 , s n ) ∈ R n×n . Wegen ⎛ ⎞


−1 8 3
Die Matrix Ai entsteht aus A durch Ersetzen von s i
det ⎝ 2 4 −1⎠ = 5 = 0
durch b.
−2 1 2

Beweis: Nach der Folgerung auf Seite 486 ist det(A) ge- hat das gegebene System genau eine Lösung (v1 , v2 , v3 )0 ,
nau dann invertierbar, wenn die Matrix A invertierbar ist, und es gilt mit der Cramer’schen Regel:
) )
d. h., wenn A−1 ∈ R n×n existiert. Es ist dann v = A−1 b )−1 2 3 )
) ) 1
v2 = )) 2 1 −1)) = (−5) = −1 .
1
die eindeutig bestimmte Lösung des linearen Gleichungs- 
systems. Damit ist der erste Teil bereits gezeigt.
5
)−2 −1 2 ) 5

Nun sei det A in R invertierbar, und es sei v = (v1 , . . . , vn )


die eindeutig bestimmte Lösung des Systems A x = b . Dann
gilt b = A v = nj=1 vj s j , sodass wegen der Multilineari- Zu n + 1 verschiedenen Stützstellen existiert
tät der Determinante genau ein Polynom vom Grad kleiner gleich n,
!
n das die vorgegebenen Stellen interpoliert
det(Ai ) = det((s 1 , . . . , s i−1 , vj s j , s i+1 , s n ))
j =1 Bei einer Polynominterpolationsaufgabe wird zu gegebe-
!
n
nen Stützstellen
= vj det((s 1 , . . . , s i−1 , s j , s i+1 , s n )) .
j =1 (x0 , y0 ), . . . , (xn , yn ) ∈ R2
488 13 Determinanten – Kenngrößen von Matrizen

mit verschiedenen x0 , . . . , xn ∈ R ein Polynom p ∈ R[X] Die n + 1 Gleichungen in (∗) liefern ein lineares Glei-
gesucht, sodass der Graph {(x, p(x)) | x ∈ R} der Polynom- chungssystem für die n + 1 zu bestimmenden Koeffizienten
funktion p diese Stützstellen enthält, d. h., es gilt: a0 , a1 , . . . , an ∈ R.

p(xi ) = yi für alle i ∈ {0, 1, . . . , n} . Das Gleichungssystem lautet ausführlich

Das Polynom p nennt man in diesem Fall ein Interpolati- a0 x00 + a1 x0 + · · · + an x0n = y0
onspolynom.
a0 x10 + a1 x1 + · · · + an x1n = y1
y a0 x20 + a1 x2 + · · · + an x2n = y2
.. .. .. ..
. . . .
(x0 , y0 )
a0 xn0 + a1 xn + · · · + an xnn = yn .
(x3 , y3 )
Als Koeffizientenmatrix erhalten wir die sogenannte
(n + 1) × (n + 1)-Vandermonde-Matrix
⎛ ⎞
(x2 , y2 )
1 x0 x02 . . . x0n
x
⎜1 x12 . . . x1n ⎟
⎜ x1 ⎟
V =⎜ ⎟ j (n+1)×(n+1)
⎜ .. .. .. .. ⎟ = (xi ) ∈ R .
⎝. . . . ⎠
(x1 , y1 ) 1 xn xn2 . . . xnn

Es existiert genau dann eine eindeutig bestimmte Lösung des


Gleichungssystems (∗), also das eindeutig bestimmte Poly-
nom p = a0 + a1 X + · · · + an X n mit an , . . . , a1 , a0 ∈ R,
Abbildung 13.2 Das kubische Polynom p = − 20 21 161
+ 120 X + 3011 2
X − wenn die Determinante der Vandermonde-Matrix von Null
19
120 X 3 ∈ R[X]
3 enthält die gegebenen Stützstellen (−3, 5
2 ), (−2, −1), verschieden ist.
(1, 21 ) und (3, 2).
Wir berechnen nun diese Determinante. Wir lassen die erste
Spalte unverändert und subtrahieren von der zweiten Spalte
Wir zeigen nun, dass es zu verschiedenen x0 , x1 , . . . , xn
das x0 -Fache der ersten Spalte, von der dritten Spalte das
und beliebigen y0 , y1 , , . . . , yn genau ein Interpolationspo-
x0 -Fache der zweiten Spalte usw.:
lynom p ∈ R[X]n , d. h. eines vom Grad kleiner oder gleich n,
gibt. Dabei spielt die sogenannte Vandermonde-Matrix eine
wichtige Rolle. det V =
) )
)1 0 0 ... 0 )
) n−1 ))
)1 x1 − x0 x1 − x0 x1 . . . x1 − x0 x1 )
2 n
Existenz und Eindeutigkeit des Interpolationspoly- )
= ). .. .. .. )
noms ) .. )
) . . . )
Zu n + 1 Stützstellen (x0 , y0 ), . . . , (xn , yn ) mit paar- )1 xn − x0 xn − x0 xn . . . xn − x0 xn )
2 n n−1
weise verschiedenen x0 , . . . , xn ∈ R und beliebigen ) )
)1 0 0 ... 0 )
y0 , . . . , yn ∈ R gibt es genau ein Polynom ) n−1 ))
)1x1 − x0 (x1 − x0 )x1 . . . (x1 − x0 )x1 )
)
= ). .. .. .. )
p = a0 + a1 X + · · · + an X n ∈ R[X]n ) .. )
) . . . )
)1xn − x0 (xn − x0 )xn . . . (xn − x0 )xn )
n−1
mit p(xi ) = yi für i = 0, . . . , n. ) )
)1 x1 . . . x n−1 )
n ) 1 )
) )
= (xi − x0 ) ) ... ... ... )
Beweis: Zu zeigen ist die Existenz und Eindeutigkeit re- ) )
i=1 )1 x . . . x n−1 )
n n
eller Zahlen a0 , . . . , an mit der Eigenschaft

yi = a0 + a1 xi + · · · + an xin für i = 0, . . . , n . (∗) Bei diesem Schritt haben wir also die (n + 1) × (n + 1)-
Vandermonde-Matrix auf eine n × n-Vandermonde-Matrix
Es ist dann zurückgeführt. Induktiv folgt nun unter Beachtung von
det(1) = 1 die Formel
p = a0 + a1 X + · · · + an X n ∈ R[X]n

n−1 
n
das eindeutig bestimmte Polynom mit der gewünschten Ei- det V = (xi − xj ).
genschaft. j =0 i=j +1
13.4 Anwendungen der Determinante 489

Dies wird meistens in der Kurzform


) ) v2 + w2
) 1 x0 x02 . . . x0n )
) )
) 1 x1 x 2 . . . x n )  w2
) 1 1 ) w w
). . . .. ) = (xi − xj )
) .. .. .. . )) i>j v2
F1
) v
) 1 x x2 . . . xn ) v F2
n n n
w1 v1 v1 + w 1 w1 v1 v1 + w1
geschrieben.
Abbildung 13.4 Der Flächeninhalt des Parallelogramms ist gleich der Differenz
Es ist det V = 0 ⇔ xi  = xj für alle i  = j . der beiden Flächeninhalte F1 und F2 .

Also existiert genau dann ein eindeutig bestimmtes Polynom


p = a0 + a1 X + · · · + an X n ∈ R[X]n mit p(xi ) = yi für Für F2 erhalten wir:
alle i, wenn die vorgegebenen Stellen x0 , . . . , xn paarweise 1 1
F2 = v1 v2 + w1 (2 v2 + w2 ) .
verschieden sind, und dies wurde vorausgesetzt.  2 2
Damit gilt F = F1 − F2 = v1 w2 − w1 v2 , d. h.,
) ' ()
) v w )
F = )) det 1 1 )) .
Der Wert der Determinante einer 2 × 2-Matrix v 2 w2
ist der Flächeninhalt des von den Spalten Insbesondere folgt, dass die Determinante null ist, wenn die
aufgespannten Parallelogramms beiden Vektoren v und w linear abhängig sind, da in die-
sem Fall die Vektoren v, w keinen nicht verschwindenden
Wir deuten den Wert der Determinante einer 2 × 2-Matrix Flächeninhalt aufspannen.
geometrisch. Bei linear unabhängigen Vektoren v und w kann der Flä-
' ( ' (
v1 w1 cheninhalt F = det((v, w)) des von v und w erzeugten
Sind v = ,w = Vektoren des R2 mit Parallelogramms positiv oder negativ sein. Im Gegensatz zu
v2 w2
v1 , v2 , w1 , w2 > 0, so bilden die vier Punkte 0, v, w, v +w dem im Kapitel 7 beim Vektorprodukt aufgetretenen Inhalt
die Ecken eines Parallelogramms im ersten Quadraten des R2 (Seite 241) sprechen wir daher hier besser von einem orien-
(Abb. 13.3). Wir bestimmen den Flächeninhalt F dieses Par- tierten Flächeninhalt im R2 . Was bedeutet dabei das Vor-
allelogramms. Dazu ermitteln wir die zwei Flächeninhalte F1 zeichen von F ?
' (
und F2 , wobei F1 die Fläche unterhalb des Streckenzugs von Die Determinante det vv1 w w1
ist positiv, wenn die Rich-
0 über w zu v +w eingeschlossen mit der x1 -Achse ist und F2 2 2
tung von w aus jener von v durch eine Drehung gegen den
jene unterhalb des Streckenzugs von 0 über v zu v + w ein-
Uhrzeigersinn entsteht, wobei der Drehwinkel zwischen 0
geschlossen mit der x1 -Achse ist. Es gilt dann F = F1 − F2
und 180 Grad liegt. In diesem Fall nennt man die Vektoren
(Abb. 13.4).
(v, w) in dieser Reihenfolge positiv orientiert (siehe Ab-
bildung 13.5).
x2
x2
v+w w

v
w

x1

Abbildung 13.5 Die Vektoren (v, w) sind positiv orientiert und (w, v) negativ.
e2
v ' (
Gilt det vv1 w
w1
< 0, so nennt man die Vektoren (v, w)
2 2

e1 x1
in dieser Reihenfolge negativ orientiert. Das Vertauschen
der Spalten, also das Umreihen der Basisvektoren ändert die
Abbildung 13.3 Die Spaltenvektoren v = (vi ) und w = (wi ) einer 2 × 2- Orientierung der Basis.
Matrix A erzeugen ein Parallelogramm mit dem Flächeninhalt F = det A.
Beispiel Mittels der Determinante können wir die Flä-
Für F1 gilt: cheninhalte von Dreiecken bestimmen. So erzeugen zwei po-
1 1 sitiv orientierte Vektoren (v, w) das Dreieck 0, v, w mit dem
F1 = w1 w2 + v1 (v2 + 2 w2 ) .
2 2 Flächeninhalt F = 1/2 det((v, w)) (Abb. 13.6).
490 13 Determinanten – Kenngrößen von Matrizen

x2 Wir haben die Vektoren gegen den Uhrzeigersinn nummeriert


– das war nicht ganz ohne Absicht. Beachtet man nämlich nun
v2 noch die Orientierung, so erhalten wir die deutlich einfachere
Formel:

2 F = det((v 1 , v 2 )) + det((v 2 , v 3 ))
F + det((v 3 , v 4 )) + det((v 4 , v 5 ))
v1
+ det((v 5 , v 1 )). 
x1

Abbildung 13.6 Zwei positiv orientierte Vektoren bestimmen ein Dreieck mit
dem Flächeninhalt F = 1/2 det((v 1 , v 2 )).
Der Wert der Determinante einer 3 × 3-Matrix
Damit lassen sich aber auch wesentlich kompliziertere Flä- ist das Volumen des von den Spalten
cheninhalte im R2 bestimmen. Wir betrachten die Fläche F aufgespannten Parallelepipeds
in Abbildung 13.7, die von den Vektoren v 1 , . . . , v 5 erzeugt
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
wird. u1 v1 w1
Sind u = ⎝ u2 ⎠, v = ⎝ v2 ⎠ und w = ⎝ w2 ⎠ Vekto-
x2 v4 u3 v3 w3
ren des reellen Vektorraums R3 , so bilden die acht Punkte
0, u, v, w, u + v, v + w, u + w, u + v + w die Ecken
v3
eines Spates oder Parallelepiped (Abb. 13.9) mit dem Volu-
F
v5 men

| det(u, v, w)| = |u1 v2 w3 + u2 v3 w1 + u3 v1 w2


v1 v2
− (u1 v3 w2 + u2 v1 w3 + u3 v2 w1 )| .

Diese Formel wurde in Kapitel 7 auf Seite 244 hergeleitet.


Dort wurde auch das Spatprodukt det(u, v, w) als orientier-
tes Volumen im Anschauungsraum eingeführt.
x1

Abbildung 13.7 Die fünf Vektoren v 1 , . . . , v 5 bestimmen die Fläche F .

Die Fläche F ist die Differenz zweier Flächen (Abb. 13.8).


Wir geben diese beiden Flächen an: Die große Fläche F1 wird
von den Vektoren 0, v 2 , v 3 , v 4 erzeugt, die kleinere F2 von u
den Vektoren 0, v 1 , v 2 , v 4 , v 5 .
v F
w

Abbildung 13.9 Die Spaltenvektoren u, v und w einer Matrix A erzeugen


einen Spat, dessen Volumen der Betrag der Determinante von A ist.

F1

F2
Das Volumen | det(u, v, w)| des Parallelepipeds ist genau
dann null, wenn die drei Vektoren u, v, w ∈ R3 linear ab-
hängig sind. Der Spat ist dann „flach“, also in einer Ebene
gelegen oder auf einer Geraden, oder er ist überhaupt auf
einen einzigen Punkt geschrumpft.
Abbildung 13.8 Die Fläche F ist die Differenz der beiden Flächen F1 und F2 .
Die vom Koordinatenursprung aus abgetragenen Vektoren
u, v, w sind Mantelkanten einer dreiseitigen Pyramide.
Für den Inhalt der großen Fläche F1 gilt:
Nach Seite 245 beträgt das Volumen dieser Pyramide ge-
2 F1 = det((v 2 , v 3 )) + det((v 3 , v 4 )), rade ein Sechstel des Volumens des von u, v, w aufgespann-
und für jenen der kleinen Fläche F2 gilt: ten Parallelepipeds. Dies ist die Grundlage für die im Essay
auf Seite 491 behandelte Cayley-Menger’sche Determinante,
2 F2 = det((v 2 , v 1 )) + det((v 1 , v 5 )) + det((v 5 , v 4 )) . durch welche das Volumen einer dreiseitigen Pyramide aus
Damit ist dann F = F1 − F2 . deren 6 Kantenlängen berechenbar ist.
13.4 Anwendungen der Determinante 491

Hintergrund und Ausblick: Die Cayley-Menger-Formel für das Volumen einer dreiseitigen
Pyramide
Die Bedeutung dieser von Arthur Cayley (1821–1895) entwickelten und später von Karl Menger (1902–1985) auf metrische
Räume verallgemeinerten Formel liegt darin, dass das Volumen einer dreiseitigen Pyramide allein durch die Längen lij der
sechs Kanten auszudrücken ist. Das Verschwinden dieses Volumens kennzeichnet die Komplanarität der Eckpunkte anhand
einer von den gegenseitigen Distanzen zu erfüllenden Gleichung.

Das Volumen V der dreiseitigen Pyramide mit den Eck- dass das Produkt der Determinanten gleich ist der Deter-
punkten a 0 , . . . , a 3 ist gleich einem Sechstel des Volu- minante des Matrizenprodukts. So entsteht
mens jenes Parallelepipeds, welches von den Vektoren ) )
) 0 1 1 1 1 )
a 1 − a 0 , a 2 − a 0 und a 3 − a 0 aufgespannt wird (siehe ) )
) 1 a0 · a0 a0 · a1 a0 · a2 a0 · a3 )
Beispiel auf Seite 245). Daher gilt: 1 ) )
V2 = − ) 1 a1 · a0 a1 · a1 a1 · a2 a1 · a3 )
V =
1
det(a 1 − a 0 , a 2 − a 0 , a 3 − a 0 ). 36 )) 1 a2 · a0 a2 · a1 a2 · a2 a2 · a3
)
)
) )
6
) 1 a3 · a0 a3 · a1 a3 · a2 a3 · a3 )
Wir bezeichnen die Koordinaten der Punkte a i für i =
0, . . . , 3 mit (xi1 , xi2 , xi3 ) und schreiben diese wie ge- Nun subtrahieren wir für 0 ≤ i ≤ 3 von der (i + 2)-ten
wohnt in Spaltenform. Dies ergibt: Zeile (1 a i · a 0 a i · a 1 a i · a 2 a i · a 3 ) die mit a i · a i /2
) ) multiplizierte erste Zeile und danach von der (j + 2)-ten
) )
1 ) x11 − x01 x21 − x01 x31 − x01 )
Spalte, 0 ≤ j ≤ 3, die mit a j · a j /2 multiplizierte erste
V = )) x12 − x02 x22 − x02 x32 − x02 )
)
6 ) x −x x −x x −x ) Spalte. Damit erhalten wir Nullen in der Hauptdiagonale.
13 03 23 03 33 03
Und an die Stelle (i + 2, j + 2), i = j , kommt der Wert
Diese 3 × 3-Matrix wird schrittweise umgeformt, ohne
ihre Determinante zu verändern. ai · aj − 1
ai · ai − 1 2
a j · a j = − 21 lij
2 2
Wir erweitern durch die Zeile (1 0 0 0) zu einer 4 × 4-
mit lij als Distanz der Punkte a i und a j , denn
Matrix. Deren Entwicklung nach der ersten Zeile beweist,
dass die Determinante unabhängig ist von den restlichen 2
lij = a i − a j 2 = a i · a i − 2 a i · a j + a j · a j .
Einträgen in der ersten Spalte. Demnach ist
) )
) 1 0 ... 0 ) Es bleibt
) )
1 )) x01 x11 − x01 . . . x31 − x01 )
)
) )
V = ) ) 0 1 1 1 1 )
6) x02 x12 − x02 . . . x32 − x02 ) ) )
) ) 1 0 −l01
2
/2 −l02
2
/2 −l03
2
/2 )
) x03 x13 − x03 . . . x33 − x03 ) −1 ) )
V2 = ) 1 −l10
2
/2 0 −l12
2
/2 −l13
2
/2 )
Dann addieren wir zu den Spalten 2 bis 4 die erste: 36 )) 1 −l20
2
/2 −l21
2
/2 0 −l23
2
/2
)
)
) )
) ) ) 1 −l30
2
/2 −l31
2
/2 −l32
2
/2 0 )
) 1 1 1 1 )
) )
1 )) x01 x11 x21 x31 )
) Zur weiteren Vereinfachung multiplizieren wir in dieser
V = ) )
6) x02 x12 x22 x32 ) symmetrischen Matrix die erste Spalte mit −1/2, um dann
) x03 x13 x23 x33 )
aus den Zeilen 2 bis 5 jeweils −1/2 wieder herauszuheben.
In den Spalten kommen genau die Koordinaten der vier Nach den Regeln über Determinanten folgt schließlich die
gegebenen Punkte vor. Nach nochmaliger Erweiterung zu Formel ) )
) 0 1 1 1 1 )
einer 5 × 5-Matrix können wir abkürzend schreiben ) )
) ) ) 1 0 2
l01 2
l02 2
l03 )
) ) 1 ) )
1 )) 1 0 0 0 0 ) V2 = ) 1 2
l10 0 2
l12 2
l13 )
V = )0 1 1 1 1 )
) 288 )) 1 2
l20 2
l21 0 2
l23
)
)
6)0 a a a a ) ) )
0 1 2 3 ) 1 2
l30 2
l31 2
l32 0 )
wobei die Vektorsymbole die in Spalten geschriebenen
mit der Cayley-Menger’schen Determinante.
Koordinatentripel repräsentieren. Derselbe Wert tritt bei
der transponierten Matrix auf, in der wir zusätzlich noch
die ersten beiden Spalten vertauschen, d. h., Kommentar: Die zweidimensionale Version dieser Vo-
) ) lumenformel liefert für das Dreieck mit den Seitenlängen
) 0 1 00 )
) ) a, b, c genau die Heron’sche Flächenformel
1 )) 1 0 a00
)
)
V =− ) .. .. .. )
6 )) ) A2 = s(s − a)(s − b)(s − c) mit s = 21 (a + b + c).
. . . )
) 1 0 a0 )
3
Bei der analog begründbaren n-dimensionalen Fassung
mit a 0
i als Koordinatentripel in Zeilenform. Wir multi- dieser Formel für das Quadrat des Volumens eines
 Simplex

plizieren die letzte Formel mit der vorletzten und nutzen, im Rn lautet der Anfangskoeffizient (−1)n+1 / 2n (n!)2 .
492 13 Determinanten – Kenngrößen von Matrizen

Die Determinante ermöglicht die Definition Die Volumina sämtlicher Parallelepipede werden mit dem-
eines n-dimensionalen Volumens selben Faktor | det A| multipliziert (Abb. 13.10). Dieser Vo-
lumenverzerrungsfaktor gilt übrigens für sämtliche Körper-
Im Anschluss an die vorhin betrachteten Fälle im R2 und R3 inhalte im Rn , nicht nur für Parallelepipede.
liegt folgende Verallgemeinerung nahe: Wir betrachten im
Rn das n-dimensionales Parallelepiped P , welches von den x2 x2
n Vektoren v 1 , . . . , v n aufgespannt wird. Wir definieren das
ϕ((1, 1)) = (2, 2)
n-dimensionale Volumen dieses Parallelepipeds als 2 2
' (
2 0
voln (P ) = |det(v 1 , . . . , v n )| . (1, 1) A=
1 1 1 1
Für eine lineare Abbildung ϕ des Rn
erklären wir das Bild
ϕ(P ) als dasjenige Parallelepiped, welches von den n Bild- x1 x1
1 2 1 2
vektoren ϕ(v 1 ), . . . , ϕ(v n ) aufgespannt wird.
Abbildung 13.10 Der Flächeninhalt des Parallelogramms wird mit dem Faktor
Die lineare Abbildung ϕ habe die Darstellungsmatrix A = | det A| = 2 verzerrt.
En M(ϕ)En bezüglich der geordneten Standardbasis En , d. h.,
ϕ(v i ) = A v i für alle i = 1, . . . , n. Damit erhalten wir für
das n-dimensionale Volumen voln (ϕ(P )) des Bildes von P ?
aufgrund des Determinantenmultiplikationssatzes den Wert Welche linearen Abbildungen sind volumentreu, d. h. ändern
die Volumina nicht ?
|det(A v 1 , . . . , A v n )| = |det A det(v 1 , . . . , v n )| .

Zusammenfassend gilt: Im Kapitel 22 zu den Gebietsintegralen werden wir auf diese


Formeln zu den n-dimensionalen Volumina wieder zurück-
voln (ϕ(P )) = | det A | voln (P ) . kommen.

Zusammenfassung

Wir erklären zu jeder quadratischen Matrix A = (aij ) ∈ ⎛ ⎞


) )
R n×n über einem kommutativen Ring R mit 1 die Determi- ) a11 a12 a13 ) +a13 +a11 +
a12
− −
a13 ⎟ a11

) ) ⎜
nante von A durch die Leibniz’sche Formel: ) a21 a22 a23 ) = ⎜ ⎟
) ) a23 ⎝ a21 a22 a23 ⎠ a21
) a31 a32 a33 )
a33 a31 a32 a33 a31
Definition der Determinante
Für jede quadratische Matrix A ∈ R n×n mit Einträgen Zur Berechnung von mehrreihigen Determinanten ist die
aus einem kommutativen Ring R heißt Leibniz’sche Formel jedoch ungeeignet und auch nicht nö-
tig. Tatsächlich berechnet man die Determinante einer großen
! 
n
Matrix fast immer durch Entwicklung nach einer Zeile oder
det(A) = sgn(σ ) ai σ (i)
Spalte, hierbei wird die Berechnung einer n-reihigen Deter-
σ ∈Sn i=1
minante auf die Berechnung von möglicherweise mehreren
die Determinante von A. (n − 1)-reihigen Determinanten zurückgeführt:

Hierbei wird die Summe über die n ! Permutationen aus der Die Entwicklung nach beliebigen Zeilen und Spalten
symmetrischen Gruppe Sn gebildet, und es ist sgn(σ ) = ±1 Für A = (aij ) ∈ R n×n und beliebige r, s ∈ {1, . . . , n}
das Signum der Permutation σ . Die Determinante von A = gilt:
(aij ) ist somit eine Summe von Produkten von Komponen- Entwicklung nach der r-ten Zeile:
ten von A. Im Fall n = 2 bzw. n = 3 kann man sich die
Leibniz’sche Formel, die sich über n ! Summanden erstreckt, !
n
det A = (−1)r+s ars det Ars .
leicht merken, es gilt nämlich für n = 2:
s=1
⎛ ⎞
) ) + −
)a11 a12 ) a a Entwicklung nach der s-ten Spalte:
) ) ⎝ 11 12 ⎠
)a21 a22 ) =
a21 a22 !
n
det A = (−1)r+s ars det Ars .
und für n = 3: r=1
Zusammenfassung 493

Vorteilhaft ist die Entwicklung nach einer Zeile oder Spalte, Determinantenmultiplikationssatz
die viele Nullen enthält. Ist dies nicht der Fall, so kann man
Sind A, B ∈ R n×n , so gilt:
vorab Nullen erzeugen, indem man elementare Zeilen- oder
Spaltenumformungen durchführt. Dabei muss man die fol- det(A B) = det A det B.
genden Regeln beachten:
Vertauscht man zwei Zeilen oder Spalten, so ändert die Auch den Beweis dieses Satzes führten wir mit der Leib-
Determinante ihr Vorzeichen. niz’schen Formel. Mit ihrer Hilfe berechneten wir det(A B)
Addiert man zu einer Zeile oder Spalte das Vielfache einer und überzeugten uns durch geschicktes Umformen davon,
anderen Zeile oder Spalte, so ändert sich die Determinante dass dies gerade det A det B ergibt.
nicht.
Der Determinantenmultiplikationsatz ist zentral, schließlich
Multipliziert man eine Zeile oder Spalte mit einem Skalar
folgt aus ihm das für alles weitere wichtige Kriterium:
λ, so multipliziert sich auch die Determinante mit die-
sem λ.
Invertierbarkeitskriterium
Natürlich betreibt man diesen Aufwand, also die Erzeugung
von Nullen in einer Zeile oder Spalte der Matrix A und dar- Für eine Matrix A ∈ Kn×n sind die folgenden Aussagen
auffolgende Entwicklung nach dieser Zeile oder Spalte, nur gleichwertig:
dann, wenn nicht einer der beiden folgenden Sonderfälle von Die Matrix A ist invertierbar.
Matrizen vorliegt: Sind die Zeilen oder Spalten der Matrix A Es gilt det A = 0.
linear abhängig, so gilt det A = 0, und hat die Matrix A eine
Blockdreiecksgestalt, so ist det A das Produkt der Determi- Die Determinante hat verschiedene Anwendungen. So kann
nanten der Blöcke auf der Diagonalen. man mithilfe der Determinante das Inverse einer invertier-
baren Matrix bestimmen; man kann die Determinante auch
Dass man bei den Regeln zur Berechnung der Determinante
zur Flächenberechnung bei Vielecken im R2 einsetzen, und
det A einer quadratischen Matrix A nicht zwischen den Zei-
die Cramer’sche Regel ist eine Methode zur Lösung eines li-
len und den Spalten von A unterscheiden muss, liegt im We-
nearen Gleichungssystems, die auf der Determinante beruht.
sentlichen an dem folgendem Satz:
Tatsächlich ist aber die Determinante nicht unabdingbar zur
Lösung dieser Problemstellungen. Es gibt zu diesen Aufga-
Die Determinante einer transponierten Matrix ben andere Methoden, die meist effizienter sind. Wirklich
Für jede quadratische Matrix A ∈ R n×n gilt: benötigt wird die Determinante zur Bestimmung der Eigen-
werte einer Matrix. Das ist das Thema des nächsten Kapitels.
det(A) = det(A0 ) .
Abschließend bemerken wir noch, dass es auch möglich und
sinnvoll ist, von einer Determinante eines Endomorphismus
Beim Beweis haben wir die Leibniz’sche Formel auf A0 an-
eines endlich-dimensionalen Vektorraums V zu sprechen: Ist
gewandt und uns davon überzeugt, dass dies letztlich die For-
nämlich ϕ ein solcher Endomorphismus, so wähle eine Basis
mel für A ist.
B von V und bilde die Darstellungsmatrix A = B M(ϕ)B
Die Gültigkeit der oben erwähnten Regeln bei den elemen- und setze det ϕ = det A. Diese Definition ist unabhängig
taren Zeilen- oder Spaltenumformungen zur Erzeugung von von der Wahl der Basis. Dies beruht wiederum auf dem De-
Nullen haben wir mit dem Determinantenmultiplikationssatz terminantenmultiplikationssatz.
nachgewiesen:
494 13 Determinanten – Kenngrößen von Matrizen

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 13.7 •• Bestimmen Sie die Determinante der folgenden


Tridiagonalmatrizen
13.1 • Begründen Sie: Sind A und B zwei reelle n×n-
Matrizen mit ⎛ ⎞
1 i 0 ... 0
⎜ . .⎟
A B = 0 , aber A  = 0 und B  = 0 , ⎜ i 1 i . . .. ⎟
⎜ ⎟
⎜ ⎟
⎜0 i 1 . . . 0⎟ ∈ Cn×n .
⎜ ⎟
so gilt ⎜. . . . ⎟
⎝ .. . . . . . . i ⎠
det(A) = 0 = det(B) .
0 ... 0 i 1

13.2 • Hat eine Matrix A ∈ Rn×n mit n ∈ 2N + 1 und Zusatzfrage: Was haben Kaninchenpaare damit zu tun?
A = −A0 die Determinante 0?
13.8 •• Es seien V ein K-Vektorraum und n eine natür-
liche Zahl. Welche der folgenden Abbildungen ϕ : V n → K,
13.3 • Folgt aus der Invertierbarkeit einer Matrix A
n > 1, sind Multilinearformen? Begründen Sie Ihre Antwor-
stets die Invertierbarkeit der Matix A0 ?
ten.
(a) Es sei V = K, ϕ : V n → K, (a1 , . . . , an )0 →
Rechenaufgaben a1 · · · an .
13.4 •• Bestimmen Sie die Determinante der Matrix (b) Es sei V = K, ϕ : V n → K, (a1 , . . . , an )0 → a1 +
⎛ ⎞ . . . + an .
0 0 a 0 (c) Es sei V = R2×2 , ϕ : V 3 → R, (X, Y , Z) →
⎜ 0 0 0 b⎟ Sp(XY Z). Dabei ist die Spur Sp(X) einer n × n-
A=⎜ ⎟
⎝ 0 c 0 0⎠ ∈ R
4×4
Matrix X = (aij ) die Summe der Diagonalelemente:
d 0 0 0 Sp(X) = a11 + a22 + · · · + ann .

mittels der Leibniz’schen Formel. 13.9 ••• Berechnen Sie die Determinante der reellen n ×
13.5 • Berechnen Sie die Determinanten der folgenden n-Matrix ⎛ ⎞
0 . . . 0 d1
reellen Matrizen: ⎜ .. . . ⎟
⎛ ⎞ ⎜. . d2 ∗ ⎟ ⎟
⎛ ⎞ 2 0 0 0 2 A=⎜ ⎜ .⎟
1 2 0 0 ⎜0 2 0 2 0⎟ ⎝ 0 . . . . . . .. ⎠
⎜2 1 0 0⎟ ⎜ ⎟
A=⎜ ⎝0 0 3 4⎠
⎟ , B = ⎜0 0 2 0 0⎟
⎜ ⎟ dn ∗ . . . ∗
⎝0 2 0 2 0⎠
0 0 4 3
2 0 0 0 2 13.10 •• Es sei V = R2×2 sowie ϕ '
: V → (V definiert
1 −2
durch X → (A X − 2 X 0 ) mit A = ∈ R2×2 .
0 −1
13.6 •• Berechnen Sie die Determinante des magischen Bestimmen Sie det(ϕ).
Quadrats
16 3 2 13
Beweisaufgaben
5 10 11 8
9 6 7 12 13.11 •• Zeigen Sie, dass für invertierbare Matrizen
4 15 14 1 A, B ∈ Kn×n gilt:

aus Albrecht Dürers Melancholia. ad(A B) = ad(B) ad(A) .


Antworten der Selbstfragen 495

13.12 ••• Zu jeder Permutation σ : {1, . . . , n} → 13.15 ••• Es seien K ein Körper und A ∈ Km×m ,
{1, . . . , n} wird durch fσ (ej ) = eσ (j ) für 1 ≤ j ≤ n ein B ∈ Kn×n . Die Blockmatrix A ⊗ B = (aij B)i,j =1,...,m ∈
Isomorphismus fσ : Kn → Kn erklärt. Es sei P σ ∈ Kn×n Kmn×mn heißt das Tensorprodukt von A und B. Zeigen
die Matrix mit fσ (x) = P σ x. Zeigen Sie P σ P τ = P σ τ , Sie
P −1 0 −1
σ = P σ −1 = P σ und P σ (aij )P σ = (aσ (i)σ (j ) ). Wel- det A ⊗ B = (det A)n (det B)m
che Determinante kann P σ nur haben?
(a) zunächst für den Fall, dass A eine obere Dreiecksmatrix,
13.13 ••• Für Elemente r1 , . . . , rn eines beliebigen Kör- ist;
pers K sei die Abbildung f : K → K, durch f (x) = (b) für beliebiges A.
(r1 − x)(r2 − x) · · · (rn − x) erklärt. Zeigen Sie:
) ) 13.16 •• Es sei x ein Element eines Körpers K, und
)r1 a a . . . a )
) ) An = ((x − 1)δij + 1)i,j =1,...,n ∈ Kn×n . Hierbei ist δij das
) b r2 a . . . a )
) )
) b b r3 . . . a ) = af (b) − bf (a) für a  = b.
Kroneckersymbol: δij = 0 für i = j , und δii = 1. Zeigen
) ) a−b Sie:
) ........ )
) )
) b b b . . . rn ) det(An ) = (x − 1)n−1 (x + n − 1).

13.14 •• Zeigen Sie, dass jede Permutation σ ∈ Sn ein


Produkt von Transpositionen ist, d. h., es gibt Transpositionen
τ1 , . . . , τk ∈ Sn mit

σ = τ1 ◦ · · · ◦ τ k .

Antworten der Selbstfragen

S. 471 Raums in einen n-dimensionalen Vektorraum dar. Damit ist


Wegen sgn(id) = 1 und der Homomorphie von sgn gilt jede Darstellungsmatrix eine n × n-Matrix.
S. 481
sgn(σ −1 ) sgn(σ ) = sgn(σ −1 ◦ σ ) = sgn(id) = 1 .
Durch elementare Zeilen- oder Spaltenumformungen kann
Damit erhalten wir sgn(σ −1 ) = sgn(σ ). man eine Nullzeile oder Nullspalte erzeugen. Die Determi-
nante der Matrix mit einer Nullzeile oder Nullspalte ist null,
S. 471 folglich ist auch die Determinante der ursprünglichen Matrix
Mithilfe des Untergruppenkriteriums auf Seite 67 kann man A null.
einfach zeigen, dass An eine Untergruppe von Sn ist. Noch
S. 483
einfacher geht es mit der auf Seite 75 stehenden Aussage:
Ja, man wende den Determinantenmultiplikationssatz an:
An ist nämlich der Kern des Homomorphismus sgn und als
solcher eine Untergruppe von Sn .
0 = det(A B) = det(A) det(B) .
S. 473
Ja. Die Determinante ist das Produkt der Diagonalelemente; Somit gilt det(A), det(B) = 0.
das folgt aus der Regel von Sarrus. S. 492
Jene mit Determinante | det ϕ| = 1 lassen die Volumina un-
S. 475
verändert. Jene mit det ϕ = 1 bilden übrigens die spezielle
Nein. Man wähle etwa A = E2 und B = −E2 .
lineare Gruppe SLn (K) von Seite 485. Lineare Abbildungen
S. 476 mit det ϕ = −1 ändern nur das Vorzeichen der orientierten
Ja, sie stellen lineare Abbildungen eines n-dimensionalen Volumina.
Normalformen –
Diagonalisieren und 14
Triangulieren
Wie berechnet man auf
einfache Art Potenzen von
Matrizen?
Welche Matrizen sind
diagonalisierbar?
Wodurch unterscheidet sich
eine Jordan-Normalform von
einer Diagonalform?

14.1 Diagonalisierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498


14.2 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 501
14.3 Berechnung der Eigenwerte und Eigenvektoren . . . . . . . . . . . . 503
14.4 Algebraische und geometrische Vielfachheit . . . . . . . . . . . . . . . 510
14.5 Die Exponentialfunktion für Matrizen . . . . . . . . . . . . . . . . . . . . . 519
14.6 Das Triangulieren von Endomorphismen . . . . . . . . . . . . . . . . . . . 521
14.7 Die Jordan-Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 526
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis . . 532
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 546
498 14 Normalformen – Diagonalisieren und Triangulieren

Lineare Abbildungen von Vektorräumen in sich sind im Allgemei- Zeile des Produkts DA ist das λi -Fache der i-ten Zeile zi
nen nicht einfach zu beschreiben. Bei endlichdimensionalen Vek- von A: ⎛ ⎞ ⎛ ⎞
torräumen ist es möglich, solche Abbildungen bezüglich einer z1 λ1 z 1
⎜ ⎟ ⎜ ⎟
gewählten Basis des Vektorraums durch Matrizen darzustellen. A = ⎝ ... ⎠ ⇒ D A = ⎝ ... ⎠ .
Zu jedem Endomorphismus eines endlichdimensionalen Vektor-
zn λn zn
raums gehört eine Äquivalenzklasse von zueinander ähnlichen
Matrizen (Seite 456). Wir wollen aus jeder Äquivalenzklasse Und Potenzen einer Diagonalmatrix zu bilden, bedeutet
einen Repräsentanten bestimmen, der eine möglichst einfache Potenzen der Diagonaleinträge zu bilden, denn es gilt für
Form hat. Als besonders einfach betrachten wir dabei eine jedes k ∈ N:
Diagonalmatrix. Leider lässt sich nicht jeder Endomorphismus ⎛ ⎞ ⎛ k ⎞
so diagonalisieren, jedoch kann oft ein Repräsentant bestimmt λ1 · · · 0 λ1 · · · 0
⎜ ⎟ ⎜ ⎟
werden, der zumindest eine obere Dreiecksgestalt hat. Die Ur- D = ⎝ ... . . . ... ⎠ ⇒ D k = ⎝ ... . . . ... ⎠
sache dafür, ob es eine solche einfache Form gibt oder nicht, ist
0 · · · λn 0 · · · λkn
im zugrunde gelegten Körper K des Vektorraums zu suchen: Ist
K algebraisch abgeschlossen, d. h. zerfällt jedes nicht konstante ' (
1.8 0.8
Polynom über K in Linearfaktoren, so ist die Existenz einer ein- Für die reelle Matrix A = gilt
0.2 1.2
fachen Form gesichert. Insbesondere werden Polynome (siehe
Abschnitt 3.4) eine wesentliche Rolle im vorliegenden Kapitel ' ( ' (
2 17 12 3 1 33 28
spielen. A = 1/5 , A = ;
3 8 5 7 12
Die Vorteile von Diagonal- oder Dreiecksmatrizen liegen auf
der Hand – die Rechnung mit solchen Matrizen ist deutlich bei Diagonalmatrizen ist es viel einfacher Potenzen zu bilden.
einfacher als mit vollen Matrizen. Und wenn man bedenkt, dass Die Matrizenmultiplikation wird also mit Diagonalmatrizen
das Rechnen mit (Darstellungs-)Matrizen nichts weiter ist, als deutlich erleichtert. Es gibt noch einen weiteren Anlass, bei
das Anwenden von linearen Abbildungen, so sieht man, dass dem man sich Diagonalmatrizen wünscht, bei Darstellungs-
sich damit der Kreis zu den Anwendungen der Mathematik matrizen linearer Abbildungen – letztlich ist es aber auch
schließt. Tatsächlich werden die erzielten Ergebnisse in zahl- hier wieder nur die Vereinfachung der Matrizenmultiplika-
reichen Gebieten der Naturwissenschaften aber auch innerhalb tion, die man sich dabei zum Ziel setzt.
der Mathematik, z. B. bei den Differenzialgleichungssystemen,
benutzt.
Die Schlüsselrolle beim Diagonalisieren bzw. Triangulieren spie- Ein Endomorphismus heißt diagonalisierbar,
len Vektoren v, die durch einen Endomorphismus auf skalare wenn es eine Basis gibt, bezüglich der die
Vielfache λ v von sich selbst abgebildet werden – man nennt v Darstellungsmatrix diagonal ist
einen Eigenvektor und λ einen Eigenwert.
Eine lineare Abbildung nennen wir auch Endomorphismus,
Wir bezeichnen in diesem Kapitel mit K einen Körper. wenn die Bildmenge gleich der Definitionsmenge ist. Wir
betrachten nun einen Endomorphismus ϕ eines n-dimen-
sionalen Vektorraums V , n ∈ N:
14.1 Diagonalisierbarkeit 
V → V,
ϕ:
v → ϕ(v).
Um unser Vorgehen zu motivieren, zeigen wir, welche Vor-
teile Matrizen in Diagonalgestalt gegenüber anderen quadra- Die Darstellungsmatrix des Endomorphismus ϕ bezüglich
tischen Matrizen haben. einer geordneten Basis A = (a 1 , . . . , a n ) bezeichnen wir
kurz mit A:

Mit Diagonalmatrizen wird vieles einfacher A = A M(ϕ)A = (A ϕ(a 1 ), . . . , A ϕ(a n )) .

Die Multiplikation einer Diagonalmatrix D ∈ Kn×n mit Die i-te Spalte der Darstellungsmatrix ist der Koordinaten-
einem Vektor v = (vi ) ∈ Kn ist sehr einfach: vektor des Bildes des i-ten Basisvektors.
⎛ ⎞⎛ ⎞ ⎛ ⎞ Nehmen wir nun an, es gibt zur linearen Abbildung ϕ eine
λ1 · · · 0 v1 λ1 v1
⎜ ⎟⎜ ⎟ ⎜ ⎟ solche geordnete Basis B = (b1 , . . . , bn ), für die gilt:
D v = ⎝ ... . . . ... ⎠ ⎝ ... ⎠ = ⎝ ... ⎠ .
0 · · · λn vn λn vn ϕ(b1 ) = λ1 b1 , . . . , ϕ(bn ) = λn bn

Entsprechend einfach ist die Multiplikation einer Diagonal- mit λ1 , . . . , λn ∈ K; d. h., jeder Basisvektor wird auf
matrix D = diag(λ1 , . . . , λn ) mit einer Matrix A. Die i-te ein Vielfaches von sich abgebildet. Dann erhalten wir als
14.1 Diagonalisierbarkeit 499

Darstellungsmatrix von ϕ bezüglich einer solchen geordne- Nicht zu jedem Endomorphismus existiert eine solche Basis,
ten Basis B die Diagonalmatrix bei der jeder Basisvektor auf ein Vielfaches von sich abge-
⎛ ⎞ bildet wird. Ein einfaches Beispiel für einen solchen nicht
λ1 · · · 0 diagonalisierbaren Endomorphismus ist eine Drehung um
⎜ ⎟
B = B M(ϕ)B = (B ϕ(b1 ), . . . , B ϕ(bn )) = ⎝ ... . . . ... ⎠ den Ursprung um einen Winkel α ∈ (0, π ).
0 · · · λn
Beispiel Bei einer Drehung δα um den Ursprung im R2
weil die Koordinatenvektoren der Bilder der Basisvektoren um einen Winkel α ∈ (0, π ) gibt es keinen vom Nullvektor
b1 , . . . , bn bezüglich der Basis B eine solche einfache Ge- verschiedenen Vektor, der auf ein Vielfaches von sich selbst
stalt haben. Und wir haben weiterhin den Zusammenhang abgebildet wird (Abb. 14.2).
⎛ ⎞
λ1 · · · 0 x2
⎜ ⎟
B = ⎝ ... . . . ... ⎠ = S −1 A S
0 · · · λn

mit der Darstellungsmatrix A von ϕ bezüglich der Basis A


und
S = A M(id)B = (A b1 , . . . , A bn ) , α
α
α
beachte das Ergebnis auf Seite 457. Die Matrix A = A M(ϕ)A
ist somit zu der Diagonalmatrix B = B M(ϕ)B ähnlich. x1
α
α
Beispiel Die Spiegelung σ (siehe auch das Beispiel auf
Seite 422) an der Geraden x2 = x1 (Abb. 14.1) hat bezüglich
der Standardbasis E2 die Darstellungsmatrix
' (
0 1
A = E2 M(σ )E2 =
1 0
Abbildung 14.2 Jeder Vektor wird um den gleichen Winkel um den Ursprung
herum gedreht.
x2

2 Die Darstellungsmatrix dieser Drehung δα bezüglich der


Standardbasis E2 erhalten wir einfach durch Angabe der
  Koordinatenvektoren der Bilder der Basisvektoren:
−b2 = −1 1 ' (
1 b1
cos α − sin α
E2 M(δα )E2 = .
sin α cos α
−2 −1 1 2 x1

 
?
−1 1
b2 = −1
Was ist mit den Winkeln α = 0 und α = π ?


−2
Nicht alle Endomorphismen lassen sich durch eine Diagonal-
Abbildung 14.1 Bei einer Spiegelung an der Geraden x2 = x1 wird der Vektor matrix darstellen, aber jene, für die das möglich ist, nennen
b1 auf 1 b1 und b2 auf −1 b2 abgebildet. wir diagonalisierbare Endomorphismen, genauer:
' ( ' (
1 1
Für die Elemente b1 = und b2 = gilt: Diagonalisierbare Endomorphismen
1 −1
Ein Endomorphismus ϕ : V → V eines n-dimensiona-
σ (b1 ) = 1 b1 und σ (b2 ) = −1 b2 , len Vektorraums, n ∈ N, heißt diagonalisierbar, wenn
es eine geordnete Basis B = (b1 , . . . , bn ) von V gibt,
d. h., dass für die geordnete Basis B = (b1 , b2 ) gilt: bezüglich der die Darstellungsmatrix B M(ϕ)B Diago-
' ( ' ( nalgestalt hat.
1 0 0 1
B M(σ )B = = S −1 S
0 −1 1 0
Die obige Spiegelung im R2 ist damit ein diagonalisierba-
' (
1 1 rer Endomorphismus, die Drehung im R2 um einen Winkel
mit S = 
1 −1 α ∈ (0, π ) dagegen nicht.
500 14 Normalformen – Diagonalisieren und Triangulieren

Eine Matrix heißt diagonalisierbar, wenn sie Nicht jeder Endomorphismus bzw. jede Matrix ist diagonali-
ähnlich zu einer Diagonalmatrix ist sierbar (siehe das Beispiel auf Seite 499). Zwei grundlegende
Fragen tauchen auf:
In den Aufgaben und Anwendungen zur Diagonalisierbar- Welche Endomorphismen bzw. Matrizen sind diagonali-
keit werden wir seltener Endomorphismen, sondern viel- sierbar?
mehr Matrizen diagonalisieren. Dabei nennen wir eine Wenn der Endomorphismus ϕ bzw. die Matrix A diago-
Matrix A ∈ Kn×n diagonalisierbar, wenn der Endomor- nalisierbar ist, wie bestimmt man effizient die Basis B
phismus mit B M(ϕ)B = D bzw. die Matrix S mit S −1 A S = D,
 n
K → Kn , wobei D eine Diagonalmatrix ist?
ϕA :
v → A v Einen ersten Hinweis liefert das folgende Kriterium:
des Kn diagonalisierbar ist, d. h., dass es eine geordnete Ba-
sis B = (b1 , . . . , bn ) des Kn gibt, bezüglich der B M(ϕA )B 1. Kriterium für Diagonalisierbarkeit
Diagonalgestalt hat. Dies können wir nach der Transforma- Ein Endomorphismus ϕ : V → V eines n-dimensio-
tionsformel für quadratische Matrizen auf Seite 457 auch nalen Vektorraums V ist genau dann diagonalisierbar,
unabhängig vom Endomorphismus ϕA formulieren: wenn es eine geordnete Basis B = (b1 , . . . , bn ) von
V mit der Eigenschaft
Diagonalisierbare Matrizen
ϕ(b1 ) = λ1 b1 , . . . , ϕ(bn ) = λn bn
Eine Matrix A ∈ Kn×n heißt diagonalisierbar, wenn
sie ähnlich zu einer Diagonalmatrix D ist, d. h., wenn es gibt. In diesem Fall ist D = B M(ϕ)B eine Diagonal-
eine invertierbare Matrix S ∈ Kn×n gibt, sodass matrix mit den Diagonalelementen λ1 , . . . , λn .
Eine Matrix A ∈ Kn×n ist genau dann diagonalisier-
D = S −1 A S bar, wenn es eine geordnete Basis B = (b1 , . . . , bn )
des Kn mit der Eigenschaft
eine Diagonalmatrix ist.
A b1 = λ1 b1 , . . . , A bn = λn bn
Nun könnte man zum einen meinen, dass wir die Endomor-
phismen unter den Tisch fallen lassen und nur noch von der gibt. In diesem Fall ist die Matrix D = S −1 A S mit
Diagonalisierbarkeit von Matrizen sprechen könnten. Tat- S = (b1 , . . . , bn ) eine Diagonalmatrix mit den Dia-
sächlich aber sind die Endomorphismen für die Theorie von gonalelementen λ1 , . . . , λn .
großer Bedeutung, vor allem dann, wenn wir zu den nicht dia-
gonalisierbaren Matrizen eine dennoch möglichst einfache Beweis: Es sei ϕ ein Endomorphismus eines n-dimen-
Darstellungsmatrix bestimmen werden. sionalen K-Vektorraums V . Der Endomorphismus ϕ ist ge-
Andererseits könnte man einwenden, dass wir die Matrizen nau dann diagonalisierbar, wenn eine geordnete Basis B =
nicht extra zu betrachten brauchen und anstelle von der Ma- (b1 , . . . , bn ) von V existiert mit
⎛ ⎞
trix A nur noch vom Endomorphismus ϕA sprechen sollten. λ1 0
Aber tatsächlich hat man es in den Anwendungen fast im- ⎜ .. ⎟
B M(ϕ)B = ⎝ . ⎠
mer mit Matrizen zu tun, sodass es etwas weltfremd wäre,
0 λn
wenn wir nur noch mit Endomorphismen hantieren würden.
Außerdem haben die Begriffe in der Sprache der Matrizen Dies ist gleichwertig mit
teils ein Eigenleben, wie bereits bei dem einfachen Begriff ϕ(b1 ) = λ1 b1 , . . . , ϕ(bn ) = λn bn .
der Diagonalisierbarkeit oben. Für eine Matrix A ∈ Kn×n folgt die Aussage aus dem er-
Wir werden im Folgenden daher viele Begriffe doppelt ein- sten Teil, indem man den Endomorphismus ϕA : Kn → Kn
führen, einmal für Endomorphismen, einmal für Matrizen. betrachtet.
Die Begriffe für die Endomorphismen benötigen wir mehr für Die Aussage D = S −1 A S mit S = (b1 , . . . , bn ) steht be-
die Theorie, die für die Matrizen für das tatsächliche Rechnen reits in der Transformationsformel für quadratische Matrizen
und das Anwenden der Theorie. auf Seite 457. 

Beispiel Kommentar: Übrigens folgt aus der Gleichung D =


Jede Diagonalmatrix D ist diagonalisierbar; man wähle S −1 A S mit einer Diagonalmatrix D = diag(λ1 , . . . , λn )
S = En . ' ( und einer invertierbaren Matrix S = (b1 , . . . , bn ) durch
Die Matrix A =
0 1
ist diagonalisierbar. Man wähle Multiplikation mit S die Gleichung S D = A S, d. h.,
1 0
' ( (λ1 b1 , . . . , λn bn ) = (A b1 , . . . , A bn ) ,
1 1
S= 
1 −1 also A b1 = λ1 b1 , . . . , A bn = λn bn .
14.2 Eigenwerte und Eigenvektoren 501

Beispiel Nach den beiden Beispielen auf Seite 499 ist die Eigenwerte und Eigenvektoren machen nur
Matrix ' ( gemeinsam einen Sinn
0 1
A=
1 0 Wir definieren Eigenwerte und Eigenvektoren gleichzeitig
diagonalisierbar, die Matrix für Endomorphismen und Matrizen.
' (
cos α − sin α Eigenwerte und Eigenvektoren
B=
sin α cos α
Man nennt ein Element λ ∈ K einen Eigenwert eines
für α ∈ (0, π) jedoch nicht.  Endomorphismus ϕ : V → V , wenn es einen Vektor
v ∈ V \ {0} mit
ϕ(v) = λ v
Von diagonalisierbaren Matrizen lassen sich gibt. Der Vektor v heißt in diesem Fall Eigenvektor
ganz einfach beliebig hohe Potenzen bilden von ϕ zum Eigenwert λ.
Man nennt ein Element λ ∈ K einen Eigenwert der
Eine der wichtigsten Eigenschaften von Diagonalmatrizen Matrix A ∈ Kn×n , wenn es einen Vektor v ∈ Kn \{0}
ist es, dass man Potenzen davon auf sehr einfache Art und mit
Weise bestimmen kann. Ist A ∈ Kn×n eine nicht notwendig Av = λv
diagonale, aber diagonalisierbare Matrix, so kann man sich
gibt. Der Vektor v heißt in diesem Fall Eigenvektor
mit einem Trick behelfen, um Potenzen von A zu berechnen.
von A zum Eigenwert λ.
Da A ∈ Kn×n diagonalisierbar ist, existiert eine invertierbare
Matrix S ∈ Kn×n mit
⎛ ⎞ Achtung: Der Nullvektor 0 ist kein Eigenvektor – für kei-
λ1 0 nen Eigenwert. Eine solche Definition wäre auch nicht sinn-
⎜ ⎟
D = S −1 A S = ⎝ ..
. ⎠ voll, da der Nullvektor sonst wegen
0 λn ϕ(0) = 0 = λ 0 für alle λ ∈ K

Diese Gleichung besagt Eigenvektor zu jedem Eigenwert wäre. Es ist jedoch durchaus
zugelassen, dass 0 ∈ K ein Eigenwert ist.
A = S D S −1 ,
Beispiel
also gilt für jedes k ∈ N: 1. Die Einheitsmatrix En ∈ Kn×n hat den Eigenwert 1, da
für jeden Vektor v ∈ Kn gilt:
Ak = (S D S −1 )k = S D S −1 S D S
−1
· · · S D S −1
En v = 1 v .
k−mal
= S D k S −1 . Damit kann En auch keine weiteren Eigenwerte haben,
da bereits jeder vom Nullvektor verschiedene Vektor des
Wir erhalten in diesem Fall die k-te Potenz von A durch Kn Eigenvektor zum' Eigenwert
( 1 ist.
Bilden der k-ten Potenz einer Diagonalmatrix und Bilden 3 −1
2. Die Matrix A = ∈C 2×2 hat wegen
des Produkts dreier Matrizen. 1 1
' ( ' ( ' (
Diesen Trick wenden wir bei den Fibonacci-Zahlen auf 1 2 1
Seite 513 an, um eine explizite Formel für die k-te Fibonacci- A = =2
1 2 1
Zahl herzuleiten. Aber dazu müssen wir erst herausfinden, ' (
wie man zu einer nicht diagonalen, aber diagonalisierbaren 1
den Eigenwert 2 und den Eigenvektor zum Eigenwert
Matrix A die auf Diagonalform transformierende Matrix S ' (
1
bestimmt. Dazu dienen Eigenwerte und Eigenvektoren. 1
2. Ebenso ist jedes Vielfache λ , λ ∈ C \ {0}, wegen
1
' ( ' ( ' (
14.2 Eigenwerte und Aλ
1

2
= 2λ
1
1 2 1
Eigenvektoren ein Eigenvektor zum
' Eigenwert
( 2.
0 1 2×2
Im Mittelpunkt aller bisherigen Überlegungen standen Vek- 3. Die Matrix A = ∈ Z2 hat wegen
1 0
toren v ∈ V \ {0}, für die ϕ(v) = λ v für ein λ ∈ K gilt. Wir ' ( ' (
geben diesen Vektoren v wie auch den zugehörigen Körper- 1 1
A =1
elementen λ Namen. 1 1
502 14 Normalformen – Diagonalisieren und Triangulieren

' (
1 Somit ist mit einem Eigenvektor v zu λ auch jedes vom Null-
den Eigenwert 1 und den Eigenvektor zum Eigen-
1 vektor verschiedene Vielfache μ v wieder ein Eigenvektor
wert 1. zu λ.
4. Nicht jede reelle Matrix
' besitzt
( Eigenwerte. So gibt es x2
0 −1
etwa zur Matrix A = ∈ R2×2 keine Eigenvek-
1 0 ϕ(v)
toren und damit auch keine Eigenwerte, denn die Glei-
chung v
' ( ' (
v1 v
A =λ 1 x1
v2 v2
liefert das System
μv
−v2 = λ v1 , v1 = λ v2 ,

' ( wegen λ  = −1 für alle λ ∈ R der


dessen einzige 2
' ( Lösung ϕ(μ v) = λ (μ v)
v 0
Vektor 1 = ist. Weil der Nullvektor aber kein Abbildung 14.3 Ist v ein Eigenvektor, so auch μ v, wenn nur μ = 0 gilt.
v2 0
Eigenvektor ist, gibt es keine Eigenvektoren und folglich
keine Eigenwerte.  Sind v und w Eigenvektoren zu dem Eigenwert λ, so auch
deren Summe, falls nur v + w = 0 gilt, da
? ϕ(v + w) = ϕ(v) + ϕ(w) = λ v + λ w = λ (v + w)
Welche Eigenwerte und Eigenvektoren hat die Nullmatrix
0 ∈ Kn×n ? bzw.
A (v + w) = A v + A w = λ v + λ w = λ (v + w) .
Mit dem Begriff des Eigenvektors können wir das Kriterium
für die Diagonalisierbarkeit einer Matrix A von Seite 500 x2
v+w
kürzer fassen.
w
2. Kriterium für Diagonalisierbarkeit v
Ein Endomorphismus ϕ : V → V eines n-dimensio-
nalen Vektorraums V ist genau dann diagonalisierbar, x1
wenn es eine geordnete Basis B = (b1 , . . . , bn ) von ϕ(v)
V aus Eigenvektoren von ϕ gibt.
In diesem Fall ist D = B M(ϕ)B eine Diagonalmatrix ϕ(w)
mit den Eigenwerten λ1 , . . . , λn auf der Diagonalen.
Eine Matrix A ∈ Kn×n ist genau dann diagonalisier- ϕ(v + w) = ϕ(v) + ϕ(w)
bar, wenn es eine geordnete Basis B = (b1 , . . . , bn ) = λ(v + w)
des Kn aus Eigenvektoren von A gibt. Abbildung 14.4 Sind v und w Eigenvektoren, so auch deren Summe v + w.
In diesem Fall ist die Matrix D = S −1 A S mit
S = (b1 , . . . , bn ) eine Diagonalmatrix mit den Ei- Fassen wir alle Eigenvektoren zu einem Eigenwert λ eines
genwerten λ1 , . . . , λn auf der Diagonalen. Endomorphismus ϕ bzw. einer Matrix A zusammen und er-
gänzen diese Menge noch mit dem Nullvektor, so erhalten
wir also einen Vektorraum – den sogenannten Eigenraum
Der Eigenraum zu einem Eigenwert besteht zum Eigenwert λ.
aus allen Eigenvektoren plus dem Nullvektor
Der Eigenraum zum Eigenwert λ
Zu einem Eigenwert λ eines Endomorphismus ϕ : V → V Ist λ ∈ K ein Eigenwert des Endomorphismus ϕ : V → V
bzw. einer Matrix A ∈ Kn×n gehören im Allgemeinen viele bzw. der Matrix A ∈ Kn×n , so nennt man den Untervek-
verschiedene Eigenvektoren. Ist nämlich v ein Eigenvektor torraum
zu λ, d. h. ϕ(v) = λ v bzw. A v = λ v, so gilt für jedes : ;
Eigϕ (λ) = v ∈ V | ϕ(v) = λ v
beliebige μ ∈ K \ {0}:
von V bzw.
ϕ(μ v) = μ ϕ(v) = μ λ v = λ (μ v) . : ;
EigA (λ) = v ∈ Kn | A v = λ v
bzw. von Kn den Eigenraum zum Eigenwert λ.
A (μ v) = μ A v = μ λ v = λ (μ v) .
14.3 Berechnung der Eigenwerte und Eigenvektoren 503

Bald werden wir klären, wie wir den Eigenraum zu einem tematisch berechnen kann. Dabei behandeln wir zuerst den
Eigenwert λ bestimmen können. Zuerst untersuchen wir, wie Fall einer Matrix A ∈ Kn×n . Die Eigenwerte, Eigenräume
wir sämtliche Eigenwerte bestimmen können. und Eigenvektoren eines Endomorphismus ϕ : V → V eines
endlichdimensionalen K-Vektorraums V erhalten wir, indem
? wir die Eigenwerte, Eigenräume und Eigenvektoren einer den
Unter welchem anderen Namen ist Ihnen Eigϕ (0) bzw.
Endomorphismus darstellenden Matrix bezüglich irgendei-
EigA (0) noch bekannt?
ner geordneten Basis B von V bestimmen. Wir werden sehen,
dass es dabei egal ist, welche Basis man wählt.
Zu dem Invertierbarkeitskriterium einer Matrix auf Seite 483 Das wesentliche Hilfsmittel für die Bestimmung der Eigen-
gesellt sich nun ein weiteres. werte einer Matrix ist das charakteristische Polynom, das wir
mithilfe der Determinante erklären werden.
Invertierbarkeitskriterium
Eine Matrix A ∈ Kn×n ist genau dann invertierbar, wenn Kommentar: Hier lernen wir nun einen wesentlichen
0 ∈ K kein Eigenwert von A ist. Grund kennen, weswegen wir die Determinante einer Ma-
trix eingeführt haben. Wir benutzen die Determinante zur
Bestimmung des charakteristischen Polynoms einer Matrix
Beweis: Die Matrix A hat genau dann den Eigenwert 0,
A, dessen Nullstellen die Eigenwerte von A sind. Theore-
wenn das lineare Gleichungssystem (A | 0) vom Nullvektor
tisch könnten wir auch auf die Determinante verzichten. Das
verschiedene Lösungen besitzt. Das ist genau dann der Fall,
passiert auch in dem Lehrbuch von Sheldon Axler, Linear
wenn A einen Rang echt kleiner als n hat (Seite 431). Und
Algebra Done Right, Springer. Wir erläutern die Idee von
das ist nach dem Kriterium für Invertierbarkeit auf Seite 449
Sheldon Axler auf Seite 506.
gleichwertig damit, dass A nicht invertierbar ist. 

Beispiel Die Eigenwerte sind die Nullstellen des


Es ist 1 der einzige Eigenwert des Endomorphismus idV charakteristischen Polynoms
bzw. der Einheitsmatrix En ∈ Kn×n , und es gilt:
EigidV (1) = V bzw. EigEn (1) = Kn . Wir zeigen nun, dass λ ∈ K genau dann ein Eigenwert einer
' ( Matrix A ∈ Kn×n ist, wenn det(A − λ En ) = 0 gilt:
λ1 0
Die Diagonalmatrix D = ∈ K2×2 hat im Fall λ ist ein EW von A ⇔ A v = λ v, v = 0
0 λ2
λ = λ1 = λ2 den Eigenraum ⇔ A v − λ v = 0, v = 0
EigD (λ) = K2 ⇔ (A − λEn ) v = 0, v = 0
und im Fall λ1 = λ2 die jeweiligen Eigenräume ⇔ det(A − λEn ) = 0 .
<' (= <' (=
1 0 Für diese letzte Äquivalenz beachte man das Invertierbar-
EigD (λ1 ) = und EigD (λ2 ) = . keitskriterium auf Seite 483.
0 1
' ( Um also die Eigenwerte einer Matrix A zu bestimmen, kön-
3 −1
Für die Matrix A = ∈ C2×2 können wir bisher nen wir den Ansatz
1 1
nur folgende Aussage treffen
<' (= det(A − X En ) = 0
1
⊆ EigA (2) in der Unbestimmten X machen. Man beachte, dass die Kom-
1
ponenten der Matrix A − X En Elemente des kommutativen
(siehe 2. Beispiel, Seite 501).  Polynomrings K[X] sind, d. h.

Tatsächlich gilt in dem letzten Beispiel sogar Gleichheit. Wir A − X En ∈ K[X]n×n .


werden nun Methoden kennenlernen, wie wir dies feststellen
können. Somit ist die Determinante
) )
)a11 − X a12 ... a1n )
) )
) .. )
) a21 a22 − X )
14.3 Berechnung der Eigenwerte det(A − X En ) = ))
. )
)
) .
.. .. )
und Eigenvektoren )
) a
. )
n1 ... ann − X)
In diesem Abschnitt zeigen wir, wie man die Eigenwerte, ein Polynom in der Unbestimmten X über dem Körper K,
die Eigenräume und damit die Eigenvektoren eines Endo- d. h., det(A − X En ) ∈ K[X], und die Nullstellen dieses
morphismus ϕ : V → V bzw. einer Matrix A ∈ Kn×n sys- Polynoms sind die Eigenwerte.
504 14 Normalformen – Diagonalisieren und Triangulieren

) )
)1 − X 2 2 ))
Das charakteristische Polynom einer Matrix )
χA = det(A − X E3 ) = )) 2 −2 − X 1 ))
Das Polynom ) 2 1 −2 − X )
) )
χA = det(A − XEn ) )−2 − X 1 ))
)
= (1 − X) )
1 −2 − X )
= (−1)n X n + cn−1 X n−1 + · · · + c1 X + c0 ∈ K[X] ) ) ) )
)2 1 )) )2 −2 − X)
)
+ (−2) ) +2)) )
vom Grad n heißt charakteristisches Polynom der Ma- 2 −2 − X) 2 1 )
trix A ∈ Kn×n . = −X 3 − 3 X2 + 9 X + 27 = (3 − X) (−3 − X)2 .
Es gilt: Da 3 und −3 die einzigen Nullstellen des charakteristi-
schen Polynoms von A sind, sind 3 und −3 auch die ein-
λ ∈ K ist ein Eigenwert von A ⇔ χA (λ) = 0 .
zigen Eigenwerte von A.
Die Matrix A hat höchstens n Eigenwerte. Wir berechnen die Eigenwerte der Matrix
⎛ ⎞
−3 1 0 0 0
⎜−1 −1 0 0 0 ⎟
Die letzte Behauptung ist klar, da χA als Polynom vom Grad ⎜ ⎟
A=⎜ ⎜−3 1 −2 1 1 ⎟ ∈ R
⎟ 5×5
.
n über einem Körper K nicht mehr als n Nullstellen haben ⎝−2 1 0 −2 1 ⎠
kann (siehe den Satz auf Seite 94).
−1 1 0 0 −2

Kommentar: In anderen Büchern findet man auch die Zum Berechnen des charakteristischen Polynoms nutzen
Definition wir aus, dass die Matrix eine Blockdreiecksmatrix ist
(siehe den Merksatz auf Seite 481):
χA = det(X En − A) .
χA = det(A − X E3 )
Wegen det(X En − A) = (−1)n det(A − X En ) ist das für ) )
)−3 − X 1 0 0 0 ))
)
)
ungerades n zwar im Allgemeinen nicht das gleiche Polynom, ) −1 −1 − X 0 0 0 ))
) )
aber die Nullstellen, also die Eigenwerte, sind die gleichen. =)) −3 1 −2 − X 1 1 ))
) )
) −2 1 0 −2 − X 1 ))
)
Es folgen nun Beispiele für das Berechnen der Eigenwerte ) −1 1 0 0 −2 − X )
einer Matrix A ∈ Kn×n . Man berechnet hierzu das charakte- ) )
)
ristische Polynom χA und ermittelt dessen Nullstellen – dies )
)−3 − X
) )−2 − X 1 1 ))
1 )) ) )
sind die Eigenwerte von A. =)) ) )
) 0 −2 − X 1 ))
) −1 −1 − X ) ) )
) 0 0 −2 − X )
Beispiel = (−2 − X)5 .
Wir berechnen die Eigenwerte der Matrix Der einzige Eigenwert von A ist also −2.
' ( Besonders einfach ist die Bestimmung der Eigenwerte von
3 4 Dreiecks- bzw. Diagonalmatrizen. Ist nämlich
A= ∈ Z2×2 .
1 1 5 ⎛ ⎞
λ11 ∗ . . . ∗
⎜ . . ⎟
Es gilt: ⎜ 0 λ22 . . .. ⎟
D=⎜ ⎜ . .
⎟ ∈ Kn×n

⎝ . .
) ) . . . . . ∗ ⎠
)3 − X 4 ))
)
χA = det(A − X E2 ) = ) 0 ... 0 λnn
1 1 − X)
etwa eine obere Dreiecksmatrix, so sind wegen
= (3 − X)(1 − X) + 1 = (2 − X)2 .
χD = (λ11 − X) (λ22 − X) · · · (λnn − X)
Da 2 die einzige Nullstelle des charakteristischen Poly- gerade die Diagonalelemente von D die Eigenwerte von
noms von A ist, ist 2 der einzige Eigenwert von A. D. Das gilt analog für untere Dreiecksmatrizen. 
Wir berechnen die Eigenwerte der Matrix
⎛ ⎞
1 2 2 Die Summe der Hauptdiagonalelemente einer
A = ⎝2 −2 1 ⎠ ∈ R3×3 . Matrix ist die Spur der Matrix
2 1 −2
Drei Koeffizienten des charakteristischen Polynoms χA las-
Zuerst bestimmen wir wieder das charakteristische Poly- sen sich mithilfe von Größen der Matrix A genau angeben,
nom, indem wir nach der ersten Zeile entwickeln. es gilt nämlich:
14.3 Berechnung der Eigenwerte und Eigenvektoren 505

Lemma Kn×n , hat wichtige Eigenschaften. So gilt etwa Sp A =


Für jede Matrix A = (aij ) ∈ Kn×n gilt: Sp S −1 A S für jede invertierbare Matrix S, d. h.:

χA = (−1)n Xn + (−1)n−1 Sp A Xn−1 + · · · + det(A) , Lemma


Zueinander ähnliche Matrizen haben dieselbe Spur.
wobei Sp A = a11 + · · · + ann die Spur von A bezeichnet.
Beweis: Es seien A und B zueinander ähnliche n × n-
Beweis: Wir berechnen das charakteristische Polynom
Matrizen über einem Körper K, d. h.,
χA , d. h. die Determinante der Matrix (bij ) = A − X En
mit der Leibniz’schen Formel (Seite 471): S −1 A S = B
χA = det(A − X E) für eine invertierbare Matrix S ∈ Kn×n . Wir zeigen zuerst
! 
n für beliebige n × n-Matrizen M, N die Formel
= sgn(σ ) bi σ (i)
σ ∈Sn i=1 Sp(M N) = Sp(N M) .

n ! 
n
= sgn(id) bi id(i) + sgn(σ ) bi σ (i) Für die Matrizen M = (mij ) und N = (nij ) gilt:
i=1 σ ∈Sn \{id} i=1 ⎛ ⎞  n 

n ! 
n !n !
n !n !
Sp(M N) = ⎝ ⎠
mij nj i = nj i mij
= (aii − X) + sgn(σ ) bi σ (i) .
i=1 σ ∈Sn \{id} i=1 i=1 j =1 j =1 i=1
= Sp(N M) .
Wir betrachten diese beiden Terme näher, dabei interessieren
uns nur die Koeffizienten vor X n und Xn−1 . Der erste Term Nun folgt mit M = S −1 und N = A S:
hat die Form

n Sp B = Sp S −1 A S = Sp A S S −1 = Sp A .
n n n−1 n−1
(aii − X) = (−1) X + (−1) (a11 + · · · + ann )X
i=1
Das ist die Behauptung. 

+ Polynome vom Grad kleinergleich n − 2 .


Ähnliche Matrizen A und B haben viel gemeinsam. Wir stel-
Die Summanden des zweiten Terms len ihre wesentlichen gemeinsamen Eigenschaften in einer
Übersicht auf Seite 543 zusammen.
! 
n
sgn(σ ) bi σ (i)
σ ∈Sn \{id} i=1
Das charakteristische Polynom eines
haben die Form Endomorphismus ist das charakteristische
Polynom einer Darstellungsmatrix
± b1 σ (1) · · · bn σ (n) .

Für σ = id sind dies aber alles Polynome vom Grad kleiner- Es sei ϕ : V → V ein Endomorphismus eines n-dimen-
gleich n − 2. Man beachte: nur die Faktoren bii = aii − X sionalen Vektorraums V mit einer geordneten Basis B =
liefern Beiträge zu den Graden der Summanden, und falls (b1 , . . . , bn ). Unter dem charakteristischen Polynom des
bi σ (i) = bii bereits (n − 1)-mal in einem Summanden auf- Endomorphismus χϕ von ϕ versteht man das charakteristi-
taucht, so gilt bi σ (i) = bii schon n-mal, d. h., σ = id, da σ sche Polynom der Darstellungsmatrix A = B M(ϕ)B :
eine Permutation ist.
χϕ = χA = det(A − X En ) .
Damit sind die beiden höchsten Koeffizienten des Polynoms
χA bereits bestimmt. Für den konstanten Koeffizienten c0 des Damit diese Definition sinnvoll ist, muss noch gezeigt wer-
charakteristischen Polynoms gilt: den, dass die Wahl der Basis B keine Rolle spielt; anders
formuliert: Wählt man irgendwelche Basen B und C von V ,
c0 = χA (0) = det(A − 0 En ) = det(A) , so müssen die charakteristischen Polynome

d. h., dass der konstante Koeffizient von χA die Determinante χBM (ϕ)B = det(B M(ϕ)B − X En ) und
von A ist. 
χCM (ϕ)C = det(C M(ϕ)C − X En )

Für die restlichen Koeffizienten des charakteristischen Poly- gleich sein. Da je zwei Darstellungsmatrizen A und B ein
noms lassen sich keine solch prägnanten Formeln angeben. und desselben Endomorphismus zueinander ähnliche Dar-
stellungsmatrizen haben, d. h., da
Die Spur einer (quadratischen) Matrix A, das ist die Summe
a11 + · · · + ann der Hauptdiagonalelemente von A = (aij ) ∈ B = S −1 A S
506 14 Normalformen – Diagonalisieren und Triangulieren

Hintergrund und Ausblick: Lineare Algebra ohne Determinante


Üblicherweise bestimmt man die Eigenwerte einer komplexen Matrix A ∈ Cn×n als die Nullstellen des charakteristischen
Polynoms χA . Das charakteristische Polynom ist dabei über die Determinante erklärt: χA = det(A − X En ) ∈ C[X]. Wenn
man bedenkt, dass dies eine der wesentlichen Anwendungen der Determinante ist, so taucht natürlich die Frage auf, ob
sich der Aufwand lohnt, die Determinante über die Leibniz’sche Formel einzuführen und die Methoden zu ihrer Berechnung
zu entwickeln. Sheldon Axler publizierte 1994 eine Arbeit mit dem Titel Down with Determinants!, in der er zeigte, dass
man die Eigenwerte mit ihren Vielfachheiten auch ohne Determinanten ermitteln kann. Seinen Vorschlag, lineare Algebra
ohne Determinanten darzustellen, konkretisierte er dann in seinem Buch Linear Algebra Done Right, das im Springer-Verlag
erschienen ist.
Jede Matrix A ∈ Cn×n besitzt einen Eigenwert λ ∈ C. heit des Eigenwerts bestimmt. Dabei verstehen wir un-
ter der Vielfachheit des Eigenwerts λ die Vielfachheit
Das folgt mit dem Fundamentalsatz der Algebra, wonach
der Nullstelle λ im charakteristischen Polynom χA . Die
das charakteristische Polynom χA ∈ C[X] vom Grad n
Kenntnis dieser Vielfachheit spielt eine große Rolle bei
eine Nullstelle λ ∈ C hat.
der Diagonalisierbar- und Triangulierbarkeit.
Für diese Begründung haben wir die Determinante be-
Da wir ja χA bei der determinantenfreien linearen Alge-
nutzt, da χA durch diese gebildet wird. Wir begründen
bra nicht bestimmen wollen, müssen wir einen anderen
diesen Satz erneut, ohne die Determinante zu bemühen:
Weg finden, diese Vielfachheit zu ermitteln. Und das ist
Für jeden vom Nullvektor verschiedenen Vektor v ∈ Cn
möglich. Man berechnet für jeden gefundenen Eigenwert
sind die n + 1 Vektoren v, A v, . . . , An v ∈ Cn linear ab-
λ von A den sogenannten Hauptraum ker(A−λ En )n . Die
hängig, d. h., es existieren a0 , a1 , . . . , am ∈ C, die nicht
Dimension des Hauptraums ist die Vielfachheit des Eigen-
alle gleich null sind, mit
werts λ (wir werden das später auch noch begründen).
a0 v + a1 A v + · · · + am Am v = 0, (m ≤ n, am  = 0) . Auf diese Art und Weise können wir sukzessive die Ei-
genwerte mit ihren Vielfachheiten bestimmen, ohne dazu
Wir betrachten nun das folgende Polynom vom Grad m
die Determinante zu benutzen. Wir sind fertig, sobald die
mit diesen Koeffizienten a0 , a1 , . . . , am ∈ C, das wir
Summe der ermittelten Vielfachheiten n ergibt. So erhalten
aufgrund des Fundamentalsatzes der Algebra in faktori-
wir auch das charakteristische Polynom χA ohne Deter-
sierter Form angeben können:
minante.
p = a0 + a1 X + · · · + am X m = c(X − λ1 ) · · · (X − λm ), Das Verfahren ist umständlich, aber tatsächlich ist das
Bestimmen des charakteristischen Polynoms bei größe-
wobei c = am und λ1 , . . . , λm ∈ C die nicht notwen-
ren Matrizen auch nicht gerade einfach. Und man muss
dig verschiedenen Nullstellen von p sind. In das Polynom
auch bedenken, dass man durch dieses Verfahren auf die
p ∈ C[X] können wir wegen C ⊆ Cn×n (nach Identifi-
Determinante vollständig verzichten kann.
kation) die Matrix A für X einsetzen, man beachte den
Merksatz zum Einsetzen in Polynome auf Seite 90, und Ein Einwand mag sein, dass das Verfahren nur für kom-
erhalten plexe Matrizen geschildert wird. Aber auch das kann um-
gangen werden. Wir haben den Körper C benutzt, da über
p(A) = a0 En + a1 A + · · · + am Am ihm jedes Polynom in Linearfaktoren zerlegbar ist. Hat
= c (A − λ1 En ) · · · (A − λm En ) . man nun einen Körper K, über dem das Polynom p nicht
in Linearfaktoren zerfällt, so gibt es stets einen Körper
Für die letzte Gleichung beachte man, dass die Diagonal-
K, der den Körper K umfasst und über dem das Polynom
matrizen der Form λ En mit der Matrix A vertauschen,
p in Linearfaktoren zerfällt. Die Existenz eines solchen
d. h., (λ En )A = A (λ En ). Wegen
algebraisch abgeschlossenen Oberkörpers zu einem be-
0 = (a0 En + a1 A + · · · + am Am ) v liebigen Körper K – es ist etwa C ein algebraisch abge-
schlossener Oberkörper über R – zeigt man in der (nichtli-
= c (A − λ1 En ) · · · (A − λm En ) v
nearen) Algebra. Dieser Nachweis ist nicht ganz einfach,
muss eine der Matrizen A − λi En einen Rang echt kleiner für unsere Zwecke hier reicht es aus zu wissen, dass es
n haben, da v = 0. Das heißt aber, dass es zu dieser Matrix geht!
A − λi En einen Vektor w ∈ Cn \ {0} gibt mit
Wir können so für jeden Körper K die Eigenwerte mit ihren
(A − λi En ) w = 0 ⇔ A w = λi w . Vielfachheiten jeder Matrix A ∈ Kn×n ohne Benutzung
der Determinante bestimmen.
Das zeigt, dass A einen (komplexen) Eigenwert λi hat.
Jetzt machen wir einen letzten Schritt: Wir definieren nun
Hat man einen Eigenwert von A auf diese Art und Weise die Determinante von A ∈ Kn×n , quasi durch die Hinter-
bestimmt, so ist die Frage offen, wie man die Vielfach- tür, als das Produkt der Eigenwerte.
14.3 Berechnung der Eigenwerte und Eigenvektoren 507

mit einer invertierbaren Matrix S gilt, reicht es dazu aus, Wir gehen nun einen Schritt weiter und erklären, wie wir
folgendes Lemma zu beweisen: die Eigenräume und damit die Eigenvektoren zu den Eigen-
werten von A bestimmen können.
Lemma
Ist λ ∈ K ein Eigenwert der Matrix A ∈ Kn×n , so besteht der
Zueinander ähnliche Matrizen haben dasselbe charak-
Eigenraum aus dem Nullvektor und aus allen Eigenvektoren
teristische Polynom.
zum Eigenwert λ, und es gilt:
Beweis: Die zwei n × n-Matrizen A und B mit Einträgen : ;
EigA (λ) = v ∈ Kn | A v = λ v
aus einem Körper K seien zueinander ähnlich; d. h., es gelte : ;
= v ∈ Kn | (A − λ En ) v = 0 .
B = S −1 A S für eine invertierbare Matrix S ∈ Kn×n . Nun
berechnen wir das charakteristische Polynom von B, wobei
Also erhält man den Eigenraum EigA (λ) zum Eigenwert λ
wir S −1 S = En und den Determinantenmultiplikationssatz
durch Lösen des homogenen linearen Gleichungssystems
auf Seite 474 benutzen.
(A − λ En ) x = 0 .
χB = det(B − X En ) = det(S −1 A S − X S −1 S)
= det(S −1 ) det(A − X En ) det(S) Die Lösungsmenge dieses Systems ist der Eigenraum des
−1 Eigenwertes λ, und jeder vom Nullvektor verschiedene Vek-
= det(S ) det(S) det(A − X En )
tor dieses Eigenraums ist ein Eigenvektor zu dem Eigen-
= det(A − X En ) = χA . wert λ.
Damit ist gezeigt, dass die charakteristischen Polynome ähn-
licher Matrizen übereinstimmen. 
Bestimmung des Eigenraums zum Eigenwert λ
Ist λ ein Eigenwert von A, so ist die Lösungsmenge des
Übrigens folgen aus diesem Lemma in Verbindung mit dem homogenen linearen Gleichungssystems
Lemma auf Seite 505 erneut die bereits bewiesenen Behaup-
tungen, dass zueinander ähnliche Matrizen dieselbe Deter- (A − λ En ) x = 0
minante haben (Seite 505). Wir erläutern das ausführlich:
der Eigenraum zum Eigenwert λ.
Sind A und B ähnliche n×n-Matrizen, so gilt für die charak-
teristischen Polynome χA und χB nach dem eben bewiesenen
Lemma Ist λ ein Eigenwert der quadratischen Matrix A, so gibt es
χA = χB . einen Vektor v ∈ Kn , v = 0 mit A v = λ v. Also ist die
Dimension des Eigenraums EigA (λ) mindestens 1.
Mit dem Lemma auf Seite 505 gilt:

χA = (−1)n Xn + (−1)n−1 Sp A Xn−1 + · · · + det(A) ,


?
Wie lautet das System
χB = (−1)n Xn + (−1)n−1 Sp B Xn−1 + · · · + det(B) .
(A − λ En ) x = 0
Ein Koeffizientenvergleich liefert nun
in den Fällen A = En bzw. A = 0 für die entsprechenden
Sp A = Sp B und det(A) = det(B) . Eigenwerte der Einheits- bzw. Nullmatrix, und was sind die
entsprechenden Eigenräume?
Da die Nullstellen des charakteristischen Polynoms χA die
Eigenwerte von A sind, erhalten wir außerdem:
Wir bestimmen für die Beispiele, die wir auf Seite 504 be-
Folgerung trachtet haben, die jeweiligen Eigenräume.
Zueinander ähnliche Matrizen haben dieselben Eigen-
werte. Beispiel
Wir berechnen die Eigenräume der Matrix
' (
3 4
Den Eigenraum und damit die Eigenvektoren A= ∈ Z2×2
5 .
1 1
erhält man durch Lösen eines homogenen
linearen Gleichungssystems Wegen χA = (2 − X)2 hat A den einzigen Eigenwert 2.
Den Eigenraum EigA (2) von A zum Eigenwert 2 erhalten
Hat eine Matrix A nicht gerade Dreiecks- oder Diagonal- wir also als Lösungsmenge des homogenen Systems
gestalt, so bestimmt man im Allgemeinen die Eigenwerte von ' (
A systematisch durch Berechnen der Nullstellen des charak- 3−2 4 0
(A − 2 En ) v = 0 , d. h.
teristischen Polynoms χA von A. 1 1−2 0
508 14 Normalformen – Diagonalisieren und Triangulieren

Durch eine Zeilenumformung erhalten wir Wir berechnen die Eigenräume der Matrix
' ( ' ( ⎛ ⎞
1 4 0 1 4 0 −3 1 0 0 0
→ .
1 4 0 0 0 0 ⎜−1 −1 0 0 0 ⎟
⎜ ⎟
A=⎜ ⎜−3 1 −2 1 1 ⎟ ∈ C
⎟ 5×5
.
Damit erhalten wir den Eigenraum zum Eigenwert 2: ⎝−2 1 0 −2 1 ⎠
<' (= −1 1 0 0 −2
1
EigA (2) = .
1
Wegen χA = (−2 − X)5 ist −2 der einzige Eigenwert
Wir bestimmen die Eigenräume der Matrix von A.
⎛ ⎞ Den Eigenraum EigA (−2) von A zum Eigenwert −2 er-
1 2 2 halten wir als Lösungsmenge des homogenen Systems
A = ⎝2 −2 1 ⎠ ∈ C3×3 .
2 1 −2 (A+2 E5 ) v = 0 , d. h.
⎛ ⎞
−3+2 1 0 0 0 0
Wegen χA = (3 − X) (−3 − X)2 hat A die beiden ver- ⎜ −1 −1+2 ⎟
⎜ 0 0 0 0 ⎟
schiedenen Eigenwerte 3 und −3. ⎜ −3 ⎟
⎜ 1 −2+2 1 1 0 ⎟
Wir berechnen zuerst den Eigenraum EigA (3) von A zum ⎝ −2 ⎠
1 0 −2+2 1 0
Eigenwert 3. Wir erhalten ihn als Lösungsmenge des ho-
−1 1 0 0 −2+2 0
mogenen Systems

(A − 3 En ) v = 0 , d. h. Durch Zeilenumformungen erhalten wir


⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1−3 2 2 0 −1 1 0 0 0 0 −1 1 0 0 0 0
⎝ 2 −2 − 3 ⎜ ⎟ ⎜ ⎟
1 0⎠ ⎜ −1 1 0 0 0 0 ⎟ ⎜ 0 0 0 0 0 0 ⎟
⎜ ⎟ ⎜ ⎟
2 1 −2 − 3 0 ⎜ −3 1 0 1 1 0 ⎟→⎜ −3 1 0 1 1 0 ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎝ −2 1 0 0 1 0 ⎠ ⎝ −2 1 0 0 1 0 ⎠
Durch Zeilenumformungen erhalten wir
−1 1 0 0 0 0 0 0 0 0 0 0
⎛ ⎞ ⎛ ⎞
−2 2 2 0 −1 1 1 0
⎝ 2 −5 1 0 ⎠ → ⎝ 0 −3 3 0 ⎠ Also ist der Eigenraum
2 1 −5 0 0 3 −3 0 ⎛ ⎞ ⎛ ⎞
1 0
⎛ ⎞ ?⎜1⎟ ⎜0⎟@
1 0 −2 0 ⎜ ⎟ ⎜ ⎟
→ ⎝ 0 1 −1 0 ⎠ EigA (−2) = ⎜ ⎟ ⎜ ⎟
⎜1⎟ , ⎜1⎟ .
0 0 0 0 ⎝1⎠ ⎝0⎠
1 0 
Also erhalten wir als Eigenraum
?⎛2⎞@ Wenn λ ∈ K ein Eigenwert der Matrix A ∈ Kn×n ist, so hat
EigA (3) = ⎝1⎠ . das Gleichungssystem
1
(A − λ En ) x = 0
Nun berechnen wir noch den Eigenraum EigA (−3) von A
vom Nullvektor verschiedene Lösungen, da ja gerade die
zum Eigenwert −3. Wir erhalten ihn als Lösungsmenge
Eigenwerte jene Elemente sind, für welche der Rang der Ma-
des homogenen Systems
trix A − λ En echt kleiner als n ist.
(A+3 En ) v = 0 , d. h.
⎛ ⎞ Dies kann zur Kontrolle der Rechnung benutzt werden, da
1+3 2 2 0 die Berechnung des Kerns von A − λ En stark anfällig für
⎝ 2 −2+3 1 0⎠ Rechenfehler ist. Erhält man nach einer Rechnung als Eigen-
2 1 −2+3 0 raum den Nullraum, so hat man sich zwangsläufig verrechnet.
Durch Zeilenumformungen erhalten wir Es ist auch leicht, seine Ergebnisse zu überprüfen. Erhält man
⎛ ⎞ ⎛ ⎞ EigA (λ) = -b1 , . . . , br ., so überprüfe man, ob die Glei-
4 2 2 0 2 1 1 0 chungen A bi = λ bi für alle i = 1, . . . , r erfüllt sind. Dies
⎝2 1 1 0⎠→⎝0 0 0 0⎠
kann man oft im Kopf nachrechnen.
2 1 1 0 0 0 0 0
Also gilt für den Eigenraum: ?
?⎛−1⎞ ⎛−1⎞@ Prüfen Sie die Gleichungen A bi = λ bi für einige i =
1, . . . , r und EigA (λ) = -b1 , . . . , br . in den eben aufge-
EigA (−3) = ⎝ 0 ⎠ , ⎝ 2 ⎠ . führten Beispielen nach.
2 0
14.3 Berechnung der Eigenwerte und Eigenvektoren 509

Den Eigenraum eines Endomorphismus – und Wir betrachten diese, die Eigenräume erzeugenden Spalten-
damit die Eigenvektoren – erhält man mit vektoren als Koordinatenvektoren von 2×2-Matrizen bezüg-
dem Eigenraum einer Darstellungsmatrix lich der Basis E, damit erhalten wir die Eigenräume von ϕ:
<' ( ' (= <' (= <' (=
1 0 0 1 1 −1 1 1
Ist ϕ : V → V ein Endomorphismus des n-dimensionalen 0 1
,
1 0
,
1 −1
,
−1 −1
.
Vektorraums V mit der geordneten Basis B = (b1 , . . . , bn ),   
so erhält man die Eigenwerte von ϕ als die Nullstel- =Eigϕ (0) =Eigϕ (2) =Eigϕ (−2)
len des charakteristischen Polynoms der Darstellungsmatrix
B M(ϕ)B , die wir einfacher mit A bezeichnen, A = B M(ϕ)B : ?
χϕ = det(A − X En ) . Prüfen Sie nach, dass die angegebenen Vektoren tatsächlich
Eigenvektoren von ϕ sind.
Es seien λ1 , . . . , λr ∈ K die verschiedenen Eigenwerte von
ϕ. Nun berechnen wir die Eigenräume und damit die Eigen- 
vektoren der Matrix A:
(1)
EigA (λ1 ) = -b1 , . . . , b(1)
s1 . , Komplexe Eigenwerte und Eigenvektoren
.. reeller Matrizen treten paarweise auf
.
(r)
EigA (λr ) = -b1 , . . . , b(r)
sr . . Es ist oftmals mühsam und langwierig, die Eigenwerte und
Eigenräume einer Matrix zu bestimmen. Gerne greift man
Damit haben wir die Eigenvektoren der Darstellungsmatrix daher auf jeden Trick zurück, durch den man die Rechnungen
A = B M(ϕ)B des Endomorphismus ϕ : V → V bestimmt, vereinfachen oder abkürzen kann. Einen solchen Trick gibt
(i)
d. h. Vektoren bj ∈ Kn mit es bei komplexen Matrizen mit reellen Komponenten, d. h.
(i) (i) bei den Matrizen der Form
B M(ϕ)B bj = λi bj .
A = (aij ) ∈ Cn×n mit aij ∈ R .
Gesucht sind aber die Eigenvektoren des Endomorphismus ϕ.
Aber die findet man nun einfach mit dem Satz auf Seite 433.
(i) Zur Bestimmung der komplexen Eigenwerte und komplexen
Wir interpretieren die oben erhaltenen Eigenvektoren bj der
Darstellungsmatrix A = B M(ϕ)B als die Koordinatenvek- Eigenvektoren einer solchen Matrix A ist das folgende Er-
(i) (i)
toren bj = B bj der Eigenvektoren von ϕ bezüglich der gebnis nützlich.
Basis B, damit gilt dann:
Lemma
(i) (i)
B M(ϕ)B B bj = λi B bj . Für jede Matrix A ∈ Cn×n mit reellen Komponenten
aij gilt:
Beispiel Die Darstellungsmatrix des Endomorphismus (i) Ist λ ∈ C ein Eigenwert von A, so ist auch λ ein Eigenwert
ϕ : R2×2 → R2×2 , von A.
' (
1 1 (ii) Ist v = (vj ) ∈ Cn ein Eigenvektor von A zum Eigenwert
ϕ(X) = M X − X M mit M = λ, so ist v = (v j ) ein Eigenvektor von A zum Eigenwert λ.
1 1
bezüglich der geordneten kanonischen Basis E = (E11 , E12 ,
E21 , E22 ) von R2×2 ist Beweis: Das charakteristische Polynom χA einer Ma-
⎛ ⎞ trix A mit reellen Komponenten hat nur reelle Koeffizien-
0 −1 1 0 ten a0 , . . . , an , wie man der Leibniz’schen Formel für die
⎜−1 0 0 1 ⎟
A = E M(ϕ)E = ⎜ ⎝ 1 0 0 −1⎠
⎟ Determinante von Seite 471 entnimmt, d. h.:

0 1 −1 0 χA = a0 + a1 X + . . . + an X n ∈ R[X] .
Die Eigenwerte dieser Matrix A sind Ist λ ∈ C ein Eigenwert von A, so gilt χA (λ) = 0. Wegen
λ1 = 0, λ2 = 2, λ3 = −2 .
0 = 0 = χA (λ) = a0 + a1 λ + . . . + an λn
Als Eigenräume erhalten wir = a0 + a1 λ + . . . + an λ
n
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛⎞ n
? 1 0 @ ? 1 @ ? 1 @ = a0 + a1 λ + . . . + an λ
⎜0⎟ ⎜1⎟ ⎜ ⎟ ⎜1⎟
⎜ ⎟ , ⎜ ⎟ , ⎜−1⎟ , ⎜ ⎟ . = χA (λ)
⎝0⎠ ⎝1⎠ ⎝1⎠ ⎝−1⎠
1 0 −1 −1
   ist auch das konjugiert Komplexe λ eine Nullstelle von χA ,
=EigA (0) =EigA (2) =EigA (−2) also auch ein Eigenwert von A.
510 14 Normalformen – Diagonalisieren und Triangulieren

Ist v = (vj ) ∈ Cn ein Eigenvektor von A = (aij ) zum Induktionsvoraussetzung: Die Behauptung sei für r − 1
Eigenwert λ, so gilt A v = λ v. Da die Komponenten aij von Eigenvektoren zu verschiedenen Eigenwerten λ1 , . . . , λr−1
A reell sind, gilt: korrekt.
⎛ n ⎞ ⎛ n ⎞ Induktionsschritt: Es seien v 1 , . . . , v r Eigenvektoren zu ver-
j =1 a1j v j j =1 a1j vj
⎜ ⎟ ⎜ ⎟ schiedenen Eigenwerten λ1 , . . . , λr . Aus der Gleichung
⎠=⎜ ⎟.
(aij ) (v j ) = ⎝ .. ..
. ⎝ . ⎠
n
a v n
a v μ 1 v 1 + · · · + μr v r = 0 (14.1)
j =1 nj j j =1 nj j
mit μ1 , . . . , μr ∈ K folgt durch
Damit gilt A v = A v und daher
Multiplikation der Gleichung (14.1) mit der Matrix A:
Av = Av = λv = λv.
0 = A 0 =A (μ1 v 1 + · · · + μr v r )
Somit ist der komplexe Vektor v ein Eigenvektor zum Eigen-
= μ1 A v 1 + · · · + μr A v r
wert λ. 
= μ1 λ1 v 1 + · · · + μr λr v r

? und durch
Bestimmen Sie'die komplexen
( Eigenwerte und Eigenvekto- Multiplikation der Gleichung (14.1) mit dem Eigen-
0 1 wert λr :
ren der Matrix .
−1 0
0 = λr 0 = λr (μ1 v 1 + · · · + μr v r )
= μ1 λr v 1 + · · · + μr λr v r .
14.4 Algebraische und Durch Gleichsetzen erhalten wir
geometrische Vielfachheit μ1 λ1 v 1 + · · · + μr λr v r = μ1 λr v 1 + · · · + μr λr v r .

Im Folgenden formulieren wir alle Aussagen für Matrizen. Es gilt somit:


Die entsprechenden Aussagen für Endomorphismen endlich-
dimensionaler Vektorräume erhält man dann durch Übergang (λr − λ1 ) μ1 v 1 + · · · + (λr − λr−1 ) μr−1 v r−1 = 0 .
zu Darstellungsmatrizen von Endomorphismen.
Nach Induktionsvoraussetzung sind die Vektoren
Nach dem Satz auf Seite 502 ist eine Matrix A ∈ Kn×n ge- v 1 , . . . , v r−1 linear unabhängig, sodass wegen λr − λi = 0
nau dann diagonalisierbar, wenn es eine Basis des Kn aus für alle i = 1, . . . , r − 1 die Koeffizienten μ1 , . . . , μr−1
Eigenvektoren von A gibt. Wir wollen nun ein Kriterium da- allesamt null sind:
für herleiten, wann eine solche Basis aus Eigenvektoren von
A existiert. Dazu ordnen wir jedem Eigenwert λ einer Ma- μ1 = · · · = μr−1 = 0 .
trix A zwei natürliche Zahlen zu, zum einen die algebraische
Vielfachheit, zum anderen die geometrische Vielfachheit. Der Aus der Gleichung (14.1) folgt nun μr = 0, da v r = 0 gilt.
Fall, dass diese beiden Zahlen für jeden Eigenwert λ von A Damit ist bewiesen:
übereinstimmen, liefert die wesentliche Aussage für die Exi-
stenz einer Basis des Kn aus Eigenvektoren von A. Dass wir Lineare Unabhängigkeit von Eigenvektoren
dabei die Eigenwerte einzeln, also unabhängig voneinander Eigenvektoren zu verschiedenen Eigenwerten sind linear
betrachten dürfen, liegt an den folgenden Ausführungen. unabhängig.

Eigenvektoren zu verschiedenen Eigenwerten ?


Welche Konsequenz hat dieses Ergebnis für eine Matrix
sind linear unabhängig
A ∈ Kn×n mit n verschiedenen Eigenwerten ?
Es seien v 1 , . . . , v r Eigenvektoren zu verschiedenen Eigen-
werten λ1 , . . . , λr einer Matrix A ∈ Kn×n :

A v 1 = λ1 v 1 , . . . , A v r = λr v r . Die algebraische Vielfachheit eines Eigen-


werts λ ist die Vielfachheit der Nullstelle λ
Wir zeigen mit vollständiger Induktion nach der natürlichen
im charakteristischen Polynom
Zahl r, dass die Vektoren v 1 , . . . , v r linear unabhängig sind.
Induktionsanfang: Die Behauptung ist korrekt, da v 1  = 0 Wir zerlegen das charakteristische Polynom χA einer Matrix
linear unabhängig ist. A ∈ Kn×n soweit wie möglich in Linearfaktoren (λi − X),
14.4 Algebraische und geometrische Vielfachheit 511

wobei wir gleiche Linearfaktoren unter Exponenten ki sam- In dieser Situation gilt für die Summe der Exponenten
meln, siehe auch den Abschnitt auf Seite 94: k1 + · · · + kr = n. Die Matrix A hat dann die verschiede-
nen Eigenwerte λ1 , . . . , λr mit den jeweiligen algebraischen
χA = (λ1 − X)k1 · · · (λr − X)kr p ∈ K[X] . Vielfachheiten k1 , . . . , kr , insgesamt also n nicht notwendig
verschiedene Eigenwerte, die genau dann verschieden sind,
Dabei ist p ∈ K[X] der nicht weiter durch Linearfaktoren wenn n = r gilt.
teilbare Anteil des Polynoms χA . Das bedeutet, dass p keine
weiteren Nullstellen in K hat. Die Nullstellen λ1 , . . . , λr Im Fall K = C zerfällt für jede Matrix A ∈ Cn×n das Poly-
von χA sind die Eigenwerte von A. nom χA in Linearfaktoren, da wegen des Fundamentalsatzes
der Algebra jedes nicht konstante komplexe Polynom eine
Man nennt die Vielfachheit k der Nullstelle λ im charakte- Nullstelle in C hat. Damit können wir für jede komplexe n×n-
ristischen Polynom χA die algebraische Vielfachheit des Matrix A mit dem charakteristischen Polynom χA ∈ C[X]
Eigenwerts λ, und man sagt auch λ ist ein k-facher Eigen- folgern:
wert der Matrix A. Für die algebraische Vielfachheit k des
Eigenwerts λ benutzen wir auch die Schreibweise ma (λ), der
Buchstabe m steht dabei für multiplicity. Zur Anzahl der Eigenwerte komplexer Matrizen
Jede komplexe n × n-Matrix A ∈ Cn×n , n ∈ N, hat n
Es ist manchmal nützlich, die Eigenwerte mit ihren entspre-
nicht notwendig verschiedene Eigenwerte.
chenden algebraischen Vielfachheiten zu zählen, d. h., man
fasst einen k-fachen Eigenwert λ, k ≥ 2, auch auf als k (nicht
verschiedene) Eigenwerte.
Die geometrische Vielfachheit ist stets kleiner
Beispiel oder gleich der algebraischen Vielfachheit
Ist χA = X4 − 2 X3 + 2 X2 − 2 X + 1 ∈ R[X], so gilt:
Die algebraische Vielfachheit eines Eigenwerts λ ist die Viel-
χA = (1 − X)2 (1 + X 2 ) fachheit der Nullstelle λ im charakteristischen Polynom χA .
Es gilt ein enger Zusammenhang zwischen der algebraischen
mit p = X2 +1. Die Matrix A hat also den einzigen Eigen- und der geometrischen Vielfachheit.
wert 1 der algebraischen Vielfachheit 2 oder kürzer: Die
Matrix A hat den zweifachen Eigenwert 1 oder ma (1) = 2. Unter der geometrischen Vielfachheit des Eigenwerts λ
Ist χA = X4 − 2 X3 + 2 X2 − 2 X + 1 ∈ C[X], so gilt: einer Matrix A versteht man die Dimension des Eigenraums
EigA (λ), also dim EigA (λ), wir schreiben mg (λ) für die geo-
χA = (1 − X)2 (i + X) (−i + X) . metrische Vielfachheit.

In diesem Fall hat die Matrix A den zweifachen Eigenwert Das kann man sich einfach merken: Geometrie spielt sich in
1 und die jeweils einfachen Eigenwerte i und −i, d. h., Räumen ab, daher ist es klar, den Dimensionsbegriff mit der
ma (1) = 2, ma (i) = 1, ma (−i) = 1. geometrischen Vielfachheit zu verknüpfen. Die Algebra be-
Ist χA = X2 + 1 ∈ Z2 [X], so gilt: schäftigt sich mit dem Auflösen von Polynomen, daher wird
man den Exponenten eines Linearfaktors eines Polynoms mit
χA = (1 + X)2 . der algebraischen Vielfachheit bezeichnen.

In diesem Fall hat die Matrix A den zweifachen Eigen- Der Zusammenhang zwischen geometrischer und algebra-
wert 1. 
ischer Vielfachheit eines Eigenwerts ist folgender:

? Geometrische und algebraische Vielfachheit


Welche algebraischen Vielfachheiten haben die Eigenwerte Ist λ ein Eigenwert der Matrix A, so ist die geometri-
der komplexen Matrix A mit dem charakteristischen Poly- sche Vielfachheit von λ zwar größer gleich 1, aber stets
nom kleiner oder gleich der algebraischen Vielfachheit von
λ, d. h.,
χA = (1 − X)2 (3 + X)4 (X2 + X + 1) ∈ C[X] ? 1 ≤ mg (λ) ≤ ma (λ) .

In dem Abschnitt zu Polynomen auf Seite 94 haben wir eine


suggestive Bezeichnung eingeführt: Wir sagen, das charak- Beweis: Es sei λ ∈ K ein Eigenwert der Matrix A ∈ Kn×n
teristische Polynom χA einer n × n-Matrix A ∈ Kn×n vom mit der algebraischen Vielfachheit ma (λ) und der geome-
Grad n zerfällt über K in Linearfaktoren, falls trischen Vielfachheit r = mg (λ). Wir wählen eine Ba-
sis {v 1 , . . . , v r } des Eigenraums EigA (λ) der Dimension
χA = (λ1 − X)k1 · · · (λr − X)kr r = mg (λ) und ergänzen diese durch Vektoren v r+1 , . . . , v n
zu einer Basis B des Vektorraums Kn . Die Darstellungs-
mit verschiedenen λ1 , . . . , λr ∈ K gilt. matrix B M(ϕA )B der linearen Abbildung ϕA : Kn → Kn ,
512 14 Normalformen – Diagonalisieren und Triangulieren

v → A v bezüglich dieser Basis B hat die Form Dabei haben wir benutzt, dass wegen der Invertierbarkeit von
⎛ ⎞ S und S −1 die Dimensionen der Kerne von S −1 (B −λi En ) S
λ 0
und B − λi En übereinstimmen (siehe die Folgerung auf
⎜ .. ⎟
⎜ . B⎟ Seite 455).
B M(ϕA )B = ⎜


⎝0 λ ⎠
0 C
Zerfällt χA , und ist die algebraische
mit passenden Matrizen B ∈ Kr×(n−r) , C ∈ K(n−r)×(n−r) Vielfachheit für jeden Eigenwert gleich der
und 0 ∈ K(n−r)×r .
geometrischen, so ist A diagonalisierbar
Nach dem Satz auf Seite 476 gilt (man beachte die Block-
dreiecksgestalt der Matrix B M(ϕA )B ): Wir nehmen an, dass das charakteristische Polynom χA einer
Matrix A ∈ Kn×n über K in Linearfaktoren zerfällt, d. h.,
χA = χBM (ϕA )B = (λ − X)r χC .
Somit ist die algebraische Vielfachheit ma (λ) mindestens r, χA = (λ1 − X)k1 · · · (λr − X)kr
da evtl. χC noch durch λ − X teilbar ist. 
mit verschiedenen λ1 , . . . , λr ∈ K. Es sind λ1 , . . . , λr die
Eigenwerte von A mit den jeweiligen algebraischen Viel-
Der Extremfall, nämlich dann wenn bei der zweiten Unglei- fachheiten k1 , . . . , kr , wobei k1 + · · · + kr = n.
chung Gleichheit anstelle von kleiner oder gleich gilt, d. h.,
mg (λ) = ma (λ), liefert das wesentliche Kriterium für die Ist nun für jeden der Eigenwerte λ1 , . . . , λr die geometri-
Existenz einer Basis des Kn , bestehend aus Eigenvektoren sche Vielfachheit gleich der algebraischen, so ist die Summe
einer Matrix A ∈ Kn×n . der Dimensionen der Eigenräume gerade die Dimension des
Vektorraums Kn .
Bevor wir dieses Kriterium formulieren, halten wir noch ein
Ergebnis für zueinander ähnliche Matrizen fest. Nach dem Weil Eigenvektoren zu verschiedenen Eigenwerten linear un-
Lemma auf Seite 507 haben zueinander ähnliche Matrizen abhängig sind (siehe den Satz zur linearen Unabhängigkeit
das gleiche charakterisitsche Polynom und damit auch die von Eigenvektoren auf Seite 510), erhalten wir in dieser Si-
gleichen Eigenwerte. Es gilt noch mehr: tuation die Existenz einer Basis B des Kn , die aus Eigen-
vektoren v 1 , . . . , v n der Matrix A besteht. Dabei trägt je-
Lemma der Eigenraum genauso viele linear unabhängige Vektoren
Die Eigenwerte zueinander ähnlicher Matrizen haben die zu dieser Basis bei, wie die algebraische Vielfachheit dieses
gleichen algebraischen und geometrischen Vielfachheiten. Eigenwerts angibt.

Beweis: Die Matrizen A und B aus Kn×n seien zuein- 3. Kriterium für Diagonalisierbarkeit
ander ähnlich, es gelte S −1 A S = B mit der invertierbaren
Eine Matrix A ∈ Kn×n ist genau dann diagonalisierbar,
Matrix S. Die charakteristischen Polynome χA und χB dieser
wenn
beiden Matrizen stimmen nach obiger Bemerkung überein.
das charakteristische Polynom χA in Linearfaktoren
Wir zerlegen das Polynom χA = χB soweit wie möglich in
zerfällt:
verschiedene Linearfaktoren
χA = (X − λ1 )ki · · · (X − λr )kr p = χB χA = (λ1 − X)ma (λ1 ) · · · (λr − X)ma (λr ) ,

mit einem weiter nicht über K in Linearfaktoren zerfallenden und


Polynom p ∈ K[X]. Hieraus folgt bereits die Behauptung für für jeden Eigenwert die algebraische Vielfachheit
die algebraischen Vielfachheiten ki . gleich der geometrischen Vielfachheit ist:
Wir begründen, dass auch die geometrischen Vielfachheiten
ma (λ1 ) = mg (λ1 ), . . . , ma (λr ) = mg (λr ) .
übereinstimmen, d. h., dass

g (λi ) = dim EigA (λi ) = dim EigB (λi ) = mg (λi )


mA B

für i = 1, . . . , r gilt. Für ein solches i gilt: Beweis: Es ist nur noch ⇒ zu begründen. Die Matrix A sei
also diagonalisierbar, und es seien λ1 , . . . , λr die verschie-
g (λi ) = dim(EigA (λi )) = dim(ker(A − λi En ))
mA denen Eigenwerte von A. Nach dem Kriterium für Diagona-
= dim(ker(S −1 B S − λi S −1 S)) lisierbarkeit auf Seite 502 existiert eine Basis {b1 , . . . , bn }
des Kn aus Eigenvektoren von A, und weil die geometrische
= dim(ker(S −1 (B − λi En ) S)) Vielfachheit stets kleiner gleich der algebraischen ist, gilt:
= dim(ker(B − λi En ))
!
r !
r
= dim(EigB (λi )) n= mg (λi ) ≤ ma (λi ) ≤ deg(χA ) = n .
= mB
g (λi ) . i=1 i=1
14.4 Algebraische und geometrische Vielfachheit 513

Anstelle der beiden ≤ gilt also sogar =. Aus der ersten entste- Die Matrix ' (
henden Gleichheit folgt sogleich mg (λi ) = ma (λi ) für alle A=
3 4
∈ Z2×2
5
i = 1, . . . , r und aus der zweiten entstehenden Gleichheit 1 1
folgt, dass das Polynom χA zerfällt. 
hat wegen

χA = (2 − X)2
Wir erhalten hieraus die Folgerung:
den einzigen Eigenwert 2 der algebraischen Vielfach-
Folgerung
heit 2. Der Eigenraum EigA (2) von A lautet
Hat eine n × n-Matrix n verschiedene Eigenwerte, so ist
<' (=
sie diagonalisierbar. 1
EigA (2) = .
1
Das folgt aus obigem Kriterium, weil in diesem Fall das cha-
rakteristische Polynom zerfällt und für jeden Eigenwert die Damit hat der Eigenwert 2 die geometrische Vielfach-
algebraische Vielfachheit, die gleich 1 ist, mit der geometri- heit 1. Weil die geometrische Vielfachheit des Eigenwerts
schen Vielfachheit, die größer gleich 1 sein muss, überein- 2 echt kleiner der algebraischen ist, ist die Matrix nicht
stimmt. diagonalisierbar.
Dieses Ergebnis erwarteten wir bereits als Antwort auf die Die Matrix ⎛ ⎞
1 3 6
Frage auf Seite 510.
A = ⎝−3 −5 −6⎠
Um eine diagonalisierbare Matrix A ∈ Kn×n zu diagonali- 3 3 4
sieren, geht man zweckmäßigerweise so vor, wie wir es in
hat das charakteristische Polynom χA = −(2+X)2 (4−X),
der Übersicht auf Seite 515 geschildert haben.
also den zweifachen Eigenwert −2 und einfachen Eigen-
Wir führen das Verfahren an Beispielen durch. wert 4. Wir erhalten als Eigenräume
?⎛−1⎞ ⎛−2⎞@ ?⎛ 1 ⎞@
Beispiel
Für die Matrix EigA (−2) = ⎝ 1 ⎠ , ⎝ 0 ⎠ , EigA (4) = ⎝−1⎠ .
⎛ ⎞ 0 1 1
1 2 2
A = ⎝2 −2 1 ⎠ ∈ R3×3 Damit stimmen für jeden Eigenwert geometrische und al-
2 1 −2 gebraische Vielfachheit überein, d. h., dass die Matrix A
diagonalisierbar ist. Mit der Matrix
haben wir bereits in den Beispielen auf Seite 507 die
Eigenwerte und Eigenräume bestimmt. Wir erhielten S = (b1 , b2 , b3 ) ,
?⎛2⎞@ ?⎛−1⎞ ⎛−1⎞@ wobei
EigA (3) = ⎝1⎠ , EigA (−3) = ⎝ 0 ⎠ , ⎝ 2 ⎠ . ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
−1 −2 1
1 2 0
b1 = ⎝ 1 ⎠ , b2 = ⎝ 0 ⎠ , b3 = ⎝−1⎠ ,
Damit existiert eine Basis des R3 aus Eigenvektoren der 0 1 1
Matrix A. Die Matrix ist also diagonalisierbar, und es gilt gilt:
mit den Vektoren ⎛ ⎞
−2 0 0
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
2 −1 −1 S −1 A S = ⎝ 0 −2 0⎠ .
b 1 = ⎝ 1⎠ , b 2 = ⎝ 0 ⎠ , b 3 = ⎝ 2 ⎠ 0 0 4
1 2 0
?
und Wie ändert sich die Diagonalmatrix, wenn man in der Ma-
S = (b1 , b2 , b3 ) trix S zwei Spalten vertauscht?
die Gleichung:

⎛ ⎞
3 0 0
S −1 A S = ⎝0 −3 0 ⎠ Kennt man bereits einige Eigenwerte einer Matrix, etwa
0 0 −3 durch geometrische Überlegungen, so kann man gelegent-
lich mit einer einfachen Rechnung die restlichen Eigenwerte
? dieser Matrix bestimmen. Das liegt daran, dass das Produkt
Prüfen Sie dies nach, indem Sie S −1 A S tatsächlich be- aller Eigenwerte und die Summe aller Eigenwerte einer Ma-
rechnen. trix A bekannte bzw. oftmals leicht bestimmbare Kenngrößen
von A sind.
514 14 Normalformen – Diagonalisieren und Triangulieren

Unter der Lupe: Das 3. Kriterium zur Diagonalisierbarkeit


Ein Kriterium zur Diagonalisierbarbeit einer Matrix A ∈ Kn×n erhalten wir durch Angabe von Eigenschaften der Matrix A,
die notwendig und hinreichend dafür sind, dass die Matrix A diagonalisierbar ist. Im dritten Kriterium zur Diagonalisierbarkeit
haben wir zwei solche Eigenschaften von A gefunden, es gilt nämlich: Eine Matrix A ∈ Kn×n ist genau dann diagonalisierbar,
wenn
(i) das charakteristische Polynom χA in Linearfaktoren zerfällt: χA = (λ1 − X)ma (λ1 ) · · · (λr − X)ma (λr ) und
(ii) für jeden Eigenwert die algebraische Vielfachheit gleich der geometrischen Vielfachheit ist: ma (λi ) = mg (λi ) für
i = 1, . . . , r.

a (λ) = mg (λ) für jeden Eigenwert λ gilt. Da nun


stets mD
Es sind zwei Richtungen zu zeigen: D

Wenn die Matrix A diagonalisierbar ist, so gelten (i) die algebraischen und geometrischen Vielfachheiten der
und (ii). jeweils gleichen Eigenwerte ähnlicher Matrizen überein-
Wenn (i) und (ii) gelten, so ist die Matrix A diagonali- stimmen, erhalten wir
sierbar.
g (λ) = mg (λ) = ma (λ) = ma (λ) ,
mA D D A
Wir beginnen mit der ersten dieser beiden Richtungen. Es
sei also A ∈ Kn×n eine diagonalisierbare Matrix. Wir d. h., dass (ii) gilt.
wollen zeigen, dass das charakteristische Polynom χA in Der Beweis ist naheliegend und durchsichtig aber etwas
Linearfaktoren zerfällt. Dazu bietet sich das folgende na- lang. Durch einen kleinen Trick können wir den Nach-
heliegende Vorgehen an: Da A diagonalisierbar ist, ist A weis von (i) und (ii) viel kürzer fassen: Ist A ∈ Kn×n
zu einer Diagonalmatrix D = diag(λ1 , . . . , λn ) ähnlich. diagonalisierbar, so gibt es zu den r verschiedenen Eigen-
Da die beiden Matrizen ähnlich sind, haben sie dasselbe werten λ1 , . . . , λr ∈ K eine Basis (b1 , . . . , bn ) des Kn
charakteristische Polynom. Und weil das charakteristische aus Eigenvektoren von A. Somit ist die Summe der Di-
Polynom einer Diagonalmatrix D = diag(λ1 , . . . , λn ) in mensionen der Eigenräume von A gleich n, d. h., es gilt
Linearfaktoren zerfällt, zerfällt auch das charakteristische n = ri=1 mg (λi ).
Polynom von A in solche:
Andererseits gilt ri=1 ma (λi ) ≤ n, da die Zahlen ma (λi )
χA = χD = (λ1 − X) · · · (λn − X) .
die Vielfachheiten der Nullstellen λi des charakteristi-
Damit ist bereits (i) gezeigt. Dieser Beweis basiert auf der schen Polynoms χA vom Grad n sind.
naheliegenden Idee, dass die Matrix A zu einer Diagonal-
Hat man nun erst einmal diese zwei Ungleichungen, so
matrix ähnlich ist. Wir können nun auch versuchen, die
erhält man wegen mg (λi ) ≤ ma (λi ) für jedes λi :
Aussage (ii) auf diese Art zu zeigen. Wir wollen zeigen,
dass die algebraische Vielfachheit ma (λ) für jeden Eigen- !
r !
r

wert λ von A gleich der geometrischen Vielfachheit mg (λ) n= mg (λi ) ≤ ma (λi ) ≤ n


ist. Wir benutzen wieder, dass A zu einer Diagonalmatrix i=1 i=1

D = diag(λ1 , . . . , λn ) ähnlich ist. Wir können die obige und damit wie im Beweis im Text (i) und (ii).
Beweisidee wieder aufgreifen und gehen den Umweg über Zur zweiten Richtung: Wenn (i) und (ii) gelten, so ist die
die zu A ähnliche Diagonalmatrix D: Wir zeigen, dass die Matrix A diagonalisierbar:
Behauptung für die Diagonalmatrix D gilt und wegen der
Je mehr Linearfaktoren sich vom charakteristischen Po-
Ähnlichkeit dann auch für A.
lynom χA abspalten lassen, um so mehr Eigenwerte hat
Die ähnlichen Matrizen A und D haben die gleichen cha- die Matrix A ∈ Kn×n . Zerfällt das Polynom χA gar, d. h.
rakteristischen Polynome und somit auch die gleichen Ei- es gilt (i), so gibt es die maximale Anzahl von Eigen-
genwerte λ1 , . . . , λr : werten, die mit ihrer algebraischen Vielfachheit entspre-
χA = (λ1 − X)k1 · · · (λr − X)k1 = χD . chend gezählt gerade n = dim Kn ist. Gilt nun zudem (ii)
Daher haben die gleichen Eigenwerte von A und D auch mg (λ) = ma (λ) für jeden Eigenwert λ von A, so gibt es
jeweils die gleichen algebraischen Vielfachheiten. Bei zu jedem Eigenwert die maximal mögliche Zahl linear un-
einer Diagonalmatrix ist aber natürlich die algebraische abhängiger Eigenvektoren. Zu jedem Eigenwert λ von A
Vielfachheit eines Eigenwerts stets gleich der geometri- stecken wir nun diese mg (λ) = ma (λ) vielen linear unab-
schen Vielfachheit dieses Eigenwerts, da die Dimension hängigen Eigenvektoren in eine Basis Bλ . Da Eigenvekto-
des Eigenraums EigD (λ) wegen ren zu verschiedenen Eigenwerten linear unabhängig sind,
⎛ ⎞ ist die Vereinigung B = Bλ1 ∪ · · · ∪ Bλr all dieser Basen
λ1 − λ 0
⎜ .. ⎟ Bλi für die verschiedenen Eigenwerte λ1 , . . . , λr von A
EigD (λ) = ker ⎝ . ⎠ linear unabhängig. Und da nun die Summe der geometri-
0 λr − λ schen Vielfachheiten mg (λi ) = |Bλi | gerade die Summe
gleich der Anzahl der Einträge λ in der Diagonalen ist, der algebraischen Vielfachheiten ma (λi ), also nach (ii)
und diese Anzahl ist gerade die algebraische Vielfachheit gleich n ist, gilt |B| = n. Also ist B eine Basis des Kn aus
von λ. Damit ist gezeigt, dass bei einer Diagonalmatrix D Eigenvektoren von A.
14.4 Algebraische und geometrische Vielfachheit 515

Übersicht: Diagonalisieren einer Matrix


Gegeben ist eine diagonalisierbare Matrix A ∈ Kn×n . Das Bestimmen einer invertierbaren Matrix S, die die Eigenschaft hat,
dass D = S −1 A S eine Diagonalmatrix ist, nennt man auch Diagonalisieren von A. Als Spalten der Matrix S wählt man
dabei die Vektoren einer Basis des Kn aus Eigenvektoren von A. Zum Diagonalisieren dieser Matrix A geht man meistens wie
folgt vor:

Bestimme das charakteristische Polynom χA von A. aus Eigenvektoren der Matrix A zu einer geordneten
Zerlege χA in Linearfaktoren Basis B = (b1 , . . . , bn ).
Mit der Matrix S = (b1 , . . . , bn ) gilt dann die Glei-
χA = (λ1 − X)ma (λ1 ) · · · (λr − X)ma (λr ) .
chung: ⎛ ⎞
Die r verschiedenen Nullstellen λ1 , . . . , λr sind die λ1 · · · 0
⎜ .. . . .. ⎟ −1
Eigenwerte der Matrix A. ⎝. . . ⎠ = S AS .
Bestimme Basen B1 , . . . , Br der r Eigenräume 0 · · · λn
EigA (λ1 ), . . . , EigA (λr ), dabei gilt:
Diese Gleichung muss nicht nachgeprüft werden, sie
|B1 | = ma (λ1 ), . . . , |Br | = ma (λr ) . gilt bereits nach Konstruktion. Es ist dabei bi ein Ei-

r genvektor zum Eigenwert λi – man achte also auf die
Ordne die Basisvektoren der Basis B = Bi des Kn Anordnung der Basisvektoren.
i=1

Die Determinante ist das Produkt der ?


Eigenwerte, die Spur die Summe der Man prüfe diese beiden Formeln an einigen bisher betrach-
Eigenwerte teten Matrizen, deren charakteristische Polynome in Linear-
faktoren zerfallen.
Wenn zwei Matrizen zueinander ähnlich sind, so haben sie
dieselbe Determinante und dieselbe Spur. Wir betrachten nun
die Situation, dass eine dieser beiden Matrizen eine Diago- Diese Formeln sind nützlich. Zum einen hat man eine Kon-
nalmatix ist. Die Determinante und die Spur einer Diagonal- trollmöglichkeit zu den berechneten Eigenwerten, zum an-
matrix sind gerade das Produkt und die Summe der Diago- deren kann man gelegentlich ohne Bestimmung des charak-
naleinträge. teristischen Polynoms unbekannte Eigenwerte einer Matrix
erschließen, wenn man bereits Informationen über die Matrix
Es sei A ∈ Kn×n zu einer Diagonalmatrix D ähnlich: hat. Zum Beispiel hat die Matrix
⎛ ⎞ ⎛ ⎞
a11 · · · a1n λ1 0 ' (
⎜ .. . . . ⎟ ⎜ ⎟ 1 1
.. A=
⎝ . . .. ⎠ ∼ ⎝ . ⎠ 2 2
an1 · · · ann 0 λn
  aufgrund der linearen Abhängigkeit der Zeilen offensichtlich
=A =D den Eigenwert 0. Wegen Sp A = 3 muss der zweite Eigen-
so erhalten wir: wert 3 sein. Wir führen ein weiteres Beispiel an.
det A = det D = λ1 · · · λn und
Beispiel Wir betrachten als Beispiel eine komplexe 4 × 4-
Sp A = Sp D = λ1 + · · · + λn . Matrix A, von der wir wissen, dass sie die Eigenwerte 1 und
Damit ist gezeigt: −1 hat – eine solche Information hat man etwa dann, wenn es
vom Nullvektor verschiedene Vektoren gibt, die auf sich bzw.
Der Zusammenhang zwischen Spur, Determinante auf ihr Negatives abgebildet werden. Gilt etwa det A = −9
und den Eigenwerten einer Matrix und Sp A = −6, so folgt mit den angegebenen Formeln für
die beiden unbekannten Eigenwerte λ1 und λ2
Es seien λ1 , . . . , λn die nicht notwendig verschiedenen
Eigenwerte einer diagonalisierbaren n × n-Matrix A ∈ λ1 λ2 = 9 und λ1 + λ2 = −6 ,
Kn×n . Dann gilt:
woraus man λ1 = −6 − λ2 und −λ22 − 6 λ2 − 9 = 0, also
Sp A = λ1 + · · · + λn , det A = λ1 · · · λn . λ2 = −3 = λ1 erhält. 

Kommentar: Dieses Ergebnis gilt sogar noch etwas allge- Kommentar: Wir haben ein Kriterium für die Diagonali-
meiner für alle Matrizen, deren charakteristisches Polynom sierbarkeit einer Matrix A hergeleitet: Wenn das charakteri-
in Linearfaktoren zerfällt. Wir begründen das auf Seite 544. stische Polynom χA in Linearfaktoren zerfällt und für jeden
516 14 Normalformen – Diagonalisieren und Triangulieren

Beispiel: Die Fibonacci-Zahlen und ihre Näherungen


Wir möchten eine explizite Formel für die Fibonacci-Zahlen a0 , a1 , a2 , . . . bestimmen, die rekursiv definiert sind durch
a0 = 1, a1 = 1, an+1 = an + an−1 für n ∈ N ,
man vergleiche hierzu auch Seite 278.

Problemanalyse und Strategie: Wir geben diese Rekursionsvorschrift durch eine Matrix A ∈ R2×2 wieder und
gelangen durch Berechnen von Potenzen von A zu einer guten Näherungslösung für hinreichend große n.

Lösung: Daraus liest man


Wir bestimmen zunächst die Matrix A ∈ R2×2 mit ⎛ √ n+1  √ n+1 ⎞
' ( ' (
an a 1 1+ 5 1− 5
= An 0 , n ∈ N an = √ ⎝ − ⎠,
an+1 a1 5 2 2
und berechnen anschließend explizit die Potenzen An . Es ' (
gilt: an
' ( ' (' ( ' (n ' ( für n ∈ N ab, und zwar durch Berechnung von =
an+1
an 0 1 an−1 0 1 a0 ' ( ' (
= = ··· = , a0 1
an+1 1 1 an 1 1 a1 An = An oder einfacher durch die Beobach-
a1 1
insbesondere also tung, dass die durch b0 = 0, b1 = 1 und bn = bn−1 +bn−2
' (
0 1 für n ≥ 2 definierte Folge (bn ) die Bedingung bn+1 = an
A= .
1 1 erfüllt, woraus folgt:
Die Eigenwerte von A sind die Nullstellen des charakte- ' ( ' ( ' ( ' (
ristischen Polynoms an−1 bn n b0 n 0
) ) = =A =A .
)−X an bn+1 b1 1
1 ))
χA = )) = X2 − X − 1
1 1 − X) Ein Vorteil dieser Matrizendarstellung der Fibonacci-
 √  √ 
1+ 5 1− 5 Zahlen besteht darin, dass man an ihr das Wachstumsver-
= −X −X . halten von
2 2 √ an gut erkennen kann. Da der zweite Summand
wegen ( 5 − 1)/2 ≈ 0.618 sehr schnell klein wird, gilt:
Die Eigenvektoren erhalten

wir als Lösungen der Glei-
1± 5
 √ n+1
chungsysteme (A − 2 E2 | 0), und zwar erhalten wir 1 1+ 5
  √ an ≈ √
1√ 1+ 5 5 2
b1 = 1+ 5 zum Eigenwert und
2
2
  in guter Näherung, und an ergibt sich für jedes n aus dieser

1√ 1− 5 Näherung durch Runden zur nächsten ganzen Zahl:
b2 = 1− 5 zum Eigenwert .
2
2 n an Näherung
Wir setzen S = (b1 , b2 ) und erhalten 0 1 0.723 606 798 0
 √ 
1+ 5
0√ 1 1 1.170 820 394
−1
S AS = 2
1− 5
= D. 2 2 1.894 427 192
0 2 3 3 3.065 247 586
Und nun kommt der entscheidende Trick. Wegen A = 4 5 4.959 674 780
S D S −1 gilt: 5 8 8.024 922 370
An = (S D S −1 )n = 6 13 12.984 597 15
7 21 21.009 519 52
= S D S −1 S D S
−1
. . . S D S −1 = S D n S −1 .
8 34 33.994 116 68
n−mal
Und dieses Produkt S D n S −1 ist nun wegen der Diagonal- √
form von D einfach zu berechnen. Zur Abkürzung setzen Kommentar: Die Zahl a = 1+2 5 ist übrigens das Ver-
√ √
1+ 5 1− 5 hältnis des goldenen Schnitts: Wegen derlinearen Abhän-
wir a = 2 und b = 2 . Wir erhalten An durch −a
Berechnen des Matrixprodukts, wobei wir a b = −1 be- gigkeit der Zeilen der Matrix A−a e2 = 1 1−a erhält
1

rücksichtigen: man a : 1 = 1 : (a − 1).


' (' n (' ( Aus der obigen Formel an = a √−b
n+1 n+1
folgt weiter
1 1 1 a 0 b −1 5
−√ an
5 a b 0 b n −a 1 limn→∞ an−1 = a, d. h., dass sich das Verhältnis auf-
' n−1 ( einanderfolgender Fibonacci-Zahlen dem Verhältnis des
1 a −b n−1 a n − bn
= √ goldenen Schnitts nähert.
5 a n − bn a n+1 − bn+1
14.4 Algebraische und geometrische Vielfachheit 517

Beispiel: Eigenwerte und Eigenvektoren von Spiegelungen und Drehungen im R2


Spiegelungen an Geraden durch den Nullpunkt und Drehungen um den Nullpunkt des R2 sind lineare Abbildungen. Somit
lassen sich diese Abbildungen durch Matrizen A aus R2×2 bezüglich der Standardbasis darstellen.

Problemanalyse und Strategie: Wir bestimmen die Eigenwerte und Eigenvektoren der darstellenden Matrizen.
'  ( '  (
Lösung: cos  α2  − sin α2
gilt mit b1 = und b 2 = sowie
sin α2 cos α2
' σα :α R( → R die Spiegelung an der Geraden
Ist 2 2
cos( 2 ) S = (b1 , b2 ) die Gleichung:
- ., die mit der x1 -Achse einen Winkel α2 ∈ ' (
sin( α2 ) 1 0
[0, π[ einschließt, so gilt nach dem Beispiel auf Seite 439 S −1 A S =
' ( 0 −1
cos α sin α
σ = ϕA mit A = , also σ (x) = A x .
sin α − cos α Wir kommen zur Drehung. Ist δα : R2 → R2 die Drehung
' ( um den Winkel α ∈ [0, 2 π [ um den Ursprung, so gilt:
x2 a ' (
b cos α − sin α
e2 δ = ϕA mit A = , also δ(x) = A x .
sin α cos α

α/2 ' ( x2
e1 −b ' (
x1
a a
' ( e2 b
b
−a α
α
e1 x1
Zwar wissen wir durch das Bild, dass die Spiegelung σ ge-
nau zwei Geraden des R2 durch 0 auf sich selbst abbildet,
nämlich die Spiegelungsachse und die dazu senkrechte
Gerade. Die Vektoren v auf der Spiegelungsachse sind
Fixpunkte von σ , d. h., A v = v, während die Vektoren auf Wir wissen bereits, dass die Drehung δα – abgesehen
der dazu senkrechten Geraden durch σ auf ihre entgegen- von zwei Ausnahmefällen – keine Gerade durch 0 auf
gesetzten Vektoren abgebildet werden, d. h., A v = −v. sich selbst abbildet und somit keine Eigenwerte besitzt.
Also besitzt A die beiden Eigenwerte 1 und −1 mit zuge- Die beiden Ausnahmen sind die Drehung um den Winkel
' (
hörigen Eigenräumen. Wir wollen dies nun auch rechne- 1 0
risch nachweisen. Dazu bestimmen wir das charakteristi- α = 0, d. h., A = , und die Drehung um den Win-
0 1
sche Polynom der Matrix A. ' (
) ) −1 0
)cos α − X ) kel α = π , d. h., A = . In diesen beiden Fällen
) sin α ) 0 −1
χA = )
sin α − cos α − X ) ist die Matrix A bereits diagonal, die Eigenräume sind in
beiden Fällen jeweils der ganze R2 .
= X2 − cos2 α − sin2 α = (1 − X) (−1 − X) .
Für α  ∈ {0, π } bestätigen wir unsere Vermutung nun rech-
Also hat A die beiden einfachen Eigenwerte 1 und −1. nerisch und bestimmen das charakteristische Polynom χA :
Insbesondere ist also A diagonalisierbar. Wir bestimmen ) )
)cos α − X − sin α )
die Eigenräume zu den beiden Eigenwerten: χA = ) ) )
' ( sin α cos α − X )
cos α − 1 sin α
EigA (1) = ker , (α  = 0)
sin α − cos α − 1 = X2 − 2 cos α X + 1 .
'      (
−2 sin2 α2 2 sin α2 cos α2 Für die Nullstellen λ1/2 dieses Polynoms gilt:
= ker
0 0  1
' α  α ( λ1/2 = cos α ± cos2 α − 1 2 .
− sin 2 cos 2
= ker
0 0 Für α ∈/ {0, π } gilt aber | cos α| < 1 und damit cos2 α −
<'  α (=
cos  2  1 < 0. Also hat das Polynom χA = X2 − 2 cos α X + 1 =
Also ist EigA (1) = auch für α = 0.
sin α2 0 im Fall α ∈/ {0, π} keine reellen Nullstellen, und damit
<'  (=
− sin α2 hat in diesem Fall die Matrix A auch keinen Eigenwert.
Die Berechnung von EigA (−1) = verläuft
cos α2 Wir halten
' ( α ∈]0, 2 π [\{π} ist die Matrix
fest: Für jedes
analog. Wir'halten fest: Für(jedes α ∈ [0, π [ ist die Ma- cos α − sin α
A= nicht diagonalisierbar, und in den
cos α sin α sin α cos α
trix A = diagonalisierbar, und zwar Fällen α = 0 und α = π hat A bereits Diagonalform.
sin α − cos α
518 14 Normalformen – Diagonalisieren und Triangulieren

Eigenwert die algebraische Vielfachheit mit der geometri- Von den vielen verschiedenen Beweisen, die es gibt, ent-
schen übereinstimmt, so ist die Matrix A diagonalisierbar. scheiden wir uns für den wohl kürzesten. Dabei benutzen
Es ist natürlich mühsam, all diese Eigenschaften nachzuprü- wir wiederholt das Kronecker-Symbol
fen. Es wäre sehr nützlich, wenn wir einer Matrix noch viel 
1 für i = j,
schneller, quasi ohne jede Rechnung ansehen könnten, dass δij =
0 für i = j.
sie diagonalisierbar ist. Und das geht oftmals, z. B. gilt: Jede
reelle symmetrische Matrix ist diagonalisierbar. Wir werden Beweis: Mithilfe der Matrix A = (aij ) bilden wir die
diese Tatsache in Kapitel 17 begründen.
Matrix B = A0 − X En = (bij ) ∈ K[X]n×n :
⎛ ⎞
a11 − X · · · an1
Die Matrix A ist Nullstelle ihres ⎜ .. .. .. ⎟
B=⎝ . . . ⎠ = (aj i − δij X) .
charakteristischen Polynoms a1n · · · ann − X

Wir betrachten zu einer Matrix A ∈ Kn×n das charakteristi- Und es sei C = (cij ) die Adjunkte zu B (Seite 485); es gilt:
sche Polynom C B = det(B) En = χA En ,
χA = (−1)n X n + cn−1 X n−1 + · · · + c1 X + c0 ∈ K[X] . da A0 und A das gleiche charakteristische Polynom haben.
Wir betrachten diese Gleichheit von Matrizen nun kompo-
Nach dem Lemma auf Seite 446 können wir den Körper K nentenweise: Für alle j, k ∈ {1, . . . , n} gilt:
als einen kommutativen Teilring des Rings Kn×n auffassen.
Dabei identifizieren wir jedes Element λ ∈ K mit der Diago- !
n
cki bij = δj k χA .
nalmatrix λ En ∈ Kn×n :
i=1
⎛ ⎞
λ 0
Dies sind n2 Gleichungen im Polynomring K[X]. Wir setzen
⎜ ⎟
λ ←→ ι(λ) = ⎝ . . . ⎠ . nun für die Unbestimmte X die Matrix A ein und erhalten
0 λ !
n
cki (A) bij (A) = δj k χA (A) . (14.2)
Nach dem Merksatz zum Einsetzen in Polynome auf Seite 90 i=1
(wir setzen in diesem Satz R = K = ι(K) und S = Kn×n )
Wegen bij (A) = aj i En − δij A gilt für alle i = 1, . . . , n:
dürfen wir daher quadratische Matrizen M aus Kn×n in das
charakteristische Polynom χA für X einsetzen: !
n !
n
bij (A) ej = (aj i En − δij A) ej
χA (M) = (−1)n M n + cn−1 M n−1 + · · · + c1 M + c0 M 0 , j =1 j =1

dabei ist χA (M) ∈ Kn×n . Hierbei ist nun die Addition bzw. ! n
= aj i ej − A ei = 0 . (14.3)
Multiplikation die Matrizenaddition bzw. Matrizenmultipli- j =1
kation.
Nun folgt für alle k ∈ {1, . . . , n}:
Es gibt einen berühmten Satz, der besagt, dass das charakte-
ristische Polynom χA einer Matrix A eben diese Matrix als !
n
χA (A) ek = δj k χA (A) ej
Nullstelle hat, d. h. χA (A) = 0.
j =1
' (
0 1 (14.2) !
n !
n
Beispiel Die Matrix A = hat das charakteristi- = cki (A) bij (A) ej
−1 0
j =1 i=1
sche Polynom χA = X2 + 1, und es gilt: ⎛ ⎞
' ( ' ( !
n !
n
−1 0 1 0 = cki (A) ⎝ bij (A) ej ⎠
χA (A) = A2 + E2 = +
0 −1 0 1 i=1 j =1
' (
0 0 (14.3)
= = 0.  = 0.
0 0
Somit gilt χA (A) = 0. 

Der Satz von Cayley-Hamilton


Für jede Matrix A ∈ Kn×n gilt:
?
Wieso ist der folgende „Beweis“ des Satzes von Cayley-
Hamilton falsch?
χA (A) = 0 ,
χA = det(A − X En ) ⇒ χA (A) = |A − AEn | = |0| = 0 .
wobei 0 die Nullmatrix aus Kn×n bezeichnet.
14.5 Die Exponentialfunktion für Matrizen 519

Kommentar: Der von uns geführte Beweis des Satzes Es ist nicht unmittelbar klar, dass der Ausdruck ∞ 1 k
k=0 k! A
von Cayley-Hamilton wirkt für einen Neuling in der Mathe- überhaupt existiert und wieder eine komplexe Matrix ist. Wir
matik sicher ein bisschen wie algebraische Zauberei. Aber begründen nun, dass diese Definition sinnvoll ist. Unter der
die Umformungen und Schlüsse sind völlig korrekt, und es Konvergenz der Reihe
kommt das gewünschte Ergebnis heraus. Auf einen solchen

!
Beweis kommt ein Student des ersten Studienjahrs ziemlich 1 k
sicher nicht selbstständig. Das erwartet man auch gar nicht. A
k!
k=0
Ein Student sollte sich von der Korrektheit dieses Beweises
überzeugen können, das sollte im ersten Studienjahr voll-
versteht man die Konvergenz aller n2 Komponentenfolgen
kommen ausreichen. Tatsächlich stammt die Beweisidee aus
einer völlig anderen algebraischen Theorie, der sogenannten N 
Modultheorie. Bei dortigen Rechnungen hatte man zufällig ! (Ak )ij
, 1 ≤ i, j ≤ n,
festgestellt, dass entsprechende Rechnungen mit Matrizen k!
k=0 N ∈N0
über Körpern gerade den Satz von Cayley-Hamilton bewei-
sen. So wurde dieser kurze und prägnante Beweis dieses Sat-  N 1 k

zes gefunden (siehe A Course in Commutative Algebra, G.
der Folge k=0 k! A N ∈N0 ihrer Partialsummen. Nun zei-
gen wir:
Kemper, Springer). Jeder andere Beweis, der geometrische
und naheliegende Beweisideen benutzt, ist im Allgemeinen
deutlich länger und unserer Auffassung nach komplizierter Die Exponentialfunktion für Matrizen
als der hier angegebene Beweis. Für jede n × n-Matrix A ∈ Cn×n konvergiert die Reihe

! 1 k
A .
14.5 Die Exponentialfunktion k!
k=0

für Matrizen Den Grenzwert

Eine wesentliche Anwendung der Diagonalisierung von Ma- !


N
1 k
lim A ∈ Cn×n
trizen ist das Lösen von Differenzialgleichungen. Dabei spielt N →∞ k!
k=0
die Exponentialfunktion für Matrizen eine wichtige Rolle.
Dazu verallgemeinern wir den Ausdruck ea für eine kom- bezeichnen wir mit exp A oder eA . Damit haben wir also
plexe Zahl a auf den Ausdruck eA für eine komplexe, qua- eine Abbildung
dratische Matrix A.  n×n
C → Cn×n ,
exp :
A  → eA
Die Exponentialfunktion für Matrizen ist
durch eine Reihe definiert erklärt.

Um die Exponentialfunktion für Matrizen zu definieren, be-


nutzen wir die Reihendarstellung der Exponentialfunktion. Beweis: Die Konvergenz von ∞ 1 k
k=0 k! (A )ij beweist man
Per Definition gilt für jede komplexe Zahl a: am einfachsten mit dem Majorantenkriterium: Es sei c eine
∞ k obere Schranke für die Zahlen |aij |. Dann gilt |(A2 )ij | =
! a2
ea =
a
=1+a+ + ··· . | ns=1 ais asj | ≤ nc2 . Allgemein ergibt sich mit vollständi-
k=0
k! 2! ger Induktion |(Ak )ij | ≤ nk−1 ck , und die Konvergenz der
Reihe
Dabei geschieht die Potenzbildung a k = a ·
· · a durch Mul- ∞ k−1 k
! n c
k-mal
tiplikation in C und die Summenbildung durch die Addition k!
k=0
in C. Aber quadratische Matrizen aus Cn×n lassen sich auch
zeigt dann die (absolute) Konvergenz der Reihen
addieren und multiplizieren, daher liegt es nahe, A0 = En ∞ 1 k
zu setzen und die Exponentialfunktion eA wie folgt zu defi- k=0 k! (A )ij . 

nieren:
' (

! 1 1
1 k 1 Beispiel Wir berechnen exp A für die Matrix A = .
e =
A
A = En + A + A2 + · · · . 0 0
k! 2!
k=0 Wegen Ak = A für k ≥ 1 gilt:
Hierbei werden Potenzen bezüglich der Matrizenmultiplika- ' ( ' ( ' ( ' (
tion gebildet, und das Summenzeichen beschreibt jetzt die 1 0 1 1 1 1 1 e e−1
eA = + + + ··· = .
Addition von Matrizen. 0 1 0 0 2 0 0 0 1
520 14 Normalformen – Diagonalisieren und Triangulieren

' ( −1
Und für die Matrix E12 =
0 1 k =
∈ C2×2 gilt wegen E12 Die rechte Seite konvergiert für N → ∞ gegen eS A S .
' (
0 0 Wir begründen nun, dass die linke Seite gegen S −1 eA S
0 0 konvergiert, es folgt dann die Behauptung.
für k ≥ 2:
0 0
Dazu beachten wir, dass für eine n×n-Matrix X = (xij )
' ( ' ( ' ( ' ( die Einträge von S −1 X S Linearkombinationen der xij
1 0 0 1 1 0 0 1 1
eE12 = + + +· · · = .  sind, genauer
0 1 0 0 2 0 0 0 1
⎛ (11) (1n) ⎞
i,j λij xij · · · i,j λij xij
⎜ ⎟
Achtung: Für eine Matrix A = (aij ) gilt im Allgemeinen: (∗) S −1 XS = ⎜ ⎝
..
.
..
.
..
.


(n1) (nn)
i,j λij xij · · · i,j λij xij
eA  = (eaij ) .
(rs)
mit λij ∈ C, r, s ∈ {1, . . . , n}. Wir schreiben für jedes
Man erhält also eA
nicht einfach durch komponentenweises N ∈ N0
Bilden der Potenzen eaij . !N
(N ) 1 k
AN = (aij ) = A
k!
k=0

A und beachten
Für diagonalisierbare Matrizen lässt sich e
(∞)
explizit angeben lim AN = eA = (aij ) .
N →∞

In den beiden letzten Beispielen konnten wir nur deshalb eA Setzt man AN in (∗) für X ein, so erhält man:
explizit bestimmen, da wir Ak für alle natürlichen Zahlen ⎛ (11) (N ) (1n) (N ) ⎞
angeben konnten. Das ist im allgemeinen Fall natürlich nicht i,j λij aij ··· i,j λij aij
⎜ ⎟
so. Aber mithilfe der folgenden Rechenregeln können wir eA S −1 AN S = ⎜

..
.
..
.
..
.
⎟.

für alle diagonalisierbaren Matrizen explizit bestimmen. (n1) (N ) (nn) (N )
λ
i,j ij aij · · · λ
i,j ij aij

Eigenschaften der Exponentialfunktion für Matrizen Nun bilden wir den Limes N → ∞, man beachte dabei,
dass in der Matrix rechts der Limes in jeder Komponente
Die Abbildung
gebildet wird; wegen der Additivität und der Homoge-
exp : Cn×n → Cn×n nität der Limesbildung, d. h.
! (rs) (N ) ! (rs) (N )
lim λij aij = λij lim aij
hat folgende Eigenschaften: N →∞ N →∞
i,j i,j
(a) Für alle A, B ∈ Cn×n mit A B = B A gilt:
(vgl. Seite 287), erhalten wir:
eA+B = eA eB . '! (
lim S −1 AN S = = S −1 eA S .
(rs) (∞)
λij aij
(b) Für jede invertierbare Matrix S ∈ Cn×n gilt: N →∞ r,s
i,j
−1 A S −1 A S
S e S=e . (c) Es gilt
⎛ ⎞k ⎛ k ⎞
(c) Für Diagonalmatrizen gilt die Regel: λ1 · · · 0 λ ··· 0
!
N
1 ⎜. . ⎟ ! 1 ⎜ .1
N
⎛ ⎞ ⎛ λ1 ⎞ .
⎝ . . . .. ⎠ = ⎝. . . .. ⎟
λ1 · · · 0 e ··· 0 k! . k! . . .⎠
⎜ ⎟ ⎜ ⎟ k=0 0 · · · λn k=0 0 · · · λkn
exp ⎝ ... . . . ... ⎠ = ⎝ ... . . . ... ⎠ . ⎛ ⎞
N λk
0 · · · λn 0 · · · e λn 1
⎛ λ1 ⎞
⎜ ⎟ ··· 0
⎜k=0 k! ⎟ e
⎜ ⎟ N →∞ ⎜ . . ⎟
=⎜⎜ . ⎟ ..
.. ⎟ −→ ⎝ .. . .. ⎠ .
Beweis: ⎜ ⎟
⎝ N
λn ⎠
k 0 · · · e λn
(a) Die Behauptung eA+B = eA eB beweist man analog zu k!
k=0
jener für komplexe Zahlen auf Seite 398 (man beachte 
hierzu auch Aufgabe 26.23).
(b) Aus S −1 Ak S = (S −1 A S)k folgt:
Beispiel Ein Beispiel dafür, dass eA+B = eA eB nicht all-
 
!
N
1 k !
N
1 −1 gemein gilt, liefern bereits
' die ( nicht miteinander
' (vertausch-
S −1 A S= (S A S)k . 1 0 0 1
k!
k=0
k!
k=0
baren Matrizen E11 = und E12 = . Mit den
0 0 0 0
14.6 Das Triangulieren von Endomorphismen 521

' (
oben berechneten Matrizen und der dritten Rechenregel gilt 0 −t
Die Matrix B = hat das charakteristische Polynom
nämlich: t 0
' ( ' ( χB ='X2 +t ( , also die beiden Eigenwerte i t und −i t. Es'sind
2
1 1 e e−1 (
exp(E11 + E12 ) = exp = , 1 1
0 0 0 1 t1 = ein Eigenvektor zum Eigenwert i t und t 2 =
' (' ( ' ( −i i
e 0 1 1 e e ein solcher zum Eigenwert −i t. Wir setzen T = (t 1 , t 2 ) und
exp(E11 ) exp(E12 ) = = . 
0 1 0 1 0 1 erhalten
' ( ' (
1 1 −1 −i 1
Ist A ∈ Cn×n eine diagonalisierbare Matrix, so existieren T = und T = i/2 ,
−i i −i −1
eine invertierbare Matrix S ∈ Cn×n und komplexe Zahlen
λ1 , . . . , λn mit der Eigenschaft also
⎛ ⎞ ' ( ' (' ('(
λ1 · · · 0
0 −t i 1 1 ei t 0 −i 1
⎜ ⎟ =
S −1 A S = ⎝ ... . . . ... ⎠ = D , d. h., A = S D S −1 . exp
t 0 2 −i i 0 e−i t
−i −1
0 · · · λn ' it −it
(
1 e +e − i (e − e−it )
1 it
=
Nun erhalten wir mit obigen Rechenregeln: 2 1i (ei t − e−it ) eit + e−i t
' (
eA = eS D S
−1
= S eD S −1 , cos t − sin t
= . 
sin t cos t
womit wir eA für diagonalisierbare Matrizen stets berechnen
können.
Wir heben eine weitere interessante Formel für die Spur und
Die Exponentialfunktion für diagonalisierbare die Exponentialfunktion hervor.
Matrizen
Ist A ∈ Cn×n eine diagonalisierbare Matrix mit den Eigen-
Ist A ∈ Cn×n eine diagonalisierbare Matrix mit den
werten λ1 , . . . , λn , so gibt es eine invertierbare Matrix
Eigenwerten λ1 , . . . , λn und Eigenvektoren s 1 , . . . , s n ,
S ∈ Cn×n mit
so gilt mit S = (s 1 , . . . , s n ):
⎛ λ1 ⎞
⎛ ⎞ e ··· 0
eλ1 · · · 0 ⎜ ⎟
⎜ ⎟ eA = S ⎝ ... . . . ... ⎠ S −1 .
eA = S ⎝ ... . . . ... ⎠ S −1 .
0 · · · eλn
0 · · · e λn
Wir wenden auf diese Gleichheit die Determinante an und
Man kann demnach mit D und S die Matrix eA berechnen. erhalten unter Beachtung des Determinantenmultiplikations-
Wir zeigen dies an Beispielen. satzes und des Resultats von Seite 515:

Beispiel Wir berechnen für ein t ∈ C die komplexen Ma- det eA = (det S) (eλ1 +···+λn ) (det S −1 ) = eSp A .
trizen ' ( ' (
0 t 0 −t
exp und exp .
t 0 t 0
' ( Die Determinante von eA
0 t
Die Matrix A = hat das charakteristische Polynom Ist A ∈ Cn×n diagonalisierbar, so gilt:
t 0
χA ='X2(− t 2 , also die beiden Eigenwerte t und −t. Es' sind
( det eA = eSp A .
1 1
s1 = ein Eigenvektor zum Eigenwert t und s 2 =
1 −1
ein solcher zum Eigenwert −t. Wir setzen S = (s 1 , s 2 ) und
erhalten
' ( ' ( 14.6 Das Triangulieren von
1 1 −1 −1
S= und S −1 = −1/2 , Endomorphismen
1 −1 −1 1
also
' ( ' (' t (' ( Wir gehen jetzt etwas weg von konkreten Berechnungen
0 t 1 1 1 e 0 −1 −1
exp =−
t 0 2 1 −1 0 e−t −1 1 und graben wieder etwas tiefer in der Theorie der linearen
' t −t −t
( Abbildungen. Daher stellen wir nun die konkreten Matri-
1 e +e e −e
t
= zen etwas in den Hintergrund und holen dafür die etwas
2 et − e−t et + e−t abstrakteren Endomorphismen eines endlichdimensionalen
' (
cosh t sinh t K-Vektorraums V hervor. Dabei behalten wir aber im Hin-
= .
sinh t cosh t terkopf, dass der Unterschied nur marginal ist: Nach Wahl
522 14 Normalformen – Diagonalisieren und Triangulieren

einer Basis B von V ist ein Endomorphismus ϕ von V nichts Wir betrachten nun eine besondere Art einer Basis eines n-
anderes als eine Matrix A (siehe Seite 437), dimensionalen K-Vektorraums V . Ist ϕ ein Endomorphis-
mus von V , so nennen wir eine geordnete Basis B =
A = B M(ϕ)B .
(b1 , . . . , bn ) von V eine Fahnenbasis für ϕ von V , falls
Nicht jeder Endomorphismus ist diagonalisierbar, genauer die Untervektorräume
gilt nach dem Kriterium von Seite 512: Der Endomorphismus
ϕA : V → V , v → A v mit A ∈ Kn×n ist genau dann -b1 . , -b1 , b2 . , . . . , -b1 , . . . , bn .
diagonalisierbar, wenn
ϕ -invariant sind, d. h., dass für jedes i = 1, . . . , n gilt:
(i) χA über K in Linearfaktoren zerfällt und
ϕ(-b1 , . . . , bi .) ⊆ -b1 , . . . , bi . .
(ii) ma (λ) = mg (λ) für jeden Eigenwert λ von A gilt.
Wir wollen in diesem Abschnitt zeigen, dass unter der Bei einer Fahnenbasis für ϕ von V hat man also eine auf-
Voraussetzung (i) der Endomorphismus ϕA triangulierbar steigende Folge von ineinander geschachtelten ϕ -invarianten
ist. Dabei nennen wir einen Endomorphismus ϕ eines n- Untervektorräumen von V :
dimensionalen K-Vektorraums triangulierbar, wenn es eine
-b1 . ⊆ -b1 , b2 . ⊆ · · · ⊆ -b1 , . . . , bn . .
geordnete Basis B von V gibt, bezüglich der die Darstel-
lungsmatrix B M(ϕ)B eine obere Dreiecksmatrix ist, d. h.,
⎛ ⎞
∗ ··· ∗ Beispiel
⎜ . . .. ⎟ Die kanonische Basis E2 = (e1 , e2 ) ist für den Endomor-
B M(ϕ)B = ⎝ . .⎠ phismus
0 ∗
' ( ' (' (
2 2 v1 −1 1 v2
Eine Matrix A ∈ Kn×n heißt triangulierbar, falls der Endo- ϕ: K → K , →
v2 0 −1 v2
morphismus ϕA triangulierbar ist, d. h., falls es eine invertier-
bare Matrix S ∈ Kn×n gibt mit eine Fahnenbasis des R2 , denn es gilt:
⎛ ⎞
∗ ··· ∗
⎜ ⎟ ϕ(-e1 .) ⊆ -e1 . und ϕ(R2 ) ⊆ R2 .
S −1 A S = ⎝ . . . ... ⎠ .
0 ∗ Ist ϕ ein diagonalisierbarer Endomorphismus eines
n-dimensionalen K-Vektorraums V , und ist B =
Dazu führen wir neue Begriffe ein. (b1 , . . . , bn ) eine geordnete Basis von V aus Eigenvek-
toren von ϕ, so ist B wegen

Ein Endomorphismus von V ist genau dann ϕ(-b1 , . . . , bi .) ⊆ -b1 , . . . , bi .


triangulierbar, wenn es eine Fahnenbasis von
für alle i = 1, . . . , n eine Fahnenbasis für ϕ von V .
V gibt
Für den Endomorphismus ϕA von Kn mit einer oberen
Dreiecksmatrix
Es sei ϕ : V → V ein Endomorphismus eines endlichdimen-
⎛ ⎞
sionalen K-Vektorraums V , dim V = n. Ein Untervektor- ∗ ··· ∗
raum U von V heißt ϕ-invariant, falls ϕ(U ) ⊆ U gilt. ⎜ ⎟
A = ⎝ . . . ... ⎠ = (s 1 , . . . , s n ) ∈ Kn×n
Beispiel 0 ∗
Die trivialen Untervektorräume {0} und V sind ϕ-invariant
für jeden Endomorphismus ϕ von V . ist die geordnete kanonische Basis En = (e1 , . . . , en )
Wir betrachten den Endomorphismus eine Fahnenbasis für ϕA des Kn , denn es gilt:
' ( ' (' (
2 2 v1 −1 1 v1 ϕ(-e1 , . . . , ei .) = -s 1 , . . . , s i . ⊆ -e1 , . . . , ei .
ϕ: K → K , → .
v2 0 −1 v2
<' (= für alle i = 1, . . . , n. 
1
Der Untervektorraum U = ist ϕ-invariant, der Un-
0 Das letzte Beispiel lässt sich verschärfen, es gilt:
<' (=
0
tervektorraum U = nicht.
1 Lemma
Ist U = Eigϕ (λ) der Eigenraum eines Endomorphismus Für einen Endomorphismus ϕ eines n-dimensionalen
ϕ von V zum Eigenwert λ von ϕ, so ist U wegen K-Vektorraums V sind äquivalent:
ϕ(v) = λ v ∈ U für jedes v ∈ U (i) ϕ ist triangulierbar.
ϕ-invariant.  (ii) Es existiert eine Fahnenbasis für ϕ von V .
14.6 Das Triangulieren von Endomorphismen 523

Beweis: (i) ⇒ (ii): Es sei B = (b1 , . . . , bn ) eine geord- U1


nete Basis mit der Eigenschaft, dass B M(ϕ)B = (aij ) eine
U1
obere Dreiecksmatrix ist. Nach dem Satz zur Darstellungs- 0 U4 ⊂ U1
matrix einer linearen Abbildung auf Seite 437 gilt nun für
jedes j ∈ {1, . . . , n}:
U2 U3
U5 ⊂ U2 ∩ U3
!
j
ϕ(bj ) = aij bi ∈ -b1 , . . . , bj . ,
i=1 U1 ⊕ U2 ⊕ U3 U2 U3

d. h., dass B = (b1 , . . . , bn ) eine Fahnenbasis für ϕ von V Abbildung 14.5 Disjunkte Kleeblätter stellen eine direkte Summe dar, die
Schnittmenge sich überlappender bzw. ineinanderliegender Kleeblätter sind
ist. wieder Kleeblätter, nämlich Untervektorräume.
(ii) ⇒ (i): Es sei B = (b1 , . . . , bn ) eine Fahnenbasis
für ϕ von V . Wir bestimmen die Darstellungsmatrix A =
und wegen ϕ(U1 ) ⊆ U1 , ϕ(U2 ) ⊆ U2 , ϕ(U3 ) ⊆ U3 erhal-
B M(ϕ)B . In der i-ten Spalte von A steht der Koordinaten-
ten wir
vektor des Bildes ϕ(bi ) des i-ten Basisvektors bi . Aufgrund
ϕ(V ) = ϕ(U1 ) ⊕ ϕ(U2 ) ⊕ ϕ(U3 ) .
der Voraussetzung gilt für jedes i ∈ {1, . . . , n}:

ϕ(bi ) ∈ -b1 , . . . , bi . , ?
Es sei U ein Eigenraum von ϕ zum Eigenwert λ. Wann gilt
sodass ϕ(U ) = U bzw. ϕ(U ) U ?
ϕ(bi ) = a1i b1 + · · · + aii bi .
Somit ist die Darstellungsmatrix eine obere Dreiecksmatrix: Daher können wir uns diagonalisierbare Endomorphismen
⎛ ⎞ wie in Abbildung 14.6 veranschaulichen.
a11 · · · a1n
⎜ .. . ⎟
A=⎝ . .. ⎠ ∈ K
n×n
.  ϕ
0 ann
U1
ϕ(U1 )
Wenn wir einen Endomorphismus ϕ bzw. eine Matrix A tri- ϕ
angulieren wollen, müssen wir somit eine Fahnenbasis für ϕ
bzw. ϕA bestimmen. Der Beweis des folgenden Kriteriums ϕ(U3 )
für Triangulierbarkeit liefert den entscheidenen Hinweis dar- U2 U3 ϕ(U2 )
auf, wie man eine Fahnenbasis bestimmt. Bevor wir aber die- ϕ
sen entscheidenen Satz formulieren, geben wir ein Visuali-
sierung der bisher behandelten Normalformen Diagonalform ϕ(U1 ⊕ U2 ⊕ U3 ) = ϕ(U1 ) ⊕ ϕ(U2 ) ⊕ ϕ(U3 )
und obere Dreiecksform. Abbildung 14.6 Diagonalisierbare Endomorphismen bilden Eigenräume in
Eigenräume ab. Man beachte, dass ein evtl. vorhandener Eigenraum zum
Eigenwert 0 auf den trivialen Untervektorraum {0} abgebildet wird, d. h. ein
Kleeblatt verschwindet.
Diagonalisierbare und triangulierbare
Endomorphismen lassen sich veranschaulichen Ist ϕ hingegen ein triangulierbarer, aber nicht diagonalisier-
barer Endomorphismus, so können wir uns die ϕ -invarianten
Wir stellen uns Untervektorräume als Kleeblätter vor. Dabei Untervektorräume
stehen überlappende Kleeblätter für sich schneidende Un-
tervektorräume, und jedes Kleeblatt enthält den Nullvektor U1 = -b1 . ⊆ U2 = -b1 , b2 . ⊆ · · · ⊆ Un = -b1 , . . . , bn .
(siehe Abbildung 14.5).
einer Fahnenbasis für ϕ wie in der Abbildung 14.7 veran-
Ist ein Endomorphismus ϕ eines endlichdimensionalen K-
schaulichen.
Vektorraums V diagonalisierbar, so ist V die direkte Summe
seiner Eigenräume. Der Einfachheit halber (und weil Klee-
blätter üblicherweise drei Blätter haben) nehmen wir an, dass
Ein Endomorphismus ist genau dann
ϕ drei Eigenwerte hat, wir setzen
triangulierbar, wenn das charakteristische
U1 = EigA (λ1 ) , U2 = EigA (λ2 ) , U3 = EigA (λ3 ) . Polynom in Linearfaktoren zerfällt

Es gilt damit: Die Elemente einer Fahnenbasis bestimmt man sukzessive,


V = U1 ⊕ U2 ⊕ U3 , so wie es der Beweis des folgenden Kriteriums nahelegt.
524 14 Normalformen – Diagonalisieren und Triangulieren

ϕ Wir ergänzen {b1 } zu einer Basis B = (b1 , . . . , bn ) von V


und betrachten die Darstellungsmatrix von ϕ bezüglich B:
ϕ
U3 ϕ(U3 ) ⎛ ⎞
λ1 a12 · · · a1n
ϕ ⎜ 0 ⎟
U2 ϕ(U2 ) ⎜ ⎟
A = B M(ϕ)B = ⎜ . ⎟
⎝ .. C ⎠
U1 ϕ(U1 ) 0
Die (n − 1) × (n − 1) -Matrix
⎛ ⎞
U 1 ⊂ U2 ⊂ U3 ϕ(U1 ) ⊂ ϕ(U2 ) ⊂ ϕ(U3 ) a22 · · · a2n
⎜ .. ⎟
C = ⎝ ... . ⎠
Abbildung 14.7 Eine Fahnenbasis bildet Untervektorräume ineinander ab.
an2 · · · ann
liefert wie im Folgenden geschildert einen Endomorphis-
Kriterium für Triangulierbarkeit mus ψ des (n − 1) -dimensionalen K-Vektorraums U =
Für einen Endomorphismus ϕ eines n-dimensionalen K- -b2 , . . . , bn .: Man wähle für ψ die eindeutig bestimmte li-
Vektorraums V sind äquivalent: neare Fortsetzung der Abbildung σ : {b2 , . . . , bn } → U :
(i) ϕ ist triangulierbar. !
n !
n
(ii) Das charakteristische Polynom χϕ von ϕ zerfällt in σ (b2 ) = ai2 bi , . . . , σ (bn ) = ain bi .
Linearfaktoren. i=2 i=2

Die Darstellungsmatrix von ψ bezüglich der geordneten


Basis (b2 , . . . , bn ) ist gerade die Matrix C.
Beweis: (i) ⇒ (ii): Das charakteristische Polynom χϕ
ist das charakteristische Polynom einer (beliebigen) Darstel- Wegen der Blockdreiecksgestalt der Matrix A gilt:
lungsmatrix B M(ϕ)B (siehe das Lemma auf Seite 507). Da ϕ
triangulierbar ist, wählen wir zur Bestimmung des charakte- χϕ = χA = (λ1 − X) χC = (λ1 − X) χψ .
ristischen Polynoms die Basis B, bezüglich der ϕ eine obere Folglich gilt χψ = (λ2 − X) · · · (λn − X), d. h., dass χψ
Dreiecksgestalt hat: in Linearfaktoren zerfällt. Da ψ somit ein Endomorphismus
eines (n − 1) -dimensionalen K-Vektorraums U mit einem in
⎛ ⎞
λ1 · · · ∗ Linearfaktoren zerfallenden charakteristischen Polynom ist,
⎜ . . .. ⎟ können wir die Induktionsvoraussetzung anwenden: Für ψ
B M(ϕ)B = ⎝ . .⎠.
existiert eine Fahnenbasis (c2 , . . . , cn ) von U . Wir zeigen
0 λn nun, dass C = (b1 , c2 , . . . , cn ) eine Fahnenbasis für ϕ von
V ist. Offenbar ist die Menge C eine geordnete Basis von V ,
Es folgt χϕ = (λ1 − X) · · · (λn − X). und es gilt:
ϕ(-b1 .) ⊆ -b1 . .
(ii) ⇒ (i): Es gelte χϕ = (λ1 − X) · · · (λn − X). Wir zeigen
per Induktion nach der Dimension n von V , dass eine Fah- Für i, j ∈ {2, . . . , n} erhalten wir zum einen:
nenbasis für ϕ von V existiert. Mit dem Lemma von Seite 522 ϕ(bj ) = a1j b1 + a2j b2 + · · · + anj bn
erhalten wir so, dass ϕ triangulierbar ist. 
=ψ(bj )
Induktionsbeginn: Im Fall n = 1 ist jede Basis eine Fahnen-
und zum anderen:
basis für ϕ von V , da jede 1 × 1-Matrix eine obere Dreiecks-
matrix ist. ci = μ2 b2 + · · · + μn bn
Induktionsbehauptung: Es sei n ≥ 2. Für jeden Endomor- mit gewissen μi ∈ K. Mit diesen Bezeichnungen erhalten
phismus ϕ mit in Linearfaktoren zerfallenden charakteristi- wir
schen Polynom eines (n − 1)-dimensionalen K-Vektorraums
!
n !
n
V existiere eine Fahnenbasis von V . ϕ(ci ) = μj ϕ(bj ) = μj (a1j b1 + ψ(bj ))
j =2 j =2
Induktionsschritt: Es sei ϕ ein Endomorphismus eines n-
dimensionalen K-Vektorraums V mit einem in Linearfakto- ! n
= μj a1j b1 + ψ(μj bj )
ren zerfallenden charkateristischen Polynom. Wegen χϕ =
j =2
(λ1 − X) · · · (λn − X) und n ≥ 2 existiert zum Eigenwert
λ1 von ϕ ein Eigenvektor b1 , b1  = 0, von ϕ: = μ b1 + ψ(ci ) ∈ -b1 , c1 , . . . , ci .

für ein μ ∈ K; man beachte, dass (c2 , . . . , cn ) eine Fahnen-


ϕ(b1 ) = λ1 b1 . basis für ψ von U ist. Somit ist alles gezeigt. 
14.6 Das Triangulieren von Endomorphismen 525

Kommentar: Der Beweis lässt sich für die Triangulier- Als Darstellungsmatrix von ϕA bezüglich der Basis B erhal-
barkeit einer Matrix etwas durchsichtiger mit einem Matri- ten wir somit:
zenformalismus führen. Wir führen das in Aufgabe 14.10 ⎛ ⎞
2 1 −1 −1
durch. Jedoch ist die durch den Matrizenformalismus moti- ⎜0 2 0 0 ⎟
vierte Konstruktion der Fahnenbasis dann aufwendiger, so- ⎜
B1 M(ϕA )B1 = ⎝

0 2 2 0⎠
lange man mit Bleistift und Papier eine solche Basis bestim- 0 0 1 2
men will.
Und die Matrix S = (s 1 , . . . , s 4 ) erfüllt
Wie man nun tatsächlich einen Endomorphismus bzw. eine B1 M(ϕA )B1 = S −1 A S .
Matrix trianguliert, wird durch unseren Beweis nahegelegt.
Wir führen die Konstruktion einer Fahnenbasis an einem Bei- 2. Schritt: Wir kümmern uns nun um die 3 × 3-Untermatrix
spiel vor. ⎛ ⎞
2 0 0
B = ⎝2 2 0⎠
Beispiel Wir konstruieren eine Fahnenbasis des R4 für den 0 1 2
Endomorphismus ϕA : v  → A v mit
⎛ ⎞ Der Endomorphismus ψ von U = -s 2 , s 3 , s 4 . mit der Dar-
2 0 0 0 stellungsmatrix B bezüglich der Basis (s 2 , s 3 , s 4 ) hat wegen
⎜2 2 0 0 ⎟
A=⎜ ⎟ χB = (2 − X)3 den dreifachen Eigenwert 2. Wegen
⎝1 −1 2 −1⎠ ⎛ ⎞ ?⎛ ⎞@
0 1 0 2 0 0 0 0
EigB (2) = ker ⎝2 0 0⎠ = ⎝0⎠
1. Schritt: Wegen χA = (2 − X)4 – man beachte die Block- 0 1 0 1
dreiecksgestalt der Matrix – hat der Endomorphismus ϕA den ist 0 s 2 + 0 s 3 + 1 s 4 = s 4 ein Eigenvektor zum Eigenwert 2
vierfachen Eigenwert 2. Als Eigenraum erhalten wir von ψ, d. h., Eigψ (2) = -s 4 ..
⎛ ⎞ ⎛ ⎞
0 0 0 0 ? 0 @ Wir ergänzen nun die linear unabhängige Menge {e3 , s 4 = e4 }
⎜2 0 0 0 ⎟ ⎜0⎟ der beiden aus den bisherigen Schritten gewonnenen linear
EigA (2) = ker ⎜ ⎟
⎝1 −1 0 −1⎠ = ⎝1⎠ .
⎜ ⎟
unabhängigen Vektoren e3 und e4 zu einer geordneten Basis
0 1 0 0 0 B2 des R4 :
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
Wir ergänzen die linear unabhängige Menge {e3 } zu einer 0 0 1 0
geordneten Basis B1 des R4 : ⎜⎜0⎟ ⎜0⎟ ⎜0⎟ ⎜1⎟⎟
B2 = ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝1⎠ , ⎝0⎠ , ⎝0⎠ , ⎝0⎠⎠ .
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞
0 1 0 0 0 1 0 0
⎜⎜0⎟ ⎜0⎟ ⎜1⎟ ⎜0⎟⎟    
B1 = ⎜ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎟
⎝⎝1⎠ , ⎝0⎠ , ⎝0⎠ , ⎝0⎠⎠ . =:t 1 =:t 2 =:t 3 =:t 4

0 0 0 1 Als Darstellungsmatrix von ϕA bezüglich dieser Basis B2


   
=:s 1 =:s 2 =:s 3 =:s 4 erhalten wir
⎛ ⎞
Wir bestimmen die Koordinatenvektoren der Bilder der Ba- 2 −1 1 −1
⎜0 2 0 1⎟
sisvektoren: ⎜
B2 M(ϕA )B2 = ⎝

⎛ ⎞ 0 0 2 0⎠
0 0 0 2 2
⎜0⎟
ϕA (s 1 ) = ⎜ ⎟
⎝2 ⎠ = 2 s 1 + 0 s 2 + 0 s 3 + 0 s 4 , Und die Matrix T = (t 1 , . . . , t 4 ) erfüllt
0
⎛ ⎞ B2 M(ϕA )B2 = T −1 A T .
2
⎜2⎟ 3. Schritt: Wir kümmern uns nun um die 2 × 2-Untermatrix
ϕA (s 2 ) = ⎝ ⎟
⎜ = 1 s1 + 2 s2 + 2 s3 + 0 s4 , ' (
1⎠ 2 0
C=
0 2 2
⎛ ⎞
0 Der Endomorphismus ψ von U = -t 3 , t 4 . mit der Dar-
⎜2⎟
ϕA (s 3 ) = ⎜ ⎟
⎝−1⎠ = −1 s 1 + 0 s 2 + 2 s 3 + 1 s 4 ,
stellungsmatrix C bezüglich der Basis (t 3 , t 4 ) hat wegen
χC = (2 − X)2 den zweifachen Eigenwert 2. Wegen
1 ' ( <' (=
⎛ ⎞ 0 0 0
0 EigC (2) = ker =
⎜0⎟ 2 0 1
ϕA (s 4 ) = ⎜ ⎟
⎝−1⎠ = −1 s 1 + 0 s 2 + 0 s 3 + 2 s 4 . ist 0 t 3 + 1 t 4 = e2 ein Eigenvektor zum Eigenwert 2 von ψ,
2 d. h., Eigψ (2) = -t 4 ..
526 14 Normalformen – Diagonalisieren und Triangulieren

Wir ergänzen nun die linear unabhängige Menge {e3 , s 4 = e4 , Potenzen von Matrizen in Jordan-Normalform
t 4 = e2 } der drei aus den bisherigen Schritten gewonnenen berechnet man mit der Binomialformel
linear unabhängigen Vektoren e3 , e4 und e2 zu einer geord-
neten Basis B3 des R4 : Nicht jede Matrix ist diagonalisierbar, so hat etwa die kom-
⎛⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎞ plexe Matrix ' (
0 0 0 1 2 1
⎜⎜0⎟ ⎜0⎟ ⎜1⎟ ⎜0⎟⎟ A= ∈ C2×2
B3 = ⎜⎜ ⎟
⎝⎝1⎠ ,
⎜ ⎟,
⎝0⎠
⎜ ⎟,
⎝0⎠
⎜ ⎟⎟ .
⎝0⎠⎠
0 2
den Eigenwert 2 mit der algebraischen Vielfachheit 2 und
0 1 0 0
    der geometrischen Vielfachheit 1 – nach dem Kriterium für
=:u1 =:u2 =:u3 =:u4 Diagonalisierbarkeit auf Seite 512 ist A also nicht diagona-
lisierbar.
Als Darstellungsmatrix von ϕA bezüglich dieser Basis B3
erhalten wir Wir berechnen nun Potenzen dieser Matrix A. Dazu schrei-
ben wir die Matrix als eine Summe einer Diagonalmatrix D
⎛ ⎞
2 −1 −1 1 und einer Matrix N, deren Quadrat die Nullmatrix ist,
⎜0 2 1 0⎟ ' ( ' (
B3 M(ϕA )B3 =⎜
⎝0 0 2 2⎠
⎟ 2 0 0 1
A= + .
0 2 0 0
0 0 0 2  
=:D =:N
Und die Matrix U = (u1 , . . . , u4 ) erfüllt
Nun berechnen wir – etwas naiv, aber korrekt – mittels der
Binomialformel Potenzen von A:
B3 M(ϕA )B3 = U −1 A U .
k ' (
! k
Damit ist der Endomorphismus ϕA bzw. die Matrix A tri- Ak = (D + N )k = D k−i N i .
i
anguliert. Die Spalten u1 , . . . , u4 der Matrix U bilden eine i=0
Fahnenbasis für ϕA des R4 . 
Wegen N 2 = 0 verkürzt sich diese Formel für k ≥ 1 auf
zwei Summanden. Es gilt also
? Ak = (D + N )k
Können Sie ein Kriterium dafür angeben, wann ein Endomor-
phismus ϕ eines n -dimensionalen K-Vektorraums V durch = D k + k D k−1 N
' k ( ' k−1 (' (
eine untere Dreiecksmatrix dargestellt werden kann ? 2 0 2 0 0 1
= + k
0 2k 0 2k−1 0 0
' k k−1
(
2 k2
= .
0 2k

Wir halten zuerst das wesentliche Hilfsmittel für diese


14.7 Die Jordan-Normalform Potenzbildung fest.

Die Binomialformel für Matrizen


Diagonalisierbare Matrizen haben gegenüber allgemeinen
und Dreiecksmatrizen den großen Vorteil, dass sich belie- Für Matrizen D, N ∈ Kn×n mit D N = N D und jede
bige Potenzen auf relativ einfache Art und Weise berechnen natürliche Zahl k gilt:
lassen. Leider kann nicht jede Matrix diagonalisiert werden. k ' (
! k
k
Aber die Vorteile von Diagonalmatrizen lassen sich auch für (D + N ) = D k−i N i .
i
einen weiteren Typ von Matrizen ausnutzen. Tatsächlich las- i=0
sen sich auch beliebige Potenzen von Matrizen effizient be-
rechnen, zu denen eine sogenannte Jordan-Normalform exi- Der Beweis erfolgt analog zur Binomialformel für komplexe
stiert. Dabei sagt man etwas salopp ausgedrückt, dass eine Zahlen per Induktion. Dabei ist wesentlich, dass die beiden
Matrix Jordan-Normalform hat, wenn sie abgesehen von ei- Matrizen miteinander kommutieren. Dies zu begründen ha-
nigen Einsen auf der oberen Nebendiagonale eine Diago- ben wir als Übungsaufgabe gestellt.
nalmatrix ist. Das Wesentliche ist nun, dass zum Beispiel zu
Weil im obigen Beispiel die beiden Matrizen miteinander
jeder komplexen Matrix eine solche Jordan-Normalform exi-
kommutieren, war diese Rechnung auch korrekt.
stiert, weil wie bei der Triangulierbarkeit das Zerfallen des
charakteristischen Polynoms hinreichend ist für die Existenz Wenn eine gewisse Potenz einer Matrix die Nullmatrix ergibt,
dieser Normalform. so nennt man diese Matrix nilpotent, genauer: Gibt es zu
14.7 Die Jordan-Normalform 527

einer Matrix N eine natürliche Zahl k, sodass N k = 0, so eine Blockdiagonalgestalt mit Jordan-Kästchen J 1 , . . . , J l
nennt man N nilpotent, und die kleinste Zahl r ∈ N mit hat. Dabei müssen die Diagonaleinträge λi der J i nicht ver-
N r = 0 nennt man den Nilpotenzindex von N . Mit der schieden sein, und es dürfen auch 1 × 1-Jordan-Kästchen
Binomialformel erhalten wir folgende Aussage. vorkommen.

Die Potenz einer Summe einer Diagonalmatrix mit


Beispiel
einer nilpotenten Matrix
Jordan-Matrizen mit einem Jordan-Kästchen:
Lässt sich eine Matrix A als Summe einer Diagonal-
matrix D und einer nilpotenten Matrix N mit Nilpo- ⎛ ⎞
   
tenzindex r schreiben, d. h.,   2 1 0
1 1 0 1 ⎜ ⎟
1 , , , ⎝0 2 1⎠
A=D+N, 0 1 0 0
0 0 2

so gilt im Fall D N = N D:
' ( Jordan-Matrizen mit zwei Jordan-Kästchen:
k k k−1 k
A = D +k D N +···+ D k−r−1 N r−1 .
r −1 ⎛ ⎞ ⎛ ⎞
    3 0 1
1 0 ⎜ ⎟ ⎜ ⎟
Je kleiner r ist, desto kürzer ist diese Summe, desto leichter , , ⎜
⎝ 2
⎟ ⎜0
1 ⎠, ⎝
0 ⎟

also ist Ak zu berechnen. 2 0
0 2 −1
Wir werden bald sehen, dass jede Matrix in Jordan-Normal-
form die angegebenen Voraussetzungen erfüllt.
Jordan-Matrizen mit drei Jordan-Kästchen:

Die Jordan-Normalform ist von einigen Einsen ⎛ ⎞ ⎛ ⎞


⎛ ⎞ 2 1 1
in der oberen Nebendiagonalen abgesehen 2 ⎜0 ⎟ ⎜ ⎟
⎜ ⎟ ⎜ 2 ⎟ ⎜ ⎟
eine Diagonalform ⎜ ⎟ ⎜ ⎟ ⎜ 0 1 ⎟
⎜ 2 ⎟, ⎜ ⎟, ⎜ ⎟
⎝ ⎠ ⎜ 3 ⎟ ⎜ 0 0 ⎟
⎝ ⎠ ⎝ ⎠
Eine Matrix (aij ) ∈ Ks×s heißt ein Jordan-Kästchen zu 2
−1 1
einem λ ∈ K, wenn

a11 = · · · = ass = λ ,
Bisher war nur von Matrizen die Rede. Für die folgenden
a12 = · · · = as−1,s = 1 und
theoretischen Betrachtungen wird es wieder unabdingbar
aij = 0 sonst , sein, Endomorphismen zu betrachten. Daher führen wir die
notwendigen Begriffe für Endomorphismen und Matrizen
d. h., ⎛ ⎞ ein.
λ 1
⎜ .. .. ⎟
⎜ . . ⎟ Wir nannten einen Endomorphismus ϕ : V → V eines n-
(aij ) = ⎜


⎟ dimensionalen K-Vektorraums diagonalisierbar bzw. trian-
⎝ ..
. 1⎠ gulierbar, wenn es eine Basis B = (b1 , . . . , bn ) von V gibt
λ mit der Eigenschaft, dass die Darstellungsmatrix
Ein Jordan-Kästchen ist also von den Einsen in der oberen
Nebendiagonalen abgesehen eine Diagonalmatrix, es sind D = B M(ϕ)B
⎛ ⎞
⎛ ⎞ λ 1 0 0
' ( λ 1 0
  λ 1 ⎜0 λ 1 0 ⎟ von ϕ bezüglich B Diagonal- bzw. obere Dreiecksgestalt
λ , , ⎝0 λ 1⎠ , ⎜ ⎝0 0 λ 1⎠

hat. Entsprechend sagen wir nun, dass ein Endomorphis-
0 λ
0 0 λ mus ϕ : V → V eine Jordan-Normalform besitzt oder sich
0 0 0 λ
auf Jordan-Normalform bringen lässt, falls es eine Basis
Beispiele für Jordan-Kästchen. B = (b1 , . . . , bn ) von V gibt mit der Eigenschaft, dass die
Darstellungsmatrix
Eine Matrix J ∈ Kn×n heißt Jordan-Matrix, falls
⎛ ⎞
J1 J = B M(ϕ)B
⎜ .. ⎟
J =⎝ . ⎠
Jl von ϕ bezüglich B eine Jordan-Matrix ist.
528 14 Normalformen – Diagonalisieren und Triangulieren

Jordan-Basis und Jordan-Normalform die zwei verschiedenen Jordan-Normalformen dieser Matrix


A, da diese diagonalisierbar ist. Jordan-Basen sind in diesem
Existiert zu einem Endomorphismus ϕ eines n-dimen-
Beispiel Basen aus Eigenvektoren von A. 
sionalen K-Vektorraums V eine geordnete Basis B =
(b1 , . . . , bn ) von V , sodass
Achtung: In manchen Lehrbüchern werden die Jordan-
⎛ ⎞
J1 Kästchen auch in der Form
⎜ .. ⎟ ⎛ ⎞
B M(ϕ)B = J = ⎝ . ⎠ λ
Jl ⎜ .. ⎟
⎜1 . ⎟
⎜ ⎟
⎜ . . ⎟
eine Jordan-Normalform mit Jordan-Kästchen ⎝ .. .. ⎠
J1 , . . . , Jl ist, so nennt man B eine Jordan-Basis von 1 λ
V zu ϕ und die Matrix J eine Jordan-Normalform
von ϕ. eingeführt, die Einsen stehen also auf der unteren Nebendia-
gonale. Hierbei werden die Vektoren der Jordan-Basis anders
Nullen außerhalb der Jordan-Kästchen lassen wir immer weg. sortiert.
Wir benutzen diese Begriffe ebenso für eine Matrix A ∈
Kn×n und meinen dabei eigentlich den Endomorphismus ϕA Nach dem Kriterium für Diagonalisierbarkeit von Seite 512
von Kn . Ist also B = (b1 , . . . , bn ) eine Jordan-Basis zu ist ein Endomorphismus ϕ genau dann diagonalisierbar,
einer Matrix A ∈ Kn×n , so besagt dies, dass A ähnlich zu wenn das charakteristische Polynom χϕ in Linearfaktoren
einer Jordan-Matrix J ist, dabei gilt: zerfällt und für jeden Eigenwert λ von ϕ die algebraische
⎛ ⎞ Vielfachheit gleich der geometrischen ist. Die Bedingungen
J1 für die Existenz einer Jordan-Normalform eines Endomor-
⎜ ⎟
S −1 A S = J = ⎝ ..
. ⎠ phismus sind deutlich einfacher:
Jl Eine Jordan-Normalform existiert zu ϕ genau dann, wenn ϕ
mit der Matrix S = (b1 , . . . , bn ). Die Jordan-Matrix J ist in Linearfaktoren zerfällt.
in diesem Fall eine Jordan-Normalform zu A. Der Beweis dieses Existenzsatzes einer Jordan-Normalform
Eine Jordan-Normalform ist im Allgemeinen nicht eindeutig, ist nicht einfach. In Arch. Math., Vol. 50, 323–327 (1988) gibt
beim Vertauschen der Kästchen entsteht wieder eine Jordan- Johann Hartl einen Induktionsbeweis für diesen Satz an. Wir
Normalform, in der Jordan-Basis werden dabei die dazuge- bringen den Beweis von Johann Hartl mit einigen weiteren
hörigen Jordan-Basisvektoren mit vertauscht. Vereinfachungen. Dazu stellen wir erst mal einige Hilfsmittel
bereit.
Eine Jordan-Normalform unterscheidet sich also von einer
Diagonalform höchstens dadurch, dass sie einige Einsen in
der ersten oberen Nebendiagonale hat.
Zum Beweis des Existenzsatzes benötigen wir
Beispiel Jede Diagonalmatrix hat Jordan-Normalform. einige Hilfsmittel
Und auch die Matrizen
⎛ ⎞ ⎛ ⎞
Für den Beweis des Existenzsatzes einer Jordan-Normalform
⎜ 1 1 ⎟ ⎜ 0 ⎟
⎜ ⎟ ⎜ ⎟ benötigen wir vier Lemmata. Wir stellen diese in diesem Ab-
⎜ 0 1 ⎟ ⎜ ⎟
⎜ ⎟ ⎜ 0 1 0 ⎟ schnitt vor. Die Beweise sind teils recht aufwendig. Wieder
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ 2 1 ⎟ ⎜ 0 0 1 ⎟ wollen wir explizit darauf hinweisen, dass wir von einem
⎜ ⎟ ⎜ ⎟
⎜ 0 2 ⎟,⎜ 0 0 0 ⎟ Leser keineswegs erwarten, dass er selbstständig auf diese
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟ Beweise kommen sollte. Es reicht vollkommen aus, wenn
⎜ 3 1 0 ⎟ ⎜ 0 1 0 ⎟
⎜ ⎟ ⎜ ⎟ Sie als Studierender im ersten Studienjahr diese Schlüsse
⎜ ⎟ ⎜ ⎟
⎜ 0 3 1 ⎟ ⎜ 0 0 1 ⎟
⎝ ⎠ ⎝ ⎠ nachvollziehen können.
0 0 3 0 0 0
Lemma 1
haben Jordan-Normalform. Hingegen ist
' ( Es sei V ein endlichdimensionaler K-Vektorraum. Ist V =
1 1 U ⊕ W die direkte Summe zweier ϕ -invarianter Untervek-
A=
0 −1 torräume U und W , so gilt:
keine Jordan-Normalform, da in den Jordan-Kästchen auf der (a) ψ = ϕ|U und ρ = ϕ|W sind Endomorphismen von U
Diagonalen nur gleiche Einträge stehen. Aber es sind und W .
    (b) Für U, W = {0} gilt χϕ = χψ χρ .
1  -1 (c) Sind BU und BW Jordan-Basen zu ψ und ρ, so ist BU ∪
J = und J =
-1 1 BW eine Jordan-Basis zu ϕ.
14.7 Die Jordan-Normalform 529

Beweis: (a) Weil U und W invariant sind unter ϕ, gilt (d) Wegen ϕ(W ) ⊆ Bild ϕ folgt die Behauptung sogleich aus
ψ(U ) ⊆ U und ρ(W ) ⊆ W . Folglich sind ψ und ρ Endo- Bild ϕ ⊆ W . 

morphismen von U und W .

(b) Das charakteristische Polynom eines Endomorphismus


ist das charakteristische Polynom einer Darstellungsmatrix
?
Zeichnen Sie Bilder mit den entsprechenden Untervektorräu-
bezüglich einer beliebig gewählten Basis. Es seien BU und
men.
BW irgendwelche Basen von U und W . Die Vereinigung B =
BU ∪BW ist wegen der Direktheit der Summe dann eine Basis
von ganz V . Die Darstellungsmatrizen der Endomorphismen
Lemma 3
ψ und ρ bezüglich der Basen BU und BW seien Aψ und Aρ :
Es sei ϕ ein Endomorphismus eines n-dimensionalen K-
Vektorraums V mit n ≥ 2.
Aψ = BU M(ψ)BU und Aρ = BW M(ρ)BW .
Falls der Kern von ϕ nicht im Bild von ϕ enthalten ist,
Wir erhalten als Darstellungsmatrix von ϕ bezüglich der Ba- ker ϕ ⊆ Bild ϕ, so gilt V = U ⊕ W mit echten ϕ -invarianten
sis B von V : Untervektorräumen U und W von V , d. h., U, W V ,
ϕ(U ) ⊆ U , ϕ(W ) ⊆ W .
' (
Aψ 0
B M(ϕ)B = . (14.4)
0 Aρ
Beweis: 1. Fall. ker ϕ = V , d. h., ϕ ist die Nullabbil-
dung. Da in diesem Fall jeder Untervektorraum ϕ -invariant
Nun bilden wir das charakteristische Polynom von ϕ:
ist, wähle man für U irgendeinen eindimensionalen Unter-
) ) vektorraum und für W das Komplement zu U in V . Es sind
)A − X E 0 )
χϕ = )) ψ ) = χψ χρ . dann U und W zwei echte ϕ -invariante Untervektorräume
0 Aρ − X E) von V mit V = U ⊕ W (man beachte den Satz zur Existenz
von Komplementen auf Seite 218).
(c) Diese Aussage folgt aus der Darstellungsmatrix in (14.4):
Sind nämlich Aψ und Aρ Jordan-Normalformen, so ist es 2. Fall. ker ϕ V . Wähle eine Basis B0 von ker ϕ ∩ Bild ϕ,
auch B M(ϕ)B . 

ker ϕ ∩ Bild ϕ = -B0 . ,

? und ergänze diese zum einen zu einer Basis B0 ∪ B1 von


Wieso haben wir U, W  = {0} in (b) verlangt ? ker ϕ,
ker ϕ = -B0 ∪ B1 . ,
Lemma 2 und zum anderen zu einer Basis B0 ∪ B2 von Bild ϕ,
Es sei U ⊆ V ein ϕ -invarianter Untervektorraum eines K-
Vektorraums V . Dann gilt: Bild ϕ = -B0 ∪ B2 . .
(a) U ist ein Untervektorraum von ϕ −1 (U ), d. h., U ⊆
ϕ −1 (U ). Wie im Beweis zur Dimensionsformel für Untervektorräume
(b) Jeder Untervektorraum W von V mit der Eigenschaft (siehe Seite 217) zeigt man:
U ⊆ W ⊆ ϕ −1 (U ) ist ϕ -invariant, d. h., ϕ(W ) ⊆ W .
(c) Jeder Untervektorraum W von V mit der Eigenschaft B0 ∪ B1 ∪ B2 ist linear unabhängig.
W ⊆ ker ϕ ist ϕ -invariant, d. h., ϕ(W ) ⊆ W .
(d) Jeder Untervektorraum W von V mit der Eigenschaft Wir ergänzen nun diese linear unabhängige Menge B0 ∪
Bild ϕ ⊆ W ist ϕ -invariant, d. h., ϕ(W ) ⊆ W . B1 ∪ B2 um weitere Vektoren aus einer Menge B3 zu einer
Basis
B = B0 ∪ B1 ∪ B2 ∪ B3
Beweis: (a) Wegen der Invarianz von U unter ϕ gilt ϕ(u) ∈
U für alle u ∈ U . Es folgt u ∈ ϕ −1 (U ) für alle u ∈ U , d. h., von V . Wir wählen nun zwei Untervektorräume U und W
U ⊆ ϕ −1 (U ). von V gemäß
(b) Wegen W ⊆ ϕ −1 (U ) gilt w ∈ ϕ −1 (U ) für alle w ∈ W .
U = -B1 . und W = -B0 ∪ B2 ∪ B3 . .
Es folgt ϕ(w) ∈ U . Und wegen U ⊆ W gilt somit ϕ(w) ∈ W
für alle w ∈ W , d. h., ϕ(W ) ⊆ W .
Wegen Lemma 2 (c) und (d) sind die Untervektorräume U
(c) Das folgt aus (b) mit dem ϕ -invarianten Untervektorraum und W ϕ -invariant. Weiter gilt V = U ⊕ W , da B0 ∪ B1 ∪
U = {0} von V . B 2 ∪ B3 ⊆ U + W .
530 14 Normalformen – Diagonalisieren und Triangulieren

Schließlich gilt B1 = ∅ wegen ker ϕ  ⊆ Bild ϕ, d. h., dass Wegen der Gleichungen (14.5) und (14.6) gelten die Inklu-
U = {0}. Es folgt W = V . sionen

Und aus ker ϕ = V folgt B1 B, d. h., dass auch U  = V ϕ −1 (U  ) ⊆ ϕ −1 (W  ) + U  + A und


gilt. 
ϕ −1 (W  ) ⊆ U  + W  + B ,

Wir formulieren den letzten Hilfssatz. sodass mithilfe von (i) folgt:
Lemma 4
V = ϕ −1 (U  ) + ϕ −1 (W  ) ⊆ U  + W  + B + A
Es sei ϕ ein Endomorphismus eines n-dimensionalen K-
Vektorraums V . =U +W .

Falls Bild ϕ = U  ⊕ W  mit ϕ -invarianten Untervektorräu- Nun zeigen wir:


men U  und W  von V gilt, so gibt es Untervektorräume U
und W von V mit (ii) Es gilt U ∩ ϕ −1 (W  ) = U  ∩ ϕ −1 (W  ).

(a) V = U ⊕ W . Denn: die Inklusion ⊇ folgt aus U  ⊆ U . Es sei v ∈ U ∩


(b) U  ⊆ U und W  ⊆ W . ϕ −1 (W  ). Dann gilt v = u +a mit einem u ∈ U  und a ∈ A,
(c) U und W sind ϕ-invariant. da U = U  + A. Wegen Gleichung (14.5) gilt U ⊆ ϕ −1 (U  ),
d. h., dass v ∈ ϕ −1 (U  ) ∩ ϕ −1 (W  ). Es folgt
 
Beweis: Wir zeigen die Behauptungen in mehreren Schrit- a = v − u ∈ ϕ −1 (U  ) ∩ ϕ −1 (W  ) + U  .
ten.

(i) Es gilt V = ϕ −1 (U  ) + ϕ −1 (W  ). Mit Gleichung (14.5) folgt a = 0, also v = u ∈ U  ∩


ϕ −1 (W  ). Somit ist (ii) begründet.
Denn nach Voraussetzung gibt es zu jedem v ∈ V ein u ∈ U 
und w  ∈ W  mit ϕ(v) = u + w  . Wegen U  ⊆ ϕ(V ) gibt (iii) Es gilt U ∩ W = {0}.
es ein u ∈ V mit u = ϕ(u), d. h., u ∈ ϕ −1 (U  ).
Aus (ii) folgt wegen W ⊆ ϕ −1 (W  ), der Gleichung (14.6)
Für die Differenz w = v − u folgt: und W = W  + B:
 
ϕ(w) = ϕ(v) − ϕ(u) = ϕ(v) − u = w ∈ W  , U ∩ W = U ∩ ϕ −1 (W  ) ∩ W
 
= U ∩ ϕ −1 (W  ) ∩ W
also v = u + w ∈ ϕ −1 (U  ) + ϕ −1 (W  ). Damit gilt (i).  
= U  ∩ ϕ −1 (W  ) ∩ (W  + B)
Nach Lemma 2 (a) gilt U  ⊆ ϕ −1 (U  ). Nach dem Satz zur
Existenz eines Komplements auf Seite 218 gibt es einen Un- = {0} .
tervektorraum A von V mit
   Damit ist alles begründet. 

ϕ −1 (U  ) ∩ ϕ −1 (W  ) + U  ⊕ A = ϕ −1 (U  ) . (14.5)

Erneut wegen Lemma 2 (a) gilt W  ⊆ ϕ −1 (W  ), außerdem


haben wir U  ∩W  = {0}. Somit gibt es erneut nach dem Satz Der Beweis des Existenzsatzes erfolgt per
zur Existenz eines Komplements einen Untervektorraum B Induktion nach der Dimension des
von V mit Vektorraums
  
U  ∩ ϕ −1 (W  ) ⊕ W  ⊕ B = ϕ −1 (W  ) . (14.6)
Wir haben im letzten Abschnitt alle wesentlichen Hilfsmit-
tel zum Beweis des folgenden Existenzsatzes einer Jordan-
Nun erklären wir die Untervektorräume U und W durch Normalform bereitgestellt:

U = U  ⊕ A und W = W  ⊕ B .
Kriterium für die Existenz einer Jordan-Normalform
Hieraus folgt U ⊆ U, W ⊆ W , und es gilt: Für einen Endomorphismus ϕ eines n-dimensionalen
K-Vektorraums V , n ∈ N, sind äquivalent:
U ⊆ ϕ −1 (U  ) und W ⊆ ϕ −1 (W  ) , (i) ϕ besitzt eine Jordan-Normalform.
(ii) Das charakteristische Polynom χϕ zerfällt über K
in Linearfaktoren.
d. h., dass U und W ϕ -invariant sind.
14.7 Die Jordan-Normalform 531

Beweis: (i) ⇒ (ii): Falls ϕ eine Jordan-Normalform be- Wegen (∗) besitzt T nach der Induktionsvoraussetzung eine
sitzt, so ist dies eine obere Dreicksmatrix. Somit zerfällt χϕ Jordan-Basis BT = (b1 , . . . , bk ) bezüglich ϕ|T . Die Dar-
über K in Linearfaktoren. stellungsmatrix

(ii) ⇒ (i): Nun zerfalle das charakteristische Polynom χϕ des


Endomorphismus ϕ eines n-dimensionalen K-Vektorraums AT = BT M(ϕ|T )BT
V über K in Linearfaktoren. Wir zeigen die Existenz einer
Jordan-Normalform mit Induktion nach der Dimension n des ist eine Jordan-Normalform von ϕ|T .
Vektorraums V .
Wir treffen eine weitere Fallunterscheidung:
Induktionsanfang. Für n = 1 gilt die Behauptung, da
Fall 2a. Die Jordan-Matrix AT enthält zwei Jordan-Käst-
B M(ϕ)B = (λ) ∈ K
1×1 für jede beliebige Basis B

von jedem Vektorraum V der Dimension 1 bereits Jordan- chen, d. h.


⎛ ⎞
Normalform hat. A1
⎜ A2 ⎟
Induktionsvoraussetzung. Die Behauptung sei richtig für alle AT = ⎝ ⎠
..
Vektorräume V mit 1 ≤ dim V ≤ n − 1 und alle Endo- .
morphismen ϕ von V mit zerfallendem charakteristischem
Polynom χϕ . wobei das Jordan-Kästchen A1 genau j Zeilen enthalte,
1 ≤ j < k. Die beiden zueinander komplementären Un-
Induktionsschritt. Es sei λ ∈ K eine Nullstelle von χϕ , d. h.,
tervektorräume
χϕ (λ) = 0. Für den Kern des Endomorphismus ϕ − λ idV
von V gilt:
U  = -b1 , . . . , bj . und W  = -bj +1 , . . . , bk .
ker(ϕ − λ idV ) = {0} ,

sodass wir für die Dimension des Bildes von ϕ − λ idV nach von T sind ϕ|T -invariant, also ϕ -invariant und schließlich
der Dimensionsformel auf Seite 427 erhalten: auch (ϕ − λ idV ) -invariant. Damit ist T die direkte Summe
zweier (ϕ − λ idV ) -invarianter Untervektorräume U  und
dim Bild(ϕ − λ idV ) < n . (∗) W :
U  ⊕ W  = T = Bild(ϕ − λ idV ) .
Wir treffen eine Fallunterscheidung:

1. Fall. ker(ϕ − λ idV )  ⊆ Bild(ϕ − λ idV ): Wegen Lemma 3 Somit gibt es nach Lemma 4 Untervektorräume U und W
existieren (ϕ − λ idV ) -invariante Untervektorräume U und von V mit U  ⊆ U und W  ⊆ W , die unter ϕ − λ idV
W von V mit dim U, dim W < n und V = U ⊕ W . Da für invariant sind und V = U ⊕ W erfüllen. Da U  , W  = {0}
jedes u ∈ U und w ∈ W gilt: gilt, erhalten wir auch U, W = {0}. Nach Lemma 1 (d) gilt:

(ϕ − λ idV )(u) = ϕ(u) − λ u ∈ U und χϕ = χϕ|U χϕ|W .


(ϕ − λ idV )(w) = ϕ(w) − λ w ∈ W ,
Somit zerfallen χϕ|U und χϕ|W in Linearfaktoren. Wegen
sind die Untervektorräume U und W somit auch ϕ -invariant. U, W  = {0} gilt dim U, dim W < n. Mit der Induktionsvor-
aussetzung und Lemma 1 (c) folgt die Behauptung in diesem
Nach Lemma 1 (b) ist das charakteristische Polynom von ϕ Fall.
das Produkt der charakteristischen Polynome von ψ = ϕ|U
und ρ = ϕ|W : Fall 2b. Die Jordan-Matrix AT ist ein Jordan-Kästchen, d. h.
χϕ = χψ χρ . ⎛ ⎞
μ 1
Mit χϕ zerfallen auch die charakteristischen Polynome χψ ⎜ .. .. ⎟
⎜ . . ⎟
und χρ . Wegen der Induktionsannahme existieren Jordanba- AT = BT M(ϕ|T )BT =⎜



⎝ ..
sen BU und BW bezüglich ψ und ρ. Nach Lemma 1 (c) ist . 1⎠
die Vereinigung B = BU ∪ BW eine Jordan-Basis bezüglich μ
ϕ von V .
Da zum einen λ ein Eigenwert von ϕ ist und zum anderen
2. Fall. ker(ϕ−λ idV ) ⊆ Bild(ϕ−λ idV ): Nach Lemma 2 (d)
ker(ϕ −λ idV ) ⊆ Bild(ϕ −λ idV ) vorausgesetzt ist, erhalten
ist der Untervektorraum T = Bild(ϕ −λ idV ) invariant unter
wir
ϕ − λ idV und somit (wie im 1. Fall gezeigt) auch invariant
unter ϕ, d. h., ϕ(T ) ⊆ T . Der Endomorphismus ϕ|T von
T hat ein in Linearfaktoren zerfallendes charakteristisches {0} = ker(ϕ − λ idV ) = ker ((ϕ − λ idV )|T )
Polynom χϕ|T . = ker(ϕ|T − λ idT ) .
532 14 Normalformen – Diagonalisieren und Triangulieren

Da AT die Darstellungsmatrix von ϕ|T bezüglich BT ist, Wir schildern die Konstruktion einer Jordan-Basis und da-
muss somit μ = λ gelten, da andernfalls ker(ϕ|T −λ idT ) = mit der Jordan-Normalform zuerst an Beispielen. Das all-
{0} gelten würde. gemeine Vorgehen wird dann schnell klar. Vorher stellen wir
Hilfsmittel bereit, mit denen man in vielen Fällen eine Jordan-
Mit der Dimensionsformel von Seite 427 gilt nun: Normalform einer Matrix bestimmen kann, ohne eine Jordan-
Basis angeben zu müssen.
1 = dim ker(ϕ|T − λ idT )
Wir beginnen mit dem Fall, dass die Matrix A nur einen
= dim ker(ϕ − λ idV )
Eigenwert hat.
= n − dim Bild(ϕ − λ idV ) ,

d. h., dass Die Dimension des Eigenraums ist die Anzahl


der Jordan-Kästchen
dim T = dim Bild(ϕ − λ idV ) = n − 1 .
Gegeben ist eine Matrix A ∈ Kn×n mit einem in Linear-
Wegen der Form der Darstellungsmatrix AT gilt für die er- faktoren zerfallendem charakteristischem Polynom χA =
zeugenden Vektoren von T = -b1 , . . . , bn−1 .: (λ − X)n . Also ist λ ∈ K der einzige Eigenwert von A mit
der algebraischen Vielfachheit n und der geometrischen Viel-
(ϕ − λ idV )(b1 ) = 0 , fachheit mg (λ), wobei wir von dieser nur wissen, dass
(ϕ − λ idV )(bi ) = bi−1 , 1 < i < n .
1 ≤ mg (λ) ≤ n

Weiter gibt es wegen (ϕ − λ idV )(V ) = T ein bn ∈ V \ T gilt. Weil das charakteristische Polynom in Linearfaktoren
mit zerfällt, existiert zu A eine Jordan-Normalform J , d. h., es
(ϕ − λ idV )(bn ) = bn−1 . gibt eine Matrix S = (b1 , . . . , bn ) ∈ Kn×n mit
⎛ ⎞
J1
Da bn ∈ T , ist B = (b1 , . . . , bn ) eine Basis von V . Wegen ⎜ ⎟
.. −1
J =⎝ . ⎠ = S AS ,
⎛ ⎞
λ 1 Jl
⎜ .. .. ⎟
⎜ . . ⎟ wobei J 1 , . . . , J l Jordan-Kästchen sind.
M(ϕ) = ⎜ ⎟
B B ⎜ .. ⎟
⎝ . 1⎠ Da A und J ähnlich sind, haben A und J dasselbe charakte-
λ ristische Polynom und auch denselben Eigenwert λ mit der
gleichen algebraischen und geometrischen Vielfachheit. Da-
ist B eine Jordan-Basis von V bezüglich ϕ.  mit haben also alle Jordan-Kästchen J 1 , . . . , J l nur λ als
Diagonaleinträge,
⎛ ⎞
Da über dem algebraisch abgeschlossenen Körper C jedes ⎛ ⎞ λ 1
J1 ⎜ ⎟
Polynom in Linearfaktoren zerfällt, erhalten wir die Folge- ⎜ .. .. ⎟
⎜ ⎟ ⎜ . . ⎟
rung: J =⎝ ..
. ⎠ mit J i =⎜



⎜ .. ⎟
⎜ . 1⎟
Jl ⎝ ⎠
λ
Jordan-Normalform komplexer Matrizen
Jeder Endomorphismus ϕ eines C-Vektorraums V be- für i = 1, . . . , l. Und wegen
sitzt eine Jordan-Normalform. Insbesondere ist jede mg (λ) = dim(ker(J − λ En ))
komplexe Matrix zu einer Jordan-Matrix ähnlich.
= Anzahl der Jordan-Kästchen von J ,

siehe etwa
⎛ ⎞
14.8 Die Berechnung einer ⎜
0

⎜ ⎟
Jordan-Normalform und ⎜

0 1 ⎟

⎜ 0 1 ⎟
Jordan-Basis ⎜ ⎟
J − λ E7 = ⎜ 0 ⎟
⎜ ⎟
⎜ ⎟
⎜ 0 1 ⎟
⎜ ⎟
In den folgenden Beispielen berechnen wir die Jordan- ⎝ 0 1⎠
Normalformen von Matrizen. Die Jordan-Normalform eines 0
Endomorphismus ϕ erhält man aus der Jordan-Normalform
einer und damit jeder Darstellungsmatrix von ϕ. erhalten wir damit:
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 533

Die Anzahl der Jordan-Kästchen Somit ist das Kästchen J j − λ Enj nilpotent mit Nilpotenz-
index nj . Folglich ist die ganze Matrix J − λ En auch nil-
Die Anzahl der Jordan-Kästchen einer Jordan-Normal-
potent. Und der Nilpotenzindex r von J − λ En ist das
form J zu einer Matrix A ∈ Kn×n zu dem Eigenwert λ
Maximum der Nilpotenzindizes der Jordan-Kästchen, also
ist die geometrische Vielfachheit mg (λ) des Eigenwerts
r = max{n1 , . . . , nl }.
λ von A.
Wegen J = S −1 A S gilt:
Damit ist die Jordan-Normalform von A genau dann eine
Diagonalmatrix, wenn die geometrische Vielfachheit von λ J − λ En = S −1 A S − λ S −1 S
gleich der algebraischen Vielfachheit ist. = S −1 (A − λ En ) S .
? Damit erhalten wir
Durch die Dimension der Eigenräume ist die Jordan-Normal-
form einer 3 × 3-Matrix A ∈ K3×3 bis auf die Reihenfolge
(J − λ En )k = 0 ⇔ S −1 (A − λ En )k S = 0
der Jordan-Kästchen eindeutig festgelegt. Welche wesentlich
verschiedenen Formen gibt es ? ⇔ (A − λ En )k = 0 .

Also ist auch A − λ En nilpotent vom Nilpotenzindex r.


Das besagt, dass der Nilpotenzindex von A − λ En die Zei-
Das größte Jordan-Kästchen hat r Zeilen,
lenanzahl des größten Jordan-Kästchens J j einer Jordan-
wobei r der Nilpotenzindex ist Normalform von A angibt.

Wir betrachten weiterhin die Matrix A ∈ Kn×n mit dem cha-


rakteristischen Polynom χA = (λ−X)n und entscheiden, wie Die Zeilenzahl des größten Jordan-Kästchen
groß das größte Jordan-Kästchen der Jordan-Normalform Die Zeilenzahl des größten Jordan-Kästchens einer
⎛ ⎞ Jordan-Normalform von A ist der Nilpotenzindex r der
J1
⎜ .. ⎟ Matrix A − λ En .
J =⎝ . ⎠
Jl
ist, dabei bezieht sich der Begriff Größe auf die Anzahl der
?
Welche Jordan-Normalform J kann eine Matrix A ∈ C5×5
Zeilen bzw. Spalten der Kästchen.
mit 5-fachem Eigenwert 1 der geometrischen Vielfachheit 3
Die Matrix haben, wenn A − E5 den Nilpotenzindex 3 hat?
⎛ ⎞
J 1 − λ En1
⎜ .. ⎟
J − λ En = ⎝ . ⎠
Wir gewinnen nun die wesentliche Motivation für die Kon-
J l − λ Enl struktion einer Jordan-Basis. Dabei gehen wir von der glei-
ist nilpotent, da für jedes Kästchen chen Situation wie bisher aus: Gegeben ist eine Matrix
⎛ ⎞ A ∈ Kn×n mit nur einem Eigenwert λ und einem in Line-
0 1
⎜ .. .. ⎟ arfaktoren zerfallendem charakteristischem Polynom χA =
⎜ . . ⎟ (λ − X)n . Es sei J eine Jordan-Matrix zu A mit einer Trans-
J j − λ Enj = ⎜⎜ ⎟
.. ⎟ formationsmatrix S, d. h., J = S −1 A S. Dann gilt für jedes
⎝ . 1⎠
k ∈ N:
0
(J − λ En )k = S −1 (A − λ En )k S
mit nj Zeilen die Gleichung
⎛ ⎞nj und damit wegen der Invertierbarkeit von S (man beachte die
0 1 Folgerung auf Seite 455):
⎜ .. .. ⎟
⎜ . . ⎟
(J j − λ Enj )nj ⎜
=⎜ ⎟ =0 dim ker(J − λ En )k = dim ker(A − λ En )k .
.. ⎟
⎝ . 1⎠
0 Wir setzen nun N = A − λ En und erhalten aufgrund der
besonderen Form der Matrix J − λ En eine Kette
gilt, z. B.
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
0 1 0 0 0 0 1 0 0 0 0 1
{0} ker N ker N 2 · · · ker N r = Kn .
⎜0
⎜ 0 1 0⎟⎟→N· ⎜
⎜0 0 0 1⎟⎟→N· ⎜
⎜0 0 0 0⎟⎟→N·
0,
⎝0 0 0 1⎠ ⎝0 0 0 0⎠ ⎝0 0 0 0⎠
0 0 0 0 0 0 0 0 0 0 0 0 Dabei gilt:

N Es ist r der Nilpotenzindex von N bzw. J − λ En .
bei jeder Multiplikation rutscht die Diagonale mit den Einsen Es ist mg (λ) = dim ker N .
um eine Reihe hoch. Es ist ma (λ) = dim ker N r .
534 14 Normalformen – Diagonalisieren und Triangulieren

Zur Konstruktion einer Jordan-Basis gibt es B = (b1 , b2 , b3 , b4 ), d. h., es gilt:


ein übersichtliches Verfahren A b1 = 2 b1 ,
A b2 = 1 b1 + 2 b2 ,
Wir gehen nach wie vor davon aus, dass die betrachtete Ma-
trix A nur einen Eigenwert λ hat. Mit den beiden Hilfsgrößen, A b3 = 2 b3 ,
der Dimension des Eigenraums und des Nilpotenzindixes, ist A b4 = 1 b3 + 2 b4 .
eine Jordan-Normalform in vielen Fällen bereits festgelegt.
Wir geben ein Beispiel. Die Vektoren b1 und b3 sind somit Eigenvektoren, hierfür
können wir also die zwei linear unabhängigen Vektoren wäh-
Beispiel Als Matrix A betrachten wir die reelle Matrix len, welche den Eigenraum erzeugen, und b2 und b4 erhalten
⎛ ⎞ wir sodann als Lösungen der beiden linearen Gleichungs-
3 1 0 0 systeme
⎜−1 1 0 0⎟
A=⎜
⎝1 1 3
⎟ ∈ R4×4 (A − 2 E4 ) b2 = b1 und (A − 2 E4 ) b4 = b3 .
1⎠
−1 −1 −1 1 Dies ist eine Möglichkeit, eine Jordan-Basis B =
(b1 , b2 , b3 , b4 ) zu konstruieren. Wir geben nun ein durch-
mit dem charakteristischen Polynom χA = (2 − X)4 . Weil sichtigeres Verfahren in Form von Beispielen an, das
das Polynom in Linearfaktoren zerfällt, existiert zu A eine man auch dann anwenden kann, wenn man eine Jordan-
Jordan-Normalform J . Normalform der Matrix A noch gar nicht kennt.
Wir bestimmen die geometrische Vielfachheit des einzigen
Beispiel Wir betrachten die Matrix
Eigenwerts 2 von A, also die Lösungsmenge des Systems ' (
(A − 2 E4 ) v = 0. Wegen i i
A= ∈ C2×2 ,
⎛ ⎞ 0 i
1 1 0 0
⎜−1 −1 0 0 ⎟ deren einziger Eigenwert die komplexe Zahl i mit der alge-
A − 2 E4 = ⎜
⎝1 1 1 1⎠
⎟ braischen Vielfachheit 2 ist. Im Folgenden wird die Matrix
−1 −1 −1 −1 N = A − i E2

erhalten wir sogleich: eine wesentliche Rolle spielen. Wir betrachten die folgende
⎛ ⎞ ⎛ ⎞ Kette:
1 2
? 1 0 @ {0} ker
N  ker N  .
⎜−1⎟ ⎜ 0 ⎟ ? @ ?   @
EigA (2) = ⎜ ⎟ ⎜ ⎟ 2
⎝ 0 ⎠ , ⎝ 1 ⎠ und (A − 2 E4 ) = 0 . 1 1 0
= = ,
0 0 1
0 −1
Dabei ist ker N 1 gerade der Eigenraum zum Eigenwert i von
Weil die Dimension des Eigenraums 2 ist, hat die Jordan- A. Weil dieser Eigenraum eindimensional ist, können wir
Normalform zwei Jordankästchen zum Eigenwert 2. Weil die gleich folgern, dass es nur ein Jordan-Kästchen gibt, damit
kleinste natürliche Zahl k mit (A − 2 E4 )k = 0 gleich 2 ist, liegt die Jordan-Normalform bereits fest, wir benutzen im
ist das längste Jordankästchen ein 2 × 2-Kästchen. Damit hat Folgenden aber dieses Wissen nicht.
eine Jordan-Normalform zu A das Aussehen
⎛ ⎞ ?
2 1 Wie sieht die Jordan-Normalform aus?
⎜0 2 ⎟
⎜ ⎟
J =⎜⎜


⎝ 2 1⎠ Wir wählen vielmehr ein Element b2 ∈ ker N 2 \ ker N 1 , und
0 2 zwar ' (
0
b2 = .
1
Hier ist die Jordan-Normalform sogar eindeutig, da ein Ver-
tauschen der Kästchen die Matrix nicht ändert.  Dies ist gerade der Basisvektor, den wir zu einer Basis von
ker N ergänzt haben, um eine Basis von ker N 2 zu erhalten.
Weil wir nun das Aussehen der Jordan-Normalform J von A Dieser Vektor b2 erfüllt wegen seiner speziellen Wahl die
in diesem Beispiel kennen, könnten wir auch eine Jordan- folgenden Eigenschaften:
Basis konstruieren. Hierzu könnten wir ausnutzen, dass b2 ist kein Eigenvektor von A,
wir nun die Koordinatenvektoren der Bilder der Jordan- N b2 ∈ ker N 1 \ {0}.
Basisvektoren unter der Abbildung ϕA : v  → A v kennen
Die zweite Eigenschaft gilt, weil b2 ∈ ker N 2 , d. h.,
– dies sind ja die Spalten von J , also der Darstellungs-
matrix der Abbildung v  → A v bezüglich der Jordan-Basis 0 = N 2 b2 = N (N b2 ) ,
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 535

d. h., N b2 ∈ ker N 1 . Und N b2  = 0, da sonst b2 ∈ ker N 1 Beispiel Wir bestimmen eine Jordan-Basis und eine
gelten würde. Jordan-Normalform zur Matrix
⎛ ⎞
Wir setzen nun b1 = N b2 , 2 1 1 0 0 0
b1 = N b2 = (A − i E2 ) b2 = A b2 − i b2 . ⎜0 2 1 0 0 0 ⎟
⎜ ⎟
⎜0 0 2 0 0 0 ⎟
Nun gilt: A=⎜ ⎜ ⎟ ∈ R6×6 .

⎜0 1 0 2 1 −1⎟
b1 , b2 sind linear unabhängig, da b2 ∈ ker N 2 \ -b1 .. ⎝0 0 0 0 2 0 ⎠
A b1 = i b1 , da b1 ∈ ker N = EigA (i). 0 0 1 0 0 2
A b2 = 1 b1 + i b2 .
Wegen χA = (2 − X)6 existiert eine Jordan-Normalform
Also ist B = (b1 , b2 ) eine Jordan-Basis mit der Jordan-
' ( zu A.
Normalform
i 1
J = Wir berechnen für N = A − 2 E6 die Kette
0 i
zu A. {0} ker N 1 ker N 2 · · · ker N r = R6 .
Und mit der Matrix S = (b1 , b2 ) gilt J = S −1 A S.
Es gilt: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0
? ?⎜ ⎟ ⎜ ⎟ ⎜0⎟
⎜ ⎟ ⎜ ⎟ ⎜
Ist (b2 , b1 ) auch eine Jordan-Basis zu A? 0 0 ⎟@
⎜0⎟ ⎜0⎟ ⎜0⎟
ker N = ⎜ ⎟ , ⎜ ⎟ , ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜

 ⎜0⎟ ⎜1⎟ ⎜0⎟
⎝0⎠ ⎝0⎠ ⎝1⎠
Wir haben den Vektor b1 noch gar nicht explizit angegeben. 0 0 1
Wir haben auch an keiner Stelle vom speziellen Aussehen
und
des Vektors b2 Gebrauch gemacht, sondern nur von der Tat-
sache, dass b2 ∈ ker N 2 \ ker N 1 gilt. Damit haben wir also ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0 0 0
ein Verfahren entwickelt, das für beliebige nicht diagonali- ?⎜ 0 ⎟ ⎜0⎟ ⎜0⎟ ⎜1⎟ ⎜0⎟@
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
sierbare 2 × 2-Matrizen A mit zerfallendem charakteristi- ⎜0⎟ ⎜0⎟ ⎜0⎟ ⎜0⎟ ⎜0⎟
schem Polynom anwendbar ist, um eine Jordan-Basis zu A ker N 2 = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜0⎟ , ⎜1⎟ , ⎜0⎟ , ⎜0⎟ , ⎜0⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
zu bestimmen. ⎝0⎠ ⎝0⎠ ⎝1⎠ ⎝0⎠ ⎝0⎠
0 0 1 0 1
Jordan-Basen von 2 × 2-Matrizen
Ist A ∈ K2×2 nicht diagonalisierbar und zerfällt das und
charakteristische Polynom von A in Linearfaktoren, so ker N 3 = R6 .
hat A einen zweifachen Eigenwert λ, und es ist B = Es gibt also 3 Jordan-Kästchen, und das größte ist ein 3 × 3-
(b1 , b2 ) mit Kästchen.
b2 ∈ ker N 2 \ ker N 1 und b1 = N b2 , Wir betrachten die Kette mit den zugehörigen Dimensionen
wobei N = A − λ E2 , eine Jordan-Basis zu A. 2 3 6
{0} ker
N ker N  = R
N  ker
dim=3 dim=5 dim=6
Dieses Verfahren kann auf größere Matrizen übertragen wer-
den. Wir behandeln auf Seite 536 ausführlich weitere Bei- und gehen nun wie folgt vor, um eine Jordan-Basis
spiele. (b1 , . . . , b6 ) zu konstruieren:
? (i) Wir wählen einen Vektor b6 ∈ ker N 3 \ ker N 2 und
Können Sie eine Jordan-Basis und die Jordan-Normalform setzen b5 = N b6 ∈ ker N 2 und b4 = N b5 ∈ ker N .
zur Matrix A aus dem Beispiel auf Seite 536 für den Fall Dieser Durchlauf der Kette von hinten nach vorne liefert
ε = 2 angeben? ein 3 × 3-Jordan-Kästchen.
(ii) Wir wählen einen Vektor b3 ∈ ker N 2 \ ker N , der zum
Vektor b5 linear unabhängig ist – aus Dimensionsgrün-
Bei der durchgeführten Konstruktion entstehen automa-
den ist eine solche Wahl noch möglich –, und setzen
tisch die größten Jordankästchen unten: Das größte Jordan-
b2 = N b3 ∈ ker N . Dieser Durchlauf der Kette von
Kästchen hat genauso viele Zeilen wie die Kette {0}
hinten nach vorne liefert ein 2 × 2-Jordan-Kästchen.
ker N 1 ker N 2 · · · ker N r echte Inklusionen auf-
(iii) Wir wählen einen Vektor b1 ∈ ker N \ {0}, der zu den
weist, dies ist gerade der Nilpotenzindex r von N = A−λ E3 .
Vektoren b2 und b4 linear unabhängig ist – aus Dimen-
Mit den gesammelten Erfahrungen ist es nun nicht mehr sionsgründen ist eine solche Wahl noch möglich. Dieser
schwierig, Jordan-Basen zu größeren Matrizen zu bestim- Durchlauf der Kette von hinten nach vorne liefert ein
men. 1 × 1-Jordan-Kästchen.
536 14 Normalformen – Diagonalisieren und Triangulieren

Beispiel: Zur Bestimmung von Jordan-Basen


Wir bestimmen eine Jordan-Basis und eine Jordan-Normalform
⎛ ⎞ zu der Matrix
1 1 1
A = ⎝0 1 ε ⎠ ∈ R3×3 mit ε ∈ {0, 1} ,
0 0 1
deren einziger Eigenwert die reelle Zahl 1 mit der algebraischen Vielfachheit 3 ist.

Problemanalyse und Strategie: Wir unterscheiden nach den beiden Fällen ε = 1 und ε = 0. In beiden Fällen bilden
wir die Matrix N = A − 1 E2 , die Kette
{0} ker N 1 ker N 2 · · · R3
und wählen dann beim R3 beginnend sukzessive jeweils der Reihe nach die Vektoren b3 , b2 und b1 , um eine Jordan-Basis
(b1 , b2 , b3 ) zu A zu erhalten.

Lösung: 2. Fall ε = 0: Wir setzen


1. Fall ε = 1: Wir setzen ⎛ ⎞
⎛ ⎞ 0 1 1
0 1 1 N = A − 1 E3 = ⎝0 0 0⎠
N = A − 1 E3 = ⎝0 0 1⎠ 0 0 0
0 0 0
Wir berechnen die Kerne der Matrizen N 1 , N 2 und N 3 : Wir berechnen die Kerne der Matrizen N 1 und N 2 :
1 2
{0} ker 1 2 3 {0} N 
ker N 
ker
N  N 
ker N 
ker .
⎛ ⎞
? 1 @ ⎛ ⎞ ⎛ ⎞
? 1 @ ?⎛ ⎞ ⎛ ⎞ ⎛ ⎞
@ ?⎛1⎞ ⎛ 0 ⎞@ ?⎛1⎞ ⎛ 0 ⎞ ⎛0⎞@
0 1 0 0 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
= ⎜ 0 ⎟ = ⎜0⎟ ,⎜1⎟ = ⎜0⎟ ,⎜1⎟ ,⎜0⎟ = ⎜ ⎟ ⎜
⎝0⎠ ,⎝ 1 ⎠
⎟ = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝0⎠ ,⎝ 1 ⎠ ,⎝0⎠
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
0 0 0 0 0 1 0 −1 0 −1 1
Es ist ker N 1 der Eigenraum zum Eigenwert 1 von A. Weil Nun ist bereits ker N 2 dreidimensional, ein weiteres Po-
dieser Eigenraum eindimensional ist, können wir gleich tenzieren der Matrix kann den Kern nicht weiter ver-
folgern, dass es nur ein Jordan-Kästchen gibt, damit liegt größern, daher bricht diese Kettenbildung bereits hier
die Jordan-Normalform bereits fest. ab. An dieser Kette kann man die Struktur der Jordan-
⎛ ⎞ ein Element b3 ∈ ker N \ ker N , und zwar
Wir wählen 3 2
Normalform bereits ablesen: Man wählt einen Vektor b3
0 aus ker N 2 \ ker N 1 , bildet diesen mit N auf den Vektor
b3 = ⎝0⎠. Nun setzen wir b2 = N b3 ∈ ker N 2 \ ker N 1 b2 ∈ ker N 1 \{0}, also auf einen Eigenvektor, ab und wählt
1 als b1 einen zu b2 linear unabhängigen Eigenvektor. Weil
und fassen zusammen, der Eigenraum zweidimensional ist, ist dies auch möglich.
⎛ ⎞
1 So entsteht eine Jordan-Basis.
b2 = ⎝1⎠ = N b3 = (A − 1 E3 ) b3 = A b3 − 1 b3 ,
⎛ ⎞ein Element b3 ∈ ker N \ ker N , und
Wir wählen 2 1 zwar
⎛ ⎞
0 0 1
also: b3 = ⎝0⎠. Nun setzen wir b2 = N b3 = ⎝0⎠ ∈
b2 und b3 sind linear unabhängig. 1 0
A b3 = 1 b2 + 1 b3 . ker N 1 \ {0}. Schließlich gilt mit
Wir setzen b1 = N b2 ∈ ker N 1 \ {0} und fassen wieder ⎛ ⎞ ⎛ ⎞
zusammen, 0 1
⎛ ⎞ b1 = ⎝ 1 ⎠ ∈ ker N \ -⎝0⎠.
1
1
−1 0
b1 = ⎝0⎠ = N b2 = (A − 1 E3 ) b2 = Ab2 − 1 b2 ,
0 b1 , b2 und b3 sind linear unabhängig.
also: A b3 = 1 b2 + 1 b3 .
b1 , b2 und b3 sind linear unabhängig. A b2 = 1 b2 .
A b3 = 1 b2 + 1 b3 . A b1 = 1 b1 .
A b2 = 1 b1 + 1 b2 . Damit ist also B = (b1 , b2 , b3 ) eine Jordan-Basis zu A,
A b1 = 1 b1 . und es hat A eine Jordan-Normalform:
⎛ ⎞
Damit ist also B = (b1 , b2 , b3 ) eine Jordan-Basis zu A, 1 0 0
und es hat A eine Jordan-Normalform:
⎛ ⎞ J = ⎝0 1 1⎠
1 1 0 0 0 1
J = ⎝0 1 1⎠
0 0 1
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 537

Wir erhalten so Vektoren Bei verschiedenen Eigenwerten bestimmt man


die Jordan-Basen nacheinander für die
b , b2 , b4 , b3 , b5 , b6 .
1    einzelnen Eigenwerte
∈ker N \{0} ∈ker N 2 \ker N ∈ker N 3 \ker N 2
Ab nun verzichten wir auf die Einschränkung, dass die Ma-
Falls nun {b1 , b2 , b4 } und {b3 , b5 } linear unabhängig sind, trix A ∈ Kn×n nur einen Eigenwert λ hat. Es sind dann die
haben wir eine Jordan-Basis (b1 , . . . , b6 ) gefunden. Dazu ist verschiedenen Eigenwerte λ1 , . . . , λs von A nacheinander
nur nachzuprüfen, dass b2 und b4 linear unabhängig sind, die zu untersuchen. Dazu betrachtet man die Matrizen
restlichen Unabhängigkeiten sind per Konstruktion erfüllt.
N 1 = A − λ 1 En , . . . , N s = A − λ s En
Kommentar: Man beachte, dass wir bei dieser Konstruk- mit den zugehörigen Ketten
tion nicht unbedingt eine Jordan-Basis erhalten: Falls b2 und
b4 linear abhängig sind, so ist Schritt (ii) mit einer anderen {0} ker N i ker N i 2 · · · ker N i ri = ker N i ri +1 .
Wahl für b3 zu wiederholen. Diese Problematik lässt sich Man nennt die Untervektorräume ker N i j verallgemei-
durch eine Modifikation dieser Konstruktion umgehen; wir nerte Eigenräume zum Eigenwert λi , den größten verall-
formulieren dieses modifizierte Vorgehen in einem Algorith- gemeinerten Eigenraum ker N i ri bezeichnet man auch als
mus auf Seite 540. Bei Rechnungen mit Bleistift und Papier Hauptraum zum Eigenwert λi . Die Elemente aus dem
ist aber das oben geschilderte Vorgehen im Allgemeinen zu Hauptraum ker N i ri zum Eigenwert λi nennt man auch
bevorzugen; eventuell muss man einen gewählten Vektor ver- Hauptvektoren. Wie im Fall eines einzigen Eigenwerts
werfen und eine neue, geschicktere Wahl treffen. (Seite 533) zeigt man:

Wir schildern die Konstruktion in unserem Beispiel ausführ- Die Dimension des Hauptraums
lich: Zerfällt das charakteristische Polynom χA von A ∈ Kn×n
(i) Wir wählen in Linearfaktoren:

b6 = (0, 0, 1, 0, 0, 0)0 ∈ ker N 3 \ ker N 2 , χA = (λ1 − X)ma (λ1 ) · · · (λs − X)ma (λs ) ,

und setzen so gibt es zu jedem Eigenwert λi , i = 1, . . . , s, und


N i = A − λi En eine natürliche Zahl ri mit 1 ≤ ri ≤ n
b5 = N b6 = (1, 1, 0, 0, 0, 1)0 ∈ ker N 2 \ ker N 1 , und
b4 = N b5 = (1, 0, 0, 0, 0, 0)0 ∈ ker N \ {0}.
{0} ker N i ker N i 2 · · · ker N i ri ,
Die Vektoren b6 , b5 , b4 liefern ein 3 × 3-Jordan-Kästchen. r
wobei dim ker N i i = ma (λi ).
(ii) Weiter wählen wir Die Dimension des Hauptraums zum Eigenwert λ ist
somit die algebraische Vielfachheit des Eigenwerts λ.
b3 = (0, 1, 0, 0, 0, 0)0 ∈ ker N 2 \ -b5 .
und setzen Kommentar: Für diese Zahlen r1 , . . . , rs gilt:
b2 = N b3 = (1, 0, 0, 1, 0, 0)0 ∈ ker N \ {0}. Kn = ker N r1 ⊕ · · · ⊕ ker N rs .
Die Vektoren b2 und b4 sind offenbar linear unabhängig. Und Man spricht von der Hauptraumzerlegung des Kn . Dies
die Vektoren b3 , b2 liefern ein 2 × 2- Jordan-Kästchen. nachzuweisen haben wir als Übungsaufgabe formuliert
(siehe Abbildung 14.8).
(iii) Schließlich wählen wir
b1 = (0, 0, 0, 0, 1, 1)0 ∈ ker N \ -b2 , b4 .. ke
r Nr
ke
Der Vektor b1 liefert ein 1 × 1-Jordan-Kästchen. r N2
ke
r N
Insgesamt ist B = (b1 , . . . , b6 ) eine Jordan-Basis zu A, und
es ist
⎛ ⎞
2
⎜ ⎟
⎜ ⎟
⎜ 2 1 ⎟
⎜ ⎟
⎜ 0 2 ⎟
J =⎜ ⎟
⎜ ⎟
⎜ 2 1 0⎟
⎜ ⎟
⎝ 0 2 1⎠
0 0 2
Abbildung 14.8 Der Vektorraum V wird in seine Haupträume für die verschie-
eine Jordan-Normalform von A.  denen Eigenwerte zerlegt
538 14 Normalformen – Diagonalisieren und Triangulieren

Wir erhalten: Hier bricht die Kette ab, weil der Eigenwert 2 die algebraische
Vielfachheit 3 hat. Es gehören also 3 Jordan-Basisvektoren
Zur Anzahl und Größe der Jordan-Kästchen zu dem Eigenwert 2, und diese finden wir in dieser Kette. An
Es sei A ∈ Kn×n eine Matrix mit zerfallendem charak- der Kette erkennen wir auch, dass es genau ein 3 × 3-Jordan-
teristischem Polynom χA . Ist λ ∈ K ein Eigenwert von Kästchen zum Eigenwert 2 gibt.
A mit der Kette der verallgemeinerten Eigenräume Wir wählen

ker N 2 · · · ker r r+1 b6 = (0, 0, 1, 0, 1, 0)0 ∈ ker(A−2 E6 )3 \ ker(A−2 E6 )2


N
ker N  = kerN ,
dim=mg (λ) dim=ma (λ) und setzen
wobei N = A − λ En , so gilt: b5 = (A−2 E6 ) b6 = (1, 1, 0, 1, 0, 0)0 ∈ ker(A−2 E6 )2 \
(a) Die Dimension des Hauptraums ker N r zum Eigen- ker(A − 2 E6 )1 ,
wert λ ist die algebraische Vielfachheit ma (λ) des b4 = (A−2 E6 ) b5 = (1, 0, 0, 0, 0, 0)0 ∈ ker(A−2 E6 )1 \
Eigenwerts λ. {0}.
(b) Die Dimension des Eigenraums ker N ist die Anzahl
der Jordan-Kästchen zum Eigenwert λ. Die Jordan-Basisvektoren b6 , b5 , b4 liefern ein 3 × 3-
(c) Die Zahl r ist die Länge des größten Jordan- Jordan-Kästchen.
Kästchens zum Eigenwert λ. Nun wenden wir das Verfahren auf den zweifachen Eigenwert
3 an und berechnen die Kette
Beispiel Wir betrachten die Matrix
⎛ ⎞ {0} ker(A − 3 E6 )1 · · · ker(A − 3 E6 )r .
2 1 1 0 0 0
⎜0 2 1 0 0 0 ⎟ Es gilt:
⎜ ⎟ ⎛ ⎞
⎜0 0 2 0 0 0 ⎟ 0
A=⎜ ⎜0 −1 0 3 1 −1⎟ ∈ R
⎟ 6×6
.
⎜ ⎟ ?⎜
⎜0⎟@

⎝0 0 −1 0 3 1 ⎠ ⎜ 0⎟
ker(A − 3 E6 )1 = ⎜
⎜1⎟

0 0 0 0 0 4 ⎜ ⎟
⎝0⎠
Es gilt χA = (2 − X)3 (3 − X)2 (4 − X), sodass eine Jordan- 0
Normalform von A existiert. Wir bestimmen eine Jordan-
Basis, indem wir das bisherige Verfahren einfach für die ein- und ⎛ ⎞ ⎛ ⎞
zelnen Eigenwerte anwenden. Wir beginnen mit dem Eigen- 0 0
wert 2 und berechnen die Kette ?⎜ ⎟ ⎜0⎟
⎜ 0 ⎟ ⎜
⎟@
⎜0⎟ ⎜0⎟
2 ⎜ ⎟
ker(A − 3 E6 ) = ⎜ ⎟ , ⎜ ⎟

⎟ .
{0} ker(A − 2 E6 )1 · · · ker(A − 2 E6 )r . ⎜1⎟ ⎜0⎟
⎝0⎠ ⎝1⎠
Es gilt: ⎛ ⎞ 0 0
1
?⎜
⎜ ⎟@
0 ⎟ Hier bricht die Kette ab, weil der Eigenwert 3 die algebraische
⎜ 0 ⎟ Vielfachheit 2 hat. Es gehören also 2 Jordan-Basisvektoren
ker(A − 2 E6 )1 = ⎜
⎜0⎟

zu dem Eigenwert 3, und diese finden wir in dieser Kette. An
⎜ ⎟
⎝0⎠ der Kette erkennen wir auch, dass es genau ein 2 × 2-Jordan-
0 Kästchen zum Eigenwert 3 gibt.
und ⎛ ⎞ ⎛ ⎞ Wir wählen
1 0
?⎜0 ⎟ ⎜1⎟@ b3 = (0, 0, 0, 0, 1, 0)0 ∈ ker(A−3 E6 )2 \ ker(A−3 E6 )1
⎜ ⎟ ⎜ ⎟
⎜0⎟ ⎜0⎟
ker(A − 2 E6 )2 = ⎜ ⎟ ⎜ ⎟
⎜0⎟ , ⎜1⎟
und setzen
⎜ ⎟ ⎜ ⎟
⎝0⎠ ⎝0⎠ b2 = (A−3 E6 ) b3 = (0, 0, 0, 1, 0, 0)0∈ ker(A−2 E6 )1\{0}.
0 0 Die Jordan-Basisvektoren b3 , b2 liefern ein 2 × 2-Jordan-
und Kästchen.
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0 Schließlich wenden wir das Verfahren auf den Eigenwert 4
?⎜0 ⎟ ⎜1⎟ ⎜0⎟@
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ an. Weil 4 ein einfacher Eigenwert ist, bricht die Kette bereits
⎜0⎟ ⎜0⎟ ⎜1⎟ nach dem Eigenraum ab, da nur ein Jordan-Basisvektor zu
ker(A − 2 E6 )3 = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜0⎟ , ⎜1⎟ , ⎜0⎟ .
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ diesem Eigenwert gehört, und dieser ist ein Eigenvektor:
⎝0⎠ ⎝0⎠ ⎝1⎠
0 0 0 {0} ker(A − 4 E6 )1 .
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 539

Und es gilt: Falls λ ein Eigenwert von A ist, so steigt die Folge (rk (A, λ))k
monoton und konvergiert gegen die algebraische Vielfachheit
⎛ ⎞
0 des Eigenwerts λ.
?⎜
⎜0⎟@

⎜ Für jedes k ∈ N setzen wir weiter:
0⎟
ker(A − 4 E6 )1 = ⎜ ⎟
⎜0⎟ .
⎜ ⎟ ck (A, λ) = rk+1 (A, λ) + rk−1 (A, λ) − 2 rk (A, λ)
⎝1⎠
1 und zeigen:

Lemma
Der Jordan-Basisvektor b1 = (0, 0, 0, 0, 1, 1)0 liefert ein
Zerfällt das charakteristische Polynom χA von A ∈ Kn×n ,
1 × 1-Jordan-Kästchen.
so ist für jeden Eigenwert λ von A die Zahl ck (A, λ),
Wir erhalten mit der Jordan-Basis B = (b1 , . . . , b6 ) die k ∈ N, die Anzahl der Jordan-Kästchen der Länge k zum
Jordan-Normalform Eigenwert λ.
⎛ ⎞
4
⎜ ⎟ Beweis: Da für zueinander ähnliche Matrizen A und B
⎜ ⎟
⎜ 3 1 ⎟ für jedes k ∈ N0 die Zahlen rk (A, λ) und rk (B, λ) gleich
⎜ ⎟
⎜ 0 3 ⎟ sind, können wir ohne Einschränkung annehmen, dass A in
J =⎜ ⎟
⎜ ⎟ Jordan-Normalform vorliegt:
⎜ 2 1 0⎟
⎜ ⎟
⎝ 0 2 1⎠ ⎛ ⎞ ⎛λ 1 ⎞
i
0 0 2 J1
⎜ ⎟ ⎜ ... ... ⎟
A=⎝ ..
. ⎠ mit J i = ⎜

⎟ ∈ Kni ×ni

..
zu A.  Jl . 1
λ i

Man kann das Verfahren zur Bestimmung einer Jordan-Basis für i = 1, . . . , l. Wegen der Dreiecksgestalt von A gilt:
allgemein schildern. Der Formalismus ist nicht ganz einfach,
man kann sich diesen Algorithmus auch nicht gut einprägen. !
l
rk (A, λ) = rk (J i , λ) .
Durch das Berechnen weniger Beispiele wird die Konstruk-
i=1
tion einer Jordan-Basis klar. Die Schwierigkeit, die bestehen
kann, haben wir bereits auf Seite 537 angedeutet: Es kann Nun sei i ∈ {1, . . . , l}.
eben passieren, dass beim zweiten Durchlauf der Kette zwei
1. Fall. λi = λ: Dann ist die Matrix J − λ Eni invertierbar.
Vektoren bi und bj aus ein und demselben verallgemeiner-
Somit ist auch (J − λ Eni )k für jedes k ∈ N0 invertierbar. Es
ten Eigenraum konstruiert werden, die jedoch linear abhän-
folgt:
gig sind. Somit können diese Vektoren nicht Elemente einer
rk (J i , λ) = ni für jedes k ∈ N
Jordan-Basis sein. Wir formulieren in einer Übersicht auf
Seite 540 einen Algorithmus, der dieses Problem bewältigt. und somit ck (J i , λ) = 0.
2. Fall. λi = λ: Dann hat die Matrix
⎛ ⎞
Die Jordan-Normalform einer Matrix ist bis 0 1
auf die Reihenfolge der Jordan-Kästchen ⎜ .. .. ⎟
⎜ . . ⎟
eindeutig bestimmt J i − λ Eni =⎜



⎝ ..
. 1⎠
0
Bei den bisherigen Beispielen zur Jordan-Normalform einer
Matrix A spielte die Matrix N = A − λ En eine Schlüssel- den Rang ni − 1, d. h., r1 (J i , λ) = ni − 1. Für die Potenzen
rolle. Mit den praktischen Erfahrungen, die wir in den Bei- (J i − λ Eni )k gilt:
spielen gesammelt haben, fällt es nun nicht mehr schwer, die

folgenden Ergebnisse nachzuvollziehen: ni − k , k ≤ ni ,
rk (J i , λ) =
Für eine Matrix A ∈ Kn×n , λ ∈ K und k ∈ N setzen wir 0, k > ni ,

sodass ⎧
rk (A, λ) = rg(A − λ En )k . ⎨ 0 , k < ni ,
ck (J i , λ) = 1 , k = ni ,
Die Zahl rk (A, λ) ist der Rang der Matrix (A − λ En )k . ⎩
0 , k > ni .
Falls λ kein Eigenwert von A ist, so gilt rk (A, λ) = n. Damit folgt die Behauptung. 
540 14 Normalformen – Diagonalisieren und Triangulieren

Übersicht: Bestimmung einer Jordan-Basis


Gegeben ist eine Matrix A ∈ Kn×n mit in Linearfaktoren zerfallendem charakteristischem Polynom. Das Bestimmen einer
invertierbaren Matrix S, die die Eigenschaft hat, dass J = S −1 A S eine Jordan-Matrix ist, nennt man auch Transformation
von A auf Jordan-Normalform. Als Spalten der Matrix S wählt man dabei die Vektoren einer Jordan-Basis des Kn von
A. Zur Transformation dieser Matrix A geht man meistens wie folgt vor:

Es sei Iteration für k = r − 1, . . . , 1:


ma (λ1 ) ma (λs ) Für i = 1, . . . , tk+1 =: t  seien schon die Vektoren
χA = (λ1 − X) · · · (λs − X)
das charakteristische Polynom von A mit den s verschie- bk,i ∈ ker N k \ ker N k−1
denen Eigenwerten λ1 , . . . , λs .
Für jeden Eigenwert λ von A setze N = A − λ En und be- bestimmt, sodass (bk,1 , . . . , bk,t  ) eine geordnete li-
stimme dann wie folgt eine Jordan-Basis des Hauptraums near unabhängige Menge ist; wir setzen
HauA (λ):
Bestimme Tk−1 = ker N k−1 ⊕ -bk,1 , . . . , bk,t  . .
ker N, . . . , ker N r ,
Falls tk > tk+1 , so bestimme linear unabhängige Vek-
wobei dim ker N r = ma (λ). Setze toren bk,i mit i = t  + 1, . . . , tk , sodass
tk = dim ker N k − dim ker N k−1 für k = r, . . . , , 1 .
ker N k = Tk−1 ⊕ -bk,t  +1 , . . . , bk,tk .
Es gilt tk ≥ tk+1 für alle k.
Bestimme linear unabhängige Vektoren br,i für i = und für i = t  + 1, . . . , tk
1, . . . , tr , sodass
bl,i = N k−l bk,i für l = k − 1, . . . , 1 .
ker N r = ker N r−1 ⊕ -br,1 , . . . , br,tr . .
Für i = t  + 1, . . . , tk ist dann
Berechne für i = 1, . . . , tr
Bi = (b1,i , . . . , bk,i )
bl,i = N r−l br,i für l = r − 1, . . . , 1 .
Es ist Bi = (b1,i , . . . , br,i ) eine geordnete linear unab- linear unabhängig und liefert ein k × k-Jordan-
hängige Menge, die ein r × r-Jordan-Kästchen liefert. Kästchen.
Da Falls tk = tk+1 , so gehe zu k − 1 über.
Die geordnete Menge
br,i ∈ ker N r−1 ⊕ -{br,1 , . . . , br,tr } \ {br,i }.
folgt, dass die Menge Bλ = (Bt1 , . . . , B2 , B1 )


tr ist eine geordnete Jordan-Basis des Hauptraums
Bi HauA (λ).
i=1
Die Vereinigung und Anordnung der Jordan-Basen aller
linear unabhängig ist. Haupträume liefert dann eine Jordan-Basis zu A.

Die ermittelte Formel kann dazu dienen, die Jordan-Normal- Zum Eigenwert λ = 2: Die Matrix
form einer Matrix zu ermitteln. Dazu ist es nicht notwendig, ⎛ ⎞
−5 −1 4 −3 −1
dass eine Jordan-Basis bestimmt wird. ⎜ 1 −1 −1 1 0 ⎟
⎜ ⎟
A − 2 E5 = ⎜⎜−1 0 0 0 0 ⎟

Beispiel Gegeben ist die Matrix ⎝ 4 1 −4 −7 1 ⎠
⎛ ⎞ −2 0 2 −2 −1
−3 −1 4 −3 −1
⎜ 1 1 −1 1 0⎟ hat den Rang 4. Der Rang der Matrix (A − 2 E5 )2 ist damit
⎜ ⎟
A=⎜⎜−1 0 2 0 0⎟ ⎟∈C
5×5
. auch 4, da für die algebraische Vielfachheit 1 = ma (2) =
⎝ 4 1 −4 −5 1⎠ 5 − rg(A − 2 E5 ) gilt.
−2 0 2 −2 1
Damit erhalten wir
Als charakteristisches Polynom erhalten wir
c1 (A, 2) = r2 (A, 2) + r0 (A, 2) −2 r1 (A, 2) = 1 ,
  
4
χA = (2 − X) (1 − X) . =4 =5 =4
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 541

Beispiel: Konstruktion einer Jordan-Basis


⎛2 1 1 1 0 0 0 0⎞
Man bestimme zu der Matrix
02101100
⎜0 0 2 0 0 1 2 0⎟
⎜ ⎟
A = ⎜ 00 00 00 20 02 10 10 00 ⎟
⎝0 0 0 0 0 1 0 0⎠
00000010
00000211
eine Jordan-Normalform und eine Jordan-Basis.
Problemanalyse und Strategie: Man wende das geschilderte Verfahren an.

Lösung: Dies liefert zwei 1×1-Jordan-Kästchen zum Eigenwert 2.


Das charakteristische Polynom von A erhält man leicht Wir machen nun mit dem Eigenwert 1 weiter. Wir setzen
wegen der Blockdreiecksgestalt und der Dreiecksgestalt N = A − E8 und erhalten
der Blöcke auf der Diagonalen, es gilt: ⎛1 1 1 1 0 0 0 0⎞ ⎛1 2 3 2 1 3 3 0⎞
01101100 01202220
χA = (2 − X)5 (1 − X)3 . ⎜0 0 1 0 0 1 2 0⎟ ⎜0 0 1 0 0 1 2 0⎟
⎜ ⎟ ⎜ ⎟
Wir beginnen mit dem Eigenwert 2. Wir setzen N = N = ⎜ 00 00 00 10 01 10 10 00 ⎟ , N 2 = ⎜ 00 00 00 10 01 10 10 00 ⎟
⎝0 0 0 0 0 0 0 0⎠ ⎝0 0 0 0 0 0 0 0⎠
A − 2 E8 und erhalten 00000000 00000000
⎛0 1 1 1 0 0 0 0 ⎞ ⎛0 0 1 0 1 3 3 0⎞ 00000210 00000000
0 0 1 0 1 1 0 0 000 0 0 0 2 0
⎜0 0 0 0 0 1 2 0 ⎟ ⎜0 0 0 0 0 −1 −2 0⎟ Wegen dim ker N 2 = 3 = ma (1) ist ker N 2 der
⎜0 0 0 0 0 1 10 ⎟ 2 ⎜ −1 −1 0⎟
N= ⎜0 0 0 0 0 0 0 0 ⎟ , N = ⎜0 0 0
000 0 0
0⎟ Hauptraum von A zum Eigenwert 1. Und es gilt:
⎝0 0 0 0 0 −1 0 0 ⎠ ⎝0 0 0 0
0
0
0
0
1
0
0 0⎠
0 0 0 0 0 0 −10 000 0 0 0 1 0 ⎛0⎞ ⎛ 0 ⎞ ⎛0⎞ ⎛ 0 ⎞ ⎛ 1 ⎞
0 0 0 0 0 2 −1
1 000 0 0 −4 −2 1 ? 0 −4 @ ? 0 −4 −2 @
⎛ 0 0 0 0 0 −2 −1 0 ⎞ ⎜0⎟ ⎜ 3 ⎟ ⎜0⎟ ⎜ 3 ⎟ ⎜ 1 ⎟
0 0 0 0 0 0 −2 0 ⎜0⎟ ⎜ 1 ⎟ ⎜0⎟ ⎜ 1 ⎟ ⎜ 0 ⎟
⎜0 0 0 0 0 1 2 0 ⎟ ⎜0⎟,⎜ 0 ⎟ ⎜0⎟,⎜ 0 ⎟,⎜ 0 ⎟ .
⎜0 0 0 0 0 1 1 0 ⎟ ⎝0⎠ ⎝ 1 ⎠ ⎝0⎠ ⎝ 1 ⎠ ⎝ 1 ⎠
N3 = ⎜0 0 0 0 0 0 0 0 ⎟ 0 −2 0 −2 −1
⎝ 0 0 0 0 0 −1 0 0 ⎠ 1 0 1 0 0
 
0 0 0 0 0 0 −1 0
0 0 0 0 0 6 3 −1 =ker N =ker N 2
Wegen dim ker N 3 = 5 = ma (2) ist ker N 3 der Das größte Jordan-Kästchen zum Eigenwert 1 hat damit
Hauptraum von A zum Eigenwert 2, und es gilt: 2 Zeilen, und wegen dim ker N = 2 gibt es zwei Jordan-
⎛1⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ ⎛1⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ ⎛0⎞
? 0 1 1 @ ? 0 1 1 0 @
Kästchen zum Eigenwert 2. Wir wählen und setzen
⎜ 0 ⎟ ⎜ 0 ⎟ ⎜ −1 ⎟ ⎜ 0 ⎟ ⎜ 0 ⎟ ⎜ −1 ⎟ ⎜ 0 ⎟ ⎛ 1 ⎞ ⎛0⎞
⎜ 0 ⎟ ⎜ −1 ⎟ ⎜ 0 ⎟ ⎜ 0 ⎟ ⎜ −1 ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟
⎜ 0 ⎟, ⎜ 0 ⎟, ⎜ 1 ⎟ ⎜ 0 ⎟, ⎜ 0 ⎟, ⎜ 1 ⎟, ⎜ 0 ⎟ −2 0
⎝0⎠ ⎝ 0 ⎠ ⎝ 0 ⎠ ⎝0⎠ ⎝ 0 ⎠ ⎝ 0 ⎠ ⎝0⎠ ⎜ 1 ⎟ ⎜0⎟
⎜ 0 ⎟ ⎜ ⎟
0 0 0 0 0 0 0 b3 = ⎜ 0 ⎟ , b2 = N b3 = ⎜ 00 ⎟ .
0 0
0
 0 0
0 0
 ⎝ 1 ⎠ ⎝0⎠
=ker N −1 0
⎛ 1 ⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ ⎛ 0=ker
⎞ ⎛N2
0
⎞ 0 1
? 0 1 1 0 0 @ Damit haben wir bereits einmal die Kette von hinten
⎜ 0 ⎟ ⎜ 0 ⎟ ⎜ −1 ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟
⎜ 0 ⎟ ⎜ −1 ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟ ⎜ 0 ⎟ nach vorne durchlaufen. Nun wählen wir einen Vektor
⎜0⎟,⎜ 0 ⎟,⎜ 1 ⎟,⎜0⎟,⎜0⎟ .
⎝0⎠ ⎝ 0 ⎠ ⎝ 0 ⎠ ⎝0⎠ ⎝0⎠ b1 ∈ ker N \ {0}, sodass b1 , b2 linear unabhängig sind:
0
0
0
0
0
0
0
0
0
0 ⎛ 0 ⎞
 −4
=ker N 3 ⎜ 3 ⎟
⎜ 1 ⎟
Das größte Jordan-Kästchen zum Eigenwert 2 hat da- b1 = ⎜ 0 ⎟ .
⎝ 1 ⎠
mit 3 Zeilen, und wegen dim ker N = 3 gibt es drei −2
Jordan-Kästchen zum Eigenwert 2. Wir wählen b8 ∈ 0
ker N 3 \ ker N 2 und erhalten b7 und b6 wie folgt: Es ist nun B = (b1 , . . . , b8 ) eine Jordan-Basis zu A mit
⎛0⎞ ⎛1⎞ ⎛1⎞
der zugehörigen Jordan-Normalform:
0 1 0
⎜1⎟ ⎜0⎟ ⎜0⎟ ⎛ ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
b8 = ⎜ 00 ⎟ , b7 = Nb8 = ⎜ 00 ⎟ , b6 = Nb7 = ⎜ 00 ⎟ . 1
⎝0⎠ ⎝0⎠ ⎝0⎠ ⎜ ⎟
⎜ ⎟
0 0 0 ⎜ 1 1 ⎟
0 0 0 ⎜ ⎟
⎜ 1 ⎟
Damit haben wir bereits einmal die Kette von hinten nach ⎜ ⎟
⎜ ⎟
vorne durchlaufen. Nun wählen wir Vektoren b5 , b4 ∈ ⎜ 2 ⎟
ker N \ {0}, sodass b4 , b5 , b6 linear unabhängig sind: J =⎜⎜


⎛ 0 ⎞ ⎛ 0 ⎞ ⎜ 2 ⎟
⎜ ⎟
1 1 ⎜ ⎟
⎜ 0 ⎟ ⎜ −1 ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ 2 1 ⎟
b5 = ⎜ −1 ⎟ , b4 = ⎜ 01 ⎟ . ⎜ 2 1⎟
⎝ 0 ⎠
0 ⎝ 0 ⎠ ⎝ ⎠
0 0 2
0 0
542 14 Normalformen – Diagonalisieren und Triangulieren

d. h., dass es (wie erwartet) genau ein Jordan-Kästchen der Wir sprechen immer von einer Jordan-Normalform und
Länge 1 zum Eigenwert 2 gibt. nicht von der Jordan-Normalform. Das liegt an der Tat-
sache, dass es zu einer Matrix durchaus verschiedene Jordan-
Zum Eigenwert λ = 1: Die Matrix
Normalformen geben kann. Es scheint aber so zu sein, dass
⎛ ⎞ sich je zwei verschiedene Jordan-Normalformen nur in der
−4 −1 4 −3 −1
⎜ 1 0 −1 1 0 ⎟ Anordnung der Jordan-Kästchen unterscheiden. Dass dem
⎜ ⎟
A − E5 = ⎜ ⎜−1 0 1 0 0 ⎟
⎟ tatsächlich so ist, können wir nun zeigen.
⎝ 4 1 −4 −6 1 ⎠
−2 0 2 −2 0 Zur Eindeutigkeit der Jordan-Normalform
Es seien A, B ∈ Kn×n zwei Matrizen mit zerfallendem
hat den Rang 3. Die Matrix
charakteristischem Polynom und zugehörigen Jordan-
⎛ ⎞ Normalformen J A , J B . Dann sind äquivalent:
1 1 −1 1 1
⎜1 0 −1 1 0⎟ (i) Die Matrizen A und B sind ähnlich.
⎜ ⎟
(A − E5 )2 = ⎜
⎜3 1 −3 3 1⎟⎟ (ii) Die Matrizen J A und J B stimmen bis auf die Rei-
⎝3 0 −3 3 0⎠ henfolge der Jordan-Kästchen überein.
−2 0 2 −2 0
Insbesondere ist die Jordan-Normalform einer Matrix
hat den Rang 2. Der Rang der Matrix (A − E5 )3 ist damit 1, bis auf die Reihenfolge der Jordan-Kästchen eindeutig
da für die algebraische Vielfachheit 4 = ma (1) = 5−rg(A− bestimmt.
2 E5 )3 gilt.
Beweis: (i) ⇒ (ii): Für jedes λ ∈ K und k ∈ N gilt
Damit erhalten wir
rk (A, λ) = rk (B, λ), d. h., dass ck (A, λ) = ck (B, λ). Somit
c1 (A, 1) = r2 (A, 1) + r0 (A, 1) −2 r1 (A, 1) = 1 , haben die ähnlichen Matrizen A und B gleich viele gleich
   lange Jordan-Kästchen zu den gleichen Eigenwerten. Damit
=2 =5 =3
gilt (ii).
d. h., dass es genau ein Jordan-Kästchen der Länge 1 zum
(ii) ⇒ (i): Die Matrizen J A und J B sind ähnlich, da sie
Eigenwert 1 gibt. Weiter gilt:
dieselbe lineare Abbildung bezüglich verschieden sortierter
c2 (A, 1) = r3 (A, 1) + r1 (A, 1) −2 r2 (A, 1) = 0 , Basen darstellen. Wegen der Transitivtät der Ähnlichkeitsre-
   lation ∼ von Matrizen folgt aus
=1 =3 =2
A ∼ JA ∼ JB ∼ B
d. h., dass es kein Jordan-Kästchen der Länge 2 zum Eigen-
die Ähnlichkeit von A und B. 
wert 1 gibt. Weiter gilt:

c3 (A, 1) = r4 (A, 1) + r2 (A, 1) −2 r3 (A, 1) = 1 ,


   Potenzen von Matrizen in Jordan-Normalform
=1 =2 =1
lassen sich einfach bestimmen
d. h., dass es genau ein Jordan-Kästchen der Länge 3 zum
Eigenwert 1 gibt. Nachdem wir nun wissen, wie man eine Jordan-Normal-
Eine Jordan-Normalform von A ist damit form und eine Jordan-Basis zu einer Matrix bestimmt, wen-
den wir uns nun den ursprünglichen Fragen zu: Wie bil-
⎛ ⎞
2 det man Potenzen von Matrizen? Dies ist im Allgemeinen
⎜ ⎟ ein rechenaufwendiges Unterfangen. Bei diagonalisierbaren
⎜ ⎟
⎜ 1 ⎟ Matrizen ist es deutlich einfacher. Wir haben das in einem
⎜ ⎟
J =⎜ ⎟ Abschnitt auf Seite 501 geschildert. Aber für Matrizen in
⎜ 1 1 0⎟
⎜ ⎟ Jordan-Normalform ist es auch noch relativ einfach, belie-
⎝ 0 1 1⎠
0 0 1 bige Potenzen zu bilden. Dazu können wir nämlich die Bi-
nomialformel von Seite 526 benutzen, dabei gilt Folgendes:
Natürlich muss man nicht alle Zahlen ck bestimmen, wenn
man nur herausfinden will, wie die Jordan-Normalform aus- Die Jordan-Zerlegung der Jordan-Normalform
sieht. Wir hätten nur mit der Bestimmung von c1 bereits Ist J eine Jordan-Normalform, so gibt es eine Diagonal-
eine Jordan-Normalform erkannt: Dass es nur ein Jordan- matrix D und eine nilpotente Matrix N mit
Kästchen zum Eigenwert 2 gibt, ist klar, da 2 ein einfacher
Eigenwert ist. Und dass das zweite (dass es nur zwei gibt, J = D + N und D N = N D .
folgt aus mg (1) = 2) Jordan-Kästchen zum Eigenwert 1 ein Wir nennen diese Darstellung der Jordan-Matrix J als
Kästchen der Länge 3 ist, ist auch klar, da 1 ein vierfacher Summe die Jordan-Zerlegung von J .
Eigenwert ist. 
14.8 Die Berechnung einer Jordan-Normalform und Jordan-Basis 543

Übersicht: Die gemeinsamen Eigenschaften ähnlicher Matrizen


Zwei Matrizen A, B ∈ Kn×n heißen äquivalent, wenn es eine invertierbare Matrix S ∈ Kn×n gibt mit
B = S −1 A S .
Wir stellen die gemeinsamen Eigenschaften ähnlicher Matrizen zusammen.

Die n × n-Matrizen A und B seien ähnlich. Es gelte A und B haben dasselbe charakteristische Polynom.
B = S −1 A S. A und B haben dieselben Eigenwerte.
A und B haben dieselbe Determinante. Die algebraischen Vielfachheiten der Eigenwerte von
A und B haben dieselbe Spur. A und B stimmen überein.
Ist A invertierbar, so auch B. Die geometrischen Vielfachheiten der Eigenwerte von
Ist A diagonalisierbar, so auch B, die Diagonalformen A und B stimmen überein.
können gleich gewählt werden. Die Dimensionen der verallgemeinerten Eigenräume
Ist A triangulierbar, so auch B. zu einem Eigenwert λ von A und B stimmen überein.
Gibt es zu A eine Jordan-Normalform, so auch zu B,
die Jordan-Normalformen können gleich gewählt wer-
den.

' (
Beispiel 1
Wir wählen den Vektor b2 = ∈ ker(A − 2 E2 )2 \
0
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ' (
2 1 2 1 −2
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ker(A − 2 E2 ) und setzen b1 = (A − 2 E2 ) b2 = .

⎜ 2 ⎟ ⎜
⎟=⎜ 2 ⎟ ⎜
⎟+⎜


−4
⎜ 3 1⎟ ⎜ 3 ⎟ ⎜ 1⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
Damit ist B = (b1 , b2 ) eine geordnete Jordan-Basis, und es
3 3  hat A die Jordan-Normalform
' (
2 1
Nun können wir auch das angekündigte Beispiel angeben. J =
0 2

Beispiel Mittels der Jordan-Normalform kann man späte


Folgenglieder rekursiv definierter Folgen relativ einfach be- Weiter erfüllt die Matrix S = (b1 , b2 ), deren Spalten gerade
stimmen. Dabei benutzen wir einen Trick, den wir auch die Elemente der Jordan-Basis sind, die Eigenschaft J =
schon beim Diagonalisieren benutzt haben. Wir betrachten S −1 A S.
die Folge (gn )n∈N0 mit
Damit und mit der angegebenen Rekursion können wir nun
g20 ermitteln, es gilt nämlich:
g0 = 0, g1 = 1, gn+1 = −4gn−1 + 4gn für n ≥ 1
' ( ' ( ' ( ' (
g19 g18 g0 g0
und interessieren uns etwa für das Folgenglied g20 . =A = A19 = S J 19 S −1 .
g20 g19 g1 g1
Dazu suchen wir erst eine Matrix A ∈ R2×2 , mittels der sich
Wir setzen nun
die Rekursion für n ≥ 1 in der Form
' ( ' (
' ( ' ( 2 0 0 1
gn gn−1 J = +
=A 0 2 0 0
gn+1 gn  
=:D =:N
schreiben lässt. Das leistet offenbar die Matrix
und berechnen J 19 mit der Formel von Seite 527:
' (
0 1 ' (
A= 219 19 · 218
−4 4 J 19 = D 19 + 19 D 18 N =
0 219

Nun bestimmen wir eine Jordan-Basis zu A und eine zuge- ' man
Daraus erhält ( nach Berechnen der zweiten Zeile von
hörige Jordan-Normalform J . Das charakteristische Poly- −1 g0
' ( 19
SJ S das Ergebnis g20 = 20 · 219 . 
1 g1
nom von A lautet χA = (2 − X)2 , und spannt den
2
eindimensionalen Eigenraum zum Eigenwert 2 der algebrai- Nun können wir auch die auf Seite 515 gemachte Behauptung
schen Vielfachheit 2 auf. beweisen:
544 14 Normalformen – Diagonalisieren und Triangulieren

Der Zusammenhang zwischen Spur, Determinante Kommentar: Der Satz von Cayley-Hamilton besagt, dass
und den Eigenwerten einer Matrix die Matrix A Nullstelle des charakteristischen Polynoms χA
ist, χA (A) = 0. Das (eindeutig bestimmte) normierte Poly-
Zerfällt das charakteristische Polynom χA der Matrix
nom μA minimalen Grades, das A als Nullstelle hat, nennt
A ∈ Kn×n in seine n Linearfaktoren, d. h.
man das Minimalpolynom von A. Zerfällt das charakteristi-
χA = (λ1 − X) · · · (λn − X) , sche Polynom χA in Linearfaktoren:
χA = (λ1 − X)s1 · · · (λr − X)sr ,
so gilt:
so gilt:
Sp A = λ1 + · · · + λn , det A = λ1 · · · λn . μA = (λ1 − X)l1 · · · (λr − X)lr ,
wobei 1 ≤ li ≤ si für i = 1, . . . , r die maximale Länge
eines Jordan-Kästchens zum Eigenwert λi ist. Das folgt un-
Beweis: Da χA zerfällt, ist A ähnlich zu einer Jordan- mittelbar aus einer Jordan-Normalform der Matrix A. Insbe-
Matrix J . Da die charakteristischen Polynome ähnlicher Ma- sondere ist das Minimalpolynom ein Teiler des charakteri-
trizen gleich sind, folgt die Behauptung wie auf Seite 515. stischen Polynoms. Man findet es unter den im Allgemeinen
 wenigen Teilern von χA .

Zusammenfassung

Jeder Endomorphismus ϕ eines n-dimensionalen K- 2. Kriterium für Diagonalisierbarkeit


Vektorraums V lässt sich durch eine quadratische Matrix
Ein Endomorphismus ϕ : V → V eines n-dimen-
A ∈ Kn×n nach Wahl einer Basis B darstellen. Umgekehrt
sionalen Vektorraums V ist genau dann diagonalisierbar,
definiert jede quadratische Matrix A ∈ Kn×n einen Endo-
wenn es eine geordnete Basis B = (b1 , . . . , bn ) von V
morphismus ϕA des n-dimensionalen Kn . Wir untersuchen
aus Eigenvektoren von ϕ gibt.
in diesem Kapitel die Diagonalisierbarkeit und Verallgemei-
nerungen davon solcher Endomorphismen und Matrizen. Die In diesem Fall ist D = B M(ϕ)B eine Diagonalmatrix
Zusammenfassung schildern wir für Endomorphismen, eine mit den Eigenwerten λ1 , . . . , λn auf der Diagonalen.
Zusammenfassung für Matrizen erhält man hieraus, indem
man den Endomorphismus ϕA des Kn betrachtet. Um einen Endomorphismus ϕ eines n-dimensionalen K-
Vektorraums zu diagonalisieren, bestimmt man die Eigen-
Diagonalisierbare Endomorphismen werte von ϕ und zugehörige Eigenvektoren. Die Eigenwerte
Ein Endomorphismus ϕ : V → V eines n-dimen- erhält man als die Nullstellen des charakteristischen Poly-
sionalen Vektorraums, n ∈ N, heißt diagonalisierbar, noms
wenn es eine geordnete Basis B = (b1 , . . . , bn ) von χϕ = det(A − X En ) ∈ K[X]n ,
V gibt, bezüglich der die Darstellungsmatrix B M(ϕ)B
wobei A die Darstellungsmatrix von ϕ bezüglich einer belie-
Diagonalgestalt hat.
big gewählten Basis von V ist. Diese Definition ist unabhän-
gig von der Wahl der Basis, wie man mithilfe des Determinan-
Das besagt aber gerade, dass tenmultiplikationssatzes zeigen kann. Sind nun λ1 , . . . , λr
die verschiedenen Eigenwerte von ϕ mit den Vielfachheiten
ϕ(b1 ) = λ1 b1 , . . . , ϕ(bn ) = λn bn
ma (λ1 ), . . . , ma (λr ), so bestimmt man als nächstes Basen
der r Eigenräume Eigϕ (λ1 ), . . . , Eigϕ (λr ) mit den Dimen-
für Skalare λ1 , . . . , λn ∈ K gilt.
sionen mg (λ1 ), . . . , mg (λr ):
Man nennt ein Element λ ∈ K einen Eigenwert eines Endo-
morphismus ϕ : V → V , wenn es einen Vektor v ∈ V \ {0} Eigϕ (λi ) = {v ∈ V | (ϕ − λi id)(v) = 0} ∀ i = 1, . . . , r .
mit
ϕ(v) = λ v Jeder Vektor v ∈ Eigϕ (λ), λ ∈ {λ1 , . . . , λr }, v = 0, ist ein
Eigenvektor zum Eigenwert λ. Können wir hierbei insgesamt
gibt. Der Vektor v heißt in diesem Fall Eigenvektor von ϕ
n linear unabhängige Eigenvektoren bestimmen, so können
zum Eigenwert λ.
wir ϕ diagonalisieren. Da Eigenvektoren zu verschiedenen
Mihilfe dieser Begriffe können wir ein Kriterium für Diago- Eigenwerten linear unabhängig sind und für jeden Eigenwert
nalisierbarkeit formulieren: λ von ϕ gilt mg (λ) ≤ ma (λ), gilt:
Zusammenfassung 545

3. Kriterium für Diagonalisierbarkeit Kriterium für die Existenz einer Jordan-Normalform


Der Endomorphismus ϕ ist genau dann diagonalisierbar, Für einen Endomorphismus ϕ eines n-dimensionalen K-
wenn das charakteristische Polynom χϕ in Linearfakto- Vektorraums V , n ∈ N, sind äquivalent:
ren zerfällt und ma (λ) = mg (λ) für jeden Eigenwert λ (i) ϕ besitzt eine Jordan-Normalform.
von ϕ. (ii) Das charakteristische Polynom χϕ zerfällt über K
in Linearfaktoren.
Übrigens nennt man ma (λ) die algebraische Vielfachheit und
mg (λ) die geometrische Vielfachheit des Eigenwertes λ. Da über C jedes Polynom vom Grad ≥ 1 in Linearfakto-
ren zerfällt, haben wir hiermit gezeigt, dass zu jedem En-
Kann man einen Endomorphismus ϕ nicht diagonalisieren,
domorphismus eines endlichdimensionalen komplexen Vek-
so kann man ihn eventuell durchaus triangulieren, d. h., eine
torraums eine Basis existiert, bezüglich der die Darstel-
Basis B bestimmen, sodass die Darstellungsmatrix von ϕ
lungsmatrix eine Jordan-Normalform ist. Die Konstruktion
bezüglich dieser Basis eine obere Dreiecksgestalt hat. Dies
einer Jordan-Basis erfolgt über die Bestimmung von Ba-
ist tatsächlich unter schwächeren Voraussetzungen möglich,
sen der verallgemeinerten Eigenräume zu den verschiede-
es gilt nämlich:
nen Eigenwerten von ϕ: Ist λ ein Eigenwert von ϕ, so nennt
man
Kriterium für Triangulierbarkeit
Für einen Endomorphismus ϕ eines n-dimensionalen K- ker(ϕ − λ id), ker(ϕ − λ id)2 , . . . , ker(ϕ − λ id)r
Vektorraums V sind äquivalent:
(i) ϕ ist triangulierbar. die verallgemeinerten Eigenräume von ϕ zum Eigenwert λ.
(ii) Das charakteristische Polynom χϕ von ϕ zerfällt in Dabei erfüllt r die Eigenschaft
Linearfaktoren.
ker(ϕ − λ id)r = ker(ϕ − λ id)r+1 = · · ·
Bei der praktischen Bestimmung der Basis B von V bezüg-
lich der ϕ eine obere Dreiecksgestalt hat, konstruiert man Die Zahl r sei dabei minimal mit dieser Eigenschaft gewählt.
eine Fahnenbasis (b1 , . . . , bn ) für ϕ von V , man bestimmt Es gilt
also Untervektorräume dim ker(ϕ − λ id)r = ma (λ),
-b1 . , -b1 , b2 . , . . . , -b1 , . . . , bn . , mg (λ) ist die Anzahl der Jordan-Kästchen zum Eigen-
wert λ,
sodass für jedes i = 1, . . . , n gilt: r ist die Zeilen- und Spaltenzahl des größten Jordan-
Kästchens zum Eigenwert λ.
ϕ(-b1 , . . . , bi .) ⊆ -b1 , . . . , bi . .
Man erhält ma (λ) linear unabhängige Vektoren zum Eigen-
Es ist sogar möglich, eine besonders günstige obere Drei- wert λ, die zu einer Jordan-Basis von ϕ gehören, indem man
ecksmatrix zu erhalten. Es kann nämlich unter der Voraus- die Kette
setzung, dass das charakteristische Polynom von ϕ über K
zerfällt, stets eine Jordan-Basis gewählt werden. Die Dar- ker(ϕ − λ id) ⊆ ker(ϕ − λ id)2 ⊆ · · · ⊆ ker(ϕ − λ id)r
stellungsmatrix bezüglich einer Jordan-Basis hat eine Jordan-
Normalform, d. h., die Darstellungmatrix ist von einigen Ein- evtl. mehrfach von hinten nach vorne durchläuft. Führt man
sen in der ersten oberen Nebendiagonale abgesehen eine Dia- das für jeden Eigenwert von ϕ durch, so erhält man insgesamt
gonalmatrix. Der Beweis des Satzes, der dies ausdrückt, ist n = deg χϕ = dim V linear unabhängige Vektoren und damit
reichlich kompliziert, er erfordert einige Hilfsmittel und ist eine Jordan-Basis von V .
per Induktion möglich:
546 14 Normalformen – Diagonalisieren und Triangulieren

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 14.7 •• Welche der folgenden Matrizen sind diagonali-


sierbar? Geben Sie gegebenenfalls eine invertierbare Matrix
14.1 • Gegeben ist ein Eigenvektor v zum Eigenwert
S an, sodass D = S −1 A S Diagonalgestalt hat.
λ einer Matrix A. ' (
1 i
(a) Ist v auch Eigenvektor von A2 ? Zu welchem Eigenwert ? (a) A = ∈ C2
i −1
(b) Wenn A zudem invertierbar ist, ist dann v auch ein Ei- ⎛ ⎞
3 0 7
genvektor zu A−1 ? Zu welchem Eigenwert ?
(b) B = ⎝0 1 0⎠ ∈ R3
7 0 3
14.2 •• Wieso hat jede Matrix A ∈ Kn×n mit A2 = En ⎛ ⎞
einen der Eigenwerte ±1 und keine weiteren ? 1 2 2
(c) C = 13 ⎝2 −2 1 ⎠ ∈ C2
14.3 •• Haben die quadratischen n × n-Matrizen A und 2 1 −2
A0 dieselben Eigenwerte? Haben diese gegebenenfalls auch
dieselben algebraischen und geometrischen Vielfachheiten ? 14.8 •• Im Vektorraum R[X]3 der reellen Polynome
vom Grad höchstens 3 ist für ein a ∈ R die Abbildung
14.4 • Gegeben ist eine Matrix A ∈ Cn×n . Sind die ϕ : R[X]3 → R[X]3 durch
Eigenwerte der quadratischen Matrix A0 A die Quadrate der
ϕ(p) = p(a) + p  (a)(X − a)
Eigenwerte von A ?
erklärt.
14.5 •• Der Satz von Cayley-Hamilton bietet eine Mög-
lichkeit, (a) Begründen Sie, dass ϕ linear ist.
(b) Berechnen Sie die Darstellungsmatrix von ϕ bezüglich
(a) das Inverse A−1 einer (invertierbaren) Matrix A zu be- der Basis E3 = (1, X, X 2 , X 3 ) von R[X]3 .
stimmen, √ (c) Bestimmen Sie eine geordnete Basis B von R[X]3 , be-
(b) eine Quadratwurzel √ A einer komplexen Matrix A ∈ züglich der die Darstellungsmatrix von ϕ Diagonalge-
C2×2 mit Sp A + 2 det A  = 0 zu bestimmen (dabei
stalt hat.
heißt eine Matrix B eine Quadratwurzel aus A, falls
B 2 = A gilt).
14.9 •• Gegeben sei die vom Parameter a ∈ R abhän-
Wie funktioniert das? Berechnen Sie mit dieser Methode das gige Matrix
Inverse von A und eine Quadratwurzel B von A , wobei ⎛ ⎞
⎛ ⎞ 5 −1 3
1 4 −2 ' ( A=⎝ 2 2 3 ⎠ ∈ R3×3 .
−2 6
A = ⎝0 1 0 ⎠ und A = a−3 1 a−1
−3 7
0 3 1
(a) Bestimmen Sie in Abhängigkeit von a die Jordan-
Normalform J von A.
(b) Berechnen Sie für a = 1 und a = −1 jeweils eine
Rechenaufgaben Jordan-Basis des R3 zu A.
14.6 • Geben Sie die Eigenwerte und Eigenvektoren
der folgenden Matrizen an:
' ( Beweisaufgaben
3 −1
(a) A = ∈ R2×2 , 14.10 ••• Beweisen Sie das folgende Kriterium für die
1 1
' ( Triangulierbarkeit einer Matrix:
0 1
(b) B = ∈ C2×2 .
1 0 Für eine Matrix A ∈ Kn×n sind äquivalent:
Antworten der Selbstfragen 547

(i) A ist triangulierbar. 14.13 •• Es sei ϕ ein diagonalisierbarer Endomorphis-


mus eines n-dimensionalen K-Vektorraumes V (n ∈ N) mit
(ii) Das charakteristische Polynom χA von A zerfällt in Li-
der Eigenschaft: Sind v und w Eigenvektoren von ϕ, so ist
nearfaktoren.
v + w ein Eigenvektor von ϕ oder v + w = 0.
14.11 •• Begründen Sie die Binomialformel für Matri- Zeigen Sie, dass es ein λ ∈ K mit ϕ = λ · id gibt.
zen: Für Matrizen D, N ∈ Kn×n mit D N = N D und jede
natürliche Zahl k gilt: 14.14 •• Es seien K ein Körper und n ∈ N; weiter seien
k ' (
! A, B ∈ Kn×n . Zeigen Sie: A B und B A haben dieselben
k
(D + N )k = D k−i N i . Eigenwerte.
i
i=0
14.15 ••• Begründen Sie die auf Seite 537 gemachte Be-
14.12 •• Gegeben ist eine nilpotente Matrix A ∈ Cn×n hauptung zur Hauptraumzerlegung.
mit Nilpotenzindex p ∈ N, d. h., es gilt:
14.16 ••• Es sei V ein endlichdimensionaler K-
Ap = 0 und Ap−1  = 0.
Vektorraum, und die linearen Abbildungen ϕ, ψ : V → V
Zeigen Sie: seien diagonalisierbar, d. h., es gibt jeweils eine Basis von V
aus Eigenvektoren von ϕ bzw. ψ. Man zeige:
(a) Die Matrix A ist nicht invertierbar.
(b) Die Matrix A hat einen Eigenwert der Vielfachheit n. Es gibt genau dann eine Basis von V aus gemeinsamen Ei-
(c) Es gilt p ≤ n. genvektoren von ϕ und ψ, wenn ϕ ◦ ψ = ψ ◦ ϕ gilt.

Antworten der Selbstfragen

S. 499 S. 508
Die Drehung mit α = 0 ist die Identität, hierbei wird jeder Im ersten Beispiel gilt etwa:
Vektor auf sich selbst abgebildet, sodass die Darstellungsma- ' ( ' (
trix bezüglich jeder geordneten Basis Diagonalgestalt hat – 1 1
A =2 .
sie ist die Einheitsmatrix E2 . Bei der Drehung mit α = π wird 1 1
jeder Vektor v ∈ R2 auf sein entgegengesetztes Element −v
abgebildet. Damit ist diese Abbildung auch diagonalisierbar,
die Darstellungsmatrix ist bezüglich jeder geordneten Basis S. 509
das Negative der Einheitsmatrix −E2 . Wegen

S. 502 1 0 1 0
ϕ( 01 ) = M E2 − E2 M = 0 = 0 01
Sie hat den einzigen Eigenwert 0, da für jeden Vektor v ∈ Kn

0v = 0v und
 0 1  1 1 0 1 0 1 1 1
gilt. Jeder vom Nullvektor verschiedene Vektor des Kn ist ϕ 10 = 11 10 − 10 11
Eigenvektor zum Eigenwert 0. 0 1
=0=0 10
S. 503
Unter Kern des Endomorphismus ϕ bzw. der Matrix A (vgl. sind diese beiden Vektoren tatsächlich Eigenvektoren zum
Seite 427 und Seite 431). Eigenwert 0. Wir prüfen als Beispiel noch den angegebenen
Vektor des Eigenraums zum Eigenwert −2 nach, es gilt:
S. 507
Das Gleichungssystem ist jeweils das triviale Gleichungssys-   1 1     1 1
ϕ 1 1
−1 −1 = 11 −1 −1 − −1 −1
1 1 1 1
11
tem  −2 −2   1 1 
0=0 = 2 2 = −2 −1 −1 .
zu dem jeweils einzigen Eigenwert 1 bzw. 0, und der Lö-
sungsraum ist somit jeweils der ganze Kn . Jeder vom Null- S. 510
vektor verschiedene Vektor ist ein Eigenvektor zum Eigen- ±i; Ei-
Die Eigenwerte sind die konjugiert komplexen Zahlen ' (
wert 1 der Einheitsmatrix bzw. zum Eigenwert 0 der Null- 1
genvektoren sind die konjugiert komplexen Vektoren .
matrix. ±i
548 14 Normalformen – Diagonalisieren und Triangulieren

S. 510 S. 526
Weil es zu jedem Eigenwert auch einen Eigenvektor gibt, Das ist auch genau dann der Fall, wenn das charakteristische
und Eigenvektoren zu verschiedenen Eigenwerten linear un- Polynom χϕ in Linearfaktoren zerfällt. Ist (b1 , . . . , bn ) eine
abhängig sind, existiert zu einer solchen Matrix A also eine Basis von V bezüglich der ϕ obere Dreiecksgestalt hat, so ist
Basis aus Eigenvektoren – eine solche Matrix A ist damit (bn , . . . , b1 ) eine Basis von V bezüglich der ϕ eine untere
diagonalisierbar. Dreiecksgestalt hat.

S. 511 S. 529
Der Eigenwert 1 von A hat die algebraische Vielfachheit 2 Weil wir für einen Endomorphismus des Nullraums {0} kein
und der Eigenwert −3 die algebraische Vielfachheit 4.√Und charakteristisches Polynom erklärt haben. Mit der Vereinba-
die beiden konjugiert komplexen Eigenwerte − 21 (1 ± 3 i) rung χϕ = 1, falls U = {0}, hätten wir den Beweis auch für
haben jeweils die algebraische Vielfachheit 1. beliebige U (und W ) formulieren können.

S. 513
S. 529
Es gilt:
⎛ ⎞ ⎛ ⎞ Z. B.:
2 −1 −1 4 2 2
1
S = ⎝1 0 2 ⎠ und S −1 = ⎝−2 −1 5 ⎠
12
1 2 0 −2 5 −1
und weiter: ϕ−1 (U )
⎛ ⎞⎛ ⎞⎛ ⎞
4 2 2 1 2 2 2 −1 −1 W
1 ⎝
−2 −1 5 ⎠ ⎝2 −2 1 ⎠ ⎝1 0 2 ⎠
12
−2 5 −1 2 1 −2 1 2 0 U
⎛ ⎞
3 0 0
ϕ(U )
= ⎝0 −3 0 ⎠ .
0 0 −3

S. 513
Es vertauschen sich die zugehörigen Eigenwerte in der Dia-
gonalmatrix.

S. 515 S. 533
' (
0 1 Drei verschiedene Eigenwerte λ1 , λ2 , λ3 : Es gibt nur eine
Es gilt etwa für die komplexe Matrix A = mit dem
−1 0 Jordan-Normalform, nämlich
charakteristischen Polynom χA = (i − X) (−i − X) und den ⎛ ⎞
beiden Eigenwerten −i, i: λ1
⎜ ⎟
⎜ ⎟
det A = 1 = (−i) i und Sp A = 0 = −i + i . ⎜ λ2 ⎟
⎝ ⎠
λ3
S. 518
Ein erster Hinweis dafür, dass dieser „Beweis“ nicht in Ord- Zwei verschiedene Eigenwerte λ1 , λ2 : Es gibt zwei wesent-
nung ist, liefert die Tatsache, dass bei diesem „Beweis“ ein lich verschiedene Jordan-Normalformen, nämlich
Widerspruch im Fall n > 1 entsteht: ⎛ ⎞ ⎛ ⎞
λ1 λ1
K n×n
8 0 = χA (A) = 0 ∈ K . ⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ λ2 ⎟ und ⎝ λ2 1 ⎠
Tatsächlich wurde hier die Matrix A falsch eingesetzt, die ⎝ ⎠
Multiplikation bei X En in A − X En ist die Multiplikation λ2 λ2
mit Skalaren, durchgeführt wurde aber bei A − A En die
Matrizenmultiplikation. Dass der „Beweis“ falsch ist, wird Ein Eigenwert λ: Es gibt drei wesentlich verschiedene
ganz offensichtlich, wenn man sich überlegt, was sich für Jordan-Normalformen, nämlich
das Polynom q(Y ) = Sp(A − Y En ) ergäbe.
⎛ ⎞ ⎛ ⎞
λ ⎛ ⎞
S. 523 ⎜ ⎟ ⎜ λ λ 1
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ ⎟, ⎝ ⎟
Wegen ϕ(u) = λ u für jedes u ∈ U gilt ϕ(U ) ⊆ U . Weiter

λ
⎠ λ 1 ⎠ und ⎝ λ 1⎠
gilt ϕ(U ) = U genau dann, wenn λ  = 0 ist, denn: ϕ(U ) = U λ λ
λ
bedeutet ϕ|U : u → λ u ist surjektiv, d. h. λ  = 0.
Antworten der Selbstfragen 549

S. 533 S. 535
⎛ ⎞ Nein,
' (die Darstellungsmatrix bezüglich dieser Basis ist
⎜ 1 ⎟
i 0
⎜ ⎟ . Bei unserer Definition stehen die Einsen oberhalb
⎜ ⎟ 1 i
⎜ 1 ⎟
⎜ ⎟ der Hauptdiagonalen. In manchen Lehrbüchern wählt man
J =⎜


⎟ aber die umgekehrte Reihenfolge – es stehen dann die Ein-
⎜ 1 1 0 ⎟
⎜ ⎟
⎜ ⎟ sen, so wie hier, unterhalb der Hauptdiagonalen.
⎜ 0 1 1 ⎟
⎝ ⎠
0 0 1
S. 535 ⎛ ⎞ ⎛ ⎞
und jede andere Reihenfolge dieser drei Kästchen. 2 1
Es bilden in diesem Fall etwa b1 = ⎝0⎠, b2 = ⎝2⎠ und
S. 534' ( 0 0
⎛ ⎞ ⎛ ⎞
i 1 0 1 1 0
J = .
0 i b3 = ⎝0⎠ eine Jordan-Basis, und es ist J = ⎝0 1 1⎠ die
1 0 0 1
Jordan-Normalform.
Differenzialrechnung –
die Linearisierung von 15
Funktionen
Welche Information über das
lokale Verhalten einer Funktion
steckt in der Ableitung?
Wie beweist man den
Mittelwertsatz?
Welche Funktionen lassen sich
durch Taylorreihen darstellen?

15.1 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 552


15.2 Differenziationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
15.3 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 569
15.4 Verhalten differenzierbarer Funktionen . . . . . . . . . . . . . . . . . . . . 577
15.5 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594
552 15 Differenzialrechnung – die Linearisierung von Funktionen

Die Differenzialrechnung ist mit Sicherheit ein zentrales Kal- y f


kül der Mathematik. Den meisten Lesern werden deswegen
die Begriffe Ableitung und Differenzial schon in verschiedenen
Facetten begegnet sein. Häufig überlagern aber rein rechentech-
g
nische Aspekte den wesentlichen Charakter des Differenzierens,
nämlich Veränderungen berechenbar zu machen. Die Idee der
Linearisierung eines funktionalen Zusammenhangs ist der ent-
scheidende Hintergrund für die herausragende Bedeutung der
Ableitung. Außerdem gibt uns unter anderem der Mittelwertsatz
ein wichtiges Werkzeug zur Beweisführung an die Hand.
Der Weg zur Differenzialrechnung wurde durch Sir Isaac Newton x0 x
(1643–1727) und Gottfried Wilhelm von Leibniz (1646–1716)
geebnet. Beiden stand ein genauer Grenzwertbegriff noch nicht
zur Verfügung, und die damaligen Argumente von unendlich
kleinen Größen wirken heute sehr vage. Mit dem Begriff des Abbildung 15.1 Die ersten beiden Summanden einer Potenzreihe liefern eine
Grenzwerts, wie wir ihn in Kapitel 8 kennengelernt haben, gibt Näherung an die Funktion in einer Umgebung um den Entwicklungspunkt.

es diese philosophischen Probleme beim Umgang mit Ableitun-


gen nicht mehr. Somit liegt heute eine mathematisch exakte g als zurückgelegte Strecke einer gleichförmigen Bewegung
Definition vor, die wir in diesem Kapitel genauer betrachten. einer Punktmasse auf, so ist
g(x) − g(x0 )
a1 =
15.1 Die Ableitung x − x0
mit x ∈ R\{x0 } die Geschwindigkeit dieser Bewegung, die
Im Beispiel zum Newton’schen Gravitationsgesetz auf Änderungsrate. Für die Festlegung von a1 bietet sich somit
Seite 397 ist ein extrem wichtiges Vorgehen in den Natur- an, die entsprechende Änderungsrate der Funktion f zu wäh-
wissenschaften und in der Technik angeklungen. Ein funk- len.
tionaler Zusammenhang, den man durch eine Potenzreihe be-
schreiben kann, wird durch Partialsummen der Potenzreihe In Abbildung 15.2 sind einige affin-lineare Funktionen g
genähert. mit g(x) = f (x0 ) + ã1 (x − x0 ) und verschiedenen Wer-
ten für die Steigung ã1 eingezeichnet, die mit dem Graphen
Dies bedeutet etwa, dass man in einem Modell eine kompli- der Funktion f den Punkt (x0 , f (x0 )) gemeinsam haben. Of-
zierte Abbildung f : I ⊆ R → R mit fensichtlich lässt sich der jeweilige Wert von ã1 mithilfe der
∞ Schnittstelle x1 der Graphen von f und g bestimmen, da dort
!
f (x) = aj (x − x0 )j f (x1 ) = g(x1 ) gilt. Wir erhalten
j =0
f (x1 ) − f (x0 )
ã1 = .
zunächst durch die einfachere Funktion x1 − x 0

g(x) = a0 + a1 (x − x0 ) Die Differenz der Funktionswerte im Verhältnis zur Diffe-


renz der Argumente liefert die Steigung des Graphen von g.
ersetzt. Die Approximation ist im Allgemeinen aber nur sinn-
voll, solange das Argument x relativ nah beim Entwicklungs-
punkt x0 liegt (Abb. 15.1). y f

Man nennt eine solche Näherung Linearisierung der Funk-


tion f , da die approximierende Funktion g eine affin-lineare f (x1 )
Funktion ist. Aus dem mathematischen Blickwinkel drängen
sich einige Fragen auf: Für welche Funktionen bietet sich eine
solche Näherung an? Wie ist eine „sinnvolle Approximation“
zu verstehen? Und wie lassen sich passende Koeffizienten a0
und a1 berechnen? f (x0 )

Ein passender Wert für a0 ist mit g(x0 ) = a0 = f (x0 ) leicht


auszumachen; die Funktion f , auch wenn sie nicht durch eine x
x0 x1
Potenzreihe gegeben ist, und ihre Linearisierung g sollten in
x0 denselben Funktionswert besitzen.
Wie ergibt sich a1 ? Dazu erinnern wir an das historische
Beispiel auf dem Weg zur Differenzialrechnung. Fassen wir Abbildung 15.2 Verschiedene Sekanten zum Graphen einer Funktion f.
15.1 Die Ableitung 553

Eine solche Gerade durch zwei Punkte auf dem Graphen wird Untersucht man die Betragsfunktion f : R → R mit
Sekante genannt und Quotienten von der Form f (x) = |x|, so ergibt sich für den Differenzenquotien-
ten an der Stelle x0 = 0 der Ausdruck
f (x1 ) − f (x0 ) 
x1 − x0 |x| − |0| 1 für x > 0 ,
=
x−0 −1 für x < 0 .
heißen Differenzenquotient der Funktion f .
Es gibt in diesem Fall keinen Grenzwert für x → 0, da
Lassen wir im Differenzenquotienten den Abstand |x1 − x0 | unterschiedliche Werte beim Grenzübergang von rechts
immer kleiner werden, so wird offensichtlich, dass die durch bzw. von links gegen die kritische Stelle angenommen
die Funktion g beschriebene Gerade im Grenzfall tangential werden. Die Betragsfunktion ist somit an der Stelle x0 = 0
am Graphen von f liegen wird. Wenn es einen Grenzwert des nicht differenzierbar.
Differenzenquotienten für x1 → x0 gibt, so ist dies gerade
die gesuchte Änderungsrate, der Koeffizient a1 der Lineari- y
f (x) = |x|
sierung von f um x0 .

Definition der Ableitung


Eine Funktion f : I → R, die auf einem offenen Inter-
vall I ⊆ R gegeben ist, heißt an einer Stelle x0 ∈ I
differenzierbar, wenn der Grenzwert x
nicht differenzierbar
f (x) − f (x0 )
lim Abbildung 15.3 Die Betragsfunktion ist an der Stelle x = 0 nicht differenzier-
x→x0 x − x0 bar.
x=x0

existiert. Diesen Grenzwert nennt man die Ableitung An beliebigen anderen Stellen x0 = 0 ist die Funktion mit
von f in x0 . Er wird mit f  (x0 ) bezeichnet. f (x) = |x| differenzierbar mit den Ableitungen

 |x| − |x0 | 1 für x0 > 0 ,
f (x0 ) = lim =
Kommentar: Die Betrachtungen zur Differenzierbarkeit x→x0 x − x0 −1 für x0 < 0 .
x=x0
von Funktionen werden hier zunächst nur für Funktionen in
einer reellen Variablen gemacht. Später, im Kapitel 21, wer-
den die Begriffe auf mehrdimensionale Abhängigkeiten über- Die Exponentialfunktion f (x) = ex ist an jeder Stelle
tragen. Die folgenreiche Erweiterung des Ableitungskalküls x0 ∈ R differenzierbar. Wir sehen diese Eigenschaft der
auf komplexe Argumente wird in der Funktionentheorie aus- Exponentialfunktion, wenn wir die charakterisierende Un-
führlich behandelt. gleichung auf Seite 398 zweimal ausnutzen. Es gilt:

1
1 + (x − x0 ) ≤ ex−x0 =
Beispiel ex0 −x
Als erstes Beispiel differenzierbarer Funktionen betrach- 1

ten wir Monome, also eine Funktion f : R → R mit 1 + (x0 − x)
f (x) = x n und n ∈ N. Klammern wir an einer Stelle 1 − (x − x0 ) + (x − x0 )
x0 ∈ R den linearen Faktor (x − x0 ) zur Nullstelle des =
1 − (x − x0 )
Polynoms f (x) − f (x0 ) = x n − x0n aus, so folgt für den (x − x0 )
Differenzenquotienten: =1+ .
1 − (x − x0 )
f (x) − f (x0 ) x n − x0n Subtrahieren wir 1, multiplizieren die Ungleichungen mit
=
x − x0 x − x0 ex0 und dividieren dann durch x − x0 , so ergeben sich für
  den Differenzenquotienten die Abschätzungen
(x − x0 ) x n−1 + x n−2 x0 + · · · + x x0n−2 + x0n−1
= ex − ex0 1
x − x0 ex0 ≤ ≤ ex0
x − x0 1 − (x − x0 )
= x n−1 + x n−2 x0 + · · · + x x0n−2 + x0n−1 ,
für x = x0 und |x −x0 | < 1. Das Einschließungskriterium
wenn x = x0 ist. Der Grenzwert für x → x0 existiert und auf Seite 289 liefert Konvergenz für x → x0 , und die
wir erhalten Ableitung ist
x n − x0n ex − ex0
f  (x0 ) = lim = n x0n−1 . f  (x0 ) = lim = e x0 . 
x→x0 x − x0 x→x0 x − x0
x =x0 x=x0
554 15 Differenzialrechnung – die Linearisierung von Funktionen

Zur Bestimmung von Ableitungen ist es manchmal günstiger, Wenn die Funktion f in x0 differenzierbar ist, so ist h eine
den Grenzwert anders zu notieren, indem wir h = x − x0 als stetige Funktion in x0 . Damit wird deutlich, was unter einer
Störung der Stelle x0 um den Wert h ∈ R auffassen. Es ist Linearisierung einer Funktion zu verstehen ist. Wir haben
dann: eine Richtung des folgenden Satzes bewiesen.
f (x) − f (x0 )
f  (x0 ) = lim Linearisierung einer Funktion
x→x0 x − x0
x =x0
Eine Funktion f : (a, b) ⊆ R → R ist in einer Stelle
f (x0 + h) − f (x0 ) x0 ∈ (a, b) differenzierbar genau dann, wenn es eine an
= lim
h→0 h der Stelle x0 stetige Funktion h : (a, b) → R gibt mit
h =0
h(x) → 0 für x → x0 und
(siehe Beispiel auf Seite 555). Beachten Sie, dass in der De-
finition keine Vorzeichenbeschränkung an x − x0 bzw. h vor- f (x) = f (x0 ) + f  (x0 )(x − x0 ) +h(x)(x − x0 ).

ausgesetzt ist, d. h., der Grenzwert gilt nicht nur für monotone „Linearisierung“
Folgen, die ausschließlich von rechts oder von links gegen x0
konvergieren, sondern auch für beliebig um x0 alternierende
Folgen. Beweis: Die eine Implikation haben wir in der Herleitung
oben bereits gesehen. Für die Rückrichtung der Äquivalenz-
? relation nehmen wir an, dass es zu f : (a, b) → R eine Dar-
Die Definition der Ableitung würde sich ändern, wenn der stellung der Form
Grenzwert des Differenzenquotienten durch den symmetri-
schen Ausdruck f (x) = f (x0 ) + α(x − x0 ) + h(x)(x − x0 )
f (x0 + h) − f (x0 − h) mit einer in x0 stetigen Funktion h : (a, b) → R mit h(x) → 0
lim
h→0 2h für x → x0 gibt. Betrachten wir den Differenzenquotienten,
h=0
so folgt, dass der Grenzwert existiert, und wir erhalten:
ersetzt wird. Finden Sie ein Beispiel, bei dem ein Unterschied
f (x) − f (x0 )
sichtbar wird. lim = α,
x→x0 x − x0
x=x0

Neben der Notation f  (x0 ) ist auch eine weitere Schreibweise d. h., f ist differenzierbar in x0 mit f  (x0 ) = α. 
für die Ableitung üblich, der sogenannte Differenzialquo-
tient: In anderen Worten ausgedrückt besagt diese Darstellung,
df
(x0 ) = f  (x0 ) . dass die Differenz zwischen f und der Linearisierung, also
dx der Term h(x)(x − x0 ), schneller gegen null konvergiert als
Um den Begriff eines Differenzials zu verstehen, nutzen wir der lineare Ausdruck (x − x0 ), wenn x gegen x0 strebt. In
die anschauliche Vorstellung, die wir von Ableitungen haben. diesem Sinne approximiert die Linearisierung eine Funktion.
Zunächst konkretisieren wir die vage Vorstellung von der Mit der Landau-Symbolik, wie wir sie in Abschnitt 11.3 ein-
lokalen Approximation durch eine affin-lineare Funktion. geführt haben, schreibt man kurz:

f (x) − g(x) = o(|x − x0 |) .


Die Ableitung liefert eine lineare
Approximation
y dy
f
Betrachten wir die Differenz einer Funktion f : (a, b) → R
und der affin-linearen Funktion g : R → R mit h(x)(x − x0 )

g(x) = f (x0 ) + f  (x0 )(x − x0 ) .

Die Differenz der beiden Funktionswerte beschreiben wir mit


f (x0 ) + f  (x0 )(x − x0 )
einer Hilfsfunktion h : (a, b) → R durch:

f (x) − g(x) = f (x) − f (x0 ) − f  (x0 )(x − x0 ) dx

= (x − x0 ) h(x),

d. h.,
x0 x

⎨ f (x) − f (x0 )
− f  (x0 ) für x ∈ (a, b)\{x0 } ,
h(x) = x − x0 Abbildung 15.4 Der Graph der Linearisierung einer Funktion um eine Stelle x0
⎩0 für x = x0 . ist die Tangente an f in x0 .
15.1 Die Ableitung 555

Beispiel: Die Ableitungen von sin und cos


Mithilfe der allgemeinen Definition wird die Differenzierbarkeit der Sinus- und der Kosinusfunktion gezeigt. Dazu ist eine
geeignete Abschätzung des Zählers im entsprechenden Differenzenquotienten erforderlich.

Problemanalyse und Strategie: Mit einem geeigneten Additionstheorem zum Sinus schreiben wir den Zähler
sin(x0 + h) − sin(x0 ) im Differenzenquotienten zur Sinusfunktion so, dass eine Abschätzung gegenüber der Störung h
deutlich wird.

Lösung: Also existiert der Grenzwert und wir erhalten die Ablei-
Mit den Additionstheoremen lässt sich eine Differenz von tung
Funktionswerten zur Sinusfunktion durch
f  (x0 ) = cos x0 .
sin(x0 + h) − sin x0 = sin x0 cos h + cos x0 sin h − sin x0
= sin x0 (cos h − 1) + cos x0 sin h Wir können ähnlich vorgehen, um die Ableitung des Ko-
sinus zu zeigen. Schneller sehen wir dies aber, wenn wir
ausdrücken. In der Herleitung zur Zahl π im Abschnitt
die Verschiebung cos x = sin(x + π2 ) ausnutzen. Denn so
auf Seite 407 haben wir mit dem Leibniz-Kriterium die
erhalten wir mit dem oben betrachteten Grenzwert an der
beiden Abschätzungen
Stelle x + π2 für den Differenzenquotienten der Kosinus-
) )
) sin h ) 2 funktion:
) − 1 ) ≤ h
) h ) 6
π π
cos(x0 + h) − cos x0 sin(x0 + + h)−sin(x0 +
2 2)
und =
h2 h h
| cos h − 1| ≤ π
2 → cos(x0 + ) = − sin x0
2
für |h| ≤ 2 gezeigt. Mit diesen Abschätzungen folgt für
den Differenzenquotienten
für h → 0, h = 0. Die letzte Identität sieht man mit
sin(x0 + h) − sin(x0 ) cos h−1 sin h dem Additionstheorem cos(x0 + π2 ) = cos x0 cos π2 −
= sin x0 + cos x0
h h h sin x0 sin π2 = − sin x0 , wobei die Funktionswerte
→ cos x0 , für h → 0 . cos π2 = 0 und sin π2 = 1 eingesetzt wurden.

Die Ableitung gibt die Steigung der ?


Tangente an Drei grundlegende Interpretationen des Begriffs Ableitung
wurden vorgestellt. Welche Variante würden Sie als geome-
Wir nennen die Gerade, die durch den Graphen von g be- trischen, welchen als analytischen und welchen als physika-
schrieben ist, die Tangente zu f an der Stelle x0 (Abb. 15.4). lischen Zugang bezeichnen?
Betrachten wir die Tangente vom Punkt (x0 , f (x0 )) ∈ R2
aus, so gilt lokal, d. h. in einer entsprechend kleinen Umge-
bung um die Stelle x0 :
Differenzierbare Funktionen einer
Veränderlichen sind stetig
(f (x) − f (x0 )) ≈ g(x) − f (x0 ) = f  (x0 )(x − x0 )
Die Eigenschaft der Differenzierbarkeit einer Funktion an
in dem oben beschriebenen Sinn. einer Stelle x0 gibt eine lokale Information über den Verlauf
der Funktion. Eine weitere lokale Eigenschaft von Funktio-
Verschieben wir den Ursprung des Koordinatensystems in
nen kennen wir bereits aus Kapitel 7, die Stetigkeit. Wir be-
den Punkt (x0 , f (x0 )) und bezeichnen die neuen Koordinaten
trachten für eine in x0 differenzierbare Funktion die Differenz
mit (δx, δf ), so ist die Tangente gegeben durch die Gleichung
der Funktionswerte und erhalten
' ) )(
) f (x) − f (x0 ) )
δf = f  (x0 )δx . lim |f (x) − f (x0 )| = lim |x − x0 | )) )
x→x0 x→x0 x−x )
0
x=x0 x=x0
(Abb. 15.4). Die so beschriebene lineare Abbildung = 0 · f  (x0 ) = 0 .
df : R → R mit df (δx) = f  (x0 )δx wird als das Dif-
ferenzial df von f in x0 bezeichnet. Schreibt man ent- Dies zeigt, dass Differenzierbarkeit einer Funktion eine stär-
sprechend die Identitätsabbildung als Differenzial dx, so ist kere Bedingung ist als Stetigkeit. Halten wir die Aussage
df = f  (x0 )dx. fest.
556 15 Differenzialrechnung – die Linearisierung von Funktionen

Differenzierbare Funktionen sind stetig Stelle x0 ab, an der der Grenzwert betrachtet wird. Wenn der
Grenzwert für jede beliebige Stelle x0 im offenen Defini-
Ist f : I ⊆ R → R eine in einer Stelle x0 ∈ I differen-
tionsbereich D ⊆ R einer Funktion F : D → R existiert, so
zierbare Funktion, so ist f in x0 stetig.
sprechen wir von einer differenzierbaren Funktion und lassen
den Zusatz „an einer Stelle“ fallen. Es ergibt sich aus der
Beispiel Die Betragsfunktion ist ein Beispiel für eine Konstruktion der Ableitung in diesem Fall eine neue Funktion
Funktion, die in x0 = 0 zwar stetig aber nicht differenzierbar
ist. Ein weiteres Beispiel ist die stückweise gegebene, stetige f: D → R.
Funktion f : R → R mit
Diese Funktion nennt man Ableitungsfunktion oder auch

x, x < 0, kurz die Ableitung von f , wenn keine Verwechselung zu be-
f (x) = fürchten ist. Somit ist etwa zu f : R → R mit f (x) = x 2
x2, x ≥ 0.
die Ableitungsfunktion f  : R → R durch f  (x) = 2x gege-
Betrachten wir den Differenzenquotienten in x0 = 0, so ist ben. Bei der Exponentialfunktion exp : R → R ist die Ablei-
tungsfunktion wegen
f (x) − f (0) x2
lim = lim = lim x = 0 .
x→0 x−0 x→0 x x→0 exp (x) = exp(x) für x ∈ R
x>0 x>0 x>0

Andererseits gilt wieder dieselbe Funktion.

f (x) − f (0) x Die Auswertung der Ableitungsfunktion liefert uns an jeder


lim = lim = 1 .
x→0 x−0 x→0 x Stelle x ∈ D des Definitionsbereichs die lokale Änderungs-
x<0 x<0
rate, die Ableitung f  (x).
Da die Grenzwerte unterschiedlich sind, existiert der Grenz-
wert lim f (x)−f (x0 )
nicht, die Funktion ist nicht differen- Wenn eine Ableitungsfunktion f  : D → R selbst eine ste-
x→x0 x−x0
x=x0 tige Funktion ist, so sprechen wir von einer stetig differen-
zierbar. zierbaren Funktion f . Ist die Ableitungsfunktion f  sogar
differenzierbar, so heißt
Modifizieren wir im letzten Beispiel die Funktion f zu
 f  = (f  ) : D → R
˜ 0, x < 0,
f (x) =
x2, x ≥ 0. die zweite Ableitung von f . Eine physikalischen Bedeutung
der zweiten Ableitung zeigt etwa der Ausblick auf Seite 557.
so handelt es sich um eine in x0 = 0 differenzierbare Funk-
tion, wie aus der analogen Rechnung ersichtlich ist. Die Ab- Induktiv lassen sich höhere Ableitungen zur Funktion f de-
bildung 15.5 der Graphen zeigt, dass f˜ an der Stelle x0 glatter finieren.
ist als f . 
Definition von r-mal stetig differenzierbar
y
Eine Funktion f auf einer offenen Menge D ⊆ R heißt
r-mal stetig differenzierbar, wenn f : D → R eine r-
mal differenzierbare Funktion ist und die r-te Ableitung
eine stetige Funktion ist.
1
Für die 2-te Ableitungsfunktion nutzt man die Notation f 
wie oben angegeben. Bei höheren Ableitungen sind die bei-
den Schreibweisen

dr f
-1 1 x f (r) (x) = (x)
dx r
für den Wert der r-ten Ableitung an einer Stelle x ∈ D üblich.
f
Beispiel
Abbildung 15.5 Zwei abschnittsweise definierte Funktionen, f ist stetig aber
Die Funktion f : R → R mit f (x) = x n für eine Zahl
nicht differenzierbar, f˜ ist stetig und differenzierbar. n ∈ N ist unendlich oft differenzierbar, und es gilt:
f (r) (x) = n(n − 1) · . . . · (n − r + 1)x n−r

Die Ableitung als Funktion für 1 ≤ r ≤ n bzw.


f (r) (x) = 0
Bisher wurde nur lokal für eine feste Stelle x0 von einer
Ableitung gesprochen. Die Ableitung hängt explizit von der für r > n.
15.1 Die Ableitung 557

Hintergrund und Ausblick: Der harmonische Oszillator


Die Bewegung eines Pendels wird durch eine Differenzialgleichung modelliert. Dabei stellt die Differenzialgleichung eine
Beziehung zwischen Auslenkung und der zweiten Ableitung dieser Funktion her. Erst eine Linearisierung der allgemeinen
Beschreibung aus der klassischen Mechanik führt auf die bekannte Schwingungsgleichung.

Beim idealen Pendel schwingt eine Punktmasse M nur un- Diese Gleichung wird auch Schwingungsgleichung ge-
ter Einfluss der Schwerkraft. Es werden Reibungskräfte nannt. Sie beschreibt einen harmonischen Oszillator.
durch die Aufhängung und der Luftwiderstand vernach- Durch die Linearisierung vereinfacht sich die Differen-
lässigt. Bezeichnet man mit l > 0 die Länge des Pendels, zialgleichung, sodass explizit Lösungen bestimmt werden
mit m > 0 die Masse und mit s(t) die Länge des Bo- können. In diesem Fall erhalten wir Lösungen von der Ge-
genstücks zwischen Punktmasse und dem Ruhepunkt des stalt
Pendels zum Zeitpunkt t ∈ R, so lässt sich die Strecke '. ( '. (
auch mithilfe des Auslenkungswinkels α(t) ∈ [−π, π] g g
α(t) = c1 cos t + c2 sin t ,
durch s(t) = lα(t) beschreiben, wenn wir den Winkel im l l
Bogenmaß messen (siehe Abbildung).
wie wir nachprüfen können, indem wir die zweite Ab-
Nach dem Newton’schen Kraftgesetz ist das Produkt aus
leitung berechnen. Im Kapitel 20 über Differenzialglei-
Masse und Beschleunigung gleich der auf der Punktmasse
chungen werden wir eine Methode kennenlernen, wie man
wirkenden Kraft. Da wegen der Aufhängung der Masse
solche Lösungen aus der Differenzialgleichung heraus be-
nur der Anteil der Gravitationskraft tangential zur Bahn
stimmen kann. Außerdem werden wir sehen, dass alle Lö-
der Punktmasse auf die Masse wirkt, erhalten wir für die
sungen die oben angegebene Form haben müssen. Die Mo-
Kraft
dellierung von Oszillationen mithilfe der Schwingungs-
F (t) = −mg sin α(t) ,
gleichung ist grundlegend in vielen Anwendungen.
und es ergibt sich eine Differenzialgleichung
Nimmt man hingegen keine Linearisierung in der Dif-
mlα  (t) = ms  (t) = −mg sin α(t) ferenzialgleichung vor, lassen sich allgemeine Lösungen
nicht explizit angeben. Die mathematische Theorie, die
zur Beschreibung der Schwingung. Immer wenn eine wir noch diskutieren werden, garantiert aber, dass auch
Funktion und/oder ihre Ableitungen zueinander in einer zu dieser Differenzialgleichung eine Lösung existiert. Wir
Gleichungsrelation stehen, spricht man von einer Diffe- sind auf numerische Verfahren angewiesen, um solche Lö-
renzialgleichung. sungen zu berechnen.
Das Bild zeigt ein Foucault’sches Pendel an der Uni
α
Heidelberg. Es dient zum experimentellen Nachweis der
l Erddrehung. Das relativ ideale mathematische Pendel
schwingt scheinbar nicht in einer Ebene. Dies muss aber
aufgrund der Drehimpulserhaltung der Fall sein. Somit
dreht sich die Bodenplatte gegenüber der Schwingungs-
s
α ebene.

mg

Geht man von relativ kleinen Winkeln α(t) für die Auslen-
kung aus, so ist eine Linearisierung der Sinusfunktion um
α = 0 in dieser Gleichung eine sinnvolle Approximation.
Mit
sin(α) ≈ sin(0) + sin (0)α = α
folgt die Differenzialgleichung
g
α  (t) + α(t) = 0 .
l
558 15 Differenzialrechnung – die Linearisierung von Funktionen

Die Aussage zeigen wir induktiv: Für r = 0 und festem Dieser Ausdruck konvergiert nicht für h → 0, da die
Wert n ∈ N haben wir die Ableitungsfunktion f  (x) = Grenzwerte von rechts und von links verschieden sind. Die
nx n−1 zu f im Beispiel auf Seite 553 bestimmt. Funktion g ist genau einmal stetig differenzierbar. Nur au-
Nehmen wir nun an, dass für 0 ≤ r < n gilt ßerhalb der Stelle x = 0 kann auch die zweite Ableitung
angegeben werden.
f (r) (x) = n(n − 1) · . . . · (n − r + 1)x n−r ,
f (x) g g
so können wir den von x unabhängigen Faktor n(n − 1)
. . . (n−r+1) aus dem Differenzenquotienten der Funktion 3
f (r) ausklammern und erhalten analog für die (r + 1)-te
Ableitung aus g 
2
 
f (r+1) (x) = f (r) (x)
11
die Identität
 
f (r+1) (x) = n(n − 1) · . . . · (n − r + 1)x n−r -2 -1 1 2 x
n−(r+1)
= n(n − 1) . . . (n − r + 1)(n − r)x
Abbildung 15.6 Graphen der stückweise definierten Funktion g und ihrer
Ableitungen.
für r + 1 ≤ n.
Im Fall r = n ist die Funktion Die Funktion
  
(n)
f (x) = n(n − 1) . . . · 1 = n! x 2 sin 1
, x > 0,
h(x) = x

konstant. Damit verschwindet ihre Ableitung und somit 0, x≤0


auch alle höheren Ableitungen von f . Dies beweist die ist genau einmal differenzierbar in x = 0. Aber die Ablei-
Aussage, dass f unendlich oft differenzierbar ist mit den tungsfunktion ist nicht stetig in x = 0, d. h., die Funktion
angegebenen Ableitungsfunktionen. ist nicht stetig differenzierbar.
Die Funktion Um dies zu sehen, betrachten wir den Differenzenquo-
 2 tienten
x + 1, x ≥ 0,
g(x) =  
1, x<0 x 2 sin x1 ' (
h(x) − h(0) 1
= = x sin , x = 0 ,
ist genau einmal stetig differenzierbar in 0. x−0 x x
Die Differenzierbarkeit für x  = 0 folgt aus dem Beispiel an der Stelle x0 = 0. Dieser Ausdruck konvergiert gegen
auf Seite 553, und es ist 0 für x → 0 wegen der Abschätzung
 ) ' ()
2x , x > 0 , ) )
g  (x) = )x sin 1 ) ≤ |x| → 0, x → 0 .
0, x < 0. ) x )

Betrachten wir noch die Stelle x = 0. Es ist Also ist h in x = 0 differenzierbar mit h (0) = 0.
 Weiter unten werden wir mit der Kettenregel sehen, dass
1* + h2
g(h) − g(0) = h = h, h > 0, für x > 0 die Funktion h differenzierbar ist mit Ableitung
h 0, h < 0. h (x) = 2x sin(1/x) − cos(1/x). Wir ersparen uns hier
eine Herleitung dieser Ableitung direkt aus dem Differen-
Daher gilt zenquotienten. Für x < 0 ist offensichtlich h (x) = 0.
1* +
g(h) − g(0) → 0 Insgesamt erhalten wir die Ableitungsfunktion
h 
für h → 0. Also ist g auch in x = 0 differenzierbar mit 2x sin(1/x) − cos(1/x) , x > 0 ,
h (x) =
g  (0) = 0. Die Abbildung g  : R → R ist stetig auf R, da 0, x ≤ 0.
insbesondere
Diese Funktion ist nicht stetig in 0, denn wählen wir etwa
 
lim g (x) = lim g (x) = 0 die Nullfolge mit xn = 1/(2π n), n ∈ N, so folgt
x→0 x→0
x<0 x>0 1
h (xn ) = sin(2π n) − cos(2π n) = −1 .
gilt. Für die zweite Ableitung von g bei x = 0 müssen πn
wir den Differenzenquotienten zur Ableitungsfunktion be- Mit der Nullfolge xn = 1/((2n + 1)π ) erhalten wir
trachten: 2
 2h h (xn ) = sin((2n+1)π )−cos((2n+1)π ) = 1 .
1*  + = 2, h > 0, (2n + 1)π
g (h) − g  (0) = h
h 0, h < 0. Die Ableitung kann somit in x = 0 nicht stetig sein.
15.1 Die Ableitung 559

Außerdem sehen wir, dass aus der Tatsache, dass der ?


Grenzwert von h (x) für x → 0 nicht existiert, nicht ge- Wenn f ∈ C r (a, b) gilt, in welcher Menge ist dann die n-te
schlossen werden kann, dass die Funktion h in x = 0 nicht Ableitungsfunktion f (n) für 0 < n ≤ r.
differenzierbar ist.
Am Beispiel erkennt man, dass das Verhalten von Funktio-
nen und deren Ableitungen an Oszillationsstellen relativ Die oben angegebenen Beispiele belegen, dass es sich bei
kompliziert sein kann und im Einzelfall zu untersuchen diesen Mengen um eine Kaskade von Teilmengen handelt
ist.  (Abb. 15.8).

y 2-mal differenzierbar
h
stetig differenzierbar C 1 (a, b)
1

h differenzierbar
1
2
stetig C(a, b)

−1 1 x Abbildung 15.8 Einbettung der differenzierbaren Funktionen in die Klasse der


− 21 1
2 stetigen Funktionen.

− 21
Es werden auch Ableitungsfunktionen f  ∈ C([a, b]) auf
abgeschlossenen Intervallen betrachtet, wobei die Funktions-
−1
werte f  (a) und f  (b) durch eine stetige Fortsetzung der
Ableitungsfunktion definiert sind (Seite 318).

Abbildung 15.7 Graphen von h und der Ableitung h aus dem Beispiel auf Diese Definition einer Ableitung in einem Randpunkt der
Seite 559. Definitionsmenge ist zu unterscheiden von einseitigen Ab-
leitungen, die unabhängig von den Eigenschaften der Ab-
leitungsfunktion im Intervall (a, b) durch einseitige Grenz-
werte, etwa
?   lim
f (a + h) − f (a)
Im Beispiel auf Seite 320 hatten wir gesehen, dass sin x1 in h→0 h
h>0
null nicht stetig
 fortgesetzt
 werden kann. Überlegen Sie sich,
dass mit x sin x1 eine stetige aber in null nicht differenzier- gegeben sind. Dieser Grenzwert, wenn er existiert, heißt
bare Funktion gegeben ist. rechtsseitige Ableitung von f in a. Analog wird die links-
seitige Ableitung definiert.

Analytische Eigenschaften einer Funktion, wie Stetigkeit Beispiel Betrachten wir die beiden Funktionen
oder Differenzierbarkeit, werden oft zusammengefasst un- f, g : (−1, 1) → R mit
ter dem Oberbegriff der Regularität einer Funktion. Beim 1
f (x) = (1 − x 2 ) 2
Umgang mit Funktionen spielt die Regularität nicht nur theo-
retisch, sondern auch numerisch eine entscheidende Rolle, und
wie wir es etwa beim Newton-Verfahren auf Seite 572 noch g(x) = (1 − x 2 ) 2
3

sehen werden. Daher ist es nützlich, alle Funktionen mit glei-


chen Regularitätseigenschaften zu Mengen zusammenzufas- und untersuchen die einseitigen Differenzenquotienten bei
sen. Die Menge der r-mal stetig differenzierbaren Funktionen x = 1. Für das erste Beispiel gilt für x ∈ (−1, 1) die Identität
wird international durch die Notation % √ √
1 − x2 − 0 (1 − x)(1 + x) 1+x
= = −√ ,
C r (D) = {f : D → R | f ist r-mal stetig differenzierbar} x−1 x−1 1−x
und es wird deutlich, dass der Grenzwert für x → 1 nicht
angegeben. Der Buchstabe C erinnert dabei an die englische existiert. Im zweiten Fall erhalten wir:
Bezeichnung continuous für stetig. Im Spezialfall r = 0 lässt
man den Index weg und schreibt (1 − x 2 )3/2 − 0 (1 − x)3/2 (1 + x)3/2
lim = lim
x→1 x−1 x→1 x−1
x<1 x<1
C(D) = {f : D → R | f ist stetig}
= − lim (1 − x)1/2 (1 + x)3/2 = 0 .
x→1
für die Menge der stetigen Funktionen. x<1
560 15 Differenzialrechnung – die Linearisierung von Funktionen

Der Grenzwert existiert. Also besitzt die Funktion g eine wenn wir eine Funktion mit einem Faktor λ ∈ R multipli-
linksseitige Ableitung in x = 1 mit dem Wert 0. Anhand der zieren, gilt die Identität (λf ) (x) = λ f  (x). Beide Eigen-
Graphen (siehe die Abbildung 15.9) wird das signifikant un- schaften, Additivität und Homogenität zusammen ergeben
terschiedliche Verhalten der Funktionen an der Stelle x = 1 die Linearität des Differenzialoperators.
deutlich. 

Linearität des Differenzialoperators


Sind f, g : D ⊆ R → R differenzierbare Funktionen
und λ ∈ R eine beliebige Konstante, so sind auch die
Funktionen f + g und λf differenzierbar, und es gilt
f
1
2
g (f + g) (x) = f  (x) + g  (x)

und
−1 1
(λf ) (x) = λf  (x) .
− 21 1
2
Abbildung 15.9 Das unterschiedliche Verhalten der beiden Funktionen f und
g am Intervallrand zeigt sich in der Existenz einer einseitigen Ableitung Beispiel Polynome sind beliebig oft differenzierbar und
mit
Kommentar: Wir haben so zwei verschiedene Betrachtun- !
n

gen von Ableitungen in Randpunkten, durch eine stetige p(x) = ak x k


Fortsetzung der Ableitungsfunktion oder durch den einseiti- k=0
gen Differenzenquotienten. Die Existenz des Grenzwerts des ist
einseitigen Differenzenquotienten sichert keine stetige Fort-
setzung der Ableitungsfunktion, wie wir es im Beispiel auf !
n !
n−1
Seite 558 schon gesehen haben. Mithilfe des Mittelwertsatzes p (x) = k ak x k−1 = (j + 1) aj +1 x j
werden wir sehen, dass für f ∈ C 1 ([a, b]) auch die einsei- k=1 j =0
tigen Grenzwerte existieren und mit den fortgesetzten Funk-
tionswerten f  (a) bzw. f  (b) übereinstimmen (Seite 571). ein Polynom vom Grad n − 1.
Die Aussage ergibt sich aus der Differenzierbarkeit von
d
Monomen mit dx (x k ) = kx k−1 und der Linearität, da sich
Polynome aus einer endlichen Summe solcher Funktionen
15.2 Differenziationsregeln zusammensetzen. 

Die Berechnung einer Ableitung durch Bilden des Grenz- Konsequenz der Linearität des Differenzialoperators bzw. der
werts des Differenzenquotienten ist relativ aufwendig. Zum analogen Eigenschaft bei Stetigkeit ist, dass die Menge der k-
Glück gibt es Regeln, die es ermöglichen, Ableitungen von mal stetig differenzierbaren Funktionen, C k (a, b), mit k ∈ N
Funktionen auf einige wenige differenzierbare Standardfunk- einen Vektorraum (siehe Kapitel 6) bildet. Genauer lässt sich
tionen zurückzuführen. festhalten, das es sich um eine Kette von Unterräumen han-
delt, d. h., es gilt
Ableiten ist eine lineare Operation
C k+1 (a, b) ⊆ C k (a, b) für k ∈ N0 .
Eine Regel ist leicht aus der Definition zu ersehen. Betrachten
Es stehen uns somit allgemeine Aussagen zu Vektorräumen
wir die Summe f +g von zwei differenzierbaren Funktionen
auch in diesen Funktionenräumen zur Verfügung. Eine Tat-
f, g : D → R, so gilt mit den allgemeinen Rechenregeln zu
sache, die sich als nützlich erweisen wird.
Grenzwerten, dass
Es handelt sich bei der Schachtelung von Unterräumen übri-
(f + g)(x) − (f + g)(x0 )
lim gens um echte Teilmengen, wie wir es etwa am Beispiel der
x→x0 x − x0 Betragsfunktion für k = 0 leicht sehen. Bei solchen Beispie-
f (x) − f (x0 ) + g(x) − g(x0 ) len ist die Differenzierbarkeit nur in einer diskreten Stelle ver-
= lim
x→x0 x − x0 letzt. Ein interessantes weiteres Beispiel einer stetigen aber
f (x) − f (x0 ) g(x) − g(x0 ) nirgends differenzierbaren Funktion ist auf Seite 561 kon-
= lim + lim
x→x0 x − x0 x→x0 x − x0 struiert. Da die Suche nach Gegenbeispielen eine wichtige
 
= f (x0 ) + g (x0 ) . Beweismethode der Mathematik ist, wird diese Konstruktion
exemplarisch genauer betrachtet. In diesem Zusammenhang
Diese Eigenschaft wird auch Additivität des Differenzierens sei auch auf das Lehrbuch Analysis in Beispielen und Gegen-
genannt. Analog erhalten wir die Homogenität. Es bedeutet, beispielen von J. Appell hingewiesen.
15.2 Differenziationsregeln 561

Unter der Lupe: Eine stetige, nirgends differenzierbare Funktion


Es ist ein Beispiel gesucht, mit dem belegt wird, dass es Funktionen gibt, die zwar stetig sind, aber in keiner Stelle differenzierbar.
Wir kennen bereits Funktionen, wie die Betragsfunktion, die in isolierten Stellen stetig, aber nicht differenzierbar sind. Aber der
Graph der gesuchten Funktion muss ausschließlich aus „Ecken“ bestehen.

Wie lässt sich eine solche Funktion konstruieren? Zu- Da alle Summanden entweder 1 oder −1 sind, beobachten
nächst verschaffen wir uns mit der Betragsfunktion eine wir, dass für n ungerade die Summe eine gerade Zahl ist
Funktion, die unendlich viele Stellen aufweist, die nicht und für n gerade die Summe ungerade ist. Also kann die
differenzierbar sind, z. B. die Sägezahnfunktion s : R → R Folge der Quotienten nicht konvergieren.
(siehe Abbildung), die durch periodische Fortsetzung von
s(x) = |x| für |x| ≤ 1 entsteht. Offensichtlich ist s ste- Jetzt müssen wir noch zeigen, dass dies im Widerspruch
tig, aber in den Stellen x = k ∈ N nicht differenzierbar. zur Differenzierbarkeit steht. Nehmen wir an, f sei diffe-
renzierbar in x̂, dann folgt mit der Linearisierung (Seite
y
554), dass es eine stetige Funktion h : R → R gibt mit
1 s(x) lim h(x) = 0 und
x→x̂
1
2
s(2x) f (yn ) − f (xn )
-2 -1 0 1 2 x yn − xn
1 
Schieben wir die Knicke etwa durch s(nx), n ∈ N zusam- = f (x̂) + f  (x̂)(yn − x̂) + h(yn )(yn − x̂)
men, erhalten wir keine stetige Funktion im Grenzfall für yn − xn

n → ∞. Verkleinern wir zusätzlich dabei die Amplitude, − f (x̂) − f  (x̂)(xn − x̂) − h(xn )(xn − x̂)
etwa durch n1 s(nx), wird die Grenzfunktion konstant null. yn − x̂ xn − x̂
Es ist eine Funktion zwischen diesen beiden Extremen zu = f  (x̂) + h(yn ) − h(xn ) .
yn − x n yn − x n
konstruieren.
−x̂
Die Idee besteht darin, die Zacken aufzusummieren. Da- Da nach Wahl von xn und yn gilt | yynn−x n
| ≤ 1 und
xn −x̂
mit wir sicherstellen, dass die so entstandene Reihe für | yn −xn | ≤ 1, folgt, dass für eine differenzierbare Funktion
x ∈ R konvergiert, wählen wir für n nur Potenzen von 2 der Grenzwert des Quotienten existiert und gleich f  (x̂)
und betrachten ist. Wir haben aber mit der Konstruktion gezeigt, dass der

! Grenzwert nicht existiert. Also ist die Funktion f in keiner
1
f (x) = s(2j x) . Stelle x̂ differenzierbar.
2j
j =0
Andererseits können wir bei der Konstruktion als Reihe
Die Konvergenz lässt sich mit dem Majorantenkriterium über stetige Funktionen hoffen, dass f stetig ist. Dies muss
und der geometrischen Reihe zu q = 21 zeigen. aber noch gezeigt werden. Geben wir uns dazu ε > 0 vor.
Betrachten wir Differenzenquotienten zu den einzelnen Mit der geometrischen Reihe können wir N ∈ N so fest-
Summanden. Wir beobachten, dass mit k ∈ Z gilt: legen, dass
1
 j  ∞ ∞
2j
s(2 y) − s(2j x) ! s(2j x) 1 ! 1 1
= ±1 , ≤ = N ≤ε
y−x 2 j 2 N +1 2 j 2
j =N +1 j =0
falls x, y ∈ [ 2kj , k+1
2j
]. Außerdem ist s(2j 2kn ) = 0 für
j ≥ n + 1 ∈ N und k ∈ Z. An diesen Stelle wird f zu für alle x ∈ R gilt. Weiter lässt sich nun zu den noch übri-
einer endlichen Summe. Um den Differenzenquotienten gen endlich vielen stetigen und periodischen Funktionen
1
an einer Stelle x̂ ∈ R zu untersuchen betrachten wir be- 2j
s(2j x) mit j = 0, . . . , N zu ε ein δ > 0 finden, sodass
nachbarte Nullstellen, d. h., wir definieren Zahlen kn ∈ Z | 21j (h(2j x) − h(2j x̂))| < N ε+1 für alle |x − x̂| ≤ δ ist.
und Folgen (xn ), (yn ) sodass Insgesamt sehen wir die Stetigkeit durch
kn kn + 1 ∞
!
xn = ≤ x̂ ≤ = yn |s(2j x) − s(2j x̂)|
2 n 2n |f (x) − f (x̂)| ≤
2j
1 j =0
gilt. Dann ist |xn − yn | = 2n , beide Folgen konvergieren ∞ ∞
gegen x̂ und es folgt ! 1 ! 1
+ j
+
2 2j
j =N +1 j =N +1
f (yn ) − f (xn ) !
1
n
2j
(s(2j yn ) − s(2j xn ))
= . ε
yn − x n yn − xn ≤ (N + 1) + ε + ε = 3ε .
j =0 N +1
562 15 Differenzialrechnung – die Linearisierung von Funktionen

Die Produktregel Lemma


Sind D ⊆ R eine offene Menge und g : D → R eine
Nachdem wir die Summe von Funktionen betrachtet haben, in x ∈ D differenzierbare Funktion mit g(x) = 0, so ist
1
wenden wir uns dem Produkt zu. Wenn f, g : D ⊆ R → R g : D → R differenzierbar in x, und es gilt
differenzierbare Funktionen sind, so folgt für den Differen- ' (
zenquotienten zum Produkt f · g die Identität 1 g  (x)
(x) = − .
g (g(x))2
f (x)g(x) − f (x0 )g(x0 )
x − x0
f (x)g(x) − f (x)g(x0 ) + f (x)g(x0 ) − f (x0 )g(x0 )
= Beweis: Da g in x stetig ist (Seite 556), gibt es ein δ > 0
x − x0
g(x) − g(x0 ) f (x) − f (x0 ) mit g(y) = 0 für alle y ∈ (x − δ, x + δ) ⊆ D. Für den
= f (x) + g(x0 ) Differenzenquotienten der Funktion 1/g folgt
x − x0 x − x0
1 1
− g(x) − g(y)
für x = x0 . Da f und g differenzierbar sind und f insbe- g(y) g(x)
=
sondere auch stetig in x0 ist, existiert der Grenzwert, und wir y−x g(y)g(x)(y − x)
erhalten: 1 g(y) − g(x)
=−
f (x)g(x) − f (x0 )g(x0 ) g(y)g(x) y−x
lim = f (x0 )g  (x0 )+f  (x0 )g(x0 ) .
x→x0 x − x0 für y ∈ (x − δ, x + δ)\{x}. Wegen der Differenzierbarkeit
x=x0 von g existiert der Grenzwert des Differenzenquotienten für
Wir haben somit die folgende Rechenregel bewiesen. y → x, und wir erhalten zusammen mit der Stetigkeit von g
die Ableitung
' (
Produktregel 1 g  (x)
(x) = − .
Sind zwei Funktionen f, g : D → R in einer Stelle g (g(x))2
x ∈ D differenzierbar, so ist auch das Produkt fg in 

x differenzierbar, und es gilt


Mit dem Lemma und der Produktregel ergibt sich
(fg) (x) = f (x) g  (x) + f  (x) g(x) . ' (
f 1 g  (x)
(x) = f  (x) − f (x)
Beispiel Die beiden Funktionen f : R → R mit f (x) = g g(x) (g(x))2
cos2 x und g : R → R mit g(x) = sin2 x sind nach der Pro- f (x)g(x) − f (x)g  (x)

= ,
duktregel differenzierbar, und wir erhalten die Ableitungen (g(x))2
f  (x) = − cos x sin x − sin x cos x = −2 cos x sin x wenn g(x) = 0 gilt und f, g beide differenzierbar sind. Also
ist der Quotient differenzierbar, und es gilt diese als Quo-
und tientenregel bezeichnete Formel:
' (
g  (x) = sin x cos x + cos x sin x = 2 cos x sin x . f f  g − f g
= .
g g2
Addieren wir die beiden Funktionen, so folgt, wie es aus dem
Additionstheorem cos2 x + sin2 x = 1 zu erwarten ist, Beispiel
 2 2
(f + g) (x) = (cos x + sin x) = 0 . 

Die Quotientenregel lässt sich auf die Funktion f : R → R
mit f (x) = x/(1 + x 2 ) anwenden, und wir erhalten
1 + x 2 − 2x 2 1 − x2
f  (x) = = .
Mit der Produktregel ergibt sich auch eine Aussage zum Quo- (1 + x 2 )2 (1 + x 2 )2
tienten zweier differenzierbarer Funktionen. Wir zeigen zu-
Mit der Quotientenregel folgt, dass der Tangens
nächst folgendes Lemma.
tan : (−π/2, π/2) → R differenzierbar ist mit der Ab-
leitung
f (x), g(x) ' (
sin2 (x) cos2 (x)  sin x  cos2 x + sin2 x 1
1
tan x = = = .
cos x cos2 x cos2 x
Beachten Sie, dass wir den vorletzten Bruch in zwei Sum-
manden zerlegen können, sodass die Ableitung auch durch
−π π x
− π2 0 π
2 tan x = 1 + tan2 x
Abbildung 15.10 Graphen der beiden Funktionen mit f (x) = cos2 x und
g(x) = sin2 x. dargestellt werden kann. 
15.2 Differenziationsregeln 563

Beim Ableiten von Verkettungen gilt: „äußere Als Beispiel betrachten wir f : R → R gegeben mit
mal innere Ableitung“ f (x) = (x 3 + 1)7 . Die Funktion f ist offensichtlich eine
Komposition f = g ◦h mit h(x) = x 3 +1 und g(y) = y 7 .
Neben der Linearität und der Produktregel gibt es eine wei- Mit der Kettenregel folgt die Ableitung:
tere grundlegende Regel zum Ableiten, die im Folgenden
ständig genutzt wird. Es ist die Kettenregel zur Differenzia- f  (x) = 7(x 3 + 1)6 · (3x 2 ) = 21 x 2 (x 3 + 1)6 .
tion der Komposition zweier Funktionen.
Die Funktion f : R → R mit f (x) = cos(sin(x)) ist
Kettenregel differenzierbar. Mit der Kettenregel erhalten wir
Wenn zwei differenzierbare Funktionen f : D → R und
g : f (D) → R gegeben sind, so ist die Verkettung der f  (x) = − sin(sin(x)) · cos(x) . 
Funktionen differenzierbar, und es gilt für x ∈ D:
  Beachten Sie, dass die Aussage der Kettenregel nicht nur in
(g ◦ f ) (x) = g  f (x) f  (x) . der Rechenregel zur Berechnung einer solchen Ableitung be-
steht, sondern dass auch die Existenz der Ableitung von f ◦g
Beweis: Um die Kettenregel herzuleiten, betrachten wir aus der Differenzierbarkeit der beiden einzelnen Funktionen
die Ableitung an einer Stelle x0 ∈ D. Beim Beweis muss folgt.
man ein wenig mehr aufpassen als bei den anderen Regeln, Die Differenziationsregeln lassen sich nun beliebig ver-
um eine zusätzliche Voraussetzung der Form f (x)  = f (x0 ) schachtelt nutzen, um Ableitungen zu berechnen.
für alle x = x0 in einer Umgebung um x0 zu vermeiden.
Setzen wir y0 = f (x0 ) und definieren die Funktion
?
Berechnen Sie die Ableitungen zu f : R → R mit
 : f (D) → R durch
⎧ 1
⎨ g(y) − g(y0 ) für y  = y , a) f (x) = ex sin x b) f (x) =
2 + sin x cos x
0
(y) = y − y0

g  (y0 ) für y = y0 .

Da die Funktion g in y0 ∈ f (D) differenzierbar ist, ist die


Funktion  stetig. Mit dieser Funktion  folgt Umkehrfunktionen differenzierbarer
    Funktionen sind differenzierbar
g f (x) − g f (x0 )   f (x) − f (x0 )
=  f (x)
x − x0 x − x0 Ähnlich lässt sich mit der Kettenregel elegant die Ableitung
für x = x0 . Da für x → x0 die Funktionswerte f (x) gegen einer Umkehrfunktion gewinnen, falls wir wissen, dass diese
f (x0 ) konvergieren, existiert der Grenzwert des Differenzen- differenzierbar ist. Denn aus der Identität
quotienten für x → x0 , und wir erhalten die Behauptung
f −1 (f (x)) = x
   
g f (x) − g f (x0 )  
→  f (x0 ) f  (x0 ) folgt, wenn wir beide Seiten ableiten:
x − x0
 
= g  (y0 ) f  (x0 ) für x → x0 .  f −1 (f (x)) f  (x) = 1 .

Also gilt mit y = f (x):


Um sich die Kettenregel zu merken, ist eventuell die Leibniz-
Notation der Ableitung hilfreich. Denn in dieser Notation ist   1
f −1 (y) = .
d df dg f  (f −1 (y))
(f (g(x))) = (g(x)) (x) ,
dx dg dx
Der Haken an dieser Rechnung besteht darin, dass voraus-
d. h., formal sieht die Regel aus, wie ein Erweitern des Dif- gesetzt werden muss, dass die Funktion f −1 differenzierbar
ferenzialquotienten um das Differenzial dg. ist. Somit ist die Rechnung eine Merkhilfe, aber kein Beweis.
Dieser lässt sich führen, wenn die Funktion streng monoton
Beispiel ist.
Eine Verkettung von Polynomen ist stets differenzierbar.
Da allgemein eine Verkettung von Polynomen wieder ein Folgerung
Polynom ist, überrascht diese Aussage nicht. Aber es ist Ist f : I → R eine auf einem offenen Intervall I ⊆ R
häufig wesentlich angenehmer die Kettenregel zu verwen- streng monoton wachsende oder fallende Funktion, die
den, anstatt zunächst ein Polynom auszumultiplizieren. in x0 ∈ I differenzierbar ist mit f  (x0 ) = 0, so ist auch
564 15 Differenzialrechnung – die Linearisierung von Funktionen

Beispiel: Anwenden der Differenziationsregeln


Berechnen Sie zu a ∈ R die Ableitungen der Funktionen, die durch die Ausdrücke
 
f (x) = a x , f (x) = x x , f (x) = arccot(cos ax) und f (x) = cosh sinh(x 2 )

jeweils auf entsprechenden Definitionsmengen gegeben sind.

Problemanalyse und Strategie: Die angesprochenen Ableitungsregeln kommen häufig bunt ineinander verschachtelt
zur Anwendung. Zunächst müssen wir also Produkte und Verkettungen in den jeweiligen Ausdrücken identifizieren, um
so einen Weg zur Berechnung der Ableitung durch Hintereinanderausführen von Differenziationsregeln zu finden.

Lösung: den Ableitungen dieser Funktionen (siehe Übersicht auf


Ist f : R → R durch f (x) = a x mit a > 0 gegeben, Seite 566) und der Kettenregel folgt, dass f differenzier-
so schreiben wir den Ausdruck mithilfe der Exponential- bar ist auf R mit
funktion zu
−1 a sin(ax)
f (x) = e(ln(a)) x . f  (x) = a(− sin(ax)) = .
1 + cos (ax)
2 1 + cos2 (ax)
Nun lässt sich die Kettenregel anwenden, und wir erhalten
die Ableitungsfunktion Im letzten Fall für f (x) = cosh(sinh(x 2 )) werden die bei-
f  (x) = ln(a)e(ln(a)) x = ln(a)a x . den hyperbolischen Funktionen mit g(x) = x 2 verkettet.
Zunächst bestimmen wir mit der Linearität des Differen-
Analog gehen wir im zweiten Beispiel vor. Für f (x) = x x zierens die Ableitungen
und x > 0 schreiben wir den Ausdruck als ' (
d ex + e−x
x
f (x) = x = e (ln(x)) x cosh (x) =
dx 2
und wenden die Kettenregel an, auf die Exponentialfunk- ex − e−x
= = sinh(x),
tion verkettet mit g(x) = x ln(x). Da die Funktion g nach 2
' x (
der Produktregel für x > 0 differenzierbar ist mit d e − e−x
sinh (x) =
x dx 2
g  (x) = ln(x) + = ln(x) + 1
x ex + e−x
= = cosh(x) .
ergibt sich insgesamt: 2

f  (x) = (ln(x) + 1) ex ln(x) = (ln(x) + 1) x x . Nun können wir wieder die Kettenregel anwenden, und es
ergibt sich die Ableitung
Im dritten Beispiel handelt es sich um eine Verkettung der
drei Funktionen arccot, cos und Multiplikation mit a. Mit f  (x) = 2x cosh(x 2 ) sinh(sinh(x 2 )) .

die Umkehrfunktion f −1 : f (I ) → R in y0 = f (x0 ) Beispiel


differenzierbar, und es gilt Da der Logarithmus die Umkehrfunktion zur Exponen-
 −1  1 tialfunktion ist, deren Ableitung wir schon berechnet ha-
f (y0 ) =  −1 .
f (f (y0 )) ben, folgt:
1 1 1
Beweis: Wir nehmen an, dass f : I → R eine stetige, ln (x) =   =   = .
exp ln(x) exp ln(x) x
streng monotone und in x0 ∈ I differenzierbare Funktion
mit f  (x0 ) = 0 ist und setzen y  = y0 , x = f −1 (y) und Nutzen wir dieses Ergebnis und berechnen die Ablei-
x0 = f −1 (y0 ). Wegen der Monotonie ist insbesondere x = tung einer allgemeinen Potenzfunktion. Sind a ∈ R und
x0 . Da f differenzierbar ist und f  (x0 )  = 0, folgt für den f : R> 0 → R mit f (x) = x a . Dann folgt mit der Ketten-
Differenzenquotienten der Grenzwert regel
f −1 (y) − f −1 (y0 ) x − x0  
=
y − y0 f (x) − f (x0 ) f  (x) = (x a ) = ea ln x
1 1 1 a ln x
= f (x)−f (x ) → =a e = ax a−1 ,
0 f  (x0 ) x
x−x0
für y → y0 . Also ist f −1 differenzierbar in x0 mit der ange- da sich die Funktion als Komposition der Funktionen exp
gebenen Ableitung.  und a · ln auffassen lässt.
15.2 Differenziationsregeln 565

f (x) oberen oder in der unteren Halbebene können wir die Linie
arctan
als Graph einer Funktion y : [−1, 1] → R auffassen. Diese
Funktion ist durch
arctan
 3
2 2
−3 −2 −1 1 2 3 x y(x) = 1 − |x| 3 ,

−1 bzw. −y(x) für den Zweig in der unteren Halbebene, gege-


ben.
Abbildung 15.11 Die Funktion arctan und ihre Ableitungsfunktion. Suchen wir zu y : (0, 1) → R die Ableitung, so können wir
diese entweder direkt aus der expliziten Darstellung ermitteln
oder implizit mit der Kettenregel aus der Gleichung
Die Ableitung der Umkehrfunktion arctan : R → (− π2 , π2 )
des Tangens ergibt sich mit der zweiten Darstellung im  2/3
x 2/3 + y(x) =1
Beispiel auf Seite 562 zu

1 bestimmen. Bilden wir die Ableitung auf beiden Seiten der


arctan (x) =   Gleichung, so folgt:
tan arctan(x)
1 1 2 −1 2 − 1
=   = .  x 3 + y(x) 3 y  (x) = 0,
1 + tan2 arctan(x) 1 + x2 3 3

und wir erhalten y  (x) = − 3 y(x) x . Nun können wir die
explizite Darstellung der Funktion y auf (0, 1) einsetzen, um
Implizites Differenzieren die Ableitungsfunktion y  : (0, 1) → R dieses Zweigs von y
durch 
Wenn eine Ableitung aus einer Gleichung heraus zu gewin-  2
nen ist, wie bei der Umkehrfunktion, etwa aus 
1−x3
y (x) = − √3
  x
arctan tan(x) = x
anzugeben. 
(siehe Beispiel auf Seite 565), so spricht man von implizitem
Differenzieren. Diese Variante, Ableitungen zu bekommen, Die bisher hergeleiteten Ableitungsfunktionen zusammen
ist häufig nützlich und wird uns später öfter begegnen. mit den drei grundlegenden Regeln erlauben, Funktionen zu
differenzieren, die sich aus Standardfunktionen bilden las-
1 sen. Daher ist eine Liste dieser Regeln zusammen mit den
wesentlichen Ableitungen, wie sie im Überblick auf Seite
566 zusammengestellt ist, hilfreich.
1
2

Auch komplexwertige Funktionen lassen sich


differenzieren
−1 − 21 1 1
2
Darüber hinaus ist mit der Linearität des Differenzierens of-
− 21
fensichtlich, wie bei komplexwertigen Funktionen in einer
reellen Variablen, also f : D → C auf einer offenen Menge
D ⊆ R, die Differenzierbarkeit erklärt werden kann. Wir bil-
den getrennt die Ableitung des Real- und des Imaginärteils.
−1 Somit ist
Abbildung 15.12 Die Astroide aus dem Beispiel auf Seite 565. Die Teilstücke
lassen sich als Graphen entsprechender Funktionen auffassen. f  (x) = (Re(f ) + i Im(f )) (x)
= (Re f ) (x) + i (Im f ) (x) .
Beispiel Die Gleichung

|x|2/3 + |y|2/3 = 1 ?
Berechnen Sie die Ableitung der Funktion f : (0, 2π ) → C
wird von den Punkten (x, y) in der Koordinatenebene erfüllt, mit f (t) = ezt mit z = a + ib ∈ C.
die auf einer sogenannten Astroide liegen (Abb. 15.12). In der
566 15 Differenzialrechnung – die Linearisierung von Funktionen

Übersicht: Differenziationsregeln und Ableitungsfunktionen


Die wichtigsten Ableitungen und Regeln für differenzierbare Funktionen f, g : D → R lassen sich knapp zusammenfassen.

Linearität f (x) f  (x)

(f + g) (x) = f  (x) + g  (x) a 0


(af ) (x) = af  (x) xa a x a−1
exp x exp x
Produktregel 1
ln x
(f · g) (x) = f  (x)g(x) + f (x)g  (x) x
ax a x ln a, a>0
Quotientenregel
' ( 1
f f  (x)g(x) − f (x)g  (x) loga x
x ln a
(x) = für g(x)  = 0
g (g(x))2 sin x cos x
Kettenregel cos x − sin x
(f ◦ g) (x) = f  (g(x)) g  (x) tan x
1
= 1 + tan2 x
cos2 x
Potenzreihen −1
Mit ∞
cot x = −1 − cot 2 x
! sin2 x
k
f (x) = ak (x − x0 ) 1
k=0
arcsin x %
1 − x2
folgt ∞ −1
! arccos x %
f  (x) = k ak (x − x0 )k−1 1 − x2
k=1 1
arctan x
für x ∈ (x0 − R, x0 + R) und Konvergenzradius R ≥ 0. 1 + x2
Ableitungen von Standardfunktionen, wobei a ∈ R eine 1
arccot x −
Konstante bezeichnet: 1 + x2

Potenzreihen sind beliebig oft differenzierbar Beweis: Ohne Beschränkung der Allgemeinheit betrach-
ten wir den Entwicklungspunkt x0 = 0. Wir stellen den Be-
Die Bedeutung von Potenzreihen (siehe Kapitel 11) ist schon weis hier vor, schließen aber eine ausführliche Diskussion
hervorgehoben worden. Ein weiterer Aspekt ist die Differen- der relativ technischen Beweisführung in der Box auf Seite
zierbarkeit von Funktionen, die durch Potenzreihen gegeben 568 an.
sind. Zunächst ist zu zeigen, dass die beiden Potenzreihen

! ∞
!
Ableitungen einer Potenzreihe f (x) = ak x k und g(x) = k ak x k−1
Eine Funktion f : (x0 − r, x0 + r) → R, die sich um den k=0 k=1
Entwicklungspunkt x0 in eine Potenzreihe mit Konver- denselben Konvergenzradius besitzen. Bezeichnen wir mit r
genzradius r > 0 entwickeln lässt, d. h., es gilt und r  die beiden Konvergenzradien von f und g. Für die

! Partialsummen Sm von f gilt:
f (x) = ak (x − x0 )k
!
m
k=0 |Sm (x)| ≤ a0 + |ak | |x|k
für x ∈ (x0 − r, x0 + r), ist beliebig oft differenzierbar, k=1
und die Ableitungen sind durch die gliedweise differen- !
m !
m
zierten Potenzreihen ≤ a0 + k |ak | |x|k = a0 + |x| k |ak | |x|k−1 .
!∞ k=1 k=1
f  (x) = k ak (x − x0 )k−1 ,
r
Für |x| < konvergieren die Partialsummen auf der rechten
k=1
Seite der Ungleichung für m → ∞. Also konvergiert auch

! die linke Reihe nach dem Majorantenkriterium, und es folgt
f  (x) = k(k − 1) ak (x − x0 )k−2 r  ≤ r.
k=2  
usw. im Konvergenzintervall (x0 − r, x0 + r) gegeben. Seien nun andererseits |x| < r und λ = 21 1 + r/|x| . Dann
konvergiert die Potenzreihe zu f auch für λx. Ferner konver-
15.2 Differenziationsregeln 567

giert die Folge αk = λkk gegen 0. Also gibt es insbesondere dies deutlich ist, kann man mit Indexverschiebungen die Ab-
eine Konstante c > 0 mit αk ≤ c für alle k, d. h. k ≤ cλk für leitung auch anders darstellen durch
alle k. Es ergibt sich: ∞  ∞ 
! !
k−1 k
k ak (x − x0 ) = (k + 1) ak+1 (x − x0 ) .
!
m
c ! k
m
k=1 k=0
k |ak | |x|k−1 ≤ λ |ak | |x|k
|x|
k=1 k=1 Manchmal wird in der Literatur auch der Term zu k = 0 mit
c !
m angegeben:
= |ak | |λx|k . (15.1) ∞  ∞ 
|x| ! !
k=1 k−1 k−1
k ak (x − x0 ) = k ak (x − x0 ) .
Wiederum folgern wir mit dem Majorantenkriterium auf k=1 k=0
Konvergenz der linken Partialsumme, und wir haben gezeigt, Diese Variante vermeiden wir im Folgenden, da die schein-
dass r ≤ r  ist. Zusammengenommen erhalten wir r  = r. bare Singularität des Ausdrucks 1/(x − x0 ) nur durch den
Für den zweiten Teil des Beweises halten wir |x| < r fest Faktor k = 0 aufgehoben wird.
und wählen ε > 0 mit ρ = |x| + ε < r. Dann gilt mit der
binomischen Formel:
?
k '
! ( Bestätigen Sie die Identität
1* + k j −1 k−j
(x + h)k − x k = h x
h j exp (x) = exp(x),
j =1
' ( ! k ' ( indem Sie die Potenzreihe der Exponentialfunktion differen-
k k j −2 k−j
= x k−1 + h h x . zieren.
1 j
 j =2
=k
Die Aussage zur Differenzierbarkeit bedeutet, dass Potenz-
Es folgt für |h| ≤ ε die Abschätzung reihen im Konvergenzbereich unendlich oft differenzierbare
) ) Funktionen repräsentieren; denn die Ableitung einer Potenz-
)1* + )
) (x + h)k − x k − k x k−1 ) reihe ist schließlich wieder eine Potenzreihe mit demselben
)h )
Konvergenzradius. So lassen sich die Standardfunktionen
!k ' (
k j −2 k−j exp, cos, sin, etc. beliebig oft differenzieren. Andererseits
≤ |h| ε |x| besagt dies aber auch, dass eine Funktion, die an einer Stelle
j
j =2
nur endlich viele Ableitungen hat, in einer Umgebung dieser
k ' (
|h| ! k j k−j Stelle nicht in eine Potenzreihe entwickelt werden kann.
= ε |x|
ε2 j
j =2 Beispiel
|h| |h| Wir suchen einen geschlossenen Ausdruck für die Potenz-
≤ 2 (ε + |x|)k = 2 ρ k . (15.2)
ε ε reihe
!∞
Somit gilt für die Partialsummen: nx n
n=1
) )
)1* + ) !
m
) Sm (x + h) − Sm (x) − S  (x)) ≤ |h| |ak | ρ k
in ihrem Konvergenzbereich |x| < 1. Für die geometri-
)h m ) ε2 sche Reihe kennen wir die Darstellung
k=1

!
≤ γ |h| 1
xn =
 ∞  1−x
n=0
mit γ = ε12 k=1 |ak | ρ . Diese Abschätzung gilt für alle
k

m ∈ N. Der Grenzübergang m → ∞ liefert für |x| < 1. Betrachten wir die Funktion f (x) = 1/(1−x)
) ) für x = 1. Die Funktion ist differenzierbar, und wir be-
)1* + )
) f (x + h) − f (x) − g(x)) ≤ γ |h| . rechnen in beiden Darstellungen die Ableitung
)h )

! 1
Für h → 0 erhalten wir die Behauptung, dass die Potenzreihe f  (x) = nx n−1 =
(1 − x)2
f im Konvergenzbereich differenzierbar ist mit der Ableitung n=1
f  = g.  für x ∈ (−1, 1). Eine Multiplikation der Identität mit x
führt auf die Darstellung
Achtung: Beachten Sie, dass der konstante erste Term ∞
! x
einer Potenzreihe beim gliedweisen Ableiten zu null wird nx n = .
und daher etwa die Reihe zu f  erst bei k = 1 beginnt. Wenn (1 − x)2
n=1
568 15 Differenzialrechnung – die Linearisierung von Funktionen

Unter der Lupe: Beweis der Differenzierbarkeit von Potenzreihen


Um die Ableitung einer Potenzreihe zu zeigen, muss bewiesen werden, dass die Potenzreihen
 ∞   ∞ 
! !
k k−1
ak (x − x0 ) und k ak (x − x0 )
k=0 k=1

denselben Konvergenzradius besitzen und im Konvergenzbereich die zweite Reihe die Ableitung der ersten ist.

Zunächst lassen sich durch x̃ = x − x0 die Potenzreihen Für λ > 1 ist die Reihe absolut konvergent, und somit
auf den Entwicklungspunkt x0 = 0 transformieren. Da- ist (αk )k∈N eine Nullfolge. Insbesondere ist die Folge be-
her kann ohne die allgemeine Aussage einzuschränken im schränkt, d. h., es gibt eine Konstante c > 0 mit αk < c
Beweis von x0 = 0 ausgegangen werden. für alle k ∈ N.
Man beginnt mit den Konvergenzradien. Wenn der Grenz- Insgesamt folgt die Ungleichung (15.1). Das Majoranten-
wert limk→∞ |ak+1 |/|ak | existiert, folgt kriterium liefert Konvergenz der linken Partialsummen,
|ak+1 | (k + 1)|ak+1 | und wir haben gezeigt, dass auch r ≤ r  sein muss.
lim |x| = lim |x|.
k→∞ |ak | k→∞ k|ak | Für den zweiten Teil des Beweises müssen wir an einer
In diesem Fall führt schon das Quotientenkriterium auf Stelle x mit |x| < r den Differenzenquotienten zur Po-
dieselben Konvergenzradien. tenzreihe f betrachten, d. h., es ist eine Abschätzung von
) )
Leider existiert der Grenzwert der Quotienten nicht in je- )1 )
) (f (x + h) − f (x)) − g(x))
dem Fall. Es muss deswegen expliziter vorgegangen wer- )h )
den. Ausgangspunkt sind die beiden Potenzreihen f und gesucht, die belegt, dass im Grenzfall für h → 0 die
g mit Konvergenzradien r für f und r  für g. Es bietet sich Differenz null wird. Wir erlauben nur Störungen h mit
an, die Aussage aufzuspalten und getrennt zu zeigen, dass |x + h| < r, damit f (x + h) definiert ist. Also wählen
sowohl r ≤ r  als auch r ≥ r  ist. wir eine Schranke ε > 0 mit ε < r − |x| und betrachten
Betrachtet man die Partialsumme Sm (x) = m k
k=0 ak x , Werte mit |h| < ε.
so lässt sich diese mithilfe der Dreiecksungleichung, Ver-
Wir haben es wieder mit zwei Grenzprozessen zu tun, und
größern der Koeffizienten um den Faktor k und durch
müssen entsprechend vorsichtig argumentieren. Betrach-
Ausklammern von |x| durch die Terme der Potenzreihe
ten wir zunächst die Differenz der Partialsummen
g abschätzen, wie es in der ersten Ungleichung im Beweis ) )
)1 )
gezeigt ist. Das Majorantenkriterium liefert somit Konver- ) (Sm (x + h) − Sm (x)) − S  (x))
genz von (Sm ) für |x| < r  . Daher muss der Konvergenz- )h m )
radius von f größer sein, d. h., es gilt r  ≤ r. * +
mit den Summanden h1 (x + h)k − x k − kx k−1 . Es ist
Es bleibt r ≤ r  zu zeigen. Eine analoge Abschätzung naheliegend, den Term (x + h)k wie im Beweis mit der
der Partialsumme m k=1 k |ak | |x|
k−1 funktioniert nicht,
allgemeinen binomischen Formel umzuschreiben. Einge-
da k|ak | ≥ d|ak | für jede beliebige Konstante d und k > d setzt führt uns dies auf die Abschätzung (15.2). Beachten
gilt. Um das schnellere Wachsen der Koeffizienten k|ak | Sie, dass es sich in der letzten Zeile wirklich um eine Ab-
gegenüber den Koeffizienten |ak | in den Partialsummen schätzung handelt, da die Terme für k = 0 und k = 1
von f zu kontrollieren, bleiben nur die Potenzen |x|k . addiert wurden.
Die Idee besteht nun darin, statt x einen etwas größeren Diese Rechnung führt auf die entscheidende Ungleichung
Wert im Konvergenzbereich zu betrachten, der das lineare ) )
)1 )
Wachstum des Faktors k in den Koeffizienten der Ablei- ) (Sm (x + h) − Sm (x)) − S  (x)) ≤ γ |h|,
)h m )
tung kompensiert. Daher wählen wir λ> 1 mit λ|x| < r,
zum Beispiel, wie im Text, λ = 21 1 + r/|x| ; denn wobei die Zahl γ unabhängig(!) von m ist.
λ|x| = 21 (|x| + r) < r für |x| < r. Mit dieser Wahl
Hier steckt sie wieder, die Gleichmäßigkeit, die wir benö-
von λ konvergiert die Potenzreihe zu f auch für λx und
tigen beim Vertauschen von Grenzprozessen, wie wir es
wir erhalten Summanden der Form ak λk x k .
schon im Kapitel 11 auf Seite 387 gesehen haben. Für den
Es ist noch erforderlich, eine Konstante c > 0 zu finden Beweis ist es wesentlich, dass wir eine solche Abschät-
mit k ≤ cλk für alle k ∈ N, um die Partialsummen von g zung gegenüber h → 0 für alle m ∈ N, also unabhängig
abzuschätzen. Die Existenz einer solchen Konstante lässt vom aktuellen Wert von m, zeigen. So können wir letzt-
sich begründen, indem wir die Folge mit αk = λkk be- endlich auf beiden Seiten der Ungleichung zunächst den
trachten. Die Folge ist eine Nullfolge, was sich etwa
 aus Grenzwert m → ∞ und dann h → 0 betrachten, um den

dem Quotientenkriterium für die Reihe k=0 k ergibt.
α Beweis abzuschließen.
15.3 Der Mittelwertsatz 569

Wir betrachten noch die Potenzreihe globales Maximum


!∞ f (x)
(2x + 1)n
f (x) = .
n
n=1
Um den Konvergenzradius und den Entwicklungspunkt lokales Maximum
zu bestimmen, schreiben wir die Reihe um zu
!∞ n ' ( lokales Maximum
2 1 n
f (x) = x+ . a b x
n 2
n=1
Es ist x0 = −1/2 der Entwicklungspunkt, und das Quoti- lokales Minimum
entenkriterium liefert den Konvergenzradius R = 21 . Die
Potenzreihe ist auf dem Intervall (−1, 0) konvergent und
globales Minimum
die Funktion f : (−1, 0) → R ist unendlich oft differen-
zierbar. Die erste Ableitungsfunktion ist gegeben durch Abbildung 15.13 Verschiedene Typen von Maxima und Minima einer Funktion
!∞ n ' ( ∞ ' ( auf dem abgeschlossenen Intervall [a, b].
2 1 n−1 ! n 1 n−1
f  (x) = n x+ = 2 x+ .
n 2 2
n=1 n=1
Die Ableitung ist null an Extremalstellen
Nun beobachten wir, dass für x = −1 die Potenzreihe
Wenn eine Funktion f : [a, b] ⊆ R → R in x̂ ∈ (a, b)
zu f nach dem Leibniz-Kriterium konvergiert. Aber die
ein lokales Maximum oder Minimum hat und in x̂ dif-
Reihenglieder in der Ableitung an der Stelle x = −1 sind
ferenzierbar ist, gilt
an = 2(−1)n−1 für n = 1, 2, . . . Dies ist keine Nullfolge,
und somit ist die Reihe nicht konvergent. f  (x̂) = 0 .
Wir sehen, dass das Konvergenzverhalten von Potenzrei-
hen und ihren Ableitungen auf dem Rand des Konvergenz-
intervalls unterschiedlich sein kann. 
Achtung: Liegt eine Extremalstelle x̂ am Rand des Inter-
valls [a, b], d. h., x̂ = a oder x̂ = b, so muss die Ableitung
nicht null sein (Abb. 15.13).
15.3 Der Mittelwertsatz
Beweis: Wir nehmen an, dass in x̂ ∈ (a, b) ein lokales
Auf Seite 331 haben wir gesehen, dass jede stetige Funktion Maximum vorliegt. Dann können wir einen Wert ε > 0 so
auf kompakten Mengen Minima und Maxima besitzt. In vie- wählen, dass f (x̂ + h) ≤ f (x̂) gilt für alle |h| ≤ ε. Für jeden
len Situationen lassen sich kritische Stellen, an denen solche positiven Wert 0 < h ≤ ε ist nun
Extrema liegen, mithilfe der Ableitung bestimmen. f (x̂ + h) − f (x̂)
≤ 0.
Zur Erinnerung: Wir sprechen von einer lokalen Maximal- h
stelle x̂ ∈ [a, b] einer Funktion f : [a, b] → R, falls es eine Lässt man h gegen 0 gehen, so konvergiert der Differenzen-
Umgebung I = (x̂ − ε, x̂ + ε) ∩ [a, b] mit ε > 0 um x̂ gibt, quotient gegen f  (x̂) und aus der Ungleichung folgt auch im
sodass Grenzfall f  (x̂) ≤ 0.
f (x) ≤ f (x̂)
Für negative Werte −ε ≤ h < 0 ist andererseits
für alle x ∈ I gilt. Analog werden lokale Minimalstellen de-
finiert. Wenn sogar f (x) ≤ f (x̂) bzw. f (x) ≥ f (x̂) für alle f (x̂ + h) − f (x̂)
≥ 0,
x ∈ [a, b] gilt, so spricht man von einer globalen Maximal- h
bzw. Minimalstelle. da in x̂ ein Maximum vorliegt. Also gilt mit h → 0 in die-
Eine Stelle x̂ heißt lokale oder globale Extremalstelle, wenn sem Fall f  (x̂) ≥ 0. Beide Ungleichungen zusammen liefern
x̂ Minimal- oder Maximalstelle ist. Zur Unterscheidung be- f  (x̂) = 0.
zeichnet man den Maximal- bzw. Minimalwert f (x̂) an einer Im Fall, dass an der Stelle x̂ eine lokale Minimalstelle ist,
solchen Stelle als globales oder lokales Maximum bzw. zeigt man die Aussage entsprechend. 
Minimum der Funktion.

Beispiel Die Minimalstelle der Funktion f : R>0 → R mit


Ableitung gleich null ist notwendige f (x) = (x + x1 )2 lässt sich finden, indem wir die Ableitung
Bedingung für innere Extrema ' (' (
1 1
f  (x) = 2 x + 1− 2
x x
Mit dem Differenzenquotienten an einer Extremalstelle sieht
man, dass die Ableitung einer differenzierbaren Funktion an berechnen und beobachten, dass diese auf R>0 nur eine Null-
einer Extremalstelle gleich null sein muss. stelle bei x = 1 besitzt.
570 15 Differenzialrechnung – die Linearisierung von Funktionen

Dies zeigt aber noch nicht, dass bei x = 1 ein Minimum Auch dies ist eine reine Existenzaussage, ohne Auskunft zu
liegt. In dem Beispiel lässt sich aber argumentieren, dass es geben, wo im Intervall [a, b] die Zwischenstelle z liegt. An-
nur eine Stelle mit f  (x) = 0 gibt und f (x) → ∞ für x → 0 schaulich besagt der Satz, dass die Sekante durch die Punkte
und für x → ∞ gilt. Deswegen muss ein globales Minimum (a, f (a)) und (b, f (b)) eine Steigung besitzt, die der Stei-
an der Stelle vorliegen.  gung einer Tangenten am Graphen von f an mindestens einer
Stelle zwischen a und b entspricht (Abb. 15.14).
Eine Aussage zur Existenz von Nullstellen der Ableitungs-
funktion lässt sich bei differenzierbaren Funktionen ähnlich f (x)
wie beim Zwischenwertsatz (siehe Seite 334) machen. Mit
dieser nach dem Mathematiker Michel Rolle (1652–1719)
benannten Aussage starten wir, um die Eigenschaften diffe-
f (b)
renzierbarer Funktionen genauer zu beleuchten.

Der Satz von Rolle


Ist f : [a, b] ⊆ R → R eine stetige Funktion, die auf (a, b)
differenzierbar ist, dann folgt aus f (a) = f (b), dass es eine
Stelle x̂ ∈ (a, b) gibt mit f  (x̂) = 0. f (a)

a x0 b x
Beweis: Ist die Funktion f auf [a, b] konstant, so sind die
Differenzenquotienten stets null und somit auch die Ablei-
tung von f . Man kann für x̂ jeden beliebigen Punkt in (a, b) Abbildung 15.14 Der Mittelwertsatz besagt, dass die Steigung der Sekante
wählen. zwischen zwei Punkten auf dem Graphen einer differenzierbaren Funktion auch
Steigung einer Tangente ist.
Betrachten wir den Fall, dass f nicht konstant ist. Wir be-
zeichnen mit x1 ∈ [a, b] eine globale Maximalstelle und mit
x2 ∈ [a, b] eine Minimalstelle. Beide existieren, da f stetig Beweis: Der Mittelwertsatz lässt sich zeigen, indem wir
und das Intervall [a, b] kompakt ist (siehe Seite 330). Au- den Satz von Rolle auf die stetige Funktion  : [a, b] → R
ßerdem muss f (x2 ) < f (x1 ) sein, da die Funktion nicht mit
konstant ist. Somit liegt mindestens eine der beiden Stellen f (b) − f (a)
(x) = f (x) − (x − a)
x1 oder x2 im Innern des Intervalls. Aus der notwendigen b−a
Bedingung für Extremalstellen folgt die Behauptung für die-
anwenden. Denn es gilt (a) = f (a) = (b). Daher gibt
sen der beiden Punkte x̂ = x1 bzw. x̂ = x2 im Intervall
es einen Wert z ∈ (a, b) mit
(a, b). 

f (b) − f (a)
0 =  (z) = f  (z) − .
b−a
?
Skizzieren Sie die Aussage des Satzes von Rolle. Dies ist gerade die Behauptung des Mittelwertsatzes. 

Funktionen mit gleichen Ableitungen


Der Mittelwertsatz, im Zentrum der Analysis
unterscheiden sich höchstens um eine
Konstante
Der Satz von Rolle liefert uns eine Existenzaussage für kriti-
sche Stellen, also Stellen x̂ ∈ (a, b) mit f  (x̂) = 0. Beachten
Viele Eigenschaften differenzierbarer Funktionen stützen
Sie, dass dabei nichts über die Anzahl oder über die Lage die-
sich auf den Mittelwertsatz. Exemplarisch sprechen wir
ser Stellen ausgesagt wird. Die Bedeutung des Satzes kommt
einige Folgerungen aus dem Mittelwertsatz in diesem Ka-
aber voll zum Tragen durch eine Folgerung, die zentral ist für
pitel an, um unter anderem besser einschätzen zu können,
die gesamte Analysis.
wo der Mittelwertsatz eine entscheidende Rolle spielt.
Es lässt sich etwa zeigen, dass sich Funktionen mit gleicher
Der Mittelwertsatz
Ableitungsfunktion höchstens um eine Konstante unterschei-
Ist f : [a, b] ⊆ R → R eine stetige Funktion, die auf den.
(a, b) differenzierbar ist, dann gibt es eine Zwischen-
stelle z ∈ (a, b) mit
Folgerung

f (b) − f (a) = f (z) (b − a) . Eine differenzierbare Funktion f : (a, b) → R mit
f  (x) = 0 für alle x ∈ (a, b) ist konstant.
15.3 Der Mittelwertsatz 571

Beispiel: Anwendungen des Mittelwertsatzes


Viele Aussagen der Analysis einer reellen Variablen stützen sich auf den Mittelwertsatz. Wie dieser Satz in Beweisen zum Einsatz
kommt, lässt sich am Beispiel der Lipschitz-Stetigkeit und beim Beweis von Differenzierbarkeit an Nahtstellen illustrieren.

Problemanalyse und Strategie: In beiden Fällen wird die Differenz von Funktionswerten durch den Mittelwertsatz
beschrieben, um Eigenschaften der Ableitung wie Beschränktheit oder Stetigkeit zu nutzen.

Lösung: Wir setzen voraus, dass auf einem offenen Intervall I eine
Auf Seite 321 wurde der Begriff der lipschitz-stetigen Funktion f : I → R gegeben ist, die für alle x ∈ I \{x̂}
Funktion eingeführt. Bei Funktionen f ∈ C 1 ([a, b]) folgt differenzierbar ist mit Ausnahme einer Stelle x̂ ∈ I . Wenn
diese Eigenschaft direkt aus dem Mittelwertsatz durch die Ableitung f  : I \ {x̂} → R stetig fortsetzbar ist in x̂,
dann ist f auch stetig differenzierbar in x̂.
|f (x)−f (y)| = |f  (z)(x −y)| ≤ max (|f  (z)|) |x −y| .
z∈[a,b]
Zum Beweis betrachten wir den Differenzenquotienten
Wir sehen aber auch mit dem Mittelwertsatz, dass die und wenden den Mittelwertsatz an, der besagt, dass es
Funktionen f : R≥0 → R mit f (x) = x α und α ∈ (0, 1), ein z zwischen x und x̂ gibt mit
also etwa die Wurzelfunktion, in x = 0 nicht lipschitz-
stetig sind. Denn da die Funktionen stetig und auf R>0 f (x) − f (x̂)
= f  (z) .
differenzierbar sind, können wir den Mittelwertsatz an- x − x̂
wenden und erhalten für x > 0:
Wir schreiben z = z(x), um deutlich zu machen, dass z
f (x) − f (0) = f  (z)x = αzα−1 x von x abhängt. Wenn x → x̂ konvergiert, so strebt auch
mit z ∈ (0, x). Der Term zα−1 ist unbeschränkt für die Zwischenstelle z(x) gegen x̂. Da f  stetig fortsetzbar
x → 0. Es lässt sich somit auf keinem Intervall [0, b] im Punkt x̂ ist, existiert der Grenzwert, und es gilt:
für f : [0, b] → R eine Lipschitz-Konstante angeben.
f (x) − f (x̂)
Eine andere Art der Anwendung des Mittelwertsatzes lim = lim f  (z(x)) = f  (x̂) .
x→x̂ x − x̂ x→x̂
steckt hinter einem nützlichen hinreichenden Kriterium
für Differenzierbarkeit von stückweise zusammengesetz- Damit ist die Differenzierbarkeit von f in x̂ gezeigt, und
ten Funktionen an „Nahtstellen“, wie etwa f : R → R mit der Grenzwert des Differenzenquotient stimmt mit der
f (x) = x 2 für x ≥ 0 und f (x) = 0 für x < 0. Fortsetzung f  (x̂) der Ableitungsfunktion überein.

Kommentar: Beachten Sie, dass die letzte Aussage auch in a und b für f ∈ C 1 ([a, b]) gilt, wenn wir den jeweiligen
einseitigen Differenzenquotienten betrachten. Eine Aussage, die wir am Ende von Abschnitt 15.1 schon erwähnt haben.
Beide Anwendungen des Mittelwertsatzes, einmal, um Abschätzungen zu gewinnen, zum anderen, um Grenzwerte zu
untersuchen, wird man häufig in der Analysis finden.

Sind f, g : (a, b) → R zwei differenzierbare Funktionen Beispiel


mit f  = g  auf (a, b), so gibt es eine Konstante c ∈ R
Aus dem Beispiel auf Seite 565 kennen wir bereits die
mit f (x) = g(x) + c für alle x ∈ (a, b).
Ableitungsfunktion
Beweis: Ist a ≤ x1 < x2 ≤ b, so liefert die Anwendung 1
des Mittelwertsatzes im Intervall [x1 , x2 ] die Existenz von arctan (x) = .
1 + x2
z ∈ (x1 , x2 ) mit
Mit der geometrischen Reihe folgt die Potenzreihe
f (x2 ) − f (x1 ) = f  (z)(x2 − x1 ).
! ∞
Da aber die Ableitung f  (z) = 0 ist, folgt: 1
arctan (x) = = (−x 2 )n
f (x2 ) − f (x1 ) = 0 1+x 2
n=0

bzw. f (x1 ) = f (x2 ). für |x| < 1.


Für die zweite Folgerung wenden wir die erste Aussage ein- Andererseits rechnen wir nach, dass die Funktion
fach auf die Differenz f − g an.  g : (−1, 1) → R, die durch die Potenzreihe
Die Folgerungen zusammen mit der Differenzierbarkeit von ∞
! (−1)n 2n+1
Potenzreihen lassen sich nutzen, um Potenzreihen von Funk- g(x) = x
(2n + 1)
tionen zu bestimmen. n=0
572 15 Differenzialrechnung – die Linearisierung von Funktionen

gegeben ist, im Konvergenzintervall dieselbe Ableitung Mit dem Newton-Verfahren lassen sich

! Nullstellen approximieren
g  (x) = (−1)n x 2n
n=0 Wir werden dem Mittelwertsatz als beweistechnisches Werk-
besitzt. Somit ist mit obiger Feststellung arctan(x) = zeug immer wieder begegnen, zum Beispiel beim Abschätzen
g(x) + c für |x| < 1 mit einer Konstanten c ∈ R. Aus der Konvergenzordnung numerischer Verfahren. Ein solches
Verfahren ist das Newton-Verfahren zur Lösung von nicht-
0 = arctan(0) = g(0) + c = 0 + c
linearen Gleichungen der Form f (x) = 0. Nur in speziel-
folgt c = 0, und wir erhalten die Potenzreihendarstellung len Situationen, etwa bei affin-linearen oder quadratischen

! Gleichungen, lassen sich Lösungen in geschlossener Form
(−1)n 2n+1
arctan(x) = x angeben. In den meisten Fällen sind wir auf numerische
(2n + 1)
n=0 Approximationen angewiesen, etwa um reelle Lösungen zu
für |x| < 1. cos x − x = 0 zu bestimmen. Das notwendige Kriterium
Diese Reihendarstellung lässt sich zum Beispiel nutzen, f  (x) = 0 zur Bestimmung von Extremalstellen führt häufig
um eine Dezimaldarstellung der Zahl π zu berechnen, in- auf solche Gleichungen, deren explizite Lösung nur durch
dem die Auswertung von ein Näherungsverfahren bestimmt werden kann.
! (−1)n ∞ Der Idee der Linearisierung einer Funktion kommt dabei eine
π
= arctan(1) = entscheidende Bedeutung zu und führt unter anderem auf
4 (2n + 1)
n=0 das Newton-Verfahren, die am häufigsten genutzte Methode
1 1 1 1 zum Lösen nichtlinearer Gleichungen.
= 1 − + − + − ...
3 5 7 9
Suchen wir eine Nullstelle x̂ ∈ (a, b) einer differenzierbaren
bei hinreichender Genauigkeit abgebrochen wird. Funktion f : (a, b) → R, so startet die Methode zunächst
Gesucht ist eine Potenzreihendarstellung für den Loga- mit einer Stelle x0 ∈ (a, b), die man vorab wählen bzw.
rithmus, f (x) = ln x, x > 0. Mit der Ableitung errechnen muss. Dort betrachtet man die Linearisierung, d. h.
1 1
f  (x) =
= f (x) ≈ g(x) = f (x0 ) + f  (x0 )(x − x0 ) .
x 1 − (1 − x)
erkennen wir, dass zumindest für die Ableitung wieder Dies ist die Tangente an f im Punkt (x0 , f (x0 )) (siehe Abbil-
eine geometrische Reihe genutzt werden kann. Wir erhal- dung 15.15). Um eine Approximation an die gesuchte Null-
ten auf diesem Weg die Potenzreihendarstellung stelle zu bekommen, verwenden wir die Nullstelle dieser

! Tangente, d. h., wir bestimmen eine neue Stelle x1 aus der
f  (x) = (−1)n (x − 1)n linearen Gleichung
n=0
0 = f (x0 ) + f  (x0 )(x1 − x0 ) .
für |x − 1| < 1 um den Entwicklungspunkt x0 = 1.
Andererseits lässt sich leicht nachrechnen, dass die Po- Wenn die Ableitung f  (x0 ) von null verschieden ist, folgt
tenzreihe x1 = x0 − f (x0 )/f  (x0 ) .
!∞
(−1)n Aus der Abbildung wird deutlich, dass zumindest in der ge-
g(x) = − (x − 1)n
n zeigten Situation x1 näher an der Nullstelle liegt als x0 . Das
n=1
Newton-Verfahren wiederholt diesen Vorgang, und konstru-
in ihrem Konvergenzintervall (0, 2) auch die Ableitung
iert so eine rekursive Folge

! ∞
!
g  (x) = − (−1)n (x − 1)n−1 = (−1)n (x − 1)n f (xn )
xn+1 = xn − , n ∈ N.
n=1 n=0 f  (xn )
besitzt. Wir können in diesem Fall schließen, dass Nehmen wir an, dass die Folge (xn ) gegen einen Grenz-
ln(x) = g(x) + c wert x̂ ∈ (a, b) konvergiert und xn ∈ (a, b) für alle
n ∈ N gilt, so folgt im Grenzfall aus der Rekursionsglei-
mit einer Konstanten c ∈ R im Konvergenzintervall (0, 2)
chung f (x̂)/f  (x̂) = 0, d. h., der Grenzwert x̂ ist Nullstelle
gilt. Berechnen wir f (1) = ln(1) = 0 und berücksich-
von f .
tigen, dass die Potenzreihe g(1) = 0 erfüllt, so folgt die
Identität Ein numerisches Verfahren nennt man Iterationsverfahren,
!∞ wenn, wie beim Newton-Verfahren, rekursiv eine Folge be-
(−1)n
ln(x) = − (x − 1)n für |x − 1| < 1 . rechnet wird, die sich einer Lösung nähert.
n
n=1
In diesen Beispielen haben wir aus Kenntnissen zur Ablei- Folgerung
tung einer Funktion zurück auf die Funktion geschlossen, Sind f : (a, b) → R zweimal stetig differenzierbar, f (x̂) = 0
im Vorgriff auf die Integration im folgenden Kapitel.  für ein x̂ ∈ (a, b) und f  (x̂) = 0. Dann gibt es ein δ > 0,
15.3 Der Mittelwertsatz 573

y einmal nutzen und zwar für die Differenz f  (xn ) − f  (z1 ) =


f  (z2 )(xn − z1 ) mit einer weiteren Zwischenstelle z2 . Auf
dem kompakten Intervall ist die stetige Funktionen f  be-
schränkt, d. h., es gibt eine Konstante α > 0 mit |f  (x)| ≤ α
für alle x ∈ [x̂ − δ, x̂ + δ]. Schätzen wir noch die Differenz
|xn − z1 | ≤ |xn − x̂| ab, so folgt die quadratische Abschät-
zung:
)  )
) f (z2 ) )
|xn+1 − x̂| ≤ ))  ) |xn − x̂|2 ≤ α |xn − x̂|2 .
f (xn ) ) c̃

Mit c = α/c̃, einem Wert δ > 0 mit


1
δ < min{1, , δ̃}
c
und einem Startwert x0 ∈ (x̂ − δ, x̂ + δ) folgt induktiv, dass
alle xn ∈ (x̂ − δ, x̂ + δ) sind und
x2 x1 x0 x
|xn − x̂| ≤ c|xn−1 − x̂|2
≤ · · · ≤ cn |x0 − x̂|2n ≤ δ n
Abbildung 15.15 Bereits die ersten beiden Iterationsschritte des Newton-
Verfahrens verdeutlichen die Näherung an eine Nullstelle für alle n ∈ N gilt. Insbesondere ist jeder Newton-Schritt
wohldefiniert, und es konvergiert |xn − x̂| → 0 für n → ∞.
sodass das Newton-Verfahren für alle x0 ∈ (x̂ − δ, x̂ + δ) 

⊆ (a, b) gegen x̂ konvergiert, und es gilt die Fehlerabschät-


zung: Kommentar: Die Fehlerabschätzung bezeichnet man als
|xn+1 − x̂| ≤ c|xn − x̂|2 für alle n ∈ N quadratische Konvergenzordnung, da sich die Differenz
zwischen Approximation und wahrer Lösung in jedem Ite-
mit einer Konstante c > 0. rationsschritt quadratisch mit |xn − x̂|2 verkleinert. An der
Abschätzung |xn − x̂| ≤ δ n sehen wir, dass es sich um eine
Beweis: Zunächst beachten wir, dass es wegen der Ste- relativ schnelle Konvergenz handelt. Ist etwa δ = 1/10, so
tigkeit von f  ein Intervall um die Stelle x̂ gibt, auf dem f  gewinnen wir in jedem Iterationsschritt eine Dezimalstelle
nicht null ist; denn es gilt: an Genauigkeit.
' (
f  (x) − f  (x̂)
f  (x) = f  (x̂) 1 +
f  (x̂) Zwei Beispiele zum Newton-Verfahren, das ausführlich
für n-dimensionale Probleme im Rahmen der Numerischen
und f  (x̂) = 0. Also können wir δ̃ > 0 und eine Konstante Mathematik untersucht wird, fügen wir hier noch an.
c̃ > 0 angeben mit |f  (x)| ≥ c̃ > 0 für x ∈ [x̂ − δ̃, x̂ + δ̃]. Im
Intervall [x̂ − δ, x̂ + δ] ist somit ein Newton-Iterationsschritt Beispiel
f (xn ) Das bekannte Heron-Verfahren (siehe Seite 296) zur Be-
xn+1 = xn −  √
f (xn ) rechnung der Wurzel a einer positiven Zahl a ∈ R ist
eine Anwendung des Newton-Verfahrens auf die Funktion
wohldefiniert. f : R>0 → R mit f (x) = x 2 − a, denn mit der Ableitung
Betrachten wir die Differenz zwischen der (n + 1)-ten Ite- f  (x) = 2x folgt der Newton-Iterationsschritt
rierten xn+1 = xn − f (xn )/f  (xn ) und xn . Anwenden des ' (
xn2 − a 1 a
Mittelwertsatzes führt auf xn+1 = xn − = xn + .
=0
2xn 2 xn
)  )
) f (x ) −f (x̂) ) Da diese Methode zur Approximation von Quadratwur-
|xn+1 − x̂| = ))xn − )
n

− x̂ ) zeln schon im antiken Babylon bekannt war, spricht man
f (xn )
) '  () auch vom babylonischen Wurzelziehen.
) f (z1 ) ))
= ))(xn − x̂) 1 −  Als zweites Beispiel suchen wir eine Lösung der Glei-
f (xn ) )
) '  () chung
)
) f (xn ) − f  (z1 ) )) cos x = x 2 .
= )(xn − x̂) )
f  (xn )
Dazu wenden wir das Newton-Verfahren auf die Funktion
mit einer Zwischenstelle z1 zwischen xn und x̂. Da f zweimal f mit f (x) = x 2 − cos x an. Starten wir mit dem Wert
stetig differenzierbar ist, können wir den Mittelwertsatz noch x0 = 1 oder x0 = −0.1, so folgen die Iterationsschritte
574 15 Differenzialrechnung – die Linearisierung von Funktionen

Ausdrücken der Form f (x)/g(x) zu berechnen. Die Aus-


n xn xn
sage ist benannt nach Guillaume François Antoine Marquis
0 1.000 000 00 −0.100 000 00 de L’Hospital (1661–1704), der sie im ersten Lehrbuch zur
1 0.838 218 40 −3.385 171 40 Differenzialrechnung 1696 veröffentlichte.
2 0.824 241 87 −1.481 426 36
3 0.824 132 32 −0.949 613 66 Die L’Hospital’sche Regel
4 0.824 132 31 −0.831 722 98
Es seien f, g : I → R differenzierbare Funktionen auf
5 0.824 132 31 −0.824 164 39
einem Intervall I = (a, b) ⊆ R mit
6 0.824 132 31 −0.824 132 31
lim f (x) = lim g(x) = 0
x→a x→a
Beachten Sie, dass das Verfahren beim zweiten Startwert x>a x>a

gegen eine andere Nullstelle konvergiert. Die schnelle und g(x) = 0, g  (x) = 0 für x ∈ I . Wenn der Grenz-
Konvergenz ist in der Tabelle deutlich zu sehen. Beim wert lim f  (x)/g  (x) existiert, dann existiert auch der
x→a
Startwert x0 = −0.1 benötigt das Verfahren einige x>a
Schritte mehr als beim Startwert x0 = 1.0. Zum einen Grenzwert lim f (x)/g(x), und es gilt:
x→a
x>a
ist dieser Startwert weiter entfernt von der Nullstelle und
zum anderen näher an der Stelle x = 0, in der die Ablei- f (x) f  (x)
lim = lim  .
tung verschwindet. Der Startwert x0 = 0 ist offensichtlich x→a
x>a g(x) x>a g (x)
x→a

nicht zulässig, da f  (0) = 0 gilt.


Die Aussage gilt entsprechend für linkseitige Grenz-
Dies illustriert, dass die Wahl des Startwerts x0 immens
werte bei b und in den Fällen I = (a, ∞) für x → ∞
wichtig für den Erfolg des Verfahrens ist. Auch die Voraus-
oder I = (−∞, b) für x → −∞.
setzung, dass f zweimal stetig differenzierbar ist, spielt
eine Rolle. Wie sich die Regularität der betrachteten Funk-
tion auf die Konvergenz und die Konvergenzgeschwin- Beweis: Mit den stetigen Fortsetzungen f (a) = g(a) = 0
digkeit des Verfahrens auswirkt, untersuchen wir in einer lässt sich der verallgemeinerte Mittelwertsatz anwenden auf
Übungsaufgabe zu diesem Abschnitt. 
f (x) f (x) − f (x0 ) f  (z)
= = 
g(x) g(x) − g(x0 ) g (z)
Der Mittelwertsatz lässt sich für Quotienten
mit einer Zwischenstelle z ∈ (a, x). Für eine Folge (xn ) in I ,
verallgemeinern
die gegen a konvergiert, streben auch die zugehörigen Zwi-
schenstellen zn mit a < zn < xn gegen a. Da der Grenzwert
In manchen Situationen ist eine allgemeinere Fassung des
auf der rechten Seite existiert, folgt somit auch die Existenz
Mittelwertsatzes hilfreich, die den Quotienten zweier Aus-
des linken Grenzwerts.
drücke berücksichtigt.
Analog lässt sich der Fall einer rechtsseitigen Umgebung von
Verallgemeinerter Mittelwertsatz b zeigen. In den asymptotischen Fällen x → ∞ oder x → −∞
Es seien f, g : [a, b] ⊆ R → R stetige Funktionen, die in führt eine Variablentransformation y = x1 auf eine rechtssei-
(a, b) differenzierbar sind. Gilt darüber hinaus, dass g  (x) = tige bzw. linksseitige Umgebung der Null. Der erste Teil des
0 für alle x ∈ (a, b). Dann gibt es eine Zwischenstelle z ∈ Satzes beweist auch in diesen Fällen die Konvergenz, wenn
(a, b) mit wir die einseitigen Grenzwerte von der Form lim h( y1 ) für
f (b) − f (a) f  (z) y→0
=  . y=0
g(b) − g(a) g (z) die Funktionen f, g, f/g oder f  /g  betrachten. 

Beweis: Der Satz von Rolle impliziert, dass g(a)  = g(b)


ist, sodass der Quotient existiert. Um die Aussage zu zeigen, Selbstverständlich können wir den Satz auch für Grenzwerte
lässt sich der Mittelwertsatz nicht direkt auf f und auf g ge- betrachten, d. h., rechts- und linksseitiger Grenzwert existie-
trennt anwenden, da sich im Allgemeinen nur zwei verschie- ren und sind gleich. Die Regeln bieten oft elegante Möglich-
dene Zwischenstellen ergeben würden. Gehen wir den Be- keiten, Grenzwerte bei rationalen Ausdrücken zu bestimmen.
weis des Mittelwertsatzes auf Seite 570 aber nochmal durch
Beispiel
und ersetzen dabei die Funktion  durch
Wir berechnen mit der Regel von L’Hospital den Grenz-
f (b) − f (a) * +
wert
(x) = f (x) − g(x) − g(a)
g(b) − g(a)
cos x − 1 − sin x
auf a ≤ x ≤ b, so folgt die Behauptung. 
lim = lim = 0.
x→0 x x→0 1

Als Konsequenz aus dem verallgemeinerten Mittelwertsatz Oft ist es zunächst nötig den Ausdruck umzuformen,
betrachten wir eine Möglichkeit, Grenzwerte von rationalen damit die L’Hospital’sche Regel genutzt werden kann.
15.3 Der Mittelwertsatz 575

Außerdem ist häufig die Regel mehrmals anzuwenden, Um auf entsprechende Differenzen von Funktionswerten zu
um Erfolg zu haben. kommen, schreiben wir
Es gilt zum Beispiel:
f (x) f (x) − f (b̃) f (x) g(x) − g(b̃)
' ( ' ( =
1 1 sin x − x g(x) g(x) − g(b̃) f (x) − f (b̃) g(x)
lim − = lim  
x→0 x sin x x→0 x sin x f  (z) 1 g(b̃)
cos x − 1 =  1− ,
= lim g (z) 1 − f (b̃) g(x)
x→0 sin x + x cos x f (x)
− sin x
= lim = 0.  wobei nach dem Mittelwertsatz die Zwischenstelle z mit
x→0 2 cos x − x sin x
x < z < b̃ von den Punkten x, b̃ ∈ (a, b) abhängt. Bei
der Umformung müssen wir gewährleisten, dass alle Nen-
ner von null verschieden sind. Dies können wir aufgrund der
? Unbeschränktheit von f und g sicherstellen, wenn x = b̃
Bei welchem der folgenden beiden Ausdrücke können wir
hinreichend nah bei a liegt.
die L’Hospital’sche Regel anwenden, um einen Grenzwert
x → 0 zu bestimmen, Betrachten wir nun die drei Faktoren. Die letzten beiden stre-
x x ben gegen 1 für x → a und der erste Quotient gegen γ , wenn
sin x
und
cos x
? z → a bzw. b̃ → a. Dies lässt sich folgendermaßen ausnut-
zen:
Es sei ε > 0 vorgegeben. Dann gibt es b̃ ∈ (a, b), sodass
)  )
) f (z) )
) )
Bei unbeschränkten Funktionen lässt sich eine ) g  (z) − γ ) ≤ ε
Variante der L’Hospital’sche Regel nutzen
für alle z ∈ (a, b) mit |z − a| ≤ |b̃ − a|, da dieser Quotient
Neben der oben angegebene Regel von L’Hospital gibt es eine konvergiert. Wir halten den Wert b̃ fest. Weiterhin gibt es
zweite nützliche Variante, die aber aufwendiger zu zeigen ist. einen Wert δ > 0, sodass δ < |b̃ − a| ist und
) )
) g(b̃) )
) 1 − g(x) )
L’Hospital’sche Regel (zweiter Teil) ) − 1 )≤ε
) )
)1 − f ( b̃) )
Sind f, g : I = (a, b) → R differenzierbare Funktionen f (x)
1 1
mit lim |f (x)| = 0 und lim |g(x)| = 0, dann ist
x→a x→a für alle x ∈ (a, a + δ) gilt. Insgesamt erhalten wir mit der
obigen Gleichung und der Dreiecksungleichung die Abschät-
f (x) f  (x) zung
lim = lim  ,
x→a
x>a g(x) x>a g (x)
x→a
) )
) ) )  )) g(b̃ )
) f (x) ) ) f (z) ) ) 1 − g(x) ) )
) ) ) )) )
) g(x) − γ ) ≤ ) g  (z) − γ ) )
falls der Grenzwert auf der rechten Seite existiert.
)
Analog, wie bei den vorherigen L’Hospitalschen Regeln ) 1 − f (b̃) )
f (x)
gilt auch diese Variante für linkseitige Grenzwerte bei ) )
) g(b̃) )
b und in den Fällen I = (a, ∞) für x → ∞ oder I = ) 1 − g(x) )
+ |γ | )) − 1))
(−∞, b) für x → −∞. ) (1 − f (b̃) ) )
f (x)
≤ ε (1 + ε) + |γ | ε
Achtung: Es handelt sich bei der Regel von l’Hospital um
eine hinreichende Bedingung für die Existenz des Grenz- für alle x ∈ (a, b) mit |x − a| ≤ δ. Dies zeigt die Existenz
werts. Die Bedingung ist nicht notwendig, wie es am Beispiel und den Wert von lim f (x)/g(x) = γ . 
x→a
limx→∞ sin xx+x = 1 zu sehen ist. x>a

Bei vielen Modellen sind gerade die Grenzfälle interessant,


Beweis: Benennen wir den Grenzwert mit um zu sehen, inwieweit eine Beschreibung konsistent ist ge-
genüber Spezialfällen. Die L’Hospital’sche Regel kann dazu
f  (x) nützlich sein, wie das folgende Beispiel zeigt.
γ = lim ,
x→a
x>a g  (x)
Beispiel Fällt ein Körper mit Masse m = 1 unter Einfluss
so ist zu zeigen, dass der Quotient f (x)/g(x) gegen γ konver- der Schwerkraft, so wird die turbulente Reibung des Medi-
giert. Einen Zusammenhang zwischen den beiden Quotienten ums durch eine Kraft Fr = μv 2 (t) in Abhängigkeit der mo-
bekommen wir durch den verallgemeinerten Mittelwertsatz. mentanen Geschwindigkeit modelliert. Dieses Modell wird
576 15 Differenzialrechnung – die Linearisierung von Funktionen

Beispiel: Die L’Hospital’sche Regel


Die Regel von de L’Hospital ist häufig anwendbar, auch wenn zunächst der Ausdruck, dessen Limes gesucht ist, nicht als Bruch
vorliegt. Nach entsprechenden Umformungen lassen sich so etwa die Grenzwerte
' ( 
1 1 x t
lim 2 1 − 2
, lim x x und lim 1 + (mit x ∈ R)
s→0 s cos s x→0 t→∞ t

bestimmen.
Problemanalyse und Strategie: Zunächst müssen Darstellungen gefunden werden, die rationale Terme enthalten,
die im Grenzfall auf unbestimmte Ausdrücke der Form „ 00 “ oder „ ∞
∞ “ führen. Dann kann die entsprechende Regel von
L’Hospital angewandt werden.

Lösung: mit dem zweiten Teil der Regel von L’Hospital von Seite
Indem wir den Ausdruck auf einem Bruch schreiben, er- 575 für den Grenzfall „ ∞
∞ “ zu berechnen. Für den gesuch-
gibt sich im Grenzfall die unbestimmte Form „ 00 “, so- ten Limes erhalten wir:
dass die L’Hospital’sche Regel anwendbar ist. Die fol-  
gende Rechnung zeigt, dass wir in diesem Beispiel zwei- x ln x
lim x = exp lim 1 = exp(0) = 1 .
mal die Regel anwenden müssen, um im Grenzfall auf x→0 x→0
x
einen bestimmten Ausdruck und somit auf den Grenzwert
zu kommen. Wir erhalten: Auch im dritten Beispiel nutzen wir die Stetigkeit der Ex-
' ( ponentialfunktion. Es gilt:
1 1
lim 1−  x t ,  x -
x→0 x 2 cos2 x lim 1+ = lim exp t ln 1 +
t→∞ t t→∞ t
cos2 x − 1  ,  x -
= lim = exp lim t ln 1 + ,
x→0 x 2 cos2 x t→∞ t
−2 cos x sin x
= lim und wir untersuchen den Exponenten. Dazu schreiben wir
x→0 2x cos2 x − x 2 cos x sin x
−2 cos2 x + 2 sin2 x ,   
= lim x - ln 1 + xt
x→0 2 cos2 x − 4x cos x sin x − x 2 (cos2 x − sin2 x) lim t ln 1 + = lim
t→∞ t t→∞ 1/t
= −1 . ln(1 + ε x)
= lim
ε→0 ε
Im zweiten Fall schreiben wir x/(1 + ε x)
  = lim = x.
ln x ε→0 1
x
x = exp(x ln(x)) = exp 1
.
x Beachten Sie dabei, dass die Ableitungen bezüglich der
Variablen ε = 1/t betrachtet werden.
Da die Exponentialfunktion stetig ist, genügt es den Mit der Stetigkeit der Exponentialfunktion folgt so die
Grenzwert Identität
1  x t  ,  x -
ln x x lim 1 + = exp lim t ln 1 + = ex ,
lim 1
= lim t→∞ t t→∞ t
x→0 x→0 − 12
x x
= − lim x = 0 die wir schon kennen und auf Seite 400 auf anderem Weg
x→0 gezeigt haben.

auch Newton’sche Reibung genannt. Die Bewegung lässt sich Durch Nachrechnen prüfen wir, dass die Funktion
durch die Differenzialgleichung
1  √ 
x(t) = ln cosh( μg t)
μ
x  (t) + μ(x  (t))2 = g
Lösung dieser Gleichung mit den Eigenschaften x(0) =
x  (0) = 0 ist.
beschreiben, wobei x(t) die bis zur Zeit t zurückgelegte Hö-
hendifferenz, v(t) = x  (t) die Geschwindigkeit, μ den Rei- Mit der Regel von L’Hospital können wir zeigen, dass diese
bungskoeffizienten und g die Erdbeschleunigung bezeich- Lösung für μ → 0 gegen die bekannte Lösung x(t) = g2 t 2
nen. des freien Falls im Vakuum konvergiert.
15.4 Verhalten differenzierbarer Funktionen 577

Dazu fassen wir den Ausdruck für x(t) bei festem Zeitpunkt Wir gehen in mehreren Schritten vor: Zunächst stellen wir
t > 0 als Funktion in μ auf. Zweimal L’Hospital’sche Regel fest, dass es mindestens ein globales Minimum und ein glo-
anwenden liefert: bales Maximum geben muss, da f auf dem kompakten In-
√ tervall [−2π, 2π] eine stetige Funktion ist.
t g sinh( μg t )
√ √
1  √  2 μg cosh( μg t) In einem zweiten Schritt suchen wir Extrema im Inneren des
lim ln cosh μg t = lim
μ→0 μ μ→0 1 Intervalls. Da f differenzierbar ist, genügt es, die notwendige
√ 
tg sinh μg t Bedingung f  (x̂) = 0 zu untersuchen. Wir berechnen
= lim √
2 μg
f  (x) = 1 + 2 cos x .
μ→0
1
√ 
tg 2 tg cosh μg t
= lim √ Aus der Bedingung f  (x̂) = 0 folgt:
2 μ→0 μg 2√1μg g
g 2 1
= t , cos x̂ = −
2 2
√  als Bedingung für kritische Stellen x̂ ∈ [−2π, 2π ]. Mit der
wobei wir den Grenzwert limμ→0 cosh μg t = 1 einge-
setzt haben. Dies bestätigt die im Grenzfall bekannte Lösung Tabelle auf Seite 406 folgen die Möglichkeiten:
zum freien, ungedämpften Fall.  2 4 2 4
x̂ = π, x̂ = π, x̂ = − π oder x̂ = − π .
3 3 3 3

15.4 Verhalten differenzierbarer Nun berechnen wir die Funktionswerte an den kritischen Stel-
len und in den Randpunkten x = −2π und x = 2π , um
Funktionen festzustellen, an welcher Stelle ein globales Maximum bzw.
ein globales Minimum liegt. Wir erhalten
' (
Nachdem mit den letzten Abschnitten geklärt ist, wie man 4 4 √
Ableitungen bestimmen und den Mittelwertsatz nutzen kann, f (−2π ) = −2π , f − π =− π + 3,
3 3
' ( ' (
werden wir nun weiter untersuchen, welche Information die 2 2 √ 2 2 √
Ableitung über das lokale Änderungsverhalten eines funktio- f − π =− π − 3, f π = π + 3,
3 3 3 3
nalen Zusammenhangs liefert. Betrachten wir Tangenten am ' (
4 4 √
Graphen einer stetigen Funktion, so ist offensichtlich, dass f π = π − 3, f (2π ) = 2π .
die Steigungen dieser Tangenten Hinweise zum Verhalten der 3 3
Funktion etwa an extremen Stellen beinhalten (Abb. 15.16). Vergleichen wir diese Funktionswerte, so wird deutlich, dass
ein globales Minimum der Funktion bei x = −2π und ein
f (x) globales Maximum bei x = 2π liegen. Ob es sich bei den kri-
tischen Stellen im Inneren des Intervalls um lokale Extrema
handelt, können wir mit dieser Information noch nicht ent-
scheiden. Ein Bild des Graphen gibt uns natürlich Auskunft
über die Extremalstellen (Abb. 15.17). 
x
Wir haben ein Kriterium, um eine Funktion auf Extremalstel-
len hin zu untersuchen. Aber es handelt sich um eine notwen-
dige Bedingung. Dies bedeutet, wenn ein Minimum oder
Maximum zu einer differenzierbaren Funktion in x̂ ∈ (a, b)
Abbildung 15.16 Die Lage der Tangenten am Graphen einer differenzierbaren vorliegt, dann gilt f  (x̂) = 0. Andersherum können wir nicht
Funktion gibt Auskunft über das lokale Verhalten einer Funktion. folgern, d. h., wenn wir eine Stelle finden mit der Bedingung
f  (x̂) = 0, so ist noch nicht gewährleistet, dass es sich um ein
Auf Seite 331 haben wir gesehen, dass jede stetige Funk- Extremum handelt. Das kanonische Beispiel ist die Funktion
tion auf kompakten Mengen Minima und Maxima besitzt. f : R → R mit f (x) = x 3 . Mit f  (x) = 3x 2 ist f  (0) = 0.
In vielen Situationen lassen sich kritische Stellen, an denen Es liegt aber weder ein lokales Minimum noch ein lokales
solche Extrema liegen, mithilfe des notwendigen Kriteriums Maximum vor, denn f (x) < 0 für x < 0 und f (x) > 0 für
f  (x̂) = 0 bestimmen (siehe Seite 569). Betrachten wir dazu x > 0. Eine Stelle, in der die erste Ableitung verschwindet,
noch ein weiteres Beispiel: aber dennoch kein lokales Extremum vorliegt heißt Sattel-
punkt der Funktion f (Abb. 15.18).
Beispiel Gesucht sind alle globalen Extremalstellen der
Trotzdem ist es bei der Suche nach Extrema sinnvoll, die
Funktion
notwendige Bedingung f  (x) = 0 zu betrachten. Lösungen
f (x) = x + 2 sin x
dieser im Allgemeinen nichtlinearen Gleichung nennen wir
auf dem Intervall [−2π, 2π]. kritische Stellen.
578 15 Differenzialrechnung – die Linearisierung von Funktionen

f (x) Nicht negative Ableitung bedeutet monoton


2π steigend

Der Mittelwertsatz gibt uns die Möglichkeit, das lokale Ver-


halten von stetig differenzierbaren Funktionen mithilfe der
π
Ableitung zu analysieren.

Lemma
Wenn f : [a, b] → R eine stetige und auf (a, b) diffe-
−2π −π π x
2π renzierbare Funktion ist, so gelten die folgenden Äquiva-
lenzen:

−π Es ist f  (x) ≥ 0 für alle x ∈ (a, b) genau dann, wenn f


in (a, b) monoton steigend ist.
Es ist f  (x) ≤ 0 für alle x ∈ (a, b) genau dann, wenn f
in (a, b) monoton fallend ist.
−2π
Abbildung 15.17 Die Extremalstellen der Funktion f (x) = x + 2 sin x.
Beweis: Wir zeigen nur den ersten Fall. Der Beweis für
monoton fallende Funktionen verläuft entsprechend.
f (x)
Gehen wir von f  (x) ≥ 0 für alle x ∈ (a, b) aus und wäh-
len zwei Stellen x1 , x2 ∈ [a, b] mit x1 < x2 . Anwendung
2
des Mittelwertsatzes im Intervall [x1 , x2 ] liefert die Existenz
einer Stelle z ∈ (x1 , x2 ) mit
1
f (x2 ) − f (x1 ) = f  (z) (x2 − x1 ) ≥ 0 ,

-2 -1 1 2 x
also gilt f (x1 ) ≤ f (x2 ).
-1 Sattelpunkt Andererseits folgt für eine monoton steigende Funktion, dass
der Differenzenquotient
-2
f (x + h) − f (x)
≥0
h

Abbildung 15.18 An der Stelle x = 0 liegt ein Sattelpunkt der Funktion nicht negativ ist. Die Ungleichung bleibt im Grenzfall h → 0
f : R → R mit f (x) = x 3 . erhalten. Also ist f  (x) ≥ 0. 

Zur Berechnung von kritischen Stellen muss die Gleichung Beachten Sie, dass die gesamte Ableitungsfunktion auf dem
f  (x) = 0 für Argumente x ∈ D im Definitionsbereich ge- Intervall positiv sein muss. Für diese Bedingung wird häufig
löst werden. Schon bei Polynomen höheren Grads ist dies auch kurz f  ≥ 0 ohne Argument geschrieben.
in geschlossener Form im Allgemeinen nicht möglich, so-
dass wir nur in Spezialfällen explizit Lösungen zu solchen ?
Gleichungen angeben können. Andernfalls bleibt uns nur Finden Sie ein Gegenbeispiel, um zu belegen, dass aus Po-
die Möglichkeit, Lösungen anzunähern, etwa mit dem auf sitivität der Ableitung an einer Stelle im Allgemeinen nicht
Seite 572 vorgestellten Newton-Verfahren. Monotonie folgt

Neben dem geschlossenen oder numerischen Lösen solcher


Gleichung stellen sich weitere Fragen, etwa: „Unter welchen Eine Implikation der letzten Aussage lässt sich übrigens ver-
Voraussetzungen gibt es überhaupt kritische Stellen?“, oder schärfen. Eine positive Ableitung f  > 0 auf einem Intervall
„Handelt es sich um eine Minimal- oder eine Maximalstelle?“ (a, b) impliziert, dass die Funktion streng monoton steigend
Wir wenden uns diesen Fragen zu. ist. Analog gilt, dass negative Ableitungen ein streng mono-
ton fallendes Verhalten implizieren. Dies wird deutlich, wenn
wir im ersten Teil des obigen Beweises die Ungleichungen
durch echte Ungleichungen ersetzen.

?
Kann man diese Aussage zur strengen Monotonie umkehren?
15.4 Verhalten differenzierbarer Funktionen 579

Beispiel Ist die Ableitungsfunktion einer differenzierba- für x > 1 (Abb. 15.19), bzw.
ren Funktion auf einem Intervall positiv, so ist die Funktion 1
streng monoton wachsend, und es existiert eine differenzier- g  (x) = − %
bare Umkehrfunktion. Auf welchem Intervall ist die Funktion x −1
2

f:R→R im zweiten Fall. 


f (x) = cosh(x)
umkehrbar? Ein Vorzeichenwechsel der Ableitungsfunktion
f (x) unterscheidet Minimum und Maximum

2.0 Wir kommen zurück auf die Extremalprobleme. Wir wissen


bereits, dass in einer Extremalstelle x̂ einer differenzierba-
1.5
arcosh
ren Funktion die Bedingung f  (x̂) = 0 gelten muss. Gilt
darüber hinaus, dass die Ableitungsfunktion links der kriti-
1.0 schen Stelle negativ ist und rechts positiv ist, so folgt mit
entsprechender Zwischenstelle z aus dem Mittelwertsatz
arcosh
0.5 f (x) − f (x̂) = f  (z) (x − x̂) > 0
 
<0 <0
0.5 1.0 1.5 2.0 2.5 3.0 3.5 x
für x < z < x̂ und
Abbildung 15.19 Der Graph des Areakosinus hyperbolicus und die zugehörige f (x) − f (x̂) = f  (z) (x − x̂) > 0
Ableitungsfunktion.  
>0 >0

Man berechnet zunächst die Ableitung f  (x) = sinh(x). Aus für x > z > x̂. Wir haben also ein Kriterium gezeigt, um in
kritischen Stellen zu entscheiden, ob es sich um ein Minimum
ex − e−x ex oder ein Maximum handelt. Wir formulieren dies sowohl für
f  (x) = = (1 − e−2x )
2 2 lokale Minima als auch für lokale Maxima in folgender Aus-
sage.
ergibt sich, dass

f  (x) > 0 für x > 0 Ein hinreichendes Optimalitätskriterium


Ist f : (a, b) → R eine differenzierbare Funktion mit
und f  (x̂) = 0 an einer Stelle x̂ ∈ (a, b), und gibt es ε > 0
f  (x) < 0 für x < 0 mit
f  (x) < 0 für alle x ∈ (x̂ − ε, x̂)
gilt. Somit ist cosh streng monoton auf R>0 bzw. auf R<0
und insbesondere umkehrbar auf diesen Intervallen. Die Um- und
kehrfunktion ist der Areakosinus hyperbolicus mit f  (x) > 0 für alle x ∈ (x̂, x̂ + ε),
% so ist x̂ Minimalstelle der Funktion f .
arcosh(x) = ln(x + x 2 − 1) , x ≥ 1 ,
Ändert sich das Vorzeichen der Ableitungen andererseits
als Umkehrfunktion zu cosh : R≥0 → R≥1 und von positiven zu negativen Werten, so ist in x̂ ein lokales
% Maximum.
g(x) = ln(x − x 2 − 1) , x ≥ 1,
Beispiel Kehren wir zurück zum Beispiel auf Seite 577,
als Umkehrfunktion zu cosh : R≤0 → R≥1 (siehe Seite 403). wo wir die Funktion f : [−2π, 2π ] → R mit
Für die Ableitung erhalten wir:
f (x) = x + 2 sin x
d 1
arcosh(x) = betrachtet haben. Wir hatten festgestellt, dass etwa bei
dx sinh(arcosh(x)) x̂ = 23 π und bei x̂ = 43 π kritische Stellen dieser Funktion
2  3−1
1 % 1 liegen. Aus den Abschätzungen
= exp(ln(x + x − 1))−
2 % ⎧  
2 exp(ln(x + x 2 − 1)) 1

⎪ >− für x ∈ 0, 23 π ,
2  % 3−1 ⎪

% ⎪
⎪ 2
1 x − x 2−1 ⎨  
= x + x2 − 1 − 2 1
2 x − (x 2 − 1) cos x < − für x ∈ 23 π, 43 π ,

⎪ 2
,% -−1 ⎪
⎪  
1 ⎪

= x2 − 1 = % ⎩ > −1 für x ∈ 43 π, 2π
x −1
2 2
580 15 Differenzialrechnung – die Linearisierung von Funktionen

folgt für f (x)



f (x) = 1 + 2 cos x
ein Vorzeichenwechsel der Ableitung von positiv zu negativ
in einer Umgebung um x̂ = 23 π, d. h., dort liegt ein loka-
les Maximum der Funktion. Analog sehen wir am Vorzei-
chenwechsel der Ableitung von negativ zu positiv, dass bei
x̂ = 43 π ein lokales Minimum liegt (Abb. 15.20). 

f (x) x1 x1 + t (x2 − x1 ) x2 x

2
f (x) > 0 f  (x) < 0 f  (x) > 0 Abbildung 15.21 Der Graph einer konvexen Funktion. Die Menge oberhalb
des Graphen ist konvex.
f

Beschreiben wir die Stellen im Intervall [x, y] durch


−1 1 3 x z = x + t (y − x) mit t ∈ [0, 1], so ergibt sich für die Sekante

g(z(t)) = (f (y) − f (x))t + f (x)


= (1 − t)f (x) + tf (y) .
−2

Die Bedingung, dass diese Gerade im Intervall [x, y] ober-


Abbildung 15.20 Ein Vorzeichenwechsel der ersten Ableitung liefert Informa- halb des Graphen von f liegt, bedeutet f (z(t)) ≤ g(z(t))
tionen über den Typ einer Extremalstelle. für alle Werte 0 ≤ t ≤ 1 (siehe auch Seite 230). Diese for-
male Darstellung nutzt man für die Definition von Konvexität
Mit Optimierungstheorie bezeichnet man den Zweig der Ma- einer Funktion, indem man sie für alle Paare x, y ∈ [a, b]
thematik, der sich mit solchen Existenzkriterien und mit der fordert.
Bestimmung von Minima und Maxima beschäftigt (siehe Ka-
pitel 6). Ein Spezialfall in der Optimierung, der die letzte
Beobachtung verallgemeinert, sind konvexe Funktionen. Definition konvexer Funktionen

Zunächst wird definiert, was eine konvexe Mengen ist. Eine Funktion f : D → R auf einem Intervall D =
[a, b] ⊆ R heißt konvex, wenn
Konvexe Mengen
f (x + t (y − x)) = f ((1 − t)x + ty)
Eine Menge M ⊆ V in einem reellen Vektorraum V
≤ (1 − t)f (x) + tf (y)
heißt konvex, wenn alle Verbindungsstrecken zwischen
Punkten der Menge ganz in M liegen, d. h., mit x, y ∈ M für alle t ∈ [0, 1] und alle x, y ∈ D gilt.
folgt
x + t (y − x) ∈ M für alle t ∈ [0, 1] .
Können wir die Ungleichung für t ∈ (0, 1) durch eine echte
Ungleichung, „<“ , ersetzen, so wird die Funktion strikt
Man spricht bei Funktionen in einer Variablen von einer kon-
konvex oder streng konvex genannt. Entsprechend nennt
vexen Funktion, wenn die Teilmenge des R2 , die oberhalb
man eine Funktion konkav bzw. strikt konkav auf einem
des Graphen der Funktion liegt, konvex ist, wie zum Beispiel
Intervall, wenn die Funktion −f konvex bzw. strikt konvex
bei der Normalparabel (Abb. 15.21).
ist.

Strikt konvexe Funktionen haben genau ein ?


Minimum Begründen Sie, warum eine strikt konvexe Funktion auf kei-
nem Intervall [x, y] mit x = y konstant sein kann.
Die Eigenschaft formulieren wir so, dass sie sich allge-
mein auf Funktionen zwischen Vektorräumen übertragen
lässt. Beim Graphen einer konvexen Funktion muss jede Se-
kante oberhalb des Graphen liegen. Zwischen zwei Punkten Beispiel
(x, f (x)) und (y, f (y)) ist die Sekante gegeben durch die Quadratische Polynome sind entweder strikt konvex oder
affin-lineare Funktion strikt konkav. Dazu betrachten wir f : R → R mit
f (y) − f (x)
g(z) = (z − x) + f (x) .
y−x f (x) = ax 2 + 2bx + c.
15.4 Verhalten differenzierbarer Funktionen 581

f (x)

−3 −2 −1 1 2 3 x

Abbildung 15.22 Optische Linsen sind konvex oder konkav.


−2

Für x, y ∈ R und t ∈ [0, 1] gilt: Abbildung 15.23 Eine Funktion, die weder konvex noch konkav ist.

f (x + t (y − x))
Satz
= a(x + t (y − x))2 + 2b(x + t (y − x)) + c Falls eine stetige Funktion f : [a, b] → R strikt kon-
= ax 2 + 2atxy − 2atx 2 + at 2 y 2 − 2at 2 xy vex bzw. strikt konkav ist auf einem Intervall [a, b], besitzt
sie genau ein Minimum bzw. Maximum auf diesem Intervall.
+ at 2 x 2 + 2bx + 2bty − 2btx + c
= (1 − t)(ax 2 + 2bx + c) + t (ay 2 + 2by + c)
Beweis: Wir führen den Beweis nur im Fall einer strikt
− at (x 2 − 2xy + y 2 ) + at 2 (x 2 + y 2 − 2xy) konvexen Funktion und einem Minimum. Die konkave Si-
= (1 − t)f (x) + tf (y) + at (t − 1)(x − y)2 . tuation mit einem Maximum gilt entsprechend.
Wir nehmen an, es gibt zwei lokale Minimalstellen x1 und x2 .
Da der Faktor (t − 1) < 0 ist, folgt im Fall a > 0 die Da wir wissen, dass es mindestens ein globales Minimum ge-
Abschätzung ben muss, genügt es, diese Annahme auf einen Widerspruch
zu führen. Aufgrund der Konvexität folgt
f (x + t (y − x)) < (1 − t)f (x) + tf (y)
f (x1 + t (x2 − x1 ))) < (1 − t)f (x1 ) + tf (x2 )
für x = y und t ∈ (0, 1). Die Funktion ist strikt kon- ≤ max{f (x1 ), f (x2 )}
vex. Andererseits folgt für a < 0, dass die Funktion strikt
konkav ist. für alle t ∈ (0, 1). Dies ist aber ein Widerspruch. Denn so-
Die Funktion f : R → R mit f (x) = |x| ist konvex, denn wohl in einer Umgebung des lokalen Minimums x1 als auch
mit der Dreiecksungleichung folgt: des Minimums bei x2 müssen die Funktionswerte f (x) grö-
ßer als f (x1 ) bzw. f (x2 ) sein, da es sich um lokale Minimal-
|x + t (y − x)| = |(1 − t)x + ty| ≤ (1 − t)|x| + t|y| . stellen handelt. Zumindest auf einer Seite, für kleine t > 0
oder für große Werte t < 1 trifft dies wegen der obigen Un-
gleichung nicht zu, wenn wir von zwei unterschiedlichen Mi-
Die Funktion f : R → R mit f (x) = x 4 − x 3 − 4x 2 + nimalstellen ausgehen. Also kann es nur eine Minimalstelle
4x +6 ist weder konvex noch konkav. Es gilt zum Beispiel geben. 

mit x = −1 und y = 2:
Wir können somit bei strikt konvexen Funktionen folgern,
1 2 1
6 = f (0) = f (−1 + (2 + 1)) ≥ f (−1) + f (2) = 2 dass es sich um eine Minimalstelle handelt, wenn wir eine
3 3 3
kritische Stelle x̂ ∈ (a, b) mit f  (x̂) = 0 finden. Und ent-
und andererseits: sprechend folgt bei einer konkaven Funktion aus f  (x̂) = 0,
dass bei x̂ ein Maximum liegt.
75 5 1 5
= f (3/2) = f (−1+ (2+1)) ≤ f (−1)+ f (2) = 5 . Um die Eigenschaften konvex oder konkav zu definieren,
16 6 6 6
muss keine Regularität der Funktion, wie Stetigkeit oder Dif-
Beachten Sie, dass sich auf Teilintervallen die Funktion f ferenzierbarkeit, vorausgesetzt werden. Wenn aber eine zwei-
sehr wohl konvex oder konkav verhält (Abb. 15.23).  mal stetig differenzierbare Funktion vorliegt, so kann man die
582 15 Differenzialrechnung – die Linearisierung von Funktionen

Beobachtung auch anders beschreiben. Der Zusammenhang für ein t ∈ (0, 1). Wenden wir den Mittelwertsatz jeweils
zur zweiten Ableitung einer Funktion lässt sich anschaulich in den Intervallen (x, x + t (y − x)) und (x + t (y − x), y)
begründen. Eine positive zweite Ableitung f  (x) > 0 be- an, so gibt es Zwischenstellen z1 , z2 ∈ (a, b) mit x < z1 <
deutet, eine monoton steigende Ableitungsfunktion f  . Aber x + t (y − x) < z2 < y mit
genau dies ist charakteristisch für eine konvexe Funktion, wie
Abbildung 15.24 veranschaulicht. (1 − t)f (x) + tf (y) − f (x + t (y − x))
= (1 − t)f  (z1 )(x − (x + t (y − x)))
−tf  (z2 )(x + t (y − x) − y)
= −(1 − t)f  (z1 )t (y − x) + tf  (z2 )(1 − t)(y − x)
f (x)  
= (1 − t)t (y − x) f  (z2 ) − f  (z1 ) .

Nun lässt sich der Mittelwertsatz ein weiteres Mal anwenden


und zwar auf die Ableitungsfunktion f  . Es gibt somit eine
f  Stelle z3 ∈ (z1 , z2 ) mit
f
(1 − t)f (x) + tf (y) − f (x + t (y − x))
= (1 − t)t (y − x)f  (z3 )(z2 − z1 ) .
x Da aber nach Voraussetzung die zweite Ableitung f  (z3 )
f nicht negativ ist, folgt:

(1 − t)f (x) + tf (y) − f (x + t (y − x)) ≥ 0 .


Abbildung 15.24 Die Eigenschaft f  > 0 impliziert, dass f monoton steigt
und damit, dass f konvex ist. Dies gilt für alle Werte t ∈ (0, 1) und für alle a ≤ x < y ≤ b.
Also ist die Funktion auf dem Intervall konvex.
Es bleibt die andere Implikation der Aussage zu beweisen.
Eine positive zweite Ableitung bedeutet lokal Dazu starten wir mit der Voraussetzung, dass die Funktion
ein konvexes Verhalten einer Funktion konvex ist. Dies bedeutet, dass für Sekanten g mit g(t) =
f (x) + t (f (y) − f (x)) gilt:
Diese Überlegung formulieren wir genauer:
f (x + t (y − x)) ≤ g(t)
Folgerung für t ∈ (0, 1). Wählen wir x, y ∈ (a, b) mit x < y und setzen
Ist f : [a, b] → R eine stetige Funktion, die auf dem z = x + t (y − x), so folgt
offenen Intervall (a, b) zweimal stetig differenzierbar ist, so
gilt: f (z) − f (x) g(t) − g(0) f (y) − f (x)
≤ =
f  (x) ≥ 0 für alle x ∈ (a, b) genau dann, wenn f konvex z−x t (y − x) y−x
ist. für alle t ∈ (0, 1), da f (z) ≤ g(t) und f (x) = g(0) gilt. Die
f  (x) ≤ 0 für alle x ∈ (a, b) genau dann, wenn f konkav Abschätzung bleibt auch im Grenzfall z → x erhalten. Da f
ist. differenzierbar ist, folgt

Beweis: Um die Aussagen zu beweisen, müssen beide f (y) − f (x)


f  (x) ≤ .
Richtungen begründet werden. Einerseits muss bei nicht ne- y−x
gativer zweiter Ableitung gezeigt werden, dass die Funk-
tion konvex ist, und andererseits müssen wir zeigen, dass Analog erhalten wir aus
für eine konvexe zweimal differenzierbare Funktion folgt,
dass f  (x) ≥ 0 ist. Die entsprechende Aussage für konkave f (y) − f (z) g(1) − g(t) f (y) − f (x)
≥ =
Funktionen ergibt sich analog. Es wird deswegen nur der Be- y−z (1 − t)(y − x) y−x
weis für die erste Aussage präsentiert.
an der Stelle y die Ungleichung
Beginnen wir mit einer Funktion, für die f  (x) ≥ 0 für alle
f (y) − f (x)
x ∈ (a, b) gilt. Zu zwei Stellen a ≤ x < y ≤ b betrachten f  (y) ≥ .
wir die Differenz y−x

Insbesondere ergibt sich, dass f  (x) ≤ f  (y) gilt. Die Ab-


(1 − t)f (x) + tf (y) − f (x + t (y − x))
  schätzung folgt für alle x, y ∈ (a, b) mit x < y. Also ist
= (1 − t) f (x) − f (x + t (y − x)) die Funktion f  monoton steigend. Da f  differenzierbar ist,
 
−t f (x + t (y − x)) − f (y) folgt f  (x) ≥ 0. 
15.5 Taylorreihen 583

Gehen wir den ersten Teil des Beweises noch einmal durch, f (x)
so wird deutlich, dass die Ungleichungen durch echte Un- 10
gleichungszeichen ersetzt werden können. Dies führt auf die
Aussage, dass f  > 0 strikte Konvexität impliziert. Auch
hier können wir somit die Aussage, wie bei der Monotonie,
in einer Richtung verschärfen. Andersherum klappt es wie-
derum nicht. 5

In einer Umgebung einer Minimalstelle einer zweimal diffe-


renzierbaren Funktion im Inneren eines Intervalls (a, b) lässt
sich das konvexe Verhalten gut verdeutlichen. In einem Mini-
mum ist die Tangentensteigung null. Links vom Minimum ist −3π −2π −π π 2π 3π x
die Steigung der Funktion negativ und rechts vom Minimum
positiv (Abb. 15.24). Also wechselt die Ableitungsfunktion
im Minimum von negativen zu positiven Werten (siehe Opti-
malitätskriterium auf Seite 579). Dies bedeutet, die Steigung −5
der Ableitungsfunktion muss positiv sein.
Setzen wir voraus, dass die zweite Ableitungsfunktion stetig
ist, genügt es zu zeigen, dass f  (x̂) > 0 gilt, denn wegen der
Stetigkeit gibt es ein Intervall um den Punkt x̂, auf dem die −10
zweite Ableitung positiv ist. Also ist die Funktion lokal auf
diesem Intervall konvex. Damit haben wir aus der Folgerung
ein nützliches hinreichendes Kriterium für Extremalstellen Abbildung 15.25 Die Graphen der Funktionen f, g mit f (x) = x + 2 cos x
und g(x) = x + cos x.
bewiesen.

Hinreichendes Kriterium für Extremalstellen Die zweite Ableitung g  mit g  (x) = − cos x hat an diesen
Ist eine Funktion f : (a, b) → R zweimal stetig diffe- Stellen die Werte g  (zk ) = 0. Somit liefert uns das Kriterium
renzierbar in x̂ ∈ (a, b) mit f  (x̂) = 0 und f  (x̂) > 0 keine Auskunft über den Typ der kritischen Stellen. Aber aus
bzw. f  (x̂) < 0. Dann ist x̂ eine lokale Minimalstelle g  (x) = 1 − sin x ≥ 0 für alle x ∈ R folgt, dass f monoton
bzw. Maximalstelle der Funktion f auf (a, b). wachsend ist. Daraus lässt sich schließen, dass die Funktion
g keine Minima oder Maxima auf R besitzt (Abb. 15.25). 

Beispiel Gesucht sind die Extremalstellen der beiden


Achtung: Beachten Sie, dass das diskutierte Kriterium zu
Funktionen f, g : R → R mit
Extremalstellen im Fall f  (x̂) = 0 und f  (x̂) = 0 keine
f (x) = x + 2 cos x und g(x) = x + cos x . Aussagen über den Typ der kritischen Stelle macht, etwa in
x = 0 für die Funktion f mit f (x) = x 3 . In der Aufgabe
Wir berechnen die Ableitungen 15.21 überlegen wir uns, wie die Werte höherer Ableitungen
weiterhelfen können.
f  (x) = 1 − 2 sin x und g  (x) = 1 − sin x .

Aus der Bedingung f  (x) = 0, d. h., sin x = 1/2, folgen für


die Funktion f die kritischen Punkte 15.5 Taylorreihen
π 5π
xk = + 2kπ bzw. yk = + 2kπ Kommen wir zurück zur Linearisierung einer Funktion, d. h.,
6 6
für k ∈ Z. Mit der zweiten Ableitung f (x) ≈ f (x0 ) + f  (x0 )(x − x0 ) .

f  (x) = −2 cos x Es ist naheliegend zu fragen, wie die Näherung, die wir
durch Linearisierung erreichen, gegebenenfalls durch Poly-
erhalten wir f  (xk ) = −2 cos(π/6) < 0 und f  (yk ) = nome höheren Grades verbessert werden könnte. Geben wir
−2 cos(5π/6) > 0. Also liegen an den kritischen Stellen xk eine Stelle x0 ∈ D vor, so besteht eine Möglichkeit darin,
lokale Maxima der Funktion, und die Punkte yk sind lokale ein Polynom pn vom Grad n zu suchen mit der Eigenschaft
Minimalstellen.
f (k) (x0 ) = pn(k) (x0 )
Betrachten wir die zweite Funktion g und bestimmen die
Nullstellen der Ableitung g  (x) = 1 − sin x. Aus sin zk = 1 für den Funktionswert und die Ableitungen, k = 1, . . . , n,
ergeben sich die kritischen Punkte zk = π2 + 2kπ für k ∈ Z. an der Stelle x0 .
584 15 Differenzialrechnung – die Linearisierung von Funktionen

Beispiel: Die Monotonie der Mittelwertfunktion


Zu positiven Zahlen a1 , . . . , an ist durch die Funktion m : R → R mit
⎛ ⎞1 ⎛ ⎞1
x x
1 !n
1 !
n
m(x) = ⎝ x⎠
aj für x  = 0 mit stetiger Ergänzung m(0) = lim ⎝ x⎠
aj
n x→0 n
j =1 j =1

ein allgemeiner Mittelwert definiert. Diese Funktion ist streng monoton steigend. Die Monotonie impliziert die Abschätzungen
zwischen verschiedenen üblichen Mittelwerten.
Problemanalyse und Strategie: Um Monotonie der Funktion m zunächst für positive Argumente 0 < x < y zu
zeigen, betrachten wir die konvexe Funktion f : R>0 → R mit f (z) = zt für t = yx > 1. Die anderen Fälle werden
dann auf diesen Fall zurückgeführt.
⎛ ⎞1/x ⎛ ⎞1/y
Lösung: ! n ! n
⎝ 1 1
ajx ⎠ <⎝ aj ⎠
y
Sind t > 1 und f : R≥0 → R definiert durch f (z) = zt ,
n n
dann gilt für die zweite Ableitung: j =1 j =1
f  (z) = t (t − 1) zt−2 > 0 für 0 < x < y. Dies bedeutet, die Funktion m ist streng
für alle z > 0. Die Funktion f ist strikt konvex. Insbeson- monoton steigend für positive Argumente.
dere ist ' (
1 1 1 Für x < y < 0 betrachten wir die Kehrwerte und erhalten
f (b1 + b2 ) < f (b1 ) + f (b2 ) mit der oben gezeigten Abschätzung die Monotonie mit
2 2 2
für b1 , b2 > 0. Wir verwenden diese Ungleichung als In- |y| < |x| aus
duktionsanfang, um zu zeigen, dass die Abschätzung ⎛ ⎞1/x
⎛ ⎞t ⎛ ⎞ 1 ! n
1
! n ! n ⎝ aj ⎠
x
=  1/|x|
⎝ 1 1 1 |x|
bj ⎠ = f ⎝ bj ⎠ n
j =1 1
n
n
j =1 a
n n j
j =1 j =1 ⎛ ⎞1/y
1 !n
1 !
n 1 1 !n
1/|y| = ⎝ aj ⎠ .
y
< f (bj ) = bjt < 
n n 1 n 1 |y| n
j =1
j =1 j =1 n j =1 aj
für positive Zahlen b1 , b2 , . . . , bn > 0 gilt. Der entspre-
In Aufgabe 15.18 zum Kapitel zeigen wir noch den Grenz-
chende Induktionsschritt ergibt sich mit der Konvexität
wert
von f aus
⎛ ⎞ ⎛ ⎞1/x
1 !
n+1
1 !n

f⎝ bj ⎠ lim ⎝ ajx ⎠ = n a1 · a2 · . . . · an .
n+1 x→0 n
j =1
j =1
⎛ ⎞
' ( ! n
1 1 1 Aufgrund der Stetigkeit der Funktion m gelten somit die
=f ⎝ 1− bj + bn+1 ⎠ Monotonieabschätzungen auch für x = 0 oder y = 0.
n+1 n n+1
j =1
⎛ ⎞
In der Abbildung ist der Graph von m für a1 = 2, a2 = 3
1! ⎠
n
n 1
< f⎝ bj + f (bn+1 ) und n = 2 gezeigt.
n+1 n n+1
j =1
1 1 m(x)
< (f (b1 ) + · · · + f (bn )) + f (bn+1 ) , 2.8
n+1 n+1
wobei die erste Abschätzung aus der Konvexität folgt und 2.4
die zweite Ungleichung die Induktionsannahme verwen-
det. 2.0

Setzen wir in der Ungleichung für 0 < x < y den Para-


meter t = y/x > 1 und bj = ajx , so folgt: −30 −20 −10 0 10 20 30 x
⎛ ⎞y/x
1 !n
1! y
n
⎝ aj ⎠
x
< aj . Wir haben gezeigt, dass die Funktion m : R → R streng
n n
j =1 j =1 monoton wächst. Für Spezialfälle – etwa x = −1, dem
Da die Exponentialfunktion streng monoton ist, bleibt die harmonischen Mittel, x = 0, dem geometrischen Mittel,
Ungleichung erhalten, wenn wir beide Seiten mit y1 po- und x = 1, dem arithmetischen Mittel – erhalten wir wich-
tenzieren. Es folgt die gesuchte Ungleichung tige Ungleichungen der Statistik.
15.5 Taylorreihen 585

Beispiel: Kurvendiskussion
Der wesentliche Verlauf einer Funktion, die durch einen Ausdruck gegeben ist, lässt sich durch eine Kurvendiskussion
ermitteln. Es soll das Verhalten der rationalen Funktion f , die durch
x 4 − 5x 2
f (x) =
4(x − 1)3
gegeben ist, untersucht werden.

Problemanalyse und Strategie: Um die durch den Ausdruck gegebene Funktion zu diskutieren, sind mehrere Aspekte
zu betrachten. Zunächst müssen wir einen zulässigen Definitionsbereich der Funktion festlegen. Dann berechnet man
die Nullstellen von f, f  , f  . Aus diesen Informationen, zusammen mit der Stetigkeit, können Intervalle identifiziert
werden, in denen die Funktion positiv oder negativ, monoton und konvex oder konkav ist. Außerdem ergeben sich aus
den kritischen Stellen die lokalen Extremalstellen der Funktion. Weiter betrachtet man die Grenzwerte von f an den
Rändern des Definitionsbereichs, um das asymptotische Verhalten für x → ±∞ oder an Polstellen zu ermitteln.

Lösung: x3 = −1 ein lokales Maximum und bei x4 = 0 ein lo-


1. Definitionsbereich: Da der Nenner des Ausdrucks nur kales Minimum.
bei x̂ = 1 eine Nullstelle aufweist, können wir als maxi-
3. Asymptotisches Verhalten: Mit den Grenzwerten
malen Definitionsbereich in den reellen Zahlen die Menge
D = R\{1} betrachten. x 4 − 5x 2
→∞ für x → 1, x < 1,
2. Nullstellen der Funktion und der Ableitungen: Die 4(x − 1)3
√aus x − 5x √= x (x −
Nullstellen von f ergeben sich 4 2 2 2
und
5) = 0 zu x0 = 0, x1 = − 5 und x2 = 5. Für die
x 4 − 5x 2
Ableitungen berechnen wir → −∞ für x → 1, x > 1,
4(x − 1)3
x(x 3 − 4x 2+ 5x + 10)
f  (x) = klärt sich das Verhalten um die Polstelle bei x = 1.
4(x − 1)4
und Weiter folgt mit einer Polynomdivision:
 x 2 − 20x − 5
f (x) = . x 4 − 5x 2 1 3 x 2 − 8x + 3
2(x − 1)5 = x+ + .
Die kritischen Punkte liegen in den reellen Nullstellen der 4(x − 1) 3 4 4 4(x − 1)3
ersten Ableitung, die sich aus der Faktorisierung Somit gilt:
f  (x) = x(x + 1)(x 2 − 5x + 10) x 4 − 5x 2
→ ±∞, für x → ±∞.
zu x3 = −1, x4 = 0 = x0 ergeben.
√ Nun berechnen
√ wir 4(x − 1)3
noch die Nullstellen x5 = 10− 105 und x6 = 10+ 105
Genauer sieht man aus der Darstellung das asymptotische
zu f  .
Verhalten limx→±∞ |f (x) − g(x)| = 0 für die Funktion
Alle diese Nullstellen liefern uns Intervallränder, an denen g : R → R mit g(x) = 41 x + 43 . Also verhält sich die
Vorzeichenwechsel in f, f  oder f  auftreten können. Be- Funktion f für sehr große und sehr kleine Argumente wie
trachten wir jeweils eine einfach zu rechnende Stelle in- die affin-lineare Funktion g.
nerhalb des entsprechenden Intervalls, etwa 21 ∈ (x0 , 1),
so lässt sich das Vorzeichen der betreffenden Funktion im f (x)
Teilintervall angeben, und wir können folgende Tabelle
zum Verhalten der Funktion f aufstellen: 2 f
g
x ∈ (−∞, x1 ), x ∈ (1, x2 ) f (x) < 0 negativ
x ∈ (x1 , x0 ), x ∈ (x0 , 1), f (x) > 0 positiv
x ∈ (x2 , ∞)
−2 x
x ∈ (−∞, x3 ), x ∈ (x0 , 1), f  (x) > 0 monoton 2 4
x ∈ (1, ∞) steigend
x ∈ (x3 , x0 ) f  (x) < 0 monoton
−2
fallend
x ∈ (−∞, x5 ), x ∈ (1, x6 ) f  (x) < 0 konkav
x ∈ (x5 , 1), x ∈ (x6 , ∞) f  (x) > 0 konvex
Aus den Vorzeichenwechseln der Ableitungen erkennen Mit diesen Informationen lässt sich relativ leicht eine
wir auch den Typ der kritischen Stellen. So liegt bei Skizze des Graphen anfertigen (siehe Abbildung).
586 15 Differenzialrechnung – die Linearisierung von Funktionen

Übersicht: Verhalten differenzierbarer Funktionen


Das lokale Verhalten differenzierbarer Funktionen lässt sich an den Werten der Ableitungen ablesen.

Bezeichnen f : D → R eine hinreichend oft stetig dif- Monotonie


ferenzierbare Funktion und (a, b) ⊆ D ein offenes Teil- f  ≤ 0 auf (a, b) ⇐⇒ f monoton fallend auf (a, b)
intervall des Definitionsbereichs, dann gelten folgende
Aussagen zum lokalen Verhalten von f auf (a, b) und den f  ≥ 0 auf (a, b) ⇐⇒ f monoton steigend auf (a, b)
Ableitungen auf (a, b):
f  < 0 auf (a, b)
Extrema $⇒ f streng monoton fallend auf (a, b)
f  (x̂) = 0 ⇔ x̂ ∈ (a, b) kritischer Punkt
f  > 0 auf (a, b)
$⇒ f streng monoton steigend auf (a, b)
f  (x̂) = 0 und f  (x̂) > 0
Krümmung
$⇒ x̂ ∈ (a, b) Minimalstelle
f  ≥ 0 auf (a, b) ⇐⇒ f konvex auf (a, b)

f  (x̂) = 0 und f  (x̂) < 0 f  ≤ 0 auf (a, b) ⇐⇒ f konkav auf (a, b)


$⇒ x̂ ∈ (a, b) Maximalstelle
f  > 0 auf (a, b) $⇒ f strikt konvex auf (a, b)

f  < 0 auf (a, b) $⇒ f strikt konkav auf (a, b)

Für n = 0 ist dies offensichtlich das konstante Polynom ?


p0 (x) = f (x0 ) für alle x ∈ R und für n = 1 ergibt sich aus Prüfen Sie nach, dass das n-te Taylorpolynom die Bedingung
den beiden Bedingungen
f (k) (x0 ) = pn(k) (x0 ; x0 )
p1 (x0 ) = f (x0 ) und p1 (x0 ) = f  (x0 ) ,
wenn wir für das Polynom den Ansatz p1 (x) = a + bx für k = 0, . . . , n erfüllt.
machen, a + bx0 = f (x0 ) und b = f  (x0 ). Also erhalten
wir mit a0 = f (x0 ) und a1 = f  (x0 ) die schon diskutierte
Linearisierung Beispiel Wir betrachten die Funktion f : R>−1 → R mit
1

p1 (x) = f (x0 ) + f (x0 ) (x − x0 ), x ∈ R. f (x) = 1+x . Aus den ersten beiden Ableitungen

Nun lässt sich sukzessive der Grad des zu betrachtenden −1 2


f  (x) = , f  (x) =
Polynoms erhöhen, und man erhält die nach dem englischen (1 + x)2 (1 + x)3
Mathematiker Brook Taylor (1685–1731) benannten Taylor-
polynome zur Funktion f um den Entwicklungspunkt x0 . ist zu vermuten, dass
(−1)n n!
Definition der Taylorpolynome f (n) (x) =
(1 + x)n+1
Wenn eine Funktion f : D ⊆ R → R n-mal stetig diffe-
renzierbar ist auf einem offenen Intervall D ⊆ R, dann gilt. Dies lässt sich induktiv mit dem Induktionsschritt
heißt die Polynomfunktion pn : R → R mit ' (
(n+1) d  (n)  d (−1)n n!
f (x) = f (x) =
!
n dx dx (1 + x)n+1
f (k) (x0 )
pn (x; x0 ) = (x − x0 )k , x ∈ R, (−1)n+1 n! (n + 1)
k! =
k=0
(1 + x)n+2
das Taylorpolynom vom Grad n zu f um den Ent-
zeigen. Also ergeben sich die Taylorpolynome bei Entwick-
wicklungspunkt x0 .
lung von f um x0 = 0 zu

Beachten Sie, dass das Taylorpolynom auch vom Entwick- p1 (x; 0) = 1 − x,


lungspunkt x0 abhängt. Wir kennzeichnen dies hier mit zu-
p3 (x; 0) = 1 − x + x 2 − x 3 ,
sätzlicher Angabe dieses Parameters durch Semikolon vom
Argument der Funktion getrennt. p5 (x; 0) = 1 − x + x 2 − x 3 + x 4 − x 5 .
15.5 Taylorreihen 587

In der Abbildung 15.26 ist die Approximationseigenschaft Mit der Verallgemeinerung des Mittelwertsatzes können wir
dieser Polynome an f (x) illustriert.  das Restglied in Abhängigkeit der Stelle x0 , dem Argument
x und dem Grad des Taylorpolynoms anders darstellen. Dies
p
p4 5
ermöglicht explizite Abschätzungen der Differenz f − pn ,
f f (x) also des Fehlers bei Approximation der Funktion f durch ihr
Taylorpolynom.

p3 4 Restglieddarstellung von Lagrange


Wenn f : (a, b) ⊆ R → R eine (n + 1)-mal stetig differen-
zierbare Funktion ist und x0 ∈ (a, b), dann gibt es zu jedem
x ∈ (a, b) eine Stelle z zwischen x und x0 mit
p2 3
1
rn (x; x0 ) = (x − x0 )n+1 f (n+1) (z) .
(n + 1)!

p1 2
Beweis: Das Restglied

!
n
f (j ) (x0 )
rn (x; x0 ) = f (x) − (x − x0 )j
j!
j =0

lässt sich bei fester Wahl von x0 und n als Funktion von
x auffassen. Es gilt für diese Funktion an der Stelle x0 die
Gleichung rn (x0 ; x0 ) = 0. Auch für die Ableitungen gilt
−1 −0.5 0.5 1 x (j )
rn (x0 ; x0 ) = 0 für j = 1, . . . , n, denn dies ist gerade
die Bedingung, die am Anfang an die Taylorpolynome ge-
stellt wurde. Differenzieren wir ein weiteres Mal, so folgt
(n+1)
rn (x; x0 ) = f (n+1) (x) für alle x ∈ (a, b), da die weite-
ren Terme im Restglied vom Taylorpolynom herrühren und
Abbildung 15.26 Approximation der Funktion, die durch 1/(1 + x) gegeben
ist, durch einige ihrer Taylorpolynome in einer Umgebung um x0 = 0. somit maximalen Grad n besitzen.
Nun wenden wir den verallgemeinerten Mittelwertsatz (siehe
? Seite 574) (n + 1)-mal an. Es folgt die Behauptung aus
Bestimmen Sie um den Entwicklungspunkt x0 = 1 das Tay-
lorpolynom vom Grad 3 zu der Funktion f (x) = exp(x). rn (x; x0 )
(x − x0 )n+1
rn (x; x0 ) − rn (x0 ; x0 ) rn (z1 ; x0 )
= =
Die Differenz zwischen Funktion und (x − x0 ) n+1 − (x0 − x0 ) n+1 (n + 1) (z1 − x0 )n
 
rn (z1 ; x0 ) − rn (x0 ; x0 )
Taylorpolynom – das Restglied
= = ...
(n + 1) ((z1 − x0 )n − 0n )
Wir erwarten auch in der Umgebung des Punktes x0 eine gute (n) (n) (n)
rn (zn ; x0 ) rn (zn ; x0 ) − rn (x0 ; x0 )
Approximation von f durch pn . Wie gut diese Approxima- = =
(n + 1)! (zn − x0 ) (n + 1)! ((zn − x0 ) − 0)
tion für Punkte x = x0 wirklich ist, bleibt noch zu analy-
(n+1)
sieren. Dazu definieren wir die Differenz zwischen Funktion rn (zn+1 ; x0 ) f (n+1) (zn+1 )
= =
und Taylorpolynom rn (x; x0 ) = f (x)−pn (x; x0 ), das Rest- (n + 1)! (n + 1)!
glied. Auch beim Restglied kennzeichnen wir durch Angabe
des Parameters die Abhängigkeit vom Entwicklungspunkt. mit Zwischenstellen zj +1 ∈ R mit |zj +1 − x0 | < |zj − x0 |
Anders ausgedrückt gilt mit dem Restglied die folgende Iden- für alle j = 1, . . . , n. Mit zn+1 = z ist die Existenz der
tität: Zwischenstelle in der Lagrange’schen Restglieddarstellung
gezeigt. 

Die Taylorformel
Die Darstellung einer n-mal stetig differenzierbaren Beispiel Betrachten wir als einfaches Beispiel f (x) = ex
Funktion f : (a, b) → R durch und x0 = 0. Wir rechnen aus: f (k) (x) = ex bzw. f (k) (0) =
f (x) = pn (x; x0 ) + rn (x; x0 ) 1. Somit ist

mit dem Taylorpolynom pn und dem Restglied rn um ei- !


n
1 k
nen Entwicklungspunkt x0 ∈ (a,b) heißt Taylorformel. f (x) = x + rn (x; 0)
k!
k=0
588 15 Differenzialrechnung – die Linearisierung von Funktionen

mit Im Spezialfall α = n ∈ N ist α . . . (α − n) = 0, also


1 rn (x; 0) = 0, und man erhält wieder die bekannte binomi-
rn (x; 0) = x n+1 ez
(n + 1)! sche Formel.
für ein z zwischen 0 und x. Die Taylorformel liefert eine Dar-
stellung des Fehlers, wenn wir die Reihe für exp(x) nach n+1 Nun untersuchen wir noch das Restglied. Zunächst beobach-
Termen abbrechen. Bislang konnten wir den Fehler nur bei ten wir, dass mit dem Quotientenkriterium folgt, dass für
alternierenden Reihen mit dem Leibniz-Kriterium abschät- |x| < 1 die Reihe
zen. ∞ ' ( 
! α
k
Als konkretes Beispiel kann man die Frage stellen: Wie groß x
k
muss n mindestens sein, damit der Fehler rn (x; 0) zwischen k=0
der Funktion f (x) = ex und dem Taylorpolynom pn für
absolut konvergiert; denn es ist
|x| ≤ 1 höchstens 10−2 ist?
) α  )
) k+1 )
|α − k|
Wir schätzen mit der Lagrange-Form des Restglieds ab: ) k+1 x )
lim ) α  k ) = lim |x| = |x| .
1 1 k→∞ ) x ) k→∞ k + 1
k
|rn (x; 0)| = |x|n+1 ez ≤ e1 .
(n + 1)! (n + 1)!   
Insbesondere ist somit αk x k eine Nullfolge. Nehmen wir
Dieser Ausdruck ist sicher kleiner als 10−2 für n ≥ 5. Wollen nun an, dass x ∈ (0, 1) und somit auch z ∈ (0, x) gilt, so
wir also ex für |x| ≤ 1 auf 2 Stellen hinter dem Komma genau ist für n > α − 1 der Term |1 + z|α−n−1 ≤ 1 im Restglied
berechnen, so können wir das Taylorpolynom p5 (x; 0) = beschränkt und wir erhalten:
5 1 k
k=0 k! x verwenden.  )' ()
) α ) n+1
|rn (x; 0)| ≤ )) ) |x| → 0 für n → ∞ . 
Beachten Sie, dass wir durch die Abschätzung des La- n+1 )
grange’schen Restglieds im letzten Beispiel auch das Ver-
halten |rn (x; x0 )| → 0 für n → ∞ sehen. Also konvergiert
das Taylorpolynom an der Stelle x gegen den Funktionswert Die Abschätzung des Lagrange’schen Restglieds im obigen
f (x) für n → ∞. Betrachten wir ein weiteres Beispiel. Beispiel scheitert für x ∈ (−1, 0). Deswegen betrachten wir
noch eine andere Restglieddarstellung, die nach dem Mathe-
Beispiel Zu einer beliebigen reellen Zahl α ∈ R ist die matiker Augustin Louis Cauchy (1789–1857) benannt ist.
Funktion f : R>−1 → R mit f (x) = (1 + x)α gegeben.
Berechnen wollen wir das zugehörige Taylorpolynom um Cauchy’sche Restglieddarstellung
den Entwicklungspunkt x0 = 0. Wenn f : (a, b) ⊆ R → R eine (n + 1)-mal stetig differen-
Es gilt f  (x) = α (1 + x)α−1 und weiter folgt induktiv: zierbare Funktion ist und x0 ∈ (a, b), dann gibt es zu jedem
x ∈ (a, b) ein τ ∈ (0, 1) mit
f (k) (x) = α (α − 1) · · · (α − k + 1) (1 + x)α−k , x > −1 ,
(x − x0 )n+1
für k ∈ N. Mit den Werten f (k) (0) lautet die Taylorformel rn (x; x0 ) = (1 − τ )n f (n+1) (x0 + τ (x − x0 )) .
vom Grad n ∈ N um den Entwicklungspunkt x0 = 0: n!

!
n
α · · · (α − k + 1) k
(1 + x)α = 1 + x + rn (x; 0)
k! Beweis: Zu x definieren wir die Funktion F : R → R
k=1
durch
mit der Lagrange-Darstellung des Restglieds !
n
f (j ) (y)
F (y) = f (x) − (x − y)j .
α . . . (α − n) j!
rn (x; 0) = (1 + z)α−n−1 x n+1 . j =0
(n + 1)!
Die Funktion ist so gewählt, dass F (x0 ) = rn (x; x0 ) und
Für beliebiges α ∈ R und k ∈ N ∪ {0}führt F (x) = 0 gilt. Außerdem ist F stetig differenzierbar mit
 man die verall-
gemeinerten Binomialkoeffizienten αk ein durch:
' ( ' ( F  (y) = −f  (y)
α α . . . (α − k + 1) α  
= und = 1. !
n
f (j +1) (y) f (j ) (y)
j j −1
k k! 0 − (x − y) − (x − y)
j! (j − 1)!
Beachten Sie, dass für α ∈ N diese mit den klassischen Bi- j =1

nomialkoeffizienten übereinstimmen. Dann schreibt sich mit !


n
f (j +1) (y) ! f (j +1) (y)
n−1
n ∈ N die Taylorformel einprägsam als =− (x − y)j + (x − y)j
j! (j )!
j =0 j =0
!n ' (
α k f (n+1) (y)
(1 + x)α = x + rn (x; 0) . =− (x − y)n .
k n!
k=0
15.5 Taylorreihen 589

Anwenden des Mittelwertsatzes auf die Funktion F mit Mit den Betrachtungen aus Kapitel 11 konnten wir bislang,
x = x0 + h liefert die Existenz von τ ∈ (0, 1) mit wie in den vorherigen Beispielen, zu Funktionen eine Potenz-
reihe angeben, wenn sich die Funktion irgendwie als Grenz-
rn (x; x0 ) = F (x0 + h) − F (x0 ) wert einer geometrischen Summe schreiben ließ oder wir
= F  (x0 + τ h)h die Funktion durch die Potenzreihe definiert haben. Die Tay-
f (n+1) (x0 + τ h) lorreihe bietet prinzipiell die Möglichkeit, auch in anderen
=− (x0 +h − (x0 +τ h))n h Fällen Potenzreihendarstellungen zu berechnen. Dazu muss
n!
aber noch geklärt werden, was die Taylorreihe innerhalb ihres
f (n+1) (x0 + τ h)
=− (h − τ h)n h Konvergenzradius mit den Funktionswerten der sie generie-
n! renden Funktion f zu tun hat. Dazu haben wir bereits zwei
f (n+1) (x0 + τ h) Aussagen fast gezeigt.
=− (1 − τ )n hn+1 . 
n!
Lemma
Ist eine Funktion f : (x0 − R, x0 + R) → R durch eine
Mit dieser Restglieddarstellung können wir das Beispiel ab- Potenzreihe
schließen.

!
f (x) = an (x − x0 )n
Beispiel Wir betrachten wieder die Funktion f (x) =
n=0
(1 + x)α und setzen für x ∈ (−1, 0) die Ableitung in die
Cauchy’sche Restglieddarstellung ein. Es folgt mit Konvergenzradius R > 0 gegeben, so ist dies die
Taylorreihe zu f , d. h., f ist unendlich oft differenzierbar
xn in x0 , und es gilt f (k) (x0 ) = k! ak für k ∈ N.
rn (x; 0) = − (1 − τ )n (α · · · · · (α − n))(1 + τ x)α−n−1
n! Ist f : {x ∈ R : |x − x0 | < d} → R eine in x0 ∈ R
bzw. unendlich oft differenzierbare Funktion und gilt für das
' ( ' ( Restglied zur Taylorformel
α 1−τ n
|rn (x; 0)| = |x|n (α − n) (1 + τ x)α−1 lim |rn (x; x0 )| = 0
n 1 − τ |x| n→∞

mit τ ∈ (0, 1). Da 1−τ


≤ 1 und |1 + τ x|α−1 ≤ für alle x ∈ (x0 − d, x0 + d), dann ist f lokal in eine
1−τ |x|
Potenzreihe entwickelbar mit Konvergenzradius R ≥ d,
α  (1 − n 
max{1, |x|)α−1 }
gilt, bleibt das Verhalten der Folge
und es gilt:
n (α − n)|x| n∈N
zu untersuchen. Analog zum Fall
x ∈ (0, 1) ergibt sich mit dem Quotientenkriterium, dass ∞
! f (n) (x0 )
es sich um eine Nullfolge handelt. Insbesondere strebt das f (x) = (x − x0 )n
Restglied gegen null. Fassen wir beide Fälle zusammen, so n!
n=0
haben wir gezeigt, dass die Taylorpolynome zu f für jedes
für |x − x0 | < R.
x ∈ (−1, 1) gegen den Funktionswert f (x) = (1 + x)α
konvergieren. 

Beweis: Die erste Aussage ergibt sich induktiv aus den


Vom Taylorpolynom zur Taylorreihe Ableitungen

!
Wenn die betrachtete Funktion unendlich oft differenzierbar f (k) (x) = n(n − 1) . . . (n − k + 1)an (x − x0 )n−k .
ist, können wir uns allgemein fragen, was passiert, wenn wir n=k
den Grad n im Taylorpolynom gegen unendlich gehen lassen.
Werten wir die Reihe auf der rechten Seite an der Stelle
Wir erhalten dann eine Potenzreihe, die von f und von der
x = x0 aus, so folgt:
Stelle x0 abhängt.
f (k) (x0 ) = k! ak .
Definition der Taylorreihe
Für die Koeffizienten der Potenzreihe gilt ak = f (k) (x0 )/k!.
Die Potenzreihe
Dies sind gerade die Koeffizienten der Taylorreihe. Die
∞ 
! f (n) (x0 ) Potenzreihe einer solchen Funktion ist also auch die Taylor-
n
(x − x0 ) , reihe zu dieser Funktion.
n!
n=0
Die zweite Aussage folgt direkt aus der Taylorformel mit
generiert durch eine unendlich oft differenzierbare Funk-
tion f : (a, b) → R um einen Entwicklungspunkt |f (x) − pn (x; x0 )| = |rn (x; x0 )| → 0 für n → ∞
x0 ∈ (a, b), heißt Taylorreihe zu f um x0 .
an einer Stelle x ∈ (x0 − d, x0 + d). 
590 15 Differenzialrechnung – die Linearisierung von Funktionen

Da der Weg, Potenzreihen über eine Taylorreihe zu ermitteln schätzen wir ab:
in den meisten Fällen aufwendig ist, wird man, wenn mög-
lich, versuchen, Potenzreihen durch Umformen und Einset- 1 (2x)2n
|r2n−1 (x; 0)| ≤ →0
zen bekannter Potenzreihen zu bestimmen. Häufig ist auch 2 (2n)!
die Idee nützlich, durch Betrachtung der Ableitung einer für n → ∞ (siehe Seite 287). Mit diesen Beweisschritten
Funktion eine Potenzreihe zu ermitteln. Wir haben dies im haben wir nun direkt aus der Taylorformel die Potenzreihe
Beispiel auf Seite 567 schon gesehen. zu sin2 um x0 = 0 hergeleitet.
Mit den Überlegungen zur allgemeinen binomischen
Beispiel
Reihe im Beispiel auf Seite 588 und dem zweiten Teil
Gesucht ist eine Potenzreihe zur Funktion f : R → R mit
des Lemmas haben wir insbesondere eine Potenzrei-
f (x) = sin2 x um den Entwicklungspunkt x0 = 0.
henentwicklung der Wurzelfunktion f : R>0 → R mit

Um die Potenzreihe zu finden, können wir mit den Addi- f (x) = x um x = 1 mit Konvergenzradius R = 1
tionstheoremen gezeigt. Denn es ist
1 − cos 2x √
f (x) = sin2 x = 1
x = (1 + (x − 1)) 2 .
2
schreiben. Nutzen wir die bekannte Potenzreihe für Also erhalten wir für |x − 1| < 1 die Darstellung
cos 2x, so folgt die Entwicklung:

! 1 · 3 · . . . · (2n − 3)
√ 1

1 1 ! (−1)n x = 1 + (x − 1) + (x − 1)n .
f (x) = − (2x)2n 2 2n n!
n=2
2 2 (2n)! 
n=0

! (−1)n−1 2n−1 2n
= 2 x
(2n)!
n=1
Nicht jede Taylorreihe konvergiert gegen die
für alle x ∈ R. sie generierende Funktion
Wir versuchen, dasselbe Ergebnis direkt aus der Definition
der Taylorreihe zu ermitteln. Mit den Ableitungen Im letzten Beispiel ergibt sich aus dem Quotientenkriterium
mit
f  (x) = sin 2x, f  (x) = 2 cos 2x f  (x) = −4 sin 2x ) )
) 1 · 3 · . . . · (2n − 1) 2n n! (x − 1)n+1 ))
)
usw. können wir induktiv zeigen, dass ) )
) 1 · 3 · . . . · (2n − 3)2n+1 (n + 1)! (x − 1)n )
 n−1
(n) 2 (−1)n/2−1 cos 2x, n gerade (2n + 1)
f (x) = = |x − 1| −→ |x − 1| , n→∞
2n−1 (−1)(n−1)/2 sin 2x, n ungerade 2(n + 1)

gilt. direkt der Konvergenzradius R = 1, d. h., die Taylorreihe


Es ergibt sich die Taylorreihe konvergiert für alle x ∈ (0, 2).

∞ Aber um zu zeigen, dass es sich bei dieser Reihe um die Po-


! f (k) (0)
p∞ (x; 0) = f (0) + x k tenzreihe zur Wurzelfunktion handelt, mussten wir zeigen,
k=1
k! dass das Restglied rn (x; 1) für n → ∞ gegen null strebt.

! Diese Arbeit können wir uns nicht ersparen, denn es gibt Tay-
(−1)n−1 22n−1 2n
= x . lorreihen, die nicht gegen den Funktionswert konvergieren.
(2n)!
n=1

Ohne die Kenntnis des Konvergenzradius sehen wir zwar Achtung: Es gibt Taylorreihen, die zwar konvergieren,
mit dem Quotientenkriterium, dass die Reihe für alle aber nicht gegen den Funktionswert f (x) der sie generie-
x ∈ R konvergiert, wegen renden Funktion f .
) )
) 22j +1 (2j )! x 2j +2 )
)
)
)
)=
4
|x|2 → 0 ?
) (2j + 2)! 2 2j −1 x 2j ) (2j + 1)(2j + 2) Geben Sie die Taylorreihe zur Funktion f : R → R mit
f (x) = |x| um den Entwicklungspunkt x0 = 1 an, und
für j → ∞. Aber um zu beweisen, dass die so gewonnene vergleichen Sie die Funktion und die Taylorreihe.
Reihe die Potenzreihe zu sin2 um x0 = 0 ist, bleibt noch
zu zeigen, dass das Restglied gegen null konvergiert. Mit
Damit die durch die Taylorreihe gegebene Potenzreihe in ih-
f (2n) (ξ ) 2n 22n−1 (−1)n−1 cos 2ξ 2n rem Konvergenzkreis mit der Funktion f übereinstimmt, darf
r2n−1 (x; 0) = x = x
(2n)! (2n)! die oben geforderte Bedingung nicht außer Acht gelassen
15.5 Taylorreihen 591

Beispiel: Bestimmung von Taylorreihen


Wir stellen uns die Aufgabe, Taylorreihen um x0 = 0 zu den Funktionen f, g : (−1, 1) → R mit
' (
1 x+1
f (x) = artanh x = ln und g(x) = arcsin x
2 x−1

zu berechnen.
Problemanalyse und Strategie: Um die Taylorreihen zu ermitteln, versuchen wir, schon bekannte Potenzreihen zu
nutzen. Im ersten Fall schreiben wir f (x) = 21 (ln(1 + x) − ln(1 − x)) und verwenden die Potenzreihe zum Logarithmus.
%
Im zweiten Beispiel betrachten wir die Ableitung der Funktion g mit g  (x) = 1/ 1 − x 2 und nutzen die allgemeine
binomische Reihe.

Lösung: Für die Funktion g nutzen wir die binomische Reihe


Die Darstellung
∞ ' 1(
!
1 −
1  (1 + x)− 2 = 2 xn
artanh x = ln(1 + x) − ln(1 − x) n=0
n
2
ermöglicht es uns, die Potenzreihen für |x| < 1 (siehe Übersicht auf Seite 592). Es folgt:

! 1
(−1)n n g  (x) = %
ln(1 + x) = − x
n 1 − x2
! '− 1 (
n=1

= 2 (−1)n x 2n
und n
n=0

! ∞
! ∞ ' (
(−1)n 1 n ! 1 n 1 · 3 · 5 · . . . (2n − 1)
ln(1 − x) = − (−x)n = − x = − (−1)n x 2n
n n 2 n!
n=1 n=1 n=0
!∞
für |x| < 1 zu betrachten (siehe Beispiel auf Seite 572). 1 · 3 · 5 · . . . (2n − 1) 2n
= x .
Bilden wir die Differenz, so ergibt sich wegen der absolu- 2n n!
n=0
ten Konvergenz die Potenzreihe
 ∞ ∞
 Da diese Potenzreihe in ihrem Konvergenzintervall die
1 ! (−1)n ! 1 n
artanh x = − n
x + x Ableitung von
2 n n
n=1 n=1 ∞

! 1 · 3 · 5 · . . . (2n − 1) 2n+1
1! 1 x
= (1 + (−1)n−1 ) x n (2n + 1)2n n!
2 n n=0
n=1

! 1 ist und die Reihe für x = 0 den Wert arcsin(0) = 0 an-
= x 2k−1 . nimmt, haben wir die Potenz- und Taylorreihe zu arcsin
2k − 1
k=1 um den Entwicklungspunkt x0 = 0 ermittelt.

werden, dass das Restglied eine Nullfolge bilden muss. Das zeigt man, dass für x = 0 jede Ableitung von der Form
folgende Gegenbeispiel zeigt, dass diese Schwierigkeit beim 
Umgang mit Taylorreihen auch bei unendlich oft differen- qk (x)
(k) exp(−1/x) , x > 0
zierbaren Funktionen auftritt. Das Beispiel zeigt auch, dass f (x) = x 2k
0, x<0
die Menge der unendlich oft differenzierbaren Funktionen
auf einem Intervall mehr Funktionen umfasst als die ana-
mit einem Polynom qk vom Grad ≤ k ist.
lytischen, also die Funktionen, die sich in eine Potenzreihe
entwickeln lassen. Jetzt benötigen wir den Grenzwert

Beispiel Die Funktion f : R → R mit 1 −1/x


 lim e = 0.
exp(−1/x) , x > 0 , x→0 xm
f (x) =
0, x≤0
für x > 0 und für jeden Grad m ∈ N. Dies sehen wir mit der
ist beliebig oft differenzierbar. Durch vollständige Induktion Potenzreihe zur Exponentialfunktion. Setzen wir t = 1/x > 0,
592 15 Differenzialrechnung – die Linearisierung von Funktionen

Übersicht: Potenzreihen und Taylorreihen


Zusammenstellung einiger Potenzreihenentwicklungen und die zugehörigen Konvergenzbereiche.

Die allgemeine binomische Reihe Trigonometrische Funktionen

∞ ' (
!

! (−1)n 2n
α α n cos x = für x ∈ C
(1 + x) = x für |x| < 1 (2n)!
x
n n=0
n=0
!∞
(−1)n 2n+1
mit dem verallgemeinerten Binomialkoeffizienten sin x = x für x ∈ C
(2n + 1)!
n=0
' ( ∞
α α · . . . · (α − n + 1) ! 22n (22n − 1)B2n 2n−1 π
= . tan x = x , |x| <
n n! (2n)! 2
n=1

Die Exponentialfunktion π ! 1 · 3 . . . (2n − 1) 2n+1
arccos x = − x , |x| < 1
2 (2n + 1) 2n n!

! n=1
1 n ∞
exp(x) = x für x ∈ C ! 1 · 3 . . . (2n − 1) 2n+1
n! arcsin x = x , |x| < 1
n=0 (2n + 1) 2n n!
!∞ n=1
1 2n ∞
cosh(x) = x für x ∈ C ! (−1)n 2n+1
(2n)! arctan x = x , |x| < 1
n=0 (2n + 1)
!∞ n=0
1 ∞
sinh(x) = x 2n+1 für x ∈ C π ! (−1)n 2n+1
(2n + 1)! arccot x = − x , |x| < 1
n=0 2 (2n + 1)
!∞ n=0
(−1)n+1 22n (22n − 1)B2n π
tanh(x) = x 2n−1 , |x| <
(2n)! 2 Mit B2k sind die sogenannten Bernoulli-Zahlen bezeich-
n=1

net, die sich rekursiv aus
! xn
ln(x + 1) = (−1)n+1
, |x| < 1 n '
! (
n n+1
n=1 B0 = 1 und Bk = 0
' ( ∞
!
k
1 1+x 1 k=0
artanh x = ln = x 2n+1 , |x| < 1
2 1−x 2n + 1 für n ∈ N berechnen lassen.
n=0

so lässt sich abschätzen: für alle m = 0, 1, 2, . . ., und der Grenzwert folgt aus dem
Majorantenkriterium. Daher ist in unserem Beispiel die k-
1 −1/x tm tm
e = t = te Ableitung f (k) für jedes k = 0, 1, 2, . . . ergänzbar mit
x m e ∞ 1 k
k=0 k! t f (k) (0) = 0 zu einer stetigen Funktion auf R. Jedes Taylor-
tm polynom um Entwicklungspunkt x0 = 0 ist konstant null.
≤ 1 m+1 Für keinen Wert x > 0 konvergiert pn (x; 0) n∈N gegen den
(m+1)! t
Funktionswert f (x). 
1
= (m + 1)! → 0 , für t → ∞ ,
t
Zusammenfassung 593

Zusammenfassung

Änderungsrate, Steigung des Graphen und Linearisierung, lung der Differenz von Funktionswerten bei differenzierba-
alle drei Betrachtungen führen auf den zentralen Begriff die- ren Funktionen.
ses Kapitels, die Ableitung.
Der Mittelwertsatz
Definition der Ableitung Ist f : [a, b] ⊆ R → R eine stetige Funktion, die auf
Eine Funktion f : I → R, die auf einem offenen Inter- (a, b) differenzierbar ist, dann gibt es eine Zwischen-
vall I ⊆ R gegeben ist, heißt an einer Stelle x0 ∈ I stelle z ∈ (a, b) mit
differenzierbar, wenn der Grenzwert
f (b) − f (a) = f  (z) (b − a) .
f (x) − f (x0 )
lim
x→x0 x − x0 Der Mittelwertsatz lässt sich zur Abschätzung von Diffe-
x=x0
renzen von Funktionswerten sowie bei Grenzwerten nutzen.
existiert. Diesen Grenzwert nennt man die Ableitung Eine Verallgemeinerung führt unter anderem auf die Regeln
von f in x0 . Er wird mit f  (x0 ) bezeichnet. von L’Hospital. Mit dem Mittelwertsatz lassen sich darüber
hinaus Eigenschaften des Verhaltens von Funktionen, wie
Die Ableitung eines gegebenen Ausdrucks anhand der De- Monotonie und Konvexität und auch Extremalstellen anhand
finition zu bestimmen, ist mühselig. Mit den grundlegenden der Ableitung charakterisieren. Diese Zusammenhänge sind
Techniken der Produktregel in der Übersicht auf Seite 586 aufgelistet.
Deutlich wird die Beziehung zwischen einer Funktion und
(fg) (x) = f (x)g  (x) + f  (x)g(x) ihren Ableitungen anhand der Taylorpolynome:
und der Kettenregel !
n
f (k) (x0 )
pn (x; x0 ) = (x − x0 )k , x ∈ R.
(g ◦ f ) (x) = g  (f (x))f  (x) k=0
k!

lässt sich das Differenzieren aber auf einige wenige Ablei- Gilt für das Restglied, die Differenz zwischen Funktion und
tungen zurückführen. Taylorpolynom, mit wachsendem Grad, dass
Ist eine Funktion in eine Potenzreihe entwickelbar, so ist sie |f (x) − pn (x, x0 )| → 0, n → ∞,
im Konvergenzbereich beliebig oft differenzierbar, und die
Ableitung ist durch die gliedweise differenzierte Reihe gege- so ist die Funktion in eine Potenzreihen entwickelbar. Und
ben. Beim Beweis zeigt sich ein weiteres Mal die Bedeutung diese Potenzreihe ist durch die Taylorreihe gegeben.
gleichmäßiger Abschätzungen beim Vertauschen von Grenz-
prozessen, hier im Fall von Differenzquotienten zu Partial-
Definition der Taylorreihe
summen.
Die Potenzreihe
Die bei Differenzierbarkeit sinnvolle Approximation durch ∞ 
Linearisierung ! f (n) (x0 )
n
(x − x0 ) ,
n!
f (x) = f (x0 ) + f  (x0 )(x − x0 ) +o(|x − x0 |) . n=0

„Linearisierung“ generiert durch eine unendlich oft differenzierbare Funk-
tion f : (a, b) → R um einen Entwicklungspunkt
hat weitreichende Konsequenzen beim Umgang mit Funk- x0 ∈ (a, b), heißt Taylorreihe zu f um x0 .
tionen. So liefert der Mittelwertsatz eine nützliche Darstel-
594 15 Differenzialrechnung – die Linearisierung von Funktionen

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 15.7 •• Zeigen Sie durch eine vollständige Induktion


die Ableitungen
15.1 • Zeigen Sie, dass eine differenzierbare Funktion
f : (a, b) → R affin-linear ist, wenn ihre Ableitung konstant dn x √ n x  nπ 
ist. (e sin x) = ( 2) e sin x +
dx n 4

15.2 •• Untersuchen Sie die Funktionen fn : R → R für n = 0, 1, 2, . . .


mit ⎧
⎨ 1 15.8 •• Wenden Sie das Newton-Verfahren an, um die
x n cos , x = 0 ,
fn (x) = x Nullstelle x = 0 der beiden Funktionen
⎩ 0, x=0
 4/3
x , x ≥ 0,
für n = 1, 2, 3 auf Stetigkeit, Differenzierbarkeit oder stetige f (x) =
−|x|4/3 , x<0
Differenzierbarkeit.
und √
15.3 •• Zeigen Sie, dass die Funktion f : R → R mit x, x ≥ 0,
f (x) = x 4 konvex ist, g(x) = √
− |x| , x<0
(a) indem Sie nach Definition f (λx + (1 − λ)y) ≤ λf (x) +
(1 − λ)f (y) für alle λ ∈ [0, 1] prüfen, zu bestimmen. Falls das Verfahren konvergiert, geben Sie
(b) mittels der Bedingung f  (x)(y − x) ≤ f (y) − f (x). die Konvergenzordnung an und ein Intervall für mögliche
Startwerte.
15.4 •• Wie weit kann man bei optimalen Sichtverhält-
nissen von einem Turm der Höhe h = 10 m sehen, wenn 15.9 • Zeigen Sie, dass die Abschätzungen
die Erde als Kugel mit Radius R ≈ 6 300 km angenommen
wird? π 1−x π
≤ arctan(x) + ≤
4 1 + x2 2
15.5 • Beweisen Sie: Wenn f : [0, 1] → R stetig dif-
für alle x ∈ R≥0 gelten.
ferenzierbar ist mit f (0) = 0 und f (1) f  (1) < 0, so gibt es
eine Stelle x̂ ∈ (0, 1) mit der Eigenschaft f  (x̂) = 0.
15.10 •• Bestimmen Sie die Potenzreihe zu f : R>0
→ R mit f (x) = 1/x 2 um den Entwicklungspunkt x0 = 1
Rechenaufgaben und ihren Konvergenzradius .

15.6 • Berechnen Sie die Ableitungen der Funktionen


15.11 • Bestimmen Sie zu
f : D → R mit
 
' (2 3 x3
1 f (x) = x cosh
f1 (x) = x + , x = 0 6
x
f2 (x) = cos(x 2 ) cos2 x , x∈R die Werte der 8. und 9. Ableitung an der Stelle x = 0 .
ex − 1
f3 (x) = ln( x ) , x  = 0
e 15.12 • Bestimmen Sie die Taylorreihe zu f : R → R
x
f4 (x) = x x , x > 0 mit f (x) = x exp(x − 1) zum einen direkt und andererseits
mithilfe der Potenzreihe zur Exponentialfunktion. Unter-
auf dem jeweiligen Definitionsbereich der Funktion. suchen Sie weiterhin die Reihe auf Konvergenz.
Aufgaben 595

15.13 •• Zeigen Sie für |x| < 1 die Taylorformel 15.19 •• Gegeben sind Zahlen xj ∈ [a, b], λj ∈ (0, 1)
für j = 1, . . . , n und nj=1 λj = 1.
1−x
ln (a) Zeigen Sie, dass für eine konvexe Funktion f : [a, b] → R
1+x
  die Ungleichung
x3 x 2n−1 ⎛ ⎞
= −2 x + + ··· + + r2n (x; 0) !n !n
3 2n − 1
f⎝ λj xj ⎠ ≤ λj f (xj )
mit dem Restglied j =1 j =1

' ( gilt.
−x 2n+1 1 1
r2n (x; 0) = + (b) Beweisen Sie für positive Zahlen xj ≥ a > 0 die Un-
2n + 1 (1 + tx) 2n+1 (1 − tx)2n+1 gleichung zwischen gewichteten arithmetischen und geome-
für ein t ∈ (0, 1). trischen Mittelwerten:

Approximieren Sie mithilfe des Taylorpolynoms vom Grad 


n
λ !
n
xj j ≤ λj xj .
n = 2 den Wert ln(2/3) und zeigen Sie, dass der Fehler
j =1 j =1
kleiner als 5 · 10−4 ist.

15.14 • Berechnen Sie die vier Grenzwerte 15.20 ••• Zeigen Sie, dass eine konvexe Funktion
f : [a, b] → R auf einem kompakten Intervall [a, b]
ln(ln x) 1 1
lim , lim − , (a) nach oben beschränkt und
x→∞ ln x x→0 ex − 1 x
(b) in x ∈ (a, b) stetig ist.
x a − ax
lim cot(x)(arcsin(x)) , lim , a ∈ R>0 \{1} .
x→0 x→a ax − aa 15.21 •• Begründen Sie, dass eine 2n-mal stetig diffe-
renzierbare Funktion f : (a, b) → R mit der Eigenschaft
15.15 • Bestimmen Sie eine Konstante c ∈ R, sodass f  (x̂) = · · · = f (2n−1) (x̂) = 0
die Funktion f : [−π/2, π/2] → R
 1
und
x2 x = 0 , f (2n) (x̂) > 0
f (x) = (cos x) ,
c, x=0 im Punkt x̂ ∈ (a, b) ein Minimum hat.
stetig ist.
15.22 • Beweisen Sie zur Taylorformel die Restglied-
darstellung von Schlömilch:
Beweisaufgaben
(x − x0 )n+1
15.16 • Beweisen Sie induktiv die Leibniz’sche Formel rn (x; x0 ) = (1−τ )n+1−p f (n+1) (x0 +τ (x−x0 ))
n! p
für die n-te Ableitung eines Produkts zweier n-mal differen-
zierbarer Funktionen f und g: mit p ∈ N, indem sie den verallgemeinerten Mittelwertsatz
anwenden auf die Funktion F : R → R aus dem Beweis zum
n ' (
! n (k) (n−k) Cauchy’schen Restglied und die Funktion G : R → R mit
(fg)(n) = f g für n ∈ N0 .
k G(y) = (x − y)p .
k=0

15.23 ••• Neben dem Newton-Verfahren gibt es zahlrei-


15.17 •• Zeigen Sie, dass es genau eine Funktion che andere iterative Methoden zur Berechnung von Nullstel-
f : R>0 → R gibt (den Logarithmus), mit den beiden Ei- len von Funktionen. Das sogenannte Halley-Verfahren etwa
genschaften: besteht ausgehend von einem Startwert x0 in der Iterations-
vorschrift
f (xy) = f (x) + f (y) , f (x) ≤ x − 1 ,
f (xj )f  (xj )
xj +1 = xj − , j ∈ N.
indem Sie beweisen: f ist differenzierbar mit der Ableitung (f  (xj ))2 − 21 f  (xj )f (xj )
f  (x) = x1 .
Beweisen Sie mithilfe der Taylorformeln erster und zwei-
15.18 •• Zeigen Sie, dass der verallgemeinerte Mittel- ter Ordnung, dass das Verfahren in einer kleinen Umgebung
wert für x → 0 gegen das geometrische Mittel positiver um eine Nullstelle x̂ einer dreimal stetig differenzierbaren
Zahlen a1 , . . . ak ∈ R>0 konvergiert, d. h., es gilt: Funktion f : D → R mit der Eigenschaft f  (x̂) = 0 sogar
kubisch konvergiert, d. h., es gilt in dieser Umgebung
⎛ ⎞1 G
!
n x H
1 H n |x̂ − xj +1 | ≤ c|x̂ − xj |3
lim ⎝ x⎠
aj = I
n aj .
x→0 n
j =1 j −1 mit einer von j unabhängigen Konstanten c > 0.
596 15 Differenzialrechnung – die Linearisierung von Funktionen

Antworten der Selbstfragen

S. 554 S. 567
Wenn wir die Betragsfunktion um die Stelle x0 = 0 betrach- Mit der Potenzreihendarstellung
ten, so gilt:

!
f (x + h) − f (x − h) |h| − |h| 1 n
lim = lim =0 exp(x) = ex = x
h→0 2h h→0 2h n!
n=0
h=0 h =0

Der Grenzwert existiert somit, aber die Funktion ist in x0 = für x ∈ R folgt:
0 nicht differenzierbar, wie wir im Beispiel auf Seite 553

! ∞
gesehen haben. n n−1 ! 1
exp (x) = x = x n−1 .
n! (n − 1)!
S. 555 n=1 n=1
Die Ableitung im Sinne der Linearisierung einer Funktion
ist ein analytisches Konzept. Die Anschauung als Steigung Verschiebt man den Index n − 1  n, so bestätigt sich das
der Tangente an einem Graphen ist hingegen eher ein geo- frühere Resultat
metrischer Zugang. Die Interpretation der Ableitung als Än- ∞
! 1 n
derungsrate, bzw. bei zeitlicher Änderung einer Ortsvariable exp (x) = x = exp(x) .
als Geschwindigkeit, ist physikalischer Natur. n!
n=0

S. 559
Da |x sin(1/x)| ≤ |x| → 0 für x → 0 gilt, ist die Funktion
stetig in null mit f (0) = 0. Der Differenzenquotient für S. 570
x = 0 ist Da entweder ein Maximum oder ein Minimum nicht am Rand
' (
f (x) − f (0) 1 der Funktion liegen kann, gibt es eine Stelle mit verschwin-
= sin , dender Ableitung, wie die Skizze in Abbildung 15.14 eines
x−0 x
möglichen Graphen illustriert.
d. h., der Grenzwert x → 0 existiert nicht, die Funktion ist
in null nicht differenzierbar.
f (x)
S. 559
Es gilt f (n) ∈ C r−n (a, b).

S. 563
a) Mit Ketten- und Produktregel ergibt sich:

f  (x) = (sin x + x cos x)ex sin x . a x̂ b x

b) Sehen wir den Ausdruck etwa als Komposition von 1/x Abbildung 15.27 Illustration zum Satz von Rolle.
und dem Nenner an, so folgt mit der Kettenregel:
1
f  (x) = − (cos2 x − sin2 x)
2 + sin x cos x S. 575
1 − 2 cos2 x Nur im ersten Beispiel ist die Regel anwendbar, denn sowohl
= . für den Zähler als auch für den Nenner gilt sin x → 0 und
2 + sin x cos x
x → 0 für x → 0. Damit ergibt sich der Grenzwert
S. 565
Es gilt: x 1
lim = lim = 1.
x→0 sin x x→0 cos x
f (t) = (eat (cos(bt) + i sin(bt))
= aeat (cos(bt) + i sin(bt)) + beat (− sin(bt) + i cos(bt)) Im zweiten Fall ist der Grenzwert des Nenners, cos x → 1
für x → 0, von null verschieden, und die Regel ist nicht
= (a + ib)eat (cos(bt) + i sin(bt))
anwendbar. Der Grenzwert ergibt sich in diesem Fall direkt
= zezt . zu
x 0
Man beachte, dass sich die Rechenregel aus dem Reellen lim = = 0.
überträgt. x→0 cos x 1
Antworten der Selbstfragen 597

S. 578 (l) f (l) (x0 )


ist. Damit ergibt sich pn (x0 ; x0 ) = 1 (x − x0 )0 =
Als Beispiel dient etwa die Oszillationsstelle bei der differen- f (l) (x0 ).
zierbaren Funktion f : R → R mit f (x) = 2x + x 2 sin(1/x)
für x = 0 (siehe Beispiel auf Seite 558). S. 587
Mit den Ableitungen
S. 578
Im Fall der strengen Monotonie folgt im Allgemeinen nur, f (k) (x) = ex
dass f  ≥ 0 ist, auch wenn f streng monoton ist. Betrachten
wir z. B. den Sattelpunkt x = 0 zur Funktion f : R → R erhalten wir für f das Taylorpolynom dritten Grades
mit f (x) = x 3 . Die Funktion f ist streng monoton steigend,
aber im Punkt x = 0 ist f  (x) = 0. !
3
e1
p3 (x; 1) = (x − 1)k
k!
k=0
S. 580 ' (
Angenommen eine Funktion ist konstant zwischen x und y 1 1
= e 1 + (x − 1) + (x − 1)2 + (x − 1)3 .
mit einem Wert c ∈ R, dann ist 2 6

c = f (x + t (y − x)) = (1 − t)c + tc = (1 − t)f (x) + tf (y) ,


S. 590
also kann die Funktion nicht strikt konvex sein. Die Taylorreihe zu f ist eine endliche Summe, da alle höhe-
ren Ableitungen verschwinden:
S. 586
Induktiv erhalten wir für l = 0, . . . , n, dass p∞ (x; 1) = 1 + (x − 1).
!
n
f (k) (x0 ) Offensichtlich stimmen Funktion und Taylorreihe nur für
pn(l) (x; x0 ) = (x − x0 )k−l
(k − l)! x ≥ 0 überein. Für x < 0 ist f (x) = p∞ (x; 1).
k=l
Integrale – von lokal
zu global 16
Wie definiert man das Integral?
Was ist eine Stammfunktion
und wie lässt sie sich
bestimmen?
Welche Bedeutung hat der Satz
von Beppo Levi?

16.1 Integration von Treppenfunktionen . . . . . . . . . . . . . . . . . . . . . . . 600


16.2 Das Lebesgue-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604
16.3 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613
16.4 Integrationstechniken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 618
16.5 Integration über unbeschränkte Intervalle oder Funktionen 622
16.6 Parameterabhängige Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 633
16.7 Weitere Integrationsbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650
600 16 Integrale – von lokal zu global

Neben der Differenzialrechnung ist die Integralrechnung die f (x)


zweite tragende Säule der Analysis. Während sich die Differen-
zialrechnung in erster Linie mit dem lokalen Änderungsverhal- c
ten von Funktionen befasst, macht die Integralrechnung globale b
Aussagen. Entscheidend ist der Zusammenhang – das Integrie- f (x)dx
ren lässt sich als Umkehrung des Differenzierens auffassen. a
Bleiben wir, wie schon beim Differenzieren, bei skalarwertigen a b x
Funktionen in einer reellen Variablen. Der Ansatzpunkt für den
Integralbegriff ist das Problem des Inhalts der Fläche zwischen Abbildung 16.1 Die Fläche unter dem Graphen einer konstanten Funktion ist
dem Graphen einer Funktion und der x-Achse. Dabei gibt es ein Rechteck.

verschiedene Möglichkeiten, zu einer sinnvollen Definition zu


gelangen. Wir stellen einen zentralen Integralbegriff ausführlich Im einfachsten Fall einer konstanten Funktion f mit f (x) = c
vor, der nach dem französischen Mathematiker Henri Leon für alle x ∈ [a, b] ist die Fläche zwischen dem Intervall [a, b]
Lebesgue (1875–1941) benannt ist. auf der x-Achse und dem Graphen der Funktion ein Rechteck
Da die subtilen Unterschiede der verschiedenen Definitionen zum mit Flächeninhalt A = c (b − a) (Abb. 16.1). Mit dieser
Integral mathematisch Grundlegendes beleuchten, diskutieren Fläche beginnen wir und erweitern die Idee auf stückweise
wir in Abschnitt 16.7 zwei weitere häufig gewählte Zugänge, konstante Funktionen.
über Regelfunktionen und über Riemann-Summen. Das gesamte
Kapitel ist so aufgebaut, dass ein erster elementarer Einstieg
in die Integralrechnung durch die Kapitel 16.1, 16.3 und 16.4
Treppenfunktionen sind stückweise konstant
gegeben ist, wenn man zunächst auf Details einer exakten
Eine Funktion f : [a, b] → R ist eine Treppenfunktion,
Definition verzichtet. Bei stetigen Funktionen auf kompakten
wenn es eine Zerlegung Z = {x0 , x1 , . . . , xn } mit
Intervallen ergeben sich letztlich dieselben Eigenschaften, so-
dass Unterschiede der verschiedenen Integralbegriffe erst in a = x0 < x1 < x2 < · · · < xn−1 < xn = b
Abschnitt 16.5 und 16.6 zum Tragen kommen.
des Intervalls [a, b] gibt und Zahlen cj ∈ R, j = 1, . . . , n,
sodass stückweise

16.1 Integration von f (x) = cj für x ∈ (xj −1 , xj )


Treppenfunktionen für j = 1, . . . , n gilt. Die Werte der Treppenfunktionen an
den Nahtstellen, xj , spielen für die Eigenschaft von f , eine
Das ursprüngliche Problem, das zum Begriff des bestimm- Treppenfunktion zu sein, keine Rolle. In Abbildung 16.2 ist
ten Integrals führt, ist die Bestimmung von Flächeninhalten. der Graph einer Treppenfunktion abgebildet.
Während die Frage für einfache Flächen, wie etwa Recht-
Addieren bzw. Subtrahieren der Flächeninhalte aller Recht-
ecke oder Dreiecke, schon von der elementaren Geometrie
ecke zwischen x-Achse und Graph einer Treppenfunktion
beantwortet wird, ist sie für allgemeine Flächen nicht direkt
zugänglich.
f (x)
Die Integralrechnung fragt nach
Flächeninhalten

Der Begriff des Flächeninhalts wird anhand von Rechtecken


bzw. Quadraten definiert. Man erklärt etwa, dass ein Quadrat
mit einem Meter Seitenlänge einen Flächeninhalt von einem
Quadratmeter hat. Alle anderen Flächenangaben sind dann
relative Angaben, wie vielen derartigen Quadraten der Inhalt x
einer Fläche entspricht.
Von daher stammt auch der Ausdruck Quadratur für Flächen-
bestimmung bzw. für die bestimmte Integration. Manchmal
wird Quadratur allerdings in einem engeren Sinne verwen-
det, nämlich als Umwandlung einer gegebenen Fläche in ein
flächengleiches Quadrat nur mittels Zirkel und Lineal. In die-
sem Sinne ist die berühmte Quadratur des Kreises tatsächlich
nicht möglich. Abbildung 16.2 Eine Treppenfunktion ist stückweise konstant.
16.1 Integration von Treppenfunktionen 601

liefert die Summe Die Integration ist eine lineare Abbildung


!
n
S(Z) = cj (xj − xj −1 ) . Wir haben zwar nun einen Integralbegriff, aber die Menge
j =1 der integrierbaren Funktionen ist noch sehr eingeschränkt.
Trotzdem ergibt sich bereits eine lineare Struktur. Sind f, g
Treppenfunktionen, so gibt es eine Zerlegung des Intervalls,
Lemma f g
Die Summe S(Z) zu einer Treppenfunktion f : [a, b] → R etwa die Vereinigung aller Nahtstellen xj , xj zu f und g,
ist unabhängig von der Wahl der Zerlegung Z. sodass f und g beide konstant sind auf den Teilintervallen,
d. h. die Summe zweier Treppenfunktionen ist wiederum eine
Treppenfunktion. Außerdem ist λf mit λ ∈ R eine Treppen-
Beweis: Nehmen wir zu f und einer Zerlegung Z eine funktion. Die Menge der Treppenfunktionen bildet also einen
weitere Stelle t ∈ [xl−1 , xl ] hinzu, so gilt: Vektorraum. Da das Integral für Treppenfunktionen eine end-
!
n liche Summe ist, gilt weiter
cj (xj − xj −1 ) = cl (xl − t) + cl (t − xl−1 ) J J J
b b b
j =1
f (x) + g(x) dx = f (x) dx + g(x) dx
!
n a a a
+ cj (xj − xj −1 ) .
j =1,j  =l und J J
b b
Also ändert der weitere Zerlegungspunkt den Wert der λf (x) dx = λ f (x) dx .
a a
Summe nicht.
Das Integrieren ist somit eine lineare Abbildung vom Vek-
Betrachten wir nun zu f zwei Zerlegungen Z mit a = x0 < torraum der Treppenfunktionen in die reellen Zahlen.
x1 · · · < xn = b und Z̃ mit a = y0 < y1 · · · < ym = b, so
bildet die Vereinigung Z ∪ Z̃ eine neue Zerlegung. Diese fügt
sowohl zur Zerlegung Z als auch zur Zerlegung Z̃ endlich Approximation durch Treppenfunktionen
viele Punkte hinzu. Also folgt mit der ersten Beobachtung: liefert weitere integrierbare Funktionen
S(Z) = S(Z ∪ Z̃) = S(Z̃) .
Ziel ist es, den Integralbegriff auf einen möglichst großen
Die Summen sind gleich.  Vektorraum von Funktionen auszudehnen, zu dem unter an-
derem auch die stetigen Funktionen gehören.
Wegen dieser Überlegung können wir durch Eine naheliegende Idee besteht darin, eine Funktion durch
J b !
n Treppenfunktionen so anzunähern, dass die Folge der Inte-
f (x) dx = cj (xj − xj −1 ) grale konvergiert. Die Grenzfunktion ist dann eine integrier-
a j =1 bare Funktion und der Grenzwert der Integrale der Trep-
penfunktionen wird als Integralwert der Funktion definiert.
das Integral der Treppenfunktion f : [a, b] → R mit
Mathematisch stoßen wir an dieser Stelle auf Schwierigkei-
f (x) = cj ∈ R innerhalb der Teilintervalle x ∈ (xj −1 , xj )
ten: Was heißt denn „Annähern“ einer Funktion?
definieren.

Beim Integralzeichen sind a bzw. b die untere bzw. obere f (x)
Integrationsgrenze, x die Integrationsvariable, f der In-
tegrand und dx das Differenzial (siehe Seite 555).
f3
f2
Kommentar: Das Integralzeichen ist ein stilisiertes S f1
und soll daran erinnern, dass das Integral aus einer Summe
hervorgeht.

?
Berechnen Sie den Wert des Integrals
J 1 x
f (x) dx Abbildung 16.3 Annäherung einer Funktion durch Treppenfunktionen.
0
für die Treppenfunktion f : [0, 1] → R mit Es ist erforderlich, Folgen von Treppenfunktionen zu be-
' (
n−1 n trachten. In Anlehnung an die bereits bekannten Notationen
f (x) = (−1)n n für x ∈ , , n = 1, 2, . . . , 10. bei Zahlenfolgen definieren wir Monotonie und eine erste
10 10
Variante von Konvergenz bei Folgen von Funktionen.
602 16 Integrale – von lokal zu global

Punktweise Konvergenz von Funktionenfolgen Beweis: Ist (fn ) gleichmäßig konvergent gegen die Funk-
tion f , so gibt es zu ε > 0 ein N ∈ N mit |fn (x) − f (x)| ≤ ε
Eine Folge (fn )n∈N von Funktionen fn : D → R mit
für alle x ∈ D und n ≥ N. Da die Menge {|fn (x) − f (x)| |
gemeinsamer Definitionsmenge D ⊆ R heißt mono-
x ∈ D} beschränkt ist, existiert ein Supremum, und die Ab-
ton wachsend (fallend), wenn
schätzung bleibt für das Supremum erhalten:
 
fn+1 (x) ≥ fn (x) bzw. fn+1 (x) ≤ fn (x)
sup |fn (x) − f (x)| ≤ ε .
x∈D
für alle x ∈ D ist.
Die Folge (fn )n∈N heißt punktweise konvergent ge- Also ist lim fn − f ∞ = 0.
n→∞
gen eine Funktion f : D → R, wenn der Grenzwert
Andererseits folgt aus lim fn −f ∞ = 0, dass es zu ε > 0
n→∞
lim fn (x) = f (x) ein N ∈ N gibt mit
n→∞

für jedes x ∈ D existiert. |fn (x) − f (x)| ≤ sup |fn (y) − f (y)| = fn − f ∞ ≤ ε
y∈D

Um zwischen der Monotonie einer Funktionenfolge und der für alle x ∈ D. Also ist die Funktionenfolge gleichmäßig
Monotonie der Folge einzelner Funktionswerte, fn (x) für konvergent. 

festes x ∈ D, zu unterscheiden, werden auch die Begriffe iso-


ton für eine monoton steigende und antiton für eine monoton
fallende Funktionenfolge und die Notationen fn 3 f bzw.
fn 4 f , n → ∞, verwendet. Bei Funktionenfolgen gibt es Gleichmäßig konvergente Funktionenfolgen
verschiedene Arten von Konvergenz, etwa neben der punkt- konvergieren auch punktweise
weisen auch die gleichmäßige Konvergenz. Diese ist übrigens
schon auf Seite 387 bei den Potenzreihen angeklungen. Es wird insbesondere deutlich, dass eine gleichmäßig kon-
vergente Funktionenfolge auch punktweise konvergiert. Um-
gekehrt ist dies nicht der Fall. Die folgenden beiden Beispiele
Gleichmäßige Konvergenz
belegen, dass es punktweise konvergente Funktionenfolgen
Die Folge (fn )n∈N heißt gleichmäßig konvergent gegen gibt, die nicht gleichmäßig konvergieren.
die Funktion f : D → R, wenn es zu jedem ε > 0 ein
N ∈ N gibt, sodass Beispiel
Die Funktionenfolge (fn ) auf [0, q] mit fn = x n konver-
|fn (x) − f (x)| ≤ ε für alle x ∈ [a, b] und n ≥ N
giert gleichmäßig gegen die Nullfunktion f = 0, wenn
q < 1 ist; denn mit obigem Lemma folgt die Konvergenz
gilt.
aus

sup x n − 0 ≤ q n → 0, n → ∞.
? x∈[0,q]
Worin besteht der Unterschied bei den Definitionen von
punktweiser und gleichmäßiger Konvergenz? Für q = 1 ist die Folge punktweise konvergent gegen

0 für x ∈ [0, 1),
f (x) =
Später werden auch noch weitere Konvergenzbegriffe bei 1 für x = 1 .
Funktionenfolgen betrachtet (siehe Kapitel 19). Wir beschäf-
Die Folge konvergiert aber nicht gleichmäßig;
√ denn wäh-
tigen uns zunächst mit diesen beiden. Eine nützliche Cha-
len wir etwa zu ε = 1/2 Stellen xn = 1/ n 2 ∈ [0, 1], so
rakterisierung der gleichmäßigen Konvergenz bei Funktio-
gilt:
nenfolgen ergibt sich mit der Supremumsnorm, die zu
f : D → R definiert ist durch 1
sup |fn (x) − f (x)| ≥ |fn (xn ) − 0| ≥
x∈[0,1] 2
f ∞ = sup |f (x)| ,
x∈D
für n ∈ N. Die Funktionenfolge konvergiert somit nicht
gleichmäßig.
wenn das Supremum existiert.
Die Funktionenfolge fn : [0, 1] → R mit

Lemma fn (x) = nx(1 − x)n


Eine Folge von Funktionen fn : D ⊆ R → R, n ∈ N,
konvergiert gleichmäßig gegen f : D → R genau dann, konvergiert punktweise gegen die Nullfunktion; denn es
wenn fn − f ∞ → 0, n → ∞, gilt. ist fn (0) = fn (1) = 0, und bei fest vorgegebenen
16.1 Integration von Treppenfunktionen 603

y von Treppenfunktionen annähern. Dazu betrachten wir das


folgende Beispiel.
f0
1
Beispiel Um eine Folge von Treppenfunktionen zu kon-
struieren, bietet es sich an, das Intervall [a, b] durch sukzes-
sives Halbieren zu zerlegen. So gilt etwa für die Identität,
also die Funktion f : [0, 1] → R mit f (x) = x, dass die
f1 Treppenfunktionen mit

j ⎪
f2 ϕn (x) = ⎪

f50 2n ⎪


⎪ ' (
⎬ j −1 j
j −1
ψn (x) = für x ∈ , ,
2n ⎪
⎪ 2n 2n
x ⎪



0 1 j
ξn (x) = n − n+1
1 ⎪

Abbildung 16.4 Eine Folge von Funktionen, die fast überall gegen 0 konver-
2 2
giert.
j ∈ {1, . . . , 2n }, punktweise gegen f konvergieren
(Abb. 16.6). Dies sehen wir etwa für ϕn aus der Abschät-
x ∈ (0, 1) folgt nx(1 − x)n → 0 für n → ∞ (siehe zung |ϕn (x) − x| ≤ 21n .
Aufgabe 8.15).
Gleichmäßige Konvergenz gilt für dieses Beispiel nicht. Es konvergiert die erste Folge monoton fallend, da für alle
j
Dazu betrachte man fn (x) = n(1 − x)n−1 (1 − x − nx). x ∈ [0, 1] mit x = 2n+1 gilt ϕn+1 (x) ≤ ϕn (x). Entsprechend
Aus fn (x̂n ) = 0 ermitteln wir, dass fn bei x̂n = 1/(n + 1) ist die Folge (ψn ) monoton wachsend. Im letzten Beispiel
∈ [0, 1] ein (ξn ) liegt keine Monotonie vor, da für j2−1 j
n < x < 2n − n+1
1
 Maximum besitzt1 mit den Funktionswerten
1 n+1 j
2
fn (x̂n ) = 1 − n+1 → e für n → ∞ (siehe Seite die Abschätzung ξn (x) > ξn+1 (x) und für 2n
1
− 2n+1 <x<
1
292). Somit gibt es etwa ein N ∈ N mit |fn (x̂n )| ≥ 2e für j
2n die Abschätzung ξn (x) < ξn+1 (x) gilt.
alle n ≥ N und wir erhalten:
1
fn − 0∞ ≥ |fn (x̂n ) − 0| ≥ >0
2e
für alle n ≥ N . Die Funktionenfolge ist nicht gleichmäßig id
ϕn
konvergent.
ξn
y
ψn
0.4 f100f
10
f3
f2

0.2 f1

0 0.5 1.0 x
Abbildung 16.5 Die Funktionenfolge mit fn (x) = nx(1 − x)n . 

j −1 j +1
Wir halten fest, dass es bei Funktionenfolgen unterschied- 2n 2n
liche Arten von Konvergenzen gibt, von denen wir hier zwei Abbildung 16.6 Approximation der Identität durch Folgen von Treppenfunk-
kennengelernt haben. Für eine detailliertere Diskussion ver- tionen mit unterschiedlichen Monotonieeigenschaften. 

weisen wir auf das Kapitel 19 und kommen zurück zum Inte-
gralbegriff. Eine Definition des Integrals erfordert nach die- Bei einer Definition muss gewährleistet sein, dass der Inte-
sen Überlegungen eine Festlegung, welche Art von Appro- gralwert zu einer Funktion f unabhängig von der speziellen
ximation durch Treppenfunktionen betrachtet werden soll. Wahl einer approximierenden Folge von Treppenfunktionen
Letztlich basieren die unterschiedlichen Integrationsbegriffe ist. Damit wird deutlich, was neben den Eigenschaften (siehe
auf verschiedenen Konvergenzbegriffen zu Folgen von Trep- Übersicht auf Seite 611) im Detail gezeigt werden muss, um
penfunktionen. Es gibt aber noch eine weitere Schwierig- den Begriff des Integrals für eine größere Klasse von Funk-
keit. Funktionen lassen sich durch unterschiedliche Folgen tionen zu klären.
604 16 Integrale – von lokal zu global

Verschiedene Arten von Konvergenz führen Nullmengen in R sind Mengen mit Maß Null
auf unterschiedliche Integralbegriffe
Deswegen werden Teilmengen von [a, b] betrachtet, die
keine Länge, gewissermaßen keine Ausdehnung besitzen.
Eine Möglichkeit ist es, die Menge aller Grenzfunktionen von
Solche Teilmengen der reellen Zahlen nennt man Nullmen-
gleichmäßig konvergenten Treppenfunktionen zu betrach-
gen. Um eine exakte Definition zu erreichen, führen wir
ten. Diese Funktionen heißen Regelfunktionen und liefern
die Notation |I | = |b − a| für die Länge eines Intervalls
einen Vektorraum integrierbarer Funktionen. Das Riemann-
I = (a, b) ein. Wir sprechen auch vom Maß oder vom Inhalt
Integral hingegen basiert auf einer anderen Idee. Das Integral
des Intervalls I . Mit dieser Bezeichnung lässt sich der Begriff
wird als Grenzwert von Riemann-Summen, d. h.:
Nullmenge definieren.
!
n
f (ξjn )|xjn+1 − xjn | Definition von Nullmengen
j =1
Eine Menge M ⊆ R heißt Nullmenge, wenn es zu jedem
Wert ε > 0 abzählbar viele beschränkte Intervalle Jk ⊆ R,
definiert, wobei mit wachsendem n feinere Zerlegungen des
k ∈ N, gibt mit den beiden Eigenschaften:
Intervalls [a, b] und weitere Stellen ξjn ∈ [xjn , xjn+1 ] in den
Die Vereinigung all dieser Intervalle überdeckt die
entsprechenden Teilintervallen gewählt werden. Dies bedeu-
Menge M, d. h.:
tet, wir betrachten Folgen von Treppenfunktionen, die an spe-


ziellen Stellen mit f übereinstimmen und deren Riemann-
M⊆ Jk .
Summen konvergieren.
k=1
Die verschiedenen Zugänge diskutieren wir in Abschnitt 16.7
Die Summe der Intervalllängen ist durch
genauer und zeigen unter anderem, dass stetige Funktionen

!
auf kompakten Intervallen bei allen Varianten integrierbar
sind. Im folgenden Abschnitt wenden wir uns einer dritten |Jk | ≤ ε
k=1
Möglichkeit zu, dem Lebesgue-Integral. Dabei werden wir
eine Verallgemeinerung der punktweisen Konvergenz nut- abschätzbar.
zen. Die Herleitung dieses Integrationsbegriffs ist aufwen-
diger. Aber wir werden belohnt mit einem Vektorraum inte- Beachten Sie, dass in der Definition Jk = ∅ zugelassen ist
grierbarer Funktionen, der genau die Eigenschaften aufweist, und somit auch endlich viele Intervalle ausreichen können.
die in sehr vielen weiterführenden Bereichen der Mathematik
grundlegend sind. Warum dies so ist, wird mit den Abschnit-
ten 16.5 bis 16.7 deutlich werden. Auch die spätere Erwei-
terung der Integration im Rn (siehe Kapitel 22) ergibt sich
relativ direkt mit der folgenden Definition. Abbildung 16.7 Eine Nullmenge lässt sich durch Intervalle überdecken, deren
Gesamtlänge durch ε > 0 nach oben beschränkt ist.

Wenn eine Aussage A(x) in Abhängigkeit einer Variablen


16.2 Das Lebesgue-Integral x ∈ [a, b] außerhalb einer Nullmenge M gilt, d. h., A(x) ist
wahr für x ∈ [a, b]\M, so sagen wir, A(x) gilt für fast alle
Wir sehen uns die Definition der Treppenfunktionen und ihre x ∈ [a, b] oder auch fast überall auf [a, b]. Als Abkürzung
Integrale genauer an. Es fällt auf, dass an den Sprungstellen werden wir im Folgenden f. ü. verwenden. Diese Notation
xj ∈ [a, b] keine Funktionswerte festgelegt werden. Denn ist praktisch, denn wir müssen dabei die Nullmenge M nicht
für das Vorhaben, die Integrale zu definieren, spielt es keine genauer charakterisieren.
Rolle, ob der Funktionswert f (xj ) = cj oder f (xj ) = cj +1
ist, das Integral bleibt davon unbeeindruckt. Es kann an die- Beispiel Jede Teilmenge von R, die nur endlich oder ab-
sen Stellen jeder beliebige Wert f (xj ) ∈ R angenommen zählbar viele Zahlen enthält, also M = {xk *∈ R | k ∈ N},
ist eine Nullmenge. Denn setzen wir Jk := xk − ε2−k−1 ,
werden, ohne dass sich das Integral ändern würde. Das be- +
deutet, dass der Funktionswert der Treppenfunktion an einer xk +ε2−k−1 für k = 1, 2, . . . , so überdeckt die Vereinigung

festen Stelle x ∈ [a, b] den Wert des Integrals nicht beein- k=1 Jk die Menge M. Mit der geometrischen Reihe ist
flusst. ∞ ∞ ∞
! ! 1 ε! 1 ε 1
|Jk | = ε = = = ε.
Diese Beobachtung scheint zunächst angenehm, aber theore- 2 k 2 2 k 21− 1
k=1 k=1 k=0 2
tisch ist genau damit ein Problem verbunden. Welche Funk-
tionswerte bestimmen denn den Wert des Integrals, wenn es Insbesondere können wir festhalten, dass Treppenfunktionen
ein einzelner Wert f (x) ∈ R nicht tut? In dieser Uneindeutig- im Allgemeinen zwar nicht stetig sind, aber zumindest fast
keit steckt eine wesentliche Schwierigkeit für die Definition überall stetig, da Sprünge nur an endlich vielen Stellen auf-
des Integrals. treten. 
16.2 Das Lebesgue-Integral 605


Mit dem Beispiel ergibt sich etwa, dass die rationalen Zah- Somit ist J˜k eine Überdeckung von M = ∞ n=1 Mn mit einer
len Q ∩ [a, b] ⊆ [a, b] eine Nullmenge bilden, da wir die Gesamtlänge kleiner ε. Eine entsprechende Abschätzung gilt
rationalen Zahlen abzählen können (siehe Seite 122). für jeden Wert ε > 0. Es folgt, dass M eine Nullmenge
ist. 
?
Kann ein Intervall (a, b) ⊆ R eine Nullmenge sein?
Mit dem Beispiel in der Vertiefung auf Seite 606 wird deut-
lich, dass es auch überabzählbare Nullmengen gibt.
Achtung: Hier, in der Maß- und Integrationstheorie, wird
der Ausdruck „fast alle“ für „alle bis auf eine Menge vom
Maß Null“ verwendet. Die genaue Bedeutung der Phrase
hängt aber vom Kontext ab. Gilt etwa eine Aussage für fast Fast überall punktweise konvergente und
alle Glieder einer Folge (an ), so gilt sie für alle bis auf endlich
monotone Funktionenfolgen sind der
viele Folgenglieder.
Schlüssel zum Integralbegriff

Jede abzählbare Vereinigung von Nullmengen Mit dem Begriff der Nullmenge können wir nun angeben,
ist wieder eine Nullmenge welche Art Grenzwerte von Folgen von Treppenfunktionen
beim Lebesgue-Integral betrachtet werden. Wir nennen eine
Zwei Eigenschaften von Nullmengen sind für die Konstruk- Folge (fn )n∈N von Funktionen fast überall monoton, wenn
tion eines allgemeinen Integralbegriffs wichtig. Die erste
Aussage ist relativ klar.  
fn+1 (x) ≥ fn (x) bzw. fn+1 (x) ≤ fn (x)
Lemma
Jede Teilmenge einer Nullmenge ist wieder eine Null- für fast alle x ∈ [a, b] gilt. Entsprechend ist (fn ) fast überall
menge punktweise konvergent gegen f : [a, b] → R, wenn

Beweis: Eine Überdeckung einer Nullmenge, wie in lim fn (x) = f (x)


n→∞
der Definition, ist auch Überdeckung einer Teilmenge der
Menge. Somit überträgt sich die Eigenschaft, eine Nullmenge
zu sein, auf Teilmengen. 
für fast alle x ∈ [a, b] gilt, d. h., mit Ausnahme einer Null-
menge gilt punktweise Konvergenz.

Die zweite Aussage betrachtet abzählbar viele Nullmengen


und ist ein wenig diffiziler. Beispiel Betrachten wir nochmal das erste Beispiel auf
Seite 602. Die Funktionenfolge fn : [0, 1] → R mit
Lemma fn (x) = x n ist wegen
Wenn Mn ⊆ R für n∈ N Nullmengen sind, so ist auch
die Vereinigung M = ∞
n=1 Mn eine Nullmenge.
fn (x) = x n < x n−1 = fn−1 (x)

Beweis: Wir bedienen uns des Cantor’schen Diagonalver-


fahrens (siehe Seite 122). Angenommen, es sind Nullmengen für x ∈ (0, 1) streng monoton fallend. Außerdem gilt:
Mn ⊆ R, n ∈ N, gegeben. Dann lässt sich zu einem Wert

ε > 0 und für jede der Nullmengen Mn eine Überdeckung 0, für x ∈ [0, 1) ,
durch Intervalle Jjn , j ∈ N, auswählen mit der Eigenschaft lim fn (x) =
N →∞ 1, für x = 1 .

! ε
|Jjn | ≤ . Somit können wir festhalten: die Folge (fn )n∈N ist fast über-
2n
j =1 all streng monoton fallend, nämlich mit Ausnahme der Stel-
Mit dem Diagonalverfahren zählen wir alle Intervalle len x = 0 und x = 1. Darüber hinaus konvergiert die Folge
J˜k = Jjn , wobei sich induktiv k = 21 (n+j −2)(n+j −1)+j fast überall punktweise gegen die konstante Funktion mit
ergibt. f (x) = 0. 

Unter Ausnutzung der geometrischen Reihe erhalten wir die


Abschätzung Fast überall monoton wachsende und punktweise konver-

! ∞ !
! ∞ ∞
! gente Folgen von Treppenfunktionen ermöglichen den ersten
ε
|J˜k | = |Jjn | ≤ = ε. wesentlichen Schritt. Wir definieren die folgende Menge von
2n Funktionen.
k=1 n=1 j =1 n=1
606 16 Integrale – von lokal zu global

Hintergrund und Ausblick: Eine überabzählbare Menge vom Maß Null


Abzählbare Mengen sind stets Nullmengen. Etwas erstaunlich ist, dass es auch überabzählbare Mengen mit dieser Eigenschaft
gibt. Eine kennen wir bereits, nämlich die Cantormenge.
1
Im Beispiel auf Seite 325 haben wir die Cantormenge Mit |f2 (x) − f1 (x)| ≤ 2 für alle x ∈ [0, 1] folgt induktiv


C= Cn 1
|fn+1 (x) − fn (x)| ≤ für x ∈ [0, 1],
n=1 2n
konstruiert, wobei die Teilmengen Cn rekursiv durch Ent-
fernen der offenen, mittleren Drittel der Teilintervalle aus- wegen |fn+1 (x) − fn (x)| = 21 |fn (3x) − fn−1 (3x)| ≤
1 1 1 1
gehend von [0, 1] definiert sind. Es wurde gezeigt, dass 2 2n−1 für x ∈ [0, 3 ] und |fn+1 (x)−fn (x)| = 2 |fn (3x−2)
diese Menge abgeschlossen und überabzählbar ist. − fn−1 (3x − 2)| ≤ 21 2n−11
für x ∈ [ 23 , 1]. Somit ergibt
sich mithilfe einer Teleskopsumme und der geometrischen
Betrachten wir nun die Summe der Intervalllängen in der
Reihe für m ≥ n:
Menge Cn nach dem n-ten Drittelungsschritt. Es ist
' (2
2 2 !
m−n−1
|C0 | = 1, |C1 | = , |C2 | = , |fm (x) − fn (x)| ≤ |fn+k+1 (x) − fn+k (x)|
3 3
k=0
und weiter ergibt sich:
' (n !
m−n−1
1 1
2 ≤ ≤ n−1 → 0, n → ∞ .
|Cn | = −→ 0 . k=0
2n+k 2
3 n→∞

Jede Menge Cn ist eine Überdeckungen der Cantormenge Also ist fn (x) eine Cauchy-Folge und insbesondere kon-
A
C = ∞ n=0 n , denn Cn+1 ⊆ Cn . Also ist C eine Null-
C vergent. Wir definieren die Grenzfunktion f : [0, 1] → R
menge. durch f (x) = limn→∞ fn (x).

Die Cantormenge ist wie die Mandelbrotmenge von Die Funktion f ist stetig. Dies folgt aus obiger Abschät-
Seite 282 ebenfalls ein Beispiel für ein Fraktal. Der Menge zung; denn die Cauchy-Folgen lassen sich gleichmäßig
kann man nicht mehr sinnvoll eine ganzzahlige Dimension über x ∈ [0, 1] abschätzen, d. h., fm − fn ∞ → 0,
zuordnen. m, n → ∞. Später in Kapitel 19 werden wir sehen, dass
stets aus gleichmäßiger Konvergenz gegen f Stetigkeit
Übrigens lässt sich das Prinzip der Cantormenge nutzen, der Grenzfunktion folgt.
um eine stetige Funktion f : [0, 1] → R zu konstruieren
mit f (0) = 0 und f (1) = 1, die aber fast überall konstant Es bleibt zu überlegen, dass die Grenzfunktion außerhalb
ist. der Nullmenge C stückweise konstant ist. Dazu zeigen wir
induktiv:
Die ersten Schritte zur Konstruktion einer solchen Funk-
tion f : [0, 1] → R, der Teufelstreppe, sind in der folgen- fm (x) = fn (x) auf [0, 1]\Cn−1 für m ≥ n.
den Abbildung gezeigt:
Wegen [0, 1]\Cn−1 ⊆ [0, 1]\Cn für alle n ∈ N genügt
es, die Aussage für m = n + 1 zu zeigen. Ist fn auf
[0, 1]\Cn−1 stückweise konstant, so bleibt die Eigenschaft
bei festem n ∈ N für alle folgenden Funktionen fm mit
m ≥ n und somit für f erhalten.
Ein Induktionsanfang ist gegeben, da f3 (x) = f2 (x) = 21
 
auf [0, 1]\C1 = 13 , 23 gilt. Für den Induktionsschritt
* +
beobachten wir, dass aus x ∈ 0, 13 \Cn folgt 3x ∈
* +
[0, 1]\Cn−1 . Somit erhalten wir für x ∈ 0, 13 \Cn mit
der Induktionsannahme und der Rekursion:
Rekursiv beschreiben wir die Konstruktion durch eine
Folge von Funktionen fn : [0, 1] → R, n ∈ N, mit fn+2 (x) =
1 1
fn+1 (3x) = fn (3x) = fn+1 (x).
f1 (x) = x und 2 2
⎧ 1
* + * +  

⎨ 2 fn (3x), x ∈ 0, 13 , Analog folgt die Identität auf 23 , 1 \Cn . Da auf 13 , 23
 
fn+1 (x) = 1
2, x ∈ 13 , 23 , nach Definition stets Gleichheit gilt, ist der Induktions-

⎩ 1 * +
x ∈ 23 , 1 . schritt für die gesamte Menge [0, 1]\Cn gezeigt.
2 (1 + fn (3x − 2)),
16.2 Das Lebesgue-Integral 607

Die Menge L↑ (a, b) es offene Intervalle


 Uj ⊆ R, j ∈ N, mit den Eigenschaf-
ten M ⊆ ∞ j =1 U j und ∞j =1 |Uj | ≤ ε. Die Vereinigung
Eine Funktion f : (a, b) → R ist Element der Menge ∞
L↑ (a, b) , wenn es eine fast überall monoton wachsende U
j =1 j ist eine offene Menge. Daher ist das Komplement,

Folge (ϕn ) von Treppenfunktionen gibt mit die Menge J := [a, b] \ ∞ j =1 j , abgeschlossen. Außer-
U
dem ist die Menge J beschränkt. Sie ist also kompakt. Es gilt
lim ϕn (x) = f (x) für fast alle x ∈ [a, b] , J ⊆ [a, b] \ M, sodass die Funktionen ϕn auf der Menge
n→∞
J stetig sind, und für jede Zahl x ∈ J konvergieren die
deren zugehörige Folge von Integralen Funktionswerte ϕn (x) → 0 monoton fallend, wenn n → ∞
J  strebt.
b
ϕn (x) dx Die Funktionen ϕn : J → R sind stetige Funktionen auf einer
a n∈N kompakten Menge. Daher besitzen sie jeweils ein Maximum.
In einem ersten Schritt zeigen wir durch einen Widerspruch
konvergiert. für diese Maxima, dass max ϕn (x) → 0 für n → ∞ gilt.
x∈J
Denn wäre dies nicht der Fall, so gäbe es einen Wert δ > 0
Anschaulich bedeutet die Definition, dass wir zunächst nur und zu jedem n ein xn ∈ J mit ϕn (xn ) ≥ δ. Nach dem
Integranden erlauben, die sich von unten fast überall punkt- Satz von Bolzano-Weierstraß (siehe Seite 299) gibt es eine
weise durch Treppenfunktionen approximieren lassen. Der konvergente Teilfolge (xnj ). Wir benennen den Grenzwert
Grenzwert dieser Teilfolge mit lim xnj = x ∈ J .
j →∞
J b J b
f (x) dx = lim ϕn (x) dx Wählen wir nun eine feste Zahl m ∈ N, dann folgt wegen der
a n→∞ a Monotonie für Indizes nj ≥ m die Abschätzung

ermöglicht die Definition des Integrals von f , wenn gezeigt δ ≤ ϕnj (xnj ) ≤ ϕm (xnj ) .
wird, dass der Grenzwert unabhängig von der speziellen Wahl
der Folge von Treppenfunktionen ist. Da ϕm stetig ist, erhalten wir im Grenzwert j → ∞ die
Ungleichung δ ≤ ϕm (x). Diese Abschätzung lässt sich
Der Beweis erfordert einigen Aufwand. Wir gehen in drei für jede Zahl m ∈ N durchführen im Widerspruch zu
Schritten vor, die wir in den folgenden Lemmata formulie- ϕm (x) → 0, m → ∞. Also gibt es ein n0 ∈ N mit
ren. Dabei wird unter anderem deutlich, warum zunächst die max ϕn (x) ≤ ε für alle n ≥ n0 .
zusätzliche Forderung nach Monotonie der Folge erforder- x∈J
lich ist. Ausgangspunkt ist eine Eigenschaft monoton gegen Im zweiten Schritt des Beweises zeigen wir nun noch, dass
die Nullfunktion fallender Treppenfunktionen.
Jb
Lemma ϕn (x) dx ≤ (b − a + C)ε
Für eine nicht negative Folge (ϕn ) von Treppenfunk- a
tionen auf einem Intervall [a, b], die fast überall monoton
fallend gegen die Nullfunktion konvergiert, für alle n ≥ n0 ist, wobei C > 0 eine Konstante bezeichnet
mit ϕn (x) ≤ C für alle n ∈ N und für fast alle x ∈ [a, b].
lim ϕn (x) = 0 f.ü. auf [a, b] , Zu dem im ersten Schritt ermittelten n0 ∈ N wählen wir
n→∞
n ≥ n0 . Die Treppenfunktion ϕn hat die Form ϕn (x) = c für
konvergiert auch die Folge der Integrale mit x ∈ (z−1 , z ),  = 1, . . . , N, wenn a = z0 < · · · < zN = b
die zu ϕn gehörende Zerlegung des Intervalls [a, b] ist. Weiter
Jb definieren wir
lim ϕn (x) dx = 0 . :   ;
n→∞
a
L :=  ∈ {1, . . . , N} : z−1 , z ∩ J = ∅ .

Dabei bedeutet nicht negativ, dass ϕn (x) ≥ 0 für fast alle Dann ist c ≤ ε für  ∈ L, da ϕn (x) ≤ ε für x ∈ J gilt
x ∈ [a, b]. und ϕn auf (z−1 , z ) konstant mit Wert c ist. Für  ∈/ L

ist (z−1 , z ) ⊆ =1 jU also ist auch die Vereinigung
 j∞
Beweis: Der Beweis gliedert sich in zwei wesentliche / (z−1 , z ) ⊆
∈L j =1 Uj . Daher ist
Schritte, die wir hier darstellen. Auf Seite 608 findet sich ∞
! !
aber noch eine Diskussion der Aussage und der Beweisidee. |z − z−1 | ≤ |Uj | ≤ ε.
Es sei ein Wert ε > 0 vorgegeben. Mit M bezeichnen wir die ∈L
/ j =1
Menge aller Sprungstellen der Treppenfunktionen ϕn , n ∈ N,
vereinigt mit der Nullmenge, auf der keine Konvergenz vor- Letztendlich können wir mit der oben angegebenen Kon-
liegt. Nach Voraussetzung ist M eine Nullmenge. Daher gibt stante C > 0 abschätzen:
608 16 Integrale – von lokal zu global

Unter der Lupe: Konvergenz der Integrale monoton gegen null fallender Treppenfunktionen
Eine Folge nicht negativer Treppenfunktionen, die fast überall monoton fallend gegen null konvergiert, liefert eine gegen null
konvergente Folge von Integralen. Diese naheliegende Feststellung des Lemmas auf Seite 607 ist der entscheidende Schlüssel
zur allgemeinen Definition des Integrals. Denn sie liefert die Monotonieabschätzung des folgenden Lemmas und somit, dass
die Menge L↑ (a, b) auf Seite 609 wohldefiniert ist. Deswegen sehen wir uns die Aussage und die Struktur des Beweises noch
einmal an.
Schon beim Begriff des Integrals bei einer Treppen- es am Anfang des Beweises beschrieben wird. Mit der
funktion musste sichergestellt sein, dass die Definition einen Teilmenge werden alle Stellen überdeckt, an denen
nicht von unterschiedlichen Zerlegungen abhängt (siehe die punktweise Konvergenz der Treppenfunktionen nicht
Lemma auf Seite 601). Dieses Problem stellt sich ver- gewährleistet ist. Da es sich bei diesen kritischen Stellen
stärkt, wenn wir eine Funktion durch Treppenfunktionen um eine Nullmenge handelt, lässt sich das Maß der Teil-
approximieren. Egal welcher Konvergenzbegriff zugrunde menge kleiner als jeder vorgegebene Wert ε annehmen.
liegt, die konstruierte Folge von Integralen muss konver-
gieren, und der Grenzwert darf nicht von der konkreten Auf der verbleibenden abgeschlossenen Menge J sind die
Wahl einer speziellen Folge abhängen. Das Lemma zielt Treppenfunktionen ϕn stetig, da alle kritischen Stellen aus-
auf den zweiten Aspekt. Es wird gezeigt, dass der Grenz- genommen sind. Auf J lässt sich deswegen das zweite
wert der Integrale einer fast überall monoton gegen null oben beschriebene Problem der Gleichmäßigkeit lösen.
fallenden Folge von Treppenfunktionen existiert und null Ausgearbeitet wird dies im ersten Schritt des Beweises.
ist. Mit der Monotonie der Folge von Treppenfunktionen wird
gezeigt, dass
Starten wir mit einer monoton fallenden Folge von Trep- max ϕn (x) ≤ ε
penfunktionen. Für die Integrale ergibt sich: x∈J
J b !n gilt. Somit lässt sich der entsprechende Anteil in der Folge
(n)
ϕn (x) dx = cj (xj − xj −1 ) der Integrale abschätzen.
a j =1
  Für den Rest benötigen wir eine obere Schranke C > 0 für
(n)
≤ sup cj (b − a) .
j,n Werte der Treppenfunktionen, die aufgrund der Monoto-
(1)
Wäre die Folge überall auf [a, b] monoton gegen null nie etwa durch die Konstante c1 gegeben ist. Zusammen
konvergent und die Funktionswerte an den Nahtstellen mit dem Maß |[a, b]\J | ≤ ε der verbleibenden Teilmenge
(n) (n) erhalten wir die gesuchte Abschätzung
durch cj oder cj +1 gegeben, so wäre zu zeigen, dass zu
ε > 0 ein N ∈ N existiert, sodass sich die Funktionswerte
(N ) Jb
|cj | < ε, j = 1, . . . , N, abschätzen lassen. Aufgrund
ϕn (x) dx ≤ (b − a + C) ε ,
der Monotonie der Folge ergäbe sich so die Abschätzung
J a
ϕn (x) dx ≤ ε(b − a)
die für jeden Wert ε > 0 gilt und somit die Konvergenz
für alle n ≥ N, und die gesuchte Konvergenz der Integrale beweist.
wäre gezeigt. Beachten sollte man, dass das Lemma in der angegebe-
nen Allgemeinheit auf der Kombination beruht, auf J die
Bei dieser Idee ergeben sich zwei Probleme. Zum einen
Funktionswerte auf der Ordinate abzuschätzen und auf
soll die Folge der Treppenfunktionen nur fast überall kon-
[a, b]\J das Maß längs der Abszisse zu kontrollieren. Das
vergieren, und es sollten beliebige Funktionswerte an den
Zusammenwirken von Nullmenge und punktweiser Kon-
Nahtstellen zugelassen sein. Zweitens müssen wir darauf
(N) vergenz ist hier somit entscheidend für die Aussage und
achten, dass eine gleichmäßige Abschätzung |cj | < ε,
letztendlich für die Definition des Integrals. Die beiden
d. h. für alle j = 1, . . . , N bei einem Wert N, erreicht
sich herauskristallisierenden Probleme, die beschriebene
werden muss.
Gleichmäßigkeit und der Umgang mit Nahtstellen, sind
Um beide Schwierigkeiten zu überwinden, ist es erforder- prinzipieller Natur und treten nicht erst durch den gewähl-
lich, das Intervall [a, b] = J ∪ ([a, b]\J ) aufzuteilen, wie ten Zugang auf.

Jb ! ! Damit ist die Konvergenz der Folge der Integrale gegen null
ϕn (x) dx = c |z − z−1 | + c |z − z−1 | gezeigt. 

a ∈L ∈L
/

!
N !
≤ε |z − z−1 | + C |z − z−1 |
=1 ∈L
/
≤ ε (b − a) + C ε = (b − a + C) ε .
16.2 Das Lebesgue-Integral 609

Integrale lassen sich entsprechend der Somit müssen nach dem Einschließungskriterium die Grenz-
Integranden abschätzen werte gleich sein.

Wir haben den ersten Schritt zur Verallgemeinerung der


Nun ist eine wichtige Vorarbeit geleistet, mit der wir die Mo-
Menge der integrierbaren Funktionen abgeschlossen und hal-
notonie der Integralwerte zeigen können.
ten fest: Funktionen f ∈ L↑ (a, b) sind integrierbar mit
Lemma J J
b b
Sind (ϕn )n bzw. (ψn )n zwei monoton wachsende Fol-
f (x) dx = lim ϕn (x) dx .
gen von Treppenfunktionen, die punktweise fast überall a n→∞ a
gegen Funktionen f, g konvergieren, und es gilt die Un-
gleichung f (x) ≤ g(x) fast überall auf [a, b], dann ist im In den folgenden Abschnitten werden sich zwar einfachere
Grenzfall auch Wege ergeben, Integrale zu berechnen, aber es ist trotzdem
J b J b aufschlussreich, an einem Beispiel die bisherige Definition
lim ϕn (x) dx ≤ lim ψn (x) dx , explizit anzuwenden.
n→∞ a n→∞ a

falls die Grenzwerte existieren.


Beispiel Gesucht ist das Integral zur Funktion f mit
Beweis: Zu festem m ∈ N untersuchen wir die Folge f (x) = x auf dem Intervall (0, b). Durch
(ϕm − ψn )n∈N . Die Differenz ist monoton fallend und kon- ' (
vergiert fast überall mit j j j +1
ϕn (x) = n b für x ∈ b, b ,
* + 2 2n 2n
lim ϕm (x) − ψn (x) = ϕm (x) − g(x)
n→∞
≤ f (x) − g(x) ≤ 0 j = 0, 1, . . . , 2n − 1, ist eine Folge von monoton wach-
senden Treppenfunktionen auf [0, b] gegeben, die wegen
für fast alle x ∈ [a, b]. Wir definieren |ϕn (x) − x| ≤ b/2n punktweise gegen f konvergiert. Also
 ist f ∈ L↑ (0, b), und wir berechnen mit der Summenformel
ϕm (x) − ψn (x) für ϕm (x) − ψn (x) > 0 ,
ξn (x) = von Seite 130 das Integral
0 sonst.
J b J b
Dann ist (ξn ) eine Folge von nicht negativen, monoton fal-
x dx = lim ϕn (x) dx
lenden Treppenfunktionen mit limn→∞ ξn = 0 f. ü., und es 0 n→∞ 0
gilt die Abschätzung 2n −1
b2 !
J b J b J b = lim j
n→∞ 22n
ϕm dx − ψn dx ≤ ξn dx . j =0
a a a  
b2 (2n − 1) 2n 1
Mit der auf Seite 607 gezeigten Konvergenz erhalten wir im = lim = b2 . 
n→∞ 22n 2 2
Grenzfall:
J b J b
ϕm (x) dx ≤ lim ψn (x) dx .
n→∞ a
a
Aus der Definition von L↑ (a, b) folgt unmittelbar, dass mit
Da dies für jedes m ∈ N gilt, gilt die Abschätzung auch f, g ∈ L↑ (a, b) und λ ≥ 0 auch f + g und λf Elemente der
im Grenzfall für m → ∞, und die Behauptung ist be- Menge L↑ (a, b) sind mit den Integralen
wiesen. 
J b J b J b
(f + g)(x) dx = f (x) dx + g(x) dx ,
Mit diesem Lemma lässt sich zeigen, dass eine Definition des a a a
Integrals zu einer Funktion aus L↑ (a, b) sinnvoll ist. Denn J b J b
mit zwei Folgen (ϕn ) und (ψn ) von Treppenfunktionen, die (λf )(x) dx = λ f (x) dx .
a a
monoton wachsend gegen f ∈ L↑ (a, b) konvergieren, erhal-
ten wir die Ungleichung des letzten Lemmas (auf Seite 609)
in beiden Richtungen, d. h., es gilt sowohl Es kann aber z. B. −f ∈ L↑ (a, b) sein, da wir nur mo-
noton wachsende Folgen von Treppenfunktionen zur Nähe-
J b J b
rung zulassen. So ist etwa die Funktion f : (0, 1) → R mit
lim ϕn (x) dx ≤ lim ψn (x) dx
n→∞ a n→∞ a f (x) = √1x durch eine monoton wachsende Folge von Trep-
als auch penfunktionen approximierbar, aber −f nicht (Abb. 16.8).
J J Um letztendlich einen Vektorraum von integrierbaren Funk-
b b
lim ψn (x) dx ≤ lim ϕn (x) dx. tionen zu bekommen, werden Funktionen, die sich monoton
n→∞ a n→∞ a fallend approximieren lassen, noch mit berücksichtigt.
610 16 Integrale – von lokal zu global

f (x) Mit der Abschätzung im Lemma auf Seite 609 ergibt sich
für die Funktionen (f1 + g2 ), (f2 + g1 ) ∈ L↑ (a, b) mit
f1 + g2 ≤ f2 + g1 auch
J b J b
(f1 + g2 )(x) dx ≤ (f2 + g1 )(x) dx .
a a

1
√ Da f1 + g2 = f2 + g1 ist, lassen sich die Rollen in der Ab-
x
schätzung vertauschen und wir erhalten die gesuchte Gleich-
x 1 heit der Integrale
−√
x
J J
?
b b
(f1 + g2 )(x) dx = (f2 + g1 )(x) dx . 
a a

Damit ist die Definition der Menge der lebesgue-integrier-


baren Funktionen abgeschlossen. Ausgehend vom Integral
über Treppenfunktionen, ließen sich zunächst unter Ausnut-

Abbildung 16.8 Approximation der Funktion mit f (x) = 1/ x durch mono- zung der Monotonie die Funktionen in L↑ (a, b) mit ihren
ton steigende Folgen von Treppenfunktionen. Eine solche Approximation ist bei Integralen festlegen. Mit der Erweiterung, auch Differen-
−f (x) nicht möglich, da die Funktion in jedem Intervall (0, ε) mit ε > 0 nicht
nach unten beschränkt ist.
zen solcher Funktionen zuzulassen, ergab sich letztlich die
Menge L(a, b) der integrierbaren Funktionen mit ihrer li-
nearen Struktur. Als Nächstes stellen wir elementare Eigen-
Lebesgue-integrierbare Funktionen schaften des Integrals zusammen, wie sie unter anderem in
der Übersicht auf Seite 611 aufgelistet sind.
Eine Funktion f : (a, b) ⊆ R → R heißt lebesgue-
integrierbar, wenn es Funktionen f1 , f2 ∈ L↑ (a, b)
gibt, sodass
f = f1 − f2 Mit der Definition ergeben sich die
gilt. Die Menge der lebesgue-integrierbaren Funktionen, elementaren Eigenschaften des Integrals
wird mit
: ; Die ersten drei Aussagen zum Integral, aufgelistet in der lin-
L(a, b) = f = f1 −f2 : (a, b) → R | f1 , f2 ∈ L↑ (a, b) ken Spalte der Übersicht auf Seite 611, sind direkte Fol-
gerungen aus der Definition als Grenzwert von Integralen
bezeichnet. Für f ∈ L(a, b) definiert man über Treppenfunktionen. Wir haben bereits festgestellt, dass
J b J b J b durch die Linearität, d. h., mit f, g ∈ L(a, b) sind auch
f (x) dx = f1 (x) dx − f2 (x) dx . f + g ∈ L(a, b) und λf ∈ L(a, b) mit λ ∈ R, die Menge der
a a a Lebesgue integrierbaren Funktionen die algebraische Struk-
tur eines Vektorraum bekommt. Beachten Sie, dass auf die-
Da es verschiedene Zerlegungen der Form f1 − f2 zu einer sem Vektorraum durch ϕ : L(a, b) → R mit
Funktion f ∈ L(a, b) geben kann, bleibt noch zu zeigen, J b
dass der Integralwert von der speziellen Wahl von f1 , f2 ∈ ϕ(f ) = f (x) dx
L↑ (a, b) unabhängig ist. Dies liefert das folgende Lemma. a

eine R-lineare Abbildung, also ein Homomorphismus, defi-


Lemma niert ist (siehe Seite 418). Diese schlichte Beobachtung liefert
Gilt zu Funktionen f1 , f2 , g1 , g2 ∈ L↑ (a, b), dass später ein einfaches Beispiel für die Begriffsbildungen in der
f1 (x) − f2 (x) = g1 (x) − g2 (x) für fast alle x ∈ [a, b], so Funktionalanalysis.
ist
Beweise zu den weiteren Eigenschaften erfordern einige Ge-
J b J b J b J b wöhnung im Umgang mit der Definition des Integrals.
f1 (x) dx− f2 (x) dx = g1 (x) dx− g2 (x) dx .
a a a a
?
Begründen Sie die Monotonie des Lebesgue-Integrals
Beweis: Für die vier Funktionen gilt f1 + g2 = g1 + f2 ∈

b
b dass auch a f1 (x) dx +
b (a, b). Somit bbleibt zu zeigen,
L
a g2 (x) dx = a g1 (x) dx + a f2 (x) dx ist.
16.2 Das Lebesgue-Integral 611

Übersicht: Eigenschaften des Integrals


Wesentliche Eigenschaften des Integrals, die im Folgenden ständig genutzt werden, ergeben sich direkt aus der Definition. Bei
den folgenden Aussagen wird vorausgesetzt, dass f, g ∈ L(a, b) lebesgue-integrierbare Funktionen sind und λ ∈ R gilt.
y y y
Linearität
J b J b J b ≤ ≤
(f (x) + g(x)) dx = f (x) dx + g(x) dx a b x a b x a b x
a a a
J b J b
λf (x) dx = λ f (x) dx .
a a Definitheit
Zerlegung des Integrationsintervalls Aus f (x) ≥ 0 fast überall auf (a, b) und
Wenn c ∈ (a, b) gilt, so ist f : (a, b) → R genau dann J b
integrierbar, wenn f über den Intervallen (a,c) und (c,b) f (x) dx = 0
integrierbar ist. Es gilt: a
J b J c J b
folgt, dass f (x) = 0 für fast alle x ∈ (a, b) ist.
f (x) dx = f (x) dx + f (x) dx .
a a c
Orientierung
Monotonie J a
Aus f (x) ≤ g(x) für fast alle x ∈ (a, b) folgt: f (x) dx := 0
a
J b J b
f (x) dx ≤ und
g(x) dx . J a J b
a a
f (x) dx := − f (x) dx .
Insbesondere ergibt sich aus f (x) = g(x) fast überall auf b a
(a, b) die Identität Hauptsätze (i) Ist f : [a, b] → R stetig, so ist
J b J b F : [a, b] → R gegeben durch
f (x) dx = g(x) dx . J
a a x
F (x) = f (t) dt
Betrag, Maximum und Minimum a
Die Funktionen |f |, max(f, g) und min(f, g) mit
differenzierbar mit F  = f auf (a, b).
|f |(x) := |f (x)|, (ii) F ∈ C([a, b]) ∩ C 1 ((a, b)) und F  ∈ L(a, b), dann
max(f, g)(x) := max(f (x), g(x)) , ist
J b
min(f, g)(x) := min(f (x), g(x)) F  (t) dt = F (b) − F (a) .
a
sind integrierbar.
Partielle Integration u, v ∈ C([a, b]) ∩ C 1 ((a, b)) und
u v, uv  ∈ L(a, b), so ist
Dreiecksungleichung für Integrale
)J ) J J
) b ) J b b b
) ) u (x)v(x) dx = u(x)v(x)|ba − u(x)v  (x)d x .
) f (x) dx ) ≤ |f (x)| dx .
) a ) a
a a

Wenn der Integrand f : [a, b] → R durch |f (x)| ≤ c ∈ R Substitution f ∈ C([α, β]), u ∈ C([a, b]) ∩ C 1 ((a, b)),
f. ü. beschränkt ist, kann weiter abgeschätzt werden u([a, b]) ⊆ [α, β] und (f ◦ u)u ∈ L(a, b), so ist
J b J b J u(b)
|f (x)| dx ≤ c |b − a| . f (u(x)) u (x) dx = f (u) du .
a a u(a)
612 16 Integrale – von lokal zu global

Der Betrag einer lebesgue-integrierbaren Beweis: Für eine Zerlegung f = f1 − f2 mit f1 , f2 ∈


Funktion ist integrierbar L↑ (a, b) ist zu zeigen, dass aus f2 ≤ f1 f. ü. und
b b
a f1 (x) dx = a f2 (x) dx die Identität f1 (x) = f2 (x) für
fast alle x ∈ [a, b] folgt.
Folgerung (A)
us f ∈ L(a, b) folgt |f | ∈ L(a, b). Wir wählen (ϕn ) bzw. (ψn ) monoton wachsende Folgen von
Treppenfunktionen, die fast überall gegen f1 bzw. f2 konver-
Beweis: Für Funktionen f, g ∈ L↑ (a, b) und zugehörige gieren, und definieren Mn,k = {x ∈ I : f2 (x) < ϕn (x) − k1 }.
Folgen von Treppenfunktionen ϕn , ψn ist max(ϕn , ψn ) eine Dann gilt:
Treppenfunktion, die monoton und punktweise fast überall


gegen max(f, g) konvergiert. Wir definieren ϕ̃n = ϕn − ϕ1
M = {x ∈ I : f2 (x) < f1 (x)} = Mn,k .
und ψ̃n = ψn − ψ1 , sodass ϕ̃n , ψ̃n ≥ 0 sind. Aus
n,k=1
J b J b
max(ϕ̃n , ψ̃n ) dx ≤ (ϕ̃n + ψ̃n ) dx
a a Ein Widerspruch zu der Annahme, dass M keine Nullmenge
J b J b
ist, zeigt die Aussage. Gehen wir nämlich davon aus, dass M
≤ (f − ϕ1 ) dx + (g − ψ1 ) dx
a a keine Nullmenge ist. Dann gibt es mindestens ein Paar von
b Indizes n0 , k0 ∈ N, sodass Mn0 ,k0 keine Nullmenge ist. Also
sehen wir, dass die Folge der Integrale a max(ϕ̃n , ψ̃n ) dx
existiert ein ε ≥ 0, sodass für jede Überdeckung von Mn0 ,k0
beschränkt ist. Außerdem ist die Folge der Integrale monoton
b durch Intervalle Ij gilt ∞ j =1 |Ij | ≥ ε. Sei nun Jm = {x ∈ I:
wachsend. Somit ist ( a max(ϕ̃n , ψ̃n ) dx) konvergent, und es
ψm (x) < ϕn0 (x) − k10 }. Dann ist Jm eine Vereinigung
folgt max(f, g) ∈ L↑ (a, b). Analog zeigen wir dies für die
von Intervallen und Mn0 ,k0 ⊆ Jm . Also gilt insbesondere
Funktion min(f, g).
|Jm | ≥ ε. Aus den Eigenschaften des Integrals erhalten wir:
Daraus ergibt sich |f | ∈ L(a, b). Denn da es eine Darstel-
J J J
lung f = f1 − f2 mit f1 , f2 ∈ L↑ (a, b) gibt, können wir b
ψm (x) dx = ψm (x) dx + ψm (x) dx
den Betrag zerlegen in |f | = max(f1 , f2 ) − min(f1 , f2 ), a Jm I \Jm
eine Differenz aus zwei integrierbaren Funktionen in J J
1
L↑ (a, b).  ≤ ϕn0 (x) dx − |Jm |+ f2 (x) dx
Jm k0 I \Jm
J J
1
Aus der letzten Folgerung ergeben sich einige weitere nütz- ≤ f1 (x) dx − |Jm | + f1 (x) dx
Jm k0 I \Jm
liche Eigenschaften. J b J b
ε ε
= f1 (x) dx − = f2 (x) dx − .
Folgerungen a k0 a k0
Mit f, g ∈ L(a, b) folgt max(f, g), min(f, g) ∈ L(a, b).
Für f ∈ L(a, b) gilt die Dreiecksungleichung Da aber die linke Seite dieser Ungleichung für m → ∞
b
)J ) J b gegen a f2 (x) dx strebt, ergibt sich ein Widerspruch.
) b ) 
) )
) f (x) dx ) ≤ |f (x)| dx .
) a ) a
Die beiden Angaben zur Orientierung in der Übersicht auf
Beweis: Seite 611 sind keine Folgerungen aus der Definition, sondern
Es gilt max(f, g) = 21 (f + g + |f − g|) und min(f, g) = Festlegungen im Sinne einer konsistenten Notation. Denn so
1 bleibt die Eigenschaft
2 (f + g − |f − g|) für Funktionen f, g ∈ L(a, b). Also
sind die Maximum- und die Minimumfunktion lineare J b J c J b
Kombinationen von integrierbaren Funktionen und somit f (x) dx = f (x) dx + f (x) dx
selbst wieder integrierbar. a a c
Die Dreiecksungleichung ergibt sich aus f ≤ |f |, −f ≤
bei Zerlegung des Integrationsintervalls richtig, auch wenn
|f |, der Integrierbarkeit von |f | und der Monotonie des
c = a, c = b oder c ∈ [a, b] ist, zumindest solange alle
Integrals. 
auftretenden Integrale existieren.
Die Eigenschaft der Definitheit im Überblick auf Seite 611
erfordert den aufwendigsten Beweis.
Kommentar: Selbstverständlich werden häufig andere
Folgerung Variablennamen, nicht nur x, genutzt. Durch Angabe des Dif-
Aus J ferenzials, etwa dx, dt oder dϕ, ist die Integrationsvariable
b
f (x) dx = 0 und der Integrand eindeutig ersichtlich. Es finden sich in der
a Literatur auch Notationen für das Integral, bei denen das Dif-
für eine Funktion f ∈ L(a, b) mit f ≥ 0 fast überall, folgt, ferenzial nicht angegeben wird. Beim Lesen müssen Sie dann
dass f (x) = 0 ist für fast alle x ∈ (a, b). entsprechend aufpassen.
16.3 Stammfunktionen 613

Stetige Funktionen auf kompakten Intervallen haben gezeigt, dass alle stetigen Funktionen in dieser Menge
sind integrierbar liegen. Wir können bei stetigen Funktionen in der Definition
des Lebesgue-Integrals f2 = 0 setzen. Im dritten Teil des
In vielen Fällen müssen wir uns zum Glück relativ wenig Beweises zum Satz von Beppo Levi (auf Seite 625) kommen
Gedanken über die Existenz eines Integrals machen, denn wir auch im allgemeinen Fall nochmal genauer auf Wahl-
für stetige Integranden lässt sich eine allgemeine Aussage möglichkeiten von f2 in der Zerlegung f = f1 − f2 zurück.
machen.
Bemerkung: In der Maßtheorie werden abstraktere Zugänge
Integrierbarkeit stetiger Funktionen zum Lebesgue-Integral und auch andere Maße betrachtet.
Dabei geht man von sogenannten messbaren Mengen im Bild
Es gilt C([a, b]) ⊆ L(a, b). einer Funktion aus und definiert elegant, dass eine Funk-
tion messbar ist, wenn Urbilder messbarer Mengen wieder
Beweis: Konstruktionen von Folgen von Treppenfunktio- messbar sind. Dies wollen wir hier nicht weiter vertiefen,
nen durch Intervallhalbierung sind uns bereits begegnet. Zu kommen aber in Kapitel 22 wieder darauf zurück.
jeder stetigen Funktion auf einem kompakten Intervall lässt
sich eine monoton wachsende Folge von Treppenfunktionen
konstruieren, die gegen f konvergiert. 16.3 Stammfunktionen
(n) j
Setzen wir =a+
zj − a), j =
2n (b 0, . . . , 2n ,
und defi-
nieren wir Treppenfunktionen durch Wie umfassend der nun definierte Vektorraum der inte-
  grierbaren Funktionen letztendlich ist, werden wir in Ab-
(n) (n)
ϕn (x) = min f (z) : z ∈ [zj −1 , zj ] schnitt 16.5 genauer untersuchen. Zunächst wenden wir uns
 (n) (n)  dem zentralen Zusammenhang zwischen Integral und Ablei-
für x ∈ zj −1 , zj ,
tung zu. Dies wird unter anderem Wege aufzeigen, die nach
j = 1, . . . , 2n . Beachten Sie, dass wir an dieser Stelle die der Definition relativ mühselig erscheinende Berechnung von
Voraussetzung der Stetigkeit nutzen, da so garantiert ist, dass Integralwerten in vielen Fällen zu erleichtern.
das Minimum existiert (siehe Seite 322). Zu x ∈ [a, b] be-
(n)
zeichnen wir die Minimalstelle zmin mit |zmin − x| ≤ b−a 2n .
(n) Mit dem Zwischenwertsatz folgt der
Dann gilt |zmin − x| → 0, n → ∞ und wegen der Stetigkeit
Mittelwertsatz der Integralrechnung
von f folgt ϕn (x) = f (zmin ) → f (x) für n → ∞.
Aus der Monotonie und der Beschränktheit Zunächst erhalten wir aus dem Zwischenwertsatz einen Zu-
J b sammenhang zwischen Integral und Integrand. Setzen wir
ϕn (x) dx ≤ max {f (x)} (b − a) eine stetige Funktion f : [a, b] → R voraus. Da das Intervall
x∈[a,b]
a [a, b] kompakt ist, nimmt f auf dieser Menge ein Maximum
für alle n ∈ N ergibt sich die Konvergenz der Folge von und ein Minimum an. Wir definieren m = min {f (x)} und
 b  x∈[a,b]
Integralen a ϕn (x) dx . Also ist die stetige Funktion f M = max {f (x)}. Also ist
x∈[a,b]
integrierbar. Es gilt sogar f ∈ L↑ (a, b). 
m ≤ f (x) ≤ M für alle x ∈ [a, b] .
Integriert man die drei Terme in den beiden Ungleichungen,
Man beachte, dass wegen der Zerlegungseigenschaft des In-
so ergibt sich wegen der Monotonie des Integrals:
tegrals auch stückweise stetige Funktionen auf kompakten J b J b
Intervallen integrierbar sind (Abb. 16.9). m(b − a) = m 1 dx ≤ f (x) dx
L(I ) a a
J b
≤M 1 dx = M(b − a)
a
stückweise
stetig bzw. J b
f (x) dx
L↑ (I ) −L↑ (I ) a
m≤ ≤M.
tig

b−a
ste

Da f stetig ist, wird nach dem Zwischenwertsatz


(siehe Seite 334) jeder Wert zwischen m und M angenom-
men. Somit gibt es eine Stelle z ∈ [a, b] mit der Eigenschaft
J b
Abbildung 16.9 Die stetigen Funktionen über kompakten Intervallen als Teil-
menge der integrierbaren Funktionen. f (x) dx
f (z) = a .
An dieser Stelle wird deutlich, dass die Menge L↑ (a, b) auch b−a
Funktionen mit negativen Funktionswerten enthält. Denn wir Dies ist der Beweis zu folgendem Mittelwertsatz.
614 16 Integrale – von lokal zu global

Mittelwertsatz der Integralrechnung Wenden wir den Mittelwertsatz (siehe Seite 614) im Inter-
vall [x0 , x] bzw. [x, x0 ] an, so gibt es eine Zwischenstelle z
Zu einer stetigen Funktion f : [a, b] → R gibt es ein
zwischen x0 und x mit
z ∈ [a, b] mit
J b F (x) − F (x0 )
= f (z) .
f (x) dx = f (z)(b − a) . x − x0
a
Da f eine stetige Funktion ist, folgt limz→x0 f (z) = f (x0 ).
Somit gilt mit |z − x0 | ≤ |x − x0 | → 0 für x → x0 , dass der
Die Aussage des Mittelwertsatzes der Integralrechnung
Grenzwert des Differenzenquotienten existiert. Wir erhalten
kann man sich in einer Skizze grafisch veranschaulichen
F (x) − F (x0 )
(Abb. 16.10). F  (x0 ) = lim = f (x0 ) .
x→x0 x − x0
x=x0
f (x)
Dies gilt für jeden Wert x0 ∈ (a, b). 

f (z) Beispiel
Wir verifizieren die Aussage des ersten Hauptsatzes am
b Beispiel auf Seite 609. Es gilt:
f (z)(b − a) = f (x) dx J x
a 1
F (x) = t dt = x 2 ,
0 2

a z x und wir erhalten die Ableitung F  (x) = x sowohl durch


b
Differenzieren der rechten Seite als auch durch Anwenden
Abbildung 16.10 Der Mittelwertsatz der Integralrechnung gibt an, dass es zu des ersten Hauptsatzes.
jeder auf [a, b] stetigen Funktion eine Stelle z gibt, sodass der Wert des Integrals
b Definieren wir die Funktion F : (0, ∞) → R mit
a f (x) dx gleich der Rechtecksfläche f (z)(b − a) ist. J x
e−t dt .
2
F (x) =
0

Integrieren ist die Umkehrung des Da der Integrand e −t 2


stetig ist, ist nach dem ersten Haupt-
Differenzierens satz die Funktion F differenzierbar, und es gilt:

F  (x) = e−x .
2

Der Mittelwertsatz führt uns direkt auf eine zentrale Aussage
der Analysis, eine Beziehung zwischen Differenzieren und Der erste Hauptsatz lässt sich anschaulich interpretieren: Die
Integrieren. Änderung des Flächeninhalts F (x0 ) zwischen dem Graph
einer positiven Funktion f und der x-Achse ist in linearer
1. Hauptsatz der Differenzial- und Integralrechnung Näherung durch f (x0 )(x − x0 ) gegeben, d. h., mit f (x0 )
Die Funktion F : [a, b] → R mit erhalten wir die Änderungsrate (Abb. 16.11).
J x
y
F (x) = f (t) dt
a f (x)
zu einer stetigen Funktion f : [a, b] → R ist differen-
zierbar auf (a, b), und es gilt:

F  (x) = f (x) für x ∈ (a, b) . f (x0 ) · (x − x0 )

F (x0 )
Beweis: Zu f ∈ C([a, b]) und F : [a, b] → R, gegeben
durch J x x0 x x
F (x) = f (t) dt , Abbildung 16.11 Der Funktionswert f (x0 ) entspricht der Änderungsrate des
a Flächeninhalts F (x0 ) unter dem Graphen von f .
betrachten wir für zwei Stellen x, x0 ∈ (a, b) den Differen-
zenquotienten von F , d. h. ?
BJ x J x0 C Im Beweis des 1. Hauptsatzes wird die Stetigkeit von f ge-
F (x) − F (x0 ) 1
= f (t) dt − f (t) dt nutzt, um Differenzierbarkeit von F zu zeigen. Mit unstetigen
x − x0 x − x0 c c
J x Integranden gilt der Satz im Allgemeinen nicht. Geben Sie
1
= f (t) dt . ein Gegenbeispiel an.
x − x0 x0
16.3 Stammfunktionen 615

Offensichtlich impliziert die Voraussetzung der Stetigkeit Im Fall F  = f , sprechen wir also einerseits von der Ablei-
von f die Differenzierbarkeit von F . Ohne eine solche Vor- tung f der Funktion F und andererseits von einer Stamm-
aussetzung gilt dies nicht. Wir können aber zumindest zeigen, funktion F zu f . Im Englischen ist mit den Bezeichnungen
dass F stetig ist. Ein wichtiges Resultat, wie wir später noch derivative und antiderivative deutlicher, dass es sich um die
sehen werden. gleiche Situation aus zwei verschiedenen Blickwinkeln han-
delt.
Satz
Sind f ∈ L(a, b) und x ∈ [a, b], dann ist die Funktion Die Funktion J x
F : [a, b] → R mit F (x) = f (t) dt
J x a

F (x) = f (t) dt aus dem ersten Hauptsatz ist eine Stammfunktion der stetigen
a Funktion f , und wir können schreiben:
stetig. 'J x (
d
f (t) dt = f (x), für x ∈ (a, b) .
dx a
Beweis: Für diesen Beweis müssen wir nochmal auf die
Definition des Integrals eingehen. Da f integrierbar ist, gibt
es eine Zerlegung f = f1 − f2 mit f1 , f2 ∈ L↑ (a, b). Somit Beispiel Durch Differenzieren bekannter Funktionen las-
genügt es, Stetigkeit für f ∈ L↑ (a, b) zu zeigen. sen sich Stammfunktionen zu einer Vielzahl von Funktionen
Wir gehen von f ∈ L↑ (a, b) aus. Dann gibt es zu ε > 0 eine auflisten:
Treppenfunktion ϕ : [a, b] → R mit ϕ ≤ f fast überall und Es ist die Funktion f : R → R mit f (x) = e−x die Ab-
J b  leitung der Funktion F mit F (x) = −e−x . Also ist F eine
ε
0≤ f (t) − ϕ(t) dt ≤ . Stammfunktion zu f .
a 2 Genauso sehen wir, dass durch F (x) = n+1 1
x n+1 eine
Betrachten wir nun x, x0 ∈ [a, b], so ergibt sich mit der Stammfunktion zur Funktion f mit f (x) = x gegeben
n

Dreiecksungleichung: ist.
)J x ) Leiten wir F mit F (x) = sin x ab, so ergibt sich F  (x) =
) )
)
|F (x) − F (x0 )| = ) f (t) dt )) cos x. Mit anderen Worten: Der Sinus ist eine Stammfunk-
x tion zur Kosinusfunktion. 
)J 0x ) )J x )
) ) ) )
≤)) )
f (t) − ϕ(t) dt ) + )) ϕ(t) dt ))
x0 x0 Der Hauptsatz besagt, dass die Existenz einer Stammfunktion
)J ) für stetige Funktionen f gesichert ist. Beachten sollten wir,
ε )) x )
≤ +) ϕ(t) dt )) . dass es nicht nur eine Stammfunktion zu einer Funktion f
2 x0
gibt. Deswegen sprechen wir von der Ableitung, aber von
Setzen wir weiter c = maxj =1...,M |cj | für die endlich vielen einer Stammfunktion. Wir können eine beliebige Konstante
Funktionswerte cj , j = 1, . . . , M, der Treppenfunktion ϕ, zu F addieren, d. h. G(x) = F (x) + c mit c ∈ R betrachten.
so folgt: )J x ) Die Eigenschaft G (x) = f (x) gilt analog wie für F , d. h.,
) ) G ist auch eine Stammfunktion. So ist etwa die Funktion
) ϕ(t) dt ) ≤ c|x − x0 | .
) ) G : R → R mit G(x) = 1 − e−x auch eine Stammfunktion
x0
zu e−x .
Damit erhalten wir, wenn
ε
|x − x0 | ≤
2c Stammfunktionen einer Funktion
ist, die Abschätzung |F (x) − F (x0 )| ≤ ε/2 + ε/2 = ε. Also unterscheiden sich höchstens um eine
ist F stetig.  Konstante

Der Zusammenhang F  = f , wie er im ersten Hauptsatz Diese Beobachtung können wir umkehren, was Sie in fol-
gegeben ist, ist grundlegend für die Differenzial- und Inte- gender Aufgabe zeigen sollten.
gralrechnung, und man führt eine Bezeichnung dafür ein.
?
Beweisen Sie: Ist F irgendeine Stammfunktion einer stetigen
Definition der Stammfunktion
Funktion f auf (a, b), so sind alle weiteren Stammfunktionen
Ist f : (a, b) → R eine auf einem offenen Intervall von der Form
(a, b) definierte Funktion, dann heißt jede differenzier- G(x) = F (x) + c
bare Funktion F : (a, b) → R mit F  = f Stammfunk-
tion von f . für x ∈ (a, b) mit Konstanten c ∈ R.
616 16 Integrale – von lokal zu global

Manchmal ist es nicht offensichtlich, dass zwei Darstellun- Beweis: Nehmen wir an, dass α, β ∈ (a, b) sind, so
gen von Stammfunktionen nur durch eine Konstante von- x nach
ist dem ersten Hauptsatz durch die Abbildung x →
einander abweichen. F  (t) dt für x ∈ (α, β) eine Stammfunktion zur stetigen,
α
integrierbaren Funktion F  auf (α, β) gegeben.
Beispiel Für die Funktion F : R → (− π2 , π2 ) mit F (x) =
Also existiert für die
x Stammfunktion F zu F  eine Darstel-
arctan(x) ist die Ableitung arctan (x) = 1+x
1
2 . Außerdem ist 
lung F (x) = c + α F (t) dt mit einer Konstanten c ∈ R.
π Durch Einsetzen von x = α berechnen wir F (α) = c. Insge-
arctan(x) = − arccot(x) + .
2 samt folgt für das bestimmte Integral im Intervall (α, β) die
Identität J
Also sind sowohl durch arctan(x) als auch durch − arccot(x) β
Stammfunktionen zu f mit f (x) = 1+x 1
2 gegeben.  F  (t) dt = F (β) − F (α) .
α
Wenn eine Stammfunktion zu einer stetigen Funktion be-
trachtet wird, wobei es auf eine Festlegung der Konstanten Der linke Ausdruck ist wegen F  ∈ L(a, b) nach dem Satz
nicht ankommt, schreibt man häufig auf Seite 615 stetig in β ∈ [a, b] und analog auch bezüglich
J α ∈ [a, b]. Außerdem ist vorausgesetzt, dass F ∈ C([a, b])
f (x) dx . gilt. Die Grenzwerte für α → a und β → b in obiger Glei-
chung liefern die Behauptung
Man nennt dies ein unbestimmtes Integral im Gegensatz J
b b
zu dem bestimmten Integral a f (x) dx, wenn die Gren- F  (t) dt = F (b) − F (a). 

zen angegeben sind. Ein unbestimmtes Integral bezeichnet a


somit die Klasse aller Stammfunktionen. Hingegen ist ein
bestimmtes Integral eine Zahl. y
F

Achtung: Häufig wird die Schreibweise


F (x ) − F ( a ) f
J
F (x) = f dx
f (x )
verwendet. Es ist gemeint, dass F irgendeine Stammfunktion
zu f bezeichnet. Lassen Sie sich dabei nicht durch die Varia-
blennamen irritieren. Die Variable x auf der linken Seite ist a x x
wie im ersten Hauptsatz zu verstehen und hat nichts mit der Abbildung 16.12 Ist F Stammfunktion einer positiven, stetigen Funktion f ,
Integrationsvariablen x auf der rechten Seite der Gleichung so liefert F (x) − F (a) den Flächeninhalt unter dem Graphen von f über dem
zu tun. Mathematisch korrekt ist etwa Intervall [a, x]. In der Abbildung ist F (a) = 0.
J x
F (x) = f (t) dt + c Achtung: Zu beachten ist, dass die Aussage nicht für jede
a differenzierbare Funktion F gilt. Die Existenz des Integrals
mit einer frei wählbaren Konstanten c zu schreiben. Diese muss vorausgesetzt werden (siehe auch Aufgabe 16.5).
etwas umständlichere Notation erspart man sich gerne.
Für die Differenz der Funktionswerte von F an zwei Stellen
a, b ∈ R ist die Notation
)b
Mithilfe von Stammfunktionen lassen sich )
F (x)) = F (b) − F (a)
bestimmte Integrale berechnen a

üblich, und wir werden sie im Folgenden nutzen.


Der Zusammenhang zwischen bestimmtem Integral und
Stammfunktion wird im zweiten Hauptsatz ausgedrückt, den
Beispiel
wir nun formulieren. 1
Mit den Stammfunktionen F (x) = n+1 x n+1 zu f (x) = x n
und der Linearität des Integrals lassen sich Integrale über
2. Hauptsatz der Differenzial- und Integralrechnung
Polynomfunktionen bestimmen. Wir berechnen etwa
Wenn F : [a, b] → R eine stetige und auf (a, b) stetig
J   ' ()
differenzierbare Funktion ist mit integrierbarer Ablei- 1 1 3 1 2 ))1 2
tung F  , d. h., F  ∈ L(a, b) ∩ C(a, b), dann gilt: x 2 + x dx = x + x ) = .
−1 3 2 −1 3
J b
F  (t) dt = F (b) − F (a) . Für die Funktion F (x) = arcsin(x) auf (−1, 1) bestim-
a
men wir durch Differenzieren der Umkehrfunktion die
16.3 Stammfunktionen 617

Übersicht: Tabelle einiger Stammfunktionen


Durch Ableiten jeweils der Funktion auf der rechten Seite der Identitäten lassen sich folgende häufig genutzte Stammfunktionen
zusammenstellen. In allen Beispielen ist auf die Angabe einer Integrationskonstante verzichtet worden, die stets addiert werden
kann.

Grundlegende Stammfunktionen Weitere Stammfunktionen


Die folgenden Stammfunktionen sind so zentral, dass man J ) )
sie sich gut einprägen sollte: 1 1 )) 1 + x ))
dx = ln
J 1 − x2 2 )1 − x )
α+1
x α dx = xα+1 für α = −1 auf R<−1 , (−1, 1) oder R>1
J
1
auf R, falls α ∈ N, % dx = arsinh x auf R
1 + x2
bzw. auf R>0 , falls α ∈ R \ {−1} J
1
% dx = arcsin x auf (−1, 1)
J 1 − x2
1 J 
dx = ln |x| auf R>0 oder R<0 1 arcosh x auf R>1 ,
x % dx =
J x −1
2 −arcosh(−x) auf R<−1
1 J
dx = arctan x auf R 1  
1 + x2 dx = tan x auf − π2 , π2
cos2 x
J J
1
ex dx = ex auf R dx = − cot x auf (0, π )
sin2 x
J J
1
ln x dx = x ln x − x auf R>0 dx = tanh x auf R
cosh2 x
J
J 1
dx = − coth x auf R
cos x dx = sin x auf R sinh2 x
J
 
J tan x dx = − ln | cos x| auf − π2 , π2
sin x dx = − cos x auf R J
cot x dx = ln | sin x| auf (0, π )
J
J
cosh x dx = sinh x auf R
tanh x dx = ln(cosh x) auf R
J J
sinh x dx = cosh x auf R coth x dx = ln | sinh x| auf R>0 oder R<0

Ableitung In der Übersicht auf Seite 617 sind die wichtigsten Stamm-
funktionen aufgelistet.
1 1
F  (x) = = % ?
cos(arcsin(x)) 2
cos (arcsin(x))
Berechnen Sie die Integrale
1 1 J 1 J
=  = % . 1 1
1 − sin (arcsin(x))
2 1 − x2 I1 = e−x dx und I2 = dx .
0 0 1 + x2
Somit gilt:
J 1 ' ( Beispiel Die Aussage des zweiten Hauptsatzes bedeutet,
2 1 1 π π π
% dx = arcsin(x)| 2
= − − = . dass eine Bilanz, also der Wert
− 21 1 − x2 − 21 6 6 3 J b
 F (b) = F (a) + F  (x) dx ,
a

Auf der Grundlage der Hauptsätze der Differenzial- und In- aus dem Anfangszustand F (a) und der Änderung F  ermit-
tegralrechnung lassen sich viele Stammfunktionen notieren, telt werden kann, wenn diese Änderung eine integrierbare
wenn wir die uns bekannten Ableitungen zusammenstellen. Funktion ist.
618 16 Integrale – von lokal zu global

So zeichnet ein Fahrtenschreiber, wie er in Abbildung 16.13 zwar stetig, jedoch an der Sprungstelle von f nicht differen-
dargestellt ist, nur die momentane Geschwindigkeit v(t) auf. zierbar ist. Mit der Zerlegungseigenschaft können wir den
zweiten Hauptsatz auf den Teilintervallen anwenden und er-
Da die Geschwindigkeit die Ableitung des zurückgelegten
halten:
Wegs s nach der Zeit t ist, J 1 J 0 J 1
v(t) = s  (t) , sign (x) dx = sign (x) dx + sign (x) dx
−1 −1 0
J 0 J 1
erhält man umgekehrt die in einem Zeitintervall [t1 , t2 ] zu-
=− dx + dx
rückgelegte Wegstrecke S durch −1 0
J t2 1 1
S= v(t) dt . 
= |x||0−1 + |x||10 = 0 . 
2 2
t1

Potenzreihen lassen sich gliedweise


integrieren

In manchen Situationen kann auch die Potenzreihendarstel-


lung des Integranden weiterhelfen. Da im Konvergenzbe-
reich durch eine Potenzreihe eine stetige Funktion gegeben
ist, folgt insbesondere, dass eine Potenzreihe auf kompak-
ten Teilintervallen des Konvergenzbereichs integrierbar ist.
Gliedweises Integrieren führt auf eine Stammfunktion.

Satz
Ist f : (x0 − r, x0 + r) → R durch eine Potenzreihe

!
f (x) = an (x − x0 )n
n=0

Abbildung 16.13 Ein Fahrtenschreiber zeichnet nur die momentane Geschwin-


mit Konvergenzradius r > 0 gegeben, so definiert die Po-
digkeit auf. Dennoch lässt sich aus diesen Daten der insgesamt zurückgelegte tenzreihe
!∞
Weg ermitteln. an
F (x) = (x − x0 )n+1
n+1
n=0
Mit dem bisherigen Wissen zur Integration lassen sich
eine Stammfunktion F zu f auf (x0 − r, x0 + r).
Stammfunktionen durch „Raten“ finden, indem wir fragen,
welche Funktion den Integranden als Ableitung besitzt. Das
ist allerdings keine wirklich befriedigende Vorgehensweise. |an |
Beweis: Mit n+1 ≤ |an | für n ∈ N0 und der Darstellung
Mit den Hauptsätzen ergeben sich weitere Techniken, die
helfen können, eine Stammfunktion zu bestimmen. ∞
! an
F (x) = (x − x0 ) (x − x0 )n
n+1
n=0

liefert das Majorantenkriterium absolute Konvergenz der


16.4 Integrationstechniken Reihe auf (x0 − r, x0 + r). Also ist F eine Potenzreihe mit
Konvergenzradius R ≥ r, und die Differenzierbarkeit von F
Mit Linearität, Zerlegung in Teilintervalle und einer Liste von im Konvergenzkreis (siehe Seite 566) liefert F  = f . 

Stammfunktionen, wie in den Übersichten auf den Seiten 611


und 617 ist offensichtlich, dass auch Integrale zu stückweise
Das Resultat lässt sich nutzen, um elegant Potenzreihen zu
gegebenen Funktionen berechnet werden können.
ermitteln, ohne Restgliedabschätzung entsprechender Tay-
lorreihen. Übrigens haben wir diesen Zusammenhang in-
Beispiel Die Signumfunktion sign : R → R ist definiert
direkt schon bei der Ermittlung etwa der Potenzreihe zu
durch ⎧ f : (−1, 1) → R mit f (x) = ln(1+x) auf Seite 572 genutzt.

⎨−1 für x < 0 ,
sign (x) = 0 für x = 0 , Beispiel Betrachten wir die Funktion arctan : (−1,1) → R.


1 für x > 0 . Die Funktion ist differenzierbar mit
Für x = 0 ist die Funktion F : [−1, 1] → R mit F (x) = |x| 1
arctan (x) = .
eine Stammfunktion von f = sign . Beachten Sie, dass F 1 + x2
16.4 Integrationstechniken 619

Mit der geometrischen Reihe erhalten wir für die Ableitung Beachten Sie, um die partielle Integration anzuwenden,
die Potenzreihendarstellung müssen Sie sich entscheiden, welcher Term die Rolle von
∞ u bzw. v übernimmt. Es ist in diesem Beispiel sinnvoll,
!
arctan (x) = (−1)n x 2n den Ausdruck x 2 abzuleiten, da durch das Ableiten die
n=0 Potenz reduziert wird. Außerdem ändert sich der Charak-
ter des zweiten Terms nicht durch Integrieren, aus Sinus
für |x| < 1. Mit dem Satz ergibt sich eine Potenzreihe für
wird lediglich Kosinus.
eine Stammfunktion, also gilt:
Gesucht ist eine Stammfunktion zur Funktion f : R → R

! mit f (x) = cos2 x. Auch hier bietet sich eine partielle
(−1)n 2n+1
arctan(x) = c + x Integration an. Für Stammfunktionen folgt:
2n + 1
n=0
J J
für |x| < 1 mit einer Integrationskonstanten c ∈ R. Setzen cos2 x dx = − sin x cos x + sin2 x dx .
wir x = 0 in die Identität ein, so folgt c = 0, und wir erhalten
die Potenzreihendarstellung des Arkustangens. 
Eine weitere partielle Integration hilft an dieser Stelle
nicht weiter, probieren Sie es aus! Nutzen wir aber das
Die Produktregel führt auf partielle Additionstheorem sin2 x + cos2 x = 1, so ist
Integration J J
cos2 x dx = − sin x cos x + 1 − cos2 x dx
Mit den Hauptsätzen führen uns die Ableitungsregeln J
(siehe Übersicht auf Seite 566) letztendlich auch auf Inte- = − sin x cos x + x − cos2 x dx
grationsregeln. Aus der Produktregel ergibt sich die partielle
Integration oder Produktintegration.
bzw.
Partielle Integration J
1
cos2 x dx = (x − sin x cos x) + c
Sind u, v ∈ C([a, b]) auf (a, b) stetig differenzierbar 2
mit u v, uv  ∈ L(a, b), so gilt:
J J mit beliebiger Konstante c ∈ R. 
b b
 
u (x)v(x) dx = u(x)v(x)|ba − u(x)v (x)d x .
a a
?
Berechnen Sie eine Stammfunktion zu f : R → R mit
Beweis: Mit der Produktregel ist (uv) = u v + uv  ∈ f (x) = sin x cos x.
L(a, b), und der zweiten Hauptsatz ist auf das Produkt uv
anwendbar. Es folgt die Identität
J b In manchen Fällen ist ein passendes Produkt für die Anwen-
u(x)v(x)|ba = (uv) (x) dx dung der partiellen Integration nicht sofort offensichtlich. Ein
a Paradebeispiel liefert der Logarithmus.
J b J b
= u (x) v(x) dx + u(x) v  (x) dx. 
a a Beispiel Gesucht ist eine Stammfunktion zu f : R>0 → R
mit f (x) = ln x. Dazu ergänzen wir den Integranden u(x) =
Wir können das Resultat des Satzes mit dem ersten Haupt- ln x durch den Faktor v  (x) = 1 und erhalten mit partieller
satz auch entsprechend für Stammfunktionen schreiben und Integration:
erhalten kurz: J J J
J J
ln x dx = 1 · ln x dx = x ln x − dx = x ln x − x + c
u v dx = uv − uv  dx.

mit Integrationskonstante c ∈ R. 
Beispiel
Mit zweimaliger partieller Integration ergibt sich
J π J π
2
2 2
π 2 Das Gegenstück zur Kettenregel ist die
x sin x dx = −x cos x|0 + 2
2
x cos x dx
0 0 Substitutionsregel
2 J π 3
π 2
= 0 + 2 x sin x|02 − sin x dx Die Produktregel führte uns auf partielle Integration. Ent-
0
π sprechend folgt aus der Kettenregel eine weitere wesentliche
= π + 2 cos x|0 = π − 2 .
2
Möglichkeit beim Integrieren.
620 16 Integrale – von lokal zu global

Die Substitutionsregel Wir setzen u = x 2 mit der Ableitung u (x) = 2x und


erhalten:
Sind f ∈ C([α, β]) stetig, u ∈ C([a, b]) auf (a, b)
J √ J
stetig differenzierbar mit Bildmenge u([a, b]) ⊆ [α, β] π 1 π
und (f ◦ u)u integrierbar, so gilt: x sin(x 2 ) dx = sin u du
0 2 0
J J )π
b   u(b) 1 ) 1
f u(x) u (x) dx = f (u) du . =− cos u) = · 2 = 1 .
2 0 2
a u(a)
In Abbildung 16.14 ist ein Vergleich der beiden Flächen
dargestellt.
Beweis: Da f stetig ist, ist f integrierbar auf kompakten
Intervallen, und es gibt wegen des ersten Hauptsatzes eine
Stammfunktion F : [α, β] → R. Mit einer solchen Stamm- y
funktion liefert die Kettenregel:

(F ◦ u) (x) = F  (u(x)) u (x)


1
für x ∈ (a, b). Wenden wir den zweiten Hauptsatz an, so
erhalten wir:
J b J b
f (u(x)) u (x) dx = (F ◦ u) (x) dx
a a 0 1 2 3 x
J u(b)
= F(u(b)) − F (u(a)) = f (u) du ,
u(a)
Abbildung 16.14 Eine Substitution u = x 2 ändert den Integranden und die
Integrationsgrenzen, bei unverändertem Flächeninhalt unter den Graphen.
und die Aussage ist unter den gegeben Voraussetzungen ge-
zeigt. 
Es ist eine Stammfunktion zu f : (−1, 1) → R mit

Beachten Sie, dass die Integrierbarkeit von (f ◦ u)u explizit 1


f (u) = %
gefordert ist. Wenn u ∈ C 1 ([a, b]) bis zum Rand stetig dif- 1 − u2
ferenzierbar ist, ist diese Voraussetzung stets erfüllt. Später
werden wir dies noch genauer beleuchten, wenn wir uns mit gesucht. Um die Wurzel im Nenner zu vermeiden, bietet
allgemeineren Formulierungen sowohl der partiellen Integra- sich die Substitution u(x) = sin x an mit u (x) = cos x > 0
tion als auch der Substitution beschäftigen (siehe Seite 627 auf (−π/2, π/2). Es ergibt sich:
und Aufgabe 16.20). J
1
Bei der Substitutionsregel ist weiter zu beachten, dass Um- F (u) = % du
1 − u2
kehrbarkeit von u für diese Formulierung nicht erforderlich J
1
ist. Wenn u umkehrbar ist, so lässt sich die Regel auch in der = % cos x dx
Form 1 − sin2 x
J
J β J u−1 (β) = 1 dx = x + c = arcsin u + c
f (u) du = f (u(x)) u (x) dx
α u−1 (α)
mit der Umkehrung x = arcsin u für u ∈ (−1, 1)
angeben. Für die Grenzen sind also bei der Substitutionsre- und einer Integrationskonstanten c ∈ R. Wir sehen,
gel die Beziehungen zwischen x und u an den Randpunkten dass wir mit den Regeln relativ gezielt Stammfunktio-
einzusetzen. Leicht merken lässt sich die Substitutionsregel nen berechnen können, im Gegensatz zum Beispiel auf
in der Form Seite 617. 
J J
du(x)
f (u) du = f (u(x)) dx An den Beispielen ist zu sehen, dass die Identität der Sub-
dx
stitutionsregel in beiden Richtungen, sowohl von links nach
für die Stammfunktionen bei Substitution u = u(x) auf In- rechts als auch von rechts nach links, nützlich sein kann.
tervallen mit u > 0 oder u < 0.
?
Beispiel Bestimmen Sie J
Ermitteln wir den Wert des Integrals f  (x)
dx
J √ f (x)
π
x sin(x 2 ) dx . für eine stetig differenzierbare Funktion f : [a, b] → R\{0}.
0
16.4 Integrationstechniken 621

Kommentar: Es ist angebracht, sich für konkrete Bei- Der Fundamentalsatz der Algebra liefert eine vollständige
spiele eine Schreibweise anzugewöhnen, die die Substitution Faktorisierung von q. Damit ergibt sich, zusammen mit dem
nachvollziehbar werden lässt. Eine Möglichkeit ist etwa Lemma, eine additive Zerlegung rationaler Funktionen.
J √ J )
π 1 π ) u = x2
x sin(x 2 ) dx = sin u du ) Partialbruchzerlegung
2 ) du = 2x dx
0 0 Sind p, q : C → C Polynome mit deg(p)
< deg(q)
= ... und der Faktorisierung q(x) = qn m j =1 (x − zj )
μj
m
mit μj ∈ N und j =1 μj = deg(q) = n ∈ N,
bei der Rechnung im Beispiel auf Seite 620. dann gibt es eindeutig bestimmte Konstanten aj k ∈ C,
k = 1, . . . , μj sodass
μj
p(x) ! !
m
aj k
Rationale Funktionen lassen sich mittels =
q(x) (x − zj )k
Partialbruchzerlegung integrieren j =1 k=1

Neben diesen beiden grundlegenden Integrationstechniken gilt.


betrachten wir noch die Integration von rationalen Funktio-
nen, also Quotienten der Form
Beweis: Wegen des Fundamentalsatzes der Algebra gibt
p(x) es zu dem Polynom q die angegebene Faktorisierung. Mit
f (x) = dem Lemma lassen sich sukzessive die Terme der Ordnung
q(x)
(x − z1 )−μ1 , (x − z1 )−μ1 +1 , . . . , (x − z1 ), (x − z2 )−μ2 , . . . ,
mit Polynomen p, q : R → R. Eine rationale Funktion lässt (x −zm ) abspalten. Daher gibt es eine Partialbruchzerlegung.
sich durch eine Partialbruchzerlegung so umschreiben, dass
Es bleibt zu zeigen, dass die Koeffizienten aj k eindeutig be-
Stammfunktionen angeben werden können. Dazu wird das
stimmt sind. Nehmen wir an, es gäbe zwei Darstellungen
Nennerpolynom in seine Linearfaktoren zerlegt. In Vorberei-
μj μj
p(x) ! ! !!
m m
tung der allgemeinen Aussage überlegen wir zunächst, wie aj k bj k
sich der Grad des Zählers im Rest bei Division durch einen = = .
q(x) (x − zj ) k (x − zj )k
linearen Faktor verhält. j =1 k=1 j =1 k=1

Multiplizieren wir die Identität mit (x − zl )μl für ein


Lemma l ∈ {1, . . . , m}, so folgt:
Sind p, q : C → C Polynome mit deg(p) < μ + deg(q),
l −1
μ! !
m μj
!
μ ∈ N, und z ∈ C mit q(z)  = 0, dann gibt es eine Zahl a ∈ C aj k (x − zl )μl
alμl + alk (x − zl )μl −k +
und ein Polynom r : C → C mit deg(r) < μ + deg(q) − 1, (x − zj )k
k=1 j =1,j =l k=1
sodass die Zerlegung
l −1
μ! !
m μj
! bj k (x − zl )μl
p(x) a r(x) = blμl + blk (x − zl )μl −k +
= + (x − zj )k
(x − z)μ q(x) (x − z)μ (x − z)μ−1 q(x) k=1 j =1,j =l k=1

für alle x ∈ C. Setzen wir x = zl in diese Gleichung ein,


gilt.
ergibt sich alμl = blμl . Ziehen wir weiter alμl von der
Gleichung ab und dividieren durch (x − zl ), so folgt ana-
Beweis: Durch Division mit Rest (siehe Seite 92) finden log al (μl −1) = bl (μl −1) . Induktiv erhalten wir alk = blk für
wir p(x) = sp (x)(x − z) + cp und q(x) = sq (x)(x − z) + cq k = 1, . . . μl . Da dies für alle l = 1, . . . , m gilt, sind die
mit Polynomen sp , sq mit deg(sp ) ≤ deg(p) − 1 und entsprechenden Koeffizienten in den beiden Darstellungen
deg(sq ) ≤ deg(q) − 1 und Konstanten cp , cq . Nach Voraus- identisch. 
setzung gilt cq = 0, da z keine Nullstelle von q ist. Setzen
wir a = cp /cq , so ist cp = aq − asq (x − z). Insgesamt
erhalten wir: Wir kommen zurück auf die Integration von rationalen Funk-
tionen. Mithilfe der Partialbruchzerlegung lassen sich stets
p(x) sp (x)(x − z) + cp Stammfunktionen bestimmen.
=
(x − z)μ q(x) (x − z)μ q(x)
sp (x)(x − z) + aq(x) − asq (x)(x − z) Beispiel Gesucht ist eine Stammfunktion zu
=
(x − z)μ q(x) x4
f (x) =
=
a
+
r(x) +x−1
x3 − x2
(x − z)μ (x − z)μ−1 q(x) auf R<1 bzw. R>1 . Zunächst führt eine Polynomdivision auf
mit r(x) = sp (x) − asq (x), und es gilt deg(r) < μ − 1 + 1
f (x) = x + 1 + .
deg(q).  x3 − x2 +x−1
622 16 Integrale – von lokal zu global

Damit erzielen wir im letzten Term einen Grad des Zähler- Wie beim Differenzieren (siehe Seite 565) übertragen sich
polynoms kleiner als der des Nennerpolynoms. Für diesen auch die Integrationstechniken auf komplexwertige Funktio-
Anteil lässt sich eine Partialbruchzerlegung durchführen. nen in einer reellen Variablen. Unter Ausnutzung der Eu-
ler’schen Formel kann dies hilfreich sein.
Mit der Faktorisierung x 3 −x 2 +x −1 = (x −1)(x +i)(x −i)
ergibt sich: Beispiel Wir bestimmen die beiden Stammfunktionen
J J
1 a b c
= + + I1 = eax cos(bx) dx und I2 = eax sin(bx) dx .
x3 − x2 + x − 1 x−1 x+i x−i
(a + b + c)x 2 + (−b − c − i(b + c))x + a + i(b − c)
= . Durch zweimaliges partielles Integrieren erhalten wir:
x3 − x2 + x − 1
1
I1 = eax (a cos(bx) + b sin(bx)) + C1
Ein Koeffizientenvergleich führt auf a2 + b2
und
a + b + c = 0,
a − (1 + i) b − (1 − i) c = 0 , 1
I2 = eax (a sin(bx) − b cos(bx)) + C2 .
a + ib + ic = 1. a 2 + b2

Wir lösen das lineare Gleichungssystem und erhalten a = 21 , Eleganter erhält man diese Stammfunktionen durch das In-
b = − 1+i 1−i tegral
4 und c = − 4 , d. h., es gilt die Partialbruchzerle-
gung J J
I = I1 + I2 = eax eibx dx = e(a+ib)x dx
1 1 1 11+i 11−i
= − − . 1 a − ib ax ibx
x3 − x2 + x − 1 2x−1 4x+i 4x−i = e(a+ib)x = 2 e e +C
a + ib a + b2
a − ib ax
Bringen wir die letzten beiden Summanden auf den gemein- = 2 e (cos(bx) + i sin(bx)) + C ,
samen Hauptnenner, so folgt: a + b2
wenn wir Real- und Imaginärteil vergleichen und die Inte-
1 1 1 1 x+1 grationskonstante zu C = C1 + iC2 aufspalten. 
= − .
x −x +x−1
3 2 2 x − 1 2 x2 + 1
Weitere grundlegende Techniken zum Berechnen von be-
Mit dieser Zerlegung lässt sich eine Stammfunktion bestim- stimmten Integralen durch komplexe Formulierungen erge-
men zu: ben sich im Rahmen der Funktionentheorie, die üblicher-
J weise nicht Stoff des ersten Studienjahrs ist. In der Funk-
x4 tionentheorie beschäftigt man sich mit komplex differenzier-
dx
x3 − x2 + x − 1 baren Funktionen und ihren Eigenschaften. Dabei ergibt sich
J J
1 ein enger Zusammenhang zur Theorie der Potenzreihen.
= x + 1 dx + dx
x3 − x2 + x − 1
J Wir haben einige Techniken bereitgestellt, um Integrale zu
1 1 1
berechnen. Aber es gibt auch Integranden, wie etwa e−x ,
2
= x2 + x + dx
2 2 x−1
J J zu denen eine Stammfunktion nicht durch elementare Funk-
1 x 1 1 tionen ausgedrückt werden kann. Insbesondere in solchen
− dx − dx
2 x +1
2 2 x +1
2
Situation ist es erforderlich, Integralwerte numerisch zu ap-
1 1 1 1 proximieren. Im Ausblick auf Seite 624 finden sich ein paar
= x 2 + x + ln |x − 1| − ln(x 2 + 1) − arctan(x)
2 2 4 2 Anmerkungen zu diesem Thema, das in der Numerischen
Mathematik ausführlich behandelt wird.
mit der Substitution u = x 2 im mittleren Integral. 

Wenn man das Beispiel genau betrachtet, so fällt auf, dass


16.5 Integration über unbe-
b und c zueinander konjugiert sind und wir deswegen die schränkte Intervalle
beiden Anteile zu den konjugiert komplexen Nullstellen, ±i,
zu einem reellen quadratischen Term zusammenfassen kön- oder Funktionen
nen. In Aufgabe 16.17 überlegen wir, dass dies bei reellen
Koeffizienten stets der Fall sein muss. Wir können also al- Wenn wir die Definition integrierbarer Funktionen genauer
ternativ die Partialbruchzerlegung mit einem reellwertigen, betrachten, fällt auf, dass die Funktion f letztendlich nur fast
aber quadratischen Ansatz durchführen. überall definiert sein muss. Auch bei den Eigenschaften ist
16.5 Integration über unbeschränkte Intervalle oder Funktionen 623

Beispiel: Zwei Standardsubstitutionen


 
Es sind Stammfunktionen F : R>0 → R und G : 0, π2 → R gesucht zu
' (
1 cos x + sin x + 1 π
f (x) = % für x > 0 und g(x) =    auf 0, .
x 1 + x2 (1 + cos x) 1 − cot x2 2

%
Problemanalyse und Strategie: Bei rationalen Ausdrücke mit Potenzen von x und 1 + x 2 sind Substitutionen
durch sinh sinnvoll, um letztendlich auf eine rationale Funktion zu kommen, die mit einer Partialbruchzerlegung integriert
werden kann. Bei rationalen Ausdrücken mit trigonometrischen Funktionen hilft stets eine Substitution t = tan(x/2).

Lösung: % Im zweiten Beispiel beginnen wir mit der Substitution


Um den Ausdruck 1 + x 2 zu vereinfachen, bietet sich t = tan( x2 ). Die Ableitung
eine Substitution x = sinh(s), s > 0, an. Denn mit x  (s) =
cosh(s) und dem Additionstheorem 1 + sinh2 (s) =   x  1 1  
x  = 2 x
cosh2 (s) folgt: tan = 1 + tan
J 2 2 cos2 2 2 2
1
F (x) = % dx
x 1 + x2 liefert dt = 21 (1 + t 2 ) dx. Weiter erhalten wir aus den
J
cosh(s) Additionstheoremen
= ds
sinh(s) cosh(s)
J x 
2
= ds . 1 − tan2
es − e−s cos x =  x2 
1 + tan2 2
Wir erhalten einen rationalen Ausdruck in es und eine wei-
tere Substitution u = es > 1 führt auf einen rationalen
Integranden, bei dem eine Partialbruchzerlegung weiter und
hilft: x 
J 2 tan 2
1 sin x = .
F (x) = 2 du 1 + tan2 x
2
u2 − 1
J
=
1

1
du = ln |u − 1| − ln |u + 1| . sin x
x 
u−1 u+1 Also gilt 1+cos x = tan 2 , und eine Stammfunktion ist
Schreiben wir diesen Ausdruck ein wenig anders, so führt J
die Rücksubstitution auf die Stammfunktion cos x + sin x + 1
  G(x) =   dx
1 (u + 1)2 (1 + cos x) 1 − cot( x2
F (x) = − ln J sin x
2 (u − 1)2 1+ 1+cos x
  =   dx
1 1
1 + cosh 1 − cot x2
= − ln s J  
2 1
1 − cosh 1 + tan x2

s
 =   dx .
1 − cot x2
1
= −artanh % .
1 + x2
Die Substitution führt mit Partialbruchzerlegung
  und
Eine andere Darstellung von F erhalten wir, wenn wir in Rücksubstitution im Intervall 0, π2 auf die Stammfunk-
der zweiten Zeile zurück substituieren und den Bruch er- tion
weitern. Es ergibt sich:
%  J
1 1 + x2 + 1 t (t + 1)
F (x) = − ln % G(x) = 2 dt
2 (t − 1)(t 2 + 1)
1 + x2 − 1 J ' (
 %  1 1
1 ( 1 + x 2 + 1)2 =2 + dt
= − ln t − 1 t2 + 1
2 (1 + x 2 ) − 1   x 
  = 2 ln 1 − tan +x.
2
x
= ln % .
1 + 1 + x2
624 16 Integrale – von lokal zu global

Hintergrund und Ausblick: Quadraturformeln


Die numerische Integration geht davon aus, dass der Integrand f an gegebenen Stützstellen a ≤ x0 < x1 < · · · < xn ≤ b
auf dem Integrationsintervall [a, b] aufgrund von Messungen bekannt ist oder berechnet werden kann. Eine Näherung an den
Wert des Integrals der Gestalt J b
!N
ωj f (xj ) ≈ f (x) dx
j =0 a

mit Gewichten ωj ∈ R, j = 1, . . . , N, nennt man Quadraturformel. In der Numerischen Mathematik werden unter
anderem solche Quadraturformeln und deren Approximationseigenschaften systematisch untersucht.

Die einfachste Quadraturformel ergibt sich direkt aus dem In der Tabelle werden die Integralwerte der letzten beiden
Zugang zum Integral über Treppenfunktionen. Als erste Methoden für f (x) = sinx x auf [0, 2π] verglichen. Deut-
b
Näherung können wir a f (x) dx ≈ (b − a) f (a) be- lich ist die schnellere Konvergenzordnung zu erkennen.
trachten. Diese Regel heißt Rechteckregel und benötigt
N Trapezregel Simpsonregel
nur die Kenntnis von f an der Stelle a. Verbessern lässt
2 1.5708 1.0472
sich die Approximation, wenn auch f (b) bekannt ist durch
4 1.4521 1.4125
die Trapezregel
J b 8 1.4264 1.4179
(b − a)   16 1.4202 1.4181
f (x) dx ≈ f (a) + f (b) .
a 2 32 1.4187 1.4181
Dabei wird die Fläche des Trapezes mit Eckpunkten
Die Abbildung illustriert die verschiedenen Approxima-
(a, 0)0 , (b, 0)0 , (b, f (b))0 und (a, f (a))0 als Nähe-
tionen durch Rechteck-, Trapez- und Simpsonregel.
rung genutzt.
Kennen wir den Integranden an N +1 äquidistanten Stütz- y y y
stellen xj = a + j b−a b−a
N mit Abstand h = N > 0, so
lassen sich die Regeln zusammensetzen, etwa zu der zu-
sammengesetzten Trapezregel:
J b
h!
N
Th (f ) = f (xj ) ≈ f (x) dx . x4 x5 x4 x5 x4 x5
2 a
x0 x1 x2
x x0 x1 x2
x x0 x1 x2
x
j =0
Offensichtlich ist eine Näherung sinnvoll, wenn bewiesen
werden kann, dass im Grenzfall h → 0 die Summe ge- Andere Möglichkeiten, bessere Quadraturformeln zu fin-
gen den Wert des Integrals konvergiert. Ist die Funktion den, bestehen darin, die Äquidistanz aufzugeben und die
zweimal stetig differenzierbar, so lässt sich mit der ent- Stützstellen optimal an bestimmte Klassen von Integran-
sprechenden Taylorentwicklung zeigen, dass der Fehler den anzupassen. Dies führt auf die Gauß-Quadraturen.
bei der Trapezregel durch
) J b ) Eine weitere Idee zur Verbesserung von Quadraturformeln
) ) b−a 2
)Th (f ) − f (x) dx )) ≤ h max |f  (x)| basiert auf einer genaueren Betrachtung des Fehlers. Es
) 12 x∈[a,b]
a lässt sich etwa aus einer allgemeinen Darstellung, der
abschätzbar ist. Man nennt die zusammengesetzte Trapez- Euler-McLaurin’schen Formel, das Verhalten in Abhän-
regel von quadratischer Ordnung, weil der Fehler mit h2 gigkeit von h bei der zusammengesetzten Trapezregel in
fällt. Verkleinern von h bedeutet aber mehr Funktions- der Gestalt
auswertungen f (xj ), j = 0, . . . , N, also einen höheren
J b
Rechenaufwand.
f (x) dx − Th (f ) = α1 h2 + α2 h4 + O(h6 )
Viele Varianten von Quadraturformeln werden in der Li- a
teratur diskutiert, die unter entsprechenden Vorausset- mit von h unabhängigen Koeffizienten α1 , α2 angeben.
zungen bei gleicher Stützstellenzahl bessere Approxima- Betrachtet man auch die Trapezregel T h (f ) mit verdop-
tionen erlauben. Dürfen wir etwa annehmen, dass die 2
pelter Stützstellenzahl, so lässt sich der quadratische Term
Funktion f viermal stetig differenzierbar ist, so erreicht
eliminieren, und wir erhalten durch
man eine Konvergenzordnung vierter Ordnung, indem die
stückweise lineare Interpolation von f bei der Trapezregel J b
3 1
durch quadratische Funktionen ersetzt wird. Dies führt auf T h (f ) − Th (f ) ≈ f (x) dx
4 2 3 a
die Simpsonregel:
J b
h ein Verfahren vierter Ordnung. Diese Idee führt auf das
f (x) dx ≈ f (x0 ) + 4f (x1 ) + 2f (x2 ) Romberg-Verfahren, das zur Gruppe der Extrapolations-
a 3 
+ · · · + 2f (xN −2 ) + 4f (xN −1 ) + f (xN ) . methoden zählt.
16.5 Integration über unbeschränkte Intervalle oder Funktionen 625

ein Funktionswert des Integranden etwa in den Randpunkten Der Satz von B. Levi liefert die zentrale
a, b eines Intervalls nicht erforderlich. Damit stellt sich die Konvergenzaussage zu monotonen Folgen
Frage, ob Funktionen, die an einer Stelle nicht definiert sind, integrierbarer Funktionen
etwa einer Oszillationsstelle oder einer Singularität (siehe
Seite 320), zur Menge der integrierbaren Funktionen gehö- Wie aus der Definition des Integrals zu erwarten ist, ist punkt-
ren. Wir haben diesen Aspekt bisher unterschlagen. Nur in weise Konvergenz fast überall von Funktionenfolgen die zen-
dem Beispiel der Funktion f : (0, 1] → R mit f (x) = √1x trale Eigenschaft in der Klasse der integrierbaren Funktionen,
auf Seite 610 wurde schon eine Singularität angedeutet. Ein um Existenzfragen zu klären. Die folgende grundlegende
weitreichendes Kriterium, um die Frage nach der Integrier- Aussage der Lebesgue-Theorie, die nach dem Mathematiker
barkeit einer Funktion zu klären, ist Ziel dieses Abschnitts. Beppo Levi (1875–1961) benannt wird, belegt dies deutlich.
Wichtige Anwendungen der Integralrechnung erfordern dar-
über hinaus die Integration über unbeschränkte Bereiche, wie Der Satz von Beppo Levi
etwa R oder R>0 . Beispiele dafür sind Integraltransformatio- Ist (fn )n∈N eine fast überall monotone Folge von
nen wie die Fouriertransformation oder die Laplacetransfor- lebesgue-integrierbaren   fn ∈ L(I ), und ist
Funktionen
mation. Auch bei diesen Integralen stellt sich die Frage nach die Folge der Integrale I fn dx n∈N in R beschränkt,
der Existenz. dann konvergiert die Funktionenfolge (fn ) punktweise
fast überall gegen eine integrierbare Funktion f ∈ L(I ),
Beide Situationen lassen sich parallel klären. Daher erwei- und es gilt:
tern wir zunächst die Definition des Integrals von den bisher J J
in Abschnitt 16.2 betrachteten kompakten Intervallen auf un-
lim fj dx = f dx .
beschränkte Intervalle. j →∞ I I

Beachten Sie, dass dieser Satz nicht nur die Konvergenz der
Integrale beinhaltet, sondern auch die Existenz der integrier-
Treppenfunktionen auf unbeschränkten baren Grenzfunktion f ∈ L(I ) klärt. Wir können die Aus-
Intervallen erweitern die Integraldefinition sage des Satzes als Monotoniekriterium im Funktionenraum
L(I ) bezüglich der punktweisen Konvergenz auffassen. Dar-
Unter einer Treppenfunktion auf einem unbeschränkten In- aus lässt sich erahnen, welche zentrale Rolle diese Aussage
tervall versteht man eine Funktion f , die auf einem be- in der Lebesgue-Theorie spielt.
schränkten Intervall I˜ ⊆ I eine Treppenfunktion nach der
Definition in Abschnitt 16.2 ist und außerhalb, auf I \ I˜, Beweis: Der Beweis des Satzes ist sicher einer der auf-
konstant 0 ist (Abb. 16.15). wendigsten, den wir in diesem Werk behandeln. Wir gehen
in vier Schritten vor. Zunächst zeigen wir, dass eine monoton
wachsende Folge von Treppenfunktionen, deren Integrale be-
schränkt bleiben, einen Grenzwert in L↑ (I ) besitzen. Damit
können wir im zweiten Schritt die Aussage des Satzes für be-
liebige Funktionenfolgen in L↑ (I ) zeigen. Zur Vorbereitung
des allgemeinen Falls beweisen wir im dritten Schritt, dass
zu einer Funktion f ∈ L(I ) bei Zerlegung in eine Differenz
aus Elementen aus L↑ (I ) der zweite Anteil beliebig klein
gewählt werden kann. Mit diesen Vorarbeiten lässt sich dann
Abbildung 16.15 Eine Treppenfunktion über den gesamten reellen Zahlen. im vierten Schritt die allgemeine Aussage für eine Folge mit
fn ∈ L(a, b) herleiten.
Wenn Sie die Beweise des Abschnitts 16.2 durchsehen, ist i) Die erste Behauptung lautet: Ist (ϕn ) eine monoton wach-
schnell offensichtlich, dass mit dieser Erweiterung des Be- sende Folge von Treppenfunktionen auf einem Intervall I mit
griffs Treppenfunktion auch auf unbeschränkten Intervallen der Eigenschaft, dass die Integrale
die Menge der lebesgue-integrierbaren Funktionen definiert J
ist. Somit lässt sich insbesondere die Menge L(R) der inte- ϕn (x) dx ≤ C
I
grierbaren Funktionen über R betrachten.
für alle n ∈ N durch eine Konstante C ∈ R>0 beschränkt
Wir erfassen alle uns interessierenden Konstellationen, in- sind, so gibt es eine Funktion f ∈ L↑ (I ) mit
dem wir im Folgenden von einem offenen Intervall I ⊆ R, be-
lim ϕn (x) = f (x) f.ü.
schränkt oder unbeschränkt, ausgehen und klären, ob Funk- n→∞
tionen in der Menge L(I ) sind. und J J
lim ϕn (x) dx = f (x) dx .
n→∞ I I
626 16 Integrale – von lokal zu global

Betrachten wir eine solche monoton steigende Folge (ϕn ) Dazu wählen wir zu jedem fn eine monoton wachsende Folge
von Treppenfunktionen. Zu einem Wert ε > 0 definieren wir von Treppenfunktionen (ϕkn ) aus, die für k → ∞ punktweise
die Menge fast überall gegen fn konvergiert. Wegen der Monotonie der
  Folge (fn )n∈N gilt nach Konstruktion fast überall:
C
Nn = x ∈ I | ϕn (x) ≥ .
ε ϕkn ≤ fn ≤ fk

Diese Menge ist entweder leer oder besteht aus endlich vielen für n ≤ k. Definieren wir mit diesen Treppenfunktionen eine
Intervallen, und wir können die Gesamtlänge |Nn | abschät- weitere monoton wachsende Folge durch
zen durch j
J J J ψn (x) = max{ϕk (x) | k, j = 1, . . . , n} ,
C C
|Nn | = 1 dx ≤ ϕn (x) dx ≤ ϕn (x) ≤ C . dann gilt:
ε ε Nn Nn I
J J
Somit ist |Nn | ≤ ε für alle n ∈ N. ψn (x) dx ≤ fn (x) dx ≤ K .
I I
Da die Monotonie ϕn ≤ ϕn+1 f. ü. vorausgesetzt ist, gilt
Nn ⊆ Nn+1 , und wir können die Differenzmengen Nn+1 \Nn Die Folge der Integrale über ψn bleibt somit beschränkt.
als Vereinigung endlich vieler disjunkter
 Intervalle ansehen. Nach Teil i) des Beweises gibt es eine Grenzfunktion
Deswegen ist die Vereinigung N = ∞ n=1 Nn eine Vereini- f ∈ L↑ (I ), und es gilt:
gung von höchstens abzählbar vielen Intervallen J1 , J2 , . . . , J J
indem man zunächst die endlich vielen Intervalle zur Dar- lim ψn (x) dx = f (x) dx .
n→∞ I
stellung von N2 \N1 und dann von N3 \N2 usw. zählt. Auf- I
grund der Konstruktion gilt für die von ε abhängende Menge Weiter ist für n ≤ j ≤ ψj . Diese Ungleichung bleibt
auch ϕjn
N= ∞ j =1 Jj die Abschätzung im Grenzfall j → ∞ bestehen, d. h., es ist fn ≤ f für alle

n ∈ N. Aus der Ungleichungskette
!
|Jj | ≤ ε . ψn ≤ fn ≤ f
j =1
und der punktweisen Konvergenz ψn (x) → f (x), f. ü., folgt:
Nun betrachten wir die Menge J J
: ; f (x) dx = lim ψn (x) dx
n→∞ I
M = x ∈ I | (ϕn (x))n∈N ist unbeschränkt . I
J
≤ lim fn (x) dx
Dann ist M ⊆ N für jedes ε > 0. Somit ist M eine Null- n→∞ I
J
menge. Für eine Stelle x ∈ I \M ist die monoton wach-
sende Folge (ϕn (x)) beschränkt und somit nach dem Mono- ≤ f (x) dx .
I
toniekriterium konvergent. Bezeichnen wir den Grenzwert
mit f (x) ∈ R, so bekommen wir durch Wegen dieser Einschließungen ergibt sich, dass die Folge
(fn ) punktweise fast überall gegen f konvergiert und auch

lim ϕn (x) für x ∈ I \M , die Integrale konvergieren.
f (x) = n→∞
0 für x ∈ M iii) Um nun dieses Resultat auch für beliebige Funktionen
in L(I ) herzuleiten, benötigen wir zunächst noch eine Aus-
eine Funktion f , die fast überall Grenzwert der Treppenfunk- sage zur Auswahlmöglichkeit der Darstellung von Funktio-
tionen ϕn ist. Also gilt f ∈ L↑ (I ), was wir im ersten Schritt nen f ∈ L(I ) durch Differenzen der Form f = g − h mit
zeigen wollten. g, h ∈ L↑ (I ). Und zwar lässt sich zu jedem ε > 0 eine
ii) Wir betrachten die Aussage des Satzes jetzt für den Fall solche Zerlegung finden, bei der die Funktion h ≥ 0 ist und
einer monoton wachsenden Folge (fn )n∈N von Funktionen J
aus L↑ (I ), für die es eine obere Schranke K > 0 zu den h(x) dx ≤ ε
I
Integralen gibt, d. h.:
J gilt.
fj (x) dx ≤ K für alle j ∈ N . Diese Behauptung zeigt man, indem man von einer beliebi-
gen Zerlegung f = g0 − h0 mit g0 , h0 ∈ L↑ (D) startet.
I

Wegen der Definition der Menge L(I ) muss es eine solche


Es soll gezeigt werden, dass (fn ) punktweise fast überall
Darstellung geben. Zu h0 wählen wir eine approximierende
gegen eine Funktion f ∈ L↑ (D) konvergiert und für die
Folge von monoton wachsenden Treppenfunktionen (ϕn ).
Integrale J J Wählen wir weiter N ∈ N so groß, dass
lim fn (x) dx = f (x) dx J J
n→∞ I I
0 ≤ h0 (x) dx − ϕN (x) dx ≤ ε
gilt. I I
16.5 Integration über unbeschränkte Intervalle oder Funktionen 627

ist, und setzen wir mit der geometrischen Summe. Auch die Folge der Integrale
 zu Gn bleibt wegen
h0 (x) − ϕN (x) , falls h0 (x) ≥ ϕN (x), J J J
h(x) =
0, sonst.
Gn (x) dx = fn (x) dx + Hn (x) dx
I I I
Dann ist h ∈ L↑ (D). Da h0 − ϕN ≥ 0 nur fast überall gilt,
ist in der Definition von h auf der Nullmenge, wo diese Ab- beschränkt, da nach Voraussetzung die Integrale über fn be-
schätzung nicht gilt, der Wert auf null gesetzt, sodass die re- schränkt sind.
sultierende Funktion die Bedingung h ≥ 0 auf ganz I erfüllt. Wir können die Aussage des zweiten Teils ii) anwenden auf
Am Integralwert ändert sich durch diese Korrektur nichts, Gn ∈ L↑ (I ) und Hn ∈ L↑ (I ). Diese besagt, dass beide
und es gilt: J Folgen punktweise fast überall gegen Funktionen G, H ∈
h(x) dx ≤ ε . L↑ (I ) konvergieren, d. h., es existiert die Grenzfunktion mit
I
Außerdem ist mit g := g0 +ϕN = g0 +h−h0 eine Funktion fn = Gn − Hn → G − H =: f ∈ L(I ), n→∞
g ∈ L↑ (I ) gegeben, und wir erhalten mit
punktweise fast überall, und es gilt:
f = g0 − h0 = g0 + h − h0 − h = g − h J
lim fn (x) dx
n→∞ I
die gewünschte Zerlegung. J J
iv) Mit diesen Vorbereitungen lässt sich jetzt der allgemeine = lim Gn (x) dx − lim Hn (x) dx
n→∞ I n→∞ I
Satz von Beppo Levi beweisen. Es genügt eine fast überall J J J
monoton wachsende Folge (fn )n∈N von Funktionen in L(I ) = G(x) dx − H (x) dx = f (x) dx .
I I I
zu betrachten. Der Fall einer monoton fallenden Folge ist
damit auch abgedeckt, da man in diesem Fall die Aussage Damit haben wir alle Beweisschritte abgeschlossen. 

für die steigende Folge (−fn ) hat. Außerdem nehmen wir


an, dass fn ≥ 0 fast überall gilt. Andernfalls betrachten wir Der Satz gibt uns eine Möglichkeit, Integrierbarkeit von
die Folge (fn −f1 ), die aufgrund der Monotonie nicht negativ Funktionen zu zeigen, und hat weitreichende Konsequenzen.
ist.
Es lässt sich etwa eine Verallgemeinerung der partiellen In-
Zu dieser Folge (fn ) können wir mit dem dritten Teil Funk- tegration mit dem Satz von Beppo Levi beweisen.
tionen gk , hk ∈ L↑ (I ) finden mit
Beispiel (a) Wir definieren die Folge von Funktionen
fk − fk−1 = gk − hk , fn : [0, 1] → R, n ∈ N, durch

sodass hk ≥ 0 und 1, 0 ≤ x < n1 ,
fn (x) =
J sin x , n1 ≤ x ≤ 1 .
1
1
hk (x) dx ≤
I 2k Wähle zu x ∈ (0, 1] ein N ∈ N mit x ≥ N1 , so ist fn (x) =
gilt für k ∈ N. Dabei setzen wir f0 = 0. Offensichtlich ist sin x1 für n ≥ N. Außerdem gilt fn (0) = 1 für alle n ∈ N.
auch Also ist die Folge (fn ) punktweise konvergent gegen sin x1
gk = fk − fk−1 + hk ≥ 0 . für x ∈ (0, 1] und gegen 1 für x = 0. Darüber hinaus ist die
 
≥0 ≥0
Folge (fn ) wegen sin x1 ≤ 1 monoton fallend. Da

Nun definieren wir weiter die Summen J 1 J 1


|fn (x)|dx ≤ dx = 1
!
n !
n 0 0
Gn = gk und Hn = hk .
für alle n ∈ N gilt, folgt aus dem Satz von Beppo Levi, dass
k=1 k=1
die Grenzfunktion mit f (x) = sin x1 auf [0, 1] integrierbar
Die Folgen (Gn ) und (Hn ) sind monoton wachsende Folgen ist. In diesem Fall können wir keine Stammfunktion explizit
in L↑ (I ), und es gilt: angeben, sodass wir zur Berechnung des Werts des Integrals
auf numerische Näherungen angewiesen sind (siehe den Aus-
!
n
blick auf Seite 624)
fn = (fk − fk−1 ) = Gn − Hn .
k=1 (b) Mit dem Satz von Beppo Levi lässt sich die Aussage der
partiellen Integration (siehe Seite 619) verallgemeinern.
Außerdem folgt:
Sind u, v ∈ L(a, b), so gilt:
J n J
! !
n J b J b
1
Hn (x) dx = hk (x) dx ≤ ≤1 u V dx = U V |ba − U v dx ,
I 2k
k=1 I k=1 a a
628 16 Integrale – von lokal zu global

wobei U, V : [a, b] → R die stetigen Funktionen Vertauschen wir die Rollen von ϕn und ψn und addieren beide
J x J x Integrale auf, so folgt die Behauptung:
U (x) = u(t) dt und V (x) = v(t) dt J b J b
a a u(x) V (x) dx + U (x) v(x) dx
bezeichnen (siehe Seite 615). Wir vermeiden hier den Begriff a a
J b J b
Stammfunktion für U oder V , da die Funktionen zwar stetig,
= lim ϕn (x)!n (x) dx + n (x)ψn (x) dx
aber nicht unbedingt differenzierbar sind. In der Literatur n→∞ a a
wird teilweise der Begriff unbestimmtes Integral in diesem ! n−1
n−1 !
allgemeineren Sinne verwendet. = lim cj c̃i |Ii | |Ij |
n→∞
j =0 i=0
Um die partielle Integration zu zeigen, nehmen wir zunächst )b
an, dass u, v ∈ L↑ (a, b) sind. Wir benennen die deswegen )
= lim n (b)!n (b) = U V ) .
existierenden Folgen von Treppenfunktionen (ϕn ), (ψn ), die n→∞ a
punktweise fast überall, monoton gegen u bzw. v konvergie-
Der allgemeine Fall u, v ∈ L(a.b) ergibt sich nun aus Zerle-
ren, und definieren
gungen u = u1 − u2 und v = v1 − v2 mit u1 , u2 , v1 , v2 ∈
J x J x
L↑ (a, b) und der Lineartität des Integrals. Man beachte, dass
n (x) = ϕn (t) dt und !n (x) = ψn (t) dt .
a a das Resultat richtig bleibt, wenn zu U oder V eine Konstante
addiert wird, d. h., die Wahl der verallgemeinerten Stamm-
Ohne Einschränkung nehmen wir an, dass ϕn und ψn nicht
funktionen U und V spielt keine Rolle. 
negativ sind. Sonst betrachte man ϕn − ϕ1 und ψn − ψ1 .
Dann sind auch die Produkte (ϕn !n ) und (n ψn ) monoton
steigende Funktionenfolgen und sie konvergieren fast überall
?
Worin besteht die Verallgemeinerung der hier angegebenen
mit
partiellen Integration gegenüber der ursprünglichen Formu-
lim ϕn (x)!n (x) = u(x)V (x)
n→∞ lierung von Seite 619 ?
und
lim n (x)ψn (x) = U (x)v(x) .
n→∞ Wir greifen das erste der beiden Beispiel nochmal auf. Mit
Nach dem Satz von B. Levi folgt uV ∈ L(a, b) und U v ∈ dem Satz von Beppo Levi lässt sich ein nützliches, allge-
L(a, b) mit meines Kriterium zeigen, das in vielen Fällen geeignet ist,
J b J b Existenz von Integralen zu beweisen.
lim ϕn (x)!n (x) dx = u(x)V (x) dx
n→∞ a a Konvergenzkriterium für Integrale
und Eine Funktion f : I → R ist integrierbar über einem
J b J b offenen Intervall I , d. h. f ∈ L(I ), wenn f auf einer
lim n (x)ψn (x) dx = U (x)v(x) dx . Folgevon Teilintervallen I1 ⊆ I2 ⊆ · · · ⊆ I ⊆ R mit
n→∞ a
I= ∞
a
j =1 Ij integrierbar ist, kurz f ∈ L(Ij ) für j ∈ N,
Wir rechnen die partielle Integration für die stückweise und die Folge der Integrale
konstanten Treppenfunktionen explizit nach und betrachten J 
den Grenzfall n → ∞: Für eine gemeinsame Zerlegung |f (x)| dx
a = x0 < · · · < xn = b und Werte cj ∈ R bzw. c̃j ∈ R Ij j ∈N
der Treppenfunktionen ϕn und ψn auf den Teilintervallen
Ij = [xj , xj +1 ] folgt: beschränkt ist. In diesem Fall gilt:
J b J J
ϕn (x)!n (x) dx f (x) dx = lim f (x) dx .
a I j →∞ Ij

!
n−1 J xj +1 J x
= cj ψn (t) dt dx
j =0 xj a Beweis: Um zu sehen, dass das Konvergenzkriterium eine
⎛ ⎞ Folgerung des Satzes von Beppo Levi ist, nehmen wir zu-
!
n−1 J xj +1 −1
j! J x
= cj ⎝ c̃i |Ii | + c̃j dt ⎠ dx nächst f ≥ 0 auf dem Intervall I an und definieren die Folge
xj xj 
j =0 i=1 f (x), x ∈ Ij ,
fj (x) =
!!
n−1 !
n−1 J xj +1 J x 0, sonst.
= cj c̃i |Ii | |Ij | + cj c̃j dt dx Die Funktionenfolge (fj ) konvergiert punktweise und mono-
j =0 i<j j =0 xj xj
ton gegen f . Da die Folge der Integrale
!!
n−1
1!
n−1 'J ( J 
= cj c̃i |Ii | |Ij | + cj |Ij |2 . fj dx = f dx
2
j =0 i<j j =0 I Ij
16.5 Integration über unbeschränkte Intervalle oder Funktionen 629

nach Voraussetzung beschränkt ist, folgt nach dem Satz von existiert. In diesem Fall können wir das Integral berechnen,
Beppo Levi, dass f ∈ L(I ) lebesgue-integrierbar ist und etwa mithilfe einer Stammfunktion, durch den Grenzwert
J J J ∞ J b
f dx = lim f dx f (x) dx = lim f (x) dx
I j →∞ Ij a b→∞ a

gilt. oder J J
b b
Ist nun f : I → R beliebig, so zerlegen wir f = f+ − f− f (x) dx = lim f (x) dx .
−∞ a→−∞ a
mit 
f (x) für f (x) ≥ 0 ,
f + (x) =
0 für f (x) < 0 Es gibt unbeschränkte, aber integrierbare
und  Funktionen
0 für f (x) ≥ 0,
f − (x) =
−f (x) für f (x) < 0 . Nachdem wir das Konvergenzkriterium bei unbeschränkten
Damit lässt sich das obige Resultat für positive Funktionen Intervallen angewandt haben, sehen wir uns jetzt noch Defi-
auf f + und f − anwenden, und wir erhalten die Behaup- nitionslücken des Integranden genauer an.
tung.  Im einfachsten Fall lässt sich eine Lücke im Definitionsbe-
reich wie jene von
Die Tragweite des Kriteriums verdeutlichen wir uns an ver- sin x
schiedenen Beispielen. f (x) = durch f (0) = 1
x
Beispiel Wir prüfen mit dem Konvergenzkriterium, dass bei x = 0 stetig ergänzen (siehe Seite 318). Da das Inte-
das Integral gral stetiger Funktionen über abgeschlossenen Intervallen
J ∞
existiert und einzelne Punkte keinen Einfluss auf das Integral
xe−x dx haben, ist die Existenz des Integrals gesichert. Ein Wert lässt
0
sich mit einer Stammfunktion bestimmen, wenn wir diese
existiert.
kennen. Auch ein endlicher Sprung im Integranden lässt sich
Da xe−x ≥ 0 für x ≥ 0 gilt, können wir das Kriterium durch Aufteilen in zwei Integrationsintervalle klären (siehe
direkt anwenden. Wir suchen eine Stammfunktion zum In- Seite 611). Schwierigkeiten machen hingegen Funktionen
d
tegranden. Mit der Produktregel folgt dx ((1 + x)e−x ) = wie
−x −x −x
e − (1 + x)e = −xe . Setzen wir weiter Ij = (0, j ) 1 1
für j ∈ N, so erhalten wir: f (x) = sin( ), f (x) = ln |x| oder f (x) = ,
x x
J j
die an einer Stelle x0 , wie hier für x0 = 0, nicht definiert
xe−x dx = −(1 + x)e−x |0 = −(1 + j )e−j + 1 .
j
0 sind. Auch wenn die Funktion bei Annäherung an eine sin-
guläre Stelle betragsmäßig beliebig groß wird, kann es durch-
Wegen der Eigenschaft 0 ≤ e−j der Exponentialfunktion für aus sein, dass ihr Integral begrenzt bleibt. Es gibt aber auch
j ∈ N lassen sich die Integrale durch Situationen, in denen der Flächeninhalt unter dem Graphen
J j unbeschränkt ist.
xe−x dx = 1 − (1 + j )e−j ≤ 1
0 Beispiel Wir kennen bereits die Stammfunktion
abschätzen und somit ist die Folge der Integrale beschränkt. F : (−1, 1) → R mit F (x) = arcsin x zur Funktion
Das Konvergenzkriterium besagt, dass das Integral über f mit f (x) = √ 1 2 . Also erhalten wir mit Ij = 0, 1 − j1
1−x
(0, ∞) existiert. Außerdem erhalten wir den Wert die Abschätzung
J ∞ J j J 1− j1
xe−x dx = lim xe−x dx = lim 1−(1+j )e−j = 1 . %
1 1− 1
dx = arcsin x|0 j
0 j →∞ 0 j →∞
 0 1 − x2
' (
1 π
= arcsin 1 − − arcsin 0 ≤
j 2
Das Beispiel legt ein allgemeines Vorgehen nahe. Denn, wenn
der Integrand f auf beschränkten Intervallen integrierbar ist, für alle j ∈ N. Mit dem Konvergenzkriterium existiert das
etwa da f stetig ist, so besagt das Kriterium, dass die Funktion Integral über dem Intervall (0, 1), und es gilt:
auf (a, ∞) oder (−∞, b) integrierbar ist, wenn der Grenz- J 1 ' (
wert für 1 1 π
% dx = lim arcsin 1 − = arcsin(1) = .
J b J b 0 1−x 2 j →∞ j 2
lim |f (x)| dx bzw. lim |f (x)| dx 
b→∞ a a→−∞ a
630 16 Integrale – von lokal zu global

Beispiel: Integration auf unbeschränkten Intervallen oder unbeschränkter Funktionen


Wir untersuchen die Existenz folgender Integrale:
J ∞ J J ∞
1 1 1 + cos x
e−x dx .
2
J1 = dx , J2 = dx , J3 =
1 x + x2 0 x 0

Problemanalyse und Strategie: Da die Integranden auf den Integrationsgebieten positiv sind, müssen wir den Grenz-
wert über den Betrag der Funktionen nicht gesondert betrachten. Mit passenden Majoranten/Minoranten lässt sich die
Existenz der Integrale klären.
J
Lösung:
b * +b
lim e−x dx = lim −e−x 1
Im ersten Beispiel stellen wir zunächst fest, dass für posi- b→∞ 1 b→∞
B C
tive x > 0 immer die Ungleichung −b 1 1
= lim −e + = .
1 1 b→∞ e e
≤ 2
x + x2 x
Somit ist e−x integrierbar auf [1, ∞) mit
gilt. Das Integral über die rechte Seite der Ungleichung J ∞
1
können wir aber problemlos ermitteln, und damit erhal- e−x dx = .
ten wir mit dem Vergleich, dass das Integral J1 existiert. 1 e
Genauer gilt: e– x
J ∞ J ∞
dx dx 2
J1 = ≤
1 x + x2 1 x2
J b B C
dx 1 b 1
= lim = lim −
b→∞ 1 x 2 b→∞ x 1
1
= − lim + 1 = 1. 0 1 2 3 4 x
b→∞ b
e−x
2
Das Integral von f (x) = über dem Intervall [0, 1]
Im zweiten Beispiel wissen wir, dass der Kosinus für existiert, da die Funktion stetig ist. Da für alle x ∈ [0, 1]
x ∈ (− π2 , π2 ) positiv ist, also insbesondere auch im Inter- immer e−x ≤ 1 ist, kann man das Integral großzügig mit
2

vall [0, 1]. Damit ergibt sich: J 1 J +∞


J 1 J 1 J3 = −x 2
dx + e−x dx
2
1 + cos x 1 e
J2 = dx ≥ dx . 0 1
0 x 0 x J 1 J ∞
Da das Integral auf der rechten Seite divergiert, existiert ≤ dx + e−x dx
0 1
auch das Integral J2 nicht. 1
=1+
Im dritten Beispiel suchen wir eine Funktion, mit der wir e
f (x) = e−x nach oben abschätzen können.
2
abschätzen. Später auf Seite 639 werden wir sehen, dass
dieses Integral den Wert
Ein Kandidat ist g(x) = e−x , denn es gilt:

π
e−x ≤ e−x ,
2
J3 =
2
wenn x ≥ 1 ist. Auf dem Intervall [1, ∞) haben wir hat. Dies können wir hier noch nicht zeigen, da sich eine
eine integrierbare Majorante gefunden; denn es gilt we- Stammfunktionen von f nicht durch elementare Funktio-
gen (e−x ) = −e−x : nen ausdrücken lässt.

J b J b
Auch in dieser Situation, wenn eine Stammfunktion bekannt
lim |f (x)| dx bzw. lim |f (x)| dx
ist, lässt sich aus dem allgemeinen Kriterium ein generelles b→x0 − a a→x0 + a
Vorgehen ableiten. Nun nehmen wir an, dass eine Singula-
rität des Integranden am linken oder rechten Rand des Inte- prüfen. Wenn dieser Grenzwert existiert, ist die Funktion in-
grationsbereichs liegt. Andernfalls spalten wir das Integral tegrierbar, und es gilt:
entsprechend auf.
J x0 J b
Für die Integration über Funktionen mit einer Singularität an
f (x) dx = lim f (x) dx
einer Stelle x0 ∈ R können wir den Grenzwert a b→x0 − a
16.5 Integration über unbeschränkte Intervalle oder Funktionen 631

bzw. J J Oft ist ein Vergleich mit der Funktion g mit g(x) = x1α =
b b
f (x) dx = lim f (x) dx . x −α hilfreich. In Abhängigkeit vom Parameter α > 0 lassen
x0 a→x0 + a sich Aussagen über das gesuchte Integral machen. Um diese
Technik nutzen zu können, untersuchen wir zunächst solche
Beispiel Vergleichsintegrale. Für das Integral
J ∞
Mit der Ableitung 1
α
dx
1 x
1
(x ln x − x) = x + ln x − 1 = ln x erhalten wir mit α = 1:
x
J )b
und der Regel von de L’Hospital erhalten wir für die Be-
b
−α x −α+1 ))
1 lim x dx = lim )
rechnung des Integrals 0 ln x dx: b→∞ 1 b→∞ −α + 1 )
1
J 1 J 1 b1−α 1
| ln x| dx = − ln x dx = −(x ln x − x)|1 = lim − .
b→∞ 1 − α 1−α
 
= 1 + ( ln  − ) → 1 Für α > 1 existiert der Grenzwert
lim b1−α = 0
für  → 0. Da der Grenzwert existiert, gilt ln ∈ L((0, 1)). b→∞
Unter Berücksichtigung des Vorzeichens erhalten wir:
und somit auch das Integral. Für α < 1 hingegen liegt Diver-
J 1 genz vor. Den ausgeschlossenen Fall α = 1 haben wir schon
ln x dx = −1 . im letzten Beispiel geklärt. Das Integral existiert nicht.
0
Analog betrachten wir noch
Mit der Ableitungsregel (ln x) = 1
x erhalten wir: J 1
1
J 1 dx .
1 xα
dx = ln x|1ε = − ln ε , 0
ε x Setzen wir wieder zunächst α = 1 voraus, so ist
und dieser Ausdruck divergiert für ε → 0. Das Integral J 1 )1
1 1
−α x −α+1 ))
0 x dx existiert nicht.  x dx = )
a −α + 1 )
a
Wir haben auf Seite 623 bereits ein Beispiel gesehen, bei dem 1 a 1−α
keine Stammfunktion durch Standardfunktionen ausgedrückt = − .
1−α 1−α
werden kann. Damit lässt sich ein Grenzwert, wie oben be-
schrieben, nicht ausnutzen. Aber es lässt sich eine weitere In diesem Fall existiert das Integral für α < 1, denn wir
Möglichkeit ableiten, die Existenz eines Integrals zu prüfen, erhalten den Grenzwert:
J 1
und zwar ohne den Wert des Integrals zu berechnen. 1 1
lim x −α dx = − lim a 1−α = .
a→0 a 1 − α a→0 1−α
Mit einer Majorante lässt sich die Existenz Für α > 1 divergiert der Limes und somit auch das Integral.
Den Ausnahmefall α = 1 haben wir oben überprüft, das
eines Integrals auch ohne Kenntnis einer
Integral existiert nicht.
Stammfunktion klären
Wie man diese Integrale als Majoranten nutzen kann, ist in ei-
Betrachten wir das Konvergenzkriterium noch einmal genau, nigen der Beispiele auf Seite 630 zu sehen. Gerade beim letz-
so beantwortet es uns die Frage nach der Existenz des Inte- ten der dort gezeigten Beispiele wird die Bedeutung solcher
grals, wenn wir neben f ∈ L(Ij ) zeigen können, dass die Abschätzungen deutlich. Wir können klären, ob ein Integral
Folge der Integrale existiert, auch wenn keine Stammfunktion gegeben ist.
J  Lässt sich die Existenz eines Integrals auf Intervallen der
|f (x)| dx Form (N, ∞) klären, so liefert dies ein weiteres Kriterium
Ij j ∈N für die Konvergenz entsprechender Reihen.

beschränkt ist. Also genügt eine Abschätzung für diese Folge. Integralkriterium für Reihen Ist f : [N, ∞) → R eine mo-
Wegen der Monotonie des Integrals ist es naheliegend, den noton fallende, positive, auf kompakten Teilintervallen inte-
Integranden durch Funktionen abzuschätzen, zu denen uns grierbare Funktion und ist an = f (n) für n ≥ N ∈ N, so
die Existenz des entsprechenden Integrals bekannt ist. Wir konvergiert die Reihe
sprechen dann von einer Majorante bzw. Minorante. Im  ∞   ∞ 
! !
Beispiel auf Seite 630 ist diese durch die Konstante 1 gege- an = f (n)
ben. n=N n=N
632 16 Integrale – von lokal zu global

Übersicht: Einige bestimmte Integrale


Da zum Beweis der Existenz von Integralen oft der Vergleich mit bekannten Integralen erforderlich ist, stellt die folgende kurze
Liste die dazu am häufigsten genutzten bestimmten Integrale zusammen.

Bestimmte Integrale Divergente Integrale


J ∞ Die folgenden Grenzwerte sind unbeschränkt und somit
1 1
dx = für α > 1 existieren die entsprechenden Integrale nicht.
1 xα α−1
J ∞ J b
e−x dx = 1 1
dx → ∞, b→∞ für α ≤ 1
0 1 xα
J ∞ √ J
π b
e−x dx =
2

2 ln x dx → ∞, b→∞
0 1
J ∞ J
1 1
dx = π 1
dx → ∞, a→0 für α ≥ 1
−∞ 1 + x2 xα
a
J 1 1 1
dx = für 0 ≤ α < 1
0 x α 1−α
J 1
Kommentar: Den Zusammenhang zwischen Konver-
ln x dx = −1 genz und Divergenz der Integrale über x1α einerseits in
0 (0, 1), andererseits in (1, ∞) kann man mit der Substi-
tutionsregel aus Kapitel 16.4 direkt herstellen. Durch die
Substitution u = x1 wird die Komplementarität klar.

genau dann, wenn das Integral für α > 1 konvergiert, betrachten wir mit der Substitution
J ∞ u = ln(x) und partieller Integration
f (x) dx J J
N b ln(x) ln b
dx = u e(1−α)u du
existiert. 1 xα 0
1 b(1−α) ln(b) b(1−α)
= − +
Beweis: Aus aj = f (j ) ≤ f (x) ≤ f (j + 1) = aj +1 für (1 − α)2 (1 − α)2 1−α
j ≥ N und x ∈ [j, j + 1] und mit In = [N, n] für n ∈ N 1
→ , b → ∞.
gilt: (1 − α)2
!
n−1 J !n
aj ≤ f (x) dx ≤ aj . Mit dem Kriterium ergibt sich Konvergenz der Reihe. 
j =N In j =N +1

Also liefert die Reihe eine Majorante für die Integrale über
alle In . Nach dem Konvergenzkriterium auf Seite 628 exis- Manchmal reicht das Lebesgue-Integral
tiert somit J ∞ nicht aus
f (x) dx .
N
∞ Auch wenn die Klasse der integrierbaren Funktionen recht
Andererseits folgt aus der Existenz des Integrals N f (x) dx umfassend ist, gibt es Situationen, in denen diese nicht aus-
eine obere Schranke für die monoton steigende Folge der reicht. Ein für die Signalverarbeitung wichtiges Beispiel ist
Partialsummen. Nach dem Monotoniekriterium konvergiert auf Seite 634 gezeigt. Wir sprechen von einem uneigent-
damit die Reihe.  lichen Integral, wenn die betrachtete Funktion nicht inte-
grierbar ist, aber ein Grenzwert, etwa wie im Beispiel
Das Konvergenzkriterium ist in manchen Fällen ein eleganter J x
Weg, um Konvergenz zu belegen. lim sinc(t) dt ,
x→∞ 0

Beispiel Um zu klären, ob die Reihe


existiert. Beachten Sie, dass das Konvergenzkriterium in die-

! sen Fällen nicht greift, da entsprechende Folgen von Integra-
ln(k)
len über den Betrag des Integranden nicht beschränkt sind,

k=1 d. h. sinc ∈ L(R).
16.6 Parameterabhängige Integrale 633

Eine weitere Erweiterung des Integralbegriffs ist mit dem so- Wir definieren eine Funktion g : R>1 → R durch das
genannten Cauchy’schen Hauptwert gegeben. Nach der De- Integral J ∞
finition existiert das Integral
g(s) = ex e−sx dx .
J 1
0
1 Diese Definition ist sinnvoll, da das Integral für s > 1
dx
−1 x existiert, und es gilt:
J ∞
nicht, da die beiden Integrale
g(s) = e(1−s)x dx
J B J 1 0
dx dx )
lim und lim 1 (1−s)x ))b
B→0− −1 x A→0+ A x = lim e )
b→∞ 1 − s x=0
divergieren. Andererseits verhalten sich beide Anteile sym- 1
metrisch. Wenn man die Grenzübergänge nicht separat, son- =
s−1
dern simultan vollzieht, ergibt sich:
J  mit dem Grenzwert limb→∞ e(1−s)b = 0 für s > 1.
J 1 −T dx J 1 Die Funktion g nennt man die Laplacetransformierte der
dx dx
P := lim + Funktion exp.
−1 x T →0+ −1 x T x
 )−T )1  Ist mit f : R → R die Rechteckfunktion mit
) ) 
= lim ln(−x)) + ln x )
T →0+ −1 T 1, t ∈ [−1, 1] ,
f (x) =
= lim {ln T − ln 1 + ln 1 − ln T } = 0. 0, sonst
T →0+
notiert, dann erhalten wir bis auf einen Faktor die soge-
Wenn ein solcher symmetrischer Grenzwert existiert, nennt nannte Fouriertransformation g : R → C durch
man ihn Cauchy’scher Hauptwert. Um dieses Integral von J ∞
eigentlichen Integralen zu unterscheiden, wird es manchmal g(s) = f (t)e−ist dt .
mit P für principal value gekennzeichnet. −∞

Dieses Integral existiert, und wir berechnen


16.6 Parameterabhängige J 1 )1
1 )
g(s) = e−ist dt = − e−ist )
−1
Integrale −1
 
is
1 is sin s
= e − e−is = 2 = 2 sinc(s)
is s
In Formelsammlungen werden Sie häufig Integraldarstellun-
gen von speziellen Funktionen begegnen. So ist etwa die mithilfe der Euler’schen Formel. Der Sinus Cardinalis
Gammafunktion für t > 0 definiert durch (siehe Beispiel auf Seite 634) ist somit bis auf einen Faktor
J ∞ die Fouriertransformierte zu f . 
(t) = e−x x t−1 dx .
0 Die letzten beiden Beispiele sind sogenannte Integraltrans-
formationen. Solche Transformationen von Funktionen sind
Diese Funktion verallgemeinert die Fakultät. In Aufgabe
nicht nur vielschichtige mathematische Studienobjekte, son-
16.12 werden wir die Funktion genauer betrachten und unter
dern spielen etwa bei der Behandlung von Differenzialglei-
anderem zeigen, dass (n − 1)! = (n) gilt, die Gammafunk-
chungen eine wichtige Rolle.
tion somit eine stetige Fortsetzung der Fakultät auf R>0 ist.
Um Eigenschaften solcher Funktionen wie Stetigkeit oder
Für uns ist an dieser Stelle Folgendes wichtig: Es handelt
Differenzierbarkeit zu untersuchen, auch wenn keine expli-
sich um ein Integral, dessen Integrand von einem Parame-
zite Stammfunktion bekannt ist, müssen Grenzprozesse be-
ter t abhängt. Bezüglich dieses Parameters können wir den
züglich der Variablen t mit der Integration vertauscht werden.
Ausdruck wieder als Funktion auffassen.
Im Allgemeinen stoßen wir hier auf Schwierigkeiten, wie es
am folgenden Beispiel deutlich wird.
Beispiel
Durch f : R>−1 → R mit Beispiel Wir definieren Funktionen fk : R → R durch
J 1 )1 ⎧
1 ) 1 ⎨ x +1−k, k−1 ≤ x < k,
f (t) = x t dx = x t+1 ) =
0 t +1 x=0 t +1 fk (x) = k + 1 − x , k ≤ x < k + 1,

0, x ∈ [k − 1, k + 1)
ist diese differenzierbare Funktion zum einen mithilfe
eines Parameterintegrals und zum anderen durch einen zu k ∈ N. Der Graph der Funktion fk ist ein Hut mit Spitze
expliziten Ausdruck dargestellt. bei x = k (Abb. 16.16).
634 16 Integrale – von lokal zu global

Beispiel: Der Sinus Cardinalis und der Integralsinus


sin x
Der Sinus Cardinalis, die Funktion sinc(x) = x , ist auf I = (0, ∞) im Lebesgue’schen Sinn nicht integrierbar, aber der
Grenzwert des Integralsinus Si : R → R,
J x sin t
lim Si(x) = lim dt
x→∞ x→∞ 0 t
existiert.
 ∞ 
Problemanalyse und Strategie: Es ist zu zeigen, dass 0 |sinc(x)| dx unbeschränkt ist, aber der Grenzwert, wenn
der Integrand ohne Betrag betrachtet wird, existiert.

Lösung: und es genügt, den restlichen Anteil zu betrachten. Mit


Aus der Divergenz der harmonischen Reihe folgt: partieller Integration folgt:
J nπ ) ) n J (j − 1 )π
! J J
) sin x ) 4 | sin x| b b
) ) dx ≥ dx sin x cos b cos x
) x ) 3 x dx = cos 1 − + dx .
0 (j − 4 )π j =1 1 x b 1 x2
! n
sin 1 π
≥  4 1 Mit der Majorante x12 ist offensichtlich, dass die Funktion
j =1
2 j−4 cos x
auf [1, ∞) integrierbar ist, und es gilt:
√ n x2
2! 1 )J )
= → ∞ für n → ∞ . ) b cos x ) J b 1
4 j − 41 ) )
j =1 ) dx ) ≤ dx ≤ 1
) 1 x2 ) 1 x
2
Beachten Sie, dass etwa mit der L’Hospital’schen Regel
sin x
x → 1 für x → 0 gilt. Daher ist |sinc x| auf dem kom- für alle b > 1. Somit existiert der Grenzwert mit
pakten Intervall [0, nπ] stetig, also integrierbar. Aber die
J b J ∞
Folge der Integrale ist unbeschränkt und somit kann das sin x cos x
Integral über (0, ∞) nicht existieren. lim dx = cos 1 + dx .
b→∞ 1 x 1 x2
sin x
Da x auf [0, 1] stetig ist, existiert das Integral b
J  Der Wert limb→∞ 0 sinx x dx = π2 lässt sich etwa mit
1 sin x
Hilfe der Laplacetransformation zeigen, auf die wir hier
dx ,
0 x aber nicht genauer eingehen können.

y Der Lebesgue’sche Konvergenzsatz sichert


Vertauschbarkeit von Integration und
f1 f2 fk
1 weiteren Grenzprozessen

1 2 k−1 k k+1 x
Ein zentraler Satz der Integrationstheorie gibt an, unter wel-
Abbildung 16.16 Graphen der Funktionen aus dem Beispiel auf Seite 633. chen Voraussetzungen an die Folge der Integranden Grenz-
wert und Integral vertauscht werden können, ohne dass sich
der Wert ändert.
Man sieht, dass die Folge punktweise gegen null konvergiert.
Für die Folge der Integrale gilt aber:
J ∞ J k J k+1 Lebesgue’scher Konvergenzsatz
fk (x) dx = (x+1−k) dx+ (k+1−x) dx = 1 .
−∞ k−1 k Wenn es zu einer Folge von integrierbaren Funktionen
fn ∈ L(I ) über einem Intervall I ⊂ R, die punktweise
Somit ist fast überall gegen f : I → R konvergiert, eine integrier-
J ∞ J ∞ bare Funktion g ∈ L(I ) gibt mit |fn (x)| ≤ g(x) für fast
1 = lim fk (x) dx  = lim (fk (x)) dx = 0 . alle x ∈ I und alle n ∈ N, dann ist f ∈ L(I ) integrierbar,
k→∞ −∞ −∞ k→∞ und es gilt:
Es macht einen Unterschied, ob wir den Grenzwert der In- J J
tegrale betrachten oder ob wir über den Grenzwert der Inte- lim fn (x) dx = f (x) dx .
n→∞ I I
granden integrieren. 
16.6 Parameterabhängige Integrale 635

Beachten Sie, dass diese Aussage nicht nur das Vertauschen und J J
der Grenzprozesse ermöglicht, sondern auch zeigt, dass die lim hn (x) dx = f (x) dx.
Grenzfunktion eine integrierbare Funktion ist. n→∞ I I

Schließlich ergibt sich aus den beiden Abschätzungen


Beweis: Der Konvergenzsatz lässt sich zeigen, indem wir
zunächst für ein n ∈ N die Funktionenfolgen J J J
gn (x) dx ≤ fn (x) dx ≤ hn (x) dx
I I I
gnj := min{fn , fn+1 , . . . , fn+j }
für n ∈ N, auch die Konvergenz der Integrale
und J J
hnj := max{fn , fn+1 , . . . , fn+j } lim fn (x) dx = f (x) dx
n→∞ I I
betrachten. Da die Funktionen fn in L(I ) liegen, gilt
auch mit den allgemeinen Eigenschaften des Integrals, dass durch das Einschließungskriterium zu Folgen (siehe
gnj ∈ L(I ) und hnj ∈ L(I ) bzgl. j ∈ N wieder Folgen Seite 289). 

integrierbarer Funktionen sind.


Die Aussage des Konvergenzsatzes gibt uns die Möglichkeit
Die Folge (gnj )j ∈N ist monoton fallend, denn wenn wir von j zu entscheiden, ob ein Grenzprozess mit einer Integration
zu j + 1 übergehen, kommt eine weitere Funktion hinzu, so- vertauscht werden darf. Wir werden dieser Situation häufi-
dass das Minimum der Funktionen gn (j +1) höchstens kleiner ger begegnen. Wie wir schon in anderen Situationen beim
wird. Analog ist die Folge hnj monoton wachsend. Nutzen Vertauschen von Grenzwerten gesehen haben (siehe etwa
wir nun noch, dass mit der im Satz vorausgesetzten integrier- Seite 387), ist auch hier Gleichmäßigkeit des Grenzprozesses
baren Majorante g die Abschätzungen die wesentliche Voraussetzung. Die Gleichmäßigkeit steckt
J J J J in diesem Fall in der Bedingung, dass die integrierbare Ma-
− g(x) dx ≤ gnj (x) dx ≤ hnj (x) dx ≤ g(x) dx jorante g unabhängig von n für alle Folgengliedern fn exi-
I I I I stieren muss.
für alle n, j ∈ N gelten, so folgt mit dem Satz von Beppo
Levi, dass die Folgen punktweise fast überall konvergie- Beispiel Die Funktionenfolgen (fn ), (hn ) der integrierba-
ren mit Grenzfunktionen limj →∞ gnj =: gn ∈ L(I ) und ren Funktionen fn , hn : [0, 1] → R mit
limj →∞ hnj =: hn ∈ L(I ). Es gilt: √ * 
n für x ∈ 0, n1 ,
J J J J fn (x) = * +
0 für x ∈ n1 , 1
− g(x) dx ≤ gn (x) dx ≤ hn (x) dx ≤ g(x) dx .
I I I I
und  * 
n für x ∈ 0, n1 ,
Für die so konstruierten Folgen integrierbarer Funktionen hn (x) = * +
(gn ) und (hn ) wenden wir ein weiteres Mal den Satz von 0 für x ∈ n1 , 1
Beppo Levi an. Dazu müssen wir uns noch die Monotonie konvergieren beide punktweise mit Ausnahme der Stelle
dieser Folgen bzgl. n ∈ N überlegen: x = 0 gegen die konstante Funktion f : [0, 1] → R mit
f (x) = 0 (Abb. 16.17).
Wenn mit M ⊆ I die Nullmenge bezeichnet ist, auf der die
Folge (fn (x)) nicht punktweise gegen f (x) konvergiert, so Im ersten Fall können wir eine integrierbare Majorante
gilt für eine Stelle x ∈ I \M Konvergenz, d. h., zu jedem g : [0, 1] → R mit g(x) = √1x angeben. Daher besagt der
ε ≥ 0 gibt es eine Zahl n0 ∈ N mit |fn (x) − f (x)| ≤ ε für Lebesgue’sche Konvergenzsatz, dass auch für die Integrale
alle n ≥ n0 . Wegen der Konstruktion gilt diese Abschätzung
J J
auch für gn und hn anstelle von fn , wenn n ≥ n0 gewählt 1 1
ist. Dies zeigt, dass die Folgen gn und hn punktweise fast lim fn (x) dx = f (x) dx = 0
n→∞ 0 0
überall, nämlich auf I \M, gegen f konvergieren.
gilt. Das Ergebnis können wir verifizieren, indem wir
Außerdem ist gn fast überall monoton steigend, da das Mini-
mum gnj = min{fn , fn+1 , . . . , fn+j } größer wird, wenn die J J 1
1 n √ 1√ 1
erste Funktion gestrichen wird, d. h., bei Übergang von gnj zu fn (x) dx = n dx = n= √
0 0 n n
g(n+1) j . Genauso ist die Folge hn fast überall monoton fal-
lend. Mit der oben angegebenen Beschränkung der Integrale berechnen.
folgt mit dem Satz von Beppo Levi, dass die Grenzfunktion
f ∈ L(I ) integrierbar ist mit Im zweiten Fall gilt:
J J J 1 J 1
n 1
lim gn (x) dx = f (x) dx hn (x) dx = n dx = n=1
n→∞ I I 0 0 n
636 16 Integrale – von lokal zu global

einem kompakten Intervall [a, b] ⊆ R definierte Funktion


f : [a, b] × I → R etwa durch f (t, x). So lässt sich ein
5 parameterabhängiges Integral allgemein durch
J
G(t) = f (t, x) dx
4 I
beschreiben. Selbstverständlich entscheiden Eigenschaften
3 fn der Funktion f über die Eigenschaften der Funktion G.

hn Zunächst muss sichergestellt werden, dass das Integral für



√5 jeden möglichen Wert t ∈ [a, b] existiert. Wir müssen die
2 = √4 Forderung stellen, dass die Funktionen h : I → R mit
√3 h(x) = f (t, x) bei fest vorgegebenem Wert t integrierbar
2
√ sind. Abkürzend schreiben wir für diese Voraussetzung:
1= 1 g
f (t, ·) ∈ L(I ) für alle t ∈ [a, b] .

Mit der Notation f (t, .) bezeichnen wir im Folgenden eine


11 1 1 1 solche Funktion h, ohne eine weitere Bezeichnung wie den
54 3 2
Abbildung 16.17 Ein Beispiel und ein Gegenbeispiel zum Konvergenzsatz. Buchstaben h jeweils einzuführen.
Zusammenfassend bedeutet diese Überlegung: Ist f : I ×
für alle n ∈ N. Es gilt deswegen: [a, b] → R eine Funktion mit f (t, .) ∈ L(I ), dann ist durch
G : [a, b] → R eine Funktion auf [a, b] definiert.
J 1 J 1
1 = lim hn (x) dx  = f (x) dx = 0 . Machen wir Aussagen über die Funktion bezüglich der Va-
n→∞ 0 0 riablen t bei festgehaltenem x ∈ I , so schreiben wir analog
Der Lebesgue’sche Konvergenzsatz ist nicht anwendbar, da f (., x). Mit dieser Notation können wir die Voraussetzungen
das Integral und der Grenzprozess nicht vertauschbar sind. formulieren, dass G eine stetige Funktion ist.
Es gibt keine integrierbare Majorante g ∈ L((0, 1)). 
Stetigkeit von Parameterintegralen
? Ist f : [a, b] × I → R eine Funktion, sodass f (., x)
Begründen Sie, dass folgende Umkehrung der Aussage des für fast alle x ∈ I eine stetige Funktion auf [a, b] ist,
Konvergenzsatzes gilt: Ist f ∈ L(I ), so gibt es eine punkt- und gibt es weiter für alle t ∈ [a, b] eine integrierbare
weise fast überall gegen f konvergente Folge von inte- Funktion g ∈ L(I ) mit |f (t, x)| ≤ g(x) für fast alle
grierbaren Funktionen und eine integrierbare Majorante mit x ∈ I , so ist die durch
f (x) ≤ g(x) fast überall. J
G(t) = f (t, x) dx, t ∈ [a, b] ,
I
Zwei wichtige Konsequenzen aus dem Konvergenzsatz im definierte Funktion G : [a, b] → R stetig.
Zusammenhang mit Parameterintegralen werden häufig ge-
nutzt.
Beweis: Wir betrachten eine beliebige Folge (tn ) in [a, b],
die gegen tˆ ∈ [a, b] konvergiert. Zu jedem tn definieren
Wenn eine integrierbare Majorante existiert, wir eine integrierbare Funktion hn ∈ L(I ) durch hn (x) =
ist ein Parameterintegral stetig vom f (tn , x). Da f (., x) stetig ist, konvergiert die Folge (hn (x))
Parameter abhängig punktweise für fast alle x ∈ I gegen eine Funktion h : I → R
mit h(x) = f (tˆ, x). Außerdem ist
Mit dem Konvergenzsatz lässt sich klären, unter welchen Be-
dingungen bei einer durch ein Integral definierten Funktion, |hn (x)| = |f (tn , x)| ≤ g(x)
wie bei der Gammafunktion, Stetigkeit der Funktion folgt. für alle n ∈ N. Also ist durch g eine integrierbare Majorante
Um den Integranden bei diesen Integralen allgemein zu be- zu (hn ) gegeben. Der Lebesgue’sche Konvergenzsatz liefert:
schreiben, greifen wir ein wenig dem Kapitel 21 vor. Der J
Integrand hängt von zwei Variablen ab, zum einen von der lim G(tn ) = lim f (tn , x) dx
n→∞ n→∞ I
Integrationsvariable, bei der Gammafunktion hatten wir x J J
gewählt, und zum anderen von dem Parameter, den wir oben = lim f (tn , x) dx = f (tˆ, x) dx = G(tˆ) .
mit t bezeichnet haben. Wir fassen den Integranden deswe- I n→∞ I
gen als einen Ausdruck bzw. eine Funktion in zwei Varia- Da diese Identität für beliebige konvergente Folgen gilt, ist
blen auf und notieren eine auf einem Intervall I ⊆ R und G : [a, b] → R stetig. 
16.7 Weitere Integrationsbegriffe 637

Beispiel Die am Anfang des Abschnitts definierte Gam- Durch die Forderungen p(0) = 0 und p  (0) = 0 sind zwei
mafunktion ist eine stetige Funktion für t > 0. Dies ergibt Koeffizienten der Parabel festgelegt. Es bleibt nur noch ein
sich aus der oben gezeigten Aussage, denn die Integranden freier Parameter, den wir mit t bezeichnen, d. h., die gesuchte
e−x x t−1 sind bei festem Wert t > 0 auf I = (0, ∞) inte- Parabel ist gegeben durch p(x) = tx 2 . Für die integrierte
grierbar. Außerdem handelt es sich um stetige Funktionen quadratische Abweichung erhalten wir
bezüglich der Variablen t für jedes x > 0. Eine integrierbare J 1, -2
Majorante erhalten wir auf jedem abgeschlossenen Intervall F (t) = x 4 − tx 2 dx .
[a, b] ⊆ (0, ∞) durch die Abschätzung −1
 −x a−1  Aus unseren Ergebnissen zu Parameterintegralen wissen wir,
e x x≤1
f (t, x) ≤ g(x) = dass F differenzierbar ist. Um ein Extremum zu finden, leiten
e−x x b−1 x>1 wir den Ausdruck nach t ab, indem wir, wie gezeigt, den
für t ∈ [a, b].  Integranden differenzieren und erhalten:
J 1, -

F (t) = 2 x 4 − tx 2 (−x 2 ) dx
Auch Differenzierbarkeit nach einem −1
J 1 , -
Parameter lässt sich mittels einer Majorante = −2 x 6 − tx 4 dx
prüfen −1
2 31 B C
x7 x5 1 1
Wenn f (., x) differenzierbar ist auf einem Intervall [a, b], = −2 −t = −4 −t .
7 5 7 5
so überträgt sich dies auch auf G, aber wiederum nur unter −1
gewissen zusätzlichen Voraussetzungen. Nullsetzen der Ableitung liefert t = 57 . Wegen F  (t) = 45 > 0
haben wir tatsächlich ein Minimum gefunden. Das Polynom
Die Ableitung eines Parameterintegrals q, die beste Parabel p und die quadratische Abweichung sind
Sind f (., x) für fast alle x ∈ I differenzierbare Funk- in Abbildung 16.18 dargestellt. 
tionen auf [a, b] mit Ableitungen ∂f 
∂t (., x) = (f (., x)) , y
und gibt es für alle t ∈ [a, b] eine integrierbare Funktion
g ∈ L(I ) mit | ∂f
1 x4
∂t (t, x)| ≤ g(x) für fast alle x ∈ I , so
ist das Parameterintegral G differenzierbar, und es gilt: 5 2
7
x
J
 ∂f
G (t) = (t, x) dx, t ∈ [a, b] .
I ∂t

Dabei bezeichnet ∂f ∂t die partielle Ableitung von f nach t -1 1 x


(siehe Kapitel 21), salopp gesprochen also den Ausdruck,
den man erhält, wenn man x vorübergehend als konstant be- Abbildung 16.18 Ein Polynom vierten Grades (blau) und die beste Näherung
im Sinne der integrierten quadratischen Abweichung.
trachtet und nach t ableitet.

Beweis: Auch diese Aussage folgt aus dem Lebesgue’


schen Konvergenzsatz – analog zur Stetigkeit, aber mit Fol- 16.7 Weitere Integrationsbegriffe
gen
f (tn , x) − f (tˆ, x)
hn (x) = Schon zu Beginn dieses Kapitels wurde angedeutet, dass
tn − tˆ es neben dem in Abschnitt 16.2 vorgestellten Zugang an-
und Grenzfunktionen dere Möglichkeiten gibt, Integrale zu definieren. Wir dis-
∂f kutieren in diesem Kapitel zwei weitere Varianten. Es wird
h(x) = (tˆ, x). sich später herausstellen, dass der Vektorraum der lebesgue-
∂t
integrierbaren Funktionen reichhaltiger ist und mit dem Satz
Die Folge hn wird durch g majorisiert, da es zu x ∈ I nach
von B. Levi und dem Lebesgue’schen Konvergenzsatz wich-
dem Mittelwertsatz der Differenzialrechnung eine Stelle
tige Eigenschaften aufweist, die in vielen Bereichen grund-
sn ∈ (tn , tˆ) gibt mit
legend sind.
) )
) ∂f )
|hn (x)| = )) (sn , x))) ≤ g(x).  Man kann die unterschiedlichen Definitionen an verschie-
∂t denen Konvergenzbegriffen bei den betrachteten Folgen von
Treppenfunktionen festmachen. Die Lebesgue-Theorie nutzt
Beispiel Wir suchen jene Parabel p mit Scheitel im Ur- fast überall monoton wachsende und fast überall punktweise
sprung, für die die integrierte quadratische Abweichung von konvergente Folgen (siehe Seite 605). Alternativ lässt sich
q(x) = x 4 im Intervall [−1, 1] minimal wird. gleichmäßige Konvergenz (siehe Seite 602) zugrunde legen.
638 16 Integrale – von lokal zu global

Hintergrund und Ausblick: Die Stirling-Formel


Parameterabhängige Integrale zusammen mit dem Lebesgue’schen Konvergenzsatz sind mächtige Werkzeuge, um ein
asymptotisches Verhalten von Ausdrücken zu begründen. So lässt sich etwa die häufig genutzte Stirling-Formel

n! = nn e−n 2π n (1 + o(1))
für n → ∞ zeigen. Zur Darstellung des Verhaltens nutzen wir hier die Landau Schreibweise (siehe Seite 396)

Zunächst überlegen wir, wie man eine Idee über das Wir definieren
asymptotische Verhalten der Fakultät bekommen kann.  2n−1 √ √
1+ x
√ e− nx , x > −2 n ,
Dazu ist es sinnvoll, sich den Logarithmus anzusehen: hn (x) = 2 n √
0, x ≤ −2 n .
!
n
ln(n!) = ln(j ) . Die Funktion hn ist nicht negativ auf R, und es gilt
j =1 limx→∞ hn (x) = 0 für jedes n ∈ N. Mit der Ableitung
Die Summe rechts lässt sich etwa im Sinne der Trapezregel
(siehe Seite 624) interpretieren, d. h.: h (x)
J n ' (' (2n−2 √
!n 2n − 1 √ x x
1
ln(j ) − ln(n) ≈ ln x dx = √ − n(1 + √ ) 1 + √ e− n x
2 1
2 n 2 n 2 n
j =1

mit Intervallbreite h = 1. Da wir eine Stammfunktion zum auf (−2 n, ∞) ergibt sich die einzige kritische Stelle bei
−1
Integral kennen, erhalten wir die Approximation x = √ n
. Also liegt dort ein Maximum; und es gilt die
! 1 Abschätzung:
ln(j ) ≈ n ln(n) − n + 1 + ln(n)
2
j =1
n −1 1 2n−1
0 ≤ hn (x) ≤ hn ( √ ) = (1 − ) e ≤ e.
bzw. mit der Exponentialfunktion n 2n
√  n n
n! ≈ e n . Damit erhalten wir eine integrierbare Majorante, g(x) =
e  2 
Die Differenz zwischen dem Integral und der Trapez- exp − x4 + 1 . Mit dem Lebesgue’schen Konvergenzsatz
summe für große n lässt sich mithilfe der sogenannten ist J ∞
x2
Euler-MacLaurin Summenformel genauer untersuchen. lim qn = lim hn (x) e− 4 dx .
n→∞ −∞ n→∞
So lässt sich die Approximation auch als Startpunkt für
einen rigorosen Beweis der Stirling’schen Formel nutzen, Für den punktweisen Grenzwert von (hn (x))n∈N schrei-
den wir hier aber nicht weiter ausführen. ben wir
' (−1 √
Eine andere Möglichkeit, nun das asymptotische Verhal- x x
2n ln(1+ 2√ )− n x
hn (x) = 1 + √ e n
ten der Fakultät für wachsendes n ∈ N zu beweisen, ist es 2 n
den Quotienten
n! en √
qn = n √ für x > −2 n. Mit der Taylorformel 2. Ordnung zu
n n ln(1 + ξ ) um ξ = 0 folgt:
zu betrachten. Auf diesem Weg können wir Parameter- B  C
x  √
integrale anwenden, genauer die Darstellung der Fakultät lim 2n ln 1 + √ − n x
mithilfe der Gammafunktion, (n − 1)! = (n) (siehe Auf- n→∞ 2 n
2  ' ( 3
gabe 16.12). Es folgt: x 1 x2 x 3 √
= lim 2n √ − +O √ − nx
en (n) n→∞ 2 n 2 4n 2 n
qn = n−1 √
n n
J ∞ x2
en =−
= n−1 √ ξ n−1 e−ξ dξ . 4
n n 0
für jeden Wert x ∈ R. Insgesamt erhalten wir die Stir-
Einer Idee von J. M. Patin in A very short proof of Stirling’s ling’sche Formel aus
formula, Amer. Math. Monthly 96 (1989) folgend ergibt J ∞
x2
sich mit der Substitution
' (2 lim qn = lim hn (x)e− 4 dx
n→∞ −∞ n→∞
x J ∞
ξ =n 1+ √ x2 √
2 n = e− 2 dx = 2π ,
die Identität −∞
J ∞ ' (2n−1 √
x x2 wobei wir den Wert des letzten Integrals im Beispiel auf
qn = √ 1 + √ e− n x− 4 dx .
−2 n 2 n Seite 639 berechnen.
16.7 Weitere Integrationsbegriffe 639

Beispiel: Das Gauß-Integral



Wir bestimmen den Wert des Integrals 0 e−x dx. Zu beachten ist, dass der Integrand keine Stammfunktion hat, die sich
2

durch elementare Funktionen ausdrücken lässt.


Problemanalyse und Strategie: Wir benutzen ein Parameterintegral, um das gesuchte Integral über einen Umweg zu
bestimmen.

Lösung: Da
Die Existenz des Integrals haben wir bereits auf Seite 630 J 1
gezeigt. 1 π
G(0) = dx = arctan x|10 =
0 1 + x2 4
Wir betrachten nun die Funktion G : R → R mit
J 1 −(1+x 2 )t 2 ist, ergibt sich insgesamt:
e
G(t) = dx .
0 1 + x2 'J t (2
π
e−x dx
2
−(1+x 2 )t 2 = − G(t) .
Mit der Ableitung, |−2te | ≤ 2t, des Integranden 0 4
ist die Konstante 2T integrierbare Majorante auf [0, 1] für
alle t ∈ [0, T ] mit T > 0. Somit ist das Parameterintegral Nun können wir den Grenzwert
G differenzierbar, und wir erhalten mit der Substitution J
e−(1+x )t
1 2 2
u = t x: lim G(t) = lim dx = 0
J 1 t→∞ t→∞ 0 1 + x2
(1 + x 2 )t e−(1+x )t
2 2

G (t) = −2 dx
0 1 + x2 unter Verwendung des Lebesgue’schen Konvergenzsatzes
J t bestimmen, da mit 1/(1 + x 2 ) eine auf [0, 1] integrierbare
= −2e−t e−u du .
2 2
Majorante gegeben ist. Insgesamt erhalten wir:
0  J ∞
= g(t) 1√
e−x dx =
2
π.
Mit der angegebenen Definition ist g eine Stammfunktion 0 2
zu g  (t) = e−t . Der zweite Hauptsatz der Integralrech-
2
Später auf Seite 941 werden wir sehen, wie der Wert dieses
nung liefert aber Integrals noch auf einem anderen Weg bestimmt werden
J t kann.
G(t) − G(0) = G (τ ) dτ
0
J t' J τ (
e−τ e−x dx dτ
2 2
= −2
0 0
J t
= −2 g  (τ )g(τ ) dτ
0
)t J t
)
= −2 (g(τ ))2 ) + 2 g  (τ )g(τ ) dτ
0 0
'J t (2
e−x dx
2
= −2 − G(t) + G(0) .
0

Regelfunktionen sind Grenzwerte gleichmäßig Die Menge aller Regelfunktionen über [a, b] bildet einen
konvergenter Folgen von Treppenfunktionen Vektorraum; denn mit der Definition und der Linearität des
Grenzwerts folgt für zwei Regelfunktionen f, g, dass auch
Betrachten wir wieder Treppenfunktionen auf einem kom- λf + μg für λ, μ ∈ R Regelfunktion ist.
pakten Intervall [a, b].
Beispiel
Jede stetige Funktion f ∈ C([a, b]) ist Regelfunktion, da
Definition der Regelfunktion sich eine Folge von Treppenfunktionen konstruieren lässt,
Eine Funktion f : [a, b] → R heißt Regelfunktion, die gleichmäßig gegen f konvergiert.
wenn es eine Folge von Treppenfunktionen ϕn : [a, b] Um eine solche Folge zu bekommen, nutzen wir zunächst,
→ R gibt, die gleichmäßig gegen f konvergiert. dass f auf dem kompakten Intervall gleichmäßig stetig ist.
Es gibt somit zu ε > 0 ein δ > 0 mit
|f (x) − f (y)| ≤ ε
640 16 Integrale – von lokal zu global

für alle x, y ∈ [a, b] mit |x − y| ≤ δ. Zu einer Zerlegung Beweis:


des Intervalls durch a = x0 < x1 < · · · < xN −1 < xN = b (a) Ist f : [a, b] → R Regelfunktion, so gibt es eine Folge
mit xn − xn−1 ≤ δ und Stellen zn ∈ (xn−1 , xn ) für n = von Treppenfunktionen ϕn , die gleichmäßig gegen f
1, . . . ,N definieren wir die Treppenfunktion ϕ : [a, b] konvergiert. Insbesondere gibt es N ∈ N mit
→ R durch
f − ϕN ∞ ≤ 1 .
ϕ(x) = f (zn ), für x ∈ [xn−1 , xn )

und ϕ(b) = f (b). Dann ist Die Treppenfunktion ϕN ist beschränkt, da sie endlich
viele Werte, die Funktionswerte der Stufen und gegebe-
|f (x) − ϕ(x)| ≤ ε nenfalls isolierte Werte an den endlich vielen Sprung-
stellen, annimmt. Mit der Dreiecksungleichung erhalten
für alle x ∈ [a, b], da zu x ∈ [a, b] ein n ∈ N existiert mit
wir für die Supremumsnorm von f :
x ∈ [xn−1 , xn ), und somit ist |x − zn | ≤ |xn − xn−1 | ≤ δ.
Konstruieren wir zu εm = 1/m diese Treppenfunktion
ϕm , so erhalten wir eine Folge von Treppenfunktionen f  = f − ϕN + ϕN ∞ ≤ 1 + ϕN ∞ .
(ϕm )m∈N mit
Somit ist auch f beschränkt.
1 (b) Eine gleichmäßig gegen f konvergierende Folge von
f − ϕm ∞ ≤ → 0, m → ∞.
m Treppenfunktionen (ϕn ) ist wegen
Das bedeutet (ϕm ) konvergiert gleichmäßig gegen f , und
wir haben gezeigt, dass f eine Regelfunktion ist. |f (x) − ϕn (x)| ≤ f − ϕn ∞ → 0, n→∞
Die Funktion f : [0, 1] → R mit
 auch punktweise konvergent, und mit Teil (a) ist durch
0, x = 0, die Konstante f ∞ auf dem kompakten Intervall [a, b]
f (x) =
sin x1 , x ∈ (0, 1] eine integrierbare Majorante gegeben. Mit dem Lebes-
gue’schen Konvergenzsatz (siehe Seite 634) ist daher
ist keine Regelfunktion. auch die Grenzfunktion f lebesgue-integrierbar.
Angenommen f wäre Regelfunktion, so gibt es eine Trep- (c) Wir zeigen, dass die Grenzfunktion eine Regelfunktion
penfunktion ϕ mit f − ϕ∞ ≤ 41 . Weiter wählen wir zur ist. Denn wenn ε > 0 vorgegeben ist, so gibt es zu jedem
Treppenfunktion ein δ > 0, sodass ϕ(x) = c ∈ R für fn , n ∈ N, eine Treppenfunktion ϕn mit
x ∈ (0, δ) konstant ist. Ist nun N ∈ N hinreichend groß
mit 2π1N < δ, so folgt: ε
fn − ϕn ∞ ≤ .
) ) 2
1 ) 1 1 )) 1
|c| = |ϕ( )| = ))f ( ) − ϕ( )) ≤
2πN 2πN 2πN 4 Außerdem gibt es N ∈ N, sodass
im Widerspruch zu ε
) ) f − fn ∞ ≤ für n ≥ N
) 1 1 ) 1 2
|1 − c| = ))f ( ) − ϕ( ))) ≤ .
2πN + π
2 2πN + π
2 4 gilt. Es folgt mit der Dreiecksungleichung
Daher ist f keine Regelfunktion. 
ε ε
f − ϕn ∞ ≤ f − fn ∞ + fn − ϕn ∞ ≤ + = ε.
Eine andere Charakterisierung der Regelfunktionen beleuch- 2 2
tet das letzte Gegenbeispiel genauer und wird auf Seite 641 Mit (ϕn ) ist eine Folge von Treppenfunktionen gegeben,
angesprochen. In Hinblick auf die Integration konzentrieren die gleichmäßig gegen f konvergiert. Also ist f Regel-
wir uns auf einige wenige Eigenschaften dieser Funktionen. funktion. 
Nutzen Sie die Regelfunktionen als Einstieg in die Integrati-
onstheorie, sollten Sie bei den folgenden Aussagen Teil (b)
Mit den ersten beiden Aussagen wird deutlich, dass die
ignorieren.
Menge der Regelfunktionen eine echte Teilmenge der
lebesgue-integrierbaren Funktionen ist. Die letzte Aussage
Satz
bedeutet, dass die Regelfunktionen bezüglich der gleichmä-
(a) Jede Regelfunktion f : [a, b] → R ist beschränkt. ßigen Konvergenz bzw. der Supremumsnorm einen abge-
(b) Jede Regelfunktion f : [a, b] → R ist lebesgue- schlossenen normierten Raum bilden (siehe Kapitel 19).
integrierbar.
(c) Ist (fn )n∈N eine Folge von Regelfunktionen auf [a, b], Das Integral einer Regelfunktion definiert man analog zum
die gleichmäßig gegen eine Funktion f : [a, b] → R Lebesgue-Integral als Grenzwert der Integrale über die ap-
konvergiert, so ist auch die Grenzfunktion f eine Regel- proximierenden Treppenfunktionen. Für eine solche Defini-
funktion. tion müssen vorab zwei Fragen geklärt werden.
16.7 Weitere Integrationsbegriffe 641

Hintergrund und Ausblick: Charakterisierung der Regelfunktionen


Eine Funktion f : [a, b] → R ist genau dann eine Regelfunktion, wenn in jedem Punkt x0 ∈ (a, b) ein rechtsseitiger
und ein linksseitiger Grenzwert lim f (x) und die einseitigen Grenzwerte lim f (x) und lim f (x) existieren. Diese
x→x0± x→a + x→b−
Charakterisierung der Regelfunktionen gibt uns eine bessere Vorstellung von diesen Funktionen.

Die Treppenfunktionen haben offensichtlich die Eigen- Für die Rückrichtung müssen wir zeigen, dass eine Funk-
schaft, dass sich die Funktion auch in den Sprungstellen tion f : [a, b] → R, zu der in jeder Stelle x0 die entspre-
sowohl von links als auch von rechts stetig fortsetzen lässt chenden links- bzw. rechtsseitigen Grenzwerte existieren,
und nur ein endlicher Sprung vorliegt. Solche Stellen wer- eine Regelfunktion ist:
den in der Literatur auch Unstetigkeit 1. Art genannt. Bei
Geben wir uns ein n ∈ N vor. Wenn die Grenzwerte exis-
den Regelfunktionen bleibt diese Eigenschaft erhalten. In-
tieren, so gibt es zu jedem x0 ∈ [a, b] ein δ > 0, sodass
teressant ist, dass andersherum genau diese Eigenschaft
|f (x) − f (y)| ≤ n1 für alle x, y ∈ Iδ (x0 ) = {x ∈ [a, b] |
die Regelfunktionen charakterisiert. Damit bekommt man
|x − x0 | ≤ δ} mit x < y < x0 bzw. x0 < y < x gilt.
eine deutlichere Vorstellung, welche Funktionen Regel-
funktionen sind. Da [a, b] kompakt ist, gibt es eine endliche Überdeckung
von [a, b] durch solche Intervalle Iδ (zj ), j ∈ {1, . . . , M}
Um diese Äquivalenz zu zeigen, betrachten wir die Im-
mit z1 , . . . , zM ∈ [a, b]. Nun betrachten wir die Zerle-
plikationen separat. Zunächst gilt es zu beweisen, dass es
gung a = x0 < x1 , · · · < xm−1 < xm = b, bestehend
bei einer Regelfunktion f : [a, b] → R zu jeder Stelle
aus den Randpunkten a, b, den Mittelpunkten zj und den
x ∈ (a, b) einen linksseitigen und einen rechtsseitigen
Randpunkten der Intervalle Iδj (zj ) nach ihrer Größe sor-
Grenzwert gibt und in den Randpunkten die jeweils ent-
tiert (siehe Abbildung).
sprechende stetige Fortsetzung existiert.
Dazu betrachte man eine Folge von Treppenfunktionen
Iδ (zj+2 )
(ϕn ), die gleichmäßig gegen f konvergiert. Mit der Drei- xn xn+1 xn+2 · · · · · ·   
ecksungleichung folgt:
zj−1 zj zj+1 zj+2

|f (x) − f (y)|
≤ |f (x) − ϕn (x)| + |ϕn (x) − ϕn (y)| + |ϕn (y) − f (y)| Wir wählen aus jedem Intervall ξj ∈ (xj , xj +1 ) und defi-
nieren die Treppenfunktionen
für x, y ∈ [a, b]. Da (ϕn ) gleichmäßig konvergiert, gibt es
zu ε > 0 ein N ∈ N, sodass |f (x) − ϕn (x)| ≤ ε für alle 
f (ξj ) für x ∈ (xj , xj +1 ) ,
x ∈ [a, b] und n ≥ N gilt. Also können wir den ersten ϕn (x) =
f (xj ) für x = xj .
und dritten Term durch ε abschätzen.
Fixieren wir nun n ≥ N und eine Stelle z ∈ [a, b). Da Damit folgt:
1
zur Treppenfunktion ϕn der Grenzwert lim ϕn (x) exis- |f (x) − ϕn (x)| ≤
x→z+ n
tiert, gibt es δ > 0 mit |ϕn (x) − ϕn (y)| ≤ ε für alle
für alle x ∈ [a, b]. Wir haben somit eine Folge von Trep-
x, y ∈ I = {x ∈ (z, b) | |x − z| ≤ δ}. Somit lässt
penfunktionen (ϕn ) konstruiert, die gleichmäßig gegen f
sich auch der mittlere Term abschätzen, und obige Un-
konvergiert. Also ist f eine Regelfunktion.
gleichung zeigt, dass rechtsseitig eine Cauchy-Folge vor-
liegt und somit der rechtsseitige Grenzwert existiert. Ana- Insgesamt erhalten wir die Äquivalenz zwischen der Ei-
log folgt die Existenz des linksseitigen Grenzwerts für genschaft von existierenden einseitigen Grenzwerten und
z ∈ (a, b]. der Regelfunktion.

Lemma gieren, so gilt:


(a) Ist (ϕn ) eine Folge von Treppenfunktionen, die gleich- J b J b
mäßig gegen die Regelfunktion f konvergiert, so bilden lim ϕn (x) dx = lim ψn (x) dx .
n→∞ a n→∞ a
die Integrale eine in R konvergente Folge
J 
b Beweis:
ϕn (x) dx . (a) Gehen wir von einer gleichmäßig gegen f konvergenten
a n∈N Folge von Treppenfunktionen ϕn aus, d. h., es gibt zu
ε > 0 ein N ∈ N mit
(b) Sind (ϕn ), (ψn ) zwei Folgen von Treppenfunktionen, die
beide gleichmäßig gegen eine Regelfunktion f konver- f − ϕn ∞ ≤ ε
642 16 Integrale – von lokal zu global

für alle n ≥ N . Wir erhalten mit der Dreiecksunglei- ?


chung für die Supremumsnorm: Überlegen Sie, dass das Integral über Regelfunktionen linear
ist, d. h., für Regelfunktionen f, g und Zahlen λ, μ ∈ R gilt:
ϕn − ϕm ∞ ≤ f − ϕn ∞ + f − ϕm ∞ ≤ 2ε J b J b J b
λf (x) + μg(x) dx = λ f (x) dx + μ g(x) dx .
für alle n, m ≥ N . Für die Integrale über die Treppen- a a a
funktionen ϕn − ϕm folgt
)J ) J
) b ) b
) ) Beispiel Wir überlegen uns als Beispiel die Monotonie
) ϕn (x) − ϕm (x) dx ) ≤ |ϕn (x) − ϕm (x)| dx
) a ) a bei Regelfunktionen, d. h., für zwei Regelfunktionen f, g mit
J b f (x) ≤ g(x) für x ∈ [a, b] folgt:
≤ ϕn − ϕm ∞ dx J b J b
a f (x) dx ≤ g(x) dx .
≤ 2ε (b − a). a a

 b  Bezeichnen wir mit ϕn und ψn Folgen von Treppenfunktio-


Somit ist die Folge der Integrale a ϕn (x) dx n∈N eine
nen, die gegen f bzw. g gleichmäßig konvergieren. Zu ϕn
Cauchy-Folge in R und wegen des Cauchy-Kriteriums
definieren wir ϕ̃n = ϕn − f − ϕn ∞ . Dann ist ϕ̃n auch eine
konvergent.
Folge von Treppenfunktionen, und mit der Dreiecksunglei-
(b) Für die zweite Aussage können wir ähnlich argumentie-
chung gilt:
ren. Sind (ϕn ), (ψn ) zwei Folgen von Treppenfunktio-
nen, die gleichmäßig gegen f konvergieren, so folgt mit f −ϕ̃n ∞ = f − ϕn − f − ϕn ∞ ∞ ≤ 2f −ϕn  → 0 ,
der Dreiecksungleichung:
für n → ∞. Darüber hinaus ist
ϕn − ψn ∞ ≤ f − ϕn ∞ + f − ψn ∞ → 0
ϕ̃n (x) = f (x) − f (x) + ϕn (x) − f − ϕn ∞

für n → ∞. Damit ergibt sich für die Differenzen, die ≤ f (x) + f − ϕn ∞ − f − ϕn ∞ = f (x) .
wiederum Treppenfunktionen sind, die Konvergenz
Analog definieren wir die gegen g konvergierenden Treppen-
)J J b )
) b ) funktionen ψ̃n = ψn + g − ψn ∞ und erhalten g ≤ ψ̃n .
) )
) ϕn (x) dx − ψn (x) dx )
) a a ) Es gilt ϕ̃n (x) ≤ f (x) ≤ g(x) ≤ ψ̃n (x). Wegen der Monoto-
J b nieeigenschaft für Treppenfunktionen folgt:
≤ |ϕn (x) − ψn (x)| dx J b J b
a
f (x) dx = lim ϕ̃n (x) dx
≤ ϕn − ψn ∞ (b − a) → 0, n → ∞. a n→∞ a
J b
Die Grenzwerte sind identisch. 
≤ lim ψ̃n (x) dx
n→∞ a
J b
= g(x) dx. 
a

Regelfunktionen sind integrierbar In der Aufgabe 16.21 bleibt als weitere Eigenschaft zu zei-
gen, dass der Betrag |f | einer Regelfunktion f : [a, b] → R
Mit diesen Vorüberlegungen lässt sich das Integral für integrierbar ist und die daraus resultierende, insbesondere bei
Regelfunktionen unabhängig vom Lebesgue-Integral durch stetigen Funktionen häufig genutzte Beschränkung
)J )
J J ) b )
b b ) )
) f (x) dx ) ≤ f ∞ |b − a|,
f (x) dx = lim ϕn (x) dx ) a )
a n→∞ a

gilt.
mit einer gleichmäßig gegen f konvergierenden Folge von
Treppenfunktionen ϕn definieren.
Mit dem Argument zur Lebesgue-Integrierbarkeit der Regel- Im Sinne uneigentlicher Integrale lassen sich
funktion (siehe Seite 640) ist offensichtlich, dass der so bei auch unbeschränkte Intervalle und Funktionen
Regelfunktionen definierte Integralwert identisch ist mit dem betrachten
Wert des Lebesgue-Integrals über f . Die Eigenschaften aus
der Übersicht auf Seite 611 lassen sich direkt aus der Defi- Mit diesen Überlegungen ist der Zugang zum Integral mit-
nition für Regelfunktionen zeigen. hilfe von Regelfunktionen abgeschlossen, und man kann mit
16.7 Weitere Integrationsbegriffe 643

Abschnitt 16.3 die Hauptsätze und Integrationstechniken her- Definition riemann-integrierbarer Funktionen
leiten. Unterschiede zeigen sich erst in den Abschnitten 16.5
Eine Funktion f : [a, b] → R heißt riemann-inte-
und 16.6. Zum Beispiel haben wir bereits gesehen, dass unbe-
grierbar, wenn jede Riemann-Folge konvergiert. Der
schränkte Funktionen keine Regelfunktionen sind. Es gibt so-
Grenzwert
mit Funktionen, die lebesgue-integrierbar, aber im Sinne der
Regelfunktionen nicht integrierbar sind. Wird der Integralbe- !
N   J b
griff über die Regelfunktionen eingeführt, weicht man bei un- lim f (zjN ) xjN − xjN−1 = f (x) dx
N →∞ a
beschränkten Integranden oder Integrationsgebieten auf un- j =1
eigentliche Integrale aus, wie wir es beim Lebesgue-Integral
auf Seite 632 gesehen haben. Der Begriff des uneigentlichen zu einer Riemann-Folge heißt Riemann-Integral von f .
Integrals wird bei der Einführung des Integrals von Regel-
funktionen für erheblich mehr Funktionen relevant. y

Beispiel Betrachten wir etwa f : (0, 1] → R mit f (x) =



1/ x. Auf Seite 631 haben wir gezeigt, dass f lebesgue-
integrierbar ist mit
J J
1 1 1 √
f (x) dx = lim √ dx = lim 2 x|1a = 2 .
0 a→0 a x a→0

Die Funktion f ist aber nur auf [a, 1] eine Regelfunktion, x


a xk ξ xk+1
nicht auf (0, 1]. Da aber der Grenzwert des Integrals für a → 0 b
existiert, spricht man von einem „uneigentlichen“ Integral
1 Abbildung 16.19 Bei der Riemann-Summe wird wiederum der Flächeninhalt
und schreibt genauso 0 f (x) dx.  von Rechtecken addiert

Die Definition fordert Konvergenz aller Folgen von Treppen-


funktionen mit Werten f (zjN ) auf (xjN−1 , xjN ) im Sinne kon-
Das Riemann-Integral ist Grenzwert der vergierender Riemann-Summen. Damit die Definition sinn-
Riemann-Folgen voll ist, bleibt noch zu zeigen, dass unter der Voraussetzung
der Konvergenz aller Riemann-Folgen diese Folgen alle den-
selben Grenzwert besitzen. Dies beweisen wir mit folgendem
Wenden wir uns einer weiteren Möglichkeit zu, Integrale zu
Lemma.
definieren. Auch bei dieser Variante muss bei unbeschränk-
ten Integranden oder Integrationsgebieten auf uneigentliche
Lemma
Integrale ausgewichen werden. Die Definition der riemann-
Sind zu einer Funktion f : [a, b] → R alle Riemann-
integrierbaren Funktionen war bereits in Abschnitt 16.1 an-
Folgen konvergent, so besitzen all diese Folgen denselben
gedeutet worden. Wir erinnern uns an die Definition einer
Grenzwert.
Riemann-Summe:
   
Beweis: Sind R(Z N , zN ) N ∈N und R(W N , wN ) N ∈N
!
N
R(Z, z) = f (zj )|xj − xj −1 | zwei Riemann-Folgen zur Funktion f , so ist auch
j =1 die zusammengesetzte Folge zu den Zerlegungen
(Z 1 , W 1 , Z 2 , W 2 , . . . ) und Zwischenstellen z1 , w1 , z2 ,
zu einer Funktion f , wobei mit a = x0 < x1 < · · · < w2 , . . . eine Folge von Riemann-Summen zu Zerlegungen,
xN−1 < xN = b eine Zerlegung Z des Intervalls [a, b] mit deren Feinheit gegen null konvergiert, also eine Riemann-
Zwischenstellen zj ∈ [xj −1 , xj ] bezeichnet ist. Zur Abkür- Folge. Da diese nach Voraussetzung konvergiert, besitzen
zung werden die Zwischenstellen zu einem Vektor z ∈ RN Teilfolgen denselben Grenzwert, insbesondere ist
zusammengefasst.    
lim R Z N , zN = lim R W N , wN . 
N →∞ N →∞
Mit
|Z| = max{|xj − xj −1 | | j = 1, . . . , N}
Auch für die Riemann-Integrale lassen sich die in der Über-
bezeichnen wir die Feinheit einer Zerlegung. Betrachten wir sicht auf Seite 611 aufgelisteten Eigenschaften des Integrals
eine Folge von Zerlegungen Z N mit |Z N | → 0 für N → beweisen.
∞, so heißt eine zugehörige Folge von Riemann-Summen
(R(Z N , zN ))N∈N eine Riemann-Folge. Mit dieser Notation Beispiel Die Linearität des Integrals folgt aus der entspre-
lässt sich eine Definition riemann-integrierbarer Funktionen chenden Eigenschaft für Grenzwerte. Betrachten wir eine
angeben. Folge von Zerlegungen Z N mit Zwischenstellen zN und
644 16 Integrale – von lokal zu global

Hintergrund und Ausblick: Integrabilitätskriterien zu riemann-integrierbaren Funktionen


Zwei weitere, äquivalente Möglichkeiten, das Riemann-Integral zu definieren, verdeutlichen die Funktionenklasse. Zum einen
ist der Wert des Integrals durch Einschachteln zwischen sogenannten Unter- und Obersummen beschreibbar. Dieser Ansatz
geht auf Riemann und Darboux zurück. Das Riemann’sche Integrabilitätskriterium belegt die Äquivalenz beider Zugänge. Eine
weitere Charakterisierung liefert das Lebesgue’sche Integrabilitätskriterium mit der Aussage, dass eine Funktion auf einem
kompakten Intervall genau dann riemann-integrierbar ist, wenn sie beschränkt und fast überall stetig ist.

Denken wir an das Problem des Flächeninhalts unter Definition äquivalent ist zur Definition des Riemann-
einem Graphen, so ist es naheliegend, zu einer Zerlegung Integrals, d. h., es gilt Gleichheit in der obigen Unglei-
Z des Intervalls [a, b] in jedem Teilintervall den größten chung genau dann, wenn f riemann-integrierbar ist, und
und den kleinsten Funktionswert wir erhalten in diesem Fall:
J b
fk = inf f (x), fk = sup f (x) .
[xk−1 , xk ] [xk−1 , xk ]
sup S Z = f (x) dx = inf S Z .
Z a Z

zu betrachten und den Inhalt durch Ober- bzw. Unter-


Wesentliche Aspekte des Beweises dieser Äquivalenz fin-
summen einzuschachteln. Man definiert die Riemann-
den sich im Text, im Beispiel auf Seite 647. Für einen
Darboux’sche Unter- bzw. Obersumme durch
vollständigen Beweis verweisen wir etwa auf das Lehr-
!
n buch der Analysis, Teil I, von H. Heuser.
SZ = f k · (xk − xk−1 )
k=1
Auch der Beweis der zweiten äquivalente Beschreibung
von Riemann-Integrierbarkeit findet sich dort. Diese stützt
!n
SZ = f k · (xk − xk−1 ) . sich auf den Begriff der Nullmenge. Das sogenannte
k=1 Lebesgue’sche Integrabilitätskriterium besagt, dass
eine Funktion f : [a, b] → R genau dann riemann-
Anschaulich werden bei einer nicht negativen Funktion integrierbar ist, wenn sie beschränkt und fast überall stetig
f die Flächen von Rechtecken aufsummiert, die in jedem ist.
Teilintervall sicher unter bzw. über dem Funktionsgraphen
liegen (Abb.). Auch zum Beweis dieser Aussage sind die wesentlichen
Argumente in dem Beispiel auf Seite 647 ff angeklungen.
Mithilfe des Kriteriums sind einige Eigenschaften des In-
f (x)
tegrals leicht zu sehen. Etwa ist mit f auch die Funktion
|f | riemann-integrierbar.
Kommentar: Ein Beispiel für eine fast überall stetige
Funktion, etwa eine Funktion, die auf den rationalen Zah-
len unstetig und auf den irrationalen Zahlen stetig ist, ist
durch die Thomae-Funktion f : [0, 1] → R gegeben. Sie
U (Z) ist definiert durch f (0) = 0 und
a x1 x2 ··· b x 
1
für x = pq ,
f (x) = q
0 für x irrational .
Die Werte von S Z und S Z hängen von der Zerlegung ab.
Aber es lässt sich zeigen, dass für beschränkte Funktionen Dabei seien in der Darstellung x = p/q die Zahlen
stets p, q ∈ N teilerfremd. Übrigens, will man die Situation
sup S Z ≤ inf S Z umdrehen, so wird sich kein Beispiel finden. Denn als
Z
Z Konsequenz aus dem Satz von Young der deskriptiven
erfüllt ist. Gilt sogar Gleichheit in dieser Relation, so Mengenlehre gibt es keine Funktion, die stetig auf den ra-
definiert der Grenzwert ein Integral der Funktion f . Das tionalen Zahlen und unstetig auf den irrationalen Zahlen
Riemann’sche Integrabilitätskriterium besagt, dass diese ist.
16.7 Weitere Integrationsbegriffe 645

|Z N | → 0 für N → ∞ gegeben. Sind f, g riemann-inte- Beweise der drei folgenden Aussagen aufwendig und unab-
grierbare Funktionen, und ist ε > 0 vorgegeben, so gelten hängig voneinander sind, stellen wir sie der besseren Über-
für alle N > N0 , wenn N0 hinreichend groß ist, die Abschät- sicht wegen in einem Satz zusammen.
zungen
) )
)N J b ) Satz
)! ) ε
) f (z N
)(x − x ) − f (x) dx )≤ (a) Eine Regelfunktion f : [a, b] → R ist riemann-inte-
) j j j −1 ) 2
)j =1 a ) grierbar.
(b) Ist f : [a, b] → R riemann-integrierbar, so ist f be-
und entsprechend für die Funktion g. Also erhalten wir für schränkt.
die Summe f + g: (c) Eine riemann-integrierbare Funktion f : [a, b] → R ist
) )
)N J b J b ) lebesgue-integrierbar.
)! )
) (f + g)(zN )(xj − xj −1 ) − f (x) dx − g(x) dx )
) j )
)j =1 a a )
) ) Beweis:
)N J b ) (a) Als erstes zeigen wir, dass jede Regelfunktion f : [a, b]
)! )
≤ ) ) N
f (zj )(xj − xj −1 ) − f (x) dx )) → R auch riemann-integrierbar ist. Dazu beweist man,
)j =1 a ) dass zu jedem ε > 0 ein δ > 0 existiert mit
) )
)N J b ) ) )
)! ) ) J b )
+ )) g(zjN )(xj − xj −1 ) − g(x) dx )) ) )
)j =1 ) )R(Z, z) − f (x) dx ) ≤ ε
a ) a )
ε ε
≤ + = ε.
2 2 für alle Zerlegungen Z von [a, b] mit Feinheit |Z| ≤ δ.
Damit ist gezeigt, dass eine Riemann-Folge zu f + g kon- Man beachte, dass das Integral existiert, da f Regelfunk-
vergiert. Also ist f + g riemann-integrierbar, und es gilt: tion ist.
J b J b J b Außerdem ist f Grenzwert von Treppenfunktionen im
Sinne gleichmäßiger Konvergenz. Daher ist es nahelie-
(f + g)(x) dx = f (x) dx + g(x) dx .
a a a gend, die Differenz gegenüber Treppenfunktionen zu be-
trachten. Seien also Z eine Zerlegung des Intervalls und
Entsprechend lässt sich auch ϕ eine Treppenfunktion, so gilt mit der Dreiecksunglei-
J b J b chung:
λf (x) dx = λ f (x) dx ) )
a a ) J b )
) )
für λ ∈ R zeigen. Wie zu erwarten war, ist das Riemann- )R(Z, z) − f (x) dx )
) a )
Integral eine lineare Operation. 
!
N

Insbesondere bildet die Menge der riemann-integrierbaren ≤ |f (zj ) − ϕ(zj )|(xj − xj −1 )


Funktionen einen Vektorraum. j =1
) )
)! J b )
)N )
? +)) ϕ(zj )(xj − xj −1 ) − ϕ(x) dx ))
Zeigen Sie, dass für zwei riemann-integrierbare Funktionen )j =1 a )
f, g mit f (x) ≤ g(x) für x ∈ [a, b] die Monotonie J b
J b J b + |ϕ(x) − f (x)| dx
f (x) dx ≤ g(x) dx a
a a ≤ 2f − ϕ∞ (b − a)
) )
)N J b )
gilt. )! )
+ )) ϕ(zj )(xj − xj −1 ) − ϕ(x) dx )) .
)j =1 a )
Mit diesem Einstieg lassen sich nun die Hauptsätze und die
Integrationstechniken wie in den Abschnitten 16.3 und 16.4 Da es eine Folge von Treppenfunktionen gibt mit
auch für riemann-integrierbare Funktionen belegen. f − ϕN ∞ → 0 für N → ∞, bleibt zu zeigen,
dass Riemann-Summen zu einer Treppenfunktion mit
|Z| → 0 gegen ihr Integral konvergieren.
Die verschiedenen Integrationsbegriffe Wir zeigen dies mittels einer Induktion nach der An-
führen auf unterschiedliche Mengen von zahl m ∈ N der Sprungstellen der Treppenfunktion.
integrierbaren Funktionen Riemann-Summen sind gleich dem Integral, wenn die
Treppenfunktion ϕ konstant ist, also keine Sprungstel-
Es bleibt noch zu klären, in welcher Beziehung die drei vor- len aufweist. Damit haben wir einen Induktionsanfang
gestellten Integral-Begriffe zueinander stehen. Obwohl die mit m = 0. Für den Induktionsschritt nehmen wir an,
646 16 Integrale – von lokal zu global

dass es zu jedem ε > 0 und einer Treppenfunktion mit oben unbeschränkt ist. Andernfalls betrachten wir −f .
bis zu m ∈ N Sprungstellen stets ein δ > 0 gibt, sodass Es gibt somit eine Folge (ξn ) in [a, b] mit ξn → ξ ∈
) ) [a, b] und f (ξn ) → ∞ für n → ∞.
)! J b )
)N ) Wählen wir weiter eine Riemann-Folge zu Zerlegun-
) ϕ(zj )(xj − xj −1 ) − ϕ(x) dx )) ≤ ε
) gen Z N des Intervalls [a, b]. Da die Stelle ξ ∈ [a, b]
)j =1 a )
ist, gibt es zu jedem N ∈ N ein k ∈ {1, . . . , N}
mit ξ ∈ [xk−1 , xk ]. Setze I N = [xk−1 , xk ], wenn
gilt für alle Zerlegungen mit |Z| ≤ δ. Ist nun ϕ eine
ξ ∈ (xk−1 , xk ). Im Fall, dass ξ = xk−1 oder ξ = xk
Treppenfunktion mit m + 1 Sprungstellen, so zerlegen
gilt, wählen wir gegebenenfalls ein benachbartes Inter-
wir ϕ = ϕ̃ + ϕ̂ mit
vall für I N , sodass zumindest eine Teilfolge von (ξn )

ϕ(x) für a ≤ x < ξm+1 , ganz in I N liegt. Ohne Änderung der Notation nutzen
ϕ̃(x) =
ϕm für ξm+1 ≤ x ≤ b wir im Folgenden auch in diesem Fall den von N abhän-
genden Index k für das Intervall I N und die Bezeichnung
und (ξn ) für diese Teilfolge.
 Wir streichen zunächst jeweils das k-te Intervall aus den
0 für a ≤ x < ξm+1 ,
ϕ̂(x) = Riemann-Summen und definieren
ϕm+1 − ϕm für ξm+1 ≤ x ≤ b ,
!
N
  
wobei mit ξj die j -te Sprungstelle der Treppenfunktion SN = f zjN xjN − xjN−1 .
und mit ϕj der Funktionswert auf dem j -ten Intervall j =1,j =k
bezeichnet sind. Da sowohl ϕ̃ als auch ϕ̂ eine bzw m
Im Intervall I N modifizieren wir die Zwischenstelle zkN .
Sprungstellen haben, gibt es nach Induktionsvorausset-
Da die Folge (f (ξn )) unbeschränkt ist, gibt es zu jedem
zung zu ε > 0 ein δ, sodass für beide Funktionen die
N ∈ N ein n ∈ N mit ξn ∈ I N und
Differenz kleiner als ε/2 ist. Wir erhalten mit diesem δ
und der Dreiecksungleichung: N − SN
f (ξn ) ≥ .
) ) (xk − xk−1 )
)! J b )
)N )
) ϕ(z )(x − x ) − ϕ(x) dx ) Wir nutzen die Zwischenstellen z̃N , bei denen gegenüber
) j j j −1 )
)j =1 a ) zN nur das k-te Element zkN durch ξn ersetzt ist. Es folgt
) )
)N J b ) für die zugehörige Riemann-Folge:
)! )  
≤ ) ) ϕ̃(zj )(xj − xj −1 ) − ϕ̃(x) dx )) R Z N , z̃N = S N + f (ξn )(xk − xk−1 ) ≥ N → ∞
)j =1 a )
) ) für N → ∞, im Widerspruch zur Riemann-Integrier-
)! J b )
)N ) barkeit von f .
+ )) ϕ̂(x) dx ))

ϕ̂(zj )(xj − xj −1 ) −
)j =1 a )
(c) Im dritten Beweis gehen wir in drei Schritten, (i)–(iii),
ε ε vor. Zunächst zeigen wir, dass Untersummen gegen das
≤ + = ε.
2 2 Riemann-Integral konvergieren. Im zweiten Schritt folgt
Damit ist die Induktion abgeschlossen. Insgesamt gibt mit dem Satz von B. Levi, dass die zugehörige Folge von
es zu gegebenem ε > 0 eine Treppenfunktion ϕ mit Treppenfunktionen gegen eine lebesgue-integrierbare
f − ϕ∞ ≤ 3(b−a) ε
, und zu dieser Treppenfunktion Funktion f˜ konvergiert. Im letzten Schritt müssen wir
lässt sich δ > 0 wählen, sodass noch belegen, dass f˜ fast überall mit f übereinstimmt
) ) und somit gezeigt ist, dass f lebesgue-integrierbar ist.
)! J b ) (i) Seien f : [a, b] → R eine riemann-integrierbare
)N ) ε
) ϕ(zj )(xj − xj −1 ) − ϕ(x) dx )) ≤ Funktion und Z N eine Folge verfeinerter Zerlegungen,
)
)j =1 a ) 3 etwa xjN = a + 2jN (b − a) für j = 0, . . . , 2N . Da f
beschränkt ist (siehe Seite 645), existiert auf jedem Teil-
für alle Zerlegungen mit |Z| < δ gilt. Obige Abschät- intervall inf z∈[x N ,x N ] f (z) für j = 1, . . . , 2N , und wir
zung liefert: j −1 j
können zu jeder Zerlegung die Untersummen
) J b )
) ) 2ε
) ) ε !
2 N
 
)R(Z, z) − f (x) dx ) ≤ + =ε
) a ) 3 3 N
U (Z ) = inf xjN − xjN−1
j =1 z∈[xj −1 ,xj ]
N N

für alle Zerlegungen mit |Z| < δ. 


definieren (siehe auch Seite 644).
Ist ε > 0 vorgegeben, so gibt es Zwischenstellen
(b) Für die zweite Aussage bietet sich ein Widerspruchs-
zjN ∈ [xj −1 , xj ] mit
beweis an. Wir nehmen an, dass f : [a, b] → R eine
unbeschränkte riemann-integrierbare Funktion ist. Ohne ε
|f (zjn ) − inf f (z)| ≤ .
Einschränkung können wir davon ausgehen, dass f nach z∈[xj −1 ,xj ] 2(b − a)
16.7 Weitere Integrationsbegriffe 647

Da f riemann-integrierbar ist, gilt für die zugehörigen mit l ∈ N und zeigt, #l ist
Nullmenge. Damit ist auch die
Riemann-Summen für hinreichend große N ∈ N: abzählbare Vereinigung ∞ l=1 #l Nullmenge, und wir
) J b ) erhalten ω(ξ ) = 0 fast überall.
) ) ε
) ) Um zu sehen, dass #l Nullmenge ist, fassen wir zur
)R(Z N , zN ) − f (x) dx ) ≤ .
) a ) 2 Zerlegung Z N die Indizes J N = {j ∈ {1, . . . , 2N } |
#l ∩ IjN = ∅} zusammen. Dann ergibt sich mit Teil (i):
Mit der Dreiecksungleichung folgt:
) J b ) 1 ! N
) ) 1
) ) |#l | ≤ |Ik |
)U (Z N ) − f (x) dx ) l l
) a ) k∈J N
) ) ⎛ ⎞
) ) ) J b ) 2N
!
) N N N ) ) N N ) ⎝f (zj ) − inf f (z)⎠ (xj − xj −1 )
≤ )R(Z , z ) − U (Z ))+ )R(Z , z ) − f (x) dx ) ≤
) a ) z∈IjN
j =1
) ⎛ ⎞ )
) n )
)! ) = R(Z N , zN ) − U (Z N ) → 0
≤ )) ⎝f (zN ) − inf f (z)⎠ (x N − x N )) + ε
j j j −1 ) 2
)j =1 z∈[xjN−1 ,xjN ] ) für N → ∞, wobei wir für die Zerlegung in den Inter-
ε ε vallen IjN mit j ∈ J N Zwischenstellen zjN = ξ ∈ #l
≤ + = ε.
2 2 wählen.
Also konvergiert die Folge der Untersummen Insgesamt haben wir gezeigt, dass die riemann-integrier-
(U (Z N ))N∈N gegen den Wert des Riemann-Integrals bare Funktion f fast überall mit einer lebesgue-inte-
von f . grierbaren Funktion f˜ übereinstimmt und somit selbst
(ii) Definieren wir zu Z N die Treppenfunktionen lebesgue-integrierbar ist. 

⎧ * 

⎨ * inf + f (z) für x ∈ xjN−1 , xjN , Da stetige Funktionen Regelfunktionen sind (siehe Seite
N N
ϕ N (x) = z∈ xj −1 ,xj 630), sehen wir mit der ersten Aussage, dass stetige Funk-

⎩ f (b) tionen riemann-integrierbar sind. Beachten Sie, dass wir im
für x = b .
ersten Beweis auch explizit gezeigt haben, dass Treppen-
Mit den Zerlegungen Z N ist (ϕ N ) offensichtlich mono- funktionen riemann-integrierbar sind. Als weitere Bemer-
ton steigend. Somit ist eine monoton wachsende Folge kung weisen wir noch darauf hin, dass wir im dritten Be-
von Treppenfunktionen gegeben mit weis sogar f ∈ L↑ (a, b) gezeigt haben (siehe Definition auf
J b J b Seite 607).
lim ϕ N (x) dx = f (x) dx .
N→∞ a a
Nach dem Satz von Beppo Levi (siehe Seite 625) kon- Das Lebesgue-Integral ist der allgemeinere
vergiert ϕ N punktweise fast überall gegen eine lebesgue- Integrationsbegriff
integrierbare Funktion f˜ ∈ L(a, b).
(iii) Es bleibt zu zeigen, dass f˜ = f fast überall auf Mit Abschnitt 16.5 wurde deutlich, dass unbeschränkte Funk-
[a, b] gilt. Wir nutzen die oben konstruierte Folge von tionen auf einem kompaktem Intervall lebesgue-integrierbar
Treppenfunktionen und betrachten an einer Stelle ξ ∈ sein können. Offensichtlich umfasst der Vektorraum der
[a, b] die Abschätzung lebesgue-integrierbaren Funktionen die Menge der riemann-
) ) ) ) integrierbaren Funktionen, beinhaltet aber noch weitere
) ) ) )
|f˜(ξ ) − f (ξ )| ≤ )f˜(ξ ) − ϕ N (ξ )) + )ϕ N (ξ ) − f (ξ )) . Funktionen. Die folgenden Beispiele vervollständigen das
Bild.
ϕ N konvergiert fast überall punktweise gegen f˜, sodass
die erste Differenz fast überall gegen null konvergiert. Beispiel
Betrachten wir noch die zweite Differenz. Sei wieder I N Im Beispiel auf Seite 640 haben wir bereits gesehen, dass
das Intervall bezüglich der N-ten Zerlegung mit ξ ∈ I N , die Funktion f : [0, 1] → R mit
so ist ⎧ 1

sin für x = 0 ,
|ϕ N (ξ ) − f (ξ )| = f (ξ ) − inf f (z) = ωN (ξ ) . f (x) = x
z∈I N ⎩0 für x = 0
Da die Folge (ωN ) beschränkt und monoton fallend ist,
keine Regelfunktion ist.
existiert der Grenzwert ω(ξ ) = limN →∞ ωN (ξ ) für je-
Da f beschränkt und fast überall stetig ist, handelt es sich
des ξ ∈ [a, b].
nach dem Lebesgue’sche Integrabilitätskriterium um eine
Ziel ist es, ω(ξ ) = 0 für fast alle ξ ∈ [a, b] zu zeigen.
riemann-integrierbare Funktion. Explizit sehen wir dies,
Dazu betrachtet man die Mengen
  indem wir einige wesentliche Argumente, die zu den bei-
1 den Integrabilitätskriterien führen (siehe Seite 644), am
#l = ξ ∈ [a, b] | ω(ξ ) ≥
l Beispiel nachvollziehen.
648 16 Integrale – von lokal zu global

Sei Z N eine Folge von Zerlegungen des Intervalls [a, b] Wir haben gezeigt, dass jede Riemann-Summe konver-
mit |Z N | → 0 für N → ∞. Da f beschränkt ist, gibt es giert mit R(Z N , zN ) → supM∈N U (Z M ) für N → ∞,
zu jeder Zerlegung eine Unter- und eine Obersumme, und d. h., f ist riemann-integrierbar.
es gilt: Ein klassisches Beispiel für eine beschränkte, lebesgue-
integrierbare Funktion, die nicht riemann-integrierbar ist,
!
N
ist die Dirichlet’sche Sprungfunktion D : R → {0, 1},
U (Z N ) = inf f (z) (xj − xj −1 )
j =0 z∈Ij
N die gegeben ist durch

!
N
  1 für x ∈ Q ,
≤ f (zjN ) (xj − xj −1 ) = R Z N , zN D(x) =
j =0
0 für x ∈ Q .

!
N
  In jedem beliebig kleinen Intervall nimmt diese Funktion
≤ sup f (z) (xj − xj −1 ) = O Z N
N die Werte Null und Eins an.
j =0 z∈Ij
Da Q ∩ [a, b] eine Nullmenge ist, konvergiert die Folge
mit IjN = [xjN−1 , xjN ]. der Treppenfunktionen, die konstant null sind, punkt-
weise und monoton fast überall gegen D. Somit ist
Ist ε > 0 vorgegeben, so definieren wir die Indizes J N =
D ∈ L↑ (a, b), und es gilt:
{k ∈ N | xkN ≤ ε}. f ist auf [ 2ε , 1] gleichmäßig stetig.
Daher lässt sich N0 ∈ N finden mit J b
ε D(x) dx = 0 .
sup f (z) − inf f (z) ≤ a
z∈I N N
z∈Ij (b − a)
j
Andererseits können wir zu jeder Zerlegung Z eines Inter-
für alle N ≥ N0 und j  ∈ J N . Es folgt für die Differenz valls [a, b] Zwischenstellen zj , wj ∈ [xj −1 , xj ] angeben
aus Ober- und Untersumme: mit f (zj ) = 1 bzw. f (wj ) = 0, und wir erhalten zu jeder
Zerlegung Riemann-Summen mit
0 ≤ O(Z N ) − U (Z N )
⎛ ⎞ R(Z, z) = 1, und R(Z, w) = 0 .
! !
≤2 |IjN | + ⎝ sup f (z) − inf f (z)⎠ |I N |
j
z∈IjN z∈IjN Es können somit nicht alle Riemann-Folgen gegen den-
j ∈J N j  ∈J N
selben Grenzwert konvergieren. Die Funktion ist nicht
≤ 3ε . riemann-integrierbar. 
Also gilt O(Z N ) − U (Z N ) → 0 für N → ∞.
Nun benötigen wir noch, dass für zwei Zerlegungen Z1 Zusammenfassen können wir die Betrachtungen zu den
und Z2 stets U (Z1 ) ≤ O(Z2 ) gilt; denn betrachten wir die verschiedenen Integralbegriffen über kompakte Intervalle
Zerlegung Z, die sich durch Zusammenfügen der beiden in einem Diagramm (Abb. 16.20). Mit den lebesgue-
Zerlegungen ergibt, so werden sowohl Z1 als auch Z2 integrierbaren Funktionen und den Konvergenzaussagen aus
durch Hinzunahme von Zerlegungsstellen verfeinert, und den Abschnitten 16.5 und 16.6 werden wir später den voll-
es gilt: ständigen normierten Raum der integrierbaren Funktionen
L1 (a, b) definieren, der eine zentrale Rolle in der Analysis
U (Z1 ) ≤ U (Z) ≤ O(Z) ≤ O(Z2 ) . spielt (siehe Kapitel 19). Weder die Regelfunktionen noch das
Riemann-Integral sind für diese Konstruktion ausreichend.
Damit folgt weiterhin:
Darüber hinaus ermöglicht uns das Lebesgue-Integral eine
sup U (Z N ) ≤ inf O(Z N ) , direkte Erweiterung der Integration auf höhere Dimensionen
N∈N N ∈N
(siehe Kapitel 22).
und aus der oben gezeigten Konvergenz erhalten wir:
C([0, 1])
0 ≤ inf O(Z N )− sup U (Z N ) ≤ O(Z N )−U (Z N ) → 0
N∈N N ∈N
Regelfunktionen (Treppenfkt.)
für N → ∞, d. h., supN ∈N U (Z N ) = inf N ∈N O(Z N ).
Mit ε > 0 und N ≥ N0 ergibt sich für die Riemann-
Summen: riemann-integrierbar (sin x1 )
−3ε ≤ U (Z N ) − O(Z N ) ≤ R(Z N , zN ) − O(Z N )
lebesgue-integrierbar (Dirichlet-Sprungfkt.)
≤ R(Z N , zN ) − inf O(Z M )
M∈N
Abbildung 16.20 Die verschiedenen Integrationsbegriffe über einem kompak-
= R(Z , z ) − sup U (Z M )
N N
ten Intervall führen auf echte Unterräume zur Menge der lebesgue-integrierbaren
M∈N
Funktionen. Beispiele von Funktionen etwa auf (0, 1), die nicht zu den jeweiligen
≤ R(Z N , zN ) − U (Z N ) ≤ O(Z N ) − U (Z N ) ≤ 3ε . Teilmengen gehören, sind mit angegeben.
Zusammenfassung 649

Auf das Adjektiv „uneigentlich“ kann in Mit dem Beispiel auf Seite 634 wird deutlich, dass auch
manchen Situationen nicht verzichtet werden bei Nutzung des Lebesgue-Integrals manchmal uneigentli-
che Integrale oder Cauchy’sche Hauptwerte betrachtet wer-
Wird das Integral über Regelfunktionen oder im Riemann- ∞ uneigent-
den müssen. Beim Lebesgue-Integral ist der Zusatz
Sinne definiert, so ist man, wie wir gesehen haben, bei unbe- lich somit sehr wichtig, da eine Notation wie a f dx sonst
schränkten Integranden oder Intervallen auf die Erweiterung Integrierbarkeit suggeriert. Legt man den Riemann’schen
zum uneigentlichen Integral angewiesen, d. h., man definiert Begriff oder Regelfunktionen zugrunde, wird das Adjektiv
etwa die Notation in der Literatur oft nicht angemerkt, da Integrale bei unbe-
J ∞ J b schränktem Integrationsgebiet und/oder Integrand dann stets
f (x) dx = lim f (x) dx, nur im uneigentlichen Sinn definiert sind.
a b→∞ a

wenn der Grenzwert existiert. Dies ist ein Unterschied zur


Lebesgue-Theorie, die auch in solchen Situationen Integrier-
barkeit kennt (siehe Beispiel auf Seite 627).

Zusammenfassung

Integrale von Treppenfunktionen sind anschaulich durch Der erste Hauptsatz besagt, dass die durch das Integral defi-
den Flächeninhalt zwischen x-Achse und ihrem Graphen de- nierte Funktion F eine Stammfunktion des Integranden f
finiert. Einen allgemeinen Begriff vom Integral erhalten wir ist, d. h., es gilt F ist differenzierbar mit F  = f . Der zweite
durch punktweise fast überall konvergente Folgen von Trep- Hauptsatz vervollständigt das Bild.
penfunktionen, deren Integralwerte beschränkt sind. Solche
Folgen ermöglichen die Definition des Lebesgue-Integrals.
Andere Zugänge zu Integration, die zumindest für einen Teil 2. Hauptsatz der Differenzial- und Integralrechnung
der betrachteten Integranden erklärt sind, ergeben sich durch Wenn F : [a, b] → R eine stetige und auf (a, b) stetig
Regelfunktionen oder durch Riemann-Summen. differenzierbare Funktion ist mit integrierbarer Ablei-
Nachdem die Definition des Integrals festgelegt ist, zeigt sich, tung F  , d. h. F  ∈ L(a, b) ∩ C(a, b), dann gilt
dass stetige Funktionen über kompakten Intervallen integrier- J b
bar sind. Damit ergeben sich grundlegende Aussagen, wie F  (t) dt = F (b) − F (a) .
etwa der Mittelwertsatz. a

Mittelwertsatz der Integralrechnung


Mit diesem Zusammenhang lassen sich die Regeln zum Dif-
Zu einer stetigen Funktion f : [a, b] → R gibt es ein
ferenzieren auch bei Integralen wiederentdecken. Die Pro-
z ∈ [a, b] mit
duktregel führt auf die partielle Integration:
J b
f (x) dx = f (z)(b − a) . J J
b b
a 
u (x)v(x) dx = u(x)v(x)|ba − u(x)v  (x)d x
a a
Mit dem Mittelwertsatz folgt unter anderem ein elementarer
Zusammenhang zwischen Ableitung und Integral. Dies wird
durch die beiden Hauptsätze der Differenzial- und Integral- etwa für u, v ∈ C 1 ([a, b]). Ähnlich liefert die Kettenregel
rechnung ausgedrückt. beim Differenzieren die Möglichkeit der Substitution:

J b J u(b)
1. Hauptsatz der Differenzial- und Integralrechnung
f (u(x)) u (x) dx = f (u) du ,
Die Funktion F : [a, b] → R mit a u(a)
J x
F (x) = f (t) dt wenn die Funktionen hinreichend regulär sind.
a
Verallgemeinerungen dieser Integrationstechniken in Hin-
zu einer stetigen Funktion f : [a, b] → R ist differen-
blick auf weniger reguläre Integranden oder unbeschränkte
zierbar auf (a, b), und es gilt:
Integrationsgebiete lassen sich mithilfe einer zentralen Kon-
F  (x) = f (x) für x ∈ (a, b) . vergenzaussage der Lebesgue’schen Integrationstheorie, dem
Satz von Beppo Levi, erreichen.
650 16 Integrale – von lokal zu global

Der Satz von Beppo Levi deutlicht, dass der Satz ein Monotoniekriterium im Funktio-
nenraum L(I ) der integrierbaren Funktionen ist.
Ist (fn )n∈N eine fast überall monotone Folge von
lebesgue-integrierbaren
 Funktionen
 fn ∈ L(I ), und die Eine weitere wichtige Folgerung ergibt sich im Zusammen-
Folge der Integrale I fn dx n∈N in R ist beschränkt, hang mit parameterabhängigen Integralen. Der Lebesgue’
dann konvergiert die Funktionenfolge (fn ) punktweise sche Konvergenzsatz beschreibt sehr allgemeine Bedingun-
fast überall gegen eine integrierbare Funktion f ∈ L(I ), gen, unter denen ein Grenzprozess mit einer Integration ver-
und es gilt: tauscht werden darf.
J J
lim fj dx = f dx . Lebesgue’scher Konvergenzsatz
j →∞ I I
Wenn es zu einer Folge von integrierbaren Funktionen
fn ∈ L(I ) über einem Intervall I ⊂ R, die punktweise
Eine nützliche Konsequenz aus dem Satz von Beppo Levi fast überall gegen f : I → R konvergiert, eine integrier-
ist das Konvergenzkriterium. Wenn f : I → R über einer bare Funktion g ∈ L(I ) gibt mit |fn (x)| ≤ g(x) für fast
∞ von Teilintervallen I1 ⊆ I2 ⊆ · · ·⊆
Folge I ⊆ R mit I = alle x ∈ I und alle n ∈ N, dann ist f ∈ L(I ) integrierbar,
I
j =1 j integrierbar ist und die Folge Ij |f (x)| dx j ∈N und es gilt:
beschränkt bleibt, so ist f auf I integrierbar mit J J
J J lim fn (x) dx = f (x) dx .
n→∞ I I
f (x) dx = lim f (x) dx .
I j →∞ Ij
Es handelt sich um eine Aussage von weitreichender Be-
Viele weitere Aussagen stützen sich auf den Satz von B. Levi. deutung, etwa wenn eine Funktion wie die Gammafunktion
Die Vielschichtigkeit lässt sich erahnen, wenn man sich ver- mithilfe einer Integraldarstellung beschrieben wird.

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen 16.2 • Wir betrachten eine stetige Funktion


16.1 ••• Ähnlich zur Cantormenge (siehe Seite 606) ent- f : [a, b] → R. Zeigen Sie: Aus
fernen wir aus dem Intervall [0, 1] das offene Mittelintervall
der Länge 41 , also ( 38 , 58 ). Es bleiben die Intervalle J b
B C B C f (x) g(x) dx = 0
3 5
C1 = 0, ∪ ,1 a
8 8
übrig, aus denen jeweils das offene Mittelintervall der Länge
1 für alle stetigen Funktionen g ∈ C([a, b]) mit g(a) =
entfernt wird. Dies liefert die vier Intervalle
42 , - , - g(b) = 0 folgt, dass f identisch null ist.
5 7 12
I21 = 0, 32 , I22 = 32 32 ,
, - , - 16.3 • Zeigen Sie, dass für eine stetig differenzierbare,
I23 = 20 32 32
25
, I24 = 27
32 , 1 . umkehrbare Funktion f : [a, b] → R gilt:
4
Wir definieren C2 = j =1 I2j . Analoges Fortfahren liefert J J
b f (b)
im n-ten Schritt eine Menge Cn bestehend aus 2n Intervallen.
f (x) dx + f −1 (x) dx = b f (b) − a f (a) ,
Zeigen Sie, dass ∞
 a f (a)
M= Cn
n=1 und veranschaulichen Sie sich die Aussage durch eine Skizze.
keine Nullmenge ist.
Aufgaben 651

16.4 • Die folgenden Aussagen zu Integralen über un- g : Dg → R mit


beschränkte Integranden oder unbeschränkte Intervalle sind
falsch. Geben Sie jeweils ein Gegenbeispiel an. e4x + 1
f (x) = ,
b e2x + 1
1. Wenn a {f (x) + g(x)} dx existiert, dann existieren auch 2
b b g(x) = .
a f (x) dx und a g(x) dx. tan( x2 ) + cos(x) − sin(x)
b b
2. Wenn a f (x) dx und a g(x) dx existieren, dann exis-
b
tiert auch a f (x) g(x) dx.
b 16.11 •• Sind die folgenden Funktionen auf dem ange-
3. Wenn a f (x) g(x) dx existiert, dann existieren auch
b b gebenen Intervall integrierbar:
a f (x) dx und a g(x) dx.
1
f (x) = √ auf [0, ∞) ,
16.5 •• Warum gilt der zweite Hauptsatz nicht für die x2 + x
 , π-
stetige Fortsetzung F : [0, 1] → R von F (x) = x cos x1 , 1
g(x) = auf 0, ,
x = 0 ? sin x 2
1
h(x) = x α sin auf [0, 1] mit α ∈ R .
x
Rechenaufgaben
16.6 •• Die Fresnel’schen Integrale C und S sind auf R 16.12 • Durch das Parameterintegral
gegeben durch J ∞
J x (t) = x t−1 e−x dx, t > 0
C(x) = cos(t 2 ) dt , 0
0
J x ist die Gammafunktion definiert.
S(x) = sin(t 2 ) dt .
0 (a) Begründen Sie, dass das Integral für alle t > 0 existiert.
(b) Beweisen Sie
Bestimmen und klassifizieren Sie alle Extrema dieser Funk-
tionen. (t + 1) = t (t)

16.7 • Man berechne die Integrale und für n ∈ N die Identität

J J (n + 1) = n!
π 1 ex
I1 = t 2 sin(2t) d t, I2 = dx , √
0 0 (1 + ex )2 (c) Berechnen Sie den Wert ( 21 ) = π.
J J
1 √ 2 1 (d) Zeigen Sie ∈ C(R>0 ).
I3 = r 2 1 − r dr , I4 = arctan((ln(x))3 ) dx .
0 1
2
x
16.13 •• Berechnen Sie das Parameterintegral

16.8 •• Bestimmen Sie in Abhängigkeit der Parame- J1


ter a, b > 0 Stammfunktionen zu folgenden Funktionen J (t) = arcsin(tx) dx, 0 ≤ t < 1,
f : D → R mit Hilfe passender Integrationsregeln. 0

cos(ln(ax)) indem Sie dessen Ableitung J  (t) im offenen Intervall 0 <


(a) f (x) = mit D = R>0 t < 1 bestimmen und auf J (t), 0 ≤ t < 1 zurückschließen.
x
(b) f (x) = sin(ax) sin(bx) mit D = R Ist J (t) nach t = 1 stetig fortsetzbar?
x
(c) f (x) = % mit D = R>b−a 16.14 • Untersuchen Sie folgende Reihen auf Konver-
(x + a)2 − b2 genz:  ∞
 ∞ 
! !
−k k −k
ke und k e .
16.9 • Bestimmen Sie auf Intervallen I ⊆ R\{−1} k=0 k=0
eine Stammfunktion zum Ausdruck
1
, x  ∈ {−1, i, −i} . Beweisaufgaben
x4 + 2x 3 + 2x 2 + 2x + 1
16.15 • Zeigen Sie, dass eine stetige Funktion f : R
→ R, die der Funktionalgleichung f (x + y) = f (x) + f (y)
16.10 • Bestimmen Sie auf möglichst großen Inter- für x, y ∈ R genügt, differenzierbar ist mit konstanter Ablei-
vallen Df,g ⊆ R Stammfunktionen zu f : Df → R und tung f  (x) = c ∈ R.
652 16 Integrale – von lokal zu global

16.16 • Zeigen Sie in einer Umgebung um einen Ent- für alle n ∈ N durch c > 0 beschränkt sind, so ist f inte-
wicklungspunkt x0 die Integraldarstellung grierbar.
!
n
f (n) (x0 ) (b) Belegen Sie den wesentlichen Unterschied zum Lebesgue’
rn (x, x0 ) = f (x) − (x − x0 )k schen Konvergenzsatz, indem Sie die Funktionenfolge (fn )
k!
J
k=0 mit fn : [0, 1] → R und
1 x
= (x − t)n f (n+1) (t) dt  * 
n! n, x ∈ 0, n1 ,
x0 fn (x) =
0, x ∈ [1/n, 1]
des Restglieds zur Taylorentwicklung einer (n+1)-mal stetig
differenzierbaren Funktion f . untersuchen.

16.17 ••• Zeigen Sie, dass zu Polynomen p, q mit reellen 16.20 ••• Zeigen Sie folgende Verallgemeinerung der
Koeffizienten und deg(p) < deg(q) durch Partialbruchzer- Substitutionsregel: Sind f ∈ L(α, β) und u ∈ C([a, b])
legung auf (a, b) monotone, stetig differenzierbare Funktionen mit
m μj
p(x) ! ! aj k u(a) = α und u(b) = β, dann ist f (u(.))u (.) integrierbar
=
q(x) (x − zj )k auf (a, b), und es gilt:
j =1 k=1
J J
stets eine reelle Stammfunktion zu p/q : I → R auf offe- b u(b)
f (u(x)) u (x) dx = f (u) du.
nen Intervallen I ⊆ R, die keine Nullstelle von q enthalten, a u(a)
angegeben werden kann.

16.18 •• Zeigen Sie: Ist f ∈ C([a, b]) und g ∈ L(a, b) 16.21 •• (a) Zeigen Sie: Ist f Regelfunktion auf [a, b],
dann gibt es in Verallgemeinerung des Mittelwertsatzes ein so gilt )J )
) b )
z ∈ [a, b] mit ) )
J b J b ) f (x) dx ) ≤ f ∞ |b − a|,
) a )
f (x)g(x) dx = f (z) g(x) dx .
a a wobei nur vom Integralbegriff für Regelfunktionen auszuge-
hen ist.
16.19 •• (a) Beweisen Sie das Lemma von Fatou:
(b) Begründen Sie: Zu zwei Regelfunktionen f und g ist auch
Ist (fn ) eine Folge nicht negativer, integrierbarer Funktionen,
das Produkt f g eine Regelfunktion.
die fast überall punktweise gegen eine Funktion f : (a, b) →
R konvergiert und deren Integrale (c) Finden Sie ein Gegenbeispiel, um zu belegen, dass
J b die Aussage aus Teil (b) im Allgemeinen für lebesgue-
fn (x) dx ≤ c integrierbare Funktionen nicht gilt.
a

Antworten der Selbstfragen

S. 601 (a, b) ist


Einsetzen der Treppenfunktion f liefert das Integral ∞
!
J 1 |Jk | ≥ b − a = 0.
1 1
f (x) dx = (−1 + 2 − 3 + · · · − 9 + 10) = . j =1
0 10 2

S. 602 Also gibt es etwa zu ε = (b − a)/2 keine abzählbare Über-


Punktweise Konvergenz bedeutet, dass zu jedem ε > 0 und deckung. Die Menge ist keine Nullmenge. Nur im Fall a = b,
x ∈ [a, b] ein N ∈ N existiert mit d. h., (a, b) = ∅, handelt es sich um eine Nullmenge.

|fn (x) − f (x)| ≤ ε für n ≥ N . S. 610


Sind f, g ∈ L(a, b) mit f ≤ g fast überall. Dann gilt
Im Gegensatz zur gleichmäßigen Konvergenz ist bei der für die Zerlegungen f = f1 − f2 und g = g1 − g2 mit
punktweisen Konvergenz die Zahl N von der Stelle x ab- f1 , f2 , g1 , g2 ∈ L↑ (a, b), dass f1 + g2 ≤ g1 + f2 . Da
hängig. Bei gleichmäßiger Konvergenz kann N angegeben f1 + g2 , g1 + f2 ∈ L↑ (a, b) sind, folgt die Monotonie
werden, sodass die Abschätzung für alle x ∈ [a, b] gilt.
J J
S. 605 b b
Für a < b und eine Überdeckung {Jk | k ∈ N} des Intervalls f1 (x) + g2 (x) dx ≤ g1 (x) + f2 (x) dx
a a
Antworten der Selbstfragen 653

mit dem Lemma auf Seite 609. Zusammen mit der Linearität S. 620
des Integrals folgt: Mit der Substitution f = f (x) und der Ableitung des Loga-
J J rithmus folgt:
b b
f (x) dx ≤ g(x) dx. J J
a a f  (x) 1
dx = df = ln |f | + c = ln |f (x)| + c
f (x) f
S. 614 nach Rücksubstitution in den Fällen f (x) > 0 für x ∈ [a, b]
Betrachten wir die Treppenfunktion f : [0, 1] → R mit oder f (x) < 0 für x ∈ [a, b]. Falls f Nullstellen auf [a, b]
 besitzt, können wir nur entsprechend gewählte Teilintervalle
0 für x ∈ [0, 1/2),
f (x) = betrachten.
1 für x ∈ [1/2, 1],

dann ist S. 628


⎧ Beachten wir die unterschiedlichen Notationen und erset-
J ⎪
⎨0
1
für x ∈ [0, ],
x zen u, v in der Formulierung auf Seite 619 durch U, V . Bei
F (x) = f (t) dt = 2
der ursprünglichen Formulierung der partiellen Integration
0 ⎪
⎩x−
1 1
für x ∈ [ , 1].
2 2 müssen die Ableitungen, also hier u, v, in (a, b) stetig vor-
ausgesetzt werden, sodass nach dem ersten Hauptsatz mit
Die Funktion F ist in x = 1/2 nicht differenzierbar. U, V ∈ C([a, b]) Stammfunktionen auf (a, b) zu u = U 
und v = V  gegeben sind. Darüber hinaus muss dort die In-
S. 615 tegrierbarkeit von uV und U v über [a, b] gefordert werden,
Nehmen wir an, es sind F1 und F2 zwei Stammfunktio- da im Allgemeinen U  bzw. V  auf [a, b] nicht zwangsläu-
nen zu f : (a, b) → R. Dann ergibt sich für die Diffe- fig integrierbar sind. In der neuen Formulierung wird diese
renz F = F1 − F2 , dass F  = F1 − F2 = f − f = 0 Existenz durch den Satz von Beppo Levi garantiert.
ist. Mit dem Mittelwertsatz der Differenzialrechnung wis-
sen wir, dass eine Funktion, deren Ableitung verschwindet,
S. 636
konstant sein muss. Also gibt es eine Konstante c ∈ R mit
Als Majoranten dient etwa der Betrag |f |, und man kann
F1 (x) − F2 (x) = c für alle x ∈ (a, b), d. h., die beiden
einfach die konstante Folge (fn ) mit fn = f wählen, die
Stammfunktionen von f unterscheiden sich höchstens durch
offensichtlich gegen f konvergiert.
eine additive Konstante c.

S. 617 S. 642
Aus der Tabelle der Stammfunktionen sehen wir sofort: Da der Grenzwert sich linear verhält und für Treppenfunktio-
J 1 J 1 nen die entsprechende Eigenschaft gilt, folgt mit zwei Folgen
)1
I1 = e−x dx = − (−e−x ) dx = − e−x ) 0
von Treppenfunktionen ϕn und ψn , die f bzw. g approximie-
0 0 ren:
)0 1
= e−x )1 = e0 − e−1 = 1 − J b J b
e
λf (x) + μg(x) dx = lim λϕn (x) + μψn (x) dx
a n→∞ a
und J b J b
J 1 = lim λ ϕn (x) dx + lim μ ψn (x) dx
1 n→∞ n→∞
I2 = dx = arctan x|10 J
a
J
a
0 1 + x2 b b
π =λ f (x) dx + μ g(x) dx.
= arctan(1) − arctan(0) = . a a
4

S. 619 S. 645
Partielle Integration führt auf Gilt f (x) ≤ g(x) auf [a, b] so gilt für die Riemann-Summen
J J zu einer Zerlegung Z die Abschätzung
sin x cos x dx = sin2 x − sin x cos xdx ,

! ∞
!
f (zj )(xj − xj −1 ) ≤ g(zj )(xj − xj −1 ) .
und es folgt:
j =1 j =1
J
1 2
sin x cos x dx = sin x + c Sind f und g riemann-integrierbar, so bleibt die Abschätzung
2
im Grenzfall entsprechender Riemann-Folgen erhalten. Das
mit einer Integrationskonstante c ∈ R. Integrieren ist monoton.
Euklidische und unitäre
Vektorräume – 17
orthogonales
Diagonalisieren
Was ist der kürzeste Abstand
eines Vektors zu einem
Untervektorraum ?
Warum sind symmetrische
Matrizen diagonalisierbar ?
Sind die Darstellungsmatrizen
orthogonaler Endomorphismen
orthogonal ?
Wann ist eine Matrix normal ?

17.1 Euklidische Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656


17.2 Norm, Abstand, Winkel, Orthogonalität . . . . . . . . . . . . . . . . . . . 662
17.3 Orthonormalbasen und orthogonale Komplemente . . . . . . . . . 668
17.4 Unitäre Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678
17.5 Orthogonale und unitäre Endomorphismen . . . . . . . . . . . . . . . . 681
17.6 Selbstadjungierte Endomorphismen . . . . . . . . . . . . . . . . . . . . . . 691
17.7 Normale Endomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 697
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708
656 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Im Kapitel 7 zur analytischen Geometrie haben wir ausführlich Längen von Vektoren und Winkel zwischen
das kanonische Skalarprodukt im (reellen) Anschauungsraum Vektoren sind im R2 bzw. R3 mit dem
behandelt. Wir haben festgestellt, dass zwei Vektoren genau Skalarprodukt bestimmbar
dann orthogonal zueinander sind, wenn ihr Skalarprodukt den
Wert null ergibt.
Für jede natürliche Zahl n und Vektoren
Wir sind auch mit höherdimensionalen reellen und komplexen
Vektorräumen und auch mit Vektorräumen, deren Elemente ⎛ ⎞ ⎛ ⎞
v1 w1
Funktionen oder Polynome sind, vertraut. Es ist daher eine ⎜ .. ⎟ ⎜ .. ⎟
v = ⎝ . ⎠ , w = ⎝ . ⎠ ∈ Rn
naheliegende Frage, ob es auch möglich ist, ein Skalarpro-
dukt zwischen Vektoren solcher Vektorräume zu erklären. Dabei vn wn
sollte aber das vertraute Standardskalarprodukt des Anschau-
ungsraums verallgemeinert werden. Dass dies in vielen Vektor- nannten wir das Produkt
räumen möglich ist, zeigen wir im vorliegenden Kapitel. Dabei
können wir aber nicht mehr mit der Anschauung argumentie- !
n
v · w = v0 w = vi wi ∈ R
ren. Wir werden vielmehr die algebraischen Eigenschaften des
i=1
Skalarprodukts im Anschauungsraum nutzen, um ein (allgemei-
nes) Skalarprodukt in reellen bzw. komplexen Vektorräumen zu
das kanonische Skalarprodukt oder auch das Standard-
erklären. Damit gelingt es dann auch von einer Orthogonalität
skalarprodukt von v und w. Dieses ist ein Produkt zwi-
von Funktionen zu sprechen – Funktionen sind per Definition
schen zwei Vektoren des reellen Vektorraums Rn , bei dem
dann orthogonal, wenn ihr Skalarprodukt den Wert null hat.
als Ergebnis eine reelle Zahl entsteht.
Tatsächlich erfordern viele Anwendungen der linearen Algebra,
wie etwa die abstrakte Formulierung der Quantenmechanik,
eine solche Orthogonalitätsrelation für Funktionen. Auch bei Kommentar: Statt v · w schreibt man oft auch -v, w.
der Entwicklung periodischer Funktionen in eine Fourierreihe oder s(v, w). Und anstelle von v · v findet man oft auch
behilft man sich mit der Tatsache, dass das Skalarprodukt die Schreibweise v 2 . Wir werden üblicherweise die Notation
zwischen bestimmten trigonometrischen Funktionen den Wert v · w verwenden, falls es sich um Vektoren v und w des
null hat. Rn oder um nicht näher spezifizierte Vektoren handelt. Sind
v und w aber Funktionen f und g eines Vektorraums von
Wie immer in der Algebra betrachten wir neben einer alge- Funktionen, so bevorzugen wir die Schreibweise -f, g., da
braischen Struktur, in vorliegendem Fall die euklidischen und dies bei Funktionen die übliche Notation ist.
unitären Vektorräume, die strukturerhaltenden Abbildungen. Da
lineare Abbildungen in verschiedener Art und Weise mit Ska-
larprodukten verträglich sein können, unterscheiden wir auch In den Anschauungsräumen, also in den Fällen n = 2 und
verschiedene Arten von linearen Abbildungen. Wir behandeln n = 3, drückt v · w = 0 die Tatsache aus, dass die beiden
ausführlich orthogonale bzw. unitäre, selbstadjungierte und nor- Vektoren v und w senkrecht aufeinanderstehen. Der Wert
male Endomorphismen. Wir können auch entscheiden, welche 

dieser Endomorphismen diagonalisierbar sind. v = v · v = v12 + v22 bzw.
√ 
v = v · v = v12 + v22 + v32 ,
17.1 Euklidische Vektorräume
also die Wurzel des Skalarprodukts eines Vektors mit sich
Wir wollen den Begriff des Senkrechtstehens zweier Vekto- selbst, gibt die Länge des Vektors v an. Anstelle von der
ren weitreichend verallgemeinern. Neben den bisher betrach- Länge eines Vektors sprachen wir auch von der Norm eines
teten Vektorräumen Rn und Cn , in denen wir von zueinander Vektors.
orthogonalen Vektoren gesprochen haben, wollen wir eine
solche Relation auch für Elemente abstrakter Vektorräume

?
erklären, wie etwa dem Vektorraum aller auf einem kompak- Wieso existiert v · v für jedes v ∈ R2 bzw. R3 ? Anders
ten Intervall stetiger reellwertiger Funktionen. Wir beginnen gefragt: Wieso ist v · v eine nicht negative reelle Zahl?
mit dem reellen Fall.

Über die geometrischen Eigenschaften des kanonischen


Skalarprodukts wurde im Kapitel 7 berichtet. Nun stellen
wir die algebraischen Eigenschaften dieses Skalarprodukts
in den Vordergrund und definieren dann den allgemeinen Be-
griff eines Skalarprodukts eines reellen Vektorraums durch
diese Eigenschaften.
17.1 Euklidische Vektorräume 657

Das kanonische Skalarprodukt ist eine


ein euklidisches Skalarprodukt, wenn für alle v, v  ,
symmetrische, positiv definite Bilinearform w ∈ V und λ ∈ R die folgenden Eigenschaften erfüllt
sind:
Wir fassen das kanonische Skalarprodukt als eine Abbildung (i) (v + v  ) · w = v · w + v  · w und (λ v) · w = λ (v · w)
auf:  n (Linearität im ersten Argument),
R × Rn → R,
·: (ii) v · w = w · v (Symmetrie),
(v, w)  → v · w = v 0 w .
(iii) v · v ≥ 0 und v · v = 0 ⇔ v = 0 (positive Definit-
Nun gilt für alle v, w, v  , w  ∈ Rn und λ ∈ R: heit).
Ist · ein euklidisches Skalarprodukt in V , so nennt man
(v + v  ) · w = v · w + v  · w und (λ v) · w = λ (v · w)
V einen euklidischen Vektorraum.
(Linearität im ersten Argument),
v · (w + w  ) = v · w + v · w  und v · (λ w) = λ (v · w)
(Linearität im zweiten Argument), Kommentar: Später werden wir auch andere Skalarpro-
v · w = w · v (Symmetrie), dukte erklären, daher sollte man eigentlich stets das Adjektiv
v · v ≥ 0 und v · v = 0 ⇔ v = 0 (positive Definitheit). euklidisch mitführen. Wenn aber keine Verwechslungsgefahr
Der Nachweis dieser Eigenschaften ist einfach. Die Symme- besteht, werden wir es auch manchmal weglassen.
trie etwa zeigt man wie folgt: Für alle v = (vi ), w = (wi ) ∈
Wegen der Symmetrie folgt die Linearität im zweiten Argu-
Rn gilt:
ment, da für alle v, w, w  ∈ V und λ ∈ R gilt:
!
n !
n
v·w = vi wi = wi vi = w · v .
(ii) (ii)
i=1 i=1 v · (w + w  ) = (w + w  ) · v v · (λ w) = (λ w) · v
(i) (i)
Eine Abbildung von einem Vektorraum in seinen zugrunde = w · v + w · v = λ (w · v)
liegenden Körper nennt man auch eine Form. Die ersten bei- (ii) (ii)
den Eigenschaften besagen, dass die Abbildung ·, also das = v · w + v · w , = λ (v · w) .
Skalarprodukt, in den beiden Argumenten (· , ·) ∈ Rn × Rn
linear, also bilinear ist. Daher rührt der Begriff Bilinearform
für Abbildungen mit diesen Eigenschaften. ?
Warum gilt für jedes v eines euklidischen Vektorraums
Wegen der dritten Eigenschaft, der Symmetrie, folgt die 0 · v = 0 = v · 0?
zweite aus der ersten – oder die erste aus der zweiten. Man
kann also eine der ersten beiden Eigenschaft aus der jeweils
anderen mit der Symmetrie folgern. Wir werden gleich zei- Beispiel
gen, wie das tatsächlich geht. Für jede natürliche Zahl n ist im reellen Vektorraum Rn
Die vierte Eigenschaft, die positive Definitheit, ist gleichwer- das kanonische Skalarprodukt
tig zu der Eigenschaft
v · w = v0 w (v, w ∈ Rn )
n
v · v > 0 für alle v ∈ R \ {0} .
ein euklidisches Skalarprodukt.
( für Vektoren v, w ∈ R mittels der Matrix
Wir definieren 2
'
2 1
Ein euklidisches Skalarprodukt ist eine A= das Produkt
1 1
symmetrische, positiv definite Bilinearform
eines reellen Vektorraums v · w = v0 A w

zwischen den Vektoren v und w und stellen fest, dass für


Wir benutzen die algebraischen Eigenschaften des kanoni-
alle v, v  , w ∈ R2 und λ ∈ R
schen Skalarprodukts, um das Skalarprodukt in beliebigen
reellen Vektorräumen einzuführen, um dann in solchen Vek- (v + v  ) · w = (v + v  )0 A w = v 0 A w + v 0 A w
torräumen von Normen von Vektoren und von Winkeln zwi-
= v · w + v · w
schen Vektoren sprechen zu können.
und
Euklidisches Skalarprodukt und euklidischer Vektor-
(λ v) · w = (λ v)0 A w = λ v 0 A w = λ (v · w)
raum
Ist V ein reeller Vektorraum, so heißt eine Abbildung gilt. Das besagt, dass das so definierte Produkt · linear im
 ersten Argument ist. Das Produkt ist auch symmetrisch,
V ×V → R da wegen
·:
(v, w)  → v · w
v 0 A w = (v 0 A w)0 = w0 A0 v
658 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

(das Transponieren ändert eine reelle Zahl nicht) und der f 2 (t) f 2 (t0 )  = 0
Symmetrie der Matrix A, d. h. A0 = A, gilt:

v · w = v 0 A w = w 0 A0 v t0
= w0 A v = w · v . a 
b t
U (t0 )
Und '
schließlich
( ist das Produkt positiv definit, da für alle
Abbildung 17.1 Der Graph der stetigen Funktion f 2 schließt mit der t-Achse
v1
v= ∈ R2 gilt: einen positiven Flächeninhalt ein.
v2
' (
0 v
v · v = v A v = (2 v1 + v2 , v1 + v2 ) 1 also ist das Produkt auch symmetrisch und somit eine sym-
v2 metrische Bilinearform.
= 2 v12 + 2 v1 v2 + v22 Wir zeigen nun, dass das Produkt positiv definit ist. Für
= v12 + (v1 + v2 )2 ≥ 0 , jedes f ∈ C(I ) gilt:
J b J b
und Gleichheit gilt hierbei genau dann, wenn v1 = 0 = v2 , -f, f . = f (t) f (t) dt = (f (t))2 dt ≥ 0 .
d. h. v = 0 ist. a a
Damit ist also gezeigt, dass · ein euklidisches Skalarpro- Ist f nicht die Nullfunktion, so gibt es ein t0 ∈ [a, b] mit
dukt ist und der R2 mit diesem Skalarprodukt ein euklidi- f (t0 ) = 0. Da f stetig ist, gibt es somit eine Umgebung
scher Vektorraum ist. U (t0 ) ⊆ [a, b], sodass f für alle Argumente aus U (t0 )
Wir erklären ein Produkt - , . im Vektorraum aller auf von null verschiedene Werte annimmt (Abb. 17.1). Da
einem abgeschlossenen Intervall I = [a, b] ⊆ R mit
a < b stetigen reellwertigen Funktionen, also im reellen J J b
2
Vektorraum 0< f (t) dt ≤ f (t)2 dt ,
U (t0 ) a
C(I ) = {f ∈ RI | f ist stetig } . b
ist das Integral -f, f . = a (f (t))2 dt größer als null. Es
Dazu multiplizieren wir zwei Funktionen f und g aus folgt die positive Definitheit:
C(I ) folgendermaßen:
-f, f . = 0 ⇔ f = 0 .
J b
-f, g. = f (t) g(t) dt ∈ R. Somit ist · ein Skalarprodukt.
a

Weil stetige Funktionen nach einem Ergebnis auf Kommentar: Hätten wir anstatt der Stetigkeit nur die
Seite 613 integrierbar sind, ist dieses Produkt auch de- Integrierbarkeit gefordert, so wäre das so definierte Pro-
finiert. dukt kein Skalarprodukt. Eine Funktion f , die außer an
Nun verifizieren wir, dass dieses Produkt einer Stelle t0 zwischen a und b stets den Wert Null an-
nimmt, ist nicht die Nullfunktion, sie ist aber integrierbar,
- , . : C(I ) × C(I ) → R b
und es gilt -f, f . = a (f (t))2 dt = 0 (Abb. 17.2).
ein Skalarprodukt ist.
f (t) f (t0 )  = 0
Aufgrund der Rechenregeln von Seite 611 für das Integral
gilt für alle Funktionen f, g, h ∈ C(I ):
b
J b a f dt = 0
-f + g, h. = (f (t) + g(t)) h(t) dt
a  t0  b
a
J b J b t
f (t) = 0 f (t) = 0
= f (t) h(t) dt + g(t) h(t) dt
a a
Abbildung 17.2 Das Integral einer Funktion, die nur auf einer Nullmenge von
= -f, h. + -g, h. . null verschiedene Werte annimmt, ist null.

Analog gilt für jede reelle Zahl λ:


Anstelle von C(I ) können wir auch den Vektorraum der
-λ f, g. = λ -f, g. . Polynome vom Grad kleiner oder gleich einer natürlichen
Zahl n wählen. Weil Polynomfunktionen stetig sind, ist
Damit ist bereits gezeigt, dass - , . linear im ersten Argu- dann
ment ist. Für alle f, g ∈ C(I ) gilt: J b
-p, q. = p(t) q(t) dt
J b J b a
-f, g. = f (t) g(t) dt = g(t) f (t) dt = -g, f . , ein Skalarprodukt. 
a a
17.1 Euklidische Vektorräume 659

Achtung: Beim Skalarprodukt darf man im Allgemeinen


negativ semidefinit, wenn für alle v ∈ Rn \ {0} gilt:
nicht kürzen:
Aus a · v = a · w folgt nicht unbedingt v = w. v 0 A v ≤ 0,
Wegen der Linearität kann man aber indefinit, wenn es Vektoren v, w ∈ Rn gibt mit
a · (v − w) = 0
v 0 A v > 0 und w 0 A w < 0 .
folgern.
Achtung: Man beachte, dass die Symmetrie im Begriff
der Definitheit steckt: Positiv definite Matrizen sind symme-
Positiv definite Matrizen liefern euklidische trisch.
Skalarprodukte
Beispiel Für eine Diagonalmatrix D = diag(λ1 , . . . , λn )
Wir betrachten noch einmal das zweite Beispiel von ∈ Rn×n gilt offenbar:
Seite 657. Für jede reelle symmetrische Matrix A ist das
Produkt von Vektoren v, w des Rn , das definiert ist durch D ist positiv definit ⇔ λ1 , . . . , λn > 0 ,
D ist negativ definit ⇔ λ1 , . . . , λn < 0 ,
v · w = v0 A w ,
D ist positiv semidefinit ⇔ λ1 , . . . , λn ≥ 0 ,
linear im ersten Argument, symmetrisch – dies liegt an der
D ist negativ semidefinit ⇔ λ1 , . . . , λn ≤ 0 ,
Symmetrie der Matrix A – und damit linear im zweiten Argu-
ment. D ist indefinit ⇔ ∃ i, j mit λi < 0, λj > 0 .

Damit dieses Produkt ein Skalarprodukt ist, fehlt noch die Weitere Beispiele werden auf Seite 660 diskutiert. 
Eigenschaft v · v > 0, also v 0 A v > 0, für alle vom Null-
vektor verschiedenen Vektoren v des Rn . Jede positiv definite Matrix liefert ein euklidisches Skalar-
produkt, das besagt der folgende Satz.
Nicht jede symmetrische Matrix erfüllt diese positive '
Definit-
(
1 1
heit. Man betrachte etwa die symmetrische Matrix , Positiv definite Matrizen definieren Skalarprodukte
1 1
für die gilt: Jede positiv definite Matrix A ∈ Rn×n definiert durch
' (' (
(1, −1)
1 1 1
= 0, v · w = v0 A w
1 1 −1
' ( ein euklidisches Skalarprodukt. Mit diesem Skalarpro-
1 dukt · ist der Rn ein euklidischer Vektorraum.
obwohl = 0 gilt.
−1

? Beweis: Die Betrachtungen zu Beginn dieses Abschnitts


Ist v · w = v 0 A v mit der Matrix zeigen, dass · eine symmetrische Bilinearform ist. Schließlich
⎛ ⎞
1 0 0 ist diese Bilinearform wegen der positiven Definitheit der
A = ⎝0 0 0 ⎠ Matrix A auch positiv definit, da für alle v ∈ Rn \ {0} gilt:
0 0 −1
v · v = v0 A v > 0 .
ein Skalarprodukt im R3 ?
Folglich ist · ein euklidisches Skalarprodukt. 

Definitheit symmetrischer Matrizen Man erhält bei diesem Skalarprodukt mit der Wahl A = En
Wir nennen eine reelle symmetrische n × n-Matrix A das kanonische Skalarprodukt zurück – die Einheitsmatrix
positiv definit, wenn für alle v ∈ Rn \ {0} gilt: En ist positiv definit.

v0 A v > 0 ,
Die Darstellungsmatrix einer Bilinearform
negativ definit, wenn für alle v ∈ Rn \ {0} gilt: erhält man komponentenweise
v0 A v < 0 , Ist ϕ ein Endomorphismus eines n-dimensionalen K-
Vektorraums V , so können wir diesen durch eine Matrix aus
positiv semidefinit, wenn für alle v ∈ Rn \ {0} gilt:
Kn×n darstellen. Diese Darstellungsmatrix B M(ϕ)B von ϕ
v 0 A v ≥ 0, bezüglich einer gewählten Basis B von V erhält man spal-
tenweise: In der i-ten Spalte steht der Koordinatenvektor des
660 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Beispiel: Definitheit symmetrischer Matrizen


Wir überprüfen, ob die folgenden symmetrischen Matrizen positiv definit, negativ definit, positiv semidefinit, negativ semidefinit
oder indefinit sind.
⎛ ⎞
' ( ' ( 1 0 0 ' (
1 1 2×2 2 1 2×2 ⎝ ⎠ 3×3 −1 1
A= ∈R , B= ∈R , C= 0 0 1 ∈R , D= ∈ R2×2 .
1 1 1 1 1 −2
0 1 0

Problemanalyse und Strategie: Wir bestimmen für jede der angegebenen Matrizen M ∈ Rn×n und jeden Vektor
v ∈ Rn die Zahl v 0 M v ∈ R und stellen Überlegungen über das Vorzeichen an.

Lösung: Die Matrix C ist wegen


Die Matrix A ist wegen ⎞⎛ ⎛ ⎞
' ( 0 1
v
(v1 , v2 ) A 1 = v12 + v1 v2 + v2 v1 + v22 (0, 1, −1) C ⎝ 1 ⎠ = −2 und (1, 0, 0) C ⎝0⎠ = 1
v2
−1 0
= (v1 + v2 )2 ≥ 0
indefinit.
auf jeden Fall zumindest positiv semidefinit. Die Matrix
ist aber nicht positiv definit, da für v1 = −v2 , v1  = 0, gilt Die Matrix D ist wegen
v 0 A v = 0. Somit ist A positiv semidefinit.
' (
Die Matrix B ist wegen v1
(v1 , v2 ) D = −v12 + 2 v1 v2 − 2 v22
' ( v2
v1
(v1 , v2 ) B = 2 v12 + 2 v1 v2 + v22 = −((v1 − v2 )2 + v22 ) ≤ 0
v2
= v12 + (v1 + v2 )2 ≥ 0
zumindest negativ semidefinit. Wegen
zumindest positiv semidefinit. Wegen ' (
' ( v1
v1 (v1 , v2 ) D = 0 ⇔ v1 = 0 = v2
(v1 , v2 ) B = 0 ⇔ v1 = 0 = v2 v2
v2
ist B positiv definit. ist D negativ definit.

Bildes des i-ten Basisvektors. Die Darstellungsmatrix enthält


Die Matrix M B = M B (·) ist positiv definit, und für alle
alle wesentlichen Informationen des Endomorphismus, es ist
!
n !
n
ϕ  → B M(ϕ)B v= vi bi und w = wi bi ∈ V
i=1 i=1
bei einer fest gewählten Basis B ein Isomorphismus von
EndK (V ) auf Kn×n (Seite 445). gilt: ⎛ ⎞
w1
⎜ .. ⎟
Wir gehen nun für euklidische Skalarprodukte endlichdimen- v · w = (v1 , . . . , vn ) M B ⎝ . ⎠.
sionaler euklidischer Vektorräume ähnlich vor: Wie wir wis- wn
sen, liefert jede positiv definite Matrix A ∈ Rn×n ein eu-
klidisches Skalarprodukt auf dem Vektorraum Rn . Nun zur
Umkehrung: Beweis: Für v = ni=1 vi bi , w = ni=1 wi bi ∈ V gilt
wegen der Linearität des Produkts in beiden Argumenten:
Darstellungsmatrix eines euklidischen Skalar-
produkts    
!
n !
n
Ist V ein n-dimensionaler euklidischer Vektorraum mit v·w = vi b i · wi b i
dem euklidischen Skalarprodukt · und einer Basis B = i=1 i=1
(b1 , . . . , bn ), so nennt man die n × n-Matrix !
n
⎛ ⎞ = vi wj (bi · bj )
b1 · b1 · · · b1 · bn
i,j =1
⎜ .. ⎟ ∈ Rn×n
M B (·) = (bi · bj )i,j = ⎝ ... . ⎠
⎛ ⎞
w1
bn · b1 · · · bn · bn ⎜ .. ⎟
= (v1 , . . . , vn ) M B ⎝ . ⎠.
die Darstellungsmatrix von · bezüglich der Basis B. wn
17.1 Euklidische Vektorräume 661

Die Symmetrie und schließlich die positive Definitheit von zueinander ähnlich, d. h., es gibt eine invertierbare Matrix
M B folgt hieraus mit der Symmetrie und der positiven Defi- S ∈ Kn×n mit
nitheit des Skalarprodukts.
= S −1 B M(ϕ)B S .

C M(ϕ)C

Dabei gilt S = B M(id)C – beachte auch das folgende Dia-


Anstelle von der Darstellungsmatrix von · bezüglich B
gramm:
spricht man auch von der Gram’schen Matrix von · be-
züglich B.
Man beachte die Ähnlichkeit zwischen der Darstellung eines
Endomorphismus und der Darstellung eines Skalarprodukts:
Das Anwenden eines Endomorphismus wird auf die Multipli-
kation der Darstellungsmatrix mit einem Koordinatenvektor
zurückgeführt:
ϕ(v) ←→ B M(ϕ)B B v ,
Natürlich stellen wir uns nun die Frage, wie die Situation im
und die Produktbildung beim Skalarprodukt erfolgt durch
vorliegenden Fall eines euklidischen Vektorraums ist. Wie ist
Multiplikation von Koordinatenvektoren mit der Darstel-
der Zusammenhang von Darstellungsmatrizen eines euklidi-
lungsmatrix
schen Skalarprodukts bezüglich verschiedener Basen? Die
0
v · w ←→ Bv MB B w . Antwort liefert der folgende Satz.

Wir können aus obigem Ergebnis eine Folgerung ziehen, die Darstellungsmatrizen bezüglich verschiedener Basen
die Ähnlichkeit der Darstellungen von Endomorphismen und Ist V ein n-dimensionaler euklidischer Vektorraum mit
Skalarprodukten weiter unterstreicht. dem euklidischen Skalarprodukt · und den Basen B =
(b1 , . . . , bn ) und C = (c1 , . . . , cn ), so gilt mit der
Folgerung Matrix S = B M(id)C die Gleichung:
Für jede Basis B eines n-dimensionalen Vektorraums
V ist die Abbildung M C = S0M B S .
ψB : s  → M B (s)
eine Bijektion von der Menge aller euklidischer Skalarpro- Beweis: Die i-te Spalte der Matrix S = (sij ) ist der
dukte auf V in die Menge aller positiv definiten n × n- Koordinatenvektor von ci bezüglich der Basis B, d. h.,
Matrizen. ci = nk=1 ski bk .
An der Stelle (i, j ) der Matrix M C steht der Eintrag
Beweis: Nach dem obigen Satz zur Darstellungsmatrix  n  n 
! ! ! n
eines euklidischen Skalarprodukts ist ψB eine Abbildung ci ·cj = ski bk · slj bl = ski slj (bk · bl ) ,
von der Menge aller euklidischer Skalarprodukte auf V in k=1 l=1 k,l=1
die Menge aller positiv definiten n × n-Matrizen. Diese Ab-
und dies ist der Eintrag in der Matrix S 0 M B S an der Stelle
bildung ist injektiv, da aus M B (s) = M B (s  ) für zwei eu-
(i, j ).
klidische Skalarprodukte s und s  erneut nach obigem Satz


s = s  folgt. Schließlich ist die Abbildung auch surjektiv, da


für jede positiv definite n × n-Matrix A das wie folgt auf V Es sei K ein Körper. Man nennt zwei Matrizen A, B ∈ Kn×n
erklärte Skalarprodukt zueinander kongruent, wenn es eine invertierbare Matrix
S ∈ Kn×n gibt, sodass
v · w = B v 0 A B w , v, w ∈ V ,
B = S0A S
die Darstellungsmatrix M B (·) = A hat. 
gilt. Da die Basistransformationsmatrix B M(id)C invertier-
bar ist, sind also je zwei Darstellungsmatrizen eines Skalar-
produkts zueinander kongruent.
Darstellungsmatrizen ein und desselben
Dass die Kongruenz von Matrizen eine Äquivalenzrelation
Skalarprodukts bezüglich verschiedener auf Kn×n liefert, begründet man analog zur entsprechenden
Basen sind zueinander kongruent Aussage zur Ähnlichkeit auf Seite 455:

Wir erinnern erneut an die Darstellungsmatrizen von Endo- Lemma


morphismen: Sind B M(ϕ)B und C M(ϕ)C zwei Darstel- Für jeden Körper K und für jede natürliche Zahl n definiert
lungsmatrizen eines Endomorphismus ϕ eines n-dimen- die Kongruenz ∼ von Matrizen eine Äquivalenzrelation auf
sionalen K-Vektorraums V , so sind die Darstellungsmatrizen der Menge Kn×n .
662 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Dies ausführlich zu begründen haben wir als Übungsaufgabe Skalarprodukt das kanonische ist. Mit dem Begriff der Norm
gestellt. werden wir dann Abstände zwischen Vektoren und Winkel
zwischen Vektoren erklären und so letztlich zu dem Begriff
Nach dem Satz auf Seite 55 zerlegt jede Äquivalenzrelation
der Orthogonalität kommen.
ihre Grundmenge in ihre nichtleeren Äquivalenzklassen. Die
Äquivalenzklassen bezüglich der Äquivalenzrelationen Ähn-
ä k
lichkeit ∼ und Kongruenz ∼ sind jedoch im Allgemeinen Vektoren in euklidischen Vektorräumen
sehr verschieden, es können nämlich alle möglichen Fälle haben eine Norm
auftreten: ' (
v1
Zueinander kongruente Matrizen können zueinander ähn- Wir haben für einen Vektor v = der Anschauungs-
v2
lich sein:
' ( ' ( ' ( ' ( ebene R2 gezeigt, dass der Ausdruck
1 0 k 1 0 1 0 ä 1 0 √ 
∼ und ∼ .
0 2 0 2 0 2 0 2 v = v · v = v12 + v22

Zueinander nicht kongruente Matrizen können zueinander die Länge der Strecke vom Ursprung zum Punkt v angibt. In
ähnlich sein: der Sprechweise des Kapitels 7 ist dies die Norm des Vek-
' ( ' ( ' ( ' ( tors v.
1 0 k
∼
0 1
und
1 0 ä

0 1
. √
0 2 −2 3 0 2 −2 3 Der Ausdruck v · v existiert aber für jedes euklidische Ska-
larprodukt ·. Dies liegt an der positiven Definitheit, die sicher-
Zueinander nicht ähnliche Matrizen können zueinander stellt, dass man diese Wurzel bilden kann.
kongruent sein: √
Wir werden die Größe v · v die Norm des Vektors v nennen
' ( ' ( ' ( ' ( und sie wieder mit v bezeichnen.
1 0 ä 4 0 1 0 k 4 0
∼ und ∼ .
0 2 0 8 0 2 0 8
Die Norm von Vektoren
Zueinander nicht ähnliche Matrizen können zueinander
Ist v ein Element eines euklidischen Vektorraums mit
nicht kongruent sein:
dem euklidischen Skalarprodukt ·, so nennt man die po-
' ( ' ( ' ( ' ( sitive reelle Zahl
1 0 ä 0 0 1 0 k 0 0
∼ und ∼ .
0 2 0 0 0 2 0 0 √
v = v·v
? die Norm bzw. Länge des Vektors v.
Begründen Sie diese Behauptungen.

Beispiel Wir können also etwa  exp  für die auf dem In-
tervall [0, 1] stetige reelle Funktion exp bezüglich des Ska-
1
larprodukts -f, g. = 0 f (t) g(t) dt auf dem reellen Vek-
torraum C der auf dem Intervall [0, 1] stetigen Funktionen
bilden:
1 .
% J 1
1 2
 exp  = -exp, exp. = e2t dt = (e − 1) .
0 2
Damit hat die Funktion
% exp in diesem euklidischen Vektor-
raum die Norm √1 (e2 − 1).
2
Abbildung 17.3 Die Äquivalenzrelationen Kongruenz und Ähnlichkeit zerlegen Hätten wir für das Skalarprodukt etwa das Intervall%[0, 2] ge-
den Kn×n im Allgemeinen in verschiedene Äquivalenzklassen.
wählt, so hätte exp eine andere Norm, nämlich √1 (e4 − 1).
2
Dieser Begriff der Norm hängt vom erklärten Skalarprodukt
ab. 
17.2 Norm, Abstand, Winkel,
Orthogonalität ?
Welche Norm hat die Polynomfunktion p : R → R, p(t) = t 2
bezüglich des euklidischen Skalarprodukts
In euklidischen Vektorräumen, also in reellen Vektorräumen
J 1
mit einem euklidischen Skalarprodukt, ist es möglich, Vekto-
-f, g. = f (t) g(t) dt ?
ren eine Norm zuzuordnen. Diese Norm entspricht dabei dem 0
anschaulichen Begriff der Länge im R2 bzw. R3 , wenn das
17.2 Norm, Abstand, Winkel, Orthogonalität 663

Die Cauchy-Schwarz’sche Ungleichung besagt, Ist andererseits vorausgesetzt, dass v und w linear abhängig
dass der Betrag des Skalarprodukts zweier sind, so existiert ein ν ∈ R mit v = ν w. Wir erhalten
Vektoren kleiner ist als das Produkt der
|v · w| = |u| w w = ν w w = v w .
Normen beider Vektoren
Damit ist alles begründet. 

Die Cauchy-Schwarz’sche Ungleichung ist eine Ungleichung


von fundamentaler Bedeutung in verschiedenen Gebieten der
Mathematik. Wir werden sie benutzen, um einen sinnvollen
Abstands- und Winkelbegriff in euklidischen Vektorräumen Jedes Skalarprodukt liefert eine Norm
einzuführen.
Tatsächlich ist der Begriff der Norm eines Vektors sogar noch
Die Cauchy-Schwarz’sche Ungleichung etwas allgemeiner als unsere Definition.
Für alle Elemente v und w eines euklidischen Vektor- Wir betrachten im Folgenden einen reellen oder komplexen
raums V gilt die Cauchy-Schwarz’sche Ungleichung: Vektorraum V – man beachte, dass wir kein Skalarprodukt
voraussetzen. Um beide Fälle in einem abhandeln zu können,
|v · w| ≤ v w . schreiben wir K für den Grundkörper des Vektorraums V .

Die Gleichheit gilt hier genau dann, wenn v und w linear


Definition einer Norm
abhängig sind.
Es sei V ein K-Vektorraum. Man nennt eine Abbildung

Beweis: Im Fall w = 0 stimmen alle Behauptungen. V → R≥0 ,
N:
Darum setzen wir von nun an w  = 0 voraus. v → N(v)

Für alle λ, μ ∈ R gilt die Ungleichung: von V in die Menge der nicht negativen reellen Zah-
len eine Norm, wenn die folgenden drei Eigenschaften
0 ≤ (λ v + μ w) · (λ v + μ w) . erfüllt sind:
(N1) N(v) = 0 ⇔ v = 0,
Wir wählen nun λ = w · w (> 0) und μ = −v · w und (N2) N(λ v) = |λ| N(v) für alle λ ∈ K.
erhalten so: (N3) N(v + w) ≤ N(v) + N(w) für alle v, w ∈ V
(Dreiecksungleichung).
0 ≤ (λ v + μ w) · (λ v + μ w) Einen K-Vektorraum V mit einer Norm N nennt man
= λ λ (v · v) + λ μ (v · w) + μ λ (w · v) + μ μ (w · w) auch normierten Raum.
= λ (λ (v · v) + μ (v · w) + μ (w · v) + μ μ)
= λ ((w · w) (v · v) − μ μ − μ μ + μ μ) Beispiel Wir betrachten die folgenden Abbildungen N1 ,
N2 und N∞ von V = Kn in R≥0 , die gegeben sind durch
= λ (w2 v2 − (v · w) (v · w)) .
n
N1 ((vi )i ) = |vi | ,
Wir können die positive Zahl λ in dieser Ungleichung kürzen i=1
und erhalten 1
n
(v · w)2 ≤ w2 v2 . N2 ((vi )i ) = |vi |2 ,
i=1
Da die Wurzelfunktion monoton wächst, folgt die Cauchy- N∞ ((vi )i ) = max{|vi | | i = 1, . . . , n} .
Schwarz’sche Ungleichung
Die Behauptung ist, dass die Abbildungen N1 , N2 , N∞ :
|v · w| ≤ v w . V → R≥0 Normen sind.
(N1) und (N2) sind offenbar für jede der Abbildungen
Weiterhin folgt aus der Gleichheit
N1 , N2 , N∞ erfüllt.
|v · w| = v w (N3) besagt für

mit obiger Wahl für λ und μ sogleich N1 : Für alle v = (vi ), w = (wi ) ∈ Kn gilt:

!
n !
n !
n
(λ v + μ w) · (λ v + μ w) = 0 , |vi + wi | ≤ |vi | + |wi | ,
i=1 i=1 i=1
wegen der positiven Definitheit des Skalarprodukts also
λ v + μ w = 0. Weil λ  = 0 gilt, bedeutet dies, dass v und w was bekanntlich nach der Dreiecksungleichung in K er-
linear abhängig sind. füllt ist.
664 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Beispiel: Einheitskreise bezüglich verschiedener euklidischer Skalarprodukte im R2



Unter der Größe v = v · v verstehen wir die Norm des Vektors v bezüglich des euklidischen Skalarprodukts ·. Wir wollen
die Menge all jener Vektoren des R2 bestimmen, welche die Norm 1 haben, also die Menge E = {v ∈ R2 | v = 1}. Diese
Menge nennt man auch den Einheitskreis des R2 bezüglich des euklidischen Skalarprodukts ·, die Form des Kreises hängt
natürlich sehr vom Skalarprodukt ab.
Wir bestimmen diese Menge bezüglich der drei verschiedenen euklidischen Skalarprodukte
' ( ' ( ' (
1 0 2 1 4 0
v · w = v 0 A w mit (1) A = , (2) A = , (3) A = .
0 1 1 1 0 1

Problemanalyse und Strategie: Die Vektoren v ∈ R2 der Länge 1 lassen sich wegen

v·v =1 ⇔ v·v =1
durch die Gleichung v · v = 1 beschreiben. Die Lösungsmenge dieser Gleichung sind die gesuchten Vektoren, sie lässt
sich grafisch darstellen.

Lösung:
(1) Im Fall A = E2 ist das gegebene euklidische Skalar-
' ( das kanonische Skalarprodukt. Der Vektor v =
produkt
(0, 1)
v1
∈ R2 hat die Länge
v2

v = v12 + v22 .

' (besteht also in dieser Situation aus den


Der Einheitskreis
v
Punkten v = 1 mit
v2

v12 + v22 = 1 . (0, −1)

Die Punkte v, deren Komponenten diese Gleichung erfül-


len, bilden im R2 den Kreis um den Ursprung mit Radius 1.
' ( ' (
4 0 x1
(3) Im Fall A = hat der Vektor v = ∈ R2
0 1 x2
(0, 1)
die Länge 
v = 4 v12 + v22 .
' (besteht also in dieser Situation aus den
Der Einheitskreis
v
Punkten v = 1 mit
(1, 0) v2

4 v12 + v22 = 1 .

Die Punkte v, deren Komponenten diese Gleichung erfül-


len, bilden im R2 die folgende Menge:
' ( ' (
2 1 v
(2) Im Fall A = hat der Vektor v = 1 ∈ R2
1 1 v2
(0, 1)
die Norm

v = 2 v12 + 2 v1 v2 + v22 .

' (besteht also in dieser Situation aus den


Der Einheitskreis
v
Punkten v = 1 mit
v2 ( 21 , 0)

v12 + (v1 + v2 )2 = 1 .
Die Punkte v, deren Komponenten diese Gleichung erfül-
len, bilden im R2 die folgende Menge:
17.2 Norm, Abstand, Winkel, Orthogonalität 665

N2 : Für alle v = (vi ), w = (wi ) ∈ Kn gilt: Euklidische Vektorräume sind normiert


G G G Ist V ein euklidischer Vektorraum, so ist die Abbildung
H n H n H n
H! H! H! 
I |vi + wi |2 ≤ I |vi |2 + I |wi |2 . V → R≥0 ,
i=1 i=1 i=1  · : √
v → v · v

Diese Ungleichung heißt Minkowski-Ungleichung, die eine Norm auf V . Man nennt  ·  die von · auf V indu-
Gültigkeit dieser Ungleichung nachzuweisen haben wir zierte Norm.
als Übungsaufgabe 17.16 gestellt.
N∞ : Für alle v = (vi ), w = (wi ) ∈ Kn gilt:
Beweis: Wegen v = 0 ⇔ v = 0 und λ v = |λ| v
max {|vi + wi |} ≤ max {|vi |} + max {|wi |} , für alle λ ∈ R und v ∈ V ist nur die Dreiecksungleichung
i=1, ..., n i=1, ..., n i=1, ..., n zu begründen. Es seien dazu v, w ∈ V . Dann gilt wegen der
Cauchy-Schwarz’schen Ungleichung:
was offensichtlich korrekt ist.
v + w2 = (v + w) · (v + w)
In Abbildung 17.4 zeigen wir für den Fall K = R und n = 2 = v2 + w2 + 2 v · w
die Menge aller Vektoren, deren Norm 1 ist.
≤ v2 + w2 + 2 |v · w|
≤ v2 + w2 + 2 v w
1 1 1
= (v + w)2 .
Da die Wurzelfunktion auf R≥0 monoton wachsend ist, folgt
−1 1 −1 1 −1 1 v + w ≤ v + w. 

−1 −1 −1 Jedes Skalarprodukt definiert somit eine Norm eines reellen


N1 N2 N∞ Vektorraums. Aber es gibt auch Normen auf reellen Vektor-
räumen, die von keinem Skalarprodukt herrühren, beachte
Abbildung 17.4 Die Einheitskreise im R2 bezüglich der Normen N1 , N2 , N∞ .
das folgende Beispiel. Der Themenkreis der normierten Vek-
torräume wird übrigens im Kapitel 19 behandelt.
Man nennt
Beispiel Wir begründen, dass die Maximumsnorm N∞
N1 auch 1-Norm, auf dem R2 durch kein Skalarprodukt induziert wird. Dazu
N2 auch euklidische Norm, benutzen wir die folgende Tatsache:
N∞ auch Maximumsnorm
Ist · ein Skalarprodukt auf R2 , so hat der Einheitskreis
auf dem Kn .  E = {v ∈ R2 | v = 1} bezüglich der von · auf R2 indu-
zierten Norm  ·  mit jeder Geraden a + b R mit a, b ∈ R2
höchstens zwei Schnittpunkte.
Wir wollen nun zeigen, dass jeder Vektorraum V mit einem
euklidischen Skalarprodukt · insbesondere ein normierter Denn: Ein Element v = a + b λ der Geraden a + b R ist
Raum ist. Dazu zeigen wir, dass die Abbildung genau dann ein Element des Einheitskreises, wenn gilt:

 1 = v = a + b λ = a + b λ2 + 2 (a · b) λ .


V → R≥0 ,
 · : √ Und diese quadratische Gleichung in der Unbestimmten λ
v → v · v , über R hat höchstens zwei Lösungen.
Da bei der Maximumsnorm N∞ die Gerade e2 + R e1 aber
die jedem Vektor seine Länge zuordnet, eine Norm in dem
unendlich viele Schnittpunkte mit dem Einheitskreis E be-
eben geschilderten Sinne ist. Daher rührt auch der Begriff der
züglich N∞ hat (Abb. 17.4), kann diese somit von keinem
Norm eines Vektors, wie wir ihn gebrauchen.
Skalarprodukt induziert sein. 
Wenn wir beweisen wollen, dass tatsächlich unser Längen-
begriff eine Norm ist, müssen wir also die drei definierenden Kommentar: Die Normen eines Vektorraums V , die von
Eigenschaften (N1), (N2) und (N3) einer Norm für die Ab- Skalarprodukten induziert werden, lassen sich kennzeichnen.
bildung  ·  nachweisen. Die ersten beiden Eigenschaften Es sind dies genau jene Normen, die der Parallelogramm-
(N1) und (N2) sind unmittelbar einsichtig, die dritte Eigen- identität
schaft (N3) aber, also die Dreiecksungleichung, verlangt et-
v + w2 + v − w2 = 2 v2 + 2 w2 für alle v, w ∈ V
was Aufwand, wir benutzen dazu die Cauchy-Schwarz’sche
Ungleichung. genügen. Wir zeigen das in Kapitel 19.
666 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Je zwei Vektoren haben einen Abstand w

Mit dem Begriff der Norm können wir Abstände zwischen


Vektoren bestimmen.
Sind v und w zwei Vektoren eines euklidischen Vektorraums α v
V , so nennen wir die reelle Zahl
2π − α
d(v, w) = v − w = w − v

den Abstand oder die Distanz von v und w. Abbildung 17.5 Zwischen zwei Vektoren existieren zwei Winkel.

Im R2 oder R3 mit dem kanonischen Skalarprodukt entspricht Für den kleineren Winkel α zwischen den beiden Vektoren v
dies genau dem anschaulichen Abstand zweier Punkte von- und w haben wir auf Seite 235 die Formel
einander. v·w
α = arccos
Wir ermitteln einige Abstände zwischen Vektoren euklidi- v w
scher Vektorräume. hergeleitet.
Nun gehen wir umgekehrt vor: Wir nutzen die Cauchy-
Beispiel
Schwarz’sche Ungleichung aus, um Winkel zwischen Vek-
Im euklidischen R2 mit dem kanonischen Skalarprodukt
toren eines allgemeinen euklidischen Vektorraums, die nicht
ist der Abstand von e1 zu e2
der Nullvektor sind, zu definieren. Dabei gehen wir so vor,
K' (K 
K 1 K √ dass diese Definition sich mit der intuitiven Begriffsbildung
e1 − e2  = K K
K −1 K = 1 + (−1) = 2 .
2 2
im Anschauungsraum aus dem Kapitel 7 deckt.
Dazu schreiben wir die Cauchy-Schwarz’sche Ungleichung
' ( das durch v · w =
Aber bezüglich des Skalarprodukts,
für zwei vom Nullvektor verschiedene Vektoren v, w eines
2 1
v 0 Aw mit der Matrix A = definiert ist, erhalten euklidischen Vektorraums mit dem euklidischen Skalarpro-
1 1
dukt · um:
wir v·w
−1 ≤ ≤ 1.
K' (K 1 ' ( v w
K 1 K 1
K
e1 − e2  = K K = (1, −1) A Zu jeder reellen Zahl zwischen −1 und 1 gibt es genau ein
−1 K −1
1 α ∈ [0, π ] mit
' ( v·w
1 cos α =
= (1, 0) = 1. v w
−1
(Abb. 17.6).
Die Polynomfunktion p : R → R, p(x) = x hat von der
cos α
Sinusfunktion sin : R → R bezüglich des euklidischen
1
Skalarprodukts
J π
-f, g. = f (t) g(t) dt π π α
−π 2

den Abstand −1
1J
π Abbildung 17.6 Der Kosinus bildet das Intervall [0, π ] bijektiv auf das Intervall
p − sin  = t 2 − 2 t sin t + sin2 (t) dt [−1, 1] ab.
−π
.
2 3
= π +π.  Der Winkel zwischen Vektoren
3
Sind v und w zwei vom Nullvektor verschiedene Vek-
toren eines euklidischen Vektorraums V mit dem eukli-
Winkel zwischen Vektoren eines euklidischen dischen Skalarprodukt ·, so nennt man das eindeutig be-
Vektorraums werden mithilfe des Skalar- stimmte α ∈ [0, π] mit
produkts erklärt v·w
cos α =
v w
In der Anschauungsebene R2 haben wir Winkel zwischen
Vektoren durch das kanonische Skalarprodukt ausgedrückt. den Winkel zwischen v und w und schreibt hierfür auch
Zwischen zwei vom Nullvektor verschiedenen Vektoren v
α =  (v, w) .
und w existieren stets zwei Winkel.
17.2 Norm, Abstand, Winkel, Orthogonalität 667

Um je zwei solchen Vektoren genau einen Winkel zuord- Beispiel


0
nen zu können, haben wir die Definitionsmenge auf das ab- ' ( das durch v · w = v A w
Bezüglich des Skalarprodukts,
geschlossene Intervall [0, π ] eingeschränkt. Dadurch ent- 2 1
mit der Matrix A = definiert ist, gilt:
spricht unsere Definition in der Anschauungsebene mit dem 1 1
kanonischen Skalarprodukt der Wahl des kleineren Winkels ' ( ' (
zwischen zwei Vektoren (Abb. 17.7). −1 0
⊥ ,
w
1 1

da ' (' (
2 1 0
(−1, 1) =0
1 1 1
α (Abb. 17.8).
v
x2
Abbildung 17.7 Die Einschränkung auf [0, π] entspricht der Wahl des kleine- ' (
−1 ' (
ren Winkels α der beiden Winkel zwischen zwei Vektoren. 0
1 1
Beispiel
Im euklidischen R2 mit dem kanonischen Skalarprodukt
schließen die beiden Vektoren e1 und e1 + e2 den Winkel
1
 (e1 , e1 + e2 ) = arccos √ = π/4 x1
2
ein. Abbildung 17.8 Bezüglich des durch die Matrix A definierten Skalarprodukts
In dem euklidischen Vektorraum aller auf dem abge- stehen die beiden Vektoren senkrecht aufeinander, wenngleich die Anschauung
anderes vermittelt.
schlossenen Intervall [0, 1] stetigen reellen Funktionen
mit dem euklidischen Skalarprodukt In dem euklidischen Vektorraum aller auf dem abge-
J 1
schlossenen Intervall [0, 1] stetigen reellen Funktionen
-f, g. = f (t) g(t) dt
0 mit dem euklidischen Skalarprodukt
schließen die Polynomfunktion p mit p(x) = x und J 1
1
die Funktion exp wegen -p, exp. = 0 t exp t dt = 1, -f, g. = f (t) g(t) dt
% √ 0
 exp  = √1 e2 − 1 und p = 1/ 3 den Winkel
2
steht die Polynomfunktion q mit q(x) = 2 − 3 x auf dem
1
 (p, exp) = arccos % = 1.409 . . . Polynom p mit p(x) = x senkrecht, da
6 (e2 − 1) J 1
ein. 
-2 − 3 x, x. = 2t − 3t 2 dt = 0 .
0

Zwei Vektoren sind orthogonal zueinander, Die sogenannten Legendre’schen Polynome p n mit
wenn ihr Skalarprodukt null ergibt 1 dn 2
pn (x) = (x − 1)n
2n n! dx n
In Abschnitt 7.2 haben wir gezeigt, dass zwei Vektoren v
und w des R3 genau dann orthogonal zueinander sind, wenn sind auf ganz R für n = 0, 1, . . . Lösungen der Le-
ihr kanonisches Skalarprodukt v 0 w = 0 ist. Wir haben dabei gendre’schen Differenzialgleichung
mit der Anschauung argumentiert. Nun abstrahieren wir dies,
(1 − x 2 ) y  − 2 x y  + n (n + 1) y = 0 .
indem wir das Senkrechtstehen für Vektoren eines euklidi-
schen Raums, also für beliebige euklidische Skalarprodukte, Die ersten Legendrepolynome lauten
definieren.
p 0 (x) = 1,
Orthogonalität von Vektoren p1 (x) = x ,
Sind v und w Elemente eines euklidischen Vektorraums 1 3
V mit dem euklidischen Skalarprodukt ·, so sagt man, v p2 (x) = − + x 2 ,
2 2
ist orthogonal zu w oder steht senkrecht auf w, wenn 3 5
p3 (x) = − + x 3 .
v·w =0 2 2
gilt. Für diesen Sachverhalt schreibt man auch Wir zeigen nun, dass die Legendrepolynome bezüglich
v ⊥ w. des Skalarprodukts
Sind v und w vom Nullvektor verschieden, so gilt: J 1
v ⊥ w ⇔  (v, w) = π/2 . -p, q. = p(t) q(t) dt
−1
668 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

orthogonal zueinander sind. Dazu notieren wir die Le- Die Anschauung vermittelt, dass Vektoren, die orthogonal
gendre’sche Differenzialgleichung etwas anders: zueinander sind, linear unabhängig sind. Dies ist tatsäch-
lich für jedes beliebige Skalarprodukt der Fall. Sind nämlich
d d
D y = n (n + 1) y mit D = − (1 − x 2 ) . v 1 , . . . , v r vom Nullvektor verschiedene Vektoren eines eu-
dx dx klidischen Vektorraums V orthogonal zueinander, gilt also
Man beachte:
' ( v i · v j = 0 für i = j ,
d d
D y = − (1 − x 2 ) y
dx dx
d so folgt für λ1 , . . . , λr ∈ R mit
= − (y  − x 2 y  ) = −y  + 2 x y  + x 2 y  ,
dx
λ 1 v 1 + · · · + λr v r = 0
d. h., dass also tatsächlich D y = n (n + 1) y nur eine
andere Schreibweise für die Legendre’sche Differenzial-
gleichung ist. durch Skalarproduktbildung beider Seiten von rechts nach-
einander mit v 1 , . . . , v r und der Linearität im ersten Argu-
Kommentar: Tatsächlich ist D nichts anderes als ein ment:
Endomorphismus des Vektorraums aller Polynomfunk-
tionen. Man nennt einen solchen Endomorphismus eines λ1 = λ1 (v 1 · v 1 ) + · · · + λr (v r · v 1 ) = 0 · v = 0,
Funktionenraums auch linearen Operator und benutzt λ2 = λ1 (v 1 · v 2 ) + · · · + λr (v r · v 2 ) = 0 · v = 0,
die angegebene Schreibweise D y anstelle von D(y).
..
.
In der Form D y = n (n+1)y lässt sich die Legendre’sche
λr = λ1 (v 1 · v r ) + · · · + λr (v r · v r ) = 0 · v = 0 .
Differenzialgleichung auch als Eigenwertgleichung inter-
pretieren: Die Lösung y ist ein Eigenvektor zum Eigenwert
n (n + 1) der (linearen) Abbildung D. Damit gilt λ1 = · · · = λr = 0, d. h., v 1 , . . . , v r sind linear
Nun folgt mit partieller Integration für m, n ∈ N0 : unabhängig.
J 1
-p n , D p m . = pn (t) D pm (t) dt Orthogonale Vektoren sind linear unabhängig
−1
= −(1 − t 2
) (pn (t) pm (t) − p n (t) pm (t))|1−1 Jede Menge von Vektoren = 0 eines euklidischen Vek-
J 1 torraums, die paarweise orthogonal zueinander sind, ist
+ D p n (t) p m (t) dt linear unabhängig.
−1
= -D pn , pm . ,
Eine naheliegende Fragestellung ist nun folgende: Gibt es
also schließlich: in euklidischen Vektorräumen stets Orthonormalbasen? Der
folgende Abschnitt behandelt diese Frage.
-pn , D pm . = m (m + 1) -pn , pm .
-D p n , pm . = n (n + 1) -pn , pm . .

Für m = n gilt also -pn , pm . = 0. Und für m = n erhalten


wir: 17.3 Orthonormalbasen und
J 1' (2
-pn , pn . =
1 dn 2
(x − 1) n
dx =
2
.
orthogonale Komplemente
n
−1 2 n! dx
n 2n+1
Also stehen je zwei verschiedene Legendrepolynome Wir zeigen, dass in endlichdimensionalen euklidischen Vek-
senkrecht aufeinander,
 und das n-te Legendrepolynom hat torräumen stets Orthonormalbasen existieren.
2
die Norm 2 n+1 . 

? Eine Orthonormalbasis ist eine Basis, deren


Warum gelten die folgenden, mit der Anschauung verträgli-
chen Merkregeln ? Elemente die Länge 1 haben und die
paarweise orthogonal zueinander stehen
Ist v orthogonal zu w, so ist w orthogonal zu v.
Der Nullvektor ist zu jedem Vektor v orthogonal.
Vom Nullvektor abgesehen ist kein Vektor zu sich selbst Neben dem Begriff der Orthonormalbasis werden wir auch
orthogonal. immer wieder den Begriff eines Orthonormalsystems brau-
chen.
17.3 Orthonormalbasen und orthogonale Komplemente 669

Orthogonal- und Orthonormalbasis Beispiel


Eine Menge B von Vektoren eines euklidischen Vektor- Es ist ⎧⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
raums V heißt Orthogonalsystem, wenn je zwei ver- ⎨ 2 1 2 ⎬
⎝−1⎠ , ⎝2⎠ , ⎝ −1 ⎠
schiedene Elemente von B orthogonal zueinander sind: ⎩ ⎭
2 0 −5/2
Aus b, b ∈ B und b  = b folgt b ⊥ b .
eine Orthogonalbasis des R3 mit dem kanonischen Ska-
Ein Orthogonalsystem B heißt Orthonormalsystem, larprodukt, aber keine Orthonormalbasis. Hingegen ist die
wenn jeder Vektor aus B zusätzlich normiert ist, also Menge, die diese Vektoren in ihrer normierten Form ent-
die Länge 1 hat: hält, also
√ ⎧ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎫
Für jedes b ∈ B gilt b · b = 1 . ⎨1 2 1 2 ⎬
⎝−1⎠ , √1 ⎝2⎠ , √
2 ⎝
−1 ⎠ ,
⎩3 5 0 3 5 −5/2 ⎭
Ein Orthogonalsystem bzw. Orthonormalsystem B heißt 2
Orthogonalbasis bzw. Orthonormalbasis, wenn B zu-
sätzlich eine Basis ist. eine Orthonormalbasis des R3 mit dem kanonischen Ska-
larprodukt.
In dem euklidischen Vektorraum V aller auf [−π, π] ste-
Mithilfe des Kroneckersymbols
tigen reellwertigen Funktionen mit dem euklidischen Ska-
 larprodukt
1 , falls i = j ,
δij = J
0 , sonst 1 π
-f, g. = f (t) g(t) dt
π −π
können wir kurz schreiben: Eine Menge B von Vektoren eines
euklidischen Vektorraums V ist genau dann ein Orthonormal- : ;
für f, g ∈ V ist die Menge B = √1 , cos, sin ein
system, falls 2
Orthonormalsystem.
bi · bj = δij für alle bi , bj ∈ B . Dazu muss man nur nachweisen, dass die Länge der drei
erzeugenden Elemente jeweils 1 ist und je zwei verschie-
Man kann jeden vom Nullvektor verschiedenen Vektor v dene Elemente aus B orthogonal zueinander sind:
eines euklidischen Vektorraums V normieren, d. h., man < = J K K
1 1 1 π 1 1 K 1 K
verkürzt bzw. verlängert den Vektor v auf die Länge 1: √ ,√ = √ √ dt = 1, d. h., K √ K K =1 ,
2 2 π −π 2 2 2K
J π
1 1
v −→ v. -cos, cos. = cos t cos t dt = 1, d. h., cos = 1 ,
v π −π
J
1 π
-sin, sin. = sin t sin t dt = 1, d. h., sin = 1
π −π
v
und
< = J
v 1 1 π 1 1
v  √ , sin = √ sin t dt = 0, d. h., √ ⊥ sin ,
2 π −π 2 2
< = J
1 1 π 1 1
1 √ , cos = √ cos t dt = 0, d. h., √ ⊥ cos ,
2 π −π 2 2
J
1 π
-sin, cos. = sin t cos t dt = 0, d. h., sin ⊥ cos .
π −π

Abbildung 17.9 Normieren eines Vektors; seine Richtung bleibt dabei gleich. Etwas allgemeiner kann man zeigen, dass die Menge B
der Funktionen
Wegen
K K 1
K 1 K 1 √ , cos(n t), sin(n t) , n ∈ N
K K
K v v K = v v = 1 2

hat der normierte Vektor die Norm 1. bezüglich dieses Skalarprodukts ein Orthonormalsystem
bildet.
Damit kann man also aus einer Orthogonalbasis eines eukli- Wie weit diese Menge B davon entfernt ist, eine Ortho-
dischen Vektorraums auf einfache Weise eine Orthonormal- normalbasis von V zu sein, ist Thema der Fouriertheorie
basis konstruieren. (siehe Kapitel 19). 
670 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Jeder endlichdimensionale euklidische Damit erhalten wir den Koordinatenvektor von v bezüg-
Vektorraum besitzt eine Orthonormalbasis lich B: ' (
1 5
Bv = √ . 
Die Orthogonalität von Vektoren erleichtert vieles. Orthogo- 2 1
nale Vektoren sind linear unabhängig, und auch die Darstel-
lung von Vektoren bezüglich Orthonormalbasen ist leicht. Jeder Vektorraum besitzt eine Basis. Dieses tief liegende und
wichtige Ergebnis haben wir auf Seite 207 aufgeführt. Eu-
Koordinatenvektoren bezüglich Orthonormalbasen klidische Vektorräume sind spezielle Vektorräume. Nur in
solchen Vektorräumen hat es einen Sinn, von Orthogonali-
Ist B eine Orthonormalbasis eines euklidischen Vektor-
tät oder spezieller von Orthonormalbasen zu sprechen. Es
raums V mit dem euklidischen Skalarprodukt ·, so gilt
ist naheliegend zu hinterfragen, ob jeder euklidische Vektor-
für jeden Vektor v ∈ V :
raum eine Orthonormalbasis besitzt. Hierbei bezieht sich die
v = λ1 b1 + · · · + λr br Orthogonalität und das Normiertsein natürlich auf das eukli-
dische Skalarprodukt des betrachteten euklidischen Vektor-
mit Vektoren b1 , . . . , br ∈ B und λi = v · bi ∈ R für raums V .
i = 1, . . . , r.
Tatsächlich besitzt nicht jeder euklidische Vektorraum eine
Orthonormalbasis. Aber viele wichtige euklidische Vektor-
Beweis: Dass eine Darstellung der Art v = λ1 b1 + · · · + räume haben eine solche Basis.
λr br mit b1 , . . . , br ∈ B und λ1 , . . . , λr ∈ R existiert,
Mit dem Gram-Schmidt’schen Orthonormalisierungsverfah-
folgt aus der Tatsache, dass B eine Basis ist. Die Koeffizien-
ren kann man aus einer gegebenen Basis eines endlichdimen-
ten λ1 , . . . , λr sind dadurch auch eindeutig festgelegt. Und
sionalen euklidischen Vektorraums eine Orthonormalbasis
weiter gilt für alle i = 1, . . . , r:
konstruieren.
v · bi = (λ1 b1 + · · · + λr br ) · bi
Die Geometrie des Verfahrens von Gram und Schmidt haben
= λ1 (b1 · bi ) + · · · + λr (br · bi ) wir für zwei Vektoren in der Abbildung 17.10 dargestellt. Im
= λi (bi · bi ) = λi .  Folgenden erläutern wir das Verfahren allgemein.

Das Orthonormalisierungsverfahren von Gram und


Achtung: Dies gilt nur für Orthonormalbasen. Bei Or-
Schmidt
thogonalbasen erhält man λi durch zusätzliches Normieren,
d. h., Ist {a 1 , . . . , a n } eine Menge von linear unabhängigen
1 Vektoren eines euklidischen Vektorraums V mit dem eu-
λi = v · bi .
bi 2 klidischen Skalarprodukt ·, so bilde man die Vektoren
b1 , . . . , bn mit
Dies liefert uns eine Methode, mit der wir sehr einfach den
Koordinatenvektor eines Vektors bezüglich einer Orthonor- b1 = a 1 −1 a 1 , bk+1 = ck+1 −1 ck+1 ,
malbasis bestimmen können.
wobei

' (( Orthonormalbasis B = !
Beispiel Bezüglich der geordneten k
' ' (
1 1 1 1 ck+1 = a k+1 − (bi · a k+1 ) bi
b1 = √ , b2 = √ des R2 mit dem ka-
2 1 2 −1 i=1

' ( Skalarprodukt · erhält man als Darstellung für


nonischen für k = 1, . . . , n − 1.
3
v= bezüglich B: Es ist dann {b1 , . . . , bn } ein Orthonormalsystem von V ,
2
v = (v · b1 ) b1 + (v · b2 ) b2 und es gilt:
5 1 -a 1 , . . . , a n . = -b1 , . . . , bn . .
= √ b1 + √ b2 .
2 2

a2 a2 c2 a2
a1 (a 2 · b1 )b1 b2

b1 b1 b1

Abbildung 17.10 Mit dem Verfahren von Gram und Schmidt entsteht aus der Basis {a 1 , a 2 } die Orthonormalbasis {b1 , b2 }.
17.3 Orthonormalbasen und orthogonale Komplemente 671

Beweis: Wir zeigen die Behauptung, indem wir per In- a 1 , . . . , a n linear unabhängig sind. Da stellt sich die Frage,
duktion nach k beweisen: ob es nun wirklich nötig ist, dass man erst die lineare Un-
abhängigkeit der gegebenen Vektoren nachprüfen muss. Tat-
{b1 , . . . , bk } ist ein Orthonormalsystem,
sächlich ist das nicht der Fall. Sind nämlich die Vektoren
-a 1 , . . . , a k . = -b1 , . . . , bk ..
a 1 , . . . , a n linear abhängig, etwa a k+1 ∈ -a 1 , . . . , a k ., so
Induktionsanfang: Offenbar gelten die Behauptungen im Fall entsteht beim Orthonormierungsverfahren als ck+1 der Null-
k = 1. vektor (dieser steht nämlich auf allen vorher konstruierten
Vektoren des Orthonormalsystems senkrecht). Man variiert
Induktionsvoraussetzung: Die Behauptungen gelten für ein
das Verfahren dann einfach dadurch, dass man diesen Vektor
k ∈ {1, . . . , n}.
im Orthonormalsystem weglässt.
Induktionsschritt: Es sei k ≥ 1. Wir betrachten das Element
ck+1 = a k+1 − ki=1 (bi · a k+1 ) bi . Wegen der Bilinearität Eine unmittelbare Folgerung aus dem Verfahren von Gram
von · gilt für alle l < k + 1 nach Induktionsvoraussetzung: und Schmidt und der Tatsache, dass jeder Vektorraum eine
Basis besitzt, ist das folgende Ergebnis.
!
k
bl · ck+1 = bl · a k+1 − (bi · a k+1 ) (bl · bi )

i=1 Existenz von Orthonormalbasen
=δli
Jeder höchstens abzählbardimensionale euklidische
= bl · a k+1 − bl · a k+1 = 0 .
Vektorraum besitzt eine Orthonormalbasis.
Somit gilt ck+1 ⊥ bl , wobei wir noch nicht wissen, ob ck+1
der Nullvektor ist. Wegen Wir wenden nun die erzielten Ergebnisse an, um minimale
Abstände von Vektoren zu Untervektorräumen zu erklären.
!
k Dazu führen wir zuerst den Begriff des orthogonalen Kom-
a k+1 = ck+1 + (bi · a k+1 ) bi plements eines Untervektorraums ein.
i=1

folgt erneut mit der Induktionsvoraussetzung


Das orthogonale Komplement eines
-b1 , . . . , bk , ck+1 . = -b1 , . . . , bk , a k+1 . Untervektorraums eines euklidischen
= -a 1 , . . . , a k , a k+1 . . Raums ist ein Untervektorraum

Aus dieser Gleichheit können wir aufgrund der linearen Un- Gegeben ist ein euklidischer Vektorraum V . Das Skalarpro-
abhängigkeit von a 1 , . . . , a n schließen, dass ck+1  = 0 gilt. dukt bezeichnen wir wieder mit einem Punkt · .
Mit bk+1 = ck+1 −1 ck+1 erhalten wir nun die Behauptun-
Für den Sachverhalt, dass das Skalarprodukt zweier Vektoren
gen. 
v, w ∈ V null ist, v·w = 0, haben wir auch „v steht senkrecht
auf w“ gesagt und mit v ⊥ w abgekürzt. Sind A und B
Explizit lauten die Formeln für die ersten drei Vektoren Teilmengen von V , so ist die Schreibweise A ⊥ B üblich für
b1 , b2 , b3 der so konstruierten Orthonormalbasis: die Tatsache, dass jedes a ∈ A auf jedem b ∈ B senkrecht
steht:
b1 = a 1 −1 a 1 ,
A ⊥ B ⇔ a ⊥ b ∀a ∈ A, b ∈ B .
b2 = c2 −1 c2 mit c2 = a 2 − (a 2 · b1 ) b1 ,
b3 = c3 −1 c3 mit c3 = a 3 − (a 3 · b1 ) b1 − (a 3 · b2 ) b2 . Ist A eine einelementige Menge A = {a}, so schreibt man

Als Beispiel bilden wir das Skalarprodukt von c3 mit b2 : a ⊥ B anstelle von {a} ⊥ B .

c3 · b2 = (a 3 − (a 3 · b1 ) b1 − (a 3 · b2 ) b2 ) · b2 Ähnlich zur Komplementbildung Ac = V \ A können wir


nun zu einer Teilmenge A ⊆ V die Menge A⊥ aller Vektoren
= a 3 · b2 − (a 3 · b1 ) (b1 · b2 ) − (a 3 · b2 ) (b2 · b2 ) aus V bilden, die zu allen Vektoren aus A senkrecht stehen.
= 0. Tatsächlich sind aber meist nicht beliebige Teilmengen A
von V , sondern vielmehr Untervektorräume U von V von
Auf Seite 672 zeigen wir dieses Orthonormalisierungsver- Interesse.
fahren an einem Beispiel, und auf Seite 673 schildern wir Ist U ein Untervektorraum von V , so setzen wir
eine Anwendung des Verfahrens von Gram und Schmidt –
die QR-Zerlegung einer invertierbaren Matrix A. Diese QR- U ⊥ = {v ∈ V | v ⊥ u für alle u ∈ U } .
Zerlegung spielt in mehreren Verfahren der numerischen Ma-
Es besteht U ⊥ also aus all jenen Vektoren, die auf allen Vek-
thematik eine wichtige Rolle.
toren aus U senkrecht stehen. Wir werden U ⊥ das orthogo-
nale Komplement von U in V nennen. Diese Bezeichnung
Kommentar: Bei der obigen Darstellung des Orthonor- legt schon mehrere Vermutungen nahe, im Einzelnen sind
malisierungsverfahrens ist vorausgesetzt, dass die Vektoren dies:
672 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Beispiel: Orthonormalisierung einer Basis nach dem Verfahren von Gram und Schmidt
Wir bestimmen eine Orthonormalbasis bezüglich des Standardskalarprodukts von
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
? 3 −1 −1 @
⎜−1⎟ ⎜ 3 ⎟ ⎜−1⎟
U= ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝−1⎠ , ⎝−1⎠ , ⎝ 3 ⎠ ⊆ R .
4

−1 −1 −1

Problemanalyse und Strategie: Wir nennen die Vektoren der Reihe nach a 1 , a 2 , a 3 und wenden die Formeln an.

Lösung: ⎛ ⎞ Um b3 zu erhalten, berechnen wir c3 : ⎛ ⎞


3 −1
⎜−1⎟ ⎜−1⎟
Wir erhalten: b1 = a 1 −1 a 1 = 1
√ ⎜ ⎟. Um b2 zu
⎝−1⎠ c3 = a 3 − (a 3 · b1 ) b1 − (a 3 · b2 ) b2 = ⎜
⎝3⎠

2 3
−1 −1
erhalten, berechnen wir c2 : ⎛ ⎛ ⎞⎞ ⎛ ⎞
−1 3
⎛ ⎞ ⎜ 1 ⎜−1⎟⎟ 1 ⎜−1⎟
−1 −⎜ ⎜ ⎟⎟
⎝ 2 √3 (3, −1, −1, −1) ⎝ 3 ⎠⎠ 2 √3 ⎝−1⎠
⎜ ⎟
⎜3⎟
c2 = a 2 − (a 2 · b1 ) b1 = ⎜
⎝−1⎠
⎟ −1 −1
⎛ ⎛ ⎞⎞ ⎛ ⎞
−1 −1 0
⎛ ⎛ ⎞⎞ ⎛ ⎞ ⎜ 1 ⎜−1⎟⎟ 1 ⎜ 2 ⎟
−1 3 −⎜ ⎜ ⎟⎟
⎝ √6 (0, 2, −1, −1) ⎝ 3 ⎠⎠ √6 ⎝−1⎠
⎜ ⎟
⎜ 1 ⎜ 3 ⎟⎟ 1 ⎜−1⎟

− ⎝ √ (3, −1, −1, −1) ⎝ ⎠⎠ √ ⎝ ⎟
⎜ ⎟⎟ ⎜ −1 −1
2 3 −1 2 3 −1⎠ ⎛ ⎞
−1 −1 0
⎛ ⎞ ⎜0⎟
0 =2⎜ ⎟
⎝ 1 ⎠.
4 ⎜ 2⎟
= ⎜ ⎟ −1 ⎛ ⎞
3 ⎝−1⎠ 0
−1 ⎜ 0⎟
⎛ ⎞ Damit erhalten wir b3 = c3 −1 c3 = √1 ⎜ ⎟.
0 2 ⎝ 1 ⎠
⎜ 2⎟ −1
Damit erhalten wir b2 = c2 −1 c2 = √1 ⎜ ⎟.
6 ⎝−1⎠ Es ist also B = {b1 , b2 , b3 } eine Orthonormalbasis
−1 von U .

U ⊥ ist ein Untervektorraum von V . und


U ⊥ U ⊥.
(λ v 1 ) · u = λ (v 1 · u) = λ 0 = 0 .
V = U ⊕ U ⊥ unter evtl. weiteren Voraussetzungen.
Genauer gilt: Somit ist U ⊥ ein Untervektorraum von V (man beachte die
Definition auf Seite 196).
Das orthogonale Komplement
Es sei U ein Untervektorraum eines euklidischen Vek- (b) Dies gilt nach Definition der Menge U ⊥ .
torraums V . Dann gilt:
(c) Die Dimension von V bzw. U sei n bzw. r. Wir wäh-
(a) Die Menge U ⊥ ist ein Untervektorraum von V . Man
len eine Orthonormalbasis {b1 , . . . , br } von U und ergän-
nennt U ⊥ das orthogonale Komplement von U
zen diese zu einer Orthonormalbasis B = {b1 , . . . , br ,
in V .
br+1 , . . . , bn } von V . Offenbar gilt -br+1 , . . . , bn . ⊆ U ⊥ .
(b) Jeder Vektor v ∈ U ⊥ steht senkrecht auf jedem Vek-
tor u ∈ U , U ⊥ U ⊥ . Ist nun v ein beliebiges Element von V , so gibt es
(c) Ist V endlichdimensional, so ist V die direkte λ1 , . . . , λn ∈ R mit
Summe von U und U ⊥ , V = U ⊕ U ⊥ .
v = λ1 b1 + · · · + λr br + λr+1 br+1 + · · · + λn bn .
Beweis: (a) Die Menge U ⊥ ist nichtleer, da der Nullvektor  
=:u∈U =:u ∈U ⊥
0 in U ⊥ enthalten ist.
Sind v 1 , v 2 ∈ U ⊥ , u ∈ U und λ ∈ R, so gilt Damit haben wir V = U + U ⊥ bewiesen. Wegen U ∩ U ⊥ =
(v 1 + v 2 ) · u = v 1 · u + v 2 · u = 0 + 0 = 0 {0} ist diese Summe direkt, d. h., V = U ⊕ U ⊥ . 
17.3 Orthonormalbasen und orthogonale Komplemente 673

Beispiel: Die Q R-Zerlegung einer invertierbaren Matrix


Wir zeigen, dass jede invertierbare Matrix A = (a 1 , . . . , a n ) ∈ Rn×n ein Produkt einer orthogonalen Matrix Q, d. h.
Q0 Q = En , und einer oberen Dreiecksmatrix R ist:

A = QR.

Problemanalyse und Strategie: Mit dem Orthonormalisierungsverfahren von Gram und Schmidt bilden wir aus den
linear unabhängigen Spalten von A eine Orthonormalbasis B des Rn und bestimmen die Darstellungen der Spalten von
A bezüglich dieser Basis B. Das liefert eine Gleichheit der Form A = Q R mit n × n -Matrizen der gesuchten Form.

Lösung: Orthonormalbasis B stets so wählen, dass die Matrix R


Weil A invertierbar ist, sind die Spalten a 1 , . . . , a n li- positive Diagonaleinträge hat, so erreichen wir eine ein-
near unabhängig. Also bilden die Spalten von A = deutige Zerlegung in der Form A = Q R – man kann
(a 1 , . . . , a n ) ∈ Rn×n eine Basis des Rn . Mit dem Verfah- dann von der Q R-Zerlegung von A sprechen. Den Nach-
ren von Gram und Schmidt können wir aus dieser Basis weis, dass eine solche Zerlegung eindeutig ist, haben wir
eine Orthonormalbasis B = {b1 , . . . , bn } bezüglich des als Übungsaufgabe 17.20 gestellt.
kanonischen Skalarprodukts des euklidischen Rn konstru-
Wir bestimmen beispielhaft die Q R-Zerlegung von
ieren. Es gilt dann:
⎛ ⎞
1 2 4
a 1 ⊥ b2 , . . . , bn ,
A = ⎝0 1 0⎠ = (a 1 , a 2 , a 3 ) ,
a 2 ⊥ b3 , . . . , bn , 1 0 0
..
. deren Spalten offenbar linear unabhängig sind. Mit dem
Verfahren von Gram und Schmidt erhalten wir die Vekto-
a n−1 ⊥ bn .
ren b1 , b2 , b3 einer Orthonormalbasis
Bezüglich der geordneten Orthonormalbasis B = ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 1 2/3
1 ⎝ ⎠ 1 ⎝ ⎠ 3 ⎝
(b1 , . . . , bn ) haben die Vektoren a 1 , . . . , a n die Darstel- b1 = √ 0 , b2 = √ 1 , b3 = √ −4/3⎠ .
lung 2 1 3 −1 2 6 −2/3

a 1 = (a 1 · b1 ) b1 , Damit haben wir bereits eine Matrix Q = (b1 , b2 , b3 )


a 2 = (a 2 · b1 ) b1 + (a 2 · b2 ) b2 , bestimmt. Die Matrix R erhalten wir nun durch das Be-
rechnen von sechs Skalarprodukten:
..
. ⎛√ √ √ ⎞
2 2 2 2
a n = (a n · b1 ) b1 + · · · + (a n · bn ) bn . ⎜ √ 4√ ⎟
R=⎜ ⎝ 0 3 3 3⎟ ⎠
Diese Gleichungen können wir wegen A = (a 1 , . . . , a n ) √
0 0 23 6
in einer Matrizengleichung zusammenfassen:
⎛ ⎞ Da die Diagonaleinträge alle positiv sind, haben wir be-
a 1 · b1 a 2 · b1 · · · a n · b1 reits die gesuchte Zerlegung:
⎜ 0 a 2 · b2 · · · a n · b2 ⎟ ⎛ 1 ⎞ √ √
⎜ ⎟ √1 √1 ⎛ √ ⎞
A = (b1 , . . . , bn ) · ⎜ . .. .. ⎟ √
 ⎝ .. . . ⎠ ⎜
2 3 6
⎟ 2 √2 2 √2
=:Q
0 ··· 0 a n · bn A=⎜ ⎝ 0
√1
3
− √2 ⎟
6⎠
⎝ 0 3 43 √3⎠
 0 0 23 6
√1 − √1 − √1
=:R 2 3 6

Eine solche Zerlegung, die für jede invertierbare Matrix


A existiert, nennt man eine Q R-Zerlegung von A. Kommentar: Die Q R-Zerlegung ist zum Beispiel bei
der numerischen Berechnung der Eigenwerte einer Matrix
Die Spalten von Q bilden eine Orthonormalbasis des Rn ,
mithilfe des sogenannten Q R-Algorithmus ein integraler
daher gilt Q0 Q = En , d. h., Q ist eine orthogonale Ma-
Bestandteil. Tatsächlich wird hierbei die Q R-Zerlegung
trix, es gilt Q0 = Q−1 . Und R ist wie gewünscht eine
im Allgemeinen nicht mit dem Verfahren von Gram und
obere Dreiecksmatrix.
Schmidt bestimmt, da dieses numerisch instabil ist, d. h.,
Ersetzen wir einen Vektor b der Orthonormalbasis B durch kleine Störungen in den Eingabedaten wirken sich stark
−b, so erhalten wir wieder eine Orthonormalbasis B  und auf die Berechnungen aus. In der Numerik benutzt man
damit eine andere Q R-Zerlegung A = Q R  . Wenn wir ausgefeilte Methoden, um die Q R-Zerlegung einer Ma-
uns darauf einigen, dass wir die Vektoren b1 , . . . , bn der trix numerisch stabil zu bestimmen.
674 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Achtung: Die Voraussetzung dim V ∈ N in (c) ist not- euklidischen Vektorraums V , so lässt sich jedes v ∈ V
wendig, es gibt nämlich Beispiele unendlichdimensionaler eindeutig in der Form
euklidischer Vektorräume V mit einem Untervektorraum U
und U + U ⊥ V , beachte das folgende Beispiel. In die- v = u + u
sem Fall ist das orthogonale Komplement U also kein zu U
komplementärer Untervektorraum – ein orthogonales Kom- mit u ∈ U und u ∈ U ⊥ schreiben. Und im Fall dim V =
plement ist also nicht notwendig ein Komplement. n ∈ N gilt:
dim U ⊥ = dim V − dim U .
Beispiel Es sei V der R-Vektorraum aller stückweise ste-
tigen, beschränkten Funktionen auf dem abgeschlossenen In-
tervall [0, 1], die an der Stelle 0 stetig sind und an den jewei-
ligen rechten Ränder linksstetig sind (Abb. 17.11).
?
Zeigen Sie die Eindeutigkeit der Darstellung v = u + u mit
u ∈ U und u ∈ U ⊥ direkt.
y

Ist V die direkte Summe von zueinander orthogonalen Un-


tervektorräumen U1 , . . . , Ur , d. h.

V = U1 ⊕ · · · ⊕ Ur mit Ui ⊥ Uj für i = j ,

so nennt man V auch die orthogonale Summe von


x U1 , . . . , Ur und schreibt dafür:
0 1
Abbildung 17.11 Die Funktionswerte an den rechten Rändern sind nicht V = U1 9
⊥ ··· 9
⊥ Ur .
beliebig

Als Skalarprodukt wählen wir wie gewöhnlich auf solchen


Beispiel Im R2 gilt bezüglich des kanonischen Skalarpro-
Vektorräumen
dukts {0}⊥ = R2 und (R2 )⊥ = {0} sowie:
J 1
<' ( =⊥ < ' ( =
-f, g. = f (t) g(t) dt für f, g ∈ V . 1 1
0 = .
−1 1
Nun betrachten wir den Untervektorraum U der Treppen-
funktionen
Im R3 gilt bezüglich des kanonischen Skalarprodukts:
U = {f ∈ V | f ist stückweise konstant} .
?⎛1⎞@⊥ ?⎛ 1 ⎞ ⎛ 0 ⎞@
Offenbar steht nur die Nullfunktion senkrecht auf allen Trep- ⎝1⎠ = ⎝−1⎠ , ⎝ 1 ⎠
penfunktionen, d. h. U ⊥ = {0}. Da aber nicht jedes Element 1 0 −1
aus V eine Treppenfunktion ist, gilt:
(Abb. 17.12).
U + U⊥ = U V . 
?⎛ ⎞@
1
U = ⎝1⎠
1
?
Wozu braucht man die Linksstetigkeit und die Stetigkeit in 0
in diesem Beispiel ?
U⊥

Ist V = U ⊕ W eine direkte Summe, so ist jeder Vektor


v ∈ V auf genau eine Weise als Summe v = u + w mit
u ∈ U und w ∈ W schreibbar (beachte das Lemma auf
Seite 218). Daher erhalten wir als Folgerung (man beachte
auch die Dimensionsformel auf Seite 217):

Folgerung Abbildung 17.12 Der Untervektorraum U und sein orthogonales Komplement


Ist U ein Untervektorraum eines endlichdimensionalen U ⊥. 
17.3 Orthonormalbasen und orthogonale Komplemente 675

Den minimalen Abstand eines Punkts zu einem v − w = (v − u) + (u − w)



Untervektorraum erhält man durch Projektion = (v − u)2 + 2 (v − u) · (u − w) + (u − w)2
des Punkts auf den Untervektorraum 
= (v − u)2 + (u − w)2
Wir betrachten die Situation des letzten Beispiels erneut 
im R2 für einen eindimensionalen Untervektorraum U ≥ (v − u)2
(Abb. 17.13). = v − u . 

x2
v Die Abbildung 17.14 illustriert diesen minimalen Abstand
im R3 mit dem kanonischen Skalarprodukt.
u = v − u U

u U⊥
b2 v
u
b1 x1

Abbildung 17.13 Der Punkt u entsteht aus dem Punkt v, indem man das Lot
von v aus auf die Gerade U fällt. Der Vektor u = v − u steht senkrecht auf U .

Anschaulich ist klar, dass der kürzeste Abstand von v zu der


Geraden U genau jener Abstand von v zu dem Fußpunkt u u
ist, d. h.:
U
u  = v − u ≤ v − μ b1  für alle μ ∈ R .

Der Vektor u entsteht dabei durch Projektion von v auf den


Untervektorraum U . Wir zeigen nun, dass dies allgemeiner
möglich ist (vgl. auch die Ausführungen in Abschnitt 7.4). Abbildung 17.14 Der Vektor u = v − u steht senkrecht auf U , seine Länge
ist der minimale Abstand von v zu U .

Projektionssatz Der Projektionssatz sagt uns zwar, dass es einen Vektor


w ∈ U gibt, sodass v − w minimal ist, aber er macht
Ist U ein Untervektorraum eines endlichdimensionalen
keine allgemeingültige Aussage dazu, wie man dieses w be-
euklidischen Vektorraums V , so gibt es zu jedem v ∈ V
stimmt (beachten Sie aber auch Aufgabe 17.21). Im Rn mit
genau ein u ∈ U mit v−u ⊥ U . Die hierdurch definierte
dem kanonischen Skalarprodukt · finden wir w durch Lö-
Abbildung  sen eines linearen Gleichungssystems – w ist eine Lösung
V → U,
π: der sogenannten Normalgleichung. Dazu zeigen wir vorab
v → u
etwas allgemeiner:
ist linear, sie heißt orthogonale Projektion oder Nor-
malprojektion von V auf U .
Das lineare Ausgleichsproblem
Für den Vektor u = v − u ∈ U ⊥ gilt:
Es seien A ∈ Rn×r , n ≥ r und v ∈ Rn . Ein Vektor
 x ∈ Rr ist genau dann eine Lösung des linearen Aus-
u  ≤ v − w für alle w ∈ U .
gleichsproblems
Der minimale Abstand von v zu U ist die Länge des
Vektors u . v − A x = min

wenn x eine Lösung der Normalgleichung


Für den Endomorphismus π von V gilt offenbar π 2 = π,
d. h., dass π eine Projektion ist (vgl. Aufgabe 17.17). A 0 A x = A0 v

ist. Die Lösung x ist genau dann eindeutig bestimmt,


Beweis: Der erste Teil dieser Aussage folgt aus der Folge- wenn der Rang von A maximal, d. h. gleich r ist.
rung auf Seite 674. Für den zweiten Teil beachte man, dass
für jedes w ∈ U gilt (v − u) · (u − w) = 0, da nämlich v − u
senkrecht auf u − w steht. Damit erhalten wir die folgende, Beweis: Wir wenden den Projektionssatz an. Dazu set-
für alle w ∈ U gültige Abschätzung: zen wir V = Rn mit dem kanonischen Skalarprodukt · und
676 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

U = ϕA (Rr ) = {A x | x ∈ Rr } = -s 1 , . . . , s r . ⊆ V mit Wir bilden die Matrix A, deren Spalten die Basisvektoren
den Spalten s 1 , . . . , s r von A. b1 , b2 von U sind und erhalten dann den Koordinatenvektor
von u bezüglich der Basis B = (b1 , b2 ) durch Lösen der
Nach dem Projektionssatz ist ein Element A x ∈ Rn mit
Normalgleichung
x ∈ Rr genau dann eine Lösung von v − A x = min,
wenn v − A x ⊥ U , d. h., A x ist die senkrechte Projektion
A0 A x = A0 v .
von v auf U . Nun gilt:
Das Gleichungssystem lautet:
v − Ax ⊥ U
⇔ v − A x ⊥ si ' ( ' (
für alle i = 1, . . . , r 2 2 4
x= .
⇔ s i · (v − A x) = 0 für alle i = 1, . . . , r 2 3 6
⇔ s0
i (v − A x) = 0 für alle i = 1, . . . , r ' (
0
0 Die eindeutig bestimmte Lösung besagt, dass die senk-
⇔ A (v − A x) = 0 2
⇔ A0 A x = A0 v . ⎞ Projektion von v auf U der Vektor u = 0 b1 + 2 b2 =
rechte

2
Damit ist gezeigt, dass die Lösungsmengen des linearen Aus- ⎝2⎠ ist.
gleichsproblem und der Normalgleichung übereinstimmen. 2
Es bleibt zu zeigen, dass die Lösungsmenge genau dann ein-
elementig ist, wenn A den Rang r hat. Das begründen wir, So erhalten wir für den minimalen Abstand von v zu U
indem wir zeigen, dass A0 A genau dann invertierbar ist, K⎛ ⎞ ⎛ ⎞K
K 1 2 K
wenn A den Rang r hat. Es gilt: K K √
v − u = K 2 − 2⎠K
K ⎝ ⎠ ⎝
K = 2. 
0 K 3 2 K
A A ist invertierbar
0
⇔ A Aw = 0 nur für w = 0
0
⇔ wA Aw = 0 nur für w = 0
⇔ (A w) · (A w) = 0 nur für w = 0 Symmetrische Bilinearformen kann man über
⇔ Aw = 0 nur für w = 0 beliebige Körpern erklären
⇔A hat Rang r.
Wir haben das (euklidische) Skalarprodukt · eines R-Vektor-
Damit ist alles gezeigt.  raums V definiert als eine positiv definite, symmetrische Bi-
linearform, · : V × V → R. Für die positive Definitheit ist
Kommentar: Die Matrix A0 A ist im Allgemeinen nicht die Eigenschaft von R nötig, dass man die von null verschie-
invertierbar. Also ist es im Allgemeinen nicht möglich, die denen Elemente von R in positive und negative Elemente
Normalgleichung nach dem Vektor v durch Berechnen von unterscheiden kann. Verzichtet man auf die positive Definit-
(A0 A)−1 aufzulösen. heit, so kann man für jeden Körper K eine symmetrische
Bilinearform · in einem K-Vektorraum V erklären, also eine
symmetrische, bilineare Abbildung · : V × V → K.
Wir kehren nun zu der Situation des Projektionssatzes zurück
im Fall V = Rn und U = -b1 , . . . , br . = ϕA (Rr ) = {A x | Durch das Fehlen der positiven Definitheit haben diese Ver-
x ∈ Rr } ⊆ V , wobei A = (b1 , . . . , br ). Zu v ∈ Rn erhalten allgemeinerungen von Skalarprodukten Eigenschaften, deren
wir die orthogonale Projektion π(v) = u = A x durch Lösen geometrische Deutungen etwas seltsam wirken.
der Normalgleichung Ist V ein K-Vektorraum mit einer symmetrischen Bilinear-
form ·, so definiert man (wie beim euklidischen Skalarpro-
A0 A x = A0 v .
dukt):
Bilden b1 , . . . , br eine Basis von U , so ist die Lösung ein- v heißt senkrecht bzw. orthogonal zu w, v ⊥ w, für zwei
deutig bestimmt. Vektoren v, w ∈ V , falls v · w = 0 gilt.
Man nennt v ∈ V isotrop, falls v ⊥ v gilt.
Beispiel
⎛ ⎞ Wir suchen den minimalen Abstand des Punktes U ⊥ = {v ∈ V | v ⊥ u für alle u ∈ U } nennt man den
1 Orthogonalraum zu U für jeden Untervektorraum U von
v = ⎝2⎠ zu der Ebene V.
3 Rad(V ) = V ∩ V ⊥ ist das Radikal von V .
⎛ ⎞
? ⎛ ⎞@ Man nennt · ausgeartet, falls Rad(V ) = {0}.
1 1
U = b1 = ⎝0⎠ , b2 = ⎝1⎠ . Die Vektoren im Radikal sind allesamt isotrop, sie stehen
1 1 nämlich auf allen Vektoren aus V , also insbesondere auch
17.3 Orthonormalbasen und orthogonale Komplemente 677

Beispiel: Methode der kleinsten Quadrate


Eine Messung liefert zu den n verschiedenen Zeitpunkten t1 , . . . , tn die jeweiligen Messwerte y1 , . . . , yn . Gesucht ist
eine Funktion f ∈ RR , welche die gegebenen Messwerte an den Stellen t1 , . . . ,⎛tn möglichst ⎞ gut annähert, wobei
f (t1 ) − y1
wir hier als Maß für gute Annäherung die Minimalität der Größe  mit  = ⎝ .
.
.
⎠ ansetzen. Es ist dann
f (tn ) − yn
2 = (f (t1 ) − y1 )2 + · · · (f (tn ) − yn )2 die Summe der Quadrate der Fehler, die dabei gemacht werden.
Die Minimalität dieser Summe besagt, dass die senkrechten
Abstände der Funktion f an den Stellen ti zu den vorgegeben
Messwerten yi minimal ist. Das kann als beste Annäherung
betrachtet werden.

Problemanalyse und Strategie: Wir benutzen die Lösung des linearen Ausgleichsproblems durch die Normalglei-
chung. Dabei wählen wir Basisfunktionen, die einen Untervektorraum U des Vektorraums aller Funktionen erzeugen und
bestimmen eine Funktion f aus U , deren Graph einen im oben erwähnten Sinne minimalen Abstand zu den gegebenen
Punkten (t1 , y1 ), . . . , (tn , yn ) hat.

Lösung: f
Um eine solche beste Annäherung zu erhalten, trägt man
zuerst die Messpunkte (t1 , y1 ), . . . , (tn , yn ) in ein Koor-
dinatensystem ein und überlegt sich, welche Funktionen

f1 , . . . , fr als Basisfunktionen in Betracht zu ziehen sind.
Bei der ersten Punkteverteilung in der folgenden Skizze
−2 −1 0 1 2

Aufgrund der Verteilung der Punkte suchen wir nach einer


Ausgleichsgeraden f : R → R, f (x) = a x + b, d. h., wir
wird man sich auf Geraden, also bei den Basisfunktio- geben uns die Basisfunktionen f1 : R → R, f (x) = 1
nen auf f1 = 1 und f2 = X konzentrieren, bei der und f2 : R → R, f (x) = x vor.
zweiten Punkteverteilung auf Parabeln und schließlich bei Als Matrix A ∈ R4×2 und Vektor v ∈ R4 erhalten wir
der dritten Punkteverteilung dieser Skizze auf Sinus- und somit: ⎛ ⎞ ⎛ ⎞
1 −1 1
Kosinusfunktionen. ⎜1 0 ⎟ ⎜1⎟
A=⎝ ⎜ ⎟ und ⎝ ⎟
⎜ .
Hat man den Satz f1 , . . . , fr von Funktionen gewählt, so 1 1⎠ 2⎠
sind λ1 , . . . , λr ∈ R gesucht, sodass die Funktion 1 2 2
f = λ1 f1 + · · · + λr fr Nun berechnen wir A0 v und A0 A:
die Größe ⎛ ⎞
(f (t1 ) − y1 )2 + · · · + (f (tn ) − yn )2 ' ( 1 ' (
1 1 1 1 ⎜ ⎟
⎜1⎟ = 6 .
A0 v =
minimiert. −1 0 1 2 ⎝2⎠ 5
Dies lässt sich mithilfe der reellen n × r-Matrix 2
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
f1 (t1 ) · · · fr (t1 ) y1 ' ( 1 −1 ' (
⎜ .. . ⎟ ⎜ .. ⎟ 0 1 1 1 1 ⎜ ⎜ 1 0⎟⎟ 4 2
A=⎝ . . ⎠ und v = ⎝ . ⎠
. A A= =
−1 0 1 2 ⎝1 1 ⎠ 2 6
f1 (tn ) · · · fr (tn ) yn 1 2
auch ausdrücken als: Gesucht ist ein x ∈ Rr mit der Eigen-
Zu lösen bleibt nun das System
schaft, dass v − A x minimal ist. Nach dem Satz zum
' (' ( ' (
linearen Ausgleichsproblem von Seite 675 erhalten wir x 4 2 x1 6
als Lösung der Normalgleichung: = .
2 6 x2 5
A0 A x = A0 v .
Damit erhalten wir als die beste lineare Annäherung die
Betrachten wir ein Beispiel. Eine Messreihe liefert Gerade
(t1 , y1 ) = (−1, 1) , (t2 , y2 ) = (0, 1) , 2 13
f : R → R , f (x) = x+ .
(t3 , y3 ) = (1, 2) , (t4 , y4 ) = (2, 2) . 5 10
678 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

auf sich selbst, senkrecht. Ist K = R und · sogar positiv ist dann in zwei Versionen zu interpretieren: Einmal für den
definit, d. h. ein euklidisches Skalarprodukt, so gilt: reellen Fall, ein zweites Mal für den komplexen Fall. Um
die Theorie übersichtlicher und klarer zu gestalten, wählten
Rad(V ) = {0} , wir einen anderen Weg. Wir schließen vorläufig die Theorie
der euklidischen Vektorräume ab und führen nun in einem
da V ⊥ = {0}. Außerdem ist nur der Nullvektor in diesem
eigenen Abschnitt die unitären Vektorräume ein.
Fall isotrop. Es folgen nun Beispiele von Vektorräumen mit
symmetrischen Bilinearformen, die keine euklidischen Ska-
larprodukte sind. In komplexen Vektorräumen gibt es keine
symmetrischen, positiv definiten
Beispiel
Es ist Bilinearformen
⎧ 2 × R2
⎨'' R( ' (( → R, An ein euklidisches Skalarprodukt eines reellen Vektorraums
·: v1 w1 stellten wir die drei Forderungen der
⎩ ,  → v1 w1 − v2 w2
v2 w2
(Bi-)linearität,
eine symmetrische Bilinearform auf dem WegenR2 . Symmetrie und
' ( ' ( positiven Definitheit.
1 1
· =1·1−1·1=0 Die positive Definitheit war es letztlich, die es ermöglichte,
1 1
Normen von Vektoren und damit Abstände, Winkel und
steht der Vektor (1, 1)0 auf sich selbst senkrecht, sodass Orthogonalität zwischen Vektoren zu erklären. Würde man in
(1, 1)0 isotrop ist. Der Vektorraum R2 ist aber bezüglich komplexen Vektorräumen nun ebenso vorgehen, um solche
· nicht ausgeartet, da es zu jedem Vektor v ∈ R2 , der vom Begriffe einführen zu können, so stößt man auf ein Problem.
Nullvektor verschieden ist, einen Vektor w ∈ R2 gibt mit So ist zwar das Produkt für Vektoren
v · w = 0. ⎛ ⎞ ⎛ ⎞
Es sei V der Z2 -Vektorraum Z22 . Es ist v1 w1
⎜ .. ⎟ ⎜ .. ⎟
⎧ v = ⎝ . ⎠ , w = ⎝ . ⎠ ∈ Cn ,
⎨'' V( ×'V (( → Z2 ,
vn wn
·: v1 w1
⎩ ,  → v1 (w1 + w2 ) + v2 (w1 + w2 )
v2 w2 das wir analog zum kanonischen Produkt im Rn definieren,
eine symmetrische Bilinearform auf V . Da !
n

' ( v · w = v0 w = vi wi ∈ C ,
1 i=1
⊥ v für alle v ∈ V ,
1
bilinear und symmetrisch, aber nicht positiv definit, da etwa
enthält der Untervektorraum Rad(V ) von V den eindi- ' ( ' (
i i
mensionalen Untervektorraum -(1, 1)0 ., d. h., dass V be- · = i2 = −1 ∈ R≥0 .
0 0
züglich · ausgeartet ist. Da aber (1, 0)0 nicht isotrop ist,
ist das Radikal nicht zweidimensional, wir erhalten
Es kann auch sein, dass die Größe v 0 v gar keine reelle Zahl
<' (=
1 ist: ' ( ' (
Rad(V ) = . 1+i 1+i
1 · = (1 + i)2 = 2 i ∈ R .
0 0
Das Radikal besteht in diesem Beispiel genau aus den Also kann es im Cn keine symmetrischen, positiv definiten
isotropen Vektoren.  Bilinearformen geben.

?
Nennen Sie für jede natürliche Zahl n einen Vektor v ∈ Cn
17.4 Unitäre Vektorräume mit v 0 v < 0.

Euklidische Vektorräume sind reelle Vektorräume mit einem


Wir müssen unsere Forderungen ändern. Um weiterhin Nor-
euklidischen Skalarprodukt. Wir werden nun analog unitäre
men, Winkel und Abstände betrachten zu können, verab-
Vektorräume betrachten. Das sind komplexe Vektorräume
schieden wir uns von der Symmetrie in dieser Form und damit
mit einem sogenannten unitären Skalarprodukt. Die Theo-
dann auch von der Bilinearität.
rie ist nahezu identisch. Vielfach werden euklidische und
unitäre Vektorräume sogar parallel eingeführt. Jede Eigen- Weil man positive reelle Zahlen erhält, wenn man kom-
schaft, die man bei dieser parallelen Einführung formuliert, plexe Zahlen mit ihrem konjugiert Komplexen multipliziert,
17.4 Unitäre Vektorräume 679

0 ≤ |z|2 = z z, stellen wir an unitäre Skalarprodukte eines Unitäres Skalarprodukt und unitärer Vektorraum
komplexen Vektorraums V statt der Symmetrie die Forde-
Ist V ein komplexer Vektorraum, so heißt eine Abbil-
rung
dung 
v · w = w · v für alle v, w ∈ V . V × V → C,
·:
(v, w) → v · w
Vertauscht man die Faktoren des Produkts, so kommt das ein unitäres Skalarprodukt, wenn für alle v, v  , w ∈
konjugiert Komplexe dabei heraus. Wir sagen, ein Produkt V und λ ∈ C die folgenden Eigenschaften erfüllt sind:
· : V × V → C ist hermitesch, wenn v · w = w · v für alle (i) (v + v  ) · w = v · w + v  · w und (λ v) · w = λ (v · w)
v, w ∈ V gilt. (Linearität im ersten Argument),
(ii) v · w = w · v (hermitesch),
Für jede Matrix A = (aij ) ∈ Cr×s , also auch für jeden
(iii) v · v ≥ 0 und v · v = 0 ⇔ v = 0 (positive Definit-
Spaltenvektor, schreiben wir wieder A = (a ij ) und erwähnen
heit).
die bereits benutzte Regel
Ist · ein unitäres Skalarprodukt in V , so nennt man V
einen unitären Vektorraum.
Av = Av

Wir stellen die Axiome (i), (ii) und (iii) für den euklidischen
für Vektoren v.
und den unitären Fall gegenüber:
Wir erklären nun ein Produkt · von Vektoren des C2 :
euklidisch unitär
!
n (v+v  ) · w =v·w + v·w (v+v  ) · w = v · w + v · w
v · w = v0 w = v i wi ∈ C . (λ v) · w = λ (v · w) (λ v) · w = λ (v · w)
i=1 v·w =w·v v·w =w·v
v·v ≥0 v·v ≥0
Nun rechnen wir mit unseren obigen Beispielen, aber bezüg- v·v =0⇔v =0 v·v =0⇔v =0
lich des neu erklärten Produkts · nach:
Aus (ii) folgt wegen der Additivität und der Multiplikativität
' ( ' ( ' (
i i −i des Konjugierens die halbe Linearität im zweiten Argument,
· = (i, 0) = i (−i) = 1 ∈ R≥0
0 0 0 d. h., es gilt für alle v, w, w ∈ V und λ ∈ C:

und v · (w + w  ) = (w + w  ) · v = w · v + w  · v
' ( ' ( ' ( = v · w + v · w = v · w + v · w
1+i 1+i 1−i
· = (1 + i, 0) = 2 ∈ R≥0 . v · (λ w) = (λ w) · v = λ (w · v)
0 0 0
= λ v · w = λ (v · w) .

Allgemeiner besagt die Eigenschaft hermitesch im Fall


v = w: Eine Abbildung von V ×V nach C, die linear im ersten Argu-
ment und im obigen Sinne halb linear im zweiten Argument
v·v = v·v,
ist, nennt man auch eine Sesquilinearform, also eine einein-
halbfache Linearform. Damit ist ein unitäres Skalarprodukt
d. h., v · v ∈ R. eine hermitesche, positiv definite Sesquilinearform.
Die Eigenschaft hermitesch hat aber Auswirkungen auf die
Linearität im zweiten Argument. Wir werden das gleich Achtung: In einem unitären Vektorraum V gilt für alle
sehen. v, w ∈ V und λ ∈ C:

(λ v) · w = λ (v · w) und v · (λ w) = λ (v · w) .

Ein unitäres Skalarprodukt ist eine positiv


definite, hermitesche Sesquilinearform eines Auch im unitären Vektorraum V gilt für alle v ∈ V :
komplexen Vektorraums
v·0 = 0 = 0·v,
Für die folgende Definition vergleiche man jene des euklidi-
schen Skalarprodukts und des euklidischen Vektorraums von wenngleich das unitäre Skalarprodukt nicht kommutativ, d. h.
Seite 657. nicht symmetrisch ist.
680 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Beispiel Dabei multiplizieren wir zwei Funktionen f und g aus C


Für jede natürliche Zahl n ist im komplexen Vektorraum folgendermaßen:
Cn das Produkt J
v · w = v0 w
b
-f, g. = f (t) g(t) dt .
ein unitäres Skalarprodukt. Dieses Skalarprodukt nennen a

wir das kanonische (unitäre) Skalarprodukt. Weil stetige Funktionen integrierbar sind, ist dieses Pro-
Die Linearität im ersten Argument ist unmittelbar klar. dukt auch definiert. Der Nachweis, dass · ein unitäres
⎛ ⎞ ⎛ ⎞ Skalarprodukt ist, erfolgt analog zum reellen Fall. 
v1 w1
⎜ .. ⎟ ⎜ .. ⎟
Sind v = ⎝ . ⎠ und w = ⎝ . ⎠, so gilt:
Das zweite Beispiel mit der Matrix A lässt sich wesentlich
vn wn verallgemeinern. Ist n eine natürliche Zahl, so ist für jede
Matrix A ∈ Cn×n das Produkt
!
n !
n
v · w = v0 w = vi wi = w i vi
v · w = v 0 A w für alle v, w ∈ Cn
i=1 i=1
!
n linear im ersten Argument. Und erfüllt die Matrix A die
= wi v i = w · v . Eigenschaft A0 = A, so ist das Produkt · auch hermitesch.
i=1 Daher ist die folgende Definition nur naheliegend.
Also ist das Produkt auch hermitesch. Und die positive
Definitheit des Produkts folgt aus Hermitesche Matrizen
0
0 2
v · v = v v = |v1 | + · · · + |vn | ≥ 0 ,2 Eine Matrix A ∈ Cn×n mit A0 = A, d. h., A = A,
heißt hermitesch.
wobei die Gleichheit genau dann gilt, wenn alle vi gleich
null sind, d. h., wenn v = 0. Die Diagonaleinträge aii einer hermiteschen Matrix A =
( für Vektoren v, w ∈ C mittels der Matrix
2
Wir definieren
' (aij ) ∈ Cn×n müssen wegen
2 i
A= das Produkt ⎛ ⎞ ⎛ ⎞
−i 1 a 11 · · · a 1n a11 · · · an1
⎜ .. ⎟ = ⎜ .. .. ⎟ = A0
A = ⎝ ... . ⎠ ⎝ . . ⎠
v · w = v0 A w .
a n1 · · · a nn a1n · · · ann
Die Linearität im ersten Argument begründet man wie im
reellen Fall. reell sein. Die hermiteschen Matrizen übernehmen im Kom-
Das Produkt ist hermitesch, da wegen plexen die Rolle der symmetrischen Matrizen im Reellen.

v 0 A w = (v 0 A w)0 = w0 A0 v
Positiv definite Matrizen definieren unitäre
(Transponieren einer komplexen Zahl ändert diese Zahl Skalarprodukte
nicht) und wegen A0 = A gilt:

v · w = v 0 A w = w 0 A0 v Jede hermitesche Matrix A liefert mit der Definition

= w0 A v = w0 A v = w · v . v · w = v 0 A w für alle v, w ∈ Cn

Schließlich
' ( ist das Produkt positiv definit, da für v = eine hermitesche Sesquilinearform. Aber das Produkt ist
v1 nicht für jede hermitesche Matrix A positiv definit, man
∈ R2 gilt:
v2 wähle etwa die Nullmatrix, diese ist hermitesch, das Produkt
' ( aber in diesem Fall sicher nicht positiv definit.
0 v1
v A v = (2 v1 − i v2 , i v1 + v2 )
v2 Wir nennen eine hermitesche n×n-Matrix A positiv definit,
wenn für alle v ∈ Cn
= 2 v1 v 1 − i v2 v 1 + i v1 v 2 + v2 v 2
= |v1 |2 + |v1 + i v2 |2 ≥ 0 , v 0 A v ≥ 0 und v 0 A v = 0 ⇔ v = 0

und Gleichheit gilt hierbei genau dann, wenn v = 0 ist. gilt – man beachte v 0 A v ∈ R. Jede positiv definite Matrix
Wir erklären ein Produkt - , . im Vektorraum aller auf dem liefert somit durch die Definition
abgeschlossenen Intervall [a, b] für reelle Zahlen a < b
stetigen komplexwertigen Funktionen, also im komplexen v · w = v0 A w
Vektorraum
ein unitäres Skalarprodukt. Man beachte, dass positiv definite
C = {f : [a, b] → C | f ist stetig } . Matrizen insbesondere hermitesch sind.
17.5 Orthogonale und unitäre Endomorphismen 681

Vektoren in unitären Vektorräumen haben Bei euklidischen bzw. unitären Vektorräumen haben wir die
eine Norm weitere Verknüpfung · des euklidischen bzw. unitären Ska-
larprodukts. Trägt ein Endomorphismus ϕ auch dieser Ver-
Unitäre Vektorräume entziehen sich, vom eindimensionalen knüpfung des Skalarprodukts im folgenden Sinne Rechnung,
Fall abgesehen, der Anschauung. Aber auch in diesen Räu- so wollen wir einen solchen Endomorphismus einen orthogo-
men kann man Begriffe wie Norm und Länge einführen. Dazu nalen bzw. unitären Endomorphismus nennen, je nachdem,
gehen wir völlig analog zum reellen Fall vor, das können wir ob ein euklidischer oder unitärer Vektorraum vorliegt.
wegen der positiven Definitheit des unitären Skalarprodukts.
Orthogonale und unitäre Endomorphismen
Die Norm von Vektoren Einen Endomorphismus ϕ eines euklidischen bzw. uni-
Ist v ein Element eines unitären Vektorraums mit dem tären Vektorraums V mit Skalarprodukt · mit der Eigen-
unitären Skalarprodukt ·, so nennt man die positive reelle schaft
Zahl √
v = v · v v · w = ϕ(v) · ϕ(w) für alle v, w ∈ V
die Norm oder Länge des Vektors v. nennt man im euklidischen Fall, d. h., K = R, einen
orthogonalen Endomorphismus und im unitären Fall,
Nun lassen sich alle Überlegungen aus dem Abschnitt zu d. h., K = C, einen unitären Endomorphismus.
den euklidischen Vektorräume für unitäre Vektorräume wie-
derholen. Wir stellen alle wesentlichen Begriffe und Eigen-
Wir haben die Länge eines Vektors v eines euklidischen oder
schaften in einer Übersicht auf Seite 682 zusammen.
unitären Vektorraums V definiert als
Kommentar: In vielen Lehrbüchern findet man auch die √
0 v = v·v.
Schreibweise AH = A . Und Physiker schreiben in der
0
Quantentheorie oft auch A† für A .
Ist ϕ ein orthogonaler oder unitärer Endomorphismus, so gilt
für jedes v ∈ V :
Wir untersuchen nun lineare Abbildungen in euklidischen
und unitären Vektorräumen. Dabei behandeln wir diese Vek- √ %
v = v · v = ϕ(v) · ϕ(v) = ϕ(v) .
torräume nicht wie bisher getrennt, sondern gleichzeitig.

Und gilt umgekehrt ϕ(v) = v für alle v eines euklidi-


schen oder unitären Vektorraums V , so folgt aus
17.5 Orthogonale und unitäre
Endomorphismen v + w2 = v2 + w2 + 2 (v · w)

und
In diesem und im folgenden Abschnitt steht das Symbol K
für einen der Körper R oder C. Wir sprechen allgemein von
einem Skalarprodukt, meinen damit stets ein euklidisches ϕ(v + w)2 = ϕ(v)2 + ϕ(w)2 + 2 (ϕ(v) · ϕ(w))
Skalarprodukt, falls K = R und ein unitäres Skalarprodukt,
falls K = C gilt. und ϕ(v + w) = v + w schließlich

v · w = ϕ(v) · ϕ(w) für alle v, w ∈ V .


Orthogonale und unitäre Endomorphismen
erhalten Längen und Winkel
Wir haben damit begründet:
Wir haben eine Abbildung ϕ eines K-Vektorraums V in einen
K-Vektorraum W linear genannt, wenn sie den Verknüpfun-
Orthogonale bzw. unitäre Endomorphismen sind län-
gen der Vektorräume Rechnung trägt, d. h., wenn für alle
generhaltend
v, w ∈ V und λ ∈ K gilt:
Ein Endomorphismus ϕ eines euklidischen bzw. unitären
ϕ(v + w) = ϕ(v) + ϕ(w) (Additivität), Vektorraums V ist genau dann orthogonal bzw. unitär,
ϕ(λ v) = λ ϕ(v) (Homogenität). wenn für alle v ∈ V gilt:
Ist V gleich W , d. h., ist ϕ eine lineare Abbildung von V in v = ϕ(v) .
V , so nannten wir ϕ auch einen Endomorphismus.
682 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Übersicht: Eigenschaften und Begriffe euklidischer bzw. unitärer Vektorräume


Wir betrachten ein euklidisches bzw. unitäres Skalarprodukt · eines euklidischen bzw. unitären Vektorraums V .

Für alle Elemente v und w aus V gilt die Cauchy- Ist {a 1 , . . . , a n } eine Basis von V , so ist {b1 , . . . , bn }
Schwarz’sche Ungleichung mit
|v · w| ≤ v w . b1 = a 1 −1 · a 1 , bk+1 = ck+1 −1 · ck+1 ,
Die Gleichheit gilt hier genau dann, wenn v und w li-
k
near abhängig sind. wobei ck+1 = a k+1 − bi · (bi · a k+1 ) für k = 1,
Die Abbildung i=1
 . . . , n − 1, eine Orthonormalbasis von V , diese Kon-
V → R≥0 ,
 · : √ struktion einer Orthonormalbasis aus einer Basis nennt
v  → v = v · v man das Orthonormalisierungsverfahren von Gram
ist eine Norm, insbesondere gilt für alle v, w ∈ V die und Schmidt.
Dreiecksungleichung Jeder höchstens abzählbardimensionale euklidische
bzw. unitäre Vektorraum besitzt eine Orthogonalbasis.
v + w ≤ v + w . Für jeden Untervektorraum U von V ist die Menge
Sind v und w zwei Elemente aus V , so nennen wir die
U ⊥ = {v ∈ V | v ⊥ w für alle w ∈ U }
reelle Zahl
d(v, w) = v − w = w − v wieder ein Untervektorraum von V , das orthogonale
Komplement von U in V .
den Abstand oder die Distanz von v zu w. Ist U ein Untervektorraum von V , so gibt es zu jedem
Sind v und w Elemente aus V , so sagt man, v steht v ∈ V genau ein u ∈ U mit v − u ⊥ U . Die hierdurch
senkrecht auf w oder ist orthogonal zu w, wenn definierte Abbildung
v·w =0 
V → U,
p:
gilt. Für diesen Sachverhalt schreiben wir auch v → u
v ⊥ w.
heißt orthogonale Projektion von V auf U .
Eine Basis B von V heißt Orthogonalbasis, wenn je Und für den Vektor u = v − u ∈ U ⊥ gilt:
zwei verschiedene Basisvektoren aus B senkrecht auf-
einander stehen. u  ≤ v − w für alle w ∈ U .
Eine Orthogonalbasis heißt Orthonormalbasis, wenn
jeder Basisvektor die Länge 1 hat. Es hat u minimalen Abstand zu v.

Wegen dieser längenerhaltenden Eigenschaften eines ortho- Sind v und w nicht der Nullvektor, so gilt für den Winkel
gonalen bzw. unitären Endomorphismus nennt man eine sol- α zwischen v und w und einen orthogonalen Endomorphis-
che Abbildung auch Isometrie. mus ϕ:

Weil nur der Nullvektor die Länge 0 hat und eine lineare v·w ϕ(v) · ϕ(w)
cos α = = ,
Abbildung genau dann injektiv ist, wenn ihr Kern nur aus v w ϕ(v) ϕ(w)
dem Nullvektor besteht, können wir folgern:
also gilt:
 (v, w) =  (ϕ(v), ϕ(w)) .
Folgerung
Jeder orthogonale bzw. unitäre Endomorphismus ϕ ist in-
jektiv, und ist V endlichdimensional, so ist ϕ sogar bijektiv. Und weil zwei Vektoren genau dann senkrecht aufeinan-
der stehen, wenn ihr Skalarprodukt null ist, erhalten wir aus
v · w = ϕ(v) · ϕ(w) für einen orthogonalen bzw. unitären
Endomorphismus:
Dabei folgt die zweite Behauptung aus dem Kriterium für
Bijektivität auf Seite 430.
Folgerung
Orthogonale sind nicht nur längenerhaltend, sie erhalten auch Orthogonale bzw. unitäre Endomorphismen bilden or-
Winkel zwischen vom Nullvektor verschiedenen Vektoren. thogonale Vektoren auf orthogonale Vektoren ab.
17.5 Orthogonale und unitäre Endomorphismen 683

Beispiel Zu einem α ∈ [0, 2 π [ betrachten wir die Matri-


zen
' ( ' (
cos α sin α, cos α − sin α, σα (a)
Sα = und D α = . ⎫
sin α − cos α sin α cos α ⎬
sin α/2
Die Abbildungen ⎭
σα (b) α/2

  cos α/2
R2→ R2 R2→ R2
σα : und δα :
v → S α v v → D α v
a
b
sind orthogonale Endomorphismen bezüglich des kanoni-
schen euklidischen Skalarprodukts des R2 .
Dass die Abbildungen σα und δα Endomorphismen sind, ist Abbildung 17.15 Die Spiegelung σα ist längenerhaltend.
klar. Wir müssen nur nachweisen, dass beide Abbildungen
längenerhaltend sind, dass also: x2
δα (a)
σα (v) = v und δα (v) = v

für jedes v ∈ R2 gilt.


b a
Wegen α
' (' ( α
cos α sin α cos α sin α x1
S0
α Sα = = E2
sin α − cos α sin α − cos α

und
' (' ( δα (b)
cos α sin α cos α − sin α
D0
α Dα = = E2
− sin α cos α sin α cos α Abbildung 17.16 Die Drehung δα ist längenerhaltend.

gilt für jedes v ∈ R2 :


 Spalten und Zeilen von orthogonalen bzw.
%
σα (v) = (S α v) · (S α v) = (S α v)0 (S α v) unitären Matrizen bilden Orthonormalbasen
 %
= v0 S 0 0
α S α v = v v = v ; Ist B = {b1 , . . . , bn } eine Orthonormalbasis des Kn bezüg-
lich des kanonischen Skalarprodukts
und entsprechend für die Abbildung δα :
 v · w = v0 w ,
%
δα (v) = (D α v) · (D α v) = v 0 D 0
α Dα v
% so gilt offenbar für die Matrix A = (b1 , . . . , bn ) ∈ Kn×n ,
= v 0 v = v . deren Spalten gerade die Basisvektoren b1 , . . . , bn der Or-
thonormalbasis sind:

( σα beschreibt die Spiegelung an der Geraden


Die'Abbildung A0 A = En ,
cos α/2
R (Abb. 17.15).
sin α/2 da die i-te Zeile von A0 der Basisvektor bi und die j -te
Spalte der Basisvektor bj ist, und somit gilt:
Die Abbildung δα ist die Drehung um den Winkel α gegen
den Uhrzeigersinn (Abb. 17.16). 
1 , falls i = j ,
bi · bj =
Drehungen und Spiegelungen im R2 sind orthogonale Endo- 0 falls i = j .
morphismen. 
Wegen A0 A = En ist A0 das Inverse zu A, d. h.,
Die Matrizen S α und D α aus dem vorangegangenen Beispiel
0 0
haben für jedes α ∈ [0, 2 π [ die Eigenschaft A = A−1 , und somit gilt auch A A = En ,

S0 0
α S α = E2 und D α D α = E2 ,
was wiederum besagt, dass die Zeilenvektoren von A paar-
weise orthogonal zueinander sind und die Länge 1 haben,
d. h., dass die Spalten von S α und D α Orthonormalbasen des also auch eine Orthonormalbasis des Kn bezüglich des ka-
Rn sind. nonischen Skalarprodukts bilden.
684 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Beispiel: Spiegelungen im Rn sind diagonalisierbare orthogonale Endomorphismen


Wir betrachten im euklidischen Rn mit dem kanonischen Skalarprodukt · für einen Vektor w ∈ Rn \ {0} der Länge 1, d. h.,
w = 1, die Abbildung  n
R → Rn ,
σw :
v → v − 2 (w · v) w.
Wir nennen σw die Spiegelung entlang w. Wir begründen: Jede Spiegelung σw ist ein diagonalisierbarer orthogonaler
Endomorphismus.

Problemanalyse und Strategie: Wir prüfen nach, dass σw ein längenerhaltender Endomorphismus ist und konstruieren
uns schließlich eine Basis bezüglich der der Endomorphismus Diagonalgestalt hat.

Lösung: Also ist jede Spiegelung σw im Rn diagonalisierbar, und


Weil für alle λ ∈ R und u, v ∈ Rn die Gleichung offenbar haben damit Spiegelungen und damit auch jede
Darstellungsmatrix einer Spiegelung stets die Determi-
σw (λ u + v) = λ u + v − 2 (v · (λ u + v)) w
nante −1. Wir ermitteln noch die Darstellungsmatrix der
= λ σw (u) + σw (v) Spiegelung σw bezüglich der geordneten Standardbasis En
gilt, ist σw ein Endomorphismus. Nun zeigen wir, dass σw des Rn .
längenerhaltend ist. Ist v ∈ Rn , so gilt:
v − 2 (w · v) w2 = v2 − 4 (w · v) (w · v) Für jedes v ∈ Rn gilt:

+ 4 (w · v)2 w2 = v2 . σw (v) = v − 2 (w · v) w = v − 2 (w 0 v) w



Im R2 stimmt dieser Begriff der Spiegelung mit dem uns ∈R
bereits bekannten überein. Man muss sich nur klar ma- = v − 2 w (w0 v) = v − 2 (w w0 ) v
chen, dass das Spiegeln entlang w eben gerade das Spie-  
geln an der Geraden senkrecht zu w bedeutet. = En − 2 w w0 v .
x2
Damit haben wir die Darstellungsmatrix der Spiegelung
σw bezüglich der Standardbasis En ermittelt:

En M(σw )En = En − 2 w w0 .

Mit der oben gewählten geordneten Orthonormalbasis


x1 B = (w, b2 , . . . , bn ) des Rn erhalten wir dann mit der
transformierenden Matrix S = (w, b2 , . . . , bn ) wegen
w
S 0 = S −1 :

D = S 0 (En − 2 w w0 ) S .

Anstelle von entlang w sagt man auch an der Hyperebene Im R3 hat⎛etwa⎞ die Spiegelung σw entlang des Vektors
w⊥ = -w.⊥ ; dies ist ein (n − 1)-dimensionaler Unter- 1
vektorraum des Rn , im Fall n = 2 also eine Gerade. Wir 1 ⎝ ⎠
w = 14 2 bezüglich der geordneten Standardbasis
untersuchen solche Spiegelungen etwas näher. 3
die Darstellungsmatrix
Offenbar erfüllt jede Spiegelung σw die Eigenschaften:
⎛ ⎞ ⎛ ⎞
σw (w) = −w. 1 2 3 6 −2 −3
Aus v ⊥ w folgt σw (v) = v. E3 − 1/7 ⎝2 4 6⎠ = 1/7 ⎝−2 3 −6⎠
Für alle v ∈ Rn gilt σw2 (v) = v. 3 6 9 −3 −6 −2
Damit erhalten wir sehr einfach eine geordnete Ortho-
normalbasis des Rn bezüglich der σw eine Diagonalge- Kommentar: In manchen Büchern verlangt man nicht,
stalt hat: Wir wählen die geordnete Orthonormalbasis dass der Vektor w die Länge 1 hat, und betrachtet statt-
(w, b2 , . . . , bn ), wobei (b2 , . . . , bn ) eine geordnete Or- dessen für einen beliebigen Vektor w = 0 aus dem Rn die
thonormalbasis des (n − 1) -dimensionalen Untervektor- Abbildung
raums w⊥ ist. Für die Darstellungsmatrix B M(σw )B be-  n
züglich dieser Basis B gilt: R → Rn
⎛ ⎞ σw :
−1 0 · · · 0 v → v − 2 ww··wv w
⎜ 0 1 · 0⎟
⎜ ⎟ und nennt sie Spiegelung. Diese Abbildung wirkt kompli-
D = B M(σw )B = ⎜ . .. ⎟
⎝ .. . ⎠ zierter, tatsächlich sorgt aber der Nenner im Bruch für die
0 ··· 1 Normierung, die wir für w vorausgesetzt haben.
17.5 Orthogonale und unitäre Endomorphismen 685

Hat umgekehrt eine Matrix A ∈ Kn×n die Eigenschaft Orthogonale bzw. unitäre Endomorphismen und
0 0
A A = En , so gilt wie eben auch A A = En , also bilden orthogonale bzw. unitäre Matrizen
sowohl die Spalten als auch die Zeilen von A eine Orthonor- Für eine Matrix A ∈ Kn×n ist der Endomorphismus
malbasis des Kn bezüglich des kanonischen Skalarprodukts.
 n
K → Kn ,
Matrizen mit dieser Eigenschaft bekommen einen eigenen ϕA :
v → A v
Namen.
genau dann orthogonal (K = R) bzw. unitär (K = C) be-
Orthogonale und unitäre Matrizen züglich des kanonischen Skalarprodukts, wenn die Ma-
Eine reelle bzw. komplexe n × n-Matrix mit der Eigen- trix A orthogonal bzw. unitär ist.
schaft
0
A A = En
Beweis: Es ist nur noch zu zeigen, dass die Matrix A
heißt orthogonale bzw. unitäre Matrix. orthogonal bzw. unitär ist, wenn ϕA orthogonal bzw. unitär
Die Zeilen und Spalten einer orthogonalen bzw. unitären bezüglich des kanonischen Skalarprodukts ist.
n × n -Matrix bilden Orthonormalbasen des Rn bzw. Cn .
Die Determinante jeder orthogonalen bzw. unitären Ma- Ist nun ϕA orthogonal bzw. unitär, so gilt für alle v und w aus
Kn :
trix A ∈ Kn×n hat den Betrag 1,

| det A| = 1 . v 0 w = v · w = (A v) · (A w) = v 0 A0 A w .

Setzt man hier die Standardeinheitsvektoren ei für v und


Beweis: Wir bestimmen die Determinante einer orthogo- ej für w ein, so erhält man rechts die Komponente aij von
nalen bzw. unitären Matrix A ∈ Kn×n : A0 A und links 0, falls i = j , und 1, falls i = j . Damit gilt
A0 A = En . 
0
1 = det En = det A A
(i) 0 (ii) Weil die Matrix A ∈ Kn×n gerade die Darstellungsmatrix
= det A det A = det A det A
A = En M(ϕA )En von ϕA bezüglich der kanonischen Basis
(iii)
= det A det A = | det A| . ist, kann dieses Ergebnis zusammengefasst auch in folgender
Art formuliert werden:
Dabei haben wir bei (i) den Determinantenmultiplikations-
satz (siehe Seite 474) benutzt. Bei (ii) haben wir ausgenutzt, Folgerung
dass die Determinanten zueinander transponierter Matrizen Die Darstellungsmatrix des Endomorphismus ϕA ist
gleich sind (siehe Seite 473). Und zu (iii) beachte man die genau dann orthogonal bzw. unitär, wenn ϕA bezüglich des
Leibniz’sche Formel auf Seite 471, wonach die Determinante kanonischen Skalarprodukts orthogonal bzw. unitär ist.
eine Summe von Produkten komplexer Zahlen ist. 

Wir verallgemeinern dieses Ergebnis für beliebige Skalar-


produkte endlichdimensionaler Vektorräume.
Achtung: Eine orthogonale Matrix hat die Determinante
+1 oder −1 und die Determinante einer unitären Matrix liegt
auf dem Einheitskreis {z ∈ C | |z| = 1}.
Die Darstellungsmatrizen von orthogonalen
bzw. unitären Endomorphismen bezüglich
? Orthonormalbasen sind orthogonal bzw.
Sind die Matrizen unitär
⎛ ⎞ ⎛ ⎞
0 −1 0 2 −1 2
1
⎝ 0 0 −1⎠ und ⎝ 2 2 −1⎠ Wir geben uns in einem endlichdimensionalen euklidischen
3 bzw. unitären Vektorraum V eine Orthonormalbasis B =
−1 0 0 −1 2 2
(b1 , . . . , bn ) vor. Eine solche existiert stets, man kann sie
aus einer Basis mit dem Verfahren von Gram und Schmidt
orthogonal?
konstruieren.
Wir zeigen, dass zwei Vektoren v, w ∈ V genau dann senk-
Die Matrizen S α und D α aus obigem Beispiel sind somit or- recht aufeinander stehen, wenn es ihre Koordinatenvektoren
thogonal. Und tatsächlich folgte die Orthogonalität der Ab- aus Rn bzw. Cn bezüglich der Basis B und des kanonischen
bildungen σα und δα bezüglich des kanonischen Skalarpro- Skalarprodukts tun, d. h.:
dukts nur aus dieser Eigenschaft. Wir erhalten viel allgemei-
ner: v·w =0 ⇔ Bv · Bw = 0.
686 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Achtung: Der Punkt · links des Äquivalenzzeichens ist ?


das Skalarprodukt in V , der Punkt · rechts des Äquivalenz- Beachten Sie, dass in diesem Satz kein mathematisches Sym-
zeichens ist das kanonische Skalarprodukt im Kn . bol auftaucht. Können Sie diese Aussage mit möglichst vie-
len Symbolen formulieren ?
Sind nämlich v = λ1 b1 + · · · + λn bn und w = μ1 b1 +
· · · + μn bn mit λi , μj ∈ K, so ist wegen der Linearität des
Skalarprodukts und bi · bj = 0 für i  = j :
Eigenwerte orthogonaler und unitärer
v · w = (λ1 b1 + · · · + λn bn ) · (μ1 b1 + · · · + μn bn ) Matrizen haben den Betrag 1 und Eigen-
= (λ1 μ1 ) (b1 · b1 ) + · · · + (λn μn ) (bn · bn ) vektoren zu verschiedenen Eigenwerten
= λ1 μ1 + · · · + λn μn = B v · B w , sind senkrecht
also gerade das kanonische Skalarprodukt der Koordinaten-
Ist λ Eigenwert einer orthogonalen bzw. unitären Matrix
vektoren.
A ∈ Kn×n und v ∈ Kn ein Eigenvektor zum Eigenwert λ, so
Wir betrachten nun einen Endomorphismus ϕ des euklidi- gilt wegen der Längenerhaltung und der Normeigenschaften
schen bzw. unitären Vektorraums V und bilden die Darstel- der Länge:
lungsmatrix dieses Endomorphismus bezüglich der Ortho-
normalbasis B v = A v = λ A = λ v = |λ| v ,

A = B M(ϕ)B = (B ϕ(b1 ), . . . , B ϕ(bn )) . wegen v = 0, also |λ| = 1.

Man beachte, dass mit obiger Gleichung v · w = Bv · Bw Eigenwerte und Eigenvektoren orthogonaler bzw.
insbesondere auch unitärer Matrizen
ϕ(v) · ϕ(w) = B ϕ(v) · B ϕ(w) Ist λ ein Eigenwert einer orthogonalen bzw. unitären Ma-
trix, so gilt |λ| = 1.
gilt. Wir berechnen nun das Produkt A0 A:
Eigenvektoren orthogonaler bzw. unitärer Matrizen zu
⎛ 0⎞
B ϕ(b1 ) verschiedenen Eigenwerten stehen senkrecht aufeinan-
⎜ .. ⎟
A0 A = ⎝ . ⎠ (B ϕ(b1 ), . . . , B ϕ(bn ))
der.
0
B ϕ(bn ) Insbesondere können damit höchstens 1 und −1 reelle Eigen-
⎛ 0 0 ⎞
B ϕ(b1 ) B ϕ(b1 ) · · · B ϕ(b1 ) B ϕ(bn ) werte orthogonaler bzw. unitärer Matrizen sein; und die kom-
⎜ .. .. ⎟ plexen Eigenwerte liegen auf dem Einheitskreis (Abb. 17.17).
=⎝ . . ⎠
0 0
B ϕ(bn ) B ϕ(b1 ) · · · B ϕ(bn ) B ϕ(bn )
Beweis: Sind λ1 und λ2 verschiedene Eigenwerte einer
Ist nun ϕ ein orthogonaler bzw. unitärer Endomorphismus, orthogonalen bzw. unitären Matrix A ∈ Kn×n mit den Eigen-
d. h. ϕ(v) · ϕ(w) = v · w, so können wir also ϕ in den n2 vektoren v 1 zu λ1 und v 2 zu λ2 , so gilt mit dem kanonischen
Produkten weglassen, damit folgt dann, weil die Elemente Skalarprodukt · im Kn :
der Basis B ja eine Orthonormalbasis bilden:
v 1 · v 2 = (A v 1 ) · (A v 2 ) = (λ1 v 1 ) · (λ2 v 2 )
A0 A = En .
= λ1 λ2 · (v 1 · v 2 ) .
Also ist die Matrix A orthogonal bzw. unitär. Ist umgekehrt
vorausgesetzt, dass die Matrix A orthogonal bzw. unitär ist, Aus v 1 · v 2 = 0 folgte λ1 λ2 = 1, wegen λ2 = λ−1 2 somit
d. h., A0 A = En , so zeigt obige Darstellung des Produkts, λ1 = λ2 , ein Widerspruch. Damit gilt v 1 · v 2 = 0. 

dass ϕ(bi ) · ϕ(bj ) = bi · bj für alle i, j . Weil B eine Basis


ist, folgt daraus, dass ϕ orthogonal bzw. unitär ist. Wir haben
gezeigt:
Die orthogonalen 2 × 2-Matrizen sind
Spiegelungs- oder Drehmatrizen
Darstellungsmatrizen orthogonaler bzw. unitärer En-
domorphismen
In den Beispielen auf Seite 683 haben wir die (reellen) or-
Die Darstellungsmatrix eines Endomorphismus eines thogonalen Matrizen
endlichdimensionalen euklidischen bzw. unitären Vek- ' ( ' (
torraums bezüglich einer Orthonormalbasis ist genau cos α sin α cos α − sin α
Sα = und D α =
dann orthogonal bzw. unitär, wenn der Endomorphis- sin α − cos α sin α cos α
mus orthogonal bzw. unitär ist.
für α ∈ [0, 2 π [ angegeben.
17.5 Orthogonale und unitäre Endomorphismen 687

Im (λ) Dreireihige orthogonale Matrizen stellen


1 Spiegelungen, Drehungen oder
Drehspiegelungen dar

Im R3 gibt es drei Arten von orthogonalen Matrizen:


Spiegelungs-, Dreh- und Drehspiegelungsmatrizen.
−1 1 Re (λ)
Wir betrachten zuerst den Fall einer orthogonalen 3 × 3-
Matrix A mit der Determinante +1:
Jeder der eventuell komplexen Eigenwerte λ1 , λ2 , λ3 von A
−1 hat den Betrag 1. Die Determinante von A ist das Produkt
Abbildung 17.17 Die Eigenwerte orthogonaler und unitärer Matrizen liegen der Eigenwerte:
auf dem Einheitskreis. 1 = λ1 λ2 λ3 .
Sind alle drei Eigenwerte λ1 , λ2 , λ3 reell, so muss also einer
der Eigenwerte gleich 1 sein. Ist aber einer der Eigenwerte
Wir nennen S α eine 2 × 2-Spiegelungsmatrix und D α eine
komplex, etwa λ1 ∈ C \ R, so ist wegen χA ∈ R[X] auch λ1
2 × 2-Drehmatrix.
ein Eigenwert, also etwa λ1 = λ2 . Damit erhalten wir aber
Tatsächlich gibt es keine weiteren orthogonalen 2 × 2- wegen λ1 λ2 = 1 sogleich λ3 = 1.
Matrizen außer diesen. Wir begründen das: Damit hat also A auf jeden Fall den Eigenwert 1 und damit
' ( auch einen Eigenvektor zum Eigenwert 1. Der Eigenraum
a b
Ist die Matrix A = orthogonal, so folgt aus A0 A = zum Eigenwert 1 ist entweder ein- oder dreidimensional, in
c d
jedem Fall ist also folgende Bezeichnung sinnvoll:
E2 , d. h. A−1 = A0 , und det A = a d − b c ∈ {±1}:
Wir nennen eine orthogonale Matrix A ∈ R3×3 mit det A = 1
' ( ' (−1 ' (0 ' ( eine Drehmatrix.
1 d −b a b a b a c
= = =
det A −c a c d c d b d ?
⎧ ' ( Wieso kann der Eigenraum zum Eigenwert 1 eigentlich nicht

⎪ a b zweidimensional sein ?
⎨A = , falls det A = −1,
⇔ 'b −a (

⎪ a −b
⎩A = , falls det A = 1 . Zu jeder Drehmatrix A ∈ R3×3 existiert also ein normierter
b a
Eigenvektor b1 zum Eigenwert 1.

' ( Wir wählen einen solchen und ergänzen diesen zu einer Or-
Zu dem Punkt
a
∈ R2 mit a 2 + b2 = 1 gibt es genau ein thonormalbasis (b1 , b2 , b3 ) des R3 . Mit der orthogonalen
b Matrix S = (b1 , b2 , b3 ) gilt dann:
α ∈ [0, 2 π[ mit a = cos α und b = sin α. Also gilt: ⎛ ⎞
1 0 0
M = S 0 A S = ⎝0 r s ⎠
Diagonalisierbarkeit orthogonaler 2 × 2-Matrizen 0 t u
Ist A ∈ R2×2 orthogonal, so gilt: Nun ist auch die Matrix M orthogonal, da
' (
A=
cos α sin α
= S α , falls det A = −1, M 0 M = (S 0 A S)0 (S 0 A S) = S 0 A0 A S = E3 .
sin α − cos α ' (
' ( r s
cos α − sin α Und weil det = det M = det S 0 det A det S =
A= = D α , falls det A = 1 . t u
sin α cos α det A = 1, folgt die Existenz eines α ∈ [0, 2 π [ mit
Jede 2 × 2-Spiegelungsmatrix S α ist diagonalisierbar. ' ( ' (
r s cos α − sin α
=
Eine 2 × 2-Drehmatrix D α mit α ∈ [0, 2 π[ ist genau t u sin α cos α
dann diagonalisierbar, wenn α ∈ {0, π}. Damit haben wir gezeigt, dass es zu jeder orthogonalen 3×3-
Matrix A mit Determinante +1, d. h. zu jeder Drehmatrix,
eine orthogonale Matrix S und ein α ∈ [0, 2 π[ gibt mit
Drehmatrizen über R sind also nicht immer diagonalisier- ⎛ ⎞
bar. Wir können aber jede solche (orthogonale) Drehmatrix 1 0 0
auch als eine unitäre Matrix über C auffassen (siehe Auf- S 0 A S = ⎝0 cos α − sin α ⎠
gabe 17.10). 0 sin α cos α
688 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Ist α = 0, so nennt man den dann eindimensionalen Eigen- 2. Fall: α = 0. Es handelt sich dann bei
raum zum Eigenwert 1 einer Drehmatrix A die Drehachse ⎛ ⎞
der Drehung v → A v. −1 0 0
M = ⎝ 0 cos α − sin α ⎠
0 sin α cos α
Drehachse
um die Darstellungsmatrix einer Drehspiegelung.

Die orthogonalen 3 × 3-Matrizen


Jede orthogonale 3×3-Matrix A ist entweder eine Dreh-
matrix, eine Spiegelungsmatrix oder eine Drehspiege-
lungsmatrix.
In jedem Fall gibt es eine orthogonale Matrix S ∈ R3×3
und ein α ∈ [0, 2 π[ mit
⎛ ⎞
±1 0 0
Abbildung 17.18 Die Drehachse einer Drehung im R3 ist der Eigenraum zum
Eigenwert 1.
S 0 A S = ⎝ 0 cos α − sin α ⎠
0 sin α cos α
Eine solche Darstellung einer Drehmatrix bezeichnet man
als ihre Normalform und meint damit, dass diese Form die Drehmatrizen und Drehspiegelungsmatrizen lassen sich über
einfachste Darstellung ist. R im Allgemeinen nicht diagonalisieren. Fasst man aber eine
solche orthogonale 3 × 3-Matrix wieder als eine unitäre Ma-
? trix über C auf, so kann man sie diagonalisieren. Wir zeigen
Wie sieht die Darstellungsmatrix aus, wenn man die Vektoren gleich viel allgemeiner, dass unitäre Matrizen stets orthogo-
der Basis (b1 , b2 , b3 ) zyklisch vertauscht ? nal diagonalisierbar sind.

Nun wenden wir uns dem Fall zu, dass eine orthogonale Ma- Unitäre Matrizen sind diagonalisierbar,
trix A ∈ R3×3 die Determinante −1 hat. Wie oben zeigt orthogonale nicht immer
man, dass A in diesem Fall den Eigenwert −1 mit einem
zugehörigen normierten Eigenvektor b1 besitzt. Es gilt also Bei jeder unitären Matrix A ∈ Cn×n zerfällt das charakteris-
A b1 = −b1 . tische Polynom χA als Polynom über C stets in Linearfakto-
Wieder ergänzen wir diesen Eigenvektor zu einer geordneten ren:
Orthonormalbasis (b1 , b2 , b3 ) des R3 . Wir erhalten mit der χA = (λ1 − X) · · · (λn − X)
orthogonalen Matrix S = (b1 , b2 , b3 ) die ebenfalls ortho- mit nicht notwendig verschiedenen λ1 , . . . , λn ∈ C.
gonale Matrix
Wir folgern nun, dass für solche Matrizen stets algebraische


−1 0 0 und geometrische Vielfachheit für jeden Eigenwert überein-
M = S0A S = ⎝ 0 r s ⎠ stimmen. Insbesondere sind also unitäre Matrizen stets dia-
0 t u gonalisierbar. Wir folgern dieses Ergebnis aus dem Satz:
' (
r s Unitäre Endomorphismen sind diagonalisierbar
Wegen − det = det M = det A = −1 folgt wieder:
t u
Ist ϕ ein unitärer Endomorphismus eines endlichdimen-
' ( ' ( sionalen unitären Vektorraums V mit den Eigenwerten
r s cos α − sin α
= λ1 , . . . , λn , so existiert eine Orthonormalbasis B von V
t u sin α cos α
aus Eigenvektoren von ϕ, d. h.
für ein α ∈ [0, 2 π[. ⎛ ⎞
λ1 0
1. Fall: α = 0. Es handelt sich dann bei ⎜ .. ⎟
B M(ϕ)B =⎝ . ⎠
⎛ ⎞
−1 0 0 0 λn
M = ⎝ 0 1 0⎠
0 0 1
Beweis: Wir beweisen den Satz durch Induktion nach der
um die Darstellungsmatrix der Spiegelung entlang b1 (siehe Dimension n von V . Ist n = 1, so ist die Behauptung richtig,
Seite 684). Damit ist erkannt, dass A die Darstellungsmatrix da man jede von Null verschiedene komplexe Zahl als ein-
einer Spiegelung, kurz eine Spiegelungsmatrix, ist. ziges Element einer solchen Orthonormalbasis wählen kann,
17.5 Orthogonale und unitäre Endomorphismen 689

jede solche Zahl ist ein Eigenvektor von ϕ. Setzen wir also Die Dimension jedes Eigenraums ist der Exponent des zuge-
nun voraus, dass n > 1 ist und die Behauptung für alle Zahlen hörigen Eigenwerts im charakteristischen Polynom.
m < n gilt.
Damit ist klar, wie wir vorgehen, um zu einer unitären Matrix
Ist v 1 ein Eigenvektor zum Eigenwert λ1 von ϕ, so betrachten A ∈ Cn×n eine Orthonormalbasis bestehend aus Eigenvek-
wir das orthogonale Komplement zum Erzeugnis von v 1 : toren von A zu konstruieren:

U = -v 1 .⊥ = {v ∈ V | v 1 · v = 0} . Bestimme die Eigenwerte als Nullstellen des charakteris-


tischen Polynoms.
Die Einschränkung des unitären Endomorphismus ϕ auf den Bestimme Basen der Eigenräume, wobei man jeweils als
Untervektorraum U von V , also die Abbildung Basis gleich eine Orthonormalbasis wählt. Falls dies nicht
 mit freiem Auge möglich ist, so wende man das Orthonor-
U → V, malisierungsverfahren von Gram und Schmidt an.
ϕ|U :
v  → ϕ(v) Die Vereinigung der Orthonormalbasen der Eigenräume
ist dann eine Orthonormalbasis des Cn aus Eigenvektoren
hat wegen von A.

λ1 (v 1 · ϕ(v)) = (λ1 v 1 ) · ϕ(v)


Beispiel Die Matrix
= ϕ(v 1 ) · ϕ(v)
⎛ 1+i −1+i

= v1 · v 2 2 0
⎜ ⎟
=0 A= ⎜ −1+i 0⎟ 3×3
⎠∈C
1+i
⎝ 2 2

für alle v ∈ V die Eigenschaft, eine Abbildung von U in 0 0 i


U zu sein, ϕ(U ) ⊆ U – man beachte, dass λ1  = 0 wegen
ist unitär, also diagonalisierbar. Die Eigenwerte von A sind
|λ1 | = 1 gilt. Und weil U als Untervektorraum eines unitären
die Nullstellen des charakteristischen Polynoms:
Vektorraumes selbst wieder ein unitärer Vektorraum ist und
die Dimension von U gleich n − 1 < n ist, ist die Induktions- χA = (i − X)2 (1 − X) .
voraussetzung auf U anwendbar: Der Vektorraum U besitzt
eine geordnete Orthonormalbasis B  = (b2 , . . . , bn ) mit Damit haben wir den einfachen Eigenwert 1 und den doppel-
⎛ ⎞ ten Eigenwert i. Nun bestimmen wir die Eigenräume:
λ2 0
⎜ .. ⎟ ⎛ ⎞
B  M(ϕ|U )B  =⎝ . ⎠ ? √1 @
⎜ 2 ⎟
0 λn EigA (1) = ker(A − E3 ) = ⎜− √ ⎟
1 ,
⎝ 2⎠
Wir normieren den Eigenvektor v 1 , setzen also b1 = v 1 −1 · 0

v 1 , B = (b1 , . . . , bn ), und erhalten so die gewünschte Dar- =:b1
stellung. ⎛ ⎞

? √1 ⎛ ⎞
⎜ 2⎟ 0 @
EigA (i) = ker(A − i E3 ) = ⎜ √1 ⎟, ⎝ 0⎠ .
Für unitäre Matrizen besagt dieser Satz: ⎝ 2⎠
−i
0 
 =:b3
Unitäre Matrizen sind diagonalisierbar =:b2

Ist A ∈ Cn×n eine unitäre Matrix mit den Eigenwerten


Die angegebenen Eigenvektoren b1 , b2 , b3 bilden bereits
λ1 , . . . , λn , so existiert eine unitäre Matrix S ∈ Cn×n
eine Orthonormalbasis des C3 . Mit der Matrix S =
mit ⎛ ⎞
λ1 0 (b1 , b2 , b3 ) gilt:
0 ⎜ .. ⎟ ⎛ ⎞
S AS = ⎝ . ⎠ 1 0 0
0 λn ⎝0 i 0⎠ = S 0 A S . 
0 0 i
Dabei sind die Spalten von S eine Orthonormalbasis des
Cn aus Eigenvektoren von A.
Unitäre Matrizen lassen sich immer diagonalisieren. Wir wis-
Ist A eine unitäre Matrix, so existiert nach dem Satz eine Or- sen, dass dies bei orthogonalen Matrizen anders ist. Bei den
thonormalbasis des Cn aus Eigenvektoren von A. Folglich 3×3-Matrizen haben wir uns auf eine gewisse schönste Form,
existieren n linear unabhängige Eigenvektoren zu A. Damit die Normalform, geeinigt (siehe Seite 688). Und tatsächlich
muss für jeden Eigenwert von A die geometrische Vielfach- gibt es so eine Form auch für beliebig große orthogonale
heit gleich der algebraischen sein, d. h.: Matrizen. Wir zeigen das auf Seite 704.
690 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Jeder orthogonale Endomorphismus ist ein Für W = -v.⊥ gilt ϕ  (W ) = W , denn für u ∈ W gilt:
Produkt von Spiegelungen
v · ϕ  (u) = ϕ  (v) · ϕ  (u) = v · u = 0 .
Die Spiegelungen sind die Bausteine der orthogonalen Endo- Folglich ist ϕ  |W ein orthogonaler Endomorphismus des
morphismen, da jeder orthogonale Endomorphismus ein Pro- n − 1-dimensionalen euklidischen Vektorraums W bezüg-
dukt von Spiegelungen ist. Man hat sogar eine obere Grenze lich des kanonischen Skalarprodukts von W . Nach Induk-
für die Anzahl der Spiegelungen, die hierzu als Faktoren auf- tionsvoraussetzung gibt es normierte w 2 , . . . , wk ∈ W mit
tauchen. Diese obere Grenze ist die Dimension des Vektor- k ≤ n und
raums, in dem die Spiegelung betrachtet wird; genauer: ϕ  |W = σw2 ◦ . . . ◦ σwk .

Zerlegung orthogonaler Endomorphismen Wir zeigen nun ϕ  = σw2 ◦ . . . σwk , wobei wir die σwi als
Spiegelungen auf V auffassen. Dabei benutzen wir, dass sich
Jeder orthogonale Endomorphismus ϕ des Rn ist ein Pro-
jeder Vektor v ∈ V wegen V = R v + W in der Form
dukt von höchstens n Spiegelungen, d. h., es gibt nor-
v = λv + u schreiben lässt.
mierte w 1 , . . . , wk ∈ Rn mit k ≤ n und
Sind u ∈ W und λ ∈ R, so erhalten wir:
ϕ = σw1 ◦ · · · ◦ σwk .
(σw2 ◦ . . . ◦ σwk )(λv + u) = λ (σw2 ◦ . . . ◦ σwk )(v)
Die Identität betrachten wir dabei als ein Produkt von 0 + (σw2 ◦ . . . ◦ σwk )(u)
Spiegelungen.
= λv + ϕ  (u)
= λ ϕ  (v) + ϕ  (u)
Beweis: Ist ϕ ein orthogonaler Endomorphismus ungleich = ϕ  (λ v + u) .
der Identität, so wählen wir ein v ∈ Rn mit ϕ(v)  = v. Dann
gilt (v − ϕ(v)) · v = 0, da andernfalls v2 = ϕ(v) · ϕ(v) = Damit gilt ϕ = σw ◦ σw2 ◦ . . . ◦ σwk mit k ≤ n. 

(v − (v − ϕ(v)) · (v − (v − ϕ(v))) = v2 + v − ϕ(v)2 ,


also v = ϕ(v) folgte (vgl. auch Abb. 17.19).
Beispiel Wir betrachten die orthogonale 3 × 3-Matrix
⎛ ⎞
2 −1 2
1⎝
v − ϕ(v) A= 2 2 −1 ⎠
3
−1 2 2
v ϕ(v)
Es gilt det A = 1. Weil A = E3 gilt, ist A ein Produkt
von zwei Spiegelungsmatrizen. Wir zerlegen nun A in ein
Produkt von Spiegelungsmatrizen.
Abbildung 17.19 Der Vektor v − ϕ(v) steht nicht senkrecht auf v.
⎛ ⎞
2
Wegen A e1 = 1/3 ⎝ 2 ⎠ gilt A e1 = e1 . Wir wählen also
Wir setzen nun w = v − ϕ(v)  = 0. Wegen −1
⎛ ⎞
w·v v · v − ϕ(v) · v 1
= = 1/2
w·w v · v + ϕ(v) · ϕ(v) − 2 ϕ(v) · v v = e1 und setzen w = v − A v = 1/3 ⎝−2⎠. Wir bilden
1
gilt also σ 1 (v) = v −2 ww··wv w = v −w = v +ϕ(v)−v =
w w 2
ϕ(v). S w = E3 − 0 w w0
w w
⎛ ⎞ ⎛ ⎞
x2 3 0 0 1 −2 1
ϕ(v) 2
= 1/3 ⎝0 3 0⎠ − 1/9 ⎝−2 4 −2⎠
6/9
0 0 3 1 −2 1
⎛ ⎞
2 2 −1
v = 1/3 ⎝ 2 −1 2 ⎠ und berechnen
x1 −1 2 2
A = S −1
w A = Sw A
w ⎛ ⎞⎛ ⎞
2 2 −1 2 −1 2
= 1/9 ⎝ 2 −1 2 ⎠ ⎝ 2 2 −1⎠
Abbildung 17.20 Die Spiegelung erfolgt entlang w.
−1 2 2 −1 2 2
⎛ ⎞
Und nun begründen wir durch Induktion nach n die Behaup- 1 0 0
tung. Wir betrachten die Abbildung ϕ  = σw−1 ◦ ϕ. Es ist ϕ  = ⎝0 0 1⎠ .
ein orthogonaler Endomorphismus mit ϕ  (v) = v. 0 1 0
17.6 Selbstadjungierte Endomorphismen 691

Weil wir wissen, dass A ein Produkt zweier Spiegelungsma- dischen bzw. unitären Vektorraums V mit dem Skalarprodukt
trizen ist, muss A eine Spiegelungsmatrix⎛sein.⎞Wir können · gilt:
0 v · w = ϕ(v) · ϕ(w)
dies aber auch nachprüfen. Es ist a 1 = ⎝−1⎠ ein Eigen-
für alle v, w ∈ V . Selbstadjungierte Endomorphismen sind
1
⎛ ⎞ ⎛ ⎞ ganz ähnlich erklärt:
1 0
vektor zum Eigenwert −1, und a 2 = ⎝0⎠, a 3 = ⎝1⎠ sind
0 1 Selbstadjungierter Endomorphismus
Eigenvektoren zum Eigenwert 1. Die Matrix S = Man nennt einen Endomorphismus ϕ eines euklidischen
(s 1 , s 2 , s 3 ) mit den Spalten s i = a1i  a i erfüllt dann bzw. unitären Vektorraums V selbstadjungiert, wenn
⎛ ⎞ für alle v, w ∈ V gilt:
−1 0 0
0 
S A S = ⎝ 0 1 0⎠ . ϕ(v) · w = v · ϕ(w) .
0 0 1
Wir erhalten die gewünschte Zerlegung: Beispiel
⎛ ⎞⎛ ⎞ Ist A ∈ Kn×n eine symmetrische bzw. hermitesche Ma-
2 2 −1 1 0 0 trix, gilt also A0 = A, so ist der Endomorphismus
A = 1/9 ⎝ 2 −1 2 ⎠ ⎝0 0 1⎠ .  ϕ = ϕA : v → A v des Kn bezüglich des kanonischen
−1 2 2 0 1 0 Skalarprodukts selbstadjungiert, da für alle v, w ∈ Kn
gilt:
Wir haben nun ausführlich orthogonale bzw. unitäre Endo-
ϕ(v) · w = (A v)0 w = v 0 A0 w
morphismen euklidischer bzw. unitärer Vektorräume behan-
delt. Nun betrachten wir weitere Endomorphismen euklidi- = v 0 (A w) = v · ϕ(w) .
scher bzw. unitärer Vektorräume.
Im euklidischen Vektorraum V aller auf dem Intervall
I = [a, b] stetiger reellwertiger Funktionen mit dem Ska-
larprodukt
J b
17.6 Selbstadjungierte -f, g. = f (t) g(t) dt
Endomorphismen a
ist für jede fest gewählte Funktion h ∈ V der Endomor-
phismus
Wir behandeln in diesem Abschnitt eine weitere wichtige

Art von Endomorphismen euklidischer bzw. unitärer Vek- V → V,
ϕ:
torräume, die sogenannten selbstadjungierten Endomorphis- f → f · h
men. Der Begriff selbstadjungiert steht für den reellen wie
auch den komplexen Fall, eine Unterscheidung wie bei or- selbstadjungiert, da
thogonal und unitär gibt es nicht. Es ist allerdings bei den J b J b
Darstellungsmatrizen eine Unterscheidung üblich: Die Dar- -f, ϕ(g). = f (t) g(t) h(t) dt = f (t) h(t) g(t) dt
stellungsmatrix selbstadjungierter Endomorphismen eukli- a a

discher Vektorräume sind symmetrisch, jene selbstadjungier- = -ϕ(f ), g. für alle f, g ∈ V .


ter Endomorphismen unitärer Vektorräume hingegen hermi-
tesch. x2
Das wichtigste Resultat lässt sich leicht formulieren:
ϕ(v)
Selbstadjungierte Endomorphismen lassen sich stets diago-
nalisieren. ϕ(w) w

Folglich sind auch reelle symmetrische und hermitesche Ma- 120◦


trizen stets diagonalisierbar. 30◦
e1 = v x1
Mit K bezeichnen wir wieder einen der Körper R oder C – je
nachdem, ob wir im euklidischen oder unitären Fall sind.

Selbstadjungierte Endomorphismen sind


durch ϕ(v) · w = v · ϕ(w) definiert
Abbildung 17.21 Die Drehung um den Winkel 120 Grad ist nicht selbstadjun-
Wir erinnern an die orthogonalen bzw. unitären Endomor- giert bezüglich des kanonischen Skalarprodukts, es ist nämlich ϕ(v) · w = 0 =
phismen. Für jeden solchen Endomorphismus ϕ eines eukli- v · ϕ(w).
692 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Jede Spiegelung σ des Rn ist selbstadjungiert. Es folgt Wir erhalten nun für die Komponente aij der Darstellungs-
nämlich aus σ −1 = σ und der Orthogonalität von σ für matrix wegen der Orthonormalität von B den Ausdruck:
alle v, w ∈ V :
bi · ϕ(bj ) = bi · (a1j b1 + · · · + anj bn ) = a ij
−1
σ (v) · w = v · σ (w) = v · σ (w) . und analog für aj i :
Ein anderes Argument ist die Symmetrie der Darstellungs- ϕ(bi ) · bj = (a1i b1 + · · · + ani bn ) · bj = aj i .
matrizen von Spiegelungen.
Nicht selbstadjungiert ist die Drehung ϕ im R'2 um Wegen bi · ϕ(bj ) = ϕ(bi ) · bj folgt also aij = a j i . 
( den
1
Winkel 120 Grad. So gilt etwa für den Vektor v , dass
0 Mit diesem Satz haben wir die selbstadjungierten Endomor-
' ( '√ (
−1/2 3/2 phismen durch reelle symmetrische bzw. hermitesche Dar-
ϕ(v) = √ und w = , also
3/2 1/2 stellungsmatrizen bezüglich Orthonormalbasen beschrieben.
0 = ϕ(v) · w  = v · ϕ(w) . 
Eigenwerte reeller symmetrischer bzw.
hermitescher Matrizen sind reell
Darstellungsmatrizen selbstadjungierter
Endomorphismen bezüglich Orthonormal- Ist λ ∈ K ein Eigenwert einer reellen symmetrischen bzw.
basen sind symmetrisch bzw. hermitesch hermiteschen Matrix A ∈ Kn×n und v = (vi ) ∈ Kn ein
0
Eigenvektor zum Eigenwert λ, so gilt wegen A = A und
Nach obigem Beispiel bestimmt jede reelle symmetrische A v = λ v:
bzw. hermitesche Matrix A ∈ Kn×n durch ϕ : v  → A v einen
selbstadjungierten Endomorphismus des Kn . Diese Matrix λ (v 0 v) = v 0 λ v = v 0 A v = (A v)0 v = λ (v 0 v) .
ist dann auch Darstellungsmatrix dieses Endomorphismus n
bezüglich einer Orthonormalbasis, nämlich der kanonischen Nun folgt wegen v = 0 zuerst v 0 v = |vi |2 = 0 und dann
i=1
Orthonormalbasis En . λ = λ, also λ ∈ R.
Wir überlegen uns, dass die Darstellungsmatrizen selbstad-
jungierter Endomorphismen bezüglich beliebiger Orthonor- Eigenwerte symmetrischer und hermitescher
malbasen reell symmetrisch bzw. hermitesch sind. Matrizen
Ist λ ein Eigenwert einer reellen symmetrischen bzw.
Darstellungsmatrizen selbstadjungierter Endo- hermiteschen Matrix, so ist λ reell.
morphismen
Ist ϕ ein selbstadjungierter Endomorphismus eines end- Wir wissen aber bisher noch nichts über die Existenz von
lichdimensionalen euklidischen bzw. unitären Vektor- Eigenwerten reeller symmetrischer bzw. hermitescher Ma-
raums mit einer geordneten Orthonormalbasis B, so gilt trizen. Wir haben nur gezeigt, dass, wenn eine solche Matrix
für die Darstellungsmatrix A = B M(ϕ)B : einen Eigenwert hat, dieser dann zwangsläufig reell ist. Tat-
sächlich ist es aber so, dass jede reelle symmetrische bzw.
0 hermitesche n × n-Matrix auch n Eigenwerte hat, hierbei
A0 = A bzw. A = A .
zählen wir die Eigenwerte entsprechend ihrer algebraischen
Vielfachheiten. Die Begründung erfolgt über einen Ausflug
Beweis: Es reicht aus, wenn wir das für den komplexen ins Komplexe.
Fall zeigen, der reelle Fall ergibt sich dann einfach durch
Weglassen der Konjugation.
Jede symmetrische n × n-Matrix hat n reelle
Wir wählen eine beliebige Orthonormalbasis B =
Eigenwerte
(b1 , . . . , bn ) von V , insbesondere ist also die Dimension von
V gleich n.
Wir betrachten eine symmetrische Matrix A ∈ Rn×n . Diese
Ist A = (aij ) die Darstellungsmatrix des selbstadjungier- Matrix definiert einen selbstadjungierten Endomorphismus
ten Endomorphismus ϕ bezüglich B, so ist für alle i, j ∈ ϕA : v → A v des Rn . Hier setzen wir an: Wir erklären einen
{1, . . . , n} selbstadjungierten Endomorphismus in dem größeren Vek-
aij = a j i torraum Cn . Die Abbildung
 n
zu zeigen. Wir geben uns i, j ∈ {1, . . . , n} vor. Die j -te C → Cn ,
ϕ̃A :
Spalte von A ist der Koordinatenvektor des Bildes des j -ten v → A v
Basisvektors bj :
ist wegen A0 = A ein selbstadjungierter Endomorphismus
ϕ(bj ) = a1j b1 + · · · + anj bn . des Cn .
17.6 Selbstadjungierte Endomorphismen 693

Die Darstellungsmatrix En M(ϕ̃A )En = A ∈ Cn×n von ϕ̃A stimmen – wie wir gleich sehen werden – algebraische und
bezüglich der kanonischen Orthonormalbasis ist hermitesch. geometrische Vielfachheit für jeden Eigenwert überein. Ins-
besondere sind reelle symmetrische bzw. hermitesche Matri-
Mit dem Fundamentalsatz der Algebra folgt nun, dass das
zen also diagonalisierbar (siehe das Kriterium auf Seite 512).
charakteristische Polynom von A über C in Linearfaktoren
zerfällt:
χA = (λ1 − X)k1 · · · (λr − X)kr . Diagonalisierbarkeit selbstadjungierter Endo-
morphismen
Dabei sind λ1 , . . . , λr die verschiedenen Eigenwerte von A
Ist ϕ ein selbstadjungierter Endomorphismus eines n-
mit den jeweiligen algebraischen Vielfachheiten k1 , . . . , kr ,
dimensionalen euklidischen bzw. unitären Vektorraums
d. h., k1 + · · · + kr = n. Die Eigenwerte λ1 , . . . , λr sind
V mit den (reellen) Eigenwerten λ1 , . . . , λn , so existiert
reell.
eine Orthonormalbasis B von V aus Eigenvektoren von
Wegen χA = χϕ̃A = χϕA ∈ R[X] hat A ein in Linearfakto- ϕ mit ⎛ ⎞
ren zerfallendes charakteristisches Polynom, und damit hat λ1 0
⎜ .. ⎟
A die reellen Eigenwerte λ1 , . . . , λr . B M(ϕ)B = ⎝ . ⎠
0 λn
Eigenwerte symmetrischer bzw. hermitescher
Matrizen
Der Beweis geht ähnlich zu dem Beweis des Satzes zur Dia-
Jede symmetrische bzw. hermitesche n × n-Matrix hat n gonalisierbarkeit unitärer Endomorphismen.
nicht notwendig verschiedene Eigenwerte. Jeder Eigen-
wert ist reell.
Beweis: Wir beweisen den Satz durch Induktion nach der
Dimension n von V . Ist n = 1, so ist die Behauptung richtig,
Wir wollen nun noch begründen, dass es zu jeder reellen sym-
man kann jede von Null verschiedene reelle bzw. komplexe
metrischen bzw. hermiteschen Matrix A ∈ Kn×n eine Or-
Zahl als einziges Element einer solchen Orthonormalbasis
thonormalbasis des Kn aus Eigenvektoren von A gibt. Dazu
wählen, jede solche Zahl ist ein Eigenvektor von ϕ. Setzen
liefert der folgende Abschnitt einen ersten Anhaltspunkt.
wir also nun voraus, dass n > 1 ist und die Behauptung für
alle Zahlen m < n gilt.
Eigenvektoren zu verschiedenen Eigenwerten Ist v 1 ein Eigenvektor zum Eigenwert λ1 von ϕ, so betrachten
stehen senkrecht zueinander wir den Orthogonalraum zum Erzeugnis von v 1 :

Sind λ1 und λ2 verschiedene Eigenwerte einer reellen sym- U = -v 1 .⊥ = {v ∈ V | v 1 · v = 0} .


metrischen bzw. hermiteschen Matrix A ∈ Kn×n mit Eigen-
Die Einschränkung des selbstadjungierten Endomorphismus
vektoren v 1 zu λ1 und v 2 zu λ2 , so gilt mit dem Skalarprodukt
ϕ auf den Untervektorraum U von V , also die Abbildung
v · w = v 0 w des Kn wegen v 1 , v 2  = 0:

U → V,
λ1 (v 0 0 0 ϕ|U :
1 v 2 ) = (λ1 v 1 ) v 2 = (A v 1 ) v 2 v → ϕ(v)
= v0 0 0
1 A v 2 = v 1 (A v 2 )
hat wegen
= v0 0
1 (λ2 v 2 ) = λ2 (v 1 v 2 ) .
v 1 · ϕ(v) = ϕ(v 1 ) · v = (λ1 v 1 ) · v = λ1 (v 1 · v) = 0
Also muss v 1 · v 2 = v 0
1 v 2 = 0 gelten, da λ1  = λ2 = λ2
vorausgesetzt ist. für alle v ∈ V die Eigenschaft, eine Abbildung von U in U
zu sein, d. h. ϕ(U ) ⊆ U . Weil U als Untervektorraum eines
euklidischen bzw. unitären Vektorraums selbst wieder ein
Eigenvektoren symmetrischer bzw. hermitescher
euklidischer bzw. unitärer Vektorraum ist und die Dimension
Matrizen
von U gleich n − 1 ist, ist die Induktionsvoraussetzung auf U
Eigenvektoren reeller symmetrischer bzw. hermitescher anwendbar. Folglich besitzt der Vektorraum U eine geordnete
Matrizen zu verschiedenen Eigenwerten stehen senk- Orthonormalbasis B  = (b2 , . . . , bn ) mit
recht aufeinander.
⎛ ⎞
λ2 0
⎜ .. ⎟
B  M(ϕ|U )B  = ⎝ . ⎠
Symmetrische bzw. hermitesche Matrizen sind
0 λn
diagonalisierbar
Wir normieren den Eigenvektor v 1 , setzen also b1 =
Das charakteristische Polynom reeller symmetrischer bzw. v 1 −1 v 1 , B = (b1 , . . . , bn ) und erhalten so die ge-
hermitescher Matrizen zerfällt stets in Linearfaktoren, und es wünschte Darstellung. 
694 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Für reelle symmetrische bzw. hermitesche Matrizen lässt sich Mit der Matrix S = (b1 , b2 , b3 ) gilt:
das wie folgt formulieren: ⎛ ⎞
0 0 0
⎝0 2 0⎠ = S 0 A S . 
Diagonalisierbarkeit reeller symmetrischer bzw.
0 0 2
hermitescher Matrizen
Ist A ∈ Kn×n eine reelle symmetrische bzw. hermite-
sche Matrix, so gibt es eine orthogonale bzw. unitäre Achtung: Reelle symmetrische Matrizen sind zwar
Matrix S und λ1 . . . , λn ∈ R mit stets diagonalisierbar, für komplexe symmetrische Matri-
zen stimmt
' das
( hingegen nicht: Die symmetrische Matrix
⎛ ⎞
λ1 0 1 i
A= ∈ C2 ist nicht diagonalisierbar.
0 ⎜ .. ⎟ i −1
S AS = ⎝ . ⎠
0 λn
Kommentar: Im R3 hat man das Vektorprodukt × zur
Dabei sind die Spalten von S eine Orthonormalbasis des Verfügung. Damit kann man sich oftmals etwas an Arbeit
Kn aus Eigenvektoren von A. ersparen. Sucht man eine Orthonormalbasis des R3 , wobei
ein normierter Basisvektor b1 = (b1 , b2 , b3 )0 = e3 vorge-
Ist A ∈ Kn×n eine reelle symmetrische bzw. hermitesche geben ist, so ist (b1 , b2 , b3 ) mit b2 = (−b2 , b1 , 0)0 und
Matrix, so existiert nach diesem Satz eine Orthonormalbasis b3 = b1 × b2 eine geordnete Orthogonalbasis. Normieren
des Kn aus Eigenvektoren von A. Dies heißt aber, dass n liefert eine Orthonormalbasis.
linear unabhängige Eigenvektoren von A existieren. Damit Mithilfe der erzielten Ergebnisse können wir nun ein Problem
muss für jeden Eigenwert von A die geometrische Vielfach- lösen, vor dem wir zu Beginn dieses Kapitels standen.
heit gleich der algebraischen sein:
Die Dimension jedes Eigenraums ist der Exponent des zuge-
Die Definitheit von reellen symmetrischen
hörigen Eigenwertes im charakteristischem Polynom.
bzw. hermiteschen Matrizen lässt sich mit den
Damit ist wieder klar, wie wir vorgehen, um eine Orthonor- Eigenwerten und Hauptunterdeterminanten
malbasis zu einer reellen symmetrischen bzw. hermiteschen
bestimmen
Matrix A ∈ Kn×n zu konstruieren.

Beispiel Die Matrix Es ist im Allgemeinen schwer zu entscheiden, ob eine reelle


⎛ ⎞ symmetrische oder hermitesche Matrix A ∈ Kn×n positiv
1 i 0 (semi-), negativ (semi-) oder indefinit ist, da es im Allgemei-
A = ⎝−i 1 0⎠ ∈ C3×3 nen nicht immer leicht ist, das Vorzeichen von
0 0 2
v0 A v
ist hermitesch, also diagonalisierbar. Wir bestimmen die
Eigenwerte von A, d. h. die Nullstellen des charakteristischen zu bestimmen. Zum Glück gibt es Kriterien, die bei kleinen
Polynoms Matrizen leicht anzuwenden sind.

χA = ((1 − X) (1 − X) − 1) (2 − X) = X (2 − X)2 . Nach dem Ergebnis auf Seite 692 hat eine reelle symme-
trische bzw. hermitesche n × n-Matrix n (nicht notwendig
Damit haben wir den einfachen Eigenwert 0 und den doppel- verschiedene) reelle Eigenwerte; es ist somit sinnvoll, von
ten Eigenwert 2. Nun bestimmen wir die Eigenräume: positiven und negativen Eigenwerten zu sprechen.
?⎛ i ⎞@
Das Eigenwertkriterium zur Definitheit
EigA (0) = ker A = ⎝−1⎠ ,
0 Eine reelle symmetrische oder hermitesche n×n-Matrix
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ A ∈ Kn×n ist genau dann
−1 i 0 i 0
positiv definit, wenn alle Eigenwerte von A positiv
EigA (0) = ker ⎝ −i −1 0⎠ = -⎝1⎠ , ⎝0⎠. .
sind,
0 0 0 0 1
negativ definit, wenn alle Eigenwerte von A negativ
Die angegebenen Vektoren bilden bereits eine Orthogonal- sind,
basis des C3 . Wir normieren nun diese Vektoren und erhalten positiv semidefinit, wenn alle Eigenwerte von A po-
eine geordnete Orthonormalbasis B = (b1 , b2 , b3 ), expli- sitiv oder null sind,
zit: negativ semidefinit, wenn alle Eigenwerte von A ne-
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ gativ oder null sind,
i i 0
1 ⎝ ⎠ 1 ⎝ ⎠ indefinit, wenn A positive und negative Eigenwerte
b1 = √ −1 , b2 = √ 1 , b3 = ⎝0⎠ .
2 2 0 hat.
0 1
17.6 Selbstadjungierte Endomorphismen 695

Beispiel: Das orthogonale bzw. unitäre Diagonalisieren


Wir bestimmen zu der hermiteschen Matrix A ∈ C4×4 bzw. reellen symmetrischen Matrix B ∈ R4×4 eine unitäre Matrix
0
S ∈ C4×4 bzw. orthogonale Matrix T ∈ R4×4 , sodass S A S bzw. T 0 B T eine Diagonalmatrix ist:
⎛ ⎞ ⎛ ⎞
2 i 0 0 1 2 3 4
⎜−i 2 0 0⎟ ⎜2 4 6 8 ⎟
A=⎜ ⎝ 0 0 2 i⎠ ∈ C
⎟ 4×4
bzw. B = ⎜ ⎟
⎝3 6 9 12⎠ ∈ R
4×4

0 0 −i 2 4 8 12 16

Problemanalyse und Strategie: Wir bestimmen die Eigenwerte und die Orthonormalbasen der Eigenräume.

Lösung: hat B den dreifachen Eigenwert 0 und den einfachen Ei-


Wegen genwert 30.
χA = ((2 − X) (2 − X) + i2 )2 = (1 − X)2 (3 − X)2 Wir bestimmen Basen für die Eigenräume EigB (0) und
EigB (30) zu den beiden Eigenwerten 0 und 30.
hat A die jeweils zweifachen Eigenwerte 1 und 3. ⎛ ⎞
Wir bestimmen Basen für die Eigenräume EigA (1) und 1 2 3 4
⎜ ⎟
⎜2 4 6 8⎟
EigA (3) zu den beiden Eigenwerten 1 und 3. EigB (0) = ker(B − 0 E4 ) = ker ⎜
⎜3

⎛ ⎞ ⎝ 6 9 12⎟⎠
1 i 0 0 4 8 12 16
⎜ ⎟
⎜−i 1 0 0⎟ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
EigA (1) = ker(A − 1 E4 ) = ker ⎜
⎜0

1 2 3 4 ? 2 0 0 @
⎝ 0 1 i⎟⎠ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜0 0 0 0⎟ ⎜−1⎟ ⎜−3⎟ ⎜ 0 ⎟
0 0 −i 1 = ker ⎜
⎜0
⎟= ⎜ ⎟,⎜ ⎟,⎜ ⎟ .
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎝ 0 0 0⎠ ⎝ 0 ⎠ ⎝ 2 ⎠ ⎝−4⎟
⎟ ⎜ ⎟ ⎜ ⎟ ⎜

1 i 0 0 ? i 0 @ 0 0 0 0 0 0 3
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜0 0 0 0⎟ ⎜−1⎟ ⎜ 0 ⎟   
= ker ⎜
⎜0
⎟= ⎜ ⎟,⎜ ⎟ .
i⎠ ⎝ 0 ⎠ ⎝ i ⎟
⎟ ⎜ ⎟ ⎜ =:a 1 =:a 2 =:a 3
⎝ 0 1 ⎠
0 0 0 0 0 −1 Die drei Basisvektoren a 1 , a 2 und a 3 bilden noch keine
  Orthonormalbasis des Eigenraums. Eine solche erhalten
=:a 1 =:a 2
wir, indem wir das Verfahren von Gram und Schmidt auf
Wir haben die Basisvektoren a 1 und a 2 so gewählt, dass sie
die Vektoren a 1 , a 2 und a 3 anwenden. Damit erhalten wir
senkrecht aufeinander stehen. Normieren von a 1 und a 2 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
liefert b1 = a 1 −1 a 1 = √1 a 1 und b2 = a 2 −1 a 2 = 2 0 −5
2 1 ⎜−1⎟ ⎜ ⎟
⎟, b2 = √1 ⎜ 0 ⎟, b3 = √ 1 ⎜⎜−10⎟ ,

√1 a 2 . Die Vektoren b1 und b2 liefern also den ersten Teil b1 = √ ⎜ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
2 5 0 5 −4 5 6 3
einer Orthonormalbasis des C4 bestehend aus Eigenvek- 0 3 4
toren von A. ⎛ ⎞ also eine Orthonormalbasis {b1 , b2 , b3 } des Eigenraums
−1 i 0 0
⎜ ⎟ zum Eigenwert 0, also den ersten Teil einer Orthonormal-
⎜ −i −1 0 0⎟
EigA (3) = ker(A − 3 E4 ) = ker ⎜
⎜ 0
⎟ basis des R4 bestehend aus Eigenvektoren von B.
⎝ 0 −1 i ⎟ ⎠
0 0 −i −1 EigB (30) = ker(B − 30 E4 ) .
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
−1 i 0 0 ? i 0 @ Die Bestimmung dieses Kerns ist mühsam. Eine Überle-
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0 0 0 0⎟ ⎜ 1 ⎟ ⎜0 ⎟ gung erspart uns diese Arbeit. Weil 30 ein einfacher Eigen-
= ker ⎜
⎜ 0
⎟= ⎜ ⎟ , ⎜ ⎟ .
⎝ 0 −1 i ⎟

⎜0⎟ ⎜ i ⎟
⎝ ⎠ ⎝ ⎠ wert ist, ist dieser Eigenraum eindimensional. Ein Vektor
0 0 0 0 0 1 a 4 , der diesen Eigenraum erzeugt, steht senkrecht auf al-
 
=:a 3 =:a 4 len Eigenvektoren zum Eigenwert 0. Ein Blick auf den
Wieder wurden a 3 und a 4 so gewählt, dass sie senkrecht Eigenvektor a 1 zeigt, dass als erste zwei Komponenten
aufeinander stehen. Normieren liefert b3 = a 3 −1 a 3 = von a 4 die Zahlen 1 und 2 infrage kommen. Ein Blick
√1 a 3 und b4 = a 4 −1 a 4 = √1 a 4 . Mit b3 und b4 ha- auf a 2 liefert dann die mögliche dritte Komponente 3
2 2 für a 4 , und betrachtet man a 3 , so erhält man den Vektor
ben wir den anderen Teil einer Orthonormalbasis des C4 a 4 = (1, 2, 3, 4)0 , der senkrecht auf allen Eigenvektoren
bestehend aus Eigenvektoren von A. zum Eigenwert 0 ist, also ein Eigenvektor zum Eigenwert
Mit der unitären Matrix S = (b1 , b2 , b3 , b4 ) gilt die 30 sein muss. Es liefert dann b4 = a 4 −1 a 4 = √1 a 4
30
Gleichung: eine Orthonormalbasis von EigB (30).
0
diag(1, 1, 3, 3) = S A S . Mit der orthogonalen Matrix T = (b1 , b2 , b3 , b4 ) erhal-
Nun zur reellen symmetrischen Matrix B. ten wir die Gleichung
Wegen
χB = −X3 (30 − X) diag(0, 0, 0, 30) = T 0 B T .
696 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Beweis: Wir begründen das Kriterium für die positive De- Das Hauptminorenkriterium zur Definitheit
finitheit. Die Beweise für die negative Definitheit und die
Eine reelle symmetrische oder hermitesche n×n-Matrix
Semidefinitheit ergeben sich analog. Die Indefinitheit zu be-
A ∈ Kn×n ist genau dann
weisen haben wir als Aufgabe gestellt.
positiv definit, wenn alle n Hauptminoren positiv
Ist λ ∈ R ein Eigenwert einer positiv definiten Matrix A und v sind,
ein zugehöriger Eigenvektor zum Eigenwert λ, so gilt wegen negativ definit, wenn die n Hauptminoren alternie-
A v = λ v durch Skalarproduktbildung dieser Gleichung mit rend sind, d. h.,
dem Vektor v 0 :
det(aij )11 < 0 , det(aij )22 > 0 , det(aij )33 < 0 , . . .
v 0
A v = v 0 λ v = λ 
v0 v .
>0 >0 Beweis: Wir begründen das Kriterium für die positive De-
finitheit:
Somit muss λ positiv sein.
⇒: Die Matrix A sei positiv definit. Dann sind auch die Ma-
Interessanter ist, dass auch die Umkehrung gilt. Wir gehen trizen (aij )1≤i,j ≤k für alle k = 1, . . . , n positiv definit. Es
von einer reellen symmetrischen bzw. komplexen hermite- genügt also, wenn wir det(A) > 0 zeigen. Weil A symme-
schen Matrix A ∈ Kn×n aus, deren n nicht notwendig ver- trisch bzw. hermitesch ist, gibt es eine orthogonale Matrix
schiedenen Eigenwerte λ1 , . . . , λn positiv sind. Nach dem 0
S und eine Diagonalmatrix D ∈ Kn×n mit S A S = D.
Satz zur Diagonalisierbarkeit reeller symmetrischer bzw. her-
Da A positiv definit ist, sind sämtliche Diagonaleinträge von
mitescher Matrizen auf Seite 694 existiert eine Orthonormal-
D reell und echt größer Null, insbesondere ist det(D) > 0.
basis B = (v 1 , . . . , v n ) des Kn aus Eigenvektoren von A. 0
Wir stellen v ∈ Kn \ {0} als Linearkombination bezüglich Also folgt det(S A S) = | det(S)|2 det(A) = det(D) > 0
der Basis B dar: und somit det(A) > 0.
⇐: Es sei nun det(aij )1≤i,j ≤k > 0 für alle k = 1, . . . , n.
v = μ1 v 1 + · · · + μn v n , Wir beweisen durch vollständige Induktion nach n, dass A
positiv definit ist. Für n = 1 ist die Behauptung klar. Es
wobei also μ1 , . . . , μn ∈ K sind. sei also n > 1. Wir betrachten die zu A gehörige hermite-
sche Sesquilinearform · : Kn × Kn → K, (v, w) → v 0 A w.
Wegen v 0 0
i v j = 0 für i  = j sowie v i v i = 1 erhalten wir mit Wir setzen U = -e1 , . . . , en−1 ., wobei ei wie üblich den
der Sesquilinearität des kanonischen Skalarprodukts: i-ten Vektor der kanonischen Basis des Kn bezeichne, und
 n   à = (aij )1≤i,j ≤n−1 . Die Matrix à beschreibt die Sesquili-
! !
n
nearform ·|U ×U eingeschränkt auf den Untervektorraum U .
0
v (A v) = μi v 0 μi λi v i
i Nach Induktionsvoraussetzung ist ·|U ×U positiv definit. Wir
i=1 i=1
wählen mit dem Verfahren von Gram und Schmidt eine Or-
!
n
= λi |μi |2 v i 2 > 0 , thonormalbasis (a 1 , . . . , a n−1 ) von U bezüglich des Ska-
i=1
larprodukts ·|U ×U und erhalten U = -a 1 , . . . , a n−1 .. Wir
a i ·en
wählen weiter u = en − n−1 i=1 a i  a i ∈ K \ U (wobei
n

weil alle Eigenwerte λ1 , . . . , λn positiv sind. 


wir vereinfachend · anstelle von ·|U ×U geschrieben haben).
Es gilt u ⊥ a i für alle i ∈ {1, . . . , n − 1} (es ist dann
(a 1 , . . . , a n−1 , u) eine Basis des Kn ). Bezüglich der Basis
Für ein zweites Kriterium, das ebenfalls leicht anzuwenden (a 1 , . . . , a n−1 , u) können wir dann · darstellen als
ist, führen wir einen neuen Begriff ein. ' (
B 0
Für jede n × n-Matrix A = (aij )nn und jede Zahl k ∈ A =
0 d
{1, . . . , n} bezeichnet man die Determinante der linken obe-
ren k × k-Teilmatrix (aij )kk von A als Hauptminor oder mit d = u · u und einer Diagonalmatrix B. Wegen det(A ) =
Hauptunterdeterminante. Die n Hauptunterdeterminanten det(B) d > 0 und det(B) > 0 ist auch d > 0. Da B nach
einer n × n-Matrix A = (aij )nn sind der Reihe nach gegeben Induktionsvoraussetzung positiv definit ist (es stellen B und
durch: Ã ein und dieselbe Sesquilinearform bezüglich verschiedener
) ) Basen dar) und d > 0 ist, ist also auch das durch A gegebene
) ) )a11 · · · a1n )
) ) ) ) ) ) Produkt positiv definit. Also ist auch A positiv definit.
) ) )a11 a12 ) )a11 a12 a13 )
)a11 ) , ) ) , )a21 a22 a23 ) , . . . , )) .. .. )
)a21 a22 ) ) ) ) . . )) Das Kriterium für die negative Definitheit einer Matrix
)a31 a32 a33 ) )a )
n1 · · · ann A = (aij ) ergibt sich hieraus durch Betrachtung von −A.
Es ist nämlich A genau dann negativ definit, wenn −A posi-
tiv definit ist, d. h., nach dem bereits bewiesenen Teil, wenn
Damit können wir das zweite wichtige Kriterium für die De-
finitheit formulieren. det −(aij )11 > 0 , det −(aij )22 > 0 , det −(aij )33 > 0 , . . .
17.7 Normale Endomorphismen 697

Wegen det(−B) = − det(B) für jede quadratische Matrix nachzuweisen. Wir werden eine komplexe Matrix, die diese
B, deren Zeilen- und Spaltenzahl ungerade ist, folgt die Be- Gleichung erfüllt, normal nennen. Unter den komplexen Ma-
hauptung.  trizen sind es also genau die normalen Matrizen, die diago-
nalisierbar sind.
Kommentar: Es ist nur dann sinnvoll, eines der beiden Natürlich behandeln wir nicht nur den komplexen Fall. Wir
geschilderten Kriterien zu benutzen, wenn die Matrix klein bestimmen auch im reellen Fall die Normalform normaler
ist. Große Matrizen bringt man besser auf Sylvester’sche Nor- Matrizen. Abgesehen von evtl. 2×2-Kästchen auf der Haupt-
malform. An dieser Normalform kann ebenfalls die Definit- diagonalen ist dies ebenfalls eine Diagonalmatrix.
heit entschieden werden. Wir behandeln diese Normalform
Der Begriff des normalen Endomorphismus verallgemeinert
im Kapitel 18.
orthogonale bzw. unitäre und selbstadjungierte Endomor-
phismen.
Beispiel ' (
1 1 Mit K bezeichnen wir wieder einen der Körper R oder C –
Die Matrix A = ist positiv semidefinit. Sie hat
1 1 im euklidischen Fall ist K = R, im unitären gilt K = C.
nämlich die Eigenwerte 0 und 2.
Mit dem zweiten Kriterium finden wir, dass A nicht positiv
definit ist, da
Nicht zu jedem Endomorphismus gibt es einen
adjungierten Endomorphismus, aber falls
det(aij )11 = 1 > 0 , aber einer existiert, so ist er eindeutig bestimmt
det(aij )22 = det A = 1 · 1 − 1 · 1 ≯ 0 .
⎛ ⎞ Wir nannten einen Endomorphismus ϕ eines euklidischen
1 0 1 bzw. unitären Vektorraums V selbstadjungiert, wenn für alle
Die Matrix A = ⎝0 1 2⎠ ist nach dem zweiten Krite- v, w ∈ V gilt:
1 2 6
rium positiv definit, da v · ϕ(w) = ϕ(v) · w .

det(aij )11 = 1 > 0 , det(aij )22 = 1 · 1 > 0 , Diese Bedingung schwächen wir nun ab: Sind ϕ und ψ Endo-
det(aij )33 = det A = 6 − (1 + 4) > 0 . morphismen eines euklidischen oder unitären Vektorraums
V , so heißt der Endomorphismus ψ zu ϕ adjungiert, wenn
Mit dieser Matrix A ist also das Produkt zwischen Vekto- für alle v, w ∈ V gilt:
ren v und w des R3
v · ϕ(w) = ψ(v) · w .
v · w = v0 A w
Ist ϕ selbstadjungiert, so ist ϕ zu sich selbst adjungiert – so
von Vektoren v und w des R3 ein euklidisches Skalar- erklärt sich die Namensgebung der selbstadjungierten Endo-
produkt, und R3 versehen mit diesem Produkt · ist ein morphismen.
euklidischer Vektorraum.  Ist ϕ irgendein Endomorphismus von V , so kann man natür-
lich die Frage stellen, ob es überhaupt einen Endomorphis-
? mus ψ von V gibt, der zu ϕ adjungiert ist. Und falls es einen
Entscheiden Sie über die Definitheit einer Diagonalmatrix. gibt, dann fragt man als nächstes, ob es verschiedene solche
zu ϕ adjungierte Endomorphismen geben kann. Wir werden
zeigen, dass, falls es überhaupt einen zu ϕ adjungierten En-
domorphismus ψ gibt, dieser dann eindeutig bestimmt ist.
Daher ist es angebracht, einen Endomorphismus ψ, der zu ϕ
17.7 Normale Endomorphismen adjungiert ist, mit ϕ ∗ zu bezeichnen, ψ = ϕ ∗ , d. h.,

Wir haben gezeigt, dass eine n × n-Matrix A über einem be- v · ϕ(w) = ϕ ∗ (v) · w für alle v, w ∈ V .
liebigen Körper genau dann diagonalisierbar ist, wenn das
charakteristische Polynom über diesem Körper in Linear- Mit ϕ ∗∗ = (ϕ ∗ )∗ bezeichnen wir den (eindeutig bestimmten)
faktoren zerfällt und für jeden Eigenwert die algebraische zu ϕ ∗ adjungierten Endomorphismus.
Vielfachheit gleich der geometrischen ist. Wir leiten nun für
den Körper C ein deutlich einfacheres Kriterium her. Über C Eindeutigkeit des adjungierten Endomorphismus
zerfällt jedes Polynom vom Grad größer gleich 1 in Linear- Es sei ϕ ein Endomorphismus von V . Dann gilt:
faktoren, damit ist die erste Bedingung automatisch erfüllt. (a) Falls ψ und ψ  zu ϕ adjungierte Endomorphismen
Anstelle der Gleichheit der Vielfachheiten ist aber tatsächlich sind, so folgt ψ = ψ  .
nur die Gleichheit (b) Falls ϕ ∗ existiert, so existiert auch ϕ ∗∗ , und es gilt
0 0 ϕ ∗∗ = ϕ.
A A = AA
698 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Beweis: (a) Es seien ψ und ψ  zwei zu ϕ adjungierte Es sei V der Vektorraum der auf dem Intervall [−1, 1]
Endomorphismen. Wir zeigen, dass ψ − ψ  der Nullendo- stetigen reellwertigen Funktionen mit dem euklidischen
1
morphismus ist, es folgt dann die Behauptung. Dazu sei ein Skalarprodukt -f, g. = −1 f (x) g(x) dx.
beliebiges v ∈ V vorgegeben. Für alle w ∈ V gilt: Wir wählen den Punkt 0 ∈ [−1, 1] und erklären einen
Endomorphismus ϕ0 von V durch
(ψ(v) − ψ  (v)) · w = ψ(v) · w − ψ  (v) · w 
[−1, 1] → R,
= v · ϕ(w) − v · ϕ(w) ϕ0 : f → f0 :
x → f (0).
= 0.
Das Bild von f unter ϕ0 ist also die konstante Funktion
Somit steht der Vektor (ψ(v) − ψ  (v))
auf jedem w ∈ V f0 , die jedem x ∈ [−1, 1] die reelle Zahl f (0) zuord-
senkrecht, d. h., (ψ(v)−ψ  (v)) ∈ V ⊥ = {0}. Es folgt ψ(v)− net. Wir zeigen nun, dass zu ϕ0 keine adjungierte Abbil-
ψ  (v) = 0. Da v ∈ V beliebig war, gilt diese Gleichheit für dung existiert. Dazu berechnen wir zuerst -f, ϕ0 (g). für
alle v ∈ V , und somit ist ψ − ψ  die Nullabbildung. f, g ∈ V :
J 1 J 1
(b) Der zu ϕ adjungierte Endomorphismus ϕ ∗ existiere. Es -f, ϕ0 (g). = f (x) g(0) dx = g(0) f (x) dx .
gilt somit für alle v, w ∈ V −1 −1

Angenommen, die zu ϕ0 adjungierte Abbildung ϕ0∗ exis-


v · ϕ(w) = ϕ ∗ (v) · w .
tiert. Wir setzen h = ϕ0∗ (f ) und beachten nun, dass wegen
-f, ϕ0 (g). = -ϕ0∗ (f ), g. = -h, g. für alle g ∈ V gilt:
Wir zeigen nun, dass für alle v, w ∈ V gilt:
J 1 J 1
v · ϕ ∗ (w) = ϕ(v) · w . (∗) g(0) f (x) dx = h(x) g(x) dx .
−1 −1
1
Es ist dann ϕ = ϕ ∗∗ gezeigt. Für alle v, w ∈ V folgt mit der Wäre nun aber −1 f (x) dx = 0, so erhielte man mit den
Tatsache, dass · hermitesch ist: bekannten Abschätzungen für bestimmte Integrale die für
alle g ∈ V gültige Ungleichung
v · ϕ ∗ (w) = ϕ ∗ (w) · v J 1
= w · ϕ(v) g(0) ≤ M |g(x)| dx für ein M ∈ R≥0 .
−1
= ϕ(v) · w .
Aber natürlich gibt es eine auf [−1, 1] stetige Funktion
1
Damit ist die Gleichung in (∗) bewiesen.  g mit g(0) > M −1 |g(x)| dx, etwa für c > max{1, M}
die Funktion g, deren Graph in Abbildung 17.22 gezeigt
ist.
Beispiel
Es sei V der Vektorraum der stetigen komplexwertigen y
Funktionen auf dem abgeschlossenen Intervall [a, b] mit
dem unitären Skalarprodukt c
J b
-f, g. = f (x) g(x) dx .
a

Für eine Funktion h ∈ V definieren wir den Endomor-


phismus ϕh : V → V durch

[a, b] → C, −1 x
ϕh : f → h f : − c12 1
c2
1
x  → h(x) f (x).
Abbildung 17.22 Das Integral dieser stetigen Funktion ist 21 22 c = 1c
Es gilt dann für alle f, g ∈ V : c

J b
1
Dieser Widerspruch zeigt, dass −1 f (x) dx = 0 gilt.
-f, ϕh (g). = f (x) h(x) g(x) dx
a Aber auch diese Gleichheit ist sicher nicht für alle f ∈ V
J b erfüllt. Und dieser Widerspruch begründet nun, dass zu ϕ
= h(x) f (x)g(x) dx keine adjungierte Abbildung existieren kann.
a
Es sei V der Vektorraum aller 2 π -periodischen, unendlich
= -ϕh (f ), g. . oft differenzierbaren komplexwertigen Funktionen auf R.
Dabei heißt eine Funktion 2 π-periodisch, falls
Damit ist der zu ϕh adjungierte Endomorphismus gleich
ϕh , d. h., ϕh∗ = ϕh . f (x + 2 π ) = f (x) für alle x ∈ R .
17.7 Normale Endomorphismen 699

Wir versehen den Vektorraum V mit dem unitären Skalar- Ein Endomorphismus ist normal, wenn er mit
produkt J seinem Adjungierten kommutiert
π
-f, g. = f (x) g(x) dx .
−π Nun kommen wir endlich zu der Definition normaler Endo-
Nun betrachten wir den Endomorphismus ϕ : V → V , morphismen.
f → f  . Mit partieller Integration gilt:
J π Normale Endomorphismen und Matrizen
-f, ϕ(g). = f (x) g  (x) dx Ein Endomorphismus ϕ eines euklidischen bzw. uni-
−π
tären Vektorraums V heißt normal, falls der adjun-
= f (π) g(π) − f (−π) g(−π)
 gierte Endomorphismus ϕ ∗ existiert und
=0
J π ϕ ◦ ϕ∗ = ϕ∗ ◦ ϕ

− f (x) g(x) dx
−π gilt.
= -−ϕ(f ), g. . Eine Matrix A ∈ Kn×n heißt normal, falls
0 0
Somit gilt ϕ ∗ = −ϕ.  A A = AA
gilt.
Wir untersuchen nun die Standardvektorräume Rn und Cn
mit den kanonischen Skalarprodukten. Jeder Endomorphis- Im Fall K = R heißt eine quadratische Matrix also dann nor-
mus ϕ : Kn → Kn hat die Form ϕ = ϕA : v  → A v mit mal, wenn A0 A = A A0 gilt. Wir listen zahlreiche Beispiele
einer Matrix A ∈ Kn×n . Wir können den Endomorphismus auf.
ϕ mit der Matrix A identifizieren. Wie sieht die Matrix des zu
ϕ adjungierten Endomorphismus aus? Existiert der zu ϕ ad- Beispiel
jungierte Endomorphismus überhaupt? Die Antworten sind Jede symmetrische Matrix A ∈ Rn×n ist normal; es gilt
bestechend einfach: A0 = A und damit A0 A = A A0 .
Jede hermitesche Matrix A ∈ Cn×n ist normal; es gilt
Adjungierte von Matrizen 0 0 0
A = A und damit A A = A A .
Es sei V = Rn mit dem kanonischen euklidischen Jede schiefsymmetrische Matrix A ∈ Rn×n ist normal; es
Skalarprodukt. Ist A ∈ Rn×n , so gilt für den Endo- gilt A0 = −A und damit A0 A = A A0 .
morphismus ϕA : v  → A v: Jede schiefhermitesche Matrix A ∈ Cn×n ist normal. Da-

bei heißt eine Matrix A ∈ Cn×n schiefhermitesch, falls
ϕA = ϕA0 . 0
gilt A = −A. Für jede solche Matrix gilt A0 A = A A0 .
Jede orthogonale Matrix A ∈ Rn×n ist normal; es gilt
Es sei V = Cn mit dem kanonischen unitären Ska- A0 = A−1 und damit A0 A = A A0 .
larprodukt. Ist A ∈ Cn×n , so gilt für den Endomor- 0
Jede unitäre Matrix A ∈ Cn×n ist normal; es gilt A =
phismus ϕA : v → A v: 0 0
A−1 und damit A' A = (AA .
∗ 1 2
ϕA = ϕA0 . Die Matrix A = ∈ R2×2 ist nicht normal. Es gilt:
3 4
0 ' (' ( ' (
Man nennt die Matrix A ∈ Kn×n die zu A ∈ Kn×n 1 2 1 3 5 11
adjungierte Matrix. A A0 = =
3 4 2 4 11 25
' (' ( ' (
1 3 1 2 10 14
A0 A = =
Beweis: Für alle v, w ∈ Rn gilt: 2 4 3 4 14 20

v · ϕA (w) = v 0 (A w) = (A0 v)0 w = ϕA0 (v) · w . Jeder orthogonale bzw. unitäre Endomorphismus ϕ eines
euklidischen bzw. unitären Vektorraums V ist normal.
Im komplexen Fall folgt die Aussage analog. 
Denn es gilt für alle v, w ∈ V :

Achtung: Man verwechsle nicht die adjungierte Matrix v · ϕ(w) = ϕ −1 (v) · ϕ −1 (ϕ(w)) = ϕ −1 (v) · w .
(siehe oben) mit der adjunkten Matrix (Seite 485).
Somit gilt ϕ ∗ = ϕ −1 . Beachte ϕ ∗ ◦ ϕ = idV = ϕ ◦ ϕ ∗ .
Jeder selbstadjungierte Endomorphismus ϕ ist normal; es
Im Standardvektorraum Kn existiert somit zu jedem Endo- gilt ϕ ∗ = ϕ.
morphismus ϕ der dazu adjungierte Endomorphismus ϕ ∗ . Ist Der Endomorphismus aus obigem Beispiel (das Differen-
A die Darstellungsmatrix von ϕ bezüglich der kanonischen zieren der 2π -periodischen Funktionen) ist normal; es gilt
0
Basis, so ist A diese von ϕ ∗ . ϕ ∗ = −ϕ. 
700 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Damit sind die normalen Endomorphismen eine gemein- von ϕ und λ. Wegen ϕ ∗∗ = ϕ und λ = λ gilt folglich
same Verallgemeinerung der orthogonalen bzw. unitären und Eϕ ∗ (λ) ⊆ Eϕ (λ). 

selbstadjungierten Endomorphismen. Unitäre und selbstad-


jungierte Endomorphismen endlichdimensionaler C-Vektor-
Im Fall eines euklidischen Vektorraums, d. h., K = R, gilt
räume sind (orthogonal) diagonalisierbar, wie wir längst wis-
somit für jedes λ ∈ R wegen λ = λ:
sen. Und einer unserer Ziele ist es zu zeigen, dass unter den
Endomorphismen endlichdimensionaler C-Vektorräume ge-
Eϕ (λ) = Eϕ ∗ (λ) ,
rade die normalen die (orthogonal) diagonalisierbaren sind.
Das nächste Ergebnis ist der erste Schritt in diese Richtung. d. h., dass in diesem Fall insbesondere die Eigenräume zu
den gleichen Eigenwerten von ϕ und ϕ ∗ gleich sind.
Die Eigenräume normaler Endomorphismen Mit dem eben gezeigten Lemma erhalten wir nun die Folge-
sind senkrecht zueinander rung, dass die Eigenräume normaler Endomorphismen zu
verschiedenen Eigenwerten senkrecht aufeinander stehen.
Ist ϕ ein Endomorphismus eines K-Vektorraums V , so be- Damit sind wir dem Ziel, nämlich, dass es bei normalen En-
zeichneten wir den Eigenraum von ϕ zum Eigenwert λ ∈ K domorphismen endlich-dimensionaler Vektorräume eine Or-
stets mit Eigϕ (λ). Wir verallgemeinern diese Bezeichnung thonormalbasis aus Eigenvektoren gibt, wieder etwas näher.
etwas. Für jedes λ ∈ K setzen wir
Folgerung
Eϕ (λ) = {v ∈ V | ϕ(v) = λ v} . Es sei ϕ ein normaler Endomorphismus des euklidi-
schen bzw. unitären Vektorraums V . Ist L ⊆ V das Erzeugnis
Es gilt: aller Eigenvektoren zu allen Eigenwerten von ϕ, so gilt:
Eϕ (λ) = Eigϕ (λ) ,
(a) Eϕ (λ) ⊥ Eϕ (μ) für alle λ, μ ∈ K mit λ = μ.
falls λ ein Eigenwert von ϕ ist. Ist λ hingegen kein Eigenwert (b) ϕ(L⊥ ) ⊆ L⊥ , und L⊥ enthält keine Eigenvektoren
von ϕ, so gilt Eϕ (λ) = {0}. von ϕ.

Lemma Beweis: (a) Es seien v ∈ Eϕ (λ) und w ∈ Eϕ (μ). Mit


Es sei ϕ ein normaler Endomorphismus eines euklidi- obigem Lemma folgt nun w ∈ Eϕ ∗ (μ), also
schen bzw. unitären Vektorraums V . Dann gilt für jedes
λ ∈ K: (λ − μ) (v · w) = λ (v · w) − μ (v · w)
Eϕ (λ) = Eϕ ∗ (λ) .
= (λ v) · w − v · (μ w)
Ist λ ein Eigenwert von ϕ, so heißt das, der Eigenraum von = ϕ(v) · w − v · ϕ ∗ (w)
ϕ zum Eigenwert λ ist gleich dem Eigenraum der zu ϕ ad-
= v · ϕ ∗ (w) − v · ϕ ∗ (w)
jungierten Abbildung ϕ ∗ zum Eigenwert λ.
= 0.
Beweis: Es sei v ∈ Eϕ (λ). Wir zeigen vorab zwei Identi- Für λ = μ folgt somit v ⊥ w. Das ist die Behauptung.
täten: Zum einen gilt:
(b) Angenommen, es gibt einen Eigenvektor v von ϕ in L⊥ .
∗ ∗ ∗ ∗
Dann gilt v ∈ L ∩ L⊥ . Wegen L ∩ L⊥ = {0} folgt v = 0.
2
ϕ (v) = ϕ (v) · ϕ (v) = v · ϕ(ϕ (v))
= v · ϕ ∗ (ϕ(v)) = v · ϕ ∗ (λ v) = λ (v · ϕ ∗ (v)) , Somit enthält L⊥ keine Eigenvektoren von ϕ.
Es sei nun v ∈ L⊥ . Wir zeigen ϕ(v) ∈ L⊥ , d. h., ϕ(v) ∈
und zum anderen gilt:
Eϕ (λ)⊥ für alle λ ∈ K. Nach obigem Lemma gilt Eϕ (λ) =
ϕ ∗ (v) · v = v · ϕ(v) = v · (λ v) = λ v2 . Eϕ ∗ (λ) für jedes λ ∈ K. Damit erhalten wir nun für ein
w ∈ Eϕ (λ), λ ∈ K:
Mit diesen zwei Aussagen erhalten wir nun:
ϕ(v) · w = v · ϕ ∗ (w) = v · (λ w) = λ (v · w) = 0 ,
∗ 2 ∗ ∗
ϕ (v) − λ v = (ϕ (v) − λ v) · (ϕ (v) − λ v)
da v ∈ L⊥ und w ∈ L. Damit ist auch die Behauptung in (b)
= ϕ ∗ (v)2 − λ (ϕ ∗ (v) · v) − λ (v · ϕ ∗ (v)) + |λ|2 v2
begründet. 

= λ (v · ϕ ∗ (v)) − |λ|2 v2 − λ(v · ϕ ∗ (v)) + |λ|2 v2


= 0. Nun haben wir alle Vorbereitungen getroffen, um das zentrale
Ergebnis zu beweisen. Nach der Aussage (a) in obiger Folge-
Damit folgt ϕ ∗ (v) − λ v = 0, d. h. v ∈ Eϕ ∗ (λ).
rung erhält man mit der Vereinigung von Orthonormalbasen
Gezeigt ist hiermit die Inklusion Eϕ (λ) ⊆ Eϕ ∗ (λ). Die der Eigenräume eines normalen Endomorphismus ein Ortho-
andere Inklusion erhalten wir nun ganz einfach: Wir wen- normalsystem des Vektorraums V bestehend aus Eigenvek-
den die obige Argumentation an auf ϕ ∗ und λ anstelle toren von V . Mit dem Orthonormierungsverfahren von Gram
17.7 Normale Endomorphismen 701

Übersicht: Die verschiedenen Klassen von Matrizen


Wir listen wichtige Arten von im Allgemeinen komplexen Matrizen auf, erwähnen wesentliche Eigenschaften und geben jeweils
ein typisches Beispiel einer 2 × 2 -Matrix an.

Diagonalmatrix: A = diag(λ1 , . . . , λn ), hat die die Spalten und Zeilen der Matrix bilden Orthonormal-
Eigenwerte λ1 , . . . , λn , ist genau dann invertierbar, basen des Rn :
wenn λ1 , . . . , λn  = 0: ⎛ ⎞
' ( − √1 √1
1 0 A = ⎝ 1 2 12 ⎠
A= √ √
0 3 2 2

Obere bzw. untere Dreiecksmatrix: Die Eigenwerte Spezielle orthogonale Matrix: eine orthogonale Ma-
stehen auf der Hauptdiagonalen, ist zu einer Jordan- trix mit det A = 1, stellt eine Drehung dar:
Matrix ähnlich, ist genau dann invertierbar, wenn alle ⎛ ⎞
Diagonaleinträge ungleich null sind: √1 − √1
' ( A=⎝ 2 2⎠
1 2 √1 √1
A= 2 2
0 3
0
Reelle symmetrische Matrix: A0 = A, hat nur reelle Unitäre Matrix: A = A−1 , hat Eigenwerte vom Be-
Eigenwerte, ist diagonalisierbar, liefert eine symmetri- trag 1, ist invertierbar, ist diagonalisierbar, die Spalten
sche Bilinearform: und Zeilen der Matrix bilden Orthonormalbasen des
' ( Cn : ⎛ ⎞
1 2 √1 √1
A=
2 3 A=⎝ 2 2 ⎠
√i − √i
2 2
Hermitesche Matrix: A0 = A, hat nur reelle Eigen-
werte, ist diagonalisierbar, liefert eine hermitesche Ses- Positiv definite Matrix: v 0 A v > 0 für alle v = 0, ist
quilinearform: ' ( symmetrisch, hat nur positive Eigenwerte, ist invertier-
1 −i bar, liefert ein Skalarprodukt:
A=
i 3 ' (
1 2
Reelle schiefsymmetrische Matrix: A0 = −A, hat A=
2 5
nur Nullen auf der Hauptdiagonalen, hat nur rein ima-
ginäre Eigenwerte: Negativ definite Matrix: v 0 A v < 0 für alle v = 0,
' (
0 −1 ist symmetrisch, hat nur negative Eigenwerte, ist inver-
A=
1 0 tierbar: ' (
−3 2
A=
Invertierbare Matrix: A A−1 = En , es gilt det A = 2 −2
0, hat höchstens Eigenwerte ungleich 0:
' ( Indefinite Matrix: Es gibt v, w mit v 0 A v < 0 und
1 0 w0 A w > 0, ist symmetrisch, hat einen negativen und
A=
2 3 positiven Eigenwert:
' (
Idempotente Matrix: A2 = A, stellt eine Projektion −1 2
A=
dar, hat höchstens die Eigenwerte 0 und 1, ist diagona- 2 −2
lisierbar: 1 1
2 2 Reelle normale Matrix: A0 A = A A0 , ist von evtl.
A=
1 1 2 × 2 -Kästchen auf der Hauptdiagonalen abgesehen
2 2
diagonalisierbar:
Nilpotente Matrix: Ap = 0 für ein p ∈ N, hat den ' (
einzigen Eigenwert 0, ist zu einer Jordan-Matrix ähn- 1 −1
A=
lich: ' ( 1 1
−1 1
A=
−1 1 0 0
Komplexe normale Matrix: A A = A A , ist dia-
Orthogonale Matrix: A0 = A−1 , hat höchstens die gonalisierbar: ' (
Eigenwerte ±1, ist invertierbar, ist von evtl. Drehkäst- 1 i
A=
chen auf der Diagonalen abgesehen diagonalisierbar, −i 5
702 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

und Schmidt ist es möglich, in den Eigenräumen Orthonor- Mit dem Gram-Schmidt’schen Orthonormierungsverfahren
malbasen zu erzeugen, solange die Dimensionen der Eigen- können wir in jedem der r Eigenräume Eigϕ (λi ) eine Ortho-
räume höchstens abzählbar unendlich sind. Falls zudem noch normalbasis Bi konstruieren. Die Vereinigung
L⊥ = {0} im Teil (b) gilt, so ist das Orthonormalsystem sogar
eine Orthonormalbasis. Und nun kommt das Entscheidende: 
r
B= Bi
Ist V endlichdimensional, so sind diese zwei Dinge von selbst
i=1
erfüllt.
dieser Orthonormalbasen B1 , . . . , Br ist dann eine Ortho-
normalbasis von V . Die Elemente von B sind Eigenvektoren
Zu jedem normalen Endomorphismus eines von ϕ. Damit ist alles begründet. 

unitären Vektorraums gibt es eine


Orthonormalbasis aus Eigenvektoren Wir übersetzen das erhaltene Ergebnis in das Matrizenkalkül
und erhalten für eine komplexe quadratische Matrix A, dass
Wir wissen bereits, dass jeder unitäre und selbstadjungierte A genau dann normal ist, wenn sie orthogonal diagonalisier-
Endomorphismen ϕ eines endlichdimensionalen unitären bar ist, etwas genauer:
Vektorraums V orthogonal diagonalisierbar ist, d. h, dass
eine Orthonormalbasis B von V aus Eigenvektoren von ϕ
Der Spektralsatz für normale Matrizen
existiert, bezüglich der die Darstellungsmatrix von ϕ eine
Diagonalgestalt besitzt. Es sei A ∈ Cn×n . Die Matrix A ist genau dann normal,
0
wenn es eine unitäre Matrix S ∈ Cn×n , S −1 = S , gibt,
Unitäre und selbstadjungierte Endomorphismen sind normal. sodass
Wir erhalten somit das alte Resultat wieder in dem allgemei- D = S −1 A S
nen Satz:
Diagonalgestalt hat.
Der Spektralsatz für unitäre Räume
Es sei ϕ ein normaler Endomorphismus des endlichdi- Beweis: Ist die Matrix A ∈ Cn×n normal, so folgt aus
mensionalen unitären Vektorraums V . Dann besitzt V dem Spektralsatz für unitäre Räume, dass es eine geordnete
eine Orthonormalbasis, die aus Eigenvektoren von ϕ be- Orthonormalbasis B = (b1 , . . . , bn ) des Cn aus Eigenvek-
steht. Insbesondere ist ϕ diagonalisierbar. toren des normalen Endomorphismus ϕA : v → A v gibt.
Die Matrix S = (b1 , . . . , bn ), deren Spalten gerade die Ba-
sisvektoren der Orthonormalbasis B bilden, ist dann unitär,
Beweis: Es sei L das Erzeugnis aller Eigenvektoren aller 0
Eigenwerte von ϕ. Wir schränken den normalen Endomor- d. h., S −1 = S , und erfüllt D = S −1 A S, wobei D eine
phismus ϕ auf den Untervektorraum L⊥ ein und erhalten Diagonalmatrix ist.
wegen der Voraussetzung und dem Teil (b) aus obiger Folge- Nun existiere zu A ∈ Cn×n eine unitäre Matrix S, d. h.,
0
rung: S −1 = S , sodass D = S −1 A S eine Diagonalmatrix ist.
Es folgt:
ϕ|L⊥ ∈ EndC (L⊥ ) und dim(L⊥ ) < ∞ .
0 0 0
Angenommen, L⊥ = {0}. Da das charakteristische Polynom A = S D S −1 = S D S und A = S D S .
von ϕ|L⊥ über C zerfällt, hat ϕ|L⊥ Eigenwerte. Da nach der Hieraus erhalten wir:
Aussage (b) der obigen Folgerung ϕ|L⊥ keine Eigenvektoren
0 0 0 0
hat, erhalten wir einen Widerspruch. Somit gilt L⊥ = {0}, AA = S DDS = SDDS = A A.
d. h., L = V .
Folglich ist A normal. 
Sind λ1 , . . . , λr die verschiedenen Eigenwerte von ϕ, so gilt
also:
V = Eigϕ (λ1 ) + · · · + Eigϕ (λr ) . Kommentar: In der linearen Algebra bezeichnet man die
Menge aller Eigenwerte einer linearen Abbildung ϕ bzw.
Wegen dem Teil (a) der Folgerung stehen Eigenräume zu einer Matrix A als das Spektrum von ϕ bzw. A. In der Funk-
verschiedenen Eigenwerten senkrecht aufeinander. Weiter- tionalanalysis wird dieses Spektrum für lineare Operatoren
hin erhalten wir aus v 1 + · · · + v r = 0 mit v i ∈ Eigϕ (λi ): unendlichdimensionaler Räume verallgemeinert.

0 = 0 · v i = (v 1 + · · · + v r ) · v i = v i 2 ,
Beim Spektralsatz für unitäre Räume bzw. für normale Matri-
d. h., dass v 1 = · · · = v r = 0 gilt. Wir haben begründet, zen ist es ganz wesentlich, dass der Grundkörper der Körper
dass V die direkte orthogonale Summe der Eigenräume ist, C der komplexen Zahlen ist. Über C zerfällt nämlich jedes
d. h. Polynom in Linearfaktoren, sodass man sich um die allge-
V = Eigϕ (λ1 ) 9⊥ ··· 9
⊥ Eigϕ (λr ) . meine Voraussetzung zur Diagonalisierbarkeit, dass nämlich
17.7 Normale Endomorphismen 703

das charakteristische Polynom zerfallen muss, nicht den Kopf Beweis: (a) Wir schreiben kürzer ϕ = ϕA . Ist v ∈ Eϕ (λ),
zerbrechen muss. Über R ist dies nicht gewährleistet. Und so gilt:
so wird man natürlich erwarten, dass man über R nicht je- ϕ(v) = A v = A v = λ v = λ v ,
den normalen Endomorphismus bzw. jede normale Matrix d. h., dass v ∈ Eϕ (λ), d. h., Eϕ (λ) ⊆ Eϕ (λ). Wendet man
diagonalisieren kann. Wir untersuchen nun den reellen Fall nun diese Argumentation auf λ anstelle von λ an, so erhält
genauer. man die andere Inklusion Eϕ (λ) ⊆ Eϕ (λ). Damit ist bereits
(a) gezeigt.
Zu jedem normalen Endomorphismus eines (b) Es gilt:
euklidischen Vektorraums gibt es eine Ortho- 1 1
normalbasis bezüglich der die Darstellungs- Re (v) = (v + v) , Im (v) = (v − v) .
2 2i
matrix eine Blockdiagonalmatrix ist Damit erhalten wir

Wir haben bereits erwähnt, dass es zu orthogonalen und Re (λ) Re (v) − Im (λ) Im (v) =
' (
selbstadjungierten Endomorphismen ϕ eines endlichdimen- 1 1
sionalen euklidischen Vektorraums V eine Orthonormalbasis = (λ + λ) (v + v) − 2 (λ − λ) (v − v)
4 i
gibt bezüglich der die Darstellungsmatrix von ϕ eine Block- 1
diagonalgestalt hat (Seiten 688 und 693). Im Fall eines selbst- = (2 λ v − 2 λ v)
4
adjungierten Endomorphismus ist die Darstellungsmatrix so- 1
gar diagonal, im Fall eines orthogonalen = (ϕ(v) + ϕ(v))
 Endomorphismus
α − sin α auf. 2
tauchen evtl. 2 × 2 -Matrizen der Form cos sin α cos α = ϕ(Re (v)) .
Nun sind orthogonale und selbstadjungierte Endomorphis-
men insbesondere normal. Wir erhalten somit diese Resultate Damit ist (i) in (b) nachgewiesen, die Gleichung in (ii) zeigt
aus dem allgemeineren Satz für normale Endomorphismen: man analog. 

Der Spektralsatz für euklidische Räume Mit diesem Lemma ist der Beweis des Spektralsatzes kurz.
Es sei ϕ ein normaler Endomorphismus des endlichdi-
mensionalen euklidischen Vektorraums V . Dann besitzt Beweis: (des Spektralsatzes für euklidische Räume) Wir
V eine Orthonormalbasis B, sodass dürfen ohne Einschränkung annehmen, dass V = Rn , · das
⎛ ⎞ kanonische Skalarprodukt und ϕ = ϕA durch eine normale
λ1 Matrix A ∈ Rn×n gegeben ist. Nach dem Spektralsatz für
⎜ ⎟
⎜ .. ⎟ normale Matrizen existiert eine Orthonormalbasis B̃ von Cn
⎜ . ⎟
⎜ ⎟
⎜ ⎟ aus Eigenvektoren von A. Nach obigem Lemma kann B̃ als
⎜ λr ⎟
⎜ ⎟
⎜ ⎟

⎜ a1 −b1 ⎟
⎟ B̃ = (v 1 , . . . , v r , v r+1 , v r+1 , . . . , v r+s , v r+s )
B M(ϕ)B = ⎜
⎜ b1 a1


⎜ ⎟ gewählt werden, wobei für i ≤ r der Vektor v i ein Eigen-
⎜ ⎟
⎜ .. ⎟

⎜ . ⎟
⎟ vektor zum Eigenwert λi ∈ R sogar aus dem Rn gewählt
⎜ ⎟ werden kann, und für j > r der Vektor v j Eigenvektor zum
⎜ ⎟
⎜ as −bs ⎟
⎝ ⎠ Eigenwert λj ∈ C \ R ist. Setze für jedes solche j nun
bs as
√ √
uj = 2 Re (v j ) , w j = 2 Im (v j ) ∈ Rn .
mit λ1 . . . , λr , a1 , . . . , as , b1 , . . . , bs ∈ R, b1 , . . . ,
bs = 0. Im Fall s = 0 ist ϕ diagonalisierbar. Es gilt dann:
 √ 2
2
Zum Beweis dieses Satzes benötigen wir eine Hilfsaussage, uj · w j = (v j + v j ) (v j − v j )
2
die wir dem Beweis des Spektralsatzes voranstellen.
1
= (v j 2 − v j 2 ) = 0
Lemma 2
Wir betrachten den Endomorphismus ϕA : Cn → Cn , und
v → A v, wobei A ∈ Rn×n . Dann gilt für jedes λ ∈ C:  √ 2
2 2
(a) EϕA (λ) = EϕA (λ) = {v | v ∈ EϕA (λ)}. uj  = (v j + v j ) (v j + v j )
2
(b) Für v ∈ EϕA (λ) seien Re (v), Im (v) ∈ Rn der Real-
und Imaginärteil von v. Dann gilt: 1
=(1 + 1) = 1 ,
(i) ϕA (Re (v)) = Re (λ) Re (v) − Im (λ) Im (v), 2
(ii) ϕA (Im (v)) = Im (λ) Re (v) + Re (λ) Im (v). wj 2 = 1 .
704 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Für k = j gilt weiterhin wj ⊥ v k . Somit ist Die Normalform eines orthogonalen


Endomorphismus ist von Drehkästchen
B = (v 1 , . . . , v r , ur+1 , w r+1 , . . . , ur+s , w r+s ) ⊆ Rn
abgesehen eine Diagonalmatrix
eine Orthonormalbasis. Nach dem Teil (b) aus obigem
Lemma gilt: Nun ist es nicht mehr schwer, das bereits früher zitierte Er-
A uj = Re (λj ) uj − Im (λj ) wj . gebnis zu beweisen:
 
=:aj −r =:bj −r
Die Normalform orthogonaler Endomorphismen
Es gilt weiterhin:
Ist ϕ ein orthogonaler Endomorphismus eines endlich-
A w j = −bj −r uj + aj −r wj . dimensionalen euklidischen Vektorraums V , so gibt es
eine Orthonormalbasis B von V mit
Das zeigt, dass B M(ϕ)B die im Satz angegebene Gestalt ⎛ ⎞
hat.  1
⎜ ⎟
⎜ .. ⎟
⎜ . ⎟
⎜ ⎟
⎜ ⎟
Da jeder selbstadjungierte Endomorphismus insbesondere ⎜ 1 ⎟
⎜ ⎟
normal ist, können wir den Spektralsatz auf selbstadjun- ⎜ −1 ⎟
⎜ ⎟
⎜ ⎟
gierte Endomorphismen endlichdimensionaler euklidischer ⎜ .. ⎟
B M(ϕ) =
B ⎜ . ⎟
⎜ ⎟
Vektorräume anwenden. Diese Endomorphismen können wir ⎜ ⎟

⎜ −1 ⎟

weiterhin mit den symmetrischen Matrizen identifizieren, da- ⎜ ⎟
⎜ A1 ⎟
her erhalten wir: ⎜ ⎟
⎜ .. ⎟
⎜ ⎟
⎝ . ⎠
Der Spektralsatz für symmetrische Matrizen Ak
Es sei A ∈ Rn×n . Die Matrix A ist genau dann symme-
trisch, wenn es eine orthogonale Matrix S ∈ Rn×n , d. h.
wobei jedes A' i für i = 1, . . . , k
(eine 2 × 2-Drehmatrix
cos αi − sin αi
S −1 = S 0 , gibt, sodass ist, also Ai = mit αi ∈]0, 2 π [\{π}.
sin αi cos αi
D = S −1 A S

Diagonalgestalt hat. Beweis: Laut dem Spektralsatz für euklidische Räume be-
sitzt V eine Orthonormalbasis B, sodass
⎛ ⎞
Beweis: Ist A ∈ Rn×n symmetrisch, so ist der Endomor- λ1
phismus ϕA : v → A v selbstadjungiert und somit normal. ⎜ ⎟
⎜ .. ⎟
⎜ . ⎟
Nach dem Spektralsatz für euklidische Räume gibt es eine ⎜ ⎟
⎜ ⎟
⎜ λr ⎟
Orthonormalbasis B des Rn aus Eigenvektoren von A mit ⎜ ⎟
⎜ ⎟
der im Satz angegeben Form, B M(ϕA )B = S −1 A S, wo- ⎜
⎜ a1 −b1 ⎟

bei die Spalten der orthogonalen Matrix S die Orthonormal- B M(ϕ)B =⎜
⎜ b1 a1


⎜ ⎟
basis B bilden. Man beachte, dass die Darstellungsmatrix ⎜ ⎟
⎜ .. ⎟
−1 ⎜ . ⎟
B M(ϕA )B = S A S wegen ⎜



⎜ ⎟
⎜ as −bs ⎟
(S −1 A S)0 = S 0 A0 (S −1 )0 = S −1 A S ⎝ ⎠
bs as
symmetrisch ist. Daher kann es wegen −bi = bi , bi  = 0,
keine 2 × 2-Kästchen auf der Diagonalen von B M(ϕA )B mit λ1 , . . . , λr , a1 , . . . , as , b1 , . . . , bs ∈ R, b1 , . . . , bs = 0.
geben. Somit ist B M(ϕA )B eine Diagonalmatrix.
Da B eine Orthonormalbasis ist, ist die Matrix B M(ϕ)B
Nun existiere zu A ∈ Rn×n eine orthogonale Matrix S, d. h., orthogonal. Damit gilt λ2i = 1, sodass λi = ±1 für alle
S −1 = S 0 , sodass D = S −1 A S eine Diagonalmatrix ist.
i = 1, . . . , r. Und für die Kästchen ( abii −b
ai ) gilt ai +bi = 1
i 2 2
Es folgt:
für alle i = 1, . . . , s. Somit gibt es zu jedem solchen Käst-
A = S D S −1 = S D S 0 chen ein αi ∈]0, 2 π [\{π} mit ai = cos αi und bi = sin αi ,
d. h.
= (S D 0 S 0 )0 ' ( ' (
ai −bi cos αi − sin αi
= (S D S 0 )0 =
bi ai sin αi cos αi
= A0 .
für jedes solche i. Damit hat B M(ϕ)B die gewünschte
Folglich ist A symmetrisch.  Form. 
Zusammenfassung 705

Übersicht: reell versus komplex


Wir stellen wesentliche Begriffe für den reellen und den komplexen Fall eines Vektorraums mit einem Skalarprodukt gegenüber
– dabei geben wir auch die Normalformen der Endomorphismen endlichdimensionaler Vektorräume bzw. Matrizen an.

reell komplex

euklidisches Skalarprodukt unitäres Skalarprodukt


0
symmetrische Matrix, A = A0 , hermitesche Matrix, A = A
diagonalisierbar diagonalisierbar
0
orthogonale Matrix, A−1 = A0 , unitäre Matrix, A−1 = A ,
im Allgemeinen nicht diagonalisierbar, diagonalisierbar
evtl. Drehkästchen auf der Diagonalen

selbstadjungierter Endomorphismus, ϕ = ϕ ∗ , selbstadjungierter Endomorphismus, ϕ = ϕ ∗ ,


diagonalisierbar diagonalisierbar
0 0
normale Matrix, A0 A = A A0 , normale Matrix, A A = A A ,
im Allgemeinen nicht diagonalisierbar, diagonalisierbar
evtl. schiefsymmetrische Kästchen auf der Diagonalen

normaler Endomorphismus, ϕ ∗ ϕ = ϕ ϕ ∗ , normaler Endomorphismus, ϕ ∗ ϕ = ϕ ϕ ∗ ,


im Allgemeinen nicht diagonalisierbar diagonalisierbar

Zusammenfassung

Im Folgenden bezeichne K einen der Körper R oder C. Bei ein Skalarprodukt. Weitere Beispiele erhält man mit positiv
einem Skalarprodukt eines K-Vektorraums V werden Vekto- definiten Matrizen. Dabei nennt man eine n × n-Matrix A
0
ren verknüpft, und als Ergebnis erhält man einen Skalar aus mit A = A positiv definit, wenn für alle v ∈ Kn
K, genauer:
v 0 A v ≥ 0 und v 0 A v = 0 ⇔ v = 0
Definition von Skalarprodukt
gilt. Ist A ∈ Kn×n positiv definit, so wird durch
Ist V ein K-Vektorraum, so heißt eine Abbildung
 v · w = v0A w
V × V → K,
·:
(v, w)  → v · w
ein Skalarprodukt auf dem Kn erklärt. Ist umgekehrt · ein
Skalarprodukt eines endlich-dimensionalen Vektorraums V
ein Skalarprodukt, wenn für alle v, v  , w ∈ V und
mit der Basis B = (b1 , . . . , bn ), so ist die sogenannte Dar-
λ ∈ K die folgenden Eigenschaften erfüllt sind:
stellungsmatrix des Skalarprodukts
(i) (v +v  )·w = v ·w +v  ·w und (λ v)·w = λ (v ·w),
(ii) v · w = w · v, ⎛ ⎞
b1 · b1 · · · b1 · bn
(iii) v · v ≥ 0 und v · v = 0 ⇔ v = 0. ⎜ .. ⎟ ∈ Kn×n
M B (·) = (bi · bj )i,j = ⎝ ... . ⎠
Im Fall K = R nennt man das Skalarprodukt euklidisch und bn · b1 · · · bn · bn
V einen euklidischen Vektorraum, im Fall K = C nennt man
· unitär und V einen unitären Vektorraum. Das bekannteste positiv definit. Ist C eine weitere Basis von V , so sind die Ma-
Beispiel ist das kanonische Skalarprodukt: Für jede natürli- trizen M B und M C zueinander kongruent, d. h., es existiert
che Zahl n ist im Vektorraum Kn das Produkt eine invertierbare Matrix S ∈ Kn×n mit
0
v · w = v0 w S MB S = MC .
706 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

Vor allem für die Anwendungen ist das folgende Beispiel Damit stellt sich gleich die Frage nach Orthonormalbasen
eines Skalarprodukts wichtig. Für reelle Zahlen a < b be- in solchen Vektorräumen, also nach Basen, bei denen je
zeichne C den Vektorraum aller auf [a, b] stetigen Funktio- zwei verschiedenen Elemente orthogonal zueinander sind
nen mit Werten in K. Setzt man für f, g ∈ C und jedes Element die Länge 1 hat. Mithilfe des Gram-
J b Schmidt’sche Orthonormierungsverfahren kann zu jeder end-
-f, g. = f (t) g(t) dt , lichen linear unabhängigen Menge X = {a 1 , . . . , a n } von
a Vektoren von V eine Orthonormalbasis B = {b1 , . . . , bn }
so ist - , . ein Skalarprodukt. angeben werden, die denselben Vektorraum erzeugt, d. h.
-X. = -B., damit erhält man:
Durch das Skalarprodukt kann man Vektoren v ∈ V eine
Länge und je zwei Vektoren v, w ∈ V einen Abstand und
im Fall K = R einen dazwischenliegenden Winkel zuordnen. Existenz von Orthonormalbasen
Diese Begriffe stimmen natürlich im Fall K = R und V = R2
Jeder höchstens abzählbardimensionale euklidische
oder V = R3 mit den kanonischen Skalarprodukten mit den
Vektorraum besitzt eine Orthonormalbasis.
anschaulichen Begriffen von Länge, Abständen und Winkel
überein. Für die Definition der Norm bzw. der Länge
√ Von den strukturerhaltenden Abbildungen von Vektorräumen
v = v · v
mit einem Skalarprodukt haben wir drei Arten genauer unter-
eines Vektors v ist wesentlich, dass das Skalarprodukt positiv sucht: Die orthogonalen bzw. unitären Endomorphismen, die
definit ist. Mithilfe dieser Norm erklärt man den Abstand selbstadjungierten Endomorphismen und die normalen En-
zwischen Vektoren v und w als die nichtnegative reelle Zahl domorphismen. Dabei sind die ersten zwei Arten spezielle
normale Endomorphismen.
d(v, w) = v − w = w − v .
Um nun auch Winkel zwischen Vektoren einführen zu kön-
nen, benötigen wir die Cauchy-Schwarz’sche Ungleichung: Orthogonale und unitäre Endomorphismen
Für alle v und w aus V gilt Einen Endomorphismus ϕ von V mit der Eigenschaft

|v · w| ≤ v w , v · w = ϕ(v) · ϕ(w) für alle v, w ∈ V


wobei Gleichheit genau dann gilt, wenn v und w linear ab- nennt man im Fall K = R einen orthogonalen Endomor-
hängig sind. phismus und im Fall K = C einen unitären Endomor-
Diese Cauchy-Schwarz’sche Ungleichung spielt nicht nur in phismus.
der linearen Algebra eine entscheidende Rolle, wir werden im
Kapitel 19 zu den Funktionenräumen darauf zurückgreifen.
In der linearen Algebra findet die Ungleichung für zweierlei Diese Art von Endomorphismen zeichnet sich dadurch aus,
Dinge eine Verwendung, zum einen kann man mit ihr die dass sie die Länge der Vektoren erhält, d. h., für alle v ∈ V
sogenannte Dreiecksungleichung gilt:

v + w ≤ v + w v = ϕ(v) .

für alle v und w eines Vektorraums V mit Skalarprodukt Orthogonale bzw. unitäre Endomorphismen sind nicht nur
begründen, zum anderen benutzt man sie wegen längenerhaltend, sie erhalten auch die Orthogonalität zwi-
v·w schen vom Nullvektor verschiedenen Vektoren.
−1 ≤ ≤1
v w Die wichtigsten Beispiele orthogonaler Endomorphismen
zur Definition des Winkels α ∈ [0, π ] im Fall K = R zwi- des Rn sind Spiegelungen. Diese sind nämlich die Bau-
schen je zwei vom Nullvektor verschiedenen Vektoren durch steine, aus denen die orthogonalen Endomorphismen aufge-
v·w baut sind: Jeder orthogonale Endomorphismus ϕ des Rn ist
α = arccos . nämlich ein Produkt von höchstens n Spiegelungen.
v w
Daher ist es auch sinnvoll zu sagen, zwei Vektoren v und w in Orthogonale bzw. unitäre Endomorphismen hängen eng
V sind orthogonal zueinander, wenn das Skalarprodukt v · w mit orthogonalen bzw. unitären Matrizen zusammen. Da-
den Wert null ergibt. Für zueinander orthogonale Vektoren bei nennt man eine Matrix A ∈ Rn×n orthogonal, falls
kann man zeigen: A0 A = En gilt, und eine Matrix A ∈ Cn×n heißt unitär,
0
falls A A = En gilt. Damit bilden die Spalten und Zeilen
Orthogonale Vektoren sind linear unabhängig einer orthogonalen bzw. unitären Matrix eine Orthonormal-
Jede Menge von Vektoren  = 0 in V , die paarweise or- basen des Rn bzw. Cn . Der angesprochene Zusammenhang
thogonal zueinander sind, ist linear unabhängig. zwischen den Endomorphismen und den Matrizen beschreibt
der Satz:
Zusammenfassung 707

Darstellungsmatrizen orthogonaler bzw. unitärer Selbstadjungierter Endomorphismus


Endomorphismen Man nennt einen Endomorphismus ϕ von V selbstad-
Die Darstellungsmatrix eines Endomorphismus eines jungiert, wenn für alle v, w ∈ V gilt:
endlichdimensionalen euklidischen bzw. unitären Vek-
torraums bezüglich einer Orthonormalbasis ist genau ϕ(v) · w = v · ϕ(w) .
dann orthogonal bzw. unitär, wenn der Endomorphis-
mus orthogonal bzw. unitär ist.
Es gibt einen engen Zusammenhang selbstadjungierter Endo-
morphismen mit reellen symmetrischen bzw. hermiteschen
Wir beschäftigen uns mit der Diagonalisierbarkeit orthogo- Matrizen, dabei nennt man eine Matrix A ∈ Rn×n symme-
naler und unitärer Endomorphismen. Dabei kann man für die trisch, wenn A0 = A gilt, und eine Matrix A ∈ Cn×n heißt
Eigenwerte λ solcher Endomorphismen wegen ihrer längen- 0
hermitesch, wenn A = A gilt. Der angesprochene Zusam-
erhaltenden Eigenschaft zeigen, dass |λ| = 1 gilt. Und die menhang lautet:
Eigenvektoren zu verschiedenen Eigenwerten stehen senk-
recht aufeinander. Im Fall K = C zerfällt zudem das charak-
teristische Polynom in Linearfaktoren. Und tatsächlich gilt Darstellungsmatrizen selbstadjungierter Endo-
in diesem Fall: morphismen
Ist ϕ ein selbstadjungierter Endomorphismus eines
Unitäre Endomorphismen sind diagonalisierbar endlich-dimensionalen K-Vektorraums V mit einer ge-
Ist ϕ ein unitärer Endomorphismus eines endlichdimen- ordneten Orthonormalbasis B, so ist die Darstellungs-
sionalen unitären Vektorraums V mit den Eigenwerten matrix A = B M(ϕ)B im Fall K = R symmetrisch und
λ1 , . . . , λn , so existiert eine Orthonormalbasis B von V im Fall K = C hermitesch.
aus Eigenvektoren von ϕ, d. h.
⎛ ⎞
λ1 0 Natürlich untersuchen wir wieder die Frage nach der Diago-
⎜ .. ⎟ nalisierbarkeit. Dazu stellt man fest, dass das charakteristi-
B M(ϕ)B = ⎝ . ⎠
sche Polynom selbstadjungierter Endomorphismen stets in
0 λn Linearfaktoren zerfällt, dass die Eigenwerte stets reell sind,
und Eigenvektoren zu verschiedenen Eigenwerten zueinan-
der orthogonal sind. Tatsächlich kann man per Induktion zei-
Im euklidischen Fall, d. h. K = R, ist die Situation etwas
gen:
verzwickter, hier gilt:

Die Normalform orthogonaler Endomorphismen Diagonalisierbarkeit selbstadjungierter Endo-


morphismen
Ist ϕ ein orthogonaler Endomorphismus eines endlich-
dimensionalen euklidischen Vektorraums V , so gibt es Ist ϕ ein selbstadjungierter Endomorphismus eines n-
eine Orthonormalbasis B von V mit dimensionalen Vektorraums V mit den (reellen) Eigen-
werten λ1 , . . . , λn , so existiert eine Orthonormalbasis
⎛ ⎞
1 B von V aus Eigenvektoren von ϕ mit
⎜ ⎟
⎜ .. ⎟
⎛ ⎞
⎜ . ⎟
⎜ ⎟ λ1 0
⎜ ⎟
⎜ 1 ⎟ ⎜ ⎟
⎜ ⎟ =⎝ ..
⎜ −1 ⎟ B M(ϕ)B . ⎠
⎜ ⎟
⎜ ⎟
⎜ .. ⎟ 0 λn
B M(ϕ)B =⎜
⎜ . ⎟

⎜ ⎟

⎜ −1 ⎟

⎜ ⎟
⎜ A1 ⎟
⎜ ⎟ Schließlich wenden wir uns den normalen Endomorphismen
⎜ .. ⎟
⎜ ⎟
⎝ . ⎠ zu, dazu muss man erst den Begriff der adjungierten Abbil-
Ak dung erklären: Falls es zu einem Endomorphismus ϕ einen
Endomorphismen ϕ ∗ gibt mit
wobei jedes A' i für i = 1, . . . , k
(eine 2 × 2-Drehmatrix
cos αi − sin αi
ist, also Ai = mit αi ∈]0, 2 π[\{π}. v · ϕ(w) = ϕ ∗ (v) · w
sin αi cos αi

für alle v, w ∈ V , so ist dieser eindeutig bestimmt; man nennt


Wir kommen nun zu den selbstadjungierten Endomorphis- ihn dann den zu ϕ adjungierten Endomorphismus. Und man
men: nennt ϕ normal, falls es zu ϕ einen adjungierten Endomor-
708 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

phismus ϕ ∗ gibt und ϕ mit ϕ ∗ vertauschbar ist, d. h., wenn Der Spektralsatz für euklidische Räume
gilt
Es sei ϕ ein normaler Endomorphismus des endlichdi-
ϕ ◦ ϕ∗ = ϕ∗ ◦ ϕ .
mensionalen euklidischen Vektorraums V . Dann besitzt
Selbstadjungierte, orthogonale und unitäre Endomorphismen V eine Orthonormalbasis B, sodass
sind Beispiele normaler Endomorphismen. Das wichtigste ⎛ ⎞
Ergebnis ist: Zu einem normalen Endomorphismus ϕ eines λ1
⎜ ⎟
komplexen Vektorraums existiert stets eine Orthonormalba- ⎜ .. ⎟
⎜ . ⎟
⎜ ⎟
sis aus Eigenvektoren von ϕ: ⎜ ⎟
⎜ λr ⎟
⎜ ⎟
⎜ ⎟
⎜ a1 −b1 ⎟
⎜ ⎟
Der Spektralsatz für unitäre Räume B M(ϕ)B =⎜ ⎟
⎜ b1 a1 ⎟
⎜ ⎟
Es sei ϕ ein normaler Endomorphismus des endlichdi- ⎜ ⎟
⎜ .. ⎟
mensionalen unitären Vektorraums V . Dann besitzt V ⎜ . ⎟
⎜ ⎟
⎜ ⎟
eine Orthonormalbasis, die aus Eigenvektoren von ϕ be- ⎜ ⎟

⎝ as −bs ⎟

steht. Insbesondere ist ϕ diagonalisierbar. bs as

Ist der Vektorraum hingegen reell, so lässt sich ϕ zwar im mit λ1 , . . . , λr , a1 , . . . , as , b1 , . . . , bs ∈ R, b1 , . . . ,


Allgemeinen nicht diagonalisieren, aber man erhält immer- bs = 0. Im Fall s = 0 ist ϕ diagonalisierbar.
hin:

Aufgaben
Die Aufgaben gliedern sich in drei Kategorien: Anhand der Verständnisfragen können Sie prüfen, ob Sie die Begriffe und
zentralen Aussagen verstanden haben, mit den Rechenaufgaben üben Sie Ihre technischen Fertigkeiten und die Beweisaufgaben
geben Ihnen Gelegenheit, zu lernen, wie man Beweise findet und führt.
Ein Punktesystem unterscheidet leichte Aufgaben •, mittelschwere •• und anspruchsvolle ••• Aufgaben. Lösungshinweise
am Ende des Buches helfen Ihnen, falls Sie bei einer Aufgabe partout nicht weiterkommen. Dort finden Sie auch die Lösungen
– betrügen Sie sich aber nicht selbst und schlagen Sie erst nach, wenn Sie selber zu einer Lösung gekommen sind. Aus-
führliche Lösungswege, Beweise und Abbildungen finden Sie auf der Website zum Buch.
Viel Spaß und Erfolg bei den Aufgaben!

Verständnisfragen Rechenaufgaben
17.1 • Sind die folgenden Produkte Skalarprodukte? 17.5 •• Gegeben ist die reelle, symmetrische Matrix

⎨ '' R( ×'R2 (( →
2 R, ⎛ ⎞
10 8 8
·: v1 w1 ,
⎩ ,  → v1 − w 1 . A = ⎝ 8 10 8 ⎠
v2 w2
⎧ 2 × R2
8 8 10
⎨ '' R( ' (( → R,
·: v1 w1 Bestimmen Sie eine orthogonale Matrix S ∈ R3×3 , sodass
⎩ ,  → 3 v1 w1 + v1 w2 + v2 w1 + v2 w2 .
v2 w2 D = S −1 A S eine Diagonalmatrix ist.

17.2 • Sind · und ◦ zwei Skalarprodukte des Rn , so ist


jede Orthogonalbasis bezüglich · auch eine Orthogonalbasis 17.6 •• Auf dem R-Vektorraum V = {f ∈ R[X] |
bezüglich ◦ – stimmt das ? deg(f ) ≤ 3} ⊆ R[X] der Polynome vom Grad kleiner oder
gleich 3 ist das Skalarprodukt · durch
17.3 • Wieso ist für jede beliebige Matrix A ∈ Cn×n
0 J
die Matrix B = A A hermitesch ? 1
-f, g. = f (t) g(t) dt
17.4 •• Für welche a, b ∈ C ist −1
⎧ 2 × C2
⎨ '' C( ' (( → C, für f, g ∈ V gegeben.
·: v1 w1 v 1 w1 + a v 1 w2
⎩ , → (a) Bestimmen Sie eine Orthonormalbasis von V bezüglich
v2 w2 −2v 2 w1 + b v 2 w2 - , ..
hermitesch? (b) Man berechne in V den Abstand von f = X + 1 zu
Für welche a, b ∈ C ist f außerdem positiv definit? g = X 2 − 1.
Aufgaben 709

17.7 •• ⎛ ⎞ Sie alle⎛normierten


Bestimmen ⎞ Vektoren des 17.12 •• Es sei der euklidische Vektorraum R3 mit dem
1 0 Standardskalarprodukt gegeben, weiter seien
C3 , die zu v 1 = ⎝ i ⎠ und v 2 = ⎝ i ⎠ bezüglich des kano- ⎛ ⎞
0 −i 0 −1 0
nischen Skalarprodukts senkrecht stehen. A = ⎝ 0 0 −1 ⎠
−1 0 0
17.8 • ⎛ ⎞
Berechnen ⎛ ⎞ ⎛ Abstand
Sie den minimalen ⎞ des
3 1 −1 und ϕ = ϕA : R3 → R3 , v → Av, die zugehörige lineare
Punktes v = ⎝ 1 ⎠ zu der Ebene -⎝1⎠ , ⎝−1⎠.. Abbildung.
−1 1 1 (a) Ist ϕ eine Drehung?
(b) Stellen Sie ϕ als Produkt einer minimalen Anzahl von
17.9 •• Im Laufe von zehn Stunden wurde alle zwei Spiegelungen dar.
Stunden, also zu den Zeiten t1 = 0, t2 = 2, t3 = 4, t4 = 6,
t5 = 8 und t6 = 10 in Stunden, die Höhe h1 , . . . , h6 des 17.13 •• Gegeben sei der euklidische Vektorraum
Wasserstandes der Nordsee in Metern ermittelt. Damit haben R[X]3 mit dem euklidischen Skalarprodukt
wir sechs Paare (ti , hi ) für den Wasserstand der Nordsee zu J 1
bestimmten Zeiten vorliegen: -p, q. = p(t) q(t) dt .
−1
(0, 1.0), (2, 1.5), (4, 1.3), (6, 0.6), (8, 0.4), (10, 0.8) . (a) Zeigen Sie, dass durch

Man ermittle eine Funktion, welche diese Messwerte mög- L(p) = (1 − X 2 )p  − 2 X p


lichst gut approximiert.
eine lineare Abbildung L : R[X]3 → R[X]3 definiert
wird.
17.10 • Laut Merkbox auf Seite 687 ist eine (reelle) (b) Berechnen Sie die Darstellungsmatrix A von L bezüg-
Drehmatrix D α für α ∈]0, 2 π [\{π} nicht diagonalisierbar. lich der Basis (1, X, X 2 , X3 ) von R[X]3 .
Nun kann man jede solche (orthogonale) Matrix D α ∈ R2×2 (c) Bestimmen Sie eine Basis B von R[X]3 aus Eigenvek-
auch als unitäre Matrix D α ∈ C2×2 auffassen. Ist sie dann toren von L.
diagonalisierbar ? (d) Bestimmen Sie jeweils eine Basis von ker(L) und
L(R[X]3 ).
17.11 •• Gegeben ist eine elastische Membran im R2 , (e) Zeigen Sie: -L(p), q. = -p, L(q). für alle p, q ∈
die von der Einheitskreislinie x12 +x22 = 1 berandet wird. Bei R[X]3 , d. h., L ist selbstadjungiert.
ihrer (als lineare
' Abbildung
( angenommenen)
' Verformung
(
v1 5 v1 + 3 v2
gehe der Punkt in den Punkt über. Beweisaufgaben
v2 3 v1 + 5 v2
17.14 • Beweisen Sie das Lemma auf Seite 661.
(a) Welche Form und Lage hat die ausgedehnte Membran ?
(b) Welche Geraden durch den Ursprung werden auf sich 17.15 •• Beweisen Sie die auf Seite 682 formulierte
abgebildet ? Cauchy-Schwarz’sche Ungleichung im unitären Fall.

x2 17.16 •• Zeigen Sie, dass die auf Seite 665 angegebene


x1 = x2 Minkowski-Ungleichung gilt.

5 17.17 • Ein Endomorphismus ϕ eines Vektorraums V


mit ϕ 2 = ϕ heißt Projektion. Ist {b1 , . . . , bn } eine Ortho-
normalbasis des euklidischen Vektorraums V = Rn mit dem
kanonischen Skalarprodukt ·, so setzen wir

P i = bi b0
i ∈R
n×n
für jedes i ∈ {1, . . . , n} .
−5 5 x1
Zeigen Sie:
x1 = −x2
!
n
(a) ϕP2 i = ϕP i und (b) En = Pi .
−5 i=1

Insbesondere ist somit für jedes i ∈ {1, . . . , n} die lineare


Abbildung ϕP i eine Projektion.
710 17 Euklidische und unitäre Vektorräume – orthogonales Diagonalisieren

17.18 •• Zeigen Sie, dass eine hermitesche Matrix A ∈ 17.21 • Es sei U ein Untervektorraum eines euklidi-
Cn×n genau dann indefinit ist, wenn sie sowohl einen posi- sches Vektorraums V . Zeigen Sie, dass im Fall U = R u mit
tiven als auch einen negativen Eigenwert hat (Seite 694). u = 1 die orthogonale Projektion π durch π(v) = (v·u) u,
v ∈ V , gegeben ist (Seite 675).
17.19 •• Eine Matrix A ∈ Kn×n , K ein Körper, nennt
man idempotent, falls A2 = A gilt. Zeigen Sie: Für jede 17.22 • Zeigen Sie: Die Matrix eiA ist unitär, falls
idempotente Matrix A ∈ Kn×n gilt: A∈C n×n hermitesch ist.

Kn = ker A ⊕ Bild A . 17.23 • Zeigen Sie, dass man den Spektralsatz für
einen selbstadjungierten Endomorphismen ϕ eines endlich-
dimensionalen R- bzw. C-Vektorraums V auch wie folgt for-
17.20 •• Zeigen Sie, dass die Q R-Zerlegung A = Q R mulieren kann: Es ist ϕ eine Linearkombination der orthogo-
für eine invertierbare Matrix A eindeutig ist, wenn man for- nalen Projektionen auf die verschiedenen Eigenräume, wobei
dert, dass die Diagonaleinträge von R positiv sind. die Koeffizienten die Eigenwerte sind.

Antworten der Selbstfragen

S. 656 Zueinander ähnliche bzw. kongruente Matrizen haben


Weil Summen von Quadraten reeller Zahlen nicht negativ denselben Rang, die Matrix A hat den Rang 2, die Null-
sind. matrix den Rang 0. Somit können die Matrizen weder
kongruent noch ähnlich sein.
S. 657
Aus 0·v = (0+0)·v = 0·v +0·v folgt nach Subtraktion von
0 · v links und rechts des Gleichungszeichens die Gleichung S. 662
0 · v = 0. Für die Gleichung v · 0 = 0 gehe man im zweiten Es gilt
Argument analog vor.
J 1/2 ' (1/2
S. 659
1
2 2 1 51 √
p = t t dt = t | = 1/ 5 .
Nein, wegen der nicht positiven Einträge 0 und −1 auf der 0 5 0
Diagonalen ist das Produkt nicht positiv definit: e2 · e2 = 0
bzw. e3 · e3 = −1.
S. 668
S. 662 ' ( Die erste Regel gilt wegen der Symmetrie des Skalarpro-
1 0
Wir setzen A = . dukts, die zweite Regel wegen 0 · v = 0 für jedes v und die
0 2
Mit der Wahl S = E2 gilt: dritte Regel wegen der positiven Definitheit des Skalarpro-
dukts.
S 0 A S = A und S −1 A S = A .
0
' gibt(keine invertierbare Matrix S mit S A S =
Es S. 674
0 1
(ein entsprechender Ansatz führt zu einem nicht Würde man die Linksstetigkeit nicht fordern, so wäre auch
−2 3
jede Funktion, die stückweise die Nullfunktion ist und an
lösbaren Gleichungssystem), jedoch gilt:
den Zwischenstellen beliebige Werte annimmt, ein Element
' (−1 ' ( ' (
2 −1 2 −1 0 1 von V . Das Integral über das Quadrat einer solchen Funktion
A = .
−1 1 −1 1 −2 3 wäre null, obwohl die Funktion nicht die Nullfunktion ist.
' ( Somit wäre · kein Skalarprodukt, da die positive Definitheit
4 0 verletzt wäre. Die Stetigkeit in 0 sorgt in ähnlicher Weise für
Die Matrizen A und können nicht ähnlich sein, da
0 8 die positive Definitheit: Eine Funktion, die abgesehen vom
sie verschiedene Eigenwerte haben, jedoch gilt:
Punkt 0 die Nullfunktion ist und in der 0 einen sonst beliebi-
' (0 ' ( ' (
2 0 2 0 4 0 gen (endlichen) Wert annimmt, wäre überall linksstetig, nicht
A = . die Nullfunktion und hätte die Norm 0.
0 2 0 2 0 8
Antworten der Selbstfragen 711

S. 674 S. 687
Gilt Weil in diesem Fall die Matrix A den zweifachen Eigenwert
u + u = v = w + w  1 haben müsste; der dritte (verbleibende) Eigenwert müsste
für Elemente u, w ∈ U und u , w  ∈ U ⊥ , so folgt: dann aber auch 1 sein, da die Determinante das Produkt der
Eigenwerte ist.
u − w = w  − u .
 
∈U S. 688
∈U ⊥
Dann rutscht die 1 mit zugehöriger Zeile und Spalte nach
Weil aber für den Durchschnitt U ∩ U ⊥ = {0} gilt, folgt rechts unten durch,
sogleich u = w und u = w  , also die Eindeutigkeit einer ⎛ ⎞
1 0 0
solchen Darstellung.
⎝0 cos α − sin α ⎠ ,
0 sin α cos α
S. 678
⎛ ⎞ ⎛ ⎞
v1 cos α 0 − sin α
⎜ .. ⎟ ⎝ 0 1 0 ⎠,
v = ⎝ . ⎠ ∈ Cn mit v1 = i und v2 , . . . , vn = 0, der Fall
cos α 0 sin α
vn ⎛ ⎞
n = 1 ist eingeschlossen. cos α − sin α 0
⎝ sin α cos α 0⎠ .
0 0 1
S. 685
Ja, das prüft man durch den Nachweis von A0 A = E3 nach.
S. 697
S. 686 Eine Diagonalmatrix D = diag(λ1 , . . . , λn ) ist genau
Sind B = (b1 , . . . , bn ) eine Orthonormalbasis von V und dann positiv semidefinit bzw. negativ semidefinit, wenn alle
ϕ : V → V linear, so gilt für A = B M(ϕ)B : λ1 , . . . , λn größer gleich bzw. kleiner gleich null sind. Die
Diagonaleinträge von D sind nämlich die Eigenwerte der
A0 A = En ⇔ v · w = ϕ(v) · ϕ(w) ∀ v, w ∈ V . Matrix D.
Quadriken – vielseitig
nutzbare Punktmengen 18
Was ist ein hyperbolisches
Paraboloid?
Warum ist die Signatur einer
quadratischen Form träge?
Inwiefern löst die
Pseudoinverse unlösbare
Gleichungssysteme?

18.1 Symmetrische Bilinearformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 714


18.2 Hermitesche Sesquilinearformen . . . . . . . . . . . . . . . . . . . . . . . . . 724
18.3 Quadriken und ihre Hauptachsentransformation . . . . . . . . . . . . 728
18.4 Die Singulärwertzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 741
18.5 Die Pseudoinverse einer linearen Abbildung . . . . . . . . . . . . . . . 743
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 753
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 754
714 18 Quadriken – vielseitig nutzbare Punktmengen

Unter einer Quadrik in einem affinen Raum verstehen wir die eine Bilinearform auf V , wenn für alle x, x  , y, y  ∈ V und
Menge jener Punkte, deren Koordinaten einer quadratischen λ ∈ K gilt:
Gleichung genügen.
σ (x + x  , y) = σ (x, y) + σ (x  , y) ,
Die zweidimensionalen Quadriken sind – von Entartungsfällen σ (λx, y) = λ σ (x, y) ,
abgesehen – identisch mit den Kegelschnitten und seit der σ (x, y + y  ) = σ (x, y) + σ (x, y  ) ,
Antike bekannt. Den Ausgangspunkt für die Untersuchung der σ (x, λy) = λ σ (x, y) .
Kegelschnitte bildete damals allerdings nicht deren Gleichung,
sondern die Kegelschnitte wurden als geometrische Orte ein- Die Bilinearform σ heißt symmetrisch, wenn stets gilt:
geführt, etwa die Ellipse als Ort der Punkte, deren Abstände σ (y, x) = σ (x, y). Bei σ (y, x) = −σ (x, y) heißt die Bi-
von den beiden Brennpunkten eine konstante Summe erge- linearform alternierend.
ben. Aber auch die Tatsache, dass Ellipsen als perspektive
Bilder von Kreisen auftreten, war vermutlich bereits um etwa Beispiel Bei V = R2 ist z. B.
300 v. Chr. bekannt. Anfang des 17. Jahrhunderts konnte Johan- σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5x2 y2
nes Kepler nachweisen, dass die Planetenbahnen Ellipsen sind. ' ( ' (
Sir Isaak Newton formulierte die zugrunde liegenden mechani- für x = xx1 , y = yy1 eine symmetrische Bilinearform.
2 2
schen Gesetze und erkannte, dass sämtliche Kegelschnitttypen
So wie im Kapitel 17 können wir diese Bilinearform auch
als Bahnen eines Massenpunkts bei dessen Bewegung um eine
mithilfe einer symmetrischen Matrix A darstellen, nämlich
zentrale Masse auftreten.
als
Dies war nur der Anfang jener herausragenden Bedeutung der ' (' (
1 1 y1
Kegelschnitte und ihrer höherdimensionalen Gegenstücke für σ (x, y) = x 0 A y = (x1 x2 ) .
1 −5 y2
die Mathematik und ihre Anwendungen in Naturwissenschaften
und Technik. Quadriken haben bemerkenswerte geometrische Dabei ist zu beachten, dass an der Stelle (i, j ) der Matrix A
Eigenschaften und werden oft als lokale oder globale Approxi- der Koeffizient von xi yj steht.
mationen für Kurven und Flächen verwendet. Ellipsoide spielen
Von der Berechnung zweireihiger Determinanten her kennen
in der Konvexitätstheorie eine besondere Rolle. Doch soll die
wir die alternierende Bilinearform
ästhetische Seite nicht unerwähnt bleiben, so treten Ellipsoide
als Kuppeln auf oder hyperbolische Paraboloide als attraktive σ  (x, y) = x1 y2 − x2 y1 .
Dachflächen.
Die Matrix der Koeffizienten ist schiefsymmetrisch, denn
Wir behandeln im Folgenden die Hauptachsentransformation ' (' (
und damit zusammenhängend die Klassifikation der Quadriken. 0 1 y1
σ  (x, y) = (x1 x2 ) . 
Von den Quadriken ist es nur ein kurzer Weg zu anderen −1 0 y2
wichtigen Begriffen wie der „Singulärwertzerlegung“ oder der
„Pseudoinversen“ einer Matrix, welche z. B. bei Problemen der
Ausgleichsrechnung und Approximation eingesetzt werden. Zu je zwei Bilinearformen σ1 , σ2 auf dem K-Vektorraum V
lässt sich eine Summe definieren durch die Vorschrift

(σ1 + σ2 )(x, y) = σ1 (x, y) + σ2 (x, y)


18.1 Symmetrische für alle (x, y) ∈ V 2 . Offensichtlich ist σ1 + σ2 ebenfalls li-
Bilinearformen near in beiden Anteilen und daher wieder eine Bilinearform.
Nun erklären wir noch das skalare Vielfache λ σ einer Bi-
linearform durch
Bei der Definition des Skalarprodukts im Anschauungsraum
wurde in Abschnitt 7.2 ein kartesisches Koordinatensystem (λ σ )(x, y) = λ σ (x, y) .
vorausgesetzt. Im Abschnitt 17.1 gingen wir anders vor,
nämlich koordinateninvariant: Das euklidische Skalarpro- Dann lässt sich leicht bestätigen, dass die Bilinearformen auf
dukt wurde anhand seiner Eigenschaften definiert, und zwar V ebenfalls einen K-Vektorraum bilden.
als eine positiv definite symmetrische Bilinearform auf Rn .
In diesem Kapitel verwenden wir neben dem Skalarprodukt
?
a) Zeigen Sie, dass mit den obigen Definitionen für die
noch eine weitere symmetrische Bilinearform, und deshalb
Summe und das skalare Vielfache von Bilinearformen die
wiederholen wir zunächst einiges aus Abschnitt 17, insbe-
Axiome (V1) bis (V4) der Definition eines Vektorraums von
sondere die Definition der Bilinearformen.
Seite 222 erfüllt sind.
Ist V ein K-Vektorraum, so ist die Abbildung b) Zeigen Sie weiterhin, dass die symmetrischen und ebenso
 die alternierenden Bilinearformen jeweils einen Untervek-
V × V → K,
σ: torraum bilden.
(x, y)  → σ (x, y)
18.1 Symmetrische Bilinearformen 715

Bilinearformen legen eine eindeutige −36


x2
quadratische Form fest, aber nicht umgekehrt −25 2
−16
Nun wollen wir die auf dem K-Vektorraum V definierte Bi- −9

9
1
linearform σ : V × V → K auf die Diagonale {(x, x) | −4

4
x ∈ V } von V einschränken. Das bedeutet, wir betrachten −1

1
0 0 x1
nur die Fälle von σ (x, y) mit x = y. Dann entsteht eine
−3 −2 −1 0 1 2
quadratische Form −1

1
 −4

4
V → K, −1 −9
ρ:

9
x  → ρ(x) = σ (x, x) −16
−2 −25
auf V . Auf Seite 716 lernen wir übrigens eine von σ unab-
−36
hängige Definition quadratischer Formen kennen.
Abbildung 18.1 Einzelne Niveaulinien der quadratischen Form ρ(x) =
In dem Sonderfall einer alternierenden Bilinearform σ ent-
x12 + 2x1 x2 − 5x22 , also Fasern { x | ρ(x) = c = konst.} der Abbildung
steht als Einschränkung auf die Diagonale von V ledig- ρ.
lich die Nullform, denn wegen σ (y, x) = −σ (x, y) ist
ρ(x) = σ (x, x) = −σ (x, x), und somit ρ(x) = 0 für alle
x ∈ V. 36 x2
25
2
Beispiel Bei unserem Zahlenbeispiel, der symmetrischen 16
Bilinearform 9
4 1
σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5 x2 y2 1

über V = R2 , gilt für die zugehörige quadratische Form: −3 −2 −1 0 1 2 x1


1

ρ(x) = x12 + 2 x1 x2 − 5 x22 . −1 4


9
Umgekehrt kann man von ρ(x) nicht auf die Bilinearform 16
zurückschließen, denn −2
25
36
σ  (x, y) = x1 y1 + 3 x1 y2 − x2 y1 − 5 x2 y2
Abbildung 18.2 Niveaulinien der positiv definiten quadratischen Form
ρ(x) = x12 − 2x1 x2 + 2x22 .
ergibt als Einschränkung auf die Diagonale dieselbe quadra-
tische Form. Wenn wir allerdings nur symmetrische Bilinear-
formen zulassen, so bleibt einzig σ übrig, denn bei der Er- x2
4 0
mittlung der Bilinearform muss der Koeffizient von x1 x2 zu 14 10
2
gleichen Teilen auf die Koeffizienten von x1 y2 und x2 y1 auf-
64
geteilt werden. Wir nennen die zu einer quadratischen Form
gehörige symmetrische Bilinearform ihre Polarform (siehe 36 1
Seite 716)
16
Das zweite Zahlenbeispiel, die alternierende Bilinearform
−3 −2 −1 0 1 2 x1
σ  (x, y) = x1 y2 − x2 y1 , ergibt als zugehörige quadratische 4
Form ρ  (x) = x1 x2 − x2 x1 die Nullform ρ  (x) = 0 für alle
0 −1
x ∈ V , wie wir schon oben festgestellt haben. 
4
Quadratische Formen auf dem R2 lassen sich auf eine Art −2
16 36 64 0 4
veranschaulichen, die uns von den Landkarten her als Gelän- 10 14
dedarstellung mittels Höhenlinien vertraut ist:
Abbildung 18.3 Zum Vergleich: Niveaulinien der quadratischen Form
Denken wir uns die Ebene R2 horizontal und tragen wir über ρ(x) = 4x12 − 12x1 x2 + 9x22 = (2x1 − 3x2 )2 zu den Werten c = 0, 4, 16, . . .
jedem Punkt x dieser Ebene den Wert ρ(x) auf. Dann entsteht
eine Fläche, der Graph der quadratischen Form. Werden ho-
rizontale Schnitte dieser Fläche orthogonal in die Ebene R2 Alle Punkte einer Niveaulinie haben unter der Abbildung ρ
projiziert, so erhalten wir Niveaulinien ρ(x) = c = konst. dasselbe Bild c. Die Niveaulinien sind somit die Fasern (siehe
dieser quadratischen Form. Seite 75) der Abbildung ρ : R2 → R, und sie vermitteln
716 18 Quadriken – vielseitig nutzbare Punktmengen

eine Vorstellung von der Werteverteilung der quadratischen Bei char K = 2 ist & σ gleichzeitig alternierend, d. h.
Form. Abbildung 18.1 zeigt die Niveaulinien zu den Werten &
σ (y, x) = −&σ (x, y), und die Einschränkung von & σ auf
c = 0, ±1, ±4, . . . Im Gegensatz dazu nimmt die in Abbil- die Diagonale ist die Nullform.
dung 18.2 gezeigte quadratische Form keine negativen Werte
an. Alternativ dazu ist in Abb. 18.3 eine quadratische Form Folgerung
dargestellt, bei welcher sämtliche Niveaulinien aus Geraden Bei char K = 2 gibt es zu jeder quadratischen Form ρ
bestehen. auf dem K-Vektorraum V genau eine symmetrische Bi-
linearform σ mit ρ(x) = σ (x, x), nämlich deren Polarform.
?
Beweisen Sie, dass die Einschränkungen der Bilinearformen
σ und σ  auf die Diagonale genau dann dieselbe quadratische
Form ergeben, wenn σ − σ  alternierend ist, also Bilinearformen sind stets durch Matrizen
darstellbar
(σ − σ  )(y, x) = σ (y, x) − σ  (y, x) = −(σ − σ  )(x, y)
für alle x, y ∈ V . In Kapitel 12 wurde gezeigt, dass jede lineare Abbildung
ϕ : V → W zwischen endlichdimensionalen K-Vektor-
räumen V und W nach der Einführung von Basen B in V
Wenn wir die quadratische Form ρ als Einschränkung der und C in W eine Darstellungsmatrix C M(ϕ)B besitzt mit
Bilinearform σ definieren, so gilt nach den Eigenschaften der Eigenschaft
einer Bilinearform ρ(λ x) = σ (λ x, λ x) = λ2 ρ(x) sowie
ρ(x + y) = σ (x + y, x + y) C ϕ(x) = C M(ϕ)B B x .
= σ (x, x) + σ (y, y) + (σ (x, y) + σ (y, x))
Dies bedeutet, die C-Koordinaten des Bildes ϕ(x) ∈ W sind
= ρ(x) + ρ(y) + σ  (x, y)
aus den B-Koordinaten des Urbilds x ∈ V durch Multipli-
mit σ  (x, y) = σ (x, y) + σ (y, x) als symmetrischer Bi- kation mit der Darstellungsmatrix C M(ϕ)B zu berechnen.
linearform. Wir nehmen dies zum Anlass für eine Definition, Umgekehrt stellt jede Matrix eine lineare Abbildung dar, und
die nicht von Bilinearformen ausgeht. Eigenschaften von Matrizen spiegeln sich in Eigenschaften
von linearen Abbildungen wieder.
Definition einer quadratischen Form Wir zeigen im Folgenden, dass die symmetrischen Matrizen
Eine Abbildung ρ des Vektorraums V in seinen Grund- M, also solche mit M 0 = M, auf ähnliche Weise den sym-
körper K heißt quadratische Form, wenn für alle x, y ∈ metrischen Bilinearformen zugeordnet werden können.
V und λ ∈ K gilt:
V sei ein n-dimensionaler Vektorraum über K mit der geord-
1. ρ(λ x) = λ2 ρ(x), und
neten Basis B = (b1 , . . . , bn ). Für x, y ∈ V , also
2. die Abbildung
&
σ : (x, y) → ρ(x + y) − ρ(x) − ρ(y) x = x1 b1 + · · · + xn bn und y = y1 b1 + · · · + yn bn ,

ist eine Bilinearform auf V . ergibt sich aus unseren Regeln für Bilinearformen:
⎛ ⎞
Offensichtlich ist &
σ symmetrisch. Als Einschränkung von &
σ ! n !
n !n

& mit
auf die Diagonale entsteht die quadratische Form ρ σ (x, y) = σ ⎝ xi bi , yj bj ⎠ = xi yj σ (bi , bj ) .
i=1 j =1 i,j =1
&(x) = ρ(2 x) − 2 ρ(x) = 2 ρ(x) .
ρ
Die letzte Summe erfolgt über alle möglichen Paare (i, j ) mit
Nun kommt es auf die Charakteristik des Körpers K an: i, j ∈ {1, . . . , n}. Die darin auftretenden n2 Koeffizienten
Bei char K = 2 gibt es zur quadratischen Form ρ eine σ (bi , bj ) legen σ eindeutig fest.
symmetrische Bilinearform
1 1 Definition der Darstellungsmatrix
σ1 = &
σ : (x, y)  → (ρ(x + y) − ρ(x) − ρ(y)) ,
2 2
Sind σ eine Bilinearform auf dem n-dimensionalen K-
deren Einschränkung auf die Diagonale gleich ρ ist. Man
Vektorraum V und B eine Basis von V , so heißt die
nennt diese Bilinearform die Polarform von ρ.
Matrix  
Angenommen, neben σ1 sei auch σ2 eine symmetrische M B (σ ) = σ (bi , bj ) ∈ Kn×n
Bilinearform mit σ2 (x, x) = σ1 (x, x) für alle x ∈ V .
Dann folgt aus σ1 (x + y, x + y) = σ2 (x + y, x + y) für Darstellungsmatrix von σ bezüglich der Basis B.
alle (x, y) ∈ V 2 :
σ1 (x, x) + 2 σ1 (x, y) + σ1 (y, y) Mithilfe der Darstellungsmatrix M B (σ ) lässt sich σ (x, y)
= σ2 (x, x) + 2 σ2 (x, y) + σ2 (y, y) als Matrizenprodukt schreiben, nämlich:
0
und daher σ1 (x, y) = σ2 (x, y), also σ1 = σ2 . σ (x, y) = Bx M B (σ ) B y. (18.1)
18.1 Symmetrische Bilinearformen 717

Beweis: Wir bestätigen die in (18.1) angegebene Matri- b) Bei alternierendem σ ist σ (bj , bi ) = −σ (bi , bj ), also
zenschreibweise für σ (x, y) durch Nachrechnen: M B (σ )0 = −M B (σ ).
Zunächst ist Umgekehrt können wir wie im symmetrischen Fall vorgehen:
⎛⎞ ⎛ n ⎞ Bei einer schiefsymmetrischen Matrix M ist
y1 j =1 σ (b1 , bj ) yj
⎜ ⎟ ⎜ ⎟ y 0 M x = (y 0 M x)0 = x 0 M 0 y = −x 0 M y
M B (σ ) ⎝ ... ⎠ = ⎝ ..
. ⎠.
n
yn j =1 σ (bn , bj ) yj und daher σM (y, x) = −σM (x, y).
Daraus folgt: Wegen der Nullen in der Hauptdiagonale einer schiefsymme-
n(n − 1)
⎞ ⎛ trischen n × n -Matrix treten darin nur voneinander
y1 2
unabhängige Einträge auf. 
⎜ ⎟
(x1 . . . xn ) M B (σ ) ⎝ ... ⎠
yn Beispiel Wir kehren zurück zum obigen Beispiel einer
⎛ ⎞
Bilinearform auf V = R2 :
!
n !
n !n
= xi ⎝ σ (bi , bj ) yj ⎠ = xi yj σ (bi , bj ).
i=1 j =1 i,j =1
σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5x2 y2 .

Wie lautet die Darstellungsmatrix M B (σ ) bezüglich der Ba-



sis B = (b1 , b2 ) mit
' ( ' (
1 2
Man beachte die Bauart der beteiligten Matrizen in der Ma- b1 = , b2 = ?
trizendarstellung (18.1) von σ (x, y): 1 1

n 1 Wir berechnen
1 n
1 = 1 · · n σ (b1 , b1 ) = −2, σ (b1 , b2 ) = σ (b2 , b1 ) = 0, σ (b2 , b2 ) = 3

σ (x, y) = 0 und übertragen diese Werte in die Matrix


Bx M B (σ ) By
' (
−2 0
M B (σ ) = .
Folgerung 0 3
Symmetrische Bilinearformen sind durch symmetrische Dar-
stellungsmatrizen gekennzeichnet, alternierende Bilinearfor- Die gegebene Koeffizientenmatrix A in der Darstellung
men durch schiefsymmetrische oder alternierende Darstel- ' (' (
1 1 y1
lungsmatrizen. σ (x, y) = x 0 A y = (x1 x2 )
1 −5 y2

Beweis: a) Bei symmetrischem σ ergibt sich die Sym- ist die Darstellungsmatrix von σ zur kanonischen Basis
metrie der Darstellungsmatrix M B (σ ) unmittelbar aus E = (e1 , e2 ), also A = M E (σ ). 
σ (bj , bi ) = σ (bi , bj ), und zwar für alle Basen B.
Wenn wir nun die auf dem n-dimensionalen K-Vektorraum V
Umgekehrt legt jede n × n -Matrix M durch die Definition definierte Bilinearform σ mit der Darstellungsmatrix M B (σ )
auf die Diagonale von V einschränken, so entsteht die qua-
σM (x, y) = x 0 M y dratische Form ρ, wobei mit (18.1) gilt:
eine Bilinearform auf Kn fest, denn es gilt ρ(x) = σ (x, x) = 0
Bx M B (σ ) B x .
 0 0 0
(x + x ) M y = x M y + x My, Bei M B (σ ) = (aij ) lautet die Summendarstellung dieser
0 0
(λx) M y = λ(x M y) , quadratischen Form:

und analog für den zweiten Vektor y . !


n
ρ(x) = aij xi xj . (18.2)
Bei symmetrischem M ist auch σM symmetrisch, denn we- i,j =1
gen y 0 M x ∈ K folgt:
Auf der rechten Seite steht ein Polynom oder genauer eine
y 0 M x = (y 0 M x)0 = x 0 M 0 y = x 0 M y . Polynomfunktion in (x1 , . . . , xn ), in welcher jeder Summand
den Grad 2 hat. Wir können darin die rein quadratischen
Es ist zu beachten, dass von den n2 Einträgen in einer n × n- Glieder aii xi2 trennen von den gemischten Summanden mit
n(n + 1)
Matrix im symmetrischen Fall nur voneinander un- xi xj , die bei i = j jeweils zweifach vorkommen, nämlich
2
abhängig sind. als (aij + aj i ) xi xj .
718 18 Quadriken – vielseitig nutzbare Punktmengen

Ist umgekehrt die quadratische Form durch die Summenfor- Je zwei Darstellungsmatrizen einer
mel (18.2) gegeben, so können wir die Koeffizientenmatrix Bilinearform sind kongruent
(aij ) noch abändern, ohne dabei ρ(x) zu ändern. Wir müssen
ja nur dafür sorgen, dass die Einträge in der Hauptdiagona- Wenn wir in unserem Vektorraum von der Basis B zu B 
len gleich bleiben und ebenso die Summen (aij + aj i ). Bei wechseln, so gilt für die jeweiligen Koordinaten von x:
char K = 2 können wir diese Summen zu gleichen Teilen
aufteilen, also B x = B TB B x .

aij = aj i = 1
2 (aij + aj i ) Die hier auftretende Transformationsmatrix
setzen. Damit erhalten wir eine symmetrische Koeffizienten- = = ( B  b1 , . . . ,
 ). Diese ist offensichtlich die Darstellungsmatrix B TB B  M(id V )B B  bn )
matrix (aij
der in der Folgerung auf Seite 716 als eindeutig erkannten ist invertierbar (siehe Kapitel 6). In ihren Spalten stehen die
Polarform der quadratischen Form, also jener symmetrischen B  -Koordinaten der Basisvektoren von B. Man beachte als
Bilinearform σ  , deren Einschränkung auf die Diagonale von Merkregel, dass der linke Index von B  T B übereinstimmt mit
V die gegebene quadratische Form liefert. dem linken Index der Spaltenvektoren B  bi und das Koordi-
Ist die Matrix der Koeffizienten aij in (18.2) bereits symme- natensystem festlegt, in welchem die Vektoren der im rechten
trisch, so können wir die Summe auch schreiben als Index angegebenen Basis dargestellt sind.

!
n !
n Umgekehrt ist
ρ(x) = aii xi2 + 2 aij xi xj .  −1
i=1 i,j =1 Bx = B TB B x mit B TB = B TB .
i<j
Der Wert σ (x, y) ist unabhängig von der verwendeten Basis,
Nachdem die quadratischen Formen und die zugehörigen
d. h., für alle x, y ∈ V muss nach (18.1) gelten:
symmetrischen Bilinearformen, die Polarformen, einander
gegenseitig bedingen, macht es keinen Unterschied, ob man 0 0
σ (x, y) = Bx M B (σ ) B y = B x M B  (σ ) B  y .
von der Darstellungsmatrix einer quadratischen Form spricht
oder von der Darstellungsmatrix der Polarform. Wir ersetzen im mittleren Ausdruck die B-Koordinaten von
x und y durch die jeweiligen B  -Koordinaten. Dies führt zu
?
Bestimmen Sie die Polarform σ (x, y) zur gegebenen qua-
(B T B  B  x)0 M B (σ ) (B T B  B  y)
dratischen Form  
= B  x 0 B T B0 M B (σ ) B T B  B  y
ρ(x) = x12 − 3x32 + 2x1 x2 − 5x2 x3 = 0 M  (σ )  y .
B x B B

auf dem Vektorraum R3 zusammen mit deren kanonischer Nachdem die letzte Gleichung für alle B  x, B  y ∈ Kn gelten
Darstellungsmatrix, also der Darstellungsmatrix M E (σ ) be- muss, können wir hierfür Vektoren der kanonischen Basis
züglich der kanonischen Basis E. einsetzen, etwa B  x = ei und B  y = ej . Dann aber bedeutet
die Gleichung, dass in M B  (σ ) und in dem Matrizenprodukt
So wie bei den linearen Abbildungen eines Vektorraums in (B T B  )0 M B (σ ) B T B  die Einträge an der Stelle (i, j ) über-
sich, den Endomorphismen, wollen wir auch bei den Bilinear- einstimmen, und zwar für alle i, j = 1, . . . , n. Also sind
formen durch die Wahl spezieller Basen möglichst einfache diese Matrizen gleich.
Darstellungsmatrizen erreichen. Dabei ist es hier etwas ein-
facher, denn es gibt zu jeder symmetrischen Bilinearform Transformation von Darstellungsmatrizen
Darstellungsmatrizen in Diagonalform. Nachdem umgekehrt Für die Darstellungsmatrizen der Bilinearform σ bezüg-
eine Diagonalmatrix stets symmetrisch ist, muss jede diago- lich der Basen B und B  gilt:
nalisierbare Bilinearform symmetrisch sein.
Eine Darstellungsmatrix M B (σ ) in Diagonalform hat viele M B  (σ ) = (B T B  )0 M B (σ ) B T B  (18.3)
Vorteile: Es vereinfacht sich die Koordinatendarstellung von  
mit B T B  = B b1 · · · B bn als invertierbarer Matrix.
σ zu
!
n
σ (x, y) = 2
xi yj σ (bi , bj ) = a11 2
x1 y1 + · · · +ann xn yn . Als kleine Gedächtnisstütze merken wir uns, indem wir die
i,j =1
Transformationsgleichung von rechts lesen: Wir bekommen
die Darstellungsmatrix von σ bezüglich B  , indem wir die
Es gibt nur mehr n Summanden. Die zugehörige quadratische B  -Koordinaten zuerst auf B-Koordinaten umrechnen und
Form ρ ist genau dann positiv definit (siehe Seite 659), wenn diese dann mit der zur Basis B gehörigen Darstellungsmatrix
aii > 0 ist für alle i ∈ {1, . . . , n}. multiplizieren.
18.1 Symmetrische Bilinearformen 719

Noch ein Hinweis zu der hier verwendeten Bezeichnungs- Die Kongruenz von Matrizen ist natürlich zu unterscheiden
weise der Darstellungsmatrizen: Bei den linearen Abbildun- von der in Kapitel 12 auf Seite 455 behandelten Ähnlichkeit.
gen schreiben wir beide Basen dazu, also z. B. B  M(ϕ)B . Zur Erinnerung, zwei quadratische Matrizen C, D heißen zu-
Bei den symmetrischen Bilinearformen oder quadratischen einander ähnlich, wenn D = T −1 C T ist mit einer invertier-
Formen ist, so wie in M B (σ ), nur eine Basis erforderlich. baren Matrix T . Wenn man allerdings die Transformations-
matrizen T auf orthogonale Matrizen T beschränkte, also auf
Beispiel Wir bestätigen (18.3) anhand des Beispiels der solche mit T −1 = T 0 (siehe Seite 683), dann wären ähnliche
Bilinearform σ auf V = R2 von Seite 717 mit Matrizen D, C gleichzeitig kongruent und umgekehrt.

σ (x, y) = x1 y1 + x1 y2 + x2 y1 − 5 x2 y2 , Nach den Ergebnissen von Kapitel 12 ändert sich der Rang
einer Matrix nicht bei Rechts- oder Linksmultiplikation mit
also σ (x, y) = x 0 A y und einer invertierbaren Matrix. Demnach haben alle Darstel-
' ( lungsmatrizen einer Bilinearform σ denselben Rang. Wir
1 1 nennen diesen den Rang von σ und bezeichnen ihn mit rg(σ ).
M E (σ ) = A =
1 −5
Es gibt noch eine andere Begründung für die Invarianz des
als Darstellungsmatrix von σ zur kanonischen Basis E = Rangs, bei der wir uns allerdings auf den Fall einer symme-
(e1 , e2 ). Wie lautet die Darstellungsmatrix M B (σ ) bezüglich trischen Bilinearform σ beschränken wollen:
der Basis B = (b1 , b2 ) mit Wie in Kapitel 17 (siehe Seite 676) erklärt, ist σ Anlass für
' ( ' ( eine symmetrische Relation auf V : Zwei Vektoren x, y ∈ V
1 2
b1 = E b1 = , b2 = E b2 = ? heißen σ -orthogonal genau dann, wenn σ (x, y) = 0 ist.
1 1
Vektoren mit σ (y, y) = 0 heißen isotrop bezüglich σ . Zu
Dazu beachten wir die Transformationsmatrix jedem Unterraum U von V gibt es einen σ -Orthogonalraum
' ( U ⊥ mit der Eigenschaft, dass σ (x, y) = 0 ist für alle x ∈ U
1 2 und y ∈ U ⊥ .
T
E B = ( b , b
E 1 E 2 ) = .
1 1
Der σ -Orthogonalraum V ⊥ heißt Radikal der symmetri-
Aus unserem Gesetz über die Transformation der Darstel- schen Bilinearform σ . Die Vektoren y ∈ V ⊥ sind zu allen
lungsmatrizen von Bilinearformen folgt nun: Vektoren aus V σ -orthogonal, also insbesondere auch zu sich
selbst und daher isotrop.
M B (σ ) = (E T B )0 M E (σ ) E T B
' (' (' ( Die Matrizengleichung x 0 M B (σ ) y = 0 ist genau dann für
=
1 1 1 1 1 2 alle x ∈ V erfüllt, wenn M B (σ ) y = 0 ist, also y das homo-
2 1 1 −5 1 1 gene lineare Gleichungssystem mit der Koeffizientenmatrix
' (' ( ' (
2 −4 1 2 −2 0 M B (σ ) löst. Die Dimension des Radikals von σ ist somit
= = , n − rg σ .
3 −3 1 1 0 3
Eine symmetrische Bilinearform auf dem n-dimensionalen
in Übereinstimmung mit dem auf Seite 717 angegebenen
K-Vektorraum V heißt entartet, wenn ihr Rang kleiner ist
Wert für M B (σ ) = σ (bi , bj ) . 
als n. Andernfalls heißt σ nicht entartet oder radikalfrei,
denn das Radikal ist {0}. Ist σ z. B. positiv definit, wie bei
Allgemein heißt die n × n -Matrix D kongruent zur n × n -
einem euklidischen Skalarprodukt, so gilt für x = 0 stets
Matrix C (siehe Seite 661), wenn es eine invertierbare n× n -
σ (x, x) = x · x > 0. Dann ist 0 der einzige isotrope Vektor
Matrix T gibt mit D = T 0 C T .
und σ daher radikalfrei.
Folgerung ?
Alle Darstellungsmatrizen derselben Bilinearform sind un- Welche Eigenschaft hat die symmetrische Darstellungsma-
tereinander kongruent. Umgekehrt sind je zwei kongruente trix M B (σ ), wenn der i-te Basisvektor bi ∈ B isotrop ist
Matrizen aus Kn×n aufzufassen als Darstellungsmatrizen bezüglich σ ? Wie sieht M B (σ ) aus, wenn bi dem Radikal
derselben Bilinearform auf Kn . von σ angehört?

Beweis: Die Umkehrung folgt aus der Tatsache, dass jede


invertierbare Matrix aus Kn×n als Transformationsmatrix für
einen Basiswechsel interpretierbar ist. 
Jede symmetrische Bilinearform besitzt eine
? Darstellungsmatrix in Diagonalform
Beweisen Sie, dass die zu einer symmetrischen Matrix kon-
gruenten Matrizen ebenfalls symmetrisch sind. Dasselbe gilt Ein Wechsel von der geordneten Basis B zu einer anderen
für die Schiefsymmetrie. Basis B  in dem K-Vektorraum V lässt sich aus folgenden
elementaren Basiswechseln zusammensetzen:
720 18 Quadriken – vielseitig nutzbare Punktmengen

1. Zwei Basisvektoren werden vertauscht, d. h. bi = bj und einer symmetrischen Bilinearform durch geeigneten Basis-
bj = bi bei i = j . wechsel auf Diagonalform zu bringen: Dabei wenden wir
2. Ein Basisvektor wird durch das λ-Fache ersetzt, also bi = wiederholt elementare Zeilenoperationen und die damit ge-
λbi und λ = 0. koppelten gleichartigen Spaltenoperationen an.
3. Zum i-ten Basisvektor wird das λ-Fache des j -ten Basis-
vektors addiert, also bi = bi + λ bj bei i  = j . Beispiel Gegeben ist die symmetrische Bilinearform
σ (x, y) = x 0 A y auf R4 mit der Darstellungsmatrix
Was bedeuten diese elementaren Basiswechsel
 für die
 sym- ⎛ ⎞
metrische Darstellungsmatrix M B (σ ) = σ (bi , bj ) ? 0 1 −2 1
⎜ 1 1 0 0⎟
A=⎜
⎝ −2

Wir werden erkennen, dass jeder dieser Schritte eine ele- 0 −4 4 ⎠
mentare Zeilenumformung und die gleichartige elementare 1 0 4 −1
Spaltenumformung nach sich zieht. Dabei ist gleichgültig,
ob zuerst die Zeilen- und dann die Spaltenumformung vor- Schritt 1: Wenn es ein Element aii = 0 in der Hauptdiago-
genommen wird oder umgekehrt. Diese elementaren Zeilen- nale gibt, so bringen wir dieses durch die Zeilenvertauschung
umformungen sind uns übrigens erstmals im Kapitel 5 beim zi ↔ z1 und die gleichartige Spaltenvertauschung s i ↔ s 1
Verfahren von Gauß und Jordan zur Lösung linearer Glei- nach links oben. In unserem Beispiel ist es das Element a22 :
chungssysteme begegnet. ⎛ ⎞ ⎛ ⎞
1 1 0 0 1 1 0 0
z 2 ↔z 1 ⎜ 0 1 −2 1 ⎟ s 2 ↔s 1 ⎜ 1 0 −2 1 ⎟
1. Die Vertauschung von bi und bj bewirkt in M B (σ ) die A −→ ⎜ ⎟ −→ ⎜ ⎟
⎝ −2 0 −4 4 ⎠ ⎝ 0 −2 −4 4 ⎠
Vertauschung der Elemente σ (bi , bk ) mit σ (bj , bk ) für 1 0 4 −1 0 1 4 −1
jedes k ∈ {1, . . . , n}, also der i-ten Zeile mit der j -ten
Zeile. Es werden aber auch die Elemente an den Stellen Schritt 2: Nun subtrahieren wir geeignete Vielfache der ers-
(k, i) und (k, j ) vertauscht, also die i-Spalte mit der j - ten Zeile von den übrigen Zeilen und wenden die analogen
Spalte. Spaltenumformungen an. Dadurch werden – bis auf das Ele-
2. Die Multiplikation von bi mit dem Faktor λ bewirkt eine ment in der Hauptdiagonale – alle Einträge der ersten Zeile
Multiplikation der i-ten Zeile und der i-ten Spalte von und Spalte zu null. In unserem Beispiel subtrahieren wir z1
M B (σ ) mit dem Faktor λ. Insbesondere kommt das Dia- von der zweiten Zeile und ebenso s 1 von s 2 .
gonalelement an der Stelle (i, i) zweimal dran; es wird ⎛ ⎞ ⎛ ⎞
1 1 0 0 1 0 0 0
daher insgesamt mit λ2 multipliziert. z2 −z1 ⎜ 0 −1 −2 1⎟ s 2 −s 1 ⎜ 0 −1 −2 1 ⎟
−→ ⎜ ⎟ −→ ⎜ ⎟
3. Wird bi ersetzt durch bi + λ bj , so wird zur i-ten Zeile ⎝ 0 −2 −4 4 ⎠ ⎝ 0 −2 −4 4 ⎠
das λ-Fache der j -ten Zeile addiert und zur i-ten Spalte 0 1 4 −1 0 1 4 −1
das λ-Fache der j -ten Spalte. Dadurch kommt das Ele-
ment an der Stelle (i, i) wiederum zweimal dran – ganz Damit sind die erste Zeile und erste Spalte erledigt, und wir
in Übereinstimmung mit verfahren mit der dreireihigen Restmatrix auf dieselbe Weise:
Schritt 1 entfällt, denn es ist a22 = 0. Wir brauchen also nur
σ (bi + λ bj , bi + λ bj ) geeignete Vielfache der zweiten Zeile und Spalte zu subtra-
= σ (bi , bi ) + 2λ σ (bi , bj ) + λ2 σ (bj , bj ) . hieren:
⎛ ⎞ ⎛ ⎞
Die zu diesen Basiswechseln gehörigen Transformations- z3 − 2z2 1 0 0 0 s 3 − 2s 2 1 0 0 0
z4 + z2 ⎜ 0 −1 −2 1 ⎟ s 4 + s 2 ⎜ 0 −1 0⎟
matrizen B T B  , die Elementarmatrizen (siehe Kapitel 13), −→ ⎝ 0 ⎜ ⎟ ⎜
−→ ⎝ 0
0 ⎟
0 0 2⎠ 0 0 2⎠
entstehen aus der Einheitsmatrix durch Ausübung der jewei-
0 0 2 0 0 0 2 0
ligen elementaren Spaltenumformung. So gehört etwa zum
Ersatz von bi durch bi = bi + λ bj die Transformationsma- Nun bleibt nur mehr eine zweireihige Matrix rechts unten
trix ⎛ ⎞ übrig. Allerdings tritt hier ein neues Phänomen auf: Die
1
⎜ .. ⎟
Restmatrix ist noch nicht gleich der Nullmatrix, aber ihre
⎜ . ⎟ Hauptdiagonale enthält nur mehr Nullen. Wir können weder
⎜ ⎟
⎜ 1 ⎟ ←i
⎜ ⎟ Schritt 1, noch Schritt 2 anwenden, jedoch den folgenden
T  = ⎜ .. ⎟
B B ⎜ . ⎟
⎜ ⎟ ←j Schritt 3: Gibt es außerhalb der Hauptdiagonalen noch ein
⎜ λ 1 ⎟
⎜ ⎟
⎝ .. ⎠ Element aij = 0, so addieren wir zur i-ten Zeile die j -te Zeile
.
1 und verfahren ebenso mit den Spalten. Dies ergibt als neues
Diagonalelement aii = 2 aij , und wir können mit Schritt 2
Jeder Umrechnung der Darstellungsmatrix einer symmetri-
fortfahren.
schen Bilinearform auf eine geänderte Basis kommt somit
der wiederholten Anwendung von jeweils gleichartigen ele- In unserem Beispiel ist a34 = 0, daher
mentaren Zeilen- und Spaltenumformungen gleich. ⎛ ⎞ ⎛ ⎞
1 0 0 0 1 0 0 0
z3 +z4 ⎜ 0 −1 0 0 ⎟ s +s ⎜ 0 −1 0 0 ⎟
In dem folgenden Beispiel wird vorgeführt, welcher Algo- −→ ⎜ ⎟ 3 4
⎝ 0 0 2 2 ⎠ −→

⎝0 0 4 2⎠

rithmus angewandt werden kann, um die Darstellungsmatrix 0 0 2 0 0 0 2 0


18.1 Symmetrische Bilinearformen 721

Nun werden die dritte Zeile und Spalte noch gemäß Schritt 2 Will man bei dem oben vorgeführten Algorithmus gleich-
reduziert: zeitig wissen, welche Transformationsmatrix B T B  die Um-
⎛ ⎞ ⎛ ⎞ rechnung von M B (σ ) auf M B  (σ ) bewirkt, so kann man zu
1 0 0 0 1 0 0 0
z4 − 21 z3 ⎜ 0 −1 0 0⎟ s − 1
4 2 3 ⎜ 0 −1 0
s 0⎟ Beginn unter der Darstellungsmatrix M B (σ ) die Einheitsma-
−→ ⎝ 0 ⎜ ⎟ −→ ⎜ ⎟
0 4 2⎠ ⎝0 0 4 0⎠ trix En dazuschreiben und bei den elementaren Spaltenum-
0 0 0 −1 0 0 0 −1 formungen gleichzeitig mit umformen. Dann steht am Ende
Das Resultat ist eine Diagonalmatrix, die wir platzsparend des Algorithmus unter M B  (σ ) genau die Transformations-
als diag (1, −1, 4, −1) schreiben können.  matrix B T B  , welche mittels (18.3) die Umrechnung auf die
Diagonalmatrix ermöglicht.
Das hier in dem Beispiel aus R4 vorgeführte Verfahren funk-
tioniert auch in anderen Körpern K. Allerdings versagt bei Beispiel Welche Transformationsmatrix B T B  bringt ge-
char K = 2 Schritt 3, denn 2 aij = 0. mäß (18.3) in dem Beispiel von Seite 720 die Umrechnung
von A auf die endgültige Diagonalmatrix?
Diagonalisierbarkeit symmetrischer Bilinearformen Wir wenden alle obigen Spaltenoperationen der Reihe nach
V sei ein endlichdimensionaler K-Vektorraum und auf die Einheitsmatrix E4 an:
char K = 2. Dann gibt es zu jeder symmetrischen Bi- ⎛ ⎞ ⎛ ⎞
0 1 0 0 0 1 0 0
linearform σ auf V eine Basis B  , für welche M B  (σ ) s 2 ↔s 1 ⎜ 1 0 0 0⎟ s 2 −s 1 ⎜ 1 −1 0 0 ⎟
eine Diagonalmatrix ist. E4 −→ ⎜ ⎝0 0 1 0⎠
⎟ −→ ⎜
⎝0 0 1 0⎠

0 0 0 1 0 0 0 1

⎛ ⎞ ⎛ ⎞
Beweis: Wir wenden auf die gegebene n-reihige Darstel- s 3 − 2s 2 0 1 −2 1 0 1 −1 1
s 4 + s 2 ⎜ 1 −1 2 −1 ⎟ s +s ⎜ ⎟
lungsmatrix A = M B (σ ) den folgenden Algorithmus an: −→ ⎜ ⎟ 3 4 ⎜ 1 −1 1 −1 ⎟
−→ ⎝ 0 0 1
⎝0 0 1 0⎠ 0⎠
Gibt es in der Hauptdiagonalen von A ein aii  = 0, so wenden 0 0 0 1 0 0 1 1
wir die nachstehend angeführten Schritte 1 und 2 an. Stehen ⎛ ⎞
0 1 −1 3/2
hingegen in der Hauptdiagonale lauter Nullen, und gibt es s 4 − 21 s 3 ⎜ 1 −1 1 −3/2 ⎟
−→ ⎝ 0 ⎜ ⎟ = B TB .
ein aij = 0, so beginnen wir mit Schritt 3. Andernfalls ist A 0 1 −1/2 ⎠
die Nullmatrix, und wir sind bereits fertig. 0 0 1 1/2

1. Schritt: Wir vertauschen die 1. Zeile mit der i-ten Zeile Damit gilt M B  (σ ) = (B T B  )0 M B (σ ) B T B  , denn
und ebenso die 1. Spalte mit der i-ten Spalte. Damit entsteht ⎛ ⎞
die Matrix A = (aj k ), in welcher links oben ein von null 0 1 0 0
⎜ 1 −1 0 0⎟⎟
verschiedenes Element a11  steht. diag (1, −1, 4, −1) = ⎜
⎝ −1 1 1 1⎠
3/2 −3/2 −1/2 1/2
2. Schritt: Wir subtrahieren für j = 2, . . . , n von der j -ten ⎛ ⎞⎛ ⎞
−2 1 0 1 −1 3/2
Zeile das aj 1 /a11
 -Fache der ersten Zeile und ebenso von der 0 1

⎜ 1
⎜ 1 0 0⎟ ⎜
⎟ ⎜ 1 −1 1 −3/2 ⎟
 = a  das a  /a  -Fache der ersten
j -ten Spalte wegen a1j j1 j 1 11 ⎝ −2 0 −4 4 ⎠ ⎝ 0 0 1 −1/2 ⎠
Spalte. Bis auf das Element a11 links oben stehen dann in der 1 0 4 −1 0 0 1 1/2 
ersten Zeile und in der ersten Spalte lauter Nullen.
3. Schritt: Stehen in der Hauptdiagonalen lauter Nullen, und
gibt es ein Element aij = aj i  = 0 bei j  = i, so addieren ?
wir zur i-ten Zeile die j -te Zeile und ebenso zur i-ten Spalte Geben Sie einen Basiswechsel an, welcher die symmetrische
die j -te Spalte. Dann entsteht an der Stelle (i, i) das neue Bilinearform
Element 2 aij , das bei charK  = 0 von null verschieden ist.
Wir können daher mit den Schritten 1 und 2 fortfahren. σ : R2 → R, σ (x, y) = x1 y2 + x2 y1

In der Folge lassen wir die erste Zeile und die ersten Spalte auf Diagonalform bringt.
der Matrix A außer Acht und wenden uns der verbleibenden
Matrix A1 ∈ K(n−1)×(n−1) zu: Ist A1 die Nullmatrix, so sind
Nach der algorithmischen Diagonalisierung folgt noch eine
wir bereits fertig. Andernfalls beginnen wir je nach Situation
Charakterisierung der diagonalisierenden Basen.
mit Schritt 1 oder Schritt 3 und kommen zu einer Matrix, in
welcher die ersten beiden Zeilen und Spalten lauter Nullen
Lemma
außerhalb der Hauptdiagonalen aufweisen. Es verbleibt die
Es sei σ eine symmetrische Bilinearform auf dem n-dimen-
Restmatrix A2 ∈ K(n−2)×(n−2) u.s.w.
sionalen K-Vektorraum V . Dann hat die Darstellungsmatrix
Dieses Vorgehen wird so lange wiederholt, bis die Restmatrix M B (σ ) genau dann die Diagonalform diag (a11 , . . . , arr ,
rechts unten nur mehr ein Element enthält oder die Nullmatrix 0, . . . , 0), wenn die Vektoren der Basis B paarweise
ist.  σ -orthogonal sind, also σ (bi , bj ) = 0 ist für alle i = j , und
722 18 Quadriken – vielseitig nutzbare Punktmengen

wenn die letzten Basisvektoren br+1 , . . . , bn dem Radikal −36


x2
von σ angehören. −25 2
−16
Die zum Vektor u ∈ V σ -orthogonalen Vektoren y gehören −9

9
dem Kern der Linearform 1
−4 b1
b2
−1
ϕu : V → K, y  → σ (u, y) 0 0 b2 x1
−3 −2 −1 1 2

1
an. Liegt u im Radikal von σ , so ist ϕu die Nullform und
b1

4
der zugehörige Kern ganz V . Andernfalls ist der Kern von −1 −9
ϕu ∈ V ∗ ein (n − 1)-dimensionaler Unterraum von V .

9
−16
−2 −25
Kommentar: Bei unserem Diagonalisierungsverfahren −36
mittels gekoppelter Zeilen- und Spaltenumformungen ergibt
sich die zugrunde liegende Basis automatisch (Abb. 18.4): Abbildung 18.4 Die Niveaulinien der quadratischen Form ρ(x) aus Abbil-
dung 18.1 samt den diagonalisierenden Basen B = (b1 , b2 ) und B  = (b1 , b2 ).
Wir können keinesfalls erwarten, dass diese orthogonal oder
gar orthonormiert ist. Es gibt zwar in euklidischen Räumen
eine diagonalisierende und gleichzeitig orthonormierte Ba- Aber auch die Basis
sis, wie wir aus Kapitel 17 wissen, doch erfordert deren Be- ' ( ' (
rechnung die Bestimmung von Eigenwerten und -vektoren 1 1
B  = (b1 , b2 ) mit b1 = , b2 =
einer symmetrischen Matrix. Wir kommen darauf noch bei −1 0
der Hauptachsentransformation auf Seite 727 zurück und
nennen dies das orthogonale Diagonalisieren. (Abb. 18.4) führt auf eine Diagonalmatrix, denn
' (
  −6 0
M B  (σ ) = σ (b1 , b2 ) = = diag (−6, 1).
0 1
Eine symmetrische Bilinearform hat viele
verschiedene Diagonaldarstellungen
Es sind sowohl b1 und b2 σ -orthogonal, als auch b1 und b2 .
Das ist auch anhand der Niveaulinien der zu σ gehörigen
Obwohl der obige Algorithmus zum Diagonalisieren der
quadratischen Form ρ erkennbar. Man kann nämlich zeigen,
Darstellungsmatrix eine gewisse Abfolge von Zeilen- und
dass zwei σ -orthogonale und von 0 verschiedene Vektoren
Spaltenumformungen vorschreibt, so bestehen doch Wahl-
ein Paar konjugierter Durchmesser der Niveaulinien aufspan-
möglichkeiten in den Schritten 1 und 3. Deshalb sind die dia-
nen; es haben nämlich die Niveaulinien in den Schnittpunk-
gonalisierten Darstellungsmatrizen der symmetrischen Bi-
ten mit einem der Durchmesser stets Tangenten, die zu dem
linearform σ keinesfalls eindeutig. Das geht auch aus dem
anderen Durchmesser parallel sind. 
obigen Lemma hervor.
So können wir in der Basis B mit M B (σ ) =
Was haben die verschiedenen diagonalisierten Darstellungs-
diag (a11 , . . . , ann ) den Vektor bi durch bi = λ bi ersetzen.
matrizen von σ gemein? Im Fall K = R gibt es darauf eine
Die Darstellungsmatrix behält Diagonalform, aber das Dia-
Antwort, wie der folgende Abschnitt zeigt.
gonalelement σ (bi , bi ) = aii aus M B (σ ) wird ersetzt durch
σ (bi , bi ) = λ2 aii in M B  (σ ).
Aber auch Basiswechsel mit bi  ∈ K bi können erneut zu
Diagonalmatrizen führen, wie das folgende Beispiel zeigt. Reelle symmetrische Bilinearformen haben
eine eindeutige Signatur
Beispiel Die symmetrische Bilinearform auf V = R2 von
Seite 714 mit der kanonischen Darstellungsmatrix
' ( Angenommen, die Darstellungsmatrix M B (σ ) ∈ Rn×n der
1 1 symmetrischen Bilinearform σ hat Diagonalform. Dann kann
M E (σ ) =
1 −5 jedes positive Diagonalelement aii durch den Ersatz von bi

'' ( ' (( durch bi = λ bi mit λ = 1/ aii auf 1 normiert werden.
hat bezüglich der Basis B =
1
,
2
(siehe Seite 717 √
1 1 Bei einem negativen aii ergibt die Wahl λ = 1/ −aii das
und Abbildung 18.4) die Darstellungsmatrix Diagonalelement −1. Damit kommen in der Hauptdiagonale
' ( von M B  (σ ) nur mehr Werte aus {1, −1, 0} vor. Nach einer
−2 0 eventuellen Umreihung der Basisvektoren erreichen wir die
M B (σ ) = = diag (−2, 3).
0 3 folgende Normalform.
18.1 Symmetrische Bilinearformen 723

Normalform reeller symmetrischer Bilinearformen negativen Einträgen, also mit


Zu jeder symmetrischen Bilinearform σ vom Rang r auf ⎧ 
dem n-dimensionalen reellen Vektorraum V gibt es eine ⎨ aii > 0 für i = 1, . . . , p ,

Basis B  mit ρ(bi ) = aii < 0 für i = p + 1, . . . , r ,
⎩ 
aii = 0 für i = r + 1, . . . , n .
M B  (σ ) = diag (a11 , . . . , ann ) bei
a11 = · · · = app = 1 , ap+1 p+1 = · · · = arr = −1 , Wir zeigen, dass die Annahme p = p, also z. B. p > p  ,
ar+1 r+1 = · · · = ann = 0 und 0 ≤ p ≤ r ≤ n . auf einen Widerspruch führt. Dazu konzentrieren wir uns auf
die beiden Unterräume
In den zugehörigen Koordinaten gilt:
U>0 = - b1 , . . . , bp . mit dim U>0 = p
σ (x, y) = x1 y1 + · · · + xp yp − xp+1 yp+1 − · · · − xr yr .
und
Wir werden sehen, dass diese spezielle Darstellungsmatrix
von σ sogar eindeutig ist, und wir nennen sie die Normal- 
U≤0 = - bp +1 , . . . , bn . mit dim U≤0

= n − p .
form der reellen Bilinearform σ . Zu ihrer Festlegung sind
drei Zahlen erforderlich, die Anzahlen p der Einsen, (r − p)  beträgt
Die Summe der Dimensionen von U>0 und U≤0
der Minus-Einsen und (n − r) der Nullen in der Hauptdiago- 
p + n − p > n. Daher ist nach der Dimensionsformel (siehe
nale von M B  (σ ). Dieses Zahlentripel
Seite 217)
  
(p, r − p, n − r) dim U>0 ∩ U≤0 ≥ 1.

heißt Signatur von σ . Dabei sind diese drei Zahlen bereits Es gibt also einen Vektor x = 0 aus dem Durchschnitt die-
vor der obigen Normierung als Anzahlen der positiven und ser Unterräume, und dies führt zum offensichtlichen Wider-
negativen Einträge sowie der Nullen in der Hauptdiagonale spruch
von M B (σ ) = diag (a11 , . . . , ann ) feststellbar.
Dass kongruente Matrizen denselben Rang r haben, wissen x ∈ U>0 \ {0} $⇒ ρ(x) > 0 und

x ∈ U≤0 $⇒ ρ(x) ≤ 0 .
wir schon. Dass sie aber auch dasselbe p und damit dieselbe
Signatur haben, ist Gegenstand des folgenden Satzes.
Somit bleibt p = p. 

Trägheitssatz von Sylvester


Alle diagonalisierten Darstellungsmatrizen der reellen Kommentar:
symmetrischen Bilinearform σ weisen dieselbe Anzahl 1. Das etwas ungewohnte Wort „Trägheit“ in diesem auf Ja-
p von positiven Einträgen auf. Ebenso haben alle die- mes J. Sylvester (1814–1897) zurückgehenden Ergebnis
selbe Anzahl r − p von negativen Einträgen. Also ist die bezieht sich auf die Tatsache, dass sich die Signatur bei
Signatur (p, r − p, n − r) von σ eindeutig. Basiswechseln, also beim Übergang zwischen kongruen-
ten Darstellungsmatrizen, nicht ändert.

Beweis: Mit jeder σ diagonalisierenden Basis 2. Der Begriff Signatur wird in der Literatur nicht immer
(b1 , . . . , bn ) sind gewisse Unterräume verknüpft: einheitlich verwendet: Manchmal bezeichnet man damit
nur das Zahlenpaar (p, r − p), vor allem dann, wenn
Für Vektoren x aus der Hülle der ersten p Basisvektoren, also die Dimension n von V von vornherein feststeht. Manch-
p
x = i=1 xi bi ∈ - b1 , . . . , bp ., ist bei x  = 0 mal meint man damit die Folge der Vorzeichen, also etwa
(+ + + − − 0) anstelle des Tripels (3, 2, 1).
ρ(x) = σ (x, x) = a11 x12 + · · · + app xp2 > 0 ,

nachdem alle hier auftretenden Koeffizienten positiv sind. Natürlich lässt sich anhand der Signatur (p, r −p, n−r) so-
fort beantworten, ob eine reelle symmetrische Bilinearform
Analog ist für alle x ∈ - bp+1 , . . . , bn .
σ oder ihre Darstellungsmatrizen positiv oder negativ definit
2 oder semidefinit sind oder indefinit (siehe Seite 659). Negativ
ρ(x) = ap+1 p+1 xp+1 + · · · + arr xr2 ≤ 0 ,
semidefinit etwa ist äquivalent zu p = 0.
denn hier sind die Koeffizienten durchwegs negativ, und die
restlichen Koordinaten xr+1 , . . . , xn kommen gar nicht vor. ?
Bestimmen Sie die Signatur der auf den Seiten 714, 717, 719
Wir vergleichen dies mit einer zweiten Diagonaldarstellung und 722 behandelten symmetrischen Bilinearform σ . Welche
von σ : Die Basis B  = (b1 , . . . , bn ) bringe σ auf eine Dia- Basen B  bringen σ auf die Normalform?
 , . . . , a  ) mit p  positiven und r − p 
gonalform diag (a11 nn
724 18 Quadriken – vielseitig nutzbare Punktmengen

18.2 Hermitesche ?
Beweisen Sie für hermitesche Formen die beiden Rechenre-
Sesquilinearformen geln:

Die Aussage, dass die Darstellungsmatrix einer symmetri- ρ(λx) = |λ|2 ρ(x) und
schen Bilinearform σ diagonalisierbar ist, gilt für alle Kör- ρ(x + y) + ρ(x − y) = 2 (ρ(x) + ρ(y)) .
per K mit char K = 2 . Von einer Signatur kann man nur
sprechen, wenn in K zwischen positiven und negativen Ele-
Ähnlich wie bei den quadratischen Formen (Seite 716)
menten sinnvoll unterschieden werden kann. Dies trifft auf
kann man auch die hermiteschen Formen direkt definieren,
angeordnete Körper zu (siehe Seite 84), wie z. B. R, aber
ohne von einer hermiteschen Sesquilinearform auf dem C-
nicht auf C.
Vektorraum V auszugehen: Dazu fordert man von einer Ab-
Und doch gilt ein Resultat ähnlichen Inhalts auch noch für C, bildung ρ : V → R für alle x, y ∈ V und λ ∈ C:
allerdings nicht für die symmetrischen Bilinearformen, son-
1. ρ(λx) = λ λ ρ(x).
dern für die im Kapitel 17 bereits vorgestellten hermiteschen
2. ρ(x + y) + ρ(x − y) = 2 (ρ(x) + ρ(y)).
Sesquilinearformen. Wir wiederholen nochmals kurz deren
3. Die induzierte Abbildung &
σ : V × V → C mit
Definition.
&
σ (x, y) = ρ(x +y)+iρ(x +iy)− (1+i) (ρ(x) + ρ(y))
Wir setzen V als Vektorraum über C voraus. Eine Abbildung
 ist eine Sesquilinearform.
V × V → C,
σ: Es stellt sich dann ρ als Einschränkung der Sesquilinearform
(x, y)  → σ (x, y)
σ = 21 &σ auf die Diagonale von V heraus, denn
heißt Sesquilinearform, wenn für alle x, x  , y, y  ∈ V und
λ ∈ K gilt: &
σ (x, x) = 4 ρ(x) + i(1 + i)(1 − i)ρ(x) − 2(1 + i)ρ(x)
= 4 ρ(x) + 2i ρ(x) − 2ρ(x) − 2i ρ(x) = 2 ρ(x) .
σ (x + x  , y) = σ (x, y) + σ (x  , y) , Man nennt dann so wie im Reellen &
σ die zu ρ gehörige Po-
σ (λx, y) = λ σ (x, y) , larform.
σ (x, y + y  ) = σ (x, y) + σ (x, y  ) ,
σ (x, λy) = λ σ (x, y) ,
Alle Darstellungsmatrizen einer hermiteschen
wobei λ die zu λ konjugiert komplexe Zahl bezeichnet. σ ist Sesquilinearform sind untereinander
somit linear im ersten und halblinear im zweiten Argument,
kongruent
also insgesamt anderthalbfach (lateinisch: sesqui) linear.
Nach Charles Hermite (1822–1901) heißt eine Sesquilinear- Bei der Definition der Darstellungsmatrix einer Sesquili-
form hermitesch, wenn stets gilt: nearform können wir wie im Reellen vorgehen: Sind B =
(b1 , . . . , bn ) eine geordnete Basis des endlichdimensionalen
σ (y, x) = σ (x, y). (18.4) C -Vektorraums V und
!
n !
n
x= xi bi sowie y = yj bj ,
? i=1 j =1
Warum kann eine Sesquilinearform nicht symmetrisch sein,
d. h., warum führt eine generelle Forderung σ (y, x) = so folgt aus unseren Regeln für Sesquilinearformen:
σ (x, y) zu Widersprüchen? ⎛ ⎞
!n !
n !n
σ (x, y) = σ ⎝ xi bi , yj bj ⎠ = xi yj σ (bi , bj ) .
i=1 j =1 i,j =1
Die Einschränkung der hermiteschen Sesquilinearform σ auf
die Diagonale von V ist eine Abbildung Die n2 Koeffizienten σ (bi , bj ) legen σ eindeutig fest und
 können in Form der Darstellungsmatrix
V → R,  
ρ: M B (σ ) = σ (bi , bj )
x  → ρ(x) = σ (x, x) .
angeordnet werden.
Sie heißt hermitesche Form auf dem C -Vektorraum V . Dass
hier als Zielmenge R angegeben ist, ist kein Tippfehler, son- Schreiben wir die Koordinaten aus, so bedeutet dies:
dern wegen (18.4) σ (y, x) = σ (x, y) muss ρ(x) = ρ(x) ⎛ ⎞
y1
und damit reell sein. Es macht also durchaus Sinn, von po- ⎜ ⎟
sitiv definiten hermiteschen Formen zu sprechen, wenn für σ (x, y) = (x1 . . . xn ) M B (σ ) ⎝ ... ⎠
(18.5)
alle x ∈ V \ {0} das ρ(x) > 0 ist. Und dieser Begriff wurde yn
in Abschnitt 17.4 auch schon verwendet. = B x 0 M B (σ ) B y.
18.2 Hermitesche Sesquilinearformen 725

Ist die Sesquilinearform überdies hermitesch, so hat deren Darstellungsmatrizen von Sesquilinearformen
Darstellungsmatrix die kennzeichnende Eigenschaft
Für die Darstellungsmatrizen der Sesquilinearform σ be-
M B (σ )0 = M B (σ ) , (18.6) züglich der Basen B und B  gilt
denn aj i = σ (bj , bi ) = σ (bi , bj ) = aij . Derartige Matri-
M B  (σ ) = (B T B  )0 M B (σ ) B T B  (18.7)
zen aus Cn×n heißen hermitesch (siehe Seite 680).
  
Man beachte: Die Theorie der hermiteschen Sesquilinearfor- mit B T B  = B b1 · · · B bn als invertierbarer Matrix. Je
men umfasst jene der reellen symmetrischen Bilinearformen zwei derartige Darstellungsmatrizen von σ heißen zuein-
als Sonderfall. Wenn wir nämlich in der Darstellungsmatrix ander hermitesch kongruent.
nur Einträge aij ∈ R zulassen, so handelt es sich um die Dar-
stellungsmatrix einer reellen symmetrischen Bilinearform,
nachdem die im hermiteschen Fall geforderte Bedingung
?
Warum sind die zu einer hermiteschen Matrix kongruenten
(18.6) dann wegen aj i = aij = aij eben nur die gewöhnliche Matrizen wieder hermitesch?
Symmetrie bedeutet.

Wie lautet eine hermitesche Form ρ(x), wenn sie in Koordi- Will man eine hermitesche Darstellungsmatrix diagonali-
naten dargestellt wird? Wie kann man aus dieser Darstellung sieren, so kann man mithilfe dieser neuartig gekoppelten
ersehen, dass ρ(x) stets reell ist? elementaren Zeilen- und Spaltenumformungen ganz ähnlich
Wir spalten die Summe vorgehen wie in dem auf Seite 721 vorstellten Algorithmus
für symmetrische Bilinearformen. Wir verzichten auf die ge-
!
n
ρ(x) = σ (x, x) = aij xi xj naue Formulierung der notwendigen Schritte 1 bis 3 und zei-
i,j =1 gen dafür ein Zahlenbeispiel.
auf in Beispiel Gesucht ist eine zu
!
n ! ! ⎛ ⎞
aii xi xi + aij xi xj + aj i xj xi . 1 i −i
  
i=1 i<j
=z
i<j A = ⎝ −i 0 2 − i ⎠
|xi |2 = aij
i 2+i 1
Somit bleibt
! ! hermitesch kongruente Diagonalmatrix.
ρ(x) = aii |xi |2 + (aij xi xj + aij xi xj ) ∈ R .
 Wir subtrahieren geeignete Vielfache der ersten Zeile und
i i<j
z+z
Spalte von den zweiten und dritten, um in der ersten Zeile
Hinsichtlich der Auswirkung elementarer Basiswechsel auf und Spalte neben a11 = 1 nur mehr Nullen zu bekommen:
diese Darstellungsmatrix zeigt sich ein Unterschied zu den
⎛ ⎞ z2 + i z1 ⎛ ⎞
symmetrischen Bilinearformen: 1 i −i z3 − i z1 1 i −i
⎝ −i 0 2 − i ⎠ −→ ⎝ 0 −1 3 − i ⎠
Setzen wir bi = bi + λ bj , während alle anderen Basisvekto- i 2+i 1 0 3+i 0
ren unverändert bleiben, so wird das Element aik = σ (bi , bk ) s2 − i s1 ⎛ ⎞
s3 + i s1 1 0 0
aus M B (σ ) zum Element
−→ ⎝ 0 −1 3 − i ⎠
σ (bi + λ bj , bk ) = σ (bi , bk ) + λ σ (bj , bk ) = aik + λ aj k 0 3+i 0

in der neuen Darstellungsmatrix M B  (σ ). Dagegen wird Hierauf verfahren wir mit der Restmatrix ähnlich:
aki = σ (bk , bi ) zu ⎛ ⎞ ⎛ ⎞
1 0 0 z3 +(3+i)z2 1 0 0
⎝0 −1 3 − i ⎠ −→ ⎝ 0 −1 3 − i ⎠
σ (bk , bi + λ bj ) = σ (bk , bi ) + λ σ (bk , bj ) = aki + λ akj .
0 3+i⎛ 0 ⎞ 0 0 10
Es wird also beim Übergang von M B (σ ) zu M B  (σ ) zur i- s 3 +(3−i)s 2 1 0 0
ten Zeile die λ-fache j -te Zeile addiert und zur i-ten Spalte −→ ⎝ 0 −1 0 ⎠ = diag (1, −1, 10) .
0 0 10
die λ-fache j -Spalte. Jede elementare Zeilenumformung ist
also hier mit der gleichartigen, jedoch konjugiert komplexen Soll auch hier so wie auf Seite 721 die Transformationsmatrix
Spaltenumformung zu koppeln. B TB mitberechnet werden, so wenden wir auf die Einheits-
Dies folgt auch aus der Matrizendarstellung (18.5): Für alle matrix E3 der Reihe nach die obigen Spaltenoperationen an.
x, y ∈ V muss gelten: Dies führt zu B T B  :

σ (x, y) = B  x 0 M B  (σ ) B  y = B 0
 x M B (σ) B y

1 0 0
⎞ s2 − i s1 ⎛
1 −i i

0 s3 + i s1
= (B T B B  x) M B (σ ) B T B  B y E3 = ⎝ 0 1 0⎠ −→ ⎝0 1 0⎠
= B  x 0 (B T B  )0 M B (σ ) B T B  B  y . 0 0 1
⎛ ⎞0 0 1
s 3 +(3−i)s 2 1 −i −1 − 2i
Das führt auf die folgende Gleichung zwischen den Darstel- −→ ⎝ 0 1 3 − i ⎠ = B TB .
lungsmatrizen. 0 0 1
726 18 Quadriken – vielseitig nutzbare Punktmengen

Zur Probe können wir für M B (σ ) = A bestätigen: In unitären Räumen haben hermitesche
⎛ ⎞ Sesquilinearformen diagonalisierende
1 0 0
(B T B  )0 M B (σ ) B T B  = ⎝i 1 0⎠ Orthonormalbasen
⎛ ⎞⎛ −1 + 2i 3 +⎞i 1
1 i −i 1 −i −1 − 2i
⎝ −i 0 2 − i ⎠⎝ 0 1 3−i ⎠
Die bisher behandelten Basen, für welche die Darstellungs-
i 2⎛+ i 1 matrix einer gegebenen hermiteschen Sesquilinearform σ
⎞0 0 1
1 0 0 Diagonalform hatte, wurden allein durch Zeilen- und Spal-
=⎝0 −1 0 ⎠ = M B  (σ ) . tenumformungen bestimmt. Sie unterlagen keinerlei weite-
0 0 10  ren Einschränkungen. Jetzt möchten wir uns aber aus all
Die Elemente in der Hauptdiagonalen einer hermiteschen diesen Basen die orthonormierten heraussuchen. Dazu sind
Matrix sind wegen ajj = ajj stets reell. Man kann daher tiefer liegende Methoden erforderlich, die jedoch bereits im
die positiven Diagonaleinträge wieder mittels bj = λ bj Kapitel 17 entwickelt worden sind.

und λ = 1/ ajj auf +1 normieren und die negativen mit In der Folge verwenden wir neben der Sesquilinearform σ
%
λ = 1/ −ajj auf −1. noch das durch einen Punkt gekennzeichnete Skalarprodukt
Nun ist eine Bemerkung notwendig: Da wir mit komplexen sowie dessen Koordinatendarstellung als Matrizenprodukt,
Zahlen rechnen, könnte man z. B. bei ajj = −4 auch den sofern den Koordinaten eine orthonormierte Basis B zu-
grunde liegt. Das folgenden Lemma zeigt, dass sich σ direkt
Basiswechsel bj = 21i bj vornehmen. Wird die j -te Zeile
mit einem Skalarprodukt in Beziehung bringen lässt.
mit 21i = − 2i multipliziert, so muss die j -te Spalte mit dem
konjugiert komplexen Wert 2i multipliziert werden. Beides Lemma
zusammen ergibt als neues Diagonalelement aber erst wieder Zu jeder auf einem unitären Raum definierten Sesqui-
1
4 (−4) = −1. Beide Möglichkeiten führen zu demselben linearform σ gibt es einen Endomorphismus ϕ mit
Ergebnis.
σ (x, y) = ϕ(x) · y, wobei B M(ϕ)B = M B (σ )0 .
Somit gilt die Normalform von Seite 723 auch für die hermi-
teschen Sesquilinearformen. Und auch der Trägheitssatz von σ ist genau dann hermitesch, wenn ϕ selbstadjungiert ist.
Sylvester von Seite 723 bleibt weiterhin gültig, denn wegen
ρ(x) ∈ R kann der obige Beweis wortwörtlich übernommen
werden. Beweis: Nach (18.5) ist
σ (x, y) = B x 0 M B (σ ) B y
Trägheitssatz für Sesquilinearformen  0
= M B (σ )0 B x By = ϕ(x) · y .
Für hermitesche Sesquilinearformen σ gilt ebenfalls der
Trägheitssatz von Silvester: σ hat eine eindeutige Si- Nach den Ergebnissen aus dem Abschnitt 17.6, Seite 692,
gnatur (p, r − p, n − r), und es gibt stets Basen B, sind selbstadjungierte Endomorphismen durch hermitesche
deren Darstellungsmatrix M B (σ ) die Normalform von Darstellungmatrizen gekennzeichnet. Und dies ist in unserem
Seite 723 aufweist. Fall gegeben, denn
0
Liegt eine positiv definite hermitesche Sesquilinearform vor B M(ϕ)B = M B (σ ) = M B (σ )0 = B M(ϕ)B . 

wie beim Skalarprodukt in unitären Räumen, also mit der


Signatur (n, 0, 0), so gibt es Basen B mit der Einheitsmatrix
als Darstellungsmatrix. In Koordinaten ausgedrückt nimmt Mit diesem Lemma ist klar, dass eine orthonormierte Basis,
dann die Sesquilinearform die kanonische Form welche σ diagonalisiert, zugleich ϕ diagonalisieren muss.
Nach Kapitel 14, Seite 502, führt der Weg dazu über die
0
σ (x, y) = x1 y1 + · · · + xn yn = Bx By Eigenwerte und -vektoren der Darstellungsmatrix.

an. Es ist also tatsächlich jede positiv definite hermitesche Wir gehen somit von einer beliebigen orthonormierten Basis
Sesquilinearform als ein Skalarprodukt mit den üblichen Ei- B eines n-dimensionalen unitären Vektorraums aus und be-
genschaften aufzufassen. In diesem Sinn ist dann jede Basis stimmen die Eigenvektoren der hermiteschen Darstellungs-
B mit M B (σ ) = En orthonormiert. matrix M B (σ )0 . Zwar wissen wir bereits aus Kapitel 17
(siehe Seite 694), dass es eine Basis aus Eigenvektoren gibt,
Im Folgenden verwenden wir in dem C -Vektorraum V zwei die sogar orthonormiert ist, doch zum besseren Verständnis
hermitesche Sesquilinearformen σ und σ1 gleichzeitig: Da- fügen wir noch die folgende Rechnung an. Dabei bezeich-
bei soll σ1 positiv definit sein. Damit können wir σ1 als Ska- nen wir die orthonormierte Basis aus Eigenvektoren mit H ,
larprodukt interpretieren. Wir verwenden einfachheitshalber nachdem deren Vektoren h1 , . . . , hn die Hauptachsen von
den Punkt als Verknüpfungssymbol, setzen also x · y = σ aufspannen. Für die zugehörigen Eigenwerte λ1 , . . . , λn
σ1 (x, y). Der Vektorraum V wird dadurch zu einem unitären gilt:
Raum (Seite 678) mit einer weiteren hermiteschen Sesquili-
nearform σ . M B (σ )0 B hi = λi B hi für i = 1, . . . , n.
18.2 Hermitesche Sesquilinearformen 727

Nun folgt für das Skalarprodukt zweier Eigenvektoren die


Bei M H (σ ) = diag (λ1 , . . . , λn ) sind die λi die stets
Gleichung:
reellen Eigenwerte der Darstellungsmatrix M B (σ ) be-
λi (hi · hj ) = (λi hi ) · hj = (λi B hi )0 B hj züglich einer beliebigen orthonormierten Basis B. Die
 0
= M B (σ )0 B hi B hj
B-Koordinaten B hi der orthonormierten Vektoren aus
= B h0 M (σ ) h H sind Eigenvektoren von M B (σ )0 .
i B B j
0 0
= B hi M B (σ ) B hj
0
  Nachdem die Transformationsmatrix
= 0
B hi M B (σ ) B hj
0
 
= B hi λj B hj B TH = (B h1 , . . . , B hn )
= hi · (λj hj ) = λj (hi · hj ) .
orthogonal bzw. unitär ist, können wir auch sagen: Zu jeder
Folgerung reellen symmetrischen bzw. hermiteschen Matrix M gibt es
Ist σ eine hermitesche Sesquilinearform auf einem uni- eine orthogonale bzw. unitäre Matrix T derart, dass
tären Raum, so gilt für je zwei Eigenvektoren hi , hj der
M  = T 0 M T = diag (λ1 , . . . , λn )
Matrix M B (σ )0 und deren Eigenwerte λi bzw. λj :
λi (hi · hj ) = λj (hi · hj ) . ist mit λ1 , . . . , λn ∈ R.
Die Vektoren unserer orthonormierten Basis H sind nicht ein-
Zwei unmittelbare Konsequenzen daraus lauten: deutig. Es kann z. B. hi durch −hi ersetzt werden. Treten zu-
1. Für i = j folgt λi (hi · hi ) = λi (hi · hi ) bei hi  = 0. Die dem mehrfache Eigenwerte der Darstellungsmatrix M B (σ )
Eigenwerte der hermiteschen Matrix M B (σ ) sind also auf, ist also etwa λi ein k-facher Eigenwert, so ist der zu-
wegen λi = λi alle reell, das charakteristische Polynom gehörige Eigenraum EigM λi k-dimensional, und in diesem
zerfällt bereits über R in lauter Linearfaktoren. Eigenraum sind dann k orthonormierte Eigenvektoren belie-
2. Sind λi und λj zwei verschiedene Eigenwerte, so folgt big festsetzbar.
wegen λi (hi · hj ) = λj (hi · hj ) für das Skalarprodukt
hi ·hj = 0. Zwei zu verschiedenen Eigenwerten gehörige Beispiel Wir bestimmen die Hauptachsen der auf Seite 714
Eigenvektoren sind also zueinander orthogonal. und noch später mehrfach verwendeten reellen symmetri-
schen Bilinearform
Schließlich kann durch Induktion gezeigt werden, dass zu
einem k-fachen Eigenwert λ einer hermiteschen Matrix M σ (x, y) = x1 y1 + '
x1 y2 + x(2'
y1 − (
5 x2 y2
stets ein k-dimensionaler Eigenraum EigM λ gehört. Aus die- 1 1 y1
= (x1 x2 ) .
sem lassen sich somit k orthonormierte Eigenvektoren aus- 1 −5 y2
wählen. Dies ermöglicht insgesamt die genannte orthonor-
Zunächst berechnen wir die Eigenwerte der kanonischen
mierte Basis aus Eigenvektoren h1 , . . . , hn . Aber dies alles
Darstellungsmatrix M E (σ ) als Nullstellen des charakteris-
ist lediglich eine Folge des Spektralsatzes für hermitesche
tischen Polynoms
Matrizen von Seite 702.
' (
Nun können wir verifizieren, dass die zur orthonormier- 1−λ 1
det = (λ − 1)(5 + λ) − 1 ,
ten Basis H aus Eigenvektoren gehörige Darstellungsmatrix 1 −5 − λ
M H (σ ) Diagonalform aufweist: Nach (18.5) ist nämlich
also die Wurzeln von
σ (hi , hj ) = B h0 M B (σ ) B hj
 i 0
= M B (σ )0 B hi B hj
λ2 + 4λ − 6 = 0 .
= (λi B hi )0 B hj
Wir erhalten:
= (λi hi ) · hj = λi (hi · hj ) = λi δij
√ √
unter Verwendung des Kroneckersymbols δij . Also ist λ1 = −2 + 10, λ2 = −2 − 10
M H (σ ) = diag (λ1 , . . . , λn ), was aber auch direkt aus dem
obigen Lemma folgt, denn σ (hi , hj ) = ϕ(hi ) · hj . und als Lösungen der homogenen linearen Gleichungssyste-
me (M E (σ ) − λi E2 ) x = 0 die orthonormierte Basis H =
Bei all diesen Rechnungen sind natürlich die reellen symme- (h1 , h2 ) mit
trischen Bilinearformen als Sonderfall enthalten.
' √ (
1 3± 10
Transformation auf Hauptachsen h1,2 = % √ .
20 ± 6 10 1
Zu jeder reellen symmetrischen Bilinearform bzw. her-
miteschen Sesquilinearform σ auf einem n-dimensio- Die neue Darstellungsmatrix von σ lautet:
nalen euklidischen bzw. unitären Vektorraum gibt es eine ' ( ' √ (
λ1 0 −2 + 10 0√
orthonormierte Basis H , welche σ diagonalisiert. M H (σ ) = = .
0 λ2 0 −2 − 10
728 18 Quadriken – vielseitig nutzbare Punktmengen

−36
x2 Seite 229, die Komponenten des Ortsvektors p −o bezüglich
−25 2 der Basis B.
−16 Übrigens wird in der Literatur oft gar kein eigenes Symbol für
−9 1 den affinen Raum verwendet wird; so bezeichnet Rn häufig

9
sowohl den reellen Vektorraum, als auch den reellen affinen

4
h2
h1 x1 Raum. In diesem Sinn wurde im Kapitel 7 vom Anschauungs-
−1 0
−3 −2 0 1 2 raum R3 gesprochen; eigentlich war dabei der affine Raum
−1 A (R3 ) gemeint. Wir wollen in diesem Kapitel nun doch kon-
1

−4 sequent das Symbol A (V ) für den affinen Raum über dem


4

−1 −9 Vektorraum V verwenden.
9

−16
−2 −25
−36 Von den quadratischen Formen zu
quadratischen Funktionen
Abbildung 18.5 Niveaulinien der quadratischen Form ρ(x) = x12 +
2x1 x2 − 5x22 mit der orthonormierten und gleichzeitig diagonalisierenden Basis
H = (h1 , h2 ). Um quadratische Formen bildlich darstellen zu können, ha-
ben wir in den Abbildungen 18.1, 18.2 und 18.3 die Niveau-
Die Abbildung 18.5 mit den Niveaulinien von ρ(x) verdeut- linien von quadratischen Formen ρ : R2 → R dargestellt.
licht den Unterschied zwischen der nunmehr orthonormierten Das waren die von den Punkten x mit
Basis und den früher verwendeten diagonalisierenden Basen
in der Abbildung 18.4.  ρ(x) = c = konst.

Ein weiteres Zahlenbeispiel zur Hauptachsentransformation gebildeten Kurven, die Fasern der Abbildung ρ . In den
einer quadratischen und einer hermiteschen Form findet sich genannten Abbildungen traten als Niveaulinien Hyperbeln,
im Kapitel 17 auf Seite 695. Ellipsen und Geradenpaare auf. Wir hatten dort übrigens be-
reits von Punkten x gesprochen, also stillschweigend bereits
Wie auf Seite 722 erwähnt, erfordert die Bestimmung diago-
die affine Ebene A (R2 ) verwendet.
nalisierender Basen deutlich weniger Aufwand als jene der
Hauptachsen. Für einige Fragen müssen die Hauptachsen gar Wir verallgemeinern diese Punktmengen, indem wir neben
nicht bestimmt werden, so z. B. bei jener nach dem Typ einer der quadratischen Form ρ und der Konstanten c auch noch
Quadrik (siehe Seite 733). eine Linearform ϕ einfügen.

Definition einer quadratischen Funktion


18.3 Quadriken und ihre V sei ein endlichdimensionaler Vektorraum über dem
Körper K mit char K = 2 und A (V ) der zugehörige
Hauptachsentransformation affine Raum. Eine Abbildung

Schauplatz der vorhin behandelten Bilinear- und Sesquiline- A (V ) → K
ψ:
arformen war ein Vektorraum V . Die nun folgenden Begriffe x → ψ(x) = ρ(x) + 2 ϕ(x) + a
quadratische Funktion und Quadrik gehören zum zugehö-
mit einer quadratischen Form ρ : V → K (Seite 716),
rigen affinen Raum A (V ). Darunter versteht man die Ge-
einer Linearform ϕ : V → K (Seite 458) und einer Kon-
samtheit der affinen Teilräume von V , also der Nebenklassen
stanten a ∈ K heißt quadratische Funktion.
a + U mit a ∈ V und mit U als Untervektorraum von V
(siehe Seite 229). Die nulldimensionalen affinen Teilräume
{a} = a + {0} sind die Punkte. Statt {a} schreiben wir ein- Auch wenn viele Eigenschaften quadratischer Funktionen
fachheitshalber nur a und sprechen vom „Punkt a“, so wie über beliebigen Körpern K nachgewiesen werden können,
bereits im Anschauungsraum (Abschnitt 7.1, Seite 228). Es beschränken wir uns von nun an auf den Fall eines n-dimen-
mag anfangs etwas verwirren, dass Vektoren V und Punkte sionalen euklidischen Vektorraums V und damit auf K = R.
aus A (V ) mit demselben Symbol bezeichnet werden. Aus
In V sei B = (b1 , . . . , bn ) eine orthonormierte Basis. Nach
dem Zusammenhang wird aber meist klar, was gemeint ist.
Wahl eines Koordinatenursprungs o sprechen wir so wie im
Der Hauptgrund, weshalb Quadriken als Punktmengen im Kapitel 7 von einem kartesischen Koordinatensystem (o; B)
affinen Raum A (V ) interpretiert werden, liegt in der größe- in A (V ). In diesem steht uns die symmetrische Darstellungs-
ren Freiheit bei der Festlegung von Koordinaten. Neben einer matrix A = M B (σ ) ∈ Rn×n der zu ρ gehörigen Polarform
Basis B des zugrunde liegenden Vektorraums V benötigen σ zur Verfügung (siehe Folgerung auf Seite 716) und ebenso
wir noch einen Punkt o als Koordinatenursprung. Die (o; B)- der Vektor a 0 als einzeilige Darstellungsmatrix der Linear-
Koordinaten des Punkts p sind dann im Sinne von Kapitel 7, form ϕ : V → K und zugleich als Vektor des Dualraums zu
18.3 Quadriken und ihre Hauptachsentransformation 729

V (siehe Abschnitt 12.9). Die quadratische Funktion hat also In Verallgemeinerung der eingangs genannten Niveaulinien
die Koordinatendarstellung einer quadratischen Form interessieren wir uns nun für die-
    jenigen Punkte x des affinen Raums A (V ), welche die Glei-
ψ(x) = (o;B) x 0 A (o;B) x + 2 a 0 (o;B) x + a (18.8) chung ψ(x) = 0 erfüllen, also für die Nullstellenmenge
ψ −1 (0) der quadratischen Funktion.
mit A0 = A. Dies bedeutet ausführlich:
!n !
n
ψ(x) = aij xi xj + 2 ak xk + a bei aj i = aij . Definition einer Quadrik
i,j k=1
Ist ψ : A (V ) → K eine von der Nullfunktion verschie-
Die xi sind dabei die (o; B)-Koordinaten des Punktes x. Die dene quadratische Funktion, wobei V ein K-Vektorraum
Konstante a ist das Bild ψ(o) des Koordinatenursprungs, ist mit charK = 2, so heißt deren Nullstellenmenge
denn (o;B) o = 0.
Nach der obigen Definition zählt auch die Nullfunktion mit Q(ψ) = ψ −1 (0) = { x | ψ(x) = 0 } ⊂ A (V )
ψ(x) = 0 für alle x ∈ Rn , also mit A als Nullmatrix, a = 0
Quadrik des A (V ).
und a = 0 zu den quadratischen Funktionen.
Es liegt nahe, die n2 Einträge aik von A zusammen mit den n
Koordinaten (a1 , . . . , an ) des Vektors a 0 und der Konstan- Wird die Bedingung ψ(x) = 0 in Koordinaten dargestellt,
ten a in eine symmetrische (n + 1)-reihige Matrix zu packen, so nennt man dies eine Gleichung der Quadrik Q(ψ). Diese
nämlich in ist selbstverständlich abhängig vom verwendeten Koordina-
⎛ ⎞ tensystem. Ist V = Kn , und handelt es sich um kanonische
a a1 . . . an
' ( ⎜ a a Koordinaten (0; E) in A (Kn ), so sprechen wir von der ka-
a a0 ⎜ 1 11 . . . a1n ⎟

M ∗(o;B) (ψ) = =⎜ . .. .. ⎟ nonischen Gleichung der Quadrik.
a A ⎝ .. . . ⎠
an an1 . . . ann
Beispiel 1. Die Quadrik des A (R2 ) mit der kanonischen
Wir nennen diese symmetrische Matrix aus R(n+1)×(n+1) die Gleichung
erweiterte Darstellungsmatrix der quadratischen Funktion
ψ(x) = x12 + x22 − 1 = 0
ψ. So wie bereits in Abschnitt 7.5 können wir die Koordina-
tenvektoren x der Punkte durch Hinzufügen der nullten Koor-
ist der Einheitskreis.
dinate 1 zu Vektoren x ∗ ∈ Rn+1 erweitern. Dies führt auf die
erweiterte Matrizendarstellung der quadratischen Funktion: 2. Bei ψ(x) = x12 − x22 besteht die Nullstellenmenge Q(ψ)
ψ(x) = ∗0
M ∗(o;B) (ψ) (o;B) x ∗ aus den Geraden mit den Gleichungen x1 ± x2 = 0.
(o;B) x (18.9)
oder ausführlich 3. Bei ψ(x) = x12 ist die Nullstellenmenge eine einzige Ge-
⎛ ⎞⎛ ⎞
a a1 . . . an 1 rade, nämlich die x2 -Achse x1 = 0.
⎜ a1 a11 . . . a1n ⎟ ⎜ ⎟
⎜ ⎟ ⎜ x1 ⎟
ψ(x) = (1, x1 , . . . , xn ) ⎜ .. .. .. ⎟ ⎜ .. ⎟ .
⎝ . . . ⎠⎝ . ⎠ 4. Bei ψ(x) = x12 + x22 ist Q(ψ) = {0}, d. h., die Quadrik
an an1 . . . ann xn besteht aus einem einzigen Punkt. 

Beispiel Die erweiterte Koeffizientenmatrix der quadrati- Kommentar: Die quadratische Funktion ψ bestimmt
schen Funktion die zugehörige Quadrik Q(ψ) eindeutig. Umgekehrt ist
ψ(x) = 2x12 − x22 + 4x1 x3 − 6x2 − 2x3 + 5, dies nicht der Fall. So haben z. B. die beiden Funktionen
ψ1 , ψ2 : A (R2 ) → R mit den kanonischen Darstellungen
also
⎛ ⎞⎛ ⎞
2 0 2 x1 ψ1 (x) = x12 + x22 und ψ2 (x) = 2 x12 + x22
ψ(x) = (x1 , x2 , x3 )⎝ 0 −1 0 ⎠⎝ x2 ⎠
2 0 0 x3
⎛ ⎞ dieselbe Nullstellenmenge Q(ψ1 ) = Q(ψ2 ) = {0}. Erst über
x1 C ist die zu einer Quadrik gehörige quadratische Funktion bis
+ (0, −6, −2)⎝ x2 ⎠+5
auf einen Faktor eindeutig, außer ψ(x) ist das Quadrat einer
x3
linearen Funktion. Es haben nämlich z. B. die quadratischen
lautet: Funktionen
⎛ ⎞
5 0 −3 −1
⎜ 0 2 0 2 ⎟ ψ1 (x) = x1 und ψ2 (x) = x12
M ∗(0;E) (ψ) = ⎜
⎝ −3
⎟. 
0 −1 0 ⎠
−1 2 0 0 selbst in A (C2 ) dieselbe Nullstellenmenge.
730 18 Quadriken – vielseitig nutzbare Punktmengen

Koordinatentransformationen können die Warum genau die Koordinatentransformation (∗) auf diese
Gleichung einer Quadrik vereinfachen einfache Gleichung führt, soll im Folgenden geklärt wer-
den. 
Unser Ziel ist es, eine Übersicht über alle möglichen Qua-
driken in reellen affinen Räumen zu bekommen. Wir errei-
chen dies, indem wir durch spezielle Wahl des kartesischen Die Transformation einer Quadrikengleichung
Koordinatensystems die Koordinatendarstellung der quadra- auf Normalform erfolgt in zwei Schritten
tischen Funktion ψ und damit die Q definierende Gleichung
auf eine der auf Seite 733 angegebenen Normalformen brin- Wir beginnen damit, die Auswirkungen eines allgemeinen
gen. Durch einen Basiswechsel gelingt es, die Darstellungs- Koordinatenwechsels auf eine quadratische Funktion zu un-
matrix A = M B (σ ) der enthaltenen quadratischen Form zu tersuchen. Dabei beschränken wir uns weiterhin auf kartesi-
diagonalisieren. Lässt man auch eine Verschiebung des Koor- sche Koordinatensysteme. Wir untersuchen in diesem Sinn
dinatenursprungs zu, so kann in vielen Fällen die enthaltene die euklidische Geometrie der Quadriken und nicht deren
Linearform zum Verschwinden gebracht werden. affine Geometrie.
Ersetzen wir das Koordinatensystem (o; B) durch das Sys-
Beispiel Die quadratische Funktion ψ : A (R2 ) → R mit
tem (o ; B  ), so bedeutet dies für die Koordinaten desselben
der kanonischen Darstellung
Punkts x (vergleiche Abschnitt 7.5):
ψ(x) = 9 x12 − 4 x1 x2 + 6 x22 − 32 x1 − 4 x2 + 24 
(o;B) x = (o;B) o + B T B  (o ;B  ) x ,
bestimmt als Nullstellenmenge
√ Q(ψ) eine Ellipse mit den
Achsenlängen 1 und 2 (Abb. 18.6), denn nach Umrechnung wobei die Matrix B T B  orthogonal, also (B T B  )−1 =
auf die Koordinaten (B T B  )0 ist. Wir setzen dies in die Darstellung (18.8)
' ( ' (
x1 1 ' −3 ( 1 ' 2 −1 ( x1 0
= √ −4 +√ (∗) ψ(x) = (o;B) x A (o;B) x + 2 a 0(o;B) x + a
x2 5 5 1 2 x2

wird dieselbe Punktmenge Q(ψ) durch die Gleichung ein, wobei wir kurz T für die Transformationsmatrix B T B 
schreiben sowie t statt (o;B) o und x  statt (o ;B  ) x :
x12 + 1
2 x22 − 1 = 0
ψ(x) = (t 0 + x 0 T 0 )A(t + T x  )
beschrieben (siehe Typ 2a auf Seite 734). + 2 a 0 (t + T x  ) + a
x2 x2 = x 0(T 0 A T )x  
+ t 0 A T x  + x 0 T 0A t + 2 a 0 T x 
+ t 0A t + 2 a0t + a .

Wir formen den mittleren, in x  linearen Term noch etwas um:


Q(ψ)
Wegen A0 = A können wir für die reelle Zahl x 0 T 0 A t
o auch schreiben:

x1 x 0 T 0 A t = (x 0 T 0 A t)0 = t 0 A T x  .

0 x1 Deshalb bleibt als linearer Term:

2 t 0 A T x  + 2 a 0 T x  = 2 (t 0 A + a 0 ) T x  .
Abbildung 18.6 Die Quadrik Q(ψ) mit der kanonischen Gleichung ψ(x) =
9x12 − 4x1 x2 + 6x22 − 32x1 − 4x2 + 24 = 0 ist eine Ellipse.
Lemma
Wir können dies durch Nachrechnen überprüfen. Dazu be- Eine Änderung des kartesischen Koordinatensystems
stimmen wir zunächst die Umkehrtransformation zu (∗). von (o; B) zu (o ; B  ) mittels der Transformationsgleichung
Nachdem die dort auftretende 2 × 2 -Matrix orthogonal ist, (o;B) x = t + T (o ;B  ) x verändert gleichzeitig die Dar-
ist ihre Inverse die Transponierte, und wir erhalten: stellung ψ(x) = (o;B) x 0 A (o;B) x + 2 a 0(o;B) x + a der
' ( ' ('  √ ( quadratische Funktion ψ : A (V ) → R zu
x1 2 1 x1 + 3/√5
= √1
x2 5−1 2 x2 + 4/ 5 ψ(x) = 0
A + 2 a 0 (o ;B  ) x + a 
' ( ' ('  ( (o ;B  ) x (o ;B  ) x
2 2 1 x1
= + √1 .
1 5 −1 2 x2 mit

Dies setzen wir in der obigen quadratischen Funktion ψ(x) A = T 0 A T ,


ein und erhalten nach einiger Rechnung die oben angeführte a  = T 0 (A t + a) , (18.10)
einfache Gleichung. a  = t 0 A t + 2 a 0 t + a = ψ(o ) .
18.3 Quadriken und ihre Hauptachsentransformation 731

Kommentar: Die in der quadratischen Funktion Wenn wir die positiven Eigenwerte λi durch 1/αi2 ersetzen
ψ : A (V ) → R vorkommende quadratische Form ρ : V → R und die negativen durch −1/αi2 bei αi > 0, so folgt als qua-
bleibt unverändert, denn die Darstellungsmatrix A wird dratischer Anteil in der transformierten Darstellung von ψ:
durch eine zu A kongruente Matrix A ersetzt. Die lineare
Abbildung ϕ hingegen wird verändert, denn der Übergang (o ;B  ) x
0 A
(o ;B  ) x = λ1 x1 2 + · · · + λr xr 2
von der einzeilige Darstellungsmatrix a 0 zu a 0 ist bei t  = 0 x1 2 xp 2 2
xp+1 xr 2
= + ··· + − − ··· −
keine Äquivalenz mehr. Dies ist deshalb ohne Änderung α12 αp2 2
αp+1 αr2
der quadratischen Funktion ψ möglich, weil nach dem
mit 0 ≤ p ≤ r = rg(A) ≤ n.
Koordinatenwechsel ρ nicht allein auf x, sondern auf x − o
angewendet wird.
2. Schritt: Nach der Beseitigung der gemischten Summan-
Durch die auf Seite 728 definierte quadratische Funktion
den verlagern wir den Ursprung derart, dass die linearen Sum-
ψ : A (V ) → R wird zwar die quadratische Form ρ ein-
manden ai xi weitgehend verschwinden.
deutig festgelegt, nicht aber die lineare Abbildung ϕ sowie
die Konstante a. Letztere ändern sich bei Verlagerung des Um in dem neuen Koordinatensystem (o ; B  ) gleichzei-
Ursprungs von A (V ). tig die Linearform zum Verschwinden zu bringen, muss in
(18.10) a  = 0 sein. Wegen der Invertierbarkeit von T ist
hierfür notwendig und hinreichend, dass t = (o;B) o das in-
Wenn wir diesen Koordinatenwechsel so wie im Kapitel 7 homogene lineare Gleichungssystem
durch die erweiterte Transformationsmatrix T ∗ beschreiben,
also in der Form A x = −a (18.11)
' ( ' (' ( löst. Hier sind zwei Fälle zu unterscheiden.
∗ 1 1 00 1
x = = = T ∗ x ∗ ,
x t T x
Fall a) Das System (18.11) ist lösbar:
Nach den Ergebnissen von Kapitel 5 wird in diesem Fall der
so erhalten wir die gegenüber M ∗(o;B) (ψ) aus (18.9) neue
Rang nicht größer, wenn zur Koeffizientenmatrix die Abso-
erweiterte Darstellungsmatrix M ∗(o ;B  ) (ψ) auch direkt als
lutspalte hinzugefügt wird – auch wenn diese zuvor mit −1
das Matrizenprodukt
multipliziert wird. Also ist
' (' (' (
1 t0 a a0 1 00
M ∗(o ;B  ) (ψ) = , rg(A | a) = rg(A) = r .
0 T0 a A t T
Jeder Punkt m, dessen (o; B)-Koordinaten dieses Glei-
wie eine einfache Rechnung mittels blockweiser Matrizen- chungssystem lösen, heißt Mittelpunkt der Quadrik. In dem
multiplikation bestätigt. Der Rang der erweiterten Matrix Koordinatensystem (m; H ) nimmt die Gleichung der Qua-
bleibt bei dieser Transformation unverändert, weil T ∗ inver- drik Q(ψ) die Form
tierbar ist.
2
x1 2 xp 2 xp+1 xr 2
Nun können wir darangehen, durch eine geeignete Wahl der + ··· + − − ··· − + a = 0
α12 αp2 2
αp+1 αr2
Basis B  und des Koordinatenursprungs o die Koordinaten-
darstellung der quadratischen Funktion ψ aus (18.10) und an. Die Lösungsmenge dieser Gleichung, also Q(ψ), bleibt
damit die Gleichung der Quadrik Q(ψ) zu vereinfachen. unverändert, wenn wir die Gleichung mit einem von null ver-
schiedenen Faktor multiplizieren. Bei a  = 0 können wir
1. Schritt: Wir diagonalisieren die Polarform und eliminie- durch die Multiplikation mit −1/a  die Konstante auf −1
ren damit in der Quadrikengleichung alle gemischten Sum- normieren. Bei a  = 0 erreichen wir durch eine etwaige
manden aij xi xj , i = j . Multiplikation mit −1, dass die Anzahl der positiven Dia-
gonaleinträge in A nicht kleiner ist als jene der negativen.
Nach der auf Seite 727 erklärten Hauptachsentransformation
Die Bezeichnung Mittelpunkt für die Lösungen von (18.11)
symmetrischer Bilinearformen haben wir als neue orthonor-
ist berechtigt, denn mit x  ∈ Q(ψ) ist stets auch −x  ∈
mierte Basis B  = H eine aus lauter Eigenvektoren von A
Q(ψ), da die (m; H )-Koordinaten x1 , . . . , xn von x alle
zu wählen. Die Transformationsmatrix lautet:
nur im Quadrat vorkommen. Der Punkt m ist also tatsächlich
ein Symmetriezentrum der Quadrik.
B TH = ( B h1 , . . . , B hn ) .
Bei r = rg(A) < n gibt es mehr als einen Mittelpunkt; jeder
Damit wird A zur Diagonalmatrix diag (λ1 , . . . , λn ) mit Punkt aus m + EigA 0 löst das inhomogene Gleichungssys-
den Eigenwerten λi von A. Deren Vorzeichenverteilung er- tem, denn der (n − r)-dimensionale Eigenraum zum Eigen-
gibt sich aus der Signatur (p, r − p, n − r) von A. Wir wert 0 – übrigens das Radikal der Polarform zu quadratischen
können jedenfalls die p positiven Eigenwerte zu Beginn rei- Form ρ in ψ – ist genau die Lösungsmenge des zu (18.11)
hen, anschließend bei r = rg(A) die r − p negativen und gehörigen homogenen Systems A x = 0 (siehe Kapitel 5,
schließlich die n − r Nullen. Seite 183).
732 18 Quadriken – vielseitig nutzbare Punktmengen

Verschwindet die Konstante a  in der Quadrikengleichung, mit (a1 , . . . , an ) als H -Koordinaten von a. Das inhomogene
so gehört der Mittelpunkt m gemäß (18.10) der Quadrik an. Gleichungssystem A x = −a aus (18.11) bekommt die Form
In diesem Fall enthält die Gleichung nur quadratische Sum-
manden. Die zugehörige Quadrik heißt kegelig. Mit jedem λ1 x1 = −a1
.. ..
vom Koordinatenursprung m verschiedenen Punkt mit den . .
(m; H )-Koordinaten (x1 , . . . , xn ) gehört die ganze Verbin- λ r xr = −ar
dungsgerade der Quadrik an, denn dann ist 0 = −ar+1
!
r !
r .. ..
. .
λi (t xi )2 = t 2 λi xi = 0 für alle t ∈ R.
2

0 = −an
i=1 i=1
Nun ist die Zerlegung von a in die beiden Komponenten
Fall b) Das System (18.11) ist nicht lösbar, es gibt keinen offensichtlich. Wir setzen
Mittelpunkt: Nun ist r = rg(A) < rg(A | a) ≤ n. ⎛ ⎞ ⎛ ⎞
a1 0
In diesem Fall können nicht alle linearen Summanden ai xi ⎜ . ⎟ ⎜ . ⎟
⎜ . ⎟ ⎜ . ⎟
⎜ . ⎟ ⎜ . ⎟
in der Quadrikengleichung eliminiert werden. Es wird sich ⎜ ⎟ ⎜ ⎟
⎜ ar ⎟ ⎜ 0 ⎟
H a1 = ⎜ 0 ⎟ und H a0 = ⎜a ⎟.
zeigen, dass ein linearer Term 2 xn bestehen bleibt. Dazu ⎜



⎜ r+1



⎜ . ⎟ ⎜ . ⎟
verhilft eine geeignete Zerlegung von a in die Summe zweier ⎝ .. ⎠ ⎝ .. ⎠
zueinander orthogonaler Komponenten. 0 an

Lemma
Ist das lineare Gleichungssystem A x = −a in (18.11) nicht Im parabolischen Fall bleibt ein linearer Term
lösbar, so lässt sich der Vektor a derart in eine Summe in der Quadrikengleichung bestehen
a 0 + a 1 zerlegen, dass einerseits a 0 ein Eigenvektor von A
zum Eigenwert 0 ist und andererseits das System A x = −a 1 Wenn wir in der (o; B)-Darstellung von ψ(x) den Vektor a
lösbar wird. durch die Summe a 0 + a 1 nach (18.12) ersetzen, so entsteht
0
ψ(x) = (o;B) x A (o;B) x + 2 a 0 0
0 (o;B) x + 2 a 1 (o;B) x + a.
Beweis: Für die Lösbarkeit des Systems A x = −a 1 ist
Darin kann der zweite lineare Summand zum Verschwinden
notwendig und hinreichend, dass a 1 im Bild der linearen
gebracht werden, indem als Ursprung o ein Punkt gewählt
Abbildung ϕA : x → A x liegt. Dieser Unterraum Im(ϕA )
wird, dessen (o; B)-Koordinaten das System A x = −a 1
wird wegen A hi = λi hi für i = 1, . . . , n bei λr+1 =
lösen.
· · · = λn = 0 von den ersten r Eigenvektoren h1 , . . . , hr
aufgespannt. Der zur Hülle dieser Eigenvektoren orthogonale Wegen der freien Wahl der letzten n − r orthonormierten
Raum ist die Hülle von hr+1 , . . . , hn , der Eigenraum EigA 0 Basisvektoren hr+1 , . . . , hn innerhalb von EigA 0 dürfen
zum Eigenwert 0. wir den letzten in Richtung von a 0 festsetzen. Dann ist in
H a 0 nur die letzte Koordinate von null verschieden, etwa
Die Zerlegung a = a 0 + a 1 wird durch die Bedingungen
H a 0 = an hn . Es bleibt in der Gleichung der Quadrik nur ein
a 0 ∈ EigA 0 = - hr+1 , . . . , hn . und a 1 ∈ Im(ϕA ) =
einziger linearer Term übrig, nämlich 2 an xn . Wegen r < n
- h1 , . . . , hr . eindeutig. Die beiden Komponenten a 0 bzw.
kommt sicherlich kein xn2 vor.
a 1 entstehen durch orthogonale Projektion von a in den Ei-
genraum EigA 0 bzw. in dessen orthogonales Komplement. Nun können wir noch die Konstante zu null machen, indem
wir den Ursprung o durch ein geeignetes o = o + λ hn
Nachdem die Koordinaten von a bezüglich der Basis H Ska-
ersetzen. Dies bedeutet, wir substituieren xn = xn − λ, wäh-
larprodukte sind (siehe Seite 670), gilt:
rend alle anderen Koordinaten unverändert bleiben. Auf der
!
n !
r linken Seite der Quadrikengleichung folgt:
a0 = (a · hi ) hi , a1 = (a · hj ) hj , (18.12)
i=r+1 j =1 !
r
λi xi2 + 2 an (xn − λ) + a.
wobei nach wie vor a = a 0 + a 1 gilt. Wegen der geforderten i=1
Unlösbarkeit des Systems in (18.11) ist a 0  = 0. 
Die Wahl λ = a/2an beseitigt die Konstante.

Angenommen, der erste Schritt ist bereits erledigt. Dann Schließlich können wir noch erreichen (gegebenenfalls nach
ist die Quadrikengleichung bereits auf die aus Eigen- Multiplikation mit −1), dass unter den quadratischen Sum-
vektoren bestehende Basis H umgerechnet, also A = manden die Anzahl der positiven nicht kleiner ist als jene der
diag (λ1 , . . . , λr , 0, . . . , 0), und die Quadrikengleichung negativen. Nach der Division durch |an | wird der Koeffizient
lautet: von xn zu 2 oder −2. Im erstgenannten Fall können wir den
Basisvektor hn noch umorientieren, also xn durch −xn er-
λ1 x12 + · · · + λr xr2 + 2 (a1 x1 + · · · + an xn ) + a = 0 setzen.
18.3 Quadriken und ihre Hauptachsentransformation 733

Damit finden wir für jede Quadrik ein geeignetes Koordina- den Seiten 734 und 738 folgenden Auflistungen der Quadri-
tensystem, in welchem die Gleichung eine der nachstehend ken im R2 bzw. R3 .
angeführten Normalformen annimmt. Die Koordinatenach-
sen sind Achsen der Quadrik. Beispiel Wir bringen die Ellipse aus Abbildung 18.6 mit
der kanonischen Gleichung
Klassifikation der reellen Quadriken
ψ(x) = 9x12 − 4x1 x2 + 6x22 − 32x1 − 4x2 + 24 = 0
Es gibt drei Typen von Quadriken in A (Rn ). Die Nor-
malformen ihrer Gleichungen lauten wie folgt: auf Normalform.
Typ 1 (kegeliger Typ): 0 ≤ p ≤ r ≤ n, p ≥ r − p,
x2
rg(A∗ ) = rg(A | a) = rg(A) = r :
2
x12 xp2 xp+1 xr2
+ ··· + − − ··· − = 0. h2
α12 αp2 2
αp+1 αr2
Q(ψ)

m
Typ 2 (Mittelpunktsquadrik): 0 ≤ p ≤ r ≤ n,
rg(A∗ ) > rg(A | a) = rg(A) = r : h1

2
x12 xp2 xp+1 xr2 o x1
+ ··· + − − ··· − −1 = 0.
α12 αp2 2
αp+1 αr2

Abbildung 18.7 Die Quadrik 9x12 − 4x1 x2 + 6x22 − 32x1 − 4x2 + 24 ist eine
Typ 3 (parabolischer Typ): 0 ≤ p ≤ r < n, √
Ellipse mit den Achsenlängen 1 und 2.
p ≥ r − p, rg(A | a) > rg(A) = r :
2 In der Bezeichnung von (18.8) ist
x12 xp2 xp+1 xr2
+ ··· + − − ··· − − 2 xn = 0 . ' ( ' (
α12 αp2 2
αp+1 αr2 9 −2 −16
A= , a= und a = 24 .
−2 6 −2

Die in diesen Normalformen auftretenden wichtigen Kenn- Als Nullstellen des charakteristischen Polynoms
zahlen p und r ergeben sich aus der Signatur der Darstel- ' (
9 − λ −2
lungsmatrix M B (σ ) = A der in ψ enthaltenen quadratischen det(A − λE2 ) = det = λ2 − 15λ + 50
−2 6 − λ
Form. Diese sind, wie im Abschnitt 18.1 gezeigt wurde, auch
allein durch kombinierte Zeilen- und Spaltenumformungen erhalten wir die Eigenwerte
bestimmbar, also ohne orthogonales Diagonalisieren mittels
Berechnung der Eigenwerte. Auch die Entscheidung, um λ1 = 10, λ2 = 5
welchen Typ es sich handelt, kann ohne die Transformation
und als orthonormierte Basis von Eigenvektoren
auf Hauptachsen getroffen werden, nämlich allein anhand der
' ( ' (
Ränge der Matrizen A, (A | a) und der erweiterten Darstel- 1 2 1 1
h1 = √ , h2 = √ .
lungsmatrix A∗ . 5 −1 5 2
Die auf Normalform gebrachte Quadrik vom Typ 2 schneidet Das Gleichungssystem (18.11)
die Achse m + hi R für i ≤ p in Punkten, für deren i-te
(m; H )-Koordinate gilt: A x = −a
xi2 /αi2 − 1 = 0, also xi = ±αi , für die kanonischen Koordinaten des Mittelpunkts ist eindeu-
wobei λi = 1/αi2 ein positiver Eigenwert von A ist; alle ande- tig lösbar und liefert
ren Koordinaten sind null. Diese Schnittpunkte sind Scheitel ' (
2
der Quadrik. Das αi ist die zugehörigen Achsenlänge, also m= .
1
der Abstand des Mittelpunkts von den Scheiteln.
Die Geraden m + hi R mit i ≤ p heißen auch Hauptachsen Die Umrechnung auf das Koordinatensystem (m; H ) gemäß
der Quadrik, jene mit p + 1 ≤ i ≤ r Nebenachsen. Die auf ' ( ' (
x1 x1
= E TH +m
Nebenachsen liegenden Schnittpunkte haben rein imaginäre
√ x2 x2
Koordinaten xi = ±i −αi . Bei einem mehrfachen Eigen-
wert λi ist die Achse m + hi R nicht mehr eindeutig. mit E T H = (h1 , h2 ), also
' ( ' (' ( ' (
Warum die Quadriken von Typ 3, also jene ohne Mittelpunkt, x1 1 2 1 x1 2
= √ +
auch parabolisch genannt werden, zeigen die Fälle in der auf x2 5 −1 2 x2 1
734 18 Quadriken – vielseitig nutzbare Punktmengen

bringt die Quadrikengleichung mit (18.10) auf die verein- Typ 2, Mittelpunktsquadriken: Hier bleiben fünf Fälle:
fachte Form x12 x22
2a) (r, p) = (2, 2), ψ(x) = + − 1, Q(ψ) ist eine
α12 α22
λ1 x1 2 + λ2 x2 2 + ψ(m) = 10 x1 2 + 5 x2 2 − 10 = 0 Ellipse,
x12 x22
2b) (r, p) = (2, 1), ψ(x) = − − 1, Q(ψ) ist eine
und nach Division durch 10 auf die Normalform α12 α22
Hyperbel,
x2 x22
x1 2 + 1
2 x2 2 −1=0 2c) (r, p) = (2, 0), ψ(x) = − 12 −
α1 α22
− 1, Q(ψ) = ∅,
√ x12
mit α1 = 1 und α2 = 2. Die in Abbildung 18.7 markierten 2d) (r, p) = (1, 1), ψ(x) = − 1, Q(ψ) besteht aus zwei
α12
Scheitel haben die Koordinaten parallelen Geraden,
  '   ( x2
2e) (r, p) = (1, 0), ψ(x) = − 12 − 1, Q(ψ) = ∅.
2 1 2 2 α1
2± √ , 1∓ √ , 2± , 1±2 . 
5 5 5 5
Eine Ellipse mit α1 = α2 ist natürlich ein Kreis mit dem
Radius α1 . Gilt bei der Ellipse α1 > α2 , so heißt die ers-
te Koordinatenachse Hauptachse und α1 Hauptachsenlänge
Ein Beispiel mit einem parabolischen Typ folgt auf Seite 735. zum Unterschied von der Nebenachse und der Nebenachsen-
länge α2 .
Dieselben Bezeichnungen werden auch bei der Hyperbel
Die Quadriken in der Ebene und im Raum mit der obigen Normalform verwendet, wobei aber nur die
Hauptachse reelle Scheitel trägt. Die durch die Hyperbel-
x x
Wir beginnen mit der Aufzählung aller Quadriken in A (R2 ). mitte gehenden Geraden mit der Gleichung 1 = ± 2 hei-
α1 α2
Diese sind auch noch in der Übersicht auf Seite 737 festge- ßen Asymptoten. Sie bilden die Quadrik mit der Gleichung
x12 x2
halten. 2
− 22 = 0 vom Typ 1b.
α1 α2
Typ 1, kegelig: Die Bedingungen 0 ≤ p ≤ r ≤ 2 und
p ≥ r − p für (r, p) ergeben drei wesentlich verschiedene Typ 3, parabolisch: Als einzige Normalformen bleiben
Nullstellenmengen: x12
3a) (r, p) = (1, 1), ψ(x) = − 2 x2 , Q(ψ)ist eine Para-
α12
x12 x22
1a) (r, p) = (2, 2), ψ(x) = + , Q(ψ) = {0}, bel mit dem Scheitel in 0,
α12 α22
x12 x22
3b) (r, p) = (0, 0), ψ(x) = −x2 , Q(ψ) ist eine Gerade.
1b) (r, p) = (2, 1), ψ(x) = − , Q(ψ) umfasst zwei
α12 α22 Die Konstante α12 in der Parabelgleichung heißt Parameter
Geraden,
(siehe Abbildung 18.8).
1c) (r, p) = (1, 1), ψ(x) = x12 , Q(ψ) ist eine Gerade.
Die Kegelschnitte, also Ellipse, Parabel und Hyperbel, haben
Die quadratische Funktion ψ(x) im Fall 1b ist reduzibel, trotz ihres verschiedenen Aussehens viele Gemeinsamkeiten.
denn So treten sie alle als Lösungskurven des Einkörperproblems
' (' ( auf (siehe Kapitel 20). Die Abbildung 18.11 illustriert, wie
x12 x22 x1 x2 x1 x2 die Bahnen von der Wahl der Anfangsgeschwindigkeit ẋ(t0 )
− 2 = + − .
α12 α2 α1 α2 α1 α2 im gemeinsamen Anfangspunkt x(t0 ) abhängen.

x2 x2 x2

α2
α2
z
f1 α1 x1 f1 α1 x1
f2 f2
f
α12 /2 x1
x
α12 /2
y L α12

Abbildung 18.8 Die Punkte x der Ellipse (links) mit den Achsenlängen α1 > α2 und den Brennpunkten f i = (±e, 0)0 bei e = α12 − α22  erfüllen die Bedingung
x − f 1  + x − f 2  = 2 α1 . Die Punkte y der Hyperbel (Mitte) mit den Achsenlängen α1 , α2 und den Brennpunkten f i = (±e, 0)0 , e = α12 + α22 , sind durch
| y − f 1  − y − f 2  | = 2 α1 gekennzeichnet. Die Punkte z der Parabel (rechts) haben vom Brennpunkt f = (0, α12 /2)0 und von der Leitgeraden L mit der
Gleichung x2 = −α12 /2 dieselbe Entfernung.
18.3 Quadriken und ihre Hauptachsentransformation 735

Beispiel: Normalform einer parabolischen Quadrik


Die durch die quadratische Funktion ψ : A (R3 ) → R festgelegte Quadrik Q(ψ) mit der kanonischen Gleichung ψ(x) =
x12 + 2x1 x2 + x22 + 4x1 + 2x2 − 4x3 − 3 = 0 ist durch Wahl eines geeigneten kartesischen Koordinatensystems auf
Normalform zu bringen.

Problemanalyse und Strategie: Wir gehen wie oben beschrieben vor: ψ(x) ist die Summe aus der quadratischen
Form x 0 A x = x12 +2x1 x2 +x22 , der Linearform 2 a 0 x = 4x1 +2x2 −4x3 und der Konstanten a = −3. Im ersten Schritt
bestimmen wir die Hauptachsen der quadratischen Form. Im zweiten Schritt erweist sich das lineare Gleichungssystem
A x = −a aus (18.11) zur Berechnung eines Mittelpunkts als unlösbar. Daher wird a aufgespaltet in zwei zueinander
orthogonale Komponenten a = a 0 + a 1 mit a 1 ∈ Im(ϕA ) und a 0 ∈ ker(ϕA ) = EigA 0. Der letzte Vektor h3 unserer
Basis entsteht durch Normierung von a 0 . Schließlich wird durch Verschiebung des Ursprungs noch die Konstante zum
Verschwinden gebracht.

Lösung: Wir verwenden die Formeln aus (18.10), um auf das


Es sind kartesische Koordinatensystem (p; H ) mit E T H =
⎛ ⎞ ⎛ ⎞ (h1 , h2 , h3 ) umzurechnen. Es entstehen
1 1 0 2
A = ⎝ 1 1 0 ⎠, a = ⎝ 1 ⎠, a = −3 . ⎛ ⎞ ⎛ ⎞
2 0 0 0 27
0 0 0 −2  ⎝ ⎠  ⎠, a  = −
A = 0 0 0 , a = ⎝ 0
√ .
0 0 0 3/ 2 4
Das charakteristische Polynom
Die vereinfachte Gleichung lautet somit:
det(A − λE3 ) = −λ2 (λ − 2)

2 x1 2 + 3 x3 2 − 27/4 = 0 . (∗)
ergibt den einfachen Eigenwert λ1 = 2 und den zweifa-
chen Eigenwert λ2 = 0. Der zu λ1 gehörige normierte Die letzten beiden Summanden fassen wir zu
Eigenvektor ⎛ ⎞ √  27  √  9 
1 1
h1 = √ ⎝ 1 ⎠ 3 2 x3 − √ = 3 2 x3 − √
2 0 12 2 4 2

spannt den Bildraum Im(ϕA ) auf. Dazu orthogonal ist der zusammen und ersetzen x3 durch x3 = x3 − 9/4 2. Dies
Eigenraum EigA 0 = ker(ϕA ). bedeutet, dass wir den Ursprung o ersetzen durch
a liegt offensichtlich nicht in Im(ϕA ). Also liegt eine pa- ⎛ ⎞
9 −9/8
rabolische Quadrik vor, und wir müssen a aufspalten. Die o = o + √ h3 = ⎝ −3/8 ⎠ .
Komponente a 1 von a in Richtung des Bildraums ist über 4 2 −3/2
das Skalarprodukt mit h1 zu berechnen:
Schließlich
√ multiplizieren wir die Gleichung (∗) noch mit
⎛ ⎞
3 1 2/3 2 und kehren die Richtung der dritten Koordina-
a 1 = (a · h1 )h1 = ⎝ 1 ⎠ . tenachse um, indem wir x3 = −x3 setzen. Zur Vermei-
2 0
dung eines Linkskoordinatensystems kehren wir auch die
Somit bleibt x2 -Achse um. Mithilfe der orthonormierten Basis H  =
⎛ ⎞ (h1 , −h2 , −h3 ) und des Ursprungs o erhalten wir die
1 1
a 0 = a − a 1 = ⎝ −1 ⎠ . Normalform
2 −4 4
√ x1 2 − 2 x3 = 0
3 2
Normierung von a 0 ergibt den dritten Basisvektor eines parabolischen Zylinders (siehe Seite 738). Dabei ge-
⎛ ⎞
1 nügt die dahinter stehende Koordinatentransformation der
1
h3 = √ ⎝ −1 ⎠ Gleichung
3 2 −4 ⎛ ⎞ ⎛ √ ⎞⎛ ⎞ ⎛ ⎞
x1 3 −2√2 −1 x1 3
⎝ x2 ⎠ = 1 ⎜ ⎟ 3
und weiter als Vektorprodukt √ ⎝ 3 2√2 1 ⎠⎝ x2 ⎠ − ⎝ 1 ⎠
3 2 8
⎛ ⎞ x3 0 − 2 4 x3 4
1 2
h2 = h3 × h1 = ⎝ −2 ⎠ . oder umgekehrt
3 ⎛ ⎞
1 ⎛ ⎞⎛ ⎞
x1 3 3 0 x1
√ √ √
Den Ursprung ounseres Koordinatensystems verlegen ⎝ x2 ⎠ =

√ ⎝ −2 2 2 2 − 2 ⎠⎝
1
x2 ⎠
3 2
wir zunächst in eine spezielle Lösung von A x = −a 1 , x3 −1
⎛⎞
1 4 x3
nämlich ⎛ ⎞ 6√
−3/2 1 ⎝
o = ⎝ 0 ⎠ . + √ −4 2 ⎠ .
4 2
0 7
736 18 Quadriken – vielseitig nutzbare Punktmengen

Im dreidimensionalen Raum A (R3 ) sind deutlich mehr Fälle


zu unterscheiden. In der Übersicht auf Seite 740 sind alle
zusammengestellt:

Typ 1, kegelig: Für (r, p) sind nunmehr die Bedingungen


0 ≤ p ≤ r ≤ 3 und p ≥ r − p einzuhalten. Dies führt auf
folgende fünf verschiedene Typen:
x12 x22 x32
1a’) (r, p) = (3, 3), ψ(x) = + + , Q(ψ) = {0},
α12 α22 α32
x12 x22 x32
1b’) (r, p) = (3, 2), ψ(x) = + − , Q(ψ) ist ein
α12 α22 α32
quadratischer Kegel,
x12 x22
1c’) (r, p) = (2, 2), ψ(x) = + , Q(ψ) ist eine Gerade,
α12 α22
x12 x22
1d’) (r, p) = (2, 1), ψ(x) = − , Q(ψ) besteht aus
α12 α22
Abbildung 18.9 Näherungsweiser Hyperbelbogen bei der von Santiago Cala- zwei Ebenen,
trava entworfenen Alamillo-Brücke in Sevilla, einer Schrägseilbrücke mit einer 1e’) (r, p) = (1, 1), ψ(x) = x12 , Q(ψ) ist eine Ebene.
Spannweite von 200 m.

Typ 2, Mittelpunktsquadriken: Hier gibt es neun Fälle:


x12 x22 x32
2a’) (r, p) = (3, 3), ψ(x) = + + − 1, Q(ψ) ist ein
α12 α22 α32
Ellipsoid,
x12 x22 x32
2b’) (r, p) = (3, 2), ψ(x) = + − − 1, Q(ψ) ist ein
α12 α22 α32
einschaliges Hyperboloid,
x12 x22 x32
2c’) (r, p) = (3, 1), ψ(x) = − − − 1, Q(ψ) ist ein
α12 α22 α32
zweischaliges Hyperboloid,
x12 x22 x32
2d’) (r, p) = (3, 0), ψ(x) = − − − − 1, Q(ψ) = ∅,
α12 α22 α32
x12 x22
2e’) (r, p) = (2, 2), ψ(x) = + − 1, Q(ψ) ist ein
α12 α22
elliptischer Zylinder,
x12 x22
2f’) (r, p) = (2, 1), ψ(x) = − − 1, Q(ψ) ist ein
α12 α22
hyperbolischer Zylinder,
x12 x22
Abbildung 18.10 Beispiele von Wurfparabeln. 2g’) (r, p) = (2, 0), ψ(x) = − − − 1, Q(ψ) = ∅,
α12 α22

x(t0 ) 2h’) (r, p) = (1, 1), ψ(x) = x12 − 1,


Q(ψ) besteht aus zwei
ẋ(t0 ) parallelen Ebenen,
2i’) (r, p) = (1, 0), ψ(x) = −x12 − 1, Q(ψ) = ∅.
ẍ Ein Ellipsoid mit paarweise verschiedenen Achsenlängen
heißt dreiachsig (Abb. 18.14 links). Bei zwei gleichen Ach-
ẋ(t0 ) senlängen spricht man von einem Drehellipsoid, dem eiför-
migen oder verlängerten mit α1 > α2 = α3 und dem linsen-
förmigen, abgeplatteten oder verkürzten mit α1 = α2 > α3
(Abb. 18.15). Der Sonderfall α1 = α2 = α3 ergibt eine
ẋ(t0 ) 0 Kugel.

Beide Hyperboloide (Abb. 18.14 Mitte und rechts) besit-


zen einen Asymptotenkegel mit der jeweiligen Gleichung
x12 x22 x32
± − = 0. Bei α1 = α2 im einschaligen Fall und
α12 α22 α32
α2 = α3 im zweischaligen entstehen Drehflächen.
Abbildung 18.11 Die Lösungskurven des Einkörperproblems (siehe Kapitel 20) Es gibt einen markanten Unterschiede zwischen beiden Hy-
sind Kegelschnitte. Dargestellt sind mögliche Bahnen des Massenpunkts x(t0 )
bei verschiedenen Anfangsgeschwindigkeiten ẋ(t0 ), und zwar eine Ellipse (blau), perboloiden: das einschalige Hyperboloid trägt zwei Scharen
eine Hyperbel (grün) und eine Parabel (rot). von Geraden, sogenannten Erzeugenden. Dies zeigt sich wie
18.3 Quadriken und ihre Hauptachsentransformation 737

Übersicht: Quadriken im A (R2 )


Wir stellen in der folgenden Tabelle die verschiedenen Typen der Quadriken der Ebene A (R2 ) zusammen.

x2

x12 x22
Typ 1, Kegelige Quadriken: + =0 ein Punkt
a12 a22 x1

zwei sich
x12 x22 x12
− =0 schneidende =0 eine Gerade
a12 a22 a12
Geraden

x12 x22
Typ 2, Mittelpunktsquadriken: + =1 Ellipse
a12 a22

x12 x22 x12 x22


− =1 Hyperbel − − =1 leere Menge
a12 a22 a12 a22

x12 zwei parallele x12


=1 − =1 leere Menge
a12 Geraden a12

x12
Typ 3, Parabolische Quadriken: − 2x2 = 0 Parabel
a12

Abbildung 18.12 Der quadratische Kegel (links) mit Hyperbelschnitten, der elliptische Zylinder (mittig) und der hyperbolische Zylinder (rechts) mit seinen
asymptotischen Ebenen (rot schattiert).

folgt: Jeder Wert t ∈ R \ {0} liefert als Schnitt der Ebenen eine Gerade, welche ganz auf dem Hyperboloid liegt. Wenn
mit den Gleichungen wir nämlich die linken Seiten und ebenso die rechten Seiten
  dieser Gleichungen miteinander multiplizieren, so erhalten
E1 (t) : t αx11 − αx33 = 1 ∓ αx22 und wir genau die obige Normalform 2b’. Demnach gehört jeder
1  x1  gemeinsame Punkt der Ebenen E1 (t) und E2 (t) auch der
E2 (t) : α + αx33 = 1 ± αx22
t 1 Nullstellenmenge von 2b’ an. Je nachdem, ob wir die oberen
738 18 Quadriken – vielseitig nutzbare Punktmengen

Abbildung 18.15 Die beiden Drehellipsoide, das linsenförmige oder abgeplat-


tete (links) und das eiförmige oder verlängerte (rechts), beide mit einem offenen
90◦ -Sektor.

Abbildung 18.13 Die Karlskirche in Wien mit ellipsoidförmiger Kuppel, deren


Umrissellipse auf dem Foto das Achsenverhältnis breit/hoch ≈ 1.03 hat.

oder die unteren Vorzeichen wählen, entsteht eine Gerade der


ersten oder zweiten Erzeugendenschar.
Neben den bisher angegebenen Geraden liegen auf dem Hy-
perboloid auch noch die insgesamt vier Geraden
x1 x3 x2
± =1± = 0,
α1 α3 α2 Abbildung 18.16 Die beiden Erzeugendenscharen eines einschaligen Hyper-
boloids.
wobei die Vorzeichen hier beliebig kombiniert werden dür-
fen. Diese Geraden sind die Grenzfälle der Schnittgeraden x12 x22
von E1 (t) und E2 (t) für t → 0 oder t → ∞ . 3a’) (r, p) = (2, 2), ψ(x) = + − 2x3 , Q(ψ) ist ein
α12 α22
elliptisches Paraboloid,
Die beiden Zylinder tragen ebenfalls Geraden. Diese sind alle x2 x22
3b’) (r, p) = (2, 1), ψ(x) = 12 − − 2x3 , Q(ψ) ist ein
parallel zur x3 -Achse (Abb. 18.12). α1 α22
hyperbolisches Paraboloid,
x2
Typ 3, parabolisch: Als Normalformen mit wesentlich ver- 3c’) (r, p) = (1, 1), ψ(x) = 12 − 2x3 , Q(ψ) ist ein para-
α1
schiedenen Nullstellenmengen bleiben bolischer Zylinder.

Abbildung 18.14 Das dreiachsige Ellipsoid sowie das ein- und zweischalige Hyperboloid mit achsenparallelen Schnittkurven.
18.3 Quadriken und ihre Hauptachsentransformation 739

x3 x3

x2
x1

x1 x2

Abbildung 18.17 Die Bezeichnung der beiden Paraboloide ergibt sich aus der Art der Schnittkurven mit den Ebenen x3 = konst.

Die beiden Paraboloide 3a’ und 3b’ sind einheitlich als Schieb- Das hyperbolische Paraboloid ist wieder eine Fläche mit zwei
flächen erzeugbar, indem die Schnittparabel P1 mit der Ebene Erzeugendenscharen. Ähnlich wie beim einschaligen Hyper-
x2 = 0 entlang der Schnittparabel P2 mit der Ebene x1 = 0 boloid können wir wieder Ebenenpaare
parallel verschoben wird (Abb. 18.18). Dabei sind im ellipti-  
schen Fall diese Schiebparabeln nach derselben Seite offen, E1 (t) : αx11 ± αx22 = t ,
im hyperbolischen Fall nach verschiedenen Seiten, weshalb  
hier eine Sattelfläche entsteht. E2 (t) : αx11 ∓ αx22 = 2xt 3

x3 x3 angeben, deren Schnittgerade für jedes t ∈ R \ {0} zur Gänze


dem Paraboloid angehört, weil alle ihre Punkte die Parabo-
loidgleichung erfüllen. Es ergeben sich erneut zwei Scharen
P1 von Geraden je nachdem, ob die oberen oder unteren Vorzei-
P2 P1
chen gewählt werden. Als Grenzfälle für t → 0 erhält man
die beiden Scheitelerzeugenden
P2 x1 x2
x1
x2 α1 ± α2 = x3 = 0 .
x2 x1

Abbildung 18.18 Beide Paraboloide sind Schiebflächen, nämlich erzeugbar


durch Verschiebung einer Parabel (rot schattiert) entlang einer zweiten, die im
elliptischen Fall (links) nach oben offen ist, im hyperbolischen Fall (rechts) nach
unten.

Diese Schiebflächeneigenschaft folgt aus der Feststellung,


dass für jedes k ∈ R die Schnittkurve der Paraboloide mit
der Ebene x2 = k = konst. die Gleichung
 
x12 k2 x12 k2
± 2 − 2x3 = 0, also 2 − 2 x3 ∓ 2 = 0
α12 α2 α1 2α2

erfüllt und daher durch die Parallelverschiebung


⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x1 0 x1
⎝ x2 ⎠  → ⎝ k ⎠ + ⎝ x2 ⎠
x3 ±k /2α2
2 2 x3

aus der zu k = 0 gehörigen Parabel P1 hervorgeht. Abbildung 18.19 Das hyperbolische Paraboloid trägt so wie das einschalige
Hyperboloid zwei Erzeugendenscharen.
Als Schnittkurven mit den Ebenen x3 = k  = 0 treten im
elliptischen Fall Ellipsen auf, im hyperbolischen Fall Hyper- Bei α1 = α2 wird das elliptische Paraboloid zum Drehpa-
beln. Dies ist eine Begründung für die Namensgebung der raboloid, und das hyperbolische Paraboloid heißt in diesem
beiden Paraboloide. Fall orthogonal.
740 18 Quadriken – vielseitig nutzbare Punktmengen

Übersicht: Quadriken in A (R3 )


Die folgenden Tabelle zeigt Ansichten aller Typen von Quadriken im Raum A (R3 ).

x3

x12 x22 x32 ein


Typ 1, Kegelige Quadriken: + + =0
a12 a22 a32 Punkt
x1 x2

x12 x22 x32 quadratischer x12 x22 eine


+ − =0 + =0
a12 a22 a32 Kegel a12 a22 Gerade

zwei sich
x12 x22 eine
− =0 schneidende x12 = 0
a12 a22 Ebene
Ebenen

x12 x22 x32


Typ 2, Mittelpunktsquadriken: + + =1 Ellipsoid
a12 a22 a32

x12 x22 x32 einschaliges x12 x22 x32 zweischaliges


+ − =1 − − =1
a12 a22 a32 Hyperboloid a12 a22 a32 Hyperboloid

x12 x22 x32 leere x12 x22 elliptischer


− − − =1 + =1
a12 a22 a32 Menge a12 a22 Zylinder

x12 x22 hyperbolischer x12 x22 leere


− =1 − − =1
a12 a22 Zylinder a12 a22 Menge

zwei
x12 x12 leere
=1 parallele − =1
a12 a12 Menge
Ebenen

x12 x22 elliptisches


Typ 3, Parabolische Quadriken: + −2x3 = 0
a12 a22 Paraboloid

x12 x22 hyperbolisches x12 parabolischer


− −2x3 = 0 − 2x3 = 0
a12 a22 Paraboloid a12 Zylinder
18.4 Die Singulärwertzerlegung 741

18.4 Die Singulärwertzerlegung Es erweist sich allerdings als günstiger, den umgekehrten
Weg einzuschlagen und jene Vektoren x zu betrachten, de-
ren Bildvektoren ϕ(x) Einheitsvektoren sind. Diese liegen
Wir wenden uns noch einmal den linearen Abbildun-
natürlich alle außerhalb des Kerns von ϕ.
gen zwischen endlichdimensionalen Vektorräumen zu. Wel-
che zusätzlichen Eigenschaften einer derartigen Abbildung Wir beginnen mit einem Beispiel: Es sei
ϕ : V → V  kann man feststellen, wenn die beteiligten Vek-  2 ' (
R → R2 , 1 1
torräume euklidisch sind? ϕ: mit A =
x → A x 0 1
Das Hauptziel des folgenden Abschnitts ist die Bestimmung
orthonormierter Basen H bzw. H  , bezüglich welcher die und damit bijektiv (Abb. 18.20). Welche Vektoren x ∈ V
Darstellungsmatrix H  M(ϕ)H möglichst einfach wird, näm- werden durch ϕ auf Einheitsvektoren abgebildet?
lich die Normalform
ϕ(e2 ) ϕ(h1 )
⎛ ⎞
s1 ... 0 0 ... 0 e2 h1 s1 h1
⎜ .. . . .. .. .. ⎟ ϕ(h2 )
⎜ ⎟


. . . . . ⎟

h2 e1 ϕ s2 h2
⎜ →
.. ⎟
0 . . . sr m×n ϕ(e1 )
H  M(ϕ) H = ⎜ .. ⎟∈R (18.13)
⎜ 0 ... 0 . . ⎟ k
⎜ ⎟
⎜ .. .. ⎟ k
⎝ . . ⎠
0 ... 0 0 ... 0
Abbildung 18.20 Die orthonormierte Basis (h1 , h2 ) bleibt orthogonal unter
annimmt, bei n = dim V , m = dim V  , r = rg(ϕ) und si > 0 der bijektiven linearen Abbildung ϕ : R2 → R2 .
für i = 1, . . . , r. Wir werden diese Normalform kurz mit
diag (s1 , . . . , sr ) bezeichnen, auch wenn die Matrix nicht Die Forderung ϕ(x) = 1 ergibt bei Verwendung des ka-
quadratisch sein sollte. nonischen Skalarprodukts in Matrizenschreibweise:

Dabei ist Folgendes zu beachten: Die im Kapitel 12 be- Ax2 = (Ax)0 (Ax) = x 0 (A0A) x = 1 .
handelte Diagonalisierbarkeit einer linearen Abbildung ϕ :
V → V  betraf nur Endomorphismen, also den Fall V  = V . Das ist die kanonische Gleichung einer Quadrik k (siehe
Damit waren die Darstellungsmatrizen stets quadratisch, und Abb. 18.20) des A (R2 ), deren quadratische Form die Dar-
es konnte nur eine einzige Basis modifiziert werden, nämlich stellungsmatrix ' (
1 1
jene in V . Dabei stellte sich heraus, dass nicht jeder Endo- A0A =
1 2
morphismus diagonalisierbar ist.
hat. Nachdem in dieser Quadrikengleichung die linearen
Nun ist es anders. Wir können sowohl in V , als auch in V  die Summanden fehlen, liegt der Mittelpunkt im Ursprung 0.
Basen der vorliegenden Abbildung ϕ anpassen. Daher gibt Wir transformieren diese Quadrik k auf ihre Hauptachsen.
es stets diagonalisierte Darstellungsmatrizen. Wir werden er-
kennen, dass die Diagonalisierung immer auch mit orthonor- Die Eigenwerte von A0A sind die Nullstellen des charakte-
mierten Basen erreichbar ist. ristischen Polynoms

det(A0A − λE2 ) = λ2 − 3λ + 1 ,

Die Hauptverzerrungsrichtungen von ϕ bei also √ √


3+ 5 3− 5
einem instruktiven Beispiel λ1 = 2 , λ2 = 2 .
Beide sind positiv. Also ist die Quadrik k eine Ellipse mit den
Zunächst befassen wir uns mit der Frage, wie sich eine lineare Achsenlängen
Abbildung ϕ auf die Länge der Vektoren auswirkt. Dazu be-  √
rechnen wir das Längenverzerrungsverhältnis ϕ(x)/x α1 = 2√
= 5−12 ≈ 0.618 ,
3+ 5
des Vektors x = 0. Dieser Quotient aus der Länge des Bilds  √
durch die Länge des Urbilds ist derselbe für alle Vielfachen α2 = 2√
= 5+12 ≈ 1.618 .
3− 5
von λx, λ = 0, denn
Diese Achsenlängen sind die Extremwerte unter den Längen
ϕ(λx) |λ| ϕ(x) ϕ(x) der Vektoren x ∈ k, d. h.,
= = .
λx |λ| x x
α1 ≤ x ≤ α2 .
Das Verzerrungsverhältnis ist also nur von der Geraden -x. Nachdem die Bildvektoren ϕ(x) alle die Länge 1 haben, gilt
abhängig. Man erhält bereits alle möglichen Verzerrungs- für die Verzerrungsverhältnisse
verhältnisse, wenn man nur Einheitsvektoren abbildet. Für
Vektoren aus dem Kern ker(ϕ) = ϕ −1 (0) ist das Verzer- 1 % ϕ(x) % 1
= λ1 ≥ ≥ λ2 = .
rungsverhältnis natürlich gleich 0. α1 x α2
742 18 Quadriken – vielseitig nutzbare Punktmengen

Die Eigenwerte von A0A geben also die Quadrate der zu. Das kanonische Skalarprodukt zwischen Bildvektoren in
extremen
√ Längenverzerrungsverhältnisse an. Wir nennen V  bestimmt in V eine symmetrische Bilinearform gemäß
si = λi für i = 1, 2 die Hauptverzerrungsverhältnisse der Gleichung
oder die Singulärwerte von ϕ. Die Achsen von k sind die-
jenigen Geraden, längs derer diese extremen Längenverzer- ϕ(x) · ϕ(y) = (A x)0 (A y) = x 0 (A0A) y , (18.14)
rungen auftreten. Sie bestimmen die Hauptverzerrungsrich-
denn das Matrizenprodukt (A0A) ist symmetrisch.
tungen von ϕ. Vektoren längs der Nebenachse von k werden
am stärksten verlängert, jene längs der Hauptachse von k am Ist rg(A0A) = r, so gibt es r von null verschiedene Eigen-
meisten verkürzt. werte λ1 , . . . , λr von (A0A) und eine orthonormierte Ba-
sis H = (h1 , . . . , hn ) aus Eigenvektoren von V , wobei
Für die orthonormierte Basis H aus Eigenvektoren von A0 A
hr+1 , . . . , hn den Kern von ϕ aufspannen. Aus
wählen wir
' ( ' √ ( (A0 A) hj = λj hj
1 2√ 1 −1 − 5
h1 = , h2 =
w 1− 5 w 2
folgt für alle i, j ∈ {1, . . . , r} nach (18.14):
√ ϕ(hi ) · ϕ(hj ) = h0 0 0
bei w 2 = 10 + 2 5. Die zugehörigen Bilder i (A A) hj = hi (λj hj ) = λj (hi · hj ) ,

' √ ( ' √ ( also 


1 3 + √5 1 1− 5 0 für i = j ,
ϕ(h1 ) = , ϕ(h2 ) = ϕ(hi ) · ϕ(hj ) =
w 1+ 5 w 2 λj für i = j .
√ √ Die ersten r Bildvektoren sind = 0 und paarweise ortho-
haben die Längen s1 = λ1 bzw. s2 = λ2 , und sie sind
zueinander orthogonal, wie deren verschwindendes Skalar- gonal. Wegen λi = ϕ(hi )2 sind die ersten r Eigenwerte
produkt beweist (Abb. 18.20). Durch Normieren entstehen von (A0A) positiv. Wir nennen die (positiven) Wurzeln aus
daraus die Vektoren diesen Eigenwerten, also
% %
s1 = λ1 = ϕ(h1 ) , . . . , sr = λr = ϕ(hr ) ,
h1 = 1
s1 ϕ(h1 ) , h2 = 1
s2 ϕ(h2 )
die Singulärwerte von ϕ. Dabei setzen wir die Vielfachheit
der orthonormierten Basis H  im Bildraum. ϕ erhält die Dar- von si jener von λi gleich.
stellungsmatrix
Die durch Normierung der Bildvektoren entstehenden Vek-
' (
s1 0 toren
H  M(ϕ)H = ( H  ϕ(h1 ), H  ϕ(h2 ) ) =
0 s2 h1 = s11 ϕ(h1 ) , . . . , hr = s1r ϕ(hr )

in der Normalform (18.13) mit den beiden Hauptverzerrungs- sind orthonormiert und lassen sich zu einer orthonormier-
verhältnissen in der Hauptdiagonale. ten Basis von V  ergänzen. Dabei ist -h1 , . . . , hr . das Bild
Im(ϕ) ⊂ V  und -hr+1 , . . . , hm . orthogonal dazu.
Nachdem die lineare Abbildung ϕ in diesem Beispiel sogar
Wir haben also ϕ(hi ) = si hi für i ∈ {1, . . . , r} und
bijektiv ist, können wir umgekehrt auf analoge Weise fest-
ϕ(hj ) = 0 für j > r. Die H  -Koordinaten der Bilder
stellen, dass die Bilder der Einheitsvektoren die Quadriken-
ϕ(hi ) sind die Spaltenvektoren in der Darstellungsmatrix
gleichung
H  M(ϕ)H ; somit erhält diese die auf Seite 741 gezeigte Nor-
x 0 (A0 −1 A−1 ) x  = x 0 (AA0 )−1 x  = 1 malform (18.13).

erfüllen. Dies führt auf die im rechten Bild von Abbil- Die Singulärwerte einer linearen Abbildung
dung 18.20 gestrichelt eingezeichnete Ellipse mit Achsen- Für jede lineare Abbildung ϕ : V → V  vom Rang r
längen s1 und s2 , auf welcher die Spitzen von ϕ(e1 ), ϕ(e2 ), zwischen den euklidischen Räumen V und V  gibt es
ϕ(h1 ) und ϕ(h2 ) liegen. orthonormierte Basen H von V und H  von V  derart,
dass die Darstellungsmatrix H  M(ϕ)H ∈ Rm×n die Nor-
malform diag (s1 , . . . , sr ) aus (18.13) annimmt mit den
Die Quadrate der Singulärwerte sind die Singulärwerten s1 , . . . , sr von ϕ als von null verschie-
Eigenwerte einer symmetrischen Matrix dene Einträge entlang der Hauptdiagonalen.

Nun wenden wir uns dem allgemeinen Fall einer linearen Angenommen, B und B  sind beliebige orthonormierte Basen
Abbildung in V bzw. V  und A ist die zugehörige Darstellungsmatrix
 von ϕ. Dann ist
V = Rn → V  = Rm ,
ϕ:
x → A x A= B  M(ϕ)B = B  T H  H  M(ϕ)H H T B ,
18.5 Die Pseudoinverse einer linearen Abbildung 743

und die Transformationsmatrizen H T B ∈ Rn×n und B  T H  ∈ Jede lineare Abbildung ist aus orthogonalen
Rm×m sind orthogonal. Endomorphismen und einer Skalierung
Jede Matrix A legt als (kanonische) Darstellungsmatrix eine zusammensetzbar
lineare Abbildung ϕ : x  → A x fest. Wir ändern die Be-
zeichnung und schreiben D für die Normalform H  M(ϕ)H Nun befassen wir uns noch mit der geometrischen Be-
aus (18.13) in Diagonalgestalt und ferner V statt H T B sowie deutung der Singulärwertzerlegung: Die lineare Abbildung
U statt H  T B  , also U 0 statt B  T H  . Dann ist U U 0 = Em ϕA : Rn → Rm mit x → A x bei A = U 0 D V ist die
und V V 0 = En . Zusammensetzung dreier linearer Abbildungen, nämlich

ϕA = ϕU 0 ◦ ϕD ◦ ϕV .
Die Singulärwertzerlegung einer Matrix
1. ϕV : Rn → Rn , x → V x ist ein orthogonaler Endo-
Für jede Matrix A ∈ Rm×n gibt es orthogonale Matrizen morphismus, also eine Abbildung, welche Längen und
U ∈ Rm×m und V ∈ Rn×n mit Winkel nicht ändert. Im Abschnitt 17.5 wurden derartige
Abbildungen als Isometrien bezeichnet. Drehungen und
A = U 0 D V bei D = diag (s1 , . . . , sr ) ∈ Rm×n Spiegelungen sind Beispiele dazu.
2. Die Abbildung ϕD : Rn → Rm mit der Darstellungs-
und s1 , . . . , sr > 0. Diese Darstellung heißt Sin-
matrix D = diag (s1 , . . . , sr ) lautet, in Koordinaten aus-
gulärwertzerlegung von A. Die Quadrate der in der
geschrieben:
Hauptdiagonale von D auftauchenden Singulärwerte
s1 , . . . , sr von A sind die von null verschiedenen Eigen- x1 = s 1 x1
werte der symmetrischen Matrix A0A. Die Vielfachheit ⎛ ⎞ ⎛ ⎞ . ..
x1 x1 .. .
des Eigenwerts λi gibt an, wie oft der Singulärwert si ⎜ .. ⎟ ⎜ . ⎟ x = sr xr
auftritt. ⎝ . ⎠ → ⎝ .. ⎠ mit xr = 0
(18.15)
xn xm .. r+1 ..
. .
xm  = 0.
Dass die Matrix A keinesfalls quadratisch zu sein braucht,
soll das folgende Schema der Singulärwertzerlegung illus-
Diese Abbildung heißt Skalierung oder axiale Streckung,
trieren:
denn es werden die Koordinaten lediglich proportional
n verändert. Einzelne Proportionalitätsfaktoren dürfen auch
n m n
null sein.
m = m · · n
3. Die Abbildung ϕU 0 : Rm → Rm , x → U 0 x ist wieder
A = U0 D V eine Isometrie, diesmal im Rm .
Die Abbildung 18.21 zeigt einen Fall m = n = 2. Die li-
Wir fügen noch zwei Bemerkungen an: neare Abbildung ϕA ist zusammengesetzt aus einer Drehung
ϕV , einer axialen Streckung, die den eingezeichneten Kreis
1. Der Satz von der Singulärwertzerlegung gilt sinngemäß in eine Ellipse verwandelt, und einer abschließenden Dre-
auch in unitären Räumen. Wir können somit sagen, dass jede hung ϕU 0 .
Matrix A aus Rm×n oder Cm×n orthogonal- bzw. unitär-
Auf Seite 744 wird die Singulärwertzerlegung bei dem so-
äquivalent ist zu einer Matrix D gleicher Größe, aber in Dia-
genannten Registrierungsproblem eingesetzt und auch beim
gonalgestalt diag (s1 , . . . , sr ) mit reellen, und zwar positi-
Entwurf von interpolierenden Raumbewegungen.
ven si .
2. Die Singulärwerte einer Matrix sind abgesehen von ihrer
Reihenfolge eindeutig. Hingegen sind die Matrizen U und V 18.5 Die Pseudoinverse einer
nur dann eindeutig, wenn alle Singulärwerte einfach sind. Bei
einem mehrfachen Eigenwert λi = si2 sind die orthonormier-
linearen Abbildung
ten Eigenvektoren innerhalb des Eigenraums Eig(A0A) λi frei
wählbar. Wir gehen aus von einer beliebigen linearen Abbildung
ϕ : V → V  zwischen endlichdimensionalen euklidischen
? Räumen. Bei dim V = n und dim V  = m können wir die
1. Wie lauten die Singulärwerte einer orthogonalen Matrix speziellen orthonormierten Basen H und H  mit der Darstel-
A ∈ Rn×n ? Geben Sie Singulärwertzerlegungen von A lungsmatrix H  M(ϕ)H = diag (s1 , . . . , sr ) ∈ Rm×n in der
an. Normalform (18.13) benutzen bzw. die ausführlichen Abbil-
dungsgleichungen aus (18.15). Wir erkennen als Kern bzw.
2. Angenommen, ϕ : R3 → R3 ist die orthogonale Projek- Bild von ϕ:
tion auf eine Ebene des R3 . Wie sieht die zugehörige
Diagonalmatrix D mit den Singulärwerten aus? ker(ϕ) = -hr+1 , . . . , hn . ⊂ V ,
Im(ϕ) = -h1 , . . . , hr . ⊂ V  .
744 18 Quadriken – vielseitig nutzbare Punktmengen

Hintergrund und Ausblick: Bestimmung einer optimalen orthogonalen Matrix


Angenommen, im R3 liegen Messdaten über zwei Positionen O und O eines starren Objekts O vor, etwa die Koordinaten-
vektoren pi und pi , i = 1, . . . , n, der jeweils zwei Positionen desselben Objektpunkts p i . Gesucht ist diejenige Bewegung,
welche die eine Position in die andere überführt. Diese Bewegung wird – abgesehen von der Verschiebung des Ursprungs
– (vergleiche Abschnitt 7.5) – durch eine orthogonale dreireihige Matrix B beschrieben, also durch 9 Einträge, welche 6
quadratische Bedingungen erfüllen müssen.
Um nun diejenige orthogonale Matrix zu berechnen, welche am besten auf die vorliegenden, mit gewissen Ungenauigkeiten
behafteten Daten passt, kann man in zwei Schritten vorgehen: Zuerst wird diejenige lineare Abbildung x → A x bestimmt,
welche den Daten pi  → p i am nächsten kommt. Dies führt auf ein überbestimmtes System von linearen Gleichungen
pi − A p i = 0 für die 9 nun unabhängigen Elemente von A. Wie man dieses löst, wird der folgende Abschnitt (siehe
Seite 751) zeigen. Im zweiten Schritt wird die orthogonale Matrix B berechnet, die im Sinne der Frobeniusnorm am nächsten
bei A liegt. Wir behandeln hier nur den zweiten Schritt.

Gegeben sei eine invertierbare Matrix A ∈ R3×3 . Gesucht Dieser Wert ist minimal, wenn die zu subtrahierende Li-
ist diejenige orthogonale Matrix B ∈ R3×3 , für welche nearkombination
B − A minimal ist. Dabei verwenden wir hier die Fro-
beniusnorm, die für die Matrix C = (c1 , c2 , c3 ), durch s1 r11 + s2 r22 + s3 r33
die Formel

mit fest vorgegebenen positiven Koeffizienten s1 , s2 und s3
C = c1 2 + c2 2 + c3 2
maximal ist. Die rii sind einzelne Koordinaten von Ein-
bestimmt ist. Diese Norm ändert sich nicht, wenn C links heitsvektoren und daher alle ≤ 1. Die minimale Norm
mit einer orthogonalen Matrix multipliziert wird, denn da- liegt also genau dann vor, wenn die Hauptdiagonalele-
bei bleibt die Länge jedes einzelnen Spaltenvektors ci von mente r11 = r22 = r33 = 1 sind. Somit bleibt r i = ei ,
C erhalten. Weil C2 auch gleich der Quadratsumme der also:
Längen aller Zeilenvektoren ist, lässt die Rechtsmultipli-
kation von C mit einer orthogonalen Matrix diese Norm U B V 0 = E3 und weiter B = U 0 V .
ebenfalls invariant.
Wir gehen aus von der Singulärwertzerlegung Man erhält demnach die zu A nächstgelegene orthogonale
Matrix B einfach dadurch, dass in der Singulärwertzerle-
A = U 0 D V mit D = diag (s1 , s2 , s3 )
gung von A alle Singulärwerte gleich 1 gesetzt werden,
mit s1 , s2 , s3 > 0, weil A invertierbar vorausgesetzt ist. also D durch E3 ersetzt wird.
Wir suchen eine Matrix B, für welche die Differenz eine
minimale Norm U 0 D V − B aufweist. Dabei sind die
Kommentar: Dies gilt auch noch, wenn einer der Ei-
Matrizen U , V und B orthogonal. Deshalb ist
genwerte von A0A verschwindet, also etwa bei s3 = 0,
U 0 D V − B = U (U 0 D V − B)V 0  weil r11 = r22 = 1 als dritten Spaltenvektor in der or-
= D − U B V 0 . thogonalen Matrix U B V 0 nur mehr r 3 = e3 zulässt.
Wir setzen an: Erst bei s2 = s3 = 0 ist das optimale B nicht mehr ein-
  deutig.
U B V 0 = rik = (r 1 , r 2 , r 3 )
mit r i  = 1, weil das Produkt orthogonaler Matrizen
Dies wird im Bereich der Bewegungsplanung angewandt,
wieder orthogonal ist.
z. B. bei der Steuerung von Robotern:
Wegen D = (s1 e1 , s2 e2 , s3 e3 ) mit (e1 , e2 , e3 ) als kano-
Zur Festlegung einer stetigen Bewegung zwischen zwei
nischer Basis folgt:
oder auch mehreren vorgegebenen Raumpositionen wer-
!
3
den zunächst einzelne Punktbahnen unabhängig vonein-
D − U BV 0 2 = (si ei − r i )2
ander interpoliert, etwa jene des Ursprungs und der Ein-
i=1
3 
!  heitspunkte eines mit dem Raumobjekt starr verbundenen
= si2 e2i − 2 si (ei · r i ) + r 2i Achsenkreuzes. Diese Bahnpunkte bestimmen zu jedem
i=1 Zeitpunkt ein zunächst noch affin verzerrtes Objekt, also
3 
!  – abgesehen von der Verschiebung – das Bild in einer li-
= si2 − 2 si rii + 1 nearen Abbildung x → A x. Indem nun A nach dem oben
i=1 beschriebenen Verfahren durch eine orthogonale Matrix
!
3 !
3
approximiert wird, werden die Zwischenlagen kongruent
= si2 − 2 si rii + 3.
zur Ausgangslage.
i=1 i=1
18.5 Die Pseudoinverse einer linearen Abbildung 745

Übersicht: Diagonalisieren von Matrizen


Wir unterscheiden folgende Äquivalenzrelationen zwischen gleichartigen Matrizen:
1) Zwei Matrizen A, B ∈ Km×n heißen äquivalent, wenn invertierbare Matrizen R ∈ Km×m und S ∈ Kn×n existieren mit
B = R −1 A S. Genau dann sind A und B Darstellungsmatrizen derselben linearen Abbildung ϕ : Kn → Km .
2) Zwei Matrizen A, B ∈ Kn×n heißen ähnlich, wenn eine invertierbare Matrix S ∈ Kn×n existiert mit B = S −1 A S.
Genau dann sind A und B Darstellungsmatrizen desselben Endomorphismus ϕ : Kn → Kn .
3) Zwei Matrizen A, B ∈ Kn×n heißen kongruent, wenn eine invertierbare Matrix T ∈ Kn×n existiert mit B = T 0 A T .
Genau dann sind A und B Darstellungsmatrizen derselben Bilinearform σ : Kn × Kn → K.
Wir stellen diejenigen Fälle zusammen, bei welchen innerhalb der Äquivalenzklassen Diagonalmatrizen existieren, insbesondere
Normalformen.
Die hier genannten invertierbaren Matrizen R, S, T sind jeweils Transformationsmatrizen zwischen verschiedenen Basen. In
euklidischen Vektorräumen, also bei K = R, können wir als jeweiligen Fall B die verschiedenen Äquivalenzrelationen noch
einschränken auf diejenigen mit ausschließlich orthogonalen Transformationsmatrizen R, S, T . Diese Resultate lassen sich
auch auf unitäre Vektorräume verallgemeinern.

1) Normalform äquivalenter Matrizen wenn A eine Basis aus Eigenvektoren besitzt. Die Ein-
Zu jeder Matrix A ∈ Km×n gibt es invertierbare Ma- träge λ1 , . . . , λn in der Diagonalmatrix D sind die Ei-
trizen R ∈ Km×m und S ∈ Kn×n derart, dass genwerte von A, also die Nullstellen des charakteristi-
' ( schen Polynoms χA (X) = det (A − X En ). Matrizen
Er 0
Nr = R −1 A S = A mit dieser Eigenschaft heißen diagonalisierbar. Für
0 0
⎛ ⎞ die Diagonalisierbarkeit von A ist notwendig und hin-
1 ... 0 0 ... 0
⎜ .. . . .. .. .. ⎟ reichend,
⎜ . . . . . ⎟
⎜ ⎟ dass χA (X) in Linearfaktoren zerfällt und
= ⎜ ⎟
0 ... 1
⎜ ⎟ ∈ Km×n für jeden Eigenwert λi von A die algebraische Viel-
⎜ 0 ... 0 ⎟
⎜ .. .. .. .. ⎟
⎝ . . . . ⎠ fachheit ki , also die Vielfachheit als Nullstelle von
0 ... 0 0 ... 0 χA (X), gleich der geometrischen Vielfachheit von
bei r = rg A. Diese Normalform Nr ist durch elemen- λi ist. Letztere ist definiert als Dimension des Eigen-
tare Zeilenumformungen und Spaltenvertauschungen raums EigA (λi ), also der Lösungsmenge des homo-
zu erreichen. genen linearen Gleichungssystems (A−λi En ) x = 0.
D ist ein Spezialfall der Jordan-Normalform (siehe Ab-
1B) Singulärwertzerlegung
schnitt 14.6); alle Jordan-Kästchen sind 1×1-Matrizen.
Für jede Matrix A ∈ Rm×n gibt es orthogonale Matri-
zen U ∈ Rm×m und V ∈ Rn×n , also mit U −1 = U 0 3) Kongruente symmetrische Matrizen
und V −1 = V 0 , derart dass Ist A ∈ Rn×n symmetrisch, also A0 = A, oder
A ∈ Cn×n hermitesch, also A0 = A, so gibt es stets
A = U −1 D r V bei
⎛ ⎞
invertierbare Matrizen T ∈ Rn×n bzw. S ∈ Cn×n und
s.1 . . . 0.
.. .
0. . . . 0. eine zu A kongruente Diagonalmatrix
⎜ .. .. .. ⎟
⎜ . . ⎟ 0
⎜ ⎟ D = T 0A⎛T bzw. D =

S AS
Dr = ⎜ .. ⎟
0 . . . sr
⎜ .. ⎟ ∈ Rm×n λ1 . . . 0
⎜ 0. . . . 0. . . ⎟
bei D = ⎜
⎜ ⎟ . .. .. ⎟
⎝ .. .. ⎠ ⎝ .. . . ⎠
0 ... 0 0 ... 0 0 . . . λn
und s1 , . . . , sr > 0. Die Quadrate der in der Hauptdia- Die Einträge λ1 , . . . , λn in dieser durch gekoppelte
gonalen von D r angeführten Singulärwerte s1 , . . . , sr Zeilen- und Spaltenumformungen erreichbaren Diago-
von A sind die von null verschiedenen Eigenwerte der nalmatrix D sind nicht eindeutig, wohl aber die An-
symmetrischen Matrix A0A. zahlen p, q der positiven bzw. negativen Werte mit
Dasselbe gilt allgemeiner bei A ∈ Cm×n mit uni- p + q = rg A gemäß dem Trägheitssatz.
0
tären Matrizen U und V , also bei U −1 = U und 3B) Orthogonales Diagonalisieren
0 Ist A ∈ Rn×n symmetrisch oder A ∈ Cn×n hermitesch,
V −1 = V . In diesem Fall sind s12 , . . . , sr2 Eigenwerte
0 so sind alle Eigenwerte λ1 , . . . , λn reell, und es gibt
der hermiteschen Matrix A A.
eine orthonormierte Basis von Eigenvektoren. Zu je-
2) Diagonalisieren von Endomorphismen dem derartigen A gibt es eine orthogonale bzw. unitäre
Zu einer quadratischen Matrix A ∈ Kn×n gibt es nur 0
Matrix S, also mit S −1 = S 0 bzw. S −1 = S , derart
dann eine invertierbare Matrix S ∈ Kn×n mit
⎛⎞ dass
λ1 . . . 0 D = diag (λ1 , . . . , λn ) = S −1 A S.
D = S −1 A S = ⎜
. .. . ⎟
⎝ .. . .. ⎠, Darauf beruht die Hauptachsentransformation quadra-
0 . . . λn tischer oder hermitescher Formen.
746 18 Quadriken – vielseitig nutzbare Punktmengen

V V
b2 x

ϕ(b2 )

0
b1
A = U 0D V ine
ar
ϕ(x)
ϕ : x → A x 0
r −→ e A
A lgeb lge ϕ(b1 )
br
re
inea
a
L Drehung ↓ ϕV Drehung ↑ ϕU 0

ϕD
−→
inear
Lin Skalierung
e Alg
ebra
ear
eA
lge
b
Abbildung 18.21 Die geometrische Deutung der Singulärwertzerlegung von A : Die lineare Abbildung ϕ : R2 → R2 , x → A x ist zusammensetzbar aus zwei
Drehungen und einer Skalierung.

Die jeweiligen Orthogonalräume sind In diesem Produkt von linearen Abbildungen ist ν die Or-
thogonalprojektion von V auf den r-dimensionalen Unter-
ker(ϕ)⊥ = -h1 , . . . , hr . ⊂ V , raum ker(ϕ)⊥ (Abb. 18.22). Hingegen ist β eine Bijektion,
Im(ϕ)⊥ = -hr+1 , . . . , hm . ⊂ V  . und zwar eine Skalierung. Und schließlich ist τ eine Ein-
bettungsabbildung: Vektoren aus dem r-dimensionalen Bild
Im(ϕ) werden als Vektoren des m-dimensionalen Zielraums
Im(ϕ)⊥ V  aufgefasst; die r Koordinaten werden durch Nullen zu m
V
V ker(ϕ) y Koordinaten aufgefüllt.
x
ν
ν
ϕ(x)
Gibt es keine Inverse zu einer linearen
0
Abbildung, so doch eine Pseudoinverse
0
ker(ϕ ) ⊥ ϕ + (y  )
)

−→

Ist die lineare Abbildung ϕ nicht bijektiv, also r < n oder


Im

β
r < m, so ist ϕ nicht invertierbar. Die Menge ϕ −1 (x  ) der
Abbildung 18.22 Die lineare Abbildung ϕ ist aus einer Orthogonalprojektion ν, Urbilder von x  ∈ V  ist nur bei x  ∈ Im(ϕ) nichtleer und
der Bijektion β und der Einbettung τ  in V  zusammensetzbar, die Pseudoinverse dann gleich der Faser β −1 (x  ) + ker(ϕ). Mithilfe der obigen
ϕ + aus der Orthogonalprojektion ν  im Zielraum, der Inversen β −1 und der
Zerlegung ϕ = τ  ◦ β ◦ ν mit dem bijektiven Mittelteil β
Einbettung in V .
bietet sich aber die Möglichkeit einer Ersatz-Inversen von ϕ
Die Verwendung von H -Koordinaten in V und H  - an.
Koordinaten in V  macht deutlich, dass ϕ wie folgt zusam- Wir setzen die Orthogonalprojektion ν  von V  auf Im(ϕ)
mensetzbar ist: zusammen mit β −1 und einer Einbettungsabbildung in V
(Abb. 18.22), also ausführlich
ν β τ
V = Rn → ker(ϕ)⊥ → Im(ϕ) → V  = Rm
⎛ ⎞ ⎛ ⎞ ν β −1 τ
x1 s1 x1 V  = Rm → Im(ϕ) → ker(ϕ)⊥ → V = Rn
⎜ .. ⎟ ⎜ .. ⎟ ⎛ ⎞ ⎛ ⎞
⎛ ⎞ ⎛ ⎞ y1 y1 /s1
⎜ . ⎟ ⎜ . ⎟
⎜ ⎟ x1 s1 x1 ⎜ ⎟ ⎜ .
⎜ .

⎟ ⎛ ⎞ ⎛ ⎞ ⎜ .
⎜ .


⎜ xr ⎟ ν ⎜ . ⎟ β ⎜ . ⎟ τ ⎜ sr xr ⎟ ⎜ . ⎟ y1 y1 /s1 ⎜ . ⎟
⎜ ⎟ → ⎝ . ⎠ → ⎝ . ⎠ → ⎜ ⎟. ⎜  ⎟ ν ⎜ . ⎟ β −1 ⎜ ⎜  ⎟
⎜ ⎟ ⎜ ⎟ ⎜ yr ⎟ . ⎟ τ ⎜ yr /sr ⎟
⎜ xr+1 ⎟
. .
⎜ 0 ⎟ ⎜ y
⎜ r+1


→ ⎜ . ⎟ →
⎝ . ⎠

⎝ . ⎟
. ⎠
→ ⎜ 0

⎟.

⎜ .. ⎟ xr sr xr ⎜ .. ⎟ ⎜ ⎟
yr  ⎜ ⎟
⎝ . ⎠ ⎝ . ⎠ ⎜ .
⎝ .


yr /sr ⎜ .
⎝ ..


.
xn 0 ym 0
18.5 Die Pseudoinverse einer linearen Abbildung 747

Wir nennen ist die orthogonale Projektion von V auf den r-dimensionalen
Unterraum ker(ϕ)⊥ . Die Darstellungsmatrix
ϕ + = τ ◦ β −1 ◦ ν  : V  = Rm → V = Rn
H M(ν)H = diag (1, . . . , 1) ∈ Rn×n

nach E. H. Moore (1862–1932) und R. Penrose (geb. 1931) r-mal
die Moore-Penrose pseudoinverse Abbildung oder kurz die ist als Diagonalmatrix symmetrisch, und diese Eigenschaft
Pseudoinverse von ϕ. bleibt bei Wechsel zwischen orthonormierten Basen erhalten.
Wir können die bisherige, auf der Singulärwertzerlegung von Daher ist ν = ϕ + ◦ ϕ selbstadjungiert (siehe Seite 692).
ϕ beruhende Festlegung der Pseudoinversen noch etwas um- Analog ist der Endomorphismus
formulieren. Es sei A = B  M(ϕ)B die Darstellungsmatrix ⎛ ⎞ ⎛ ⎞
von ϕ für beliebige orthonormierte Basen B von V und B  y1 y1
von V  . Dann ist ⎜ .. ⎟ ⎜ .. ⎟
⎜ . ⎟ ⎜ . ⎟
⎜ ⎟ ⎜ ⎟
⎜ yr ⎟ ⎜ yr ⎟
A = (H  T B  )0 D H T B mit D = diag (s1 , . . . , sr ) , ν = ϕ ◦ ϕ+ : V  → V , ⎜
⎜ 
⎟ → ⎜
⎟ ⎜


⎜ yr+1 ⎟ ⎜ 0 ⎟
⎜ .. ⎟ ⎜ .. ⎟
⎝ . ⎠ ⎝ . ⎠
wenn wir die Orthogonalität der Transformationsmatrix
H  TB ∈ R
m×m gleich berücksichtigen. Die Darstellungs- ym 0
matrix der Pseudoinversen B M(ϕ + )B  , die pseudoinverse mit der symmetrischen Darstellungsmatrix H  M(ν  )H  =
Matrix A+ von A, lautet dann: diag (1, . . . , 1) ∈ Rm×m gleich der orthogonalen Projektion
+)  auf Im(ϕ) und selbstadjungiert.
B M(ϕ B = (H T B )0 D + H  T B  mit
D+ = H M(ϕ
+) 
H = diag (s1−1 , . . . , sr−1 ) . Wegen ν(x) ∈ x + ker(ϕ) (Abb. 18.22) haben x und ν(x)
dasselbe Bild unter ϕ. Somit gilt:
Nun setzen wir noch U = H  T B  und V = H T B .
ϕ ◦ (ϕ + ◦ ϕ) = ϕ ◦ ν = ϕ .

Berechnung der pseudoinversen Matrix aus der Mit einer analogen Begründung folgt:
Singulärwertzerlegung ϕ + ◦ (ϕ ◦ ϕ + ) = ϕ + ◦ ν  = ϕ + . 

Hat A die Singulärwertzerlegung A = U 0D V


mit
D = diag (s1 , . . . , sr ) ∈ Rm×n , so ist A+ = V 0 D + U Kommentar: Jede orthogonale Projektion ν in einem
mit D + = diag (s1−1 , . . . , sr−1 ) ∈ Rn×m . n-dimensionalen euklidischen Vektorraum V ist selbstadjun-
giert, sofern sie so wie vorhin als Endomorphismus, also als
Auf diese Weise wird in dem Zahlenbeispiel auf Seite 748 Abbildung V → V gesehen wird. Dies folgt auch aus der
die Pseudoinverse berechnet. Tatsache, dass die Darstellungsmatrix analog zu jener im An-
schauungsraum (Seite 256) als Summe dyadischer Quadrate
Ist die lineare Abbildung ϕ bijektiv, also m = n = r, so von Vektoren einer orthonormierten Basis des Bildraums ge-
fällt die Pseudoinverse mit der gewöhnlichen Inversen zu- schrieben werden kann.
sammen, denn dann ist ϕ = β (Abb. 18.22). Ansonsten teilt
die Pseudoinverse mit der Inversen die folgende Eigenschaf- Wird die orthogonale Projektion ν jedoch als Abbildung
ten: V → Im(ν) aufgefasst mit einem nunmehr r-dimensionalen
Zielraum bei r = rg ν < n, so ist dies kein Endomorphismus
Folgerung mehr und damit natürlich auch nicht selbstadjungiert.
Ist ϕ + die Pseudoinverse zu ϕ, so gilt: Die obige Folgerung lässt sich aber auch umkehren.
ϕ ◦ ϕ + ◦ ϕ = ϕ und ϕ + ◦ ϕ ◦ ϕ + = ϕ + . (18.16) Lemma
Es sei ϕ : V → V  eine lineare Abbildung zwischen
Ferner sind die Abbildungen ϕ + ◦ ϕ : V → V und ϕ ◦ euklidischen Räumen. Erfüllt die Abbildung ϕ + : V  → V
ϕ + : V  → V  selbstadjungierte Endomorphismen. die Gleichungen (18.16) und sind ϕ + ◦ ϕ und ϕ ◦ ϕ +
selbstadjungierte Endomorphismen, so ist ϕ + die Moore-
Beweis: Das Produkt Penrose-Pseudoinverse von ϕ.
⎛ ⎞ ⎛ ⎞
x1 x1
Beweis: Liegt der Vektor u im Kern einer linearen Abbil-
⎜ .. ⎟ ⎜ .. ⎟
⎜ . ⎟ ⎜ . ⎟ dung ϕ1 , so liegt er auch im Kern jeder Zusammensetzung
⎜ ⎟ ⎜ ⎟
⎜ xr ⎟ ⎜ xr ⎟ ϕ2 ◦ ϕ1 . Deshalb ist
ν = ϕ+ ◦ ϕ : V → V , ⎜

⎟ → ⎜
⎟ ⎜


⎜ xr+1 ⎟ ⎜ 0 ⎟ (18.16)

⎝ .. ⎟


⎝ .. ⎟
⎠ ker(ϕ) ⊂ ker(ϕ + ◦ ϕ) ⊂ ker(ϕ ◦ ϕ + ◦ ϕ) = ker(ϕ) .
. .
xn 0 Also gilt überall die Gleichheit.
748 18 Quadriken – vielseitig nutzbare Punktmengen

Beispiel: Berechnung einer Pseudoinversen


Gegeben ist die lineare Abbildung
⎛ ⎞ ⎛ ⎞
x1 '  ( ' ( x1
⎝ x2 ⎠ → x 1 1 0 ⎝ x2 ⎠ .
ϕ : R 3 → R2 , 1 =
x2 2 2 0
x3 x3
Wir lautet die Pseudoinverse ϕ + ?

Problemanalyse und Strategie: Wir bestimmen den Kern und den Bildraum von ϕ und die zugehörigen Ort

Das könnte Ihnen auch gefallen