Beruflich Dokumente
Kultur Dokumente
Helga Baum
Grundkurs Analysis
5. Oktober 2012
Vorwort
Dieses Skript dient als begleitendes Lehrmaterial für den 3-semestrigen Grundkurs Analy-
sis im Pflichtbereich des Bachelorstudienganges ”Mathematik” für die Studienanfänger des
Wintersemesters 2011/12. Es soll Ihnen nicht den Gang in die Bibliothek ersetzen. Gehen
Sie bei Gelegenheit dort hin und blättern Sie in den vielen dort stehenden Lehrbüchern
zum Grundkurs Analysis. Sie werden dann selbst feststellen, welches dieser Bücher Ih-
nen am besten gefällt und Ihnen am meisten hilft. Dieses Skript enthält den Stoff des
Grundkurses Analysis, so wie ich ihn in den nächsten drei Semestern lesen werde und soll
Ihnen die Nacharbeit der Vorlesung erleichtern. Es soll Sie auf keinen Fall davon abhalten,
während der Vorlesung mitzuschreiben. Erfahrungsgemäß ist das Mitschreiben einer Vor-
lesung (auch dann, wenn man ab einer bestimmten Stelle nicht mehr alles oder nichts mehr
versteht) etwas, das vielen von Ihnen am Anfang schwer fällt. Es ist aber eine Fähigkeit,
die Sie für Ihr Studium benötigen und lernen müssen.
Mathematik lernt man nur, wenn man sich selbst mit ihr beschäftigt. Es reicht also nicht,
sich in die Vorlesung zu setzen. Die wenigsten von Ihnen werden nach den 90 Minuten
rausgehen und alles verstanden haben. Das ist völlig normal. Arbeiten Sie die Vorlesung
zu Hause an Hand Ihrer Mitschriften nach und versuchen Sie, die nicht verstandenen
Stellen zu klären. Wenn Ihnen das allein nicht gelingt, nutzen Sie die Übung, eines der
Tutorien und die Sprechstunden dazu. Auch die Diskussion mit Ihren Kommilitonen über
den Vorlesungsstoff kann hilfreich sein. Den sicheren Umgang mit dem gelernten Stoff
erwerben Sie nur durch das Lösen der Übungsaufgaben, die Sie jede Woche bekommen.
Die Aufgaben sind nicht nur ein Selbsttest oder ein lästiges Übel, um den Übungsschein
zu bekommen – sie sind das entscheidende Mittel, mit dem Sie zunehmend Routine im
Umgang mit Mathematik bekommen.
Möchte man verstehen, ’was in der Welt vorgeht’ und dies genauer analysieren, so stellt
man schnell fest, daß man dazu die funktionalen Abhängigkeiten von Ursachen und Wir-
kungen geeignet modellieren muß. Die Analysis beschäftigt sich mit der Frage, wie man
das Änderungsverhalten von Funktionen verstehen, beschreiben und beherrschen kann. Sie
stellt Begriffe bereit, mit denen man die Änderung einer Funktion ’im Kleinen’ (also bei
geringen Änderungen ihrer unabhängigen Variablen) erfassen kann und untersucht, wann
VIII Vorwort
und auf welche Weise man aus diesen Eigenschaften ’im Kleinen’ globale Eigenschaften
der Funktion bestimmen kann. Das wichtigste und unverzichtbare Hilfsmittel für solche
Untersuchungen ist der Begriff des Grenzwertes. Man muß exakt formulieren können, was
es in dem jeweils benutzten Modell bedeutet, daß man sich an einen Punkt ’annähert’.
Ich beginne deshalb den Grundkurs Analysis mit dem Studium einer Klasse von Räumen,
in denen man einen solchen Grenzwertbegriff formulieren kann, mit den metrischen Räum-
en. Anschließend werden verschiedene Klassen von Funktionen zwischen allgemeinen und
speziellen metrischen Räumen behandelt, insbesondere die stetigen, die differenzierba-
ren und die integrierbaren Funktionen. Als Anwendung der grundlegenden Eigenschaften
verschiedener Funktionenklassen werden wir die Lösungstheorie gewöhnlicher Differenti-
algleichungen, die Maßtheorie und die Analysis auf Untermannigfaltigkeiten behandeln.
Im Einzelnen werden wir in den drei Semestern der Vorlesung folgende Schwerpunkte
behandeln:
und viele andere mehr . . .. Sie finden in diesen Büchern viele interessante Beispiele und An-
wendungen, historische Kommentare und weiterführende Kapitel, die wir aus Zeitgründen
in der Vorlesung nicht behandeln können. Es lohnt sich deshalb, in diese Bücher hinein-
zuschauen.
∀ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . für alle
∃ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . es existiert
∃!. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .es existiert genau ein
⇔ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . genau dann, wenn
⇒ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . daraus folgt
:= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ist definiert als
:⇔ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ist definiert durch
x ∈ M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x ist Element der Menge M
∅. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .leere Menge (Menge, die kein Element enthält)
A ⊂ M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A ist Teilmenge von M , d.h. x ∈ A ⇒ x ∈ M
OBdA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ohne Beschränkung der Allgemeinheit
2 Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.1 Definition und Beispiele metrischer Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2 Das Innere, der Abschluß und der Rand einer Menge . . . . . . . . . . . . . . . . . . . 35
2.3 Offene und abgeschlossene Mengen in metrischen Räumen . . . . . . . . . . . . . . . 41
2.4 Folgen in metrischen Räumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.4.1 Allgemeine Eigenschaften konvergenter Folgen . . . . . . . . . . . . . . . . . . . . 46
2.4.2 Spezielle Eigenschaften von konvergenten Folgen im Vektorraum Ck
bzw. Rk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.4.3 Spezielle Eigenschaften konvergenter Folgen in R . . . . . . . . . . . . . . . . . 53
2.5 Vollständige metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.6 Kompakte und folgenkompakte Teilmengen metrischer Räume . . . . . . . . . . . 65
2.7 Zusammenhängende Teilmengen und Zusammenhangskomponenten eines
metrischen Raumes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.8 Banachräume und Hilberträume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3 Reihen in Banachräumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.1 Konvergente und divergente Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.2 Konvergenzkriterien für Reihen in Banachräumen . . . . . . . . . . . . . . . . . . . . . . 80
3.3 Das Cauchy–Produkt von Reihen komplexer Zahlen . . . . . . . . . . . . . . . . . . . . 89
3.4 Umordnung von Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
XII Inhaltsverzeichnis
Wir gehen davon aus, daß der Aufbau der Zahlbereiche bis zu den reellen Zahlen be-
kannt ist. Man findet dies zum Beispiel in dem Buch von J. Kramer: Zahlen für Einsteiger
(Vieweg-Verlag, 2006).
Wir benutzen in dieser Vorlesung die folgenden Bezeichnungen für die Zahlbereiche:
N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller natürlichen Zahlen: 1, 2, 3, . . .
N0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . N ∪ {0}
Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller ganzen Zahlen: 0, ±1, ±2, . . .
Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller rationalen Zahlen: { m n | m ∈ Z, n ∈ N}
+
Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der positiven rationalen Zahlen: {q ∈ Q | q > 0}
R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der reellen Zahlen
R\Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der irrationalen Zahlen
C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der komplexen Zahlen
Offensichtlich gilt: N ⊂ Z ⊂ Q ⊂ R.
Die Zahlbereiche werden bekanntlich aus folgendem Grund erweitert:
N ⊂ Z: Die Subtraktion ist durch die Erweiterung immer ausführbar. Seien a, b ∈ N. Die
Gleichung x + a = b ist in Z immer lösbar, aber nicht in N.
Q ⊂ R: Die Erweiterung ist nötig, damit Wurzeln positiver Zahlen existieren. Sei q ∈ Q+ ,
n ∈ N. Die Gleichung xn = q ist in R immer lösbar, aber nicht in Q.
Im Abschnitt 1.1. werden wir zunächst ein wichtiges und oft benutztes Beweisprinzip wie-
derholen und an Beispielen demonstrieren: das der vollständigen Induktion. Im Abschnitt
1.2. fassen wir die grundlegenden, die Menge der reellen Zahlen charakterisierenden Ei-
genschaften (ihre Axiome) zusammen und leiten wesentliche, aus den Axiomen folgende
Eigenschaften her. Der Abschnitt 1.3. enthält die Definition und die grundlegenden Eigen-
schaften der komplexen Zahlen. In Abschnitt 1.4. betrachten wir die Vektorräume Rn und
Cn und definieren den Abstand von Vektoren in diesen Vektorräumen.
2 1 Reelle und komplexe Zahlen
Die natürlichen Zahlen werden durch auf Peano zurückgehende Axiome (die Peano-
Axiome) eingeführt. Aus diesen Axiomen folgt die Induktionseigenschaft für die natürli-
chen Zahlen, die folgendes besagt:
Ist M ⊂ N0 eine Teilmenge der (um Null ergänzten) natürlichen Zahlen, die die folgenden
beiden Eigenschaften erfüllt:
(1) n0 ∈ M ,
(2) Ist n ∈ M für eine Zahl n ≥ n0 , so ist auch (n + 1) ∈ M .
Dann ist die Aussage A(n) für alle Zahlen n ∈ N0 mit n ≥ n0 richtig.
Um einzusehen, dass das Prinzip der vollständigen Induktion aus der Induktionseigenschaft
der natürlichen Zahlen folgt, setzen wir
Dann gilt:
• n0 ∈ M (nach Induktionsanfang).
• Ist n ∈ M für eine Zahl n ≥ n0 , so ist (n + 1) ∈ M (nach Induktionsschritt).
Aus der Induktionseigenschaft der natürlichen Zahlen folgt nun, dass A(n) für alle n ≥ n0
richtig ist.
Eine typisches Anwendungsfeld für das Beweisprinzip der vollständigen Induktion sind
Summenformeln. Wir demonstrieren dies an einem Beispiel:
Als weitere Anwendungen beweisen wir einige Eigenschaften der Fakultät einer natürlichen
Zahl und der Binimialkoeffizienten.
Satz 1.2 Die Anzahl an aller Anordnungen von n verschiedenen Objekten ist n!.
Zj sei die Anzahl der Elemente in Kj . Folglich ist Zj gleich der Anzahl der Anordnungen
der n Objekte O1 , . . . , Oj−1 , Oj+1 , . . . , On+1 . Nach Induktionsvoraussetzung ist aber die
Anzahl der Anordnungen von n Objekten gleich an = n! . Also gilt
n+1
X n+1
X n+1
X
an+1 = Zj = an = n! = (n + 1) · n! = (n + 1)! .
j=1 j=1 j=1
⊓
⊔
4 1 Reelle und komplexe Zahlen
n n · (n − 1) · . . . · (n − (k − 1)) n · (n − 1) · . . . · (n − (k − 1)) · (n − k) · . . . · 2 · 1
= =
k k! k! · (n − k)!
n! n
= = .
k! · (n − k)! n−k
x · (x − 1) · . . . · ((x + 1) − k) (x + 1)
= ·
k! k+1
(x + 1) · ((x + 1) − 1) · ((x + 1) − 2) · . . . · ((x + 1) − k)
=
(k + 1)!
x+1
= .
k+1
⊓
⊔
Satz 1.4 Seien k und n natürliche Zahlen und sei 1 ≤ k ≤ n. Es bezeichne cnk die An-
zahl aller k–elementigen Teilmengen einer n–elementigen Menge. Dann gilt cnk = nk .
Insbesondere ist nk ∈ N .
Beweis. Der Beweis von Satz 1.4 erfolgt durch vollständige Induktion über n.
Induktionsanfang: Es gilt c11 = 1 = 11 , denn aus einer einelementigen Menge kann nur ein
Element ausgewählt werden.
1.2 Die reellen Zahlen 5
Induktionsschritt:
Induktionsvoraussetzung: Es gelte cnk = nk für alle k ∈ {1, . . . , n}.
Induktionsbehauptung: cn+1
k = n+1k für alle k ∈ {1, . . . , n + 1}.
Induktionsbeweis: Bei der Auswahl einer einelementigen Teilmenge aus einer (n + 1)–
elementigen Menge hat man (n + 1) verschiedene Möglichkeiten. Es gilt somit:
n+1 n+1
c1 = n + 1 = .
1
Betrachtet man die Anzahl aller (n+1)–elementigen Teilmengen einer (n+1)–elementigen
Menge, so gilt offensichtlich
n+1 n+1
cn+1 = 1 = .
n+1
Es genügt also, die Behauptung für k ∈ {2, · · · , n} zu zeigen. Betrachten wir eine Menge
M = {E1 , · · · , En+1 } mit (n+1) Elementen. Dann zerfallen die k–elementigen Teilmengen
von M in zwei disjunkte Klassen:
K0 : alle Teilmengen, die En+1 nicht enthalten, und
K1 : alle Teilmengen, die En+1 enthalten.
Die Anzahl der k–elementigen Teilmengen in Klasse K0 ist gleich der Anzahl der k–
elementigen Teilmengen von {E1 , · · · , En }, also entsprechend der Induktionsvorausset-
zung gleich cnk = nk . Die Anzahl der k–elementigen Teilmengen in Klasse K1 ist gleich
der Anzahl der (k − 1)–elementigen Teilmengen von {E1 , · · · , En }, also nach Induktions-
n
voraussetzung gleich cnk−1 = k−1 . Folglich gilt nach Satz 1.3
n+1 n n n+1
ck = + = .
k k−1 k
⊓
⊔
Im Folgenden setzen wir voraus, dass die reellen Zahlen existieren und dass sie dem Leser
bereits bekannt sind. Das Ziel dieses Abschnittes besteht darin, noch einmal die grundle-
genden, die reellen Zahlen eindeutig charakterisierenden Eigenschaften (ihre sogenannten
“Axiome”) zusammenzustellen und daraus wichtige Rechenregeln abzuleiten. Diese grund-
legenden Eigenschaften sind
• die Körperaxiome,
• die Anordnungsaxiome und
• das Vollständigkeitsaxiom.
Wir werden in dieser Vorlesung nicht darauf eingehen, ob überhaupt eine Menge existiert,
die die obigen drei Axiome erfüllt, und wie und woraus man sie ggf. konstruieren kann. Wir
werden auch nicht untersuchen, ob eine Menge, die die obigen Axiome erfüllt, eindeutig
bestimmt ist. Für diese Fragen verweisen wir auf eines der Bücher
6 1 Reelle und komplexe Zahlen
Addition:
Multiplikation:
K9: (x + y) · z = x · z + y · z ∀ x, y, z ∈ R (Distributivgesetz).
Aus diesen neun grundlegenden Eigenschaften lassen sich die weiteren Rechenregeln für
die reellen Zahlen ableiten. Beweisen Sie zur Übung, dass z.B. die folgenden Eigenschaften
allein aus K1 - K9 folgen:
• Die neutralen Elemente der Addition und der Multiplikation sind eindeutig bestimmt.
• Das Negative und das Inverse von x ∈ R sind eindeutig bestimmt.
• 0 · x = 0 für jedes x ∈ R.
• Die Gleichung a+x = b, a, b ∈ R, hat genau eine Lösung, nämlich x = b+(−a) =: b−a.
(b − a heißt Differenz von b und a).
• Die Gleichung a · x = b, a, b ∈ R, a 6= 0, hat genau eine Lösung, nämlich x = b · a1 =: ab .
( ab heißt der Quotient von b und a).
• Für reelle Zahlen a, b, c, d mit b 6= 0 und d 6= 0 gilt:
a c a·c a c a·d+c·b
· = und + = .
b d b·d b d b·d
1.2 Die reellen Zahlen 7
Definition 1.3. Eine Menge K mit mindestens zwei Elementen, auf der zwei Operationen
+ und ·
+ : K × K −→ K · : K × K −→ K
(x, y) 7−→ x + y (x, y) 7−→ x · y
Wir schreiben den Körper K mit seinen beiden Operationen + und · oft in der Form
[K, +, ·]. Der Begriff des Körpers ist ein zentraler algebraischer Begriff und wird in der
Algebra-Vorlesung ausführlich behandelt.
[ Q, +, · ] ist ebenfalls ein Körper, während [ Z, +, · ] kein Körper ist (zum Beispiel besitzt
2 kein multiplikativ inverses Element in Z). Ein Körper mit zwei Elementen ist durch
K := {0, 1} und die Operationen 0 + 0 := 0, 0 + 1 = 1 + 0 := 1, 1 + 1 := 0, 0 · 0 := 0,
0 · 1 = 1 · 0 := 0 und 1 · 1 := 1 gegeben.
Die Rechenregeln, die man aus den Eigenschaften K1-K9 herleiten kann, gelten in jedem
Körper. Man braucht sie nur einmal zu beweisen. Dies ist der Vorteil dieses abstrakten
Konzeptes.
Bezeichnungen: Für n reelle Zahlen x1 , · · · , xn werden die Summe und das Produkt
folgendermaßen abgekürzt:
P
n
xi := x1 + x2 + . . . + xn
Klammern sind wegen K2 und K6
i=1
Q
n
nicht nötig.
xi := x1 · x2 · . . . · xn
i=1
A + B := {a + b | a ∈ A, b ∈ B} ⊂ R
A · B := {a · b | a ∈ A, b ∈ B} ⊂ R
−A := {−a | a ∈ A} ⊂ R.
Außer [ R, +, · ] gibt es noch viele andere Körper. Die Körperaxiome K1-K9 reichen also
nicht aus, um R eindeutig zu beschreiben. Auf dem Körper der reellen Zahlen kann man
im Gegensatz zu einigen anderen Körpern zusätzlich eine Anordnung einführen.
1
Wobei in K1 - K9 natürlich R durch K zu ersetzen ist, und in K3 und K7 die Existenz eines solchen
neutralen Elementes gefordert wird.
8 1 Reelle und komplexe Zahlen
Anordnungseigenschaften von R
Der Körper der reellen Zahlen [ R, +, · ] enthält eine Teilmenge von ”positiven” reellen
Zahlen R+ mit folgenden Eigenschaften:
A1: Für jede reelle Zahl x gilt entweder x = 0 oder x ∈ R+ oder x ∈ −R+ ,
das heißt R ist die disjunkte Vereinigung
R = −R+ ∪˙ {0} ∪˙ R+ .
Bezeichnung:
• Gilt x ≤ y und x 6= y, so schreibt man auch x < y
(sprich: “x kleiner als y”).
• x ≥ y :⇐⇒ y ≤ x bzw. x > y :⇐⇒ y < x.
Mittels der Ordnungsrelation können wir Intervalle definieren:
Für a ≤ b, a, b ∈ R, sei
[a, ∞) := {x ∈ R | a ≤ x}
(a, ∞) := {x ∈ R | a < x}
(−∞, a) := {x ∈ R | x < a}
(−∞, a] := {x ∈ R | x ≤ a}
(−∞, ∞) := R.
Sei I eines der Intervalle [a, b], (a, b), [a, b), oder (a, b]. Dann heißt die Zahl L(I) := b − a
Länge des Intervalls I.
Definition 1.6. Unter dem Betrag einer reellen Zahl x ∈ R versteht man die Zahl
(
x falls x ≥ 0
|x| :=
−x falls x < 0.
Satz 1.5 Für den Betrag einer reellen Zahl gelten folgende Eigenschaften:
(1) |x| ≥ 0 ∀ x ∈ R, |x| = 0 ⇔ x = 0.
(2) |x · y| = |x| · |y| ∀ x, y ∈ R.
(3) |x + y| ≤ |x| + |y|. (Dreiecksungleichung)
(4) ||x| − |y|| ≤ |x + y|.
Beweis. (1) und (2) folgen unmittelbar aus der Definition des Betrages | · | .
Zum Beweis von (3) benutzen wir die Monotonieeigenschaften. Wegen x ≤ |x| und −x ≤
|x| bzw. y ≤ |y| und −y ≤ |y| folgt nach Addition dieser Gleichungen x + y ≤ |x| + |y|
und −(x + y) ≤ |x| + |y| und folglich |x + y| ≤ |x| + |y| .
Zum Beweis von (4) benutzen wir die Dreiecksungleichung und |x| = | − x|:
a<b ∀ a ∈ A, ∀ b ∈ B.
Die Definition eines Dedekindschen Schnittes ist in jedem angeordneten Körper möglich,
da eine Relation “<” definiert ist; zum Beispiel in [Q, +, · ].
Definition 1.8. Sei (A | B) ein Dedekindscher Schnitt von R. Eine Zahl s ∈ R heißt
Schnittzahl von (A | B), falls a ≤ s ≤ b für alle a ∈ A und b ∈ B.
Wegen R = A∪B˙ , ist s entweder das größte Element von A (falls s ∈ A) oder das kleinste
Element von B (falls s ∈ B).
Definition 1.9. Ein angeordneter Körper [ K, +, · ] mit der Eigenschaft (V), das heißt in
dem jeder Dedekindsche Schnitt eine Schnittzahl hat, heißt vollständig.
Zusammenfassung:
Die reellen Zahlen [R, +, · ] bilden einen vollständigen, ange-
ordneten Körper.
Wir beweisen nun einige Eigenschaften der reellen Zahlen, die aus der Vollständigkeits-
eigenschaft (V) folgen.
1.2 Die reellen Zahlen 11
Definition 1.10.
1. Eine Teilmenge A ⊂ R heißt von oben beschränkt, falls eine Zahl M ∈ R existiert, so
dass a ≤ M für alle a ∈ A gilt. Eine solche Zahl M heißt obere Schranke von A.
2. Eine Teilmenge A ⊂ R heißt von unten beschränkt, falls eine Zahl m ∈ R existiert, so
dass m ≤ a für alle a ∈ A gilt. Eine solche Zahl m heißt untere Schranke von A.
3. Eine Teilmenge A ⊂ R heißt beschränkt, falls sie sowohl von unten als auch von oben
beschränkt ist.
1. Eine Zahl M0 ∈ R heißt Supremum von A, falls sie die kleinste obere Schranke von A
ist, das heißt falls
a) a ≤ M0 ∀ a ∈ A ,
b) für jedes ε > 0 existiert ein a ∈ A, so dass M0 − ε < a .
2. Eine Zahl m0 ∈ R heißt Infimum von A, falls sie die größte untere Schranke von A
ist, das heißt falls
a) m0 ≤ a ∀a ∈ A ,
b) für jedes ε > 0 existiert ein a ∈ A, so dass a < m0 + ε .
Bezeichnung: Falls das Supremum bzw. das Infimum einer Menge A ⊂ R existiert, so
bezeichnen wir es mit
sup A := Supremum von A , inf A := Infimum von A.
Offensichtlich existiert höchstens ein Supremum und höchstens ein Infimum einer Menge
A ⊂ R. Aus der Vollständigkeitseigenschaft von R erhält man die folgende Aussage über
die Existenz von Supremum bzw. Infimum.
Satz 1.6 Jede nach oben beschränkte, nichtleere Menge A ⊂ R besitzt ein Supremum.
Jede nach unten beschränkte, nichtleere Menge A ⊂ R besitzt ein Infimum.
Beweis. (1) Sei A ⊂ R von oben beschränkt. Wir betrachten die Menge
X := {M ∈ R | a ≤ M ∀ a ∈ A}.
Also ist (Y | X) ein Dedekindscher Schnitt von R. Nach dem Vollständigkeitsaxiom (V)
von R existiert eine Schnittzahl M0 dieses Dedekindschen Schnittes, also eine Zahl M0 ∈ R
mit
y ≤ M0 ≤ x ∀ y ∈ Y, x ∈ X.
12 1 Reelle und komplexe Zahlen
Wir zeigen, dass die Schnittzahl M0 in X liegt. Wir führen diesen Beweis indirekt. Wir
nehmen an, dass M0 ∈ / X und führen dies zum Widerspruch. Ist M0 ∈ / X, so ist M0 das
größte Element von Y . Nach Definition von Y gibt es ein a0 ∈ A mit M0 < a0 . Dann ist
wegen der Monotonieeigenschaft von < aber auch
M0 + a 0 a0 a0
M0 < < + = a0
2 2 2
und folglich
M0 + a 0
∈ Y.
2
Dann kann M0 aber nicht das größte Element von Y sein, d.h. wir erhalten wir einen
Widerspruch. Unsere Annahme war demnach falsch. Folglich ist M0 ∈ X, also eine obere
Schranke von A. Als Schnittzahl von (Y | X) ist M0 das kleinste Element von X, also die
kleinste obere Schranke von A. Das zeigt, dass M0 = sup A.
Der Beweis der 2. Aussage des Satzes wird analog geführt. ⊓
⊔
Definition 1.12.
1. Sei A ⊂ R eine nach oben beschränkte Menge. Liegt das Supremum von A in A, so
nennt man es auch das Maximum von A und schreibt dafür max A.
2. Sei A ⊂ R eine nach unten beschränkte Menge. Liegt das Infimum von A in A, so
nennt man es auch das Minimum von A und schreibt dafür min A.
Beweis. Wir führen den Beweis indirekt. Angenommen N ist nach oben beschränkt. Dann
existiert nach Satz 1.6 das Supremum M0 = sup N. Es sei M := M0 − 12 . Da M0 die
kleinste obere Schranke ist, existiert ein m ∈ N, mit M0 − 21 < m. Folglich ist
1
M0 < m + < m + 1.
2
Da aber m + 1 ∈ N ist, kann M0 keine obere Schranke sein. Dies ergibt den Widerspruch.
Den Beweis für N ⊂ N führt man analog. ⊓
⊔
Folgerung 1.2
Beweis. Zu 1) Zur Zahl 1ε ∈ R existiert nach dem Archimedischen Axiom ein n ∈ N mit
1 1
ε < n. Folglich gilt n < ε. Zum Beweis der 2. Aussage setzen wir
N := {q n | n ∈ N}.
N ist eine unendliche Teilmenge von N. Den Beweis kann man dann analog zu 1) führen.
⊓
⊔
Folgerung 1.3 Sei A ⊂ Z eine nichtleere, nach oben (unten) beschränkte Menge ganzer
Zahlen. Dann besitzt A ein Maximum (Minimum).
Beweis. Sei A nach unten beschränkt und d = inf A. Nach dem Archimedischen Axiom
existiert ein n0 ∈ N mit |d| < n0 . Also gilt −n0 < d und somit 0 < d + n0 ≤ a + n0
für alle a ∈ A. Betrachten wir nun die Menge A0 := {a + n0 | a ∈ A} ⊂ N. Wir zeigen,
dass diese Menge ein kleinstes Element besitzt. Sei k ∈ A0 und bezeichne (A0 )k := {x ∈
A0 | x ≤ k}. Die Menge (A0 )k ist endlich und besitzt deshalb ein kleinstes Element m0
(siehe Übungsaufgaben). Dann ist m0 auch das kleinste Element von A0 und m0 − n0 das
kleinste Element von A . Folglich gilt m0 − n0 = min A.
Ist A von oben beschränkt, so ist max A = − min(−A). ⊓
⊔
A := {z ∈ Z | z > n · x}.
Wiederum nach dem Archimedischen Axiom ist A nicht leer und besitzt, da von unten
beschränkt, ein Minimum (Folgerung 1.3). Sei m0 = min A. Dann gilt m0 ∈ A und m0 −1 ∈
/
m0 m0 −1
A. Folglich ist n > x und n ≤ x. Wir erhalten somit
m0 m0 − 1 1
x< = + < x + (y − x) = y
n n n
m0
und folglich liegt die rationale Zahl q := n im Intervall (x, y). ⊓
⊔
Beweis.
1. Existenz: Sei In = [an , bn ]. Da In ⊂ Im für alle n ≥ m, folgt
am ≤ an ≤ bn ≤ bm . (∗)
A := {an | n ∈ N} ⊂ R.
A ist nach oben beschränkt, zum Beispiel durch b1 , hat also nach Satz 1.6 ein Supremum.
Sei x = sup A. Wir zeigen, dass x ∈ In für alle n ∈ N. Nach Definition ist an ≤ x. Es
bleibt zu zeigen, dass x ≤ bn für alle n ∈ N. Angenommen x > bm für ein m ∈ N. Da x
die kleinste obere Schranke von A ist, kann bm keine obere Schranke von A sein. Somit
existiert ein an ∈ A, so dass an > bm . Dies widerspricht aber der Schachtelungseigenschaft
(∗). Folglich war die Annahme falsch, das heißt x ≤ bn für alle n ∈ N und somit gilt
an ≤ x ≤ bn , also x ∈ In für alle n ∈ N.
2. Eindeutigkeit: Angenommen es gäbe zwei Zahlen x, y ∈ R mit x 6= y und x, y ∈ In
für alle n ∈ N. Sei ε = |x − y| > 0. Dann existiert ein Intervall In0 mit L(In0 ) < ε.
Da |x − y| > L(In0 ), können aber nicht beide Zahlen x, y in In0 liegen. Damit ist die
Eindeutigkeit von x gezeigt. ⊓
⊔
Die Implikation: 1. =⇒ 2. =⇒ 3. haben wir bewiesen. Die Umkehrung werden wir hier
nicht beweisen.
Wir beweisen mit Hilfe des Vollständigkeitsaxioms, dass die Menge der reellen Zahlen nicht
abzählbar ist. Dazu zunächst einige Definitionen.
Definition 1.15. Eine Menge A heißt abzählbar, wenn es eine bijektive Abbildung
f : N −→ A von der Menge der natürlichen Zahlen auf die Menge A gibt.
Die bijektive Abbildung f liefert uns eine Abzählvorschrift für A: Mit der Bezeichnung
an := f (n) ist nämlich
Eine Menge A heißt überabzählbar, wenn sie weder leer, noch endlich oder abzählbar ist.
Wir sagen, die Menge A ist höchstens abzählbar, wenn sie leer, endlich oder abzählbar ist.
Beispiele:
1. Die Menge der natürlichen Zahlen N und die Menge N0 sind abzählbar.
2. Die Menge der ganzen Zahlen Z ist abzählbar, denn
fZ : N −→ Z
2k 7−→ k
2k + 1 7−→ −k
m6
1 I
6
5 1 6 2 I
5 5
4 R
1 I 3 I
4 4
3 R
1 6 2 I 4 I
3 3 3
2 R R
1 I 3 I 5 I
2 2 2
1 - R - R -
1 2 3 4 5 6
-
1 2 3 4 5 n
16 1 Reelle und komplexe Zahlen
Die Gitterpunkte werden nun längs des im Gitter gezeichneten Streckenzuges nummeriert.
Dadurch erreicht man alle Punkte des konstruierten Gitters und erhält somit eine bijektive
Abbildung ϕ : N −→ Q+ .
Diese Abzählung beginnt offensichtlich mit:
1 1 3 2 1 1
1, 2, , , 3, 4, , , , , 5, · · ·
2 3 2 3 4 5
Wir erweitern nun ϕ zu einer bijektiven Abbildung φ : Z −→ Q mittels
ϕ(n) falls n∈N
φ(n) := 0 falls n=0
−ϕ(−n) falls n ∈ Z, n < 0.
R = {x1 , x2 , x3 , . . .}.
I1 ⊃ I2 ⊃ I3 ⊃ I4 ⊃ I5 ⊃ . . .
Es sei
4
I1 := [ x1 + 1, x1 + ].
3
/ I1 und L(I1 ) = 13 . Aus einem schon vorhandenen Intervall In kon-
Offensichtlich ist x1 ∈
struieren wir In+1 wie folgt: Wir teilen In in drei gleichlange, abgeschlossene Intervalle und
wählen als In+1 eines dieser Teilintervalle, das xn+1 nicht enthält. Für die so konstruierte
Folge von Intervallen gilt
I1 ⊃ I2 ⊃ I3 ⊃ I4 ⊃ . . .
xn ∈
/ In
L(I1 ) = 13 , L(I2 ) = 1
32
,... , L(In ) = 1
3n , . . .
∞
T
Somit ist I1 ⊃ I2 ⊃ I3 ⊃ . . . eine Intervallschachtelung. Sei nun x ∈ In . Nach Annah-
n=1
me war R = {x1 , x2 , x3 , x4 , . . .}. Es muß also ein k0 ∈ N mit x = xk0 geben. Dann ist
xk0 ∈ Ik0 . Dies widerspricht aber der Konstruktion der Intervalle. Somit war die Annahme
der Abzählbarkeit von R falsch. ⊓
⊔
1.2 Die reellen Zahlen 17
Definition 1.16. Zwei Mengen A und B heißen gleichmächtig, falls eine bijektive Abbil-
dung f : A −→ B existiert. Die Menge B hat eine größere Mächtigkeit als A, falls A zu
einer Teilmenge von B gleichmächtig ist, aber B zu keiner Teilmenge von A.
Die Mengen N, Z und Q sind gleichmächtig. Die Menge R hat eine größere Mächtigkeit als
diese drei Mengen.
Kontinuumshypothese : Es gibt keine Menge A, deren Mächtigkeit größer als die von
N und kleiner als die von R ist.
Diese Hypothese wurde 1878 von Georg Cantor [1845–1918] aufgestellt. Sie leitete die Ent-
wicklung der Mengenlehre ein. Auf dem Internationalen Mathematikerkongreß 1900 in Pa-
ris hat David Hilbert [1862-1943] seine berühmte Liste von 23 ungelösten mathematischen
Problemen vorgestellt. Die Kontinuumshypothese steht dabei an 1. Stelle. Inzwischen weiß
man, dass sie auf der Basis der heute zugrundegelegten Axiome der Mengenlehre weder
beweisbar noch widerlegbar. Kurt Gödel [1906-1978] hat 1939 gezeigt, dass sie nicht wi-
derlegbar ist, Paul Cohen [1934-2007] hat 1963 gezeigt, dass sie auch nicht beweisbar ist
(dafür hat er 1966 die Fields-Medaille bekommen). Solche Fragen werden in den Vorlesun-
gen über mathematische Logik behandelt.
In diesem Abschnitt behandeln wir einige wichtige Gleichungen und Ungleichungen für
Potenzen und Wurzeln reeller Zahlen.
Sei x ∈ R eine reelle Zahl. Die Potenz xn für n ∈ N0 definieren wir induktiv durch:
x0 := 1, x1 := x, x2 := x · x , . . . , xn+1 := xn · x.
Induktionsbehauptung:
X
n+1
n + 1 k n−k+1
(x + y)n+1 = x ·y .
k
k=0
Induktionsbeweis:
(x + y)n+1 = (x + y)n · (x + y)
n
!
IV
X n k n−k
= x ·y · (x + y)
k
k=0
n
X n
X
n k n−k n k n−k
= x ·x·y + x ·y ·y
k k
k=0 k=0
n
X n
n k+1 n+1−(k+1) X n k n+1−k
= x ·y + x ·y
k k
k=0 k=0
X
n+1
n
n
X
n l (n+1)−l
= xl · y (n+1)−l + x ·y
l−1 l
l=1 l=0
n
X
n n l (n+1)−l n n+1 0 n 0 n+1
= + x ·y + x y + x y
l l−1 n 0
l=1
1.3
X
n+1
n + 1 l (n+1)−l
= x ·y .
l
l=0
⊓
⊔
Folgerung 1.4
P
n
n
1. (1 + x)n = k xk ,
k=0
P
n
n
2. k = 2n ,
k=0
Pn
n
3. (−1)k k = 0.
k=0
Beweis. (1) ist der Binomische Satz für y = 1, (2) ist der Binomischer Satz für x = y = 1
und (3) ist der Binomischer Satz für x = −1, y = 1. ⊓
⊔
1.2 Die reellen Zahlen 19
Satz 1.12 (Bernoullische Ungleichung) Für jede reelle Zahl x ≥ −1 und für jedes
n ∈ N gilt:
(1 + x)n ≥ 1 + n x.
Folgerung 1.5
Beweis. Sei r ∈ R+ und y > 1. Nach dem Archimedischen Axiom für reelle Zahlen existiert
r
eine natürliche Zahl n ∈ N, so daß n > y−1 . Dann folgt mit der Bernoullischen Ungleichung
y n = (1 + (y − 1))n ≥ 1 + n (y − 1) ≥ n (y − 1) > r.
1 1
Ist 0 < y < 1, so wenden wir das eben Bewiesene auf die reelle Zahl y > 1 und r an und
erhalten eine natürliche Zahl n ∈ N mit ( y1 )n > 1r und somit y n < r. ⊓
⊔
Satz 1.13 (Geometrische Summe) Für jede reelle Zahl x 6= 1 und jede natürliche Zahl
n gilt:
n
X 1 − xn+1
xk = .
1−x
k=0
1 − x2 (1 − x)(1 + x)
= = 1 + x = x0 + x1 .
1−x 1−x
Induktionsschritt:
Induktionsvoraussetzung: Die Behauptung ist für ein n ∈ N richtig.
Induktionsbehauptung:
n+1
X 1 − xn+2
xk = .
1−x
k=0
Induktionsbeweis:
20 1 Reelle und komplexe Zahlen
n+1
X X
n
k
x = xk + xn+1
k=0 k=0
n+1
IV 1 − x
= + xn+1
1−x
1 − xn+1 + xn+1 (1 − x)
=
1−x
1−x n+2
= .
1−x
⊓
⊔
Wir beweisen nun die Existenz der n-ten Wurzel einer positiven reellen Zahl.
Satz 1.14 Sei x ∈ R+ eine positive reelle Zahl und n ∈ N. Dann existiert genau eine
positive reelle Zahl y ∈ R+ mit y n = x.
√
Bezeichnung: y := n x heißt die n–te Wurzel aus x.
Beweis. Zum Beweis benutzen wir das Intervallschachtelungsprinzip. Es genügt, den Fall
x > 1 zu behandeln. Den Fall x < 1 führt man durch Übergang zu x′ := x1 darauf zurück.
Wir definieren induktiv die folgende Folge abgeschlossener Intervalle: Wir setzen I1 :=
[1, x]. Sei Ik := [ak , bk ] bereits konstruiert. Dann definieren wir Ik+1 durch Halbierung von
Ik : Sei m = ak +b
2
k
der Mittelpunkt von Ik . Wir setzen dann
(
[ak , m] falls mn ≥ x
Ik+1 = [ak+1 , bk+1 ] :=
[m, bk ] falls mn < x.
Dann gilt nach Konstruktion:
1. I1 ⊃ I2 ⊃ I3 ⊃ . . ..
k−1
2. L(Ik ) = (x − 1) · 12 für alle k ∈ N.
n n
3. ak ≤ x ≤ bk für alle k ∈ N.
Wir erhalten also ineinander geschachtelte Intervalle, deren Längen nach Folgerung 1.2
beliebig klein werden. Nach dem Intervallschachtelungsprinzip existiert genau eine reelle
Zahl y ∈ R mit y ∈ Ik für jedes k ∈ N. Wir zeigen nun, dass y n = x gilt.
Dazu betrachten wir die Intervalle
Jk := [ank , bnk ].
Da Ik ⊃ Ik+1 , gilt wegen der Monotonie der Potenzen auch Jk ⊃ Jk+1 . Für die Länge von
Jk erhalten wir
Nach Folgerung 1.2 gibt es zu jedem ε > 0 ein k ∈ N mit L(Jk ) ≤ ε. Die Folge der
Intervalle Jk ist also eine Intervallschachtelung. Nach Konstruktion gilt aber sowohl x ∈ Jk
∞
T
(Eigenschaft 3.) als auch y n ∈ Jk für alle k ∈ N. Da der Durchschnitt Jk nur ein
k=1
Element enthält, folgt x = y n .
Die Eindeutigkeit der Zahl y ∈ R+ mit y n = x ist klar, denn ist z.B. y1 < y2 , so folgt
y1n < y2n . ⊓
⊔
√ √
Die Gleichung y n = x hat für gerade n zwei reelle Lösungen y1 = n x und y2 = − n x.
Die Eindeutigkeitsaussage von Satz 1.14 gilt also nur in R+ . Die Gleichung y n = x ist in
Q im allgemeinen nicht lösbar.
√
Satz 1.15 Seien n und k natürliche Zahlen. Dann ist n k genau dann eine rationale Zahl,
falls k die n–te Potenz einer natürlichen Zahl ist, das heißt falls k = mn für ein m ∈ N.
Insbesondere gilt:
√
• Für jede Primzahl p und jedes n > 1 ist die Zahl n p irrational.
√ √
• Wenn n k rational ist, so ist n k sogar eine natürliche Zahl.
Beweis.
√
1. (⇐=): Sei k = mn mit m ∈ N. Dann ist per Definition m := n k ∈ N ⊂ Q.
√ √
2. (=⇒): Sei n k ∈ Q. Dann existieren teilerfremde Zahlen m, l ∈ N, so dass n k = ml .
n
Nach Definition erhält man k = ( ml )n = mln und somit kln = mn . Wir zeigen nun, dass
l = 1 gilt. Angenommen l > 1. Dann existiert eine Primzahl p > 1, die l teilt. Folglich
teilt p auch kln = mn , das heißt p teilt auch m. Das ist aber ein Widerspruch dazu, dass
l und m teilerfremd sind. Somit ist l = 1 und k = mn für m ∈ N. ⊓
⊔
Definition 1.17. Sei x ∈ R+ eine positive reelle Zahl und q ∈ Q eine rationale Zahl mit
n
der Darstellung q = m , n ∈ Z, m ∈ N. Dann setzen wir:
√ n
xq := m
x .
Diese Definition ist korrekt, d.h. unabhängig von der Wahl der Darstellung von q.
Die folgenden Eigenschaften für die Potenzen mit rationalen Exponenten sind leicht nach-
zuprüfen: Seien p, q ∈ Q und x, y ∈ R+ . Dann erhält man:
Wir werden auf die Potenzen und ihre Eigenschaften später zurückkommen.
22 1 Reelle und komplexe Zahlen
Für jede von Null verschiedene reelle Zahl x gilt x2 > 0. Man kann im Zahlbereich der
reellen Zahlen also keine Wurzeln aus negativen Zahlen ziehen. Insbesondere gibt es keine
reelle Lösung der Gleichung x2 = −1. Die komplexen Zahlen sind eine Erweiterung der
reellen Zahlen, die es möglich macht, auch Wurzeln aus negativen Zahlen zu ziehen.
Dazu betrachten wir die Menge der Paare reeller Zahlen
R2 := R × R := {(a, b) | a, b ∈ R}
und führen auf dieser Menge eine Addition + : R2 × R2 −→ R2 und eine Multiplikation
· : R2 × R2 −→ R2 ein. Zwei Paare z1 = (a1 , b1 ) und z2 = (a2 , b2 ) aus R2 addieren bzw.
multiplizieren wir nach folgenden Regeln:
Die mit dieser Addition und Multiplikation ausgestattete Menge R2 bezeichnet man mit
dem neuen Symbol C, d.h. C := R2 , um auszudrücken, dass man außer der üblichen
Addition (1.1) der reellen Paare auch noch die Multiplikation (1.2) festgelegt hat. Die
Elemente von C heißen komplexe Zahlen.
Satz 1.16 Die komplexen Zahlen [C, +, ·] bilden einen Körper. Es gelten also die Rechen-
regeln K1 − K9 für die Addition + und die Multiplikation · .
Beweis. Diese Eigenschaften folgen direkt aus den Körpereigenschaften von R und den
Definitionen von + und ·. Man erhält z.B. durch direktes Nachrechnen: (0, 0) ist das
neutrale Element der Addition, (1, 0) das neutrale Element der Multiplikation. Das Ne-
gative zu z = (a, b) ∈ C ist −z := (−a, −b). Das Inverse zu w = (a, b) 6= (0, 0) ist
1 a −b
w := ( a2 +b2 , a2 +b2 ). ⊓
⊔
Im Gegensatz zum Körper der reellen Zahlen ist der Körper der komplexen Zahlen nicht
angeordnet (Übungsaufgabe).
Für den bequemen Umgang mit den komplexen Zahlen eignen sich die nun folgenden
Vereinbarungen: Nach Definition gilt für die komplexen Zahlen (a, 0) und (b, 0)
Die Zuordnung a ∈ R 7−→ (a, 0) ∈ C ist also eine Einbettung der Menge der reellen
Zahlen in die Menge der komplexen Zahlen, die mit den jeweiligen Körperoperationen +
und · verträglich ist. Wir können deshalb R als Teilkörper von C auffassen. Dies werden
wir in Zukunft tun und die komplexe Zahl (a, 0) einfach mit a bezeichnen. Dies rechtfertigt
auch die Bezeichnung 0 := (0, 0) für das neutrale Element der Addition und 1 := (1, 0)
für das neutrale Element der Multiplikation. Die komplexe Zahl (0, 1) bezeichnen wir mit
i und nennen sie die imaginäre Einheit. Für i = (0, 1) gilt
z = a + ib a, b ∈ R (1.3)
darstellbar. Dies ist die übliche Darstellung der komplexen Zahlen. Man kann dann mit
den komplexen Zahlen wie mit den reellen rechnen, indem man i2 = −1 berücksichtigt.
Es gilt also für z1 = a1 + i b1 und z2 = a2 + i b2
1. z + w = z + w, z · w = z · w, z = z .
2. z + z = 2 · Re(z) , z − z = 2i · Im(z) .
3. z = z ⇐⇒ z ∈ R.
24 1 Reelle und komplexe Zahlen
Definition 1.19. Sei z = a + ib ∈ C eine komplexe Zahl. Der Betrag von z ist die reelle
Zahl p √
|z| := a2 + b2 = z · z.
Beweis. 1., 4. und 5. folgen trivialerweise aus der Definition. Formel 2. folgt aus
|z + w|2 = (z + w)(z + w)
= (z + w)(z + w)
= zz + ww + wz + zw
= zz + ww + wz + wz
= |z|2 + |w|2 + 2 · Re(wz)
≤ |z|2 + |w|2 + 2 · |wz|
= |z|2 + |w|2 + 2 · |w| · |z|
= (|z| + |w|)2 .
⊓
⊔
Der Darstellung der reellen Zahlen auf einer Geraden entspricht die Darstellung der kom-
plexen Zahlen in der Ebene, die man dann oft Gaußsche Zahlenebene oder komplexe
Zahlenebene nennt.
Wir wählen ein kartesisches Koordinatensystem in der Ebene und stellen die komplexe
Zahl z = (a, b) = a + ib ∈ C als Punkt der Ebene mit den Koordinaten (a, b) dar.
1.3 Die komplexen Zahlen 25
z = (a, b) = a + bi
ib 3
|z|
i
ϕ
-
1 a R
reelle Achse (x-Achse)
Die reellen Zahlen R entsprechen der x–Achse, die rein imaginären Zahlen iR der y–Achse.
√
Nach dem Satz von Pythagoras ist |z| = a2 + b2 gleich dem Abstand des Punktes
z = (a, b) zum Ursprung des Koordinatensystems. Die komplexe Zahl z = (a, −b) = a − ib
entsteht durch Spiegelung von z an der reellen Achse. Für z 6= 0 sei ϕ der Winkel zwi-
schen der x–Achse und dem Strahl vom Ursprung durch z, gemessen in positiver Richtung
(entgegen dem Uhrzeigersinn). Dann gilt im rechtwinkligen Dreieck
a b
cos ϕ = und sin ϕ = .
|z| |z|
Die Darstellung
heißt trigonometrische Darstellung der komplexen Zahl z 6= 0. Der Winkel ϕ heißt Ar-
gument von z und wird mit arg(z) bezeichnet. Das Argument ϕ ist bis auf ganzzahlige
Vielfache von 2π eindeutig bestimmt.
iR
6
i(b1 + b2 ) 3
z1 + z2 = (a1 + a2 , b1 + b2 )
ib2 z2 z2 = (a2 , b2 )
ib1 1 z1 z1 = (a1 , b1 )
-
a2 a1 a1 + a2
R
26 1 Reelle und komplexe Zahlen
z1 · z2
w
z2
ϕ1 + ϕ2
z1
ϕ2
ϕ1
1 |w| = |z1 · z2 |
Für die Winkel gilt ϕ1 = arg(z1 ) und ϕ2 = arg(z2 ). Der Punkt z1 · z2 liegt auf dem vom
Ursprung ausgehenden Strahl, der mit der reellen Achse R den Winkel ϕ1 + ϕ2 einnimmt.
Mittels des Strahlensatzes erhält man einen Punkt w auf dem Strahl durch den Ursprung
und z2 mit |w| = |z1 · z2 |. Man dreht diesen Punkt w um den Winkel ϕ1 um den Ursprung
und erhält den Punkt z1 · z2 .
Beispiele:
a) Die Abbildung z ∈ C 7−→ iz ∈ C beschreibt die Drehung um den Ursprung um den
Winkel π2 (entgegen dem Uhrzeigersinn).
b) Die Abbildung z ∈ C 7−→ rz ∈ C, r ∈ R+ , ist die Streckung von z um den Faktor r
auf dem durch den Ursprung und z gehenden Strahl.
c) Was bedeutet die Inversion z ∈ C 7−→ z −1 = z1 ∈ C geometrisch?
Betrachten wir den Kreis K1 = {z ∈ C | |z|2 = 1} vom Radius 1. Sei z ∈ C ein vom
Ursprung verschiedener Punkt. Der Punkt ze ∈ C heißt Spiegelpunkt von z an K1 , falls
1.3 Die komplexen Zahlen 27
ze auf dem von 0 ausgehenden Strahl durch z liegt und |z| · |e z | = 1 gilt. Dann existiert
+
ein c ∈ R mit ze = cz. Setzen wir das in |z| · |e 1
z | = 1 ein, so erhalten wir c = |z|12 = z·z .
Folglich ist der Spiegelpunkt ze = z1 = z1 . Die Inversionsabbildung z ∈ C 7−→ z −1 ∈ C
ist also die Hintereinanderausführung der Spiegelung am Kreis K1 und der Spiegelung an
der reellen Achse.
iR
z −1
1 R
z −1
Wir erklären nun Wurzeln aus komplexen Zahlen: Wie wir gerade gesehen haben, gelten
für eine komplexe Zahl z die Formeln
Satz 1.19 Sei w ∈ C eine von Null verschiedene komplexe Zahl mit dem Betrag r := |w|
und dem Argument ϕ =: arg(w) ∈ [0, 2π). Dann hat die Gleichung z n = w genau n
verschiedene komplexe Lösungen, nämlich
√n
ϕ k · 2π ϕ k · 2π
zk := r · cos + + i sin +
n n n n
Wir haben also n verschiedene Lösungen der Gleichung z n = w gefunden. Wir zeigen,
dass es keine weiteren Lösungen gibt. Sei z eine beliebige Lösung von z n = w und z =
|z|(cos ψ + i · sin ψ) die trigonometrische Darstellung von z. Es gilt |z|n = |w| und folglich
28 1 Reelle und komplexe Zahlen
p
|z| = n |w|. Weiterhin ist n · ψ = ϕ + 2πl, für ein l ∈ Z und somit ψ = ϕn + 2πl
n . Wir teilen
l durch n mit Rest: l = k + rn, r ∈ Z und 0 ≤ k ≤ n − 1. Dann gilt ψ = ϕk + r · 2π und
folglich z = zk . ⊓
⊔
iR w
n=4
6
z1
M
1 z0
ϕ
-
ϕ
4
z2 )
π
2
R
N
z3
Wir formulieren abschließend den Fundamentalsatz der Algebra, der eine der wichtigsten
Aussagen über komplexe Zahlen enthält.
z n + an−1 z n−1 + . . . + a1 z + a0 = 0
eine Lösung z ∈ C. ⊓
⊔
Der Beweis dieses Satzes für allgemeine n erfolgt später in Kapitel 4.7. Wir beweisen den
Fundamentalsatz der Algebra hier zunächst nur für n = 2. In diesem Fall erhält man alle
komplexen Lösungen z der quadratischen Gleichung z 2 +a1 z+a0 = 0 mittels quadratischer
Ergänzung. Es gilt:
z 2 + a1 z + a0 = 0
a 1 2 a2
⇐⇒ z+ + a0 − 1 = 0
2 4
a1 a2
⇐⇒ w2 = c wobei w := z + und c = 1 − a0 .
2 4
Für c 6= 0 können wir die Gleichung w2 = c nach Satz 1.19 lösen und erhalten genau 2
a2
verschiedene komplexe Lösungen von z 2 + a1 z + a0 = 0. Für c = 0 gilt a0 = 41 und deshalb
a1 a1
z 2 + a1 z + a0 = z + z+ .
2 2
In diesem Fall ist z = − a21 eine 2-fache Lösung von z 2 + a1 z + a0 = 0.
1.4 Die Vektorräume Rn und Cn 29
Definition 1.20. Mit Rn bezeichnen wir die Menge aller n–Tupel reeller Zahlen. Mit Cn
bezeichnen wir die Menge aller n–Tupel komplexer Zahlen.
Wir addieren zwei n-Tupel x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) aus Rn (Cn ) mittels:
Wir multiplizieren ein n-Tupel x = (x1 , . . . , xn ) ∈ Rn (Cn ) mit einer Zahl λ ∈ R (C)
mittels:
λ · x := λ · (x1 , . . . , xn ) = (λx1 , . . . , λxn ).
Satz 1.21 Rn ist ein n–dimensionaler Vektorraum über dem Körper der reellen Zahlen
R. Cn ist ein n–dimensionaler Vektorraum über dem Körper der komplexen Zahlen C.
Beweis. Dies wird in der Vorlesung über Lineare Algebra definiert und erklärt. ⊓
⊔
Die Elemente von Rn und Cn bezeichnet man deshalb auch als Vektoren. Der Vektor
0 := (0, 0, . . . , 0) heißt Nullvektor in Rn bzw. Cn .
Definition 1.21.
(1)Unter dem (kanonischen) Skalarprodukt zweier Vektoren x = (x1 , . . . , xn ) ∈ Rn und
y = (y1 , . . . , yn ) ∈ Rn versteht man die Zahl
n
X
hx, yiRn := xj · yj ∈ R.
j=1
(3)Die Norm eines Vektors x = (x1 , . . . , xn ) ∈ Rn bzw. z = (z1 , . . . , zn ) ∈ Cn ist die Zahl
v v
uX uX
p u n 2 p u n
kxkRn := hx, xiRn = t xj ∈ R bzw. kzkCn := hz, ziCn = t |zj |2 ∈ R.
j=1 j=1
Im Folgenden lassen wir zur Abkürzung die Indizes bei Skalarprodukt und Norm weg und
bezeichnen beide kurz mit h·, ·i bzw. k · k.
30 1 Reelle und komplexe Zahlen
Die Gleichheit gilt genau dann, wenn z und w linear abhängig sind.
7. Dreiecksungleichung:
kz + wk ≤ kzk + kwk.
0 ≤ kz + λwk2 (∗)
= hz + λw, z + λwi
= hz, zi + λhw, zi + λhz, wi + λ · λhw, wi
= kzk2 + λhz, wi + λhz, wi + |λ|2 kwk2 .
und somit
|hz, wi| ≤ kzkkwk.
Die Gleichheit kann dabei nur gelten, wenn in (*) die Gleichheit steht. Dies ist aber genau
dann der Fall, wenn z + λw = 0, d.h. wenn z und w linear abhängig sind.
Als letztes beweisen wir die Dreiecksungleichung: Es gilt
1.4 Die Vektorräume Rn und Cn 31
kz + wk2 = hz + w, z + wi
= hz, zi + hw, wi + hz, wi + hw, zi
= kzk2 + kwk2 + hz, wi + hz, wi
= kzk2 + kwk2 + 2Rehz, wi
≤ kzk2 + kwk2 + 2|Rehz, wi|
≤ kzk2 + kwk2 + 2|hz, wi|
≤ kzk2 + kwk2 + 2kzk · kwk
= (kzk + kwk)2 .
⊓
⊔
Definition 1.22. Seien x und y zwei Vektoren aus Rn bzw. Cn . Die Zahl
d(x, y) := kx − yk
Im folgenden Kapitel betrachten wir Eigenschaften von Rn bzw. Cn , die sich aus der Exis-
tenz des Euklidischen Abstandes ergeben. Dabei ist oft nicht wichtig, dass es sich bei der
zugrundeliegenden Menge um Rn oder Cn handelt und dass der Abstand d der konkrete
Euklidische Abstand ist. Man benötigt oft nur seine drei in Satz 1.23 formulierten Ei-
genschaften. Wir können deshalb die gleichen Untersuchungen für beliebige Mengen X
machen, auf denen eine Abstandsfunktion, d.h. eine Funktion d : X × X −→ R mit den
drei in Satz 1.23 formulierten Eigenschaften gegeben ist.
Eine solche Abstandsfunktion d gibt uns ein Maß dafür, wie weit zwei Punkte in X von-
einander entfernt sind. Ein solches Abstandsmaß möchte man z.B. auf der Erdoberfläche
haben, um anzugeben, wie weit zwei Orte voneinander entfernt sind. Man benötigt solche
Abstandsmaße auch für Funktionenräume, z.B. in der Lösungstheorie von Differentialglei-
chungen, die viele Prozesse der Natur mathematisch beschreiben. Es gibt sehr viele weitere
Gründe, sich bei den betrachteten Mengen X nicht auf die Vektorräume Rn und Cn zu
beschränken.
2
Metrische Räume
In diesem Kapitel betrachten wir Mengen X, auf denen ein Abstand d : X × X −→ R mit
den Eigenschaften aus Satz 1.23 gegeben ist. Mit Hilfe eines solchen Abstandes können
wir erklären, was es bedeutet, dass eine Folge von Punkten xn ∈ X, n = 1, 2, . . ., gegen
einen Punkt x ∈ X konvergiert. Der Konvergenzbegriff ist grundlegend für das Studium
des lokalen Änderungsverhaltens von Funktionen, die auf der Menge X erklärt sind.
Definition 2.1. Ein metrischer Raum ist ein Paar (X, d) bestehend aus einer nichtleeren
Menge X und einer Abbildung d : X × X −→ R mit folgenden Eigenschaften
1. d(p, q) ≥ 0 ∀ p, q ∈ X und d(p, q) = 0 ⇐⇒ p = q (Positivität),
2. d(p, q) = d(q, p) ∀ p, q ∈ X (Symmetrie),
3. d(p, q) ≤ d(p, r) + d(r, q) ∀ p, q, r ∈ X (Dreiecksungleichung).
Die Elemente von X heißen Punkte des metrischen Raumes, d(p, q) nennt man Abstand
zwischen p und q. Die Abbildung d heißt Metrik (oder Abstandsfunktion) auf X.
Beispiel 1: Aus Kapitel 1 wissen wir, dass folgende Räume metrische Räume sind:
• R mit d(x, y) := |x − y| für x, y ∈ R
• C mit d(z, w) := |z − w| für z, w ∈ C
• Rn mit d(p, q) := kp − qkRn für p, q ∈ Rn
• Cn mit d(r, s) := kr − skCn für r, s ∈ Cn ,
wobei |·| den Betrag der reellen bzw. komplexen Zahl und k·kRn und k·kCn die Normen auf
Rn bzw. Cn bezeichnen. Diese Metriken nennen wir die Standardmetrik auf R, C, Rn bzw.
Cn . Ist nichts anderes vereinbart, so seien R, C, Rn bzw. Cn mit dieser Metrik versehen.
• Die ”’Metrik der französischen Eisenbahn”’ (um von einer Stadt zur anderen zu kom-
men, muß man über Paris fahren): Sei p ein fixierter Punkt.
(
d1 (x, p) + d1 (p, y) falls x 6= y
d3 (x, y) :=
0 falls x = y
Dann ist (X, d) ein metrischer Raum. (X, d) heißt diskreter metrischer Raum und d die
diskrete Metrik.
Beispiel 4: Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Dann ist
(A, d|A×A ) ebenfalls ein metrischer Raum. Hierbei bezeichnet d|A×A die Einschränkung
der Abbildung d auf die Menge A × A. Sie heißt durch d induzierte Metrik auf A.
Beispiel 5: Seien (X1 , d1 ), . . . , (Xn , dn ) metrische Räume. Wir betrachten die Menge
Dann ist (X, d) ein metrischer Raum und heißt das kartesische Produkt der metrischen
Räume (X1 , d1 ), . . . , (Xn , dn ).
Beweis: Die Positivität und Symmetrie sind aus der Definition sofort ersichtlich. Wir zeigen
die Dreiecksungleichung. Seien dazu p = (p1 , . . . , pn ), q = (q1 , . . . , qn ) und r = (r1 , . . . , rn )
drei beliebige Punkte in X. Unter Benutzung der Dreiecksungleichung für die Metriken dj
und der Cauchy-Schwarzschen Ungleichung (CSU, siehe Kapitel 1.4) erhalten wir
2.2 Das Innere, der Abschluß und der Rand einer Menge 35
n
X
d(p, q)2 = dj (pj , qj )2
j=1
Xn 2
≤ dj (pj , rj ) + dj (rj , qj )
j=1
Xn
= dj (pj , rj )2 + 2dj (pj , rj ) · dj (rj , qj ) + dj (rj , qj )2
j=1
n
X
2 2
= d(p, r) + d(r, q) + 2 dj (pj , rj ) · dj (rj , qj )
j=1
v v
uXn uX
CSU
2 2
u u n
≤ d(p, r) + d(r, q) + 2 t d(pj , rj ) · t
2 d(rj , qj )2
j=1 j=1
Da der Abstand nicht-negativ ist, können wir in der Ungleichung auf beiden Seiten die
Wurzel ziehen und erhalten die Dreiecksungleichung für d. ⊓
⊔
Insbesondere gilt Rn = R×. . .×R und Cn = C×. . .×C (versehen mit der Standardmetrik
bzw. der Produktmetrik).
ˆ (x), f (y))
d(x, y) = d(f ∀ x, y ∈ X
ˆ
gilt. Die Abbildung f heißt dann Isometrie zwischen (X, d) und (Y, d).
2.2 Das Innere, der Abschluß und der Rand einer Menge
heißt ε–Kugel in X um x.
a+b
ε- 2
( ) - ( ) -
x a b
R a+b a−b R
K(x, ε) = (x − ε, x + ε) (a, b) = K( 2 , 2 )
Für n = 2 sind die ε–Kugeln gerade die Kreisscheiben vom Radius ε ohne ihren Rand.
R R K((a, b), ε)
6 K(0, ε) 6 = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 < ε2 }
ε 3 ε3
- b •
(a, b)
R
-
a
R
(X, d) ist tatsächlich ein metrischer Raum (Übungsaufgabe). Die ε–Kugel um den Null-
punkt ist für diese Metrik ein Quadrat mit der Seitenlänge 2ε ohne seinen Rand:
R
ε6
-
−ε ε
R
−ε
Beispiel 3: Sei (X, d) ein diskreter metrischer Raum. Dann gilt für die ε-Kugeln
(
{x} falls ε ≤ 1
K(x, ε) =
X falls ε > 1.
2.2 Das Innere, der Abschluß und der Rand einer Menge 37
Definition 2.4. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X. Ein
Punkt x ∈ A heißt innerer Punkt von A, falls eine ε–Kugel K(x, ε) um x existiert, die
vollständig in A liegt.
Int(A) bezeichne die Menge aller inneren Punkte von A ⊂ X.
A
K(x, ε)
x•
1. Int(X) = X, Int(∅) = ∅.
2. Int(A) ⊂ A.
3. Int(Int(A)) = Int(A).
4. A ⊂ B =⇒ Int(A) ⊂ Int(B) (Monotonie).
5. Int(A ∩ B) = Int(A) ∩ Int(B) .
S S
6. Für beliebig viele Teilmengen Ai ⊂ X, i ∈ Λ, gilt Int(Ai ) ⊂ Int( Ai ) .
i∈Λ i∈Λ
Beweis. Die Eigenschaften 1. und 2. folgen unmittelbar aus der Definition des Inneren
einer Menge.
Zu 3. Aus der 2. Eigenschaft des Inneren folgt Int(Int(A)) ⊂ Int(A) . Es bleibt somit
noch
Int(A) ⊂ Int(Int(A))
zu zeigen. Sei x ∈ Int(A). Nach Definition von Int(A) existiert eine ε–Kugel um x mit
K(x, ε) ⊂ A. Wir zeigen nun, dass K(x, ε) ⊂ Int(A) gilt.
Sei y ∈ K(x, ε) beliebig gewählt. Wir betrachten die Ku-
A gel um y mit dem Radius ε − d(x, y). Dann gilt
K(x, ε)
K(y, ε − d(x, y)) ⊂ K(x, ε) ⊂ A.
•y
x• Ist nämlich z ∈ K(y, ε − d(x, y)), so gilt
•y und wir erhalten
x•
ε d(x, z) ≤ d(x, y) + d(y, z) < ε.
R
Nach Definition ist somit jeder Punkt y von K(x, ε) ein innerer Punkt von A, also
38 2 Metrische Räume
K(x, ε) ⊂ Int(A). Daraus folgt wiederum, dass x ein innerer Punkt der Menge Int(A)
ist. Damit haben wir Int(A) ⊂ Int(Int(A)) bewiesen.
Zu 4. Wir zeigen A ⊂ B =⇒ Int(A) ⊂ Int(B):
Sei x ∈ Int(A). Dann existiert eine ε-Kugel K(x, ε) mit K(x, ε) ⊂ A. Da A ⊂ B folgt
K(x, ε) ⊂ B. Folglich ist x ∈ Int(B).
Zu 5. Wir zeigen Int(A ∩ B) = Int(A) ∩ Int(B):
Sei x ∈ Int(A ∩ B). Dann existiert eine ε–Kugel um x mit K(x, ε) ⊂ A ∩ B und es folgt,
dass sowohl K(x, ε) ⊂ A als auch K(x, ε) ⊂ B. Somit ist x ∈ Int(A) und x ∈ Int(B)
und wir erhalten x ∈ Int(A) ∩ Int(B). Es gilt folglich Int(A ∩ B) ⊂ Int(A) ∩ Int(B).
Sei nun x ∈ Int(A) ∩ Int(B), das heißt x ∈ Int(A) und x ∈ Int(B). Folglich existieren
ε1 , ε2 ∈ R+ , so dass
K(x, ε1 ) ⊂ A und K(x, ε2 ) ⊂ B.
Wir betrachten ε := min(ε1 , ε2 ). Dann ist
Also gilt K(x, ε) ⊂ A ∩ B, somit ist x ∈ Int(A ∩ B). Dies zeigt, dass
Int(A) ∩ Int(B) ⊂ Int(A ∩ B).
Zu 6. Wir betrachten eine Familie {Ai }i∈Λ aus beliebig vielen Teilmengen Ai ⊂ X. Sei Aj
S
eine fixierte Menge dieser Familie. Dann ist Aj ⊂ Ai . Aus der Monotonieeigenschaft
i∈Λ
des Inneren folgt
[
Int(Aj ) ⊂ Int( Ai ).
i∈Λ
Da dies für alle j ∈ Λ gilt, erhalten wir
[ [
Int(Aj ) ⊂ Int( Ai ).
j∈Λ i∈Λ
⊓
⊔
Wir betrachten dazu als metrischen Raum X = R mit der Standardmetrik und die Teil-
mengen A = Q und B = R \ Q. Dann ist A ∪ B = R und Int(A ∪ B) = R. Da in jedem
Intervall sowohl eine eine rationale als auch eine irrationale Zahl liegt, gilt K(x, ε) 6⊆ Q,
und K(x, ε) 6⊆ R \ Q. Also ist Int(Q) = Int(R \ Q) = ∅.
Definition 2.5. Sei (X, d) ein metrischer Raum und A ⊂ X eine beliebige Teilmenge.
Der Abschluss von A ist die Menge
x ∈ X \ Int(X \ A) ⇐⇒ x ∈ X und x ∈
/ Int(X \ A)
⇐⇒ ∀ ε > 0 gilt K(x, ε) 6⊂ X \ A
⇐⇒ ∀ ε > 0 gilt K(x, ε) ∩ A 6= ∅
⇐⇒ x ∈ cl(A).
Die anderen Aussagen kann man dann aus den Eigenschaften des Inneren (siehe Satz 2.1)
ableiten. Wir überlassen dies dem Leser als Übungsaufgabe. ⊓
⊔
Sei A ⊂ X eine Teilmenge eines metrischen Raumes (X, d). Dann gilt
Int(A) ⊂ A ⊂ cl(A).
Wir wollen nun die Punkte studieren, die in cl(A) \ Int(A) liegen.
Definition 2.6. Sei A ⊂ X eine Teilmenge eines metrischen Raumes (X, d). Unter dem
Rand von A versteht man die Menge
∂A := cl(A) \ Int(A).
x ∈ ∂A ⇐⇒ x ∈
/ Int(A) und x ∈
/ Int(X \ A)
⇐⇒ ∀ ε > 0 gilt K(x, ε) ∩ (X \ A) 6= ∅ und K(x, ε) ∩ A 6= ∅.
⊓
⊔
Bezeichnung: Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Dann bezeich-
net Int(A) die inneren Punkte von A. Die Punkte in Int(X \ A) nennen wir auch die
äußeren Punkte von A. Dann sagt uns Satz 2.3 insbesondere, dass sich X in die Menge
der inneren Punkte von A, die Menge der äußeren Punkte von A und den Rand von A
zerlegt, d.h. es gilt
X = Int(A) ∪˙ Int(X \ A) ∪˙ ∂A.
Definition 2.7. Eine Teilmenge A eines metrischen Raumes (X, d) heißt offen, falls
Int(A) = A gilt, dh. falls zu jedem x ∈ A eine ε–Kugel K(x, ε) existiert, die vollständig
in A liegt.
Beispiele:
1. Das Innere Int(A) jeder Teilmenge A eines metrischen Raumes ist offen. (Nach Satz
2.1, Punkt 3.).
2. Die ε–Kugeln K(x, ε) eines metrischen Raumes (X, d) sind offen. Ist nämlich y ∈
K(x, ε), dann gilt K(y, ε − d(x, y)) ⊂ K(x, ε) (siehe Beweis von 3. in Satz 2.1).
Insbesondere sind die Intervalle (a, b) im metrischen Raum R (mit der Standardmetrik)
in diesem Sinne offen.
3. Jede Teilmenge in einem disktreten metrischen Raum (X, d) ist offen.
Satz 2.4 Die offenen Teilmengen eines metrischen Raumes (X, d) haben folgende Eigen-
schaften:
1. Die Mengen X und ∅ sind offen.
2. Der Durchschnitt endlich vieler offener Mengen ist offen.
3. Die Vereinigung beliebig vieler offener Mengen ist offen.
und somit ist U1 ∩ U2 offen. Induktiv schließt man auf die Behauptung für endlich viele
Mengen.
Zu 3: Seien Ui , i ∈ Λ, beliebig viele offene Mengen. Dann gilt Int(Ui ) = Ui für alle i ∈ Λ.
Wegen Satz 2.1 ist
[ [ [ [
Ui = Int(Ui ) ⊂ Int( Ui ) ⊂ Ui
i∈Λ i∈Λ i∈Λ i∈Λ
S S S
und somit Ui = Int( Ui ). Also ist Ui offen. ⊓
⊔
i∈Λ i∈Λ i∈Λ
Beispiel: Der Durchschnitt beliebig vieler offener Mengen ist im allgemeinen nicht offen:
Sei X = R mit der Standardmetrik d(x, y) = |x − y| versehen. Wir betrachten die offenen
T
Intervalle Un = (− n1 , n1 ), n ∈ N. Dann ist Un = {0} nicht offen in R.
n∈N
Als nächstes wollen wir beschreiben, wie die offenen Mengen in Teilräumen aussehen. Ist
(X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X, so ist die Menge A selbst
ein metrischer Raum mit der induzierten Metrik d|A×A : A × A −→ R.
42 2 Metrische Räume
Satz 2.5 Sei (X, d) ein metrischer Raum und A ⊂ X eine beliebige Teilmenge. Eine
Menge B ⊂ A ist im metrischen Raum (A, d|A×A ) genau dann offen, wenn es in (X, d)
eine offene Menge U ⊂ X gibt, so daß B = U ∩ A gilt.
Beweis. Wir vergleichen zunächst die Kugeln des metrischen Raumes (A, d|A×A ) mit denen
des metrischen Raumes (X, d). Es gilt
(1) Sei B ⊂ A im metrischen Raum (A, d|A×A ) offen. Nach Definition existiert für jedes
b ∈ B eine Zahl ε(b) > 0, so dass
Da U die Vereinigung von Kugeln in X ist, ist U nach Satz 2.4, Punkt 3. offen in X. Da
B ⊂ A und B ⊂ U , ist B ⊂ U ∩ A. Andererseits gilt
!
[
U ∩A= KX (b, ε(b)) ∩ A
b∈B
[
= KX (b, ε(b)) ∩ A
b∈B
[
= KA (b, ε(b)) ⊂ B,
b∈B
Definition 2.8. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt abgeschlos-
sen, falls cl(A) = A gilt.
Satz 2.6 Sei (X, d) ein metrischer Raum und A ⊂ X. Dann gilt:
(2)–(4) folgen aus (1), Satz 2.1 und den Beziehungen zwischen Vereinigung und Durch-
schnitt bei der Komplementbildung:
(2) X = X \ ∅. Da ∅ offen ist, ist X abgeschlossen.
∅ = X \ X. Da X offen ist, ist ∅ abgeschlossen.
(3) Seien Ai , i ∈ Λ, beliebig viele abgeschlossene Teilmengen von X. Dann gilt nach den
bekannten Regeln der Mengenlehre
\ [
X\ Ai = (X \ Ai ). (⋆)
i∈Λ i∈Λ
Da Ai abgeschlossen ist, ist X \ Ai offen. Die Vereinigung beliebig vieler offener Mengen
ist offen, folglich ist die rechte Seite von (⋆) ebenfalls offen. Wenden wir (1) auf die linke
T
Seite von (⋆) an, so folgt, dass i∈Λ Ai abgeschlossen ist.
(4) Es genügt, die Behauptung für zwei abgeschlossene Mengen zu beweisen. Die Gültig-
keit für endlich viele Teilmengen erhält man dann durch Induktion. Seien A und B zwei
abgeschlossene Teilmengen von X. Nach den bekannten Regeln der Mengenlehre gilt:
X \ (A ∪ B) = (X \ A) ∩ (X \ B).
Da A und B abgeschlossen sind, sind X \ A und X \ B offen und somit deren Durchschnitt
ebenfalls offen. Dann ist nach (1) aber A ∪ B abgeschlossen. ⊓
⊔
Als nächstes definieren wir zwei spezielle Arten von Punkten in metrischen Räumen:
Definition 2.9. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Ein Punkt
x ∈ X heißt Häufungspunkt von A, falls in jeder ε-Kugel K(x, ε) ein von x verschiedener
Punkt von A liegt, d.h. falls
(K(x, ε) \ {x}) ∩ A 6= ∅.
Satz 2.7 Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Dann gilt:
44 2 Metrische Räume
1. x ∈ X ist genau dann ein Häufungspunkt von A, wenn in jeder ε-Kugel K(x, ε) un-
endlich viele Punkte von A liegen.
2. cl(A) = A ∪ HP (A).
3. A ist genau dann abgeschlossen, wenn HP (A) ⊂ A.
Beweis. (1) Sei x ∈ X ein Häufungspunkt von A und ε > 0 eine beliebig fixierte Zahl.
Wir müssen zeigen, dass die Kugel K(x, ε) unendlich viele Punkte von A enthält. Aus der
Definition des Häufungspunktes erhalten wir zunächst, dass ein von x verschiedener Punkt
a1 ∈ K(x, ε) existiert mit a1 ∈ A. Wir betrachten ε1 := d(x, a1 ) > 0. Dann ist ε1 < ε.
Wiederum aus der Häufungspunkt-Eigenschaft von x, erhalten wir einen weiteren von a1
und x verschiedenen Punkt a2 ∈ K(x, ε1 ) mit a2 ∈ A. Wir betrachten dann ε2 := d(x, a2 )
und erhalten einen von a1 , a2 und x verschiedenen Punkt a3 ∈ K(x, ε2 ) mit a3 ∈ A.
Fahren wir induktiv so fort, so erhalten wir unendlich viele voneinander verschiedene
Punkte a1 , a2 , a3 , a4 , . . . ∈ A ∩ K(x, ε).
(2) Wir zeigen zuerst, dass A ∪ HP (A) ⊂ cl(A):
Da A ⊂ cl(A), ist dazu nur zu zeigen, dass HP (A) ⊂ cl(A). Sei x ∈ HP (A). Dann gilt
(K(x, ε) \ {x}) ∩ A 6= ∅ für alle ε > 0. Folglich ist auch K(x, ε) ∩ A 6= ∅ für alle ε > 0 und
damit x ∈ cl(A).
Wir zeigen nun cl(A) ⊂ A ∪ HP (A):
Sei x ∈ cl(A) \ A. Wir müssen zeigen, dass x ein Häufungspunkt von A ist. Da x ∈ cl(A)
gilt für alle ve > 0 dass K(x, ε) ∩ A 6= ∅. Da x 6∈ A folgt auch K(x, ε) \ {x} ∩ A 6= ∅. Als
ist x ∈ HP (A).
(3) A ist genau dann abgeschlossen, wenn A = cl(A), also wegen (2) genau dann wenn
A = A ∪ HP (A). Dies ist aber äquivalent dazu, dass HP (A) ⊂ A. ⊓
⊔
Definition 2.10. Sei (X, d) metrischer Raum und A ⊂ X Teilmenge. Ein Punkt x ∈ A
heißt isolierter Punkt von A, falls ein ε > 0 existiert, so daß K(x, ε) ∩ A = {x} gilt.
Mit Iso(A) bezeichnen wir die Menge der isolierten Punkte von A.
Definition 2.11. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt dicht in
X, wenn cl(A) = X gilt.
Satz 2.8 Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X. Dann sind
die folgenden Aussagen äquivalent:
1. A ist dicht in X.
2. A besitzt keine äußeren Punkte, d.h. Int(X \ A) = ∅.
3. X \ A enthält keine ε–Kugel.
A ⊂ X dicht ⇐⇒ cl(A) = X
⇐⇒ X \ Int(X \ A) = X
⇐⇒ Int(X \ A) = ∅
⇐⇒ X \ A enthält keine ε–Kugel.
⊓
⊔
Definition 2.12. Sei (X, d) ein metrischer Raum und x ∈ X. Unter einer Umgebung von
x verstehen wir eine offene Menge U ⊂ X, die x enthält.
Bemerkung:
Man kann deshalb in allen obigen Definitionen (innerer Punkt, Abschluss, Randpunkt,
Häufungspunkt, isolierter Punkt, . . .) den Begriff “Kugeln um x” durch “Umgebungen
von x” ersetzen.
46 2 Metrische Räume
Definition 2.13. Sei X eine nichtleere Menge. Unter einer Folge in X versteht man eine
Abbildung
F : N −→ X
n 7−→ F (n) =: xn ,
die jeder natürlichen Zahl n einen Punkt xn ∈ X zuordnet.
Eine Folge ist also eine durch die Abbildung F gegebene Aufzählung von Punkten in X,
wobei Punkte auch mehrfach vorkommen können. Wir geben künftig lediglich die Bild-
werte der Abbildung F an und benutzen für die Folge die nachstehenden Schreibweisen:
x1 , x2 , x3 , . . . oder (xn )∞
n=1 oder kurz (xn ).
Definition 2.14. Sei (X, d) ein metrischer Raum und (xn ) eine Folge in X. Wir sagen,
dass (xn ) gegen x ∈ X konvergiert, falls zu jedem ε > 0 ein (von ε-abhängiger) Index
n0 ∈ N existiert, so dass xn ∈ K(x, ε) für alle n ≥ n0 .
Der Punkt x heißt Grenzwert (GW) der Folge (xn ). Besitzt eine Folge (xn ) einen Grenz-
wert, so heißt sie konvergent. Besitzt die Folge (xn ) keinen Grenzwert, so heißt sie diver-
gent.
Satz 2.9 Eine Folge (xn ) in einem metrischen Raum (X, d) konvergiert genau dann ge-
gen x ∈ X, wenn die Folge der Abstände (d(x, xn )) im metrischen Raum R gegen Null
konvergiert:
xn −→ x in (X, d) ⇐⇒ d(x, xn ) −→ 0 in R.
Satz 2.10 (Eindeutigkeit des Grenzwerts) Der Grenzwert einer konvergenten Folge
eines metrischen Raumes ist eindeutig bestimmt.
2.4 Folgen in metrischen Räumen 47
Beweis. Sei (xn ) eine Folge des metrischen Raumes (X, d), die gegen x und x∗ konvergiert.
Angenommen x 6= x∗ . Dann ist ε := d(x, x∗ ) > 0. Also existieren n0 und n∗0 mit
ε ε
d(x, xn ) < ∀ n ≥ n0 und d(x∗ , xn ) < ∀ n ≥ n∗0 .
2 2
Somit gilt d(x, xn ) < 2ε und d(x∗ , xn ) < ε
2 für alle n ≥ max(n0 , n∗0 ). Nach Dreiecksunglei-
chung folgt für ein solches n
ε ε
ε = d(x, x∗ ) ≤ d(x, xn ) + d(xn , x∗ ) < + = ε.
2 2
Dies ist aber ein Widerspruch. ⊓
⊔
Definition 2.15. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt be-
schränkt, falls es eine Kugel K(x0 , M ) des metrischen Raumes gibt, die A enthält. Eine
Folge (xn ) in (X, d) heißt beschränkt, wenn die Menge der Folgenglieder {x1 , x2 , x3 , . . .}
beschränkt ist.
Satz 2.11 Jede konvergente Folge (xn ) eines metrischen Raumes (X, d) ist beschränkt.
Beweis. Sei (xn ) eine konvergente Folge und x = lim xn . Nach Definition der Kon-
n→∞
vergenz existiert ein n0 ∈ N, so dass d(xn , x) < 1 für alle n ≥ n0 . Wir setzen nun
M := max( d(x, x1 ), d(x, x2 ), . . . , d(x, xn0 −1 ) ) + 1. Dann gilt d(x, xn ) < M für alle n ∈ N.
Damit liegt die Menge {x1 , x2 , . . .} in der Kugel K(x, M ) und ist somit beschränkt. ⊓
⊔
Als nächstes wollen wir ein Kriterium für die Konvergenz von Folgen in Produkträumen
behandeln. Wir erinnern nochmal an die Definition der Produktmetrik. Seien (X1 , d1 ),
(X2 , d2 ), . . . , (Xk , dk ) metrische Räume. Das Produkt dieser k metrischen Räume ist das
Paar (X, d) mit
X : = X1 × X2 × . . . × Xk ,
v
u k
uX
d(a, b) := t dj (aj , bj )2 , wobei a = (a1 , . . . , ak ), b = (b1 , . . . , bk ).
j=1
Satz 2.12 Seien (X1 , d1 ), . . . , (Xk , dk ) metrische Räume und (X, d) das Produkt dieser
Räume. Eine Folge (xn = (xn1 , . . . , xnk ))∞ n=1 von Punkten im Produktraum X konvergiert
genau dann gegen y = (y1 , . . . , yk ) ∈ X, wenn für jedes j ∈ {1, . . . , k} die Komponenten-
folgen (xnj )∞
n=1 in (Xj , dj ) gegen yj konvergieren.
für jedes j ∈ {1, . . . , k}. Sei nun (xn ) gegen y in (X, d) konvergent. Dann existiert für jedes
ε > 0 ein n0 ∈ N mit d(y, xn ) < ε für alle n ≥ n0 . Nach Abschätzung (*) folgt daraus
48 2 Metrische Räume
dj (yj , xnj ) < ε für alle n ≥ n0 und jedes j ∈ {1, . . . , k}. Somit konvergiert xnj gegen yj in
(Xj , dj ) für jedes j ∈ {1, . . . , k}.
Sei umgekehrt lim xnj = yj für jedes j ∈ {1, . . . , k} und ε > 0. Dann existieren n0j ∈ N
n→∞
so dass dj (yj , xnj ) < √εk für alle n ≥ n0j . Es folgt
v v
u k u k
uX u X ε2
d(y, xn ) = t dj (yj , xnj ) < t
2 =ε
k
j=1 j=1
für alle n ≥ m0 = max(n01 , . . . , n0k ). Also konvergiert xn gegen y im Produktraum (X, d).
⊓
⊔
Wir charakterisieren nun den Abschluß einer Teilmenge eines metrischen Raumes durch
konvergente Folgen.
Satz 2.13 Sei A eine beliebige Teilmenge eines metrischen Raumes (X, d). Dann gilt für
den Abschluß von A:
x ∈ cl(A) ⇐⇒ Es existiert eine Folge (an ) mit an ∈ A, so dass lim an = x.
n→∞
Beweis. (=⇒) Sei x ∈ cl(A). Dann gilt K(x, ε)∩A 6= ∅ für alle ε > 0. Sei n ∈ N und ε = n1 .
Dann existiert ein Element an ∈ K(x, n1 ) ∩ A. Wir erhalten also eine Folge a1 , a2 , a3 . . .
in A mit d(x, an ) < n1 . Die Folge der Abstände (d(x, an )) konvergiert in R gegen Null
(Archimedisches Axiom). Somit konvergiert die Folge (an ) gegen x.
(⇐=) Sei (an ) eine Folge in A, die gegen x konvergiert und ε > 0. Dann existiert ein
n0 ∈ N, so dass an ∈ K(x, ε) für alle n ≥ n0 . Folglich ist K(x, ε) ∩ A 6= ∅, also x ∈ cl(A).
⊓
⊔
1. Eine Teilmenge A ⊂ X ist genau dann abgeschlossen, wenn der Grenzwert jeder kon-
vergenten, vollständig in A liegenden Folge gleichfalls in A liegt.
2. Eine Teilmenge A ⊂ X ist genau dann dicht im metrischen Raum (X, d), wenn für
jedes x ∈ X eine Folge (an ) von Punkten aus A existiert, die gegen x konvergiert.
Beweis. A ⊂ X ist genau dann abgeschlossen, wenn cl(A) = A. A ⊂ X ist genau dann
dicht, wenn cl(A) = X. Die Charakterisierung von cl(A) aus Satz 2.13 liefert dann die
Behauptung. ⊓
⊔
Definition 2.16. Sei (xn ) eine Folge in einer Menge X. Unter einer Teilfolge von (xn )
verstehen wir eine unendliche Auswahl von Elementen dieser Folge, d.h. eine Folge
(xnj )∞
j=1 , wobei {n1 , n2 , n3 , . . .} eine Teilmenge von N mit n1 < n2 < n3 < . . . ist.
Offensichtlich gilt:
Satz 2.14 Sei (X, d) ein metrischer Raum und (xn ) eine gegen x ∈ X konvergente Folge.
Dann konvergiert jede Teilfolge von (xn ) ebenfalls gegen x.
2.4 Folgen in metrischen Räumen 49
Definition 2.17. Sei (xn ) eine Folge im metrischen Raum (X, d). Ein Punkt x ∈ X
heißt Häufungspunkt der Folge (xn ), wenn es eine Teilfolge (xnj )∞
j=1 von (xn ) gibt mit
lim xnj = x.
j→∞
Die Menge der Häufungspunkte von (xn ) bezeichnen wir mit HP (xn ).
Beispiele:
1. Sei (X, d) ein metrischer Raum und (xn ) eine gegen x ∈ X konvergente Folge. Dann
gilt nach Satz 2.14, dass HP (xn ) = {x}.
2. Wir betrachten in R die Folge (xn ) mit
(
1
falls n gerade
xn := n
1 falls n ungerade
versehen. Da der metrische Raum Rk ein Teilraum des metrischen Raumes Ck ist, gelten
alle Eigenschaften, die wir im folgenden für Folgen in Ck formulieren, auch für Folgen in
Rk . Aus Satz 2.12 folgt als Spezialfall sofort
Satz 2.15
Der folgende Satz fasst die wichtigsten Rechenregeln für Folgen in Ck (bzw. in Rk ) zusam-
men.
50 2 Metrische Räume
2. Seien (zn ) und (wn ) zwei konvergente Folgen komplexer Zahlen mit den Grenzwerten
lim zn = z und lim wn = w in C. Dann gilt:
n→∞ n→∞
(a) lim zn · wn = lim zn · lim wn = z · w.
n→∞ n→∞ n→∞
(b) Ist w 6= 0, so ist auch wn 6= 0 für alle n größer als ein n0 ∈ N, und es gilt
zn lim zn z
lim = n→∞ = .
n→∞ wn lim wn w
n→∞
3. Seien (xn ) und (yn ) zwei konvergente Folgen reeller Zahlen mit den Grenzwerten
lim xn = x und lim yn = y.
n→∞ n→∞
(a) Gilt xn ≤ yn für fast alle1 n ∈ N, so folgt x ≤ y.
(b) Sei (un ) eine weitere Folge reeller Zahlen mit xn ≤ un ≤ yn für fast alle n ∈ N und
sei x = y. Dann ist die Folge (un ) ebenfalls konvergent und es gilt lim un = x.
n→∞
Folglich gilt kµz − µzn k = |µ| · kz − zn k < ε für alle n ≥ n0 , und somit lim µzn = µz.
n→∞
(c) Mittels der Cauchy-Schwarzschen Ungleichung erhält man die folgende Abschätzung
Da die Folge (wn ) konvergiert, ist die Menge {w1 , w2 , . . .} beschränkt. Somit existiert ein
M ∈ R+ mit kwn k ≤ M für alle n ∈ N. Wir wählen außerdem ein C ∈ R+ mit kzk < C.
Sei nun ε > 0 gegeben. Dann existieren n0 und n∗0 , so dass
ε ε
kz − zn k < ∀ n ≥ n0 und kw − wn k ≤ ∀ n ≥ n∗0 .
2M 2C
Wir erhalten
ε ε
|hzn , wn i − hz, wi| ≤ + =ε ∀ n ≥ max(n0 , n∗0 ).
2 2
Daraus folgt lim hzn , wn i = hz, wi.
n→∞
(d) Sei zn −→ z und ε > 0. Aus der Dreiecksungleichung für die Norm in Ck folgt
Zu 3. (a) Angenommen, es wäre x > y. Wir setzen ε = x − y > 0. Dann existiert ein
n0 ∈ N, so dass
ε ε
|xn − x| < und |yn − y| < ∀ n ≥ n0 .
2 2
Deshalb ist xn > x − 2ε = y + 2ε > yn für alle n ≥ n0 . Dies steht aber im Widerspruch zur
Voraussetzung und somit war die Annahme x > y falsch.
(b) Sei xn ≤ un ≤ yn für alle n ≥ n0 . Da xn → x und yn → x, existiert für jedes ε > 0 ein
n1 so dass |xn − x| < 4ε und |yn − x| < 4ε für alle n ≥ n1 . Aus der Dreiecks-Ungleichung
folgt:
52 2 Metrische Räume
ε ε ε
|x−un | ≤ |x−xn |+|xn −un | ≤ |x−xn |+|xn −yn | ≤ |x−xn |+|xn −x|+|x−yn | < + + <ε
4 4 4
für alle n ≥ max{n0 , n1 }. Folglich konvergiert die Folge (un ) gegen x. ⊓
⊔
Definition 2.18. Eine Folge (zn ) in Ck , die gegen den Nullvektor 0 = (0, . . . , 0) konver-
giert, heißt Nullfolge.
• Eine Folge (zn ) von Vektoren aus Ck ist genau dann eine Nullfolge, wenn die Folge der
reellen Zahlen (kzn k) eine Nullfolge ist.
• Eine Folge von Vektoren (zn ) konvergiert genau dann gegen den Vektor z, wenn (zn −z)
eine Nullfolge ist.
• Ist (zn ) eine Nullfolge von Vektoren und µ ∈ C, so ist auch (µ · zn ) eine Nullfolge.
• Sind (zn ) und (wn ) Nullfolgen von Vektoren, so ist auch (zn + wn ) eine Nullfolge.
• Ist (zn ) eine Nullfolge und (wn ) eine konvergente Folge von Vektoren, so ist die Folge
der Skalarprodukte (hzn , wn i) ebenfalls eine Nullfolge.
• Ist (yn ) eine Nullfolge reeller Zahlen und xn eine weitere Folge reeller Zahlen mit
0 ≤ xn ≤ yn für fast alle n ∈ N, dann ist (xn ) ebenfalls eine Nullfolge.
Wir erinnern nochmal daran, dass R und C immer mit der durch den Betrag gegebenen
Standardmetrik versehen sind.
q
1. Sei q eine positive rationale Zahl. Dann gilt lim n1 = 0.
n→∞
1
Nach dem Archimedischen Axiom existiert zu jedem ε > 0 ein n0 ∈ N, so dass n10 ≤ ε q .
q
Folglich ist | n1 | < ε für alle n ≥ n0 , woraus die Behauptung folgt.
√
2. Sei x eine positive reelle Zahl. Dann gilt lim n x = 1.
n→∞
√
Um dies einzusehen, betrachten wir zunächst x > 1. Sei xn := n x − 1. Dann gilt xn > 0
und aus der Bernoullischen Ungleichung erhalten wir
x = (1 + xn )n ≥ 1 + n · xn .
√
3. Es gilt lim n
n = 1.
n→∞
√
Zum Beweis betrachten wir die Folge xn := n
n − 1. Es gilt xn ≥ 0. Aus der binomischen
Formel folgt
2.4 Folgen in metrischen Räumen 53
n 2 1
n = (1 + xn ) ≥n
x = n(n − 1)x2n .
2 n 2
q q
2 2
Folglich gilt 0 ≤ xn ≤ n−1 . Nach 1. ist ( n−1 ) eine Nullfolge, somit ist (xn ) ebenfalls
√
eine Nullfolge und folglich gilt lim n = 1.
n
n→∞
nk
5. Sei z ∈ C mit |z| > 1 und k ∈ N eine fixierte natürliche Zahl. Dann gilt lim n = 0.
n→∞ z
Dies bedeutet, dass für |z| > 1 die Folge der Potenzen |z|n schneller wächst als jede noch
so große Potenz von n. Zum Beweis setzen wir x := |z| − 1 und wählen eine natürliche
Zahl p > k. Für jedes n > 2p folgt aus der binomischen Formel
p−Faktoren
z }| {
n n(n − 1) · . . . · (n − (p − 1))
(1 + x)n > · xp = ·xp .
p p!
nk 2p · p! 2p · p! 1
0< < ≤ · .
|z|n xp · np−k |x
p
{z } n
konstant
nk
Auf der rechten Seite steht eine Nullfolge, also ist lim n = 0.
n→∞ z
In diesem Abschnitt betrachten wir weitere, spezielle Eigenschaften von Folgen reeller
Zahlen, wobei R wieder mit der Standardmetrik d(x, y) := |x − y| versehen sei. Wir nutzen
dabei aus, dass R ein vollständiger angeordneter Körper ist.
Um später Formulierungen vereinheitlichen zu können, betrachten wir zunächst eine spe-
zielle Sorte von divergenten Folgen reeller Zahlen und ordnen diesen den Grenzwert +∞
oder −∞ zu.
Für Folgen reeller Zahlen, die gegen +∞ bzw. −∞ streben, benutzen wir die Schreibweise
Man nennt diese Sorte divergenter Folgen reeller Zahlen oft auch bestimmt divergent oder
uneigentlich konvergent (je nach Autor des benutzten Buches) und ±∞ den uneigentlichen
Grenzwert.
Beispiele:
• Ist xn = n oder xn = n2 , so gilt lim xn = +∞.
n→∞
• Die Folge 1, 0, 2, 0, 3, 0, 4, 0, . . . ist in R divergent und strebt auch nicht gegen +∞,
obwohl sie beliebig große Glieder enthält.
• Aus xn −→ +∞ und yn −→ +∞ folgt xn + yn −→ +∞ und xn · yn −→ +∞.
• Aus xn −→ +∞ und yn −→ a für a > 0 folgt xn + yn −→ +∞ und xn · yn −→ +∞ .
• Wenn xn −→ +∞ , so x1n −→ 0 .
• Wenn xn −→ 0 und xn > 0, so x1n −→ +∞ .
Aus xn −→ +∞ und yn −→ 0 kann man i.a. nichts über das Verhalten von xn · yn folgern,
wie die folgenden Beispiele zeigen.
Eine wichtige Folgerung aus dem Vollständigkeitsaxiom der reellen Zahlen ist die folgende
Eigenschaft beschränkter Folgen2 .
Insgesamt folgt also, dass unendlich viele Glieder der Folge (xn ) im Intervall (g − ε, g + ε)
liegen. Wir konstruieren jetzt eine Teilfolge (xnk ) von (xn ) auf folgende Weise.
Satz 2.18 Jede monoton wachsende, nach oben beschränkte Folge reeller Zahlen (xn ) kon-
vergiert gegen sup{xn | n ∈ N}.
Jede monoton fallende, nach unten beschränkte Folge reeller Zahlen (xn ) konvergiert gegen
inf{xn | n ∈ N}.
Beweis. Sei (xn ) monoton wachsend und nach oben beschränkt. Nach Satz 1.6 existiert
das Supremum g = sup{xn | n ∈ N}. Wir zeigen, dass (xn ) gegen g konvergiert. Sei
ε > 0. Nach Definition des Supremums existiert ein m0 ∈ N mit xm0 > g − ε, also mit
xm0 ∈ (g − ε, g]. Da (xn ) monoton wachsend ist, gilt g − ε < xm0 ≤ xn ≤ g für alle
n ≥ m0 . Folglich konvergiert (xn ) gegen g.
Den Beweis für monoton fallende, nach unten beschränkte Folgen führt man analog. ⊓
⊔
Das Supremum und das Infimum einer beschränkten Teilmenge A ⊂ R liegt im Abschluss
cl(A). Ist A ⊂ R beschränkt und abgeschlossen, so existiert folglich das Maximum max(A)
und das Minimum min(A) von A.
Sei nun (xn ) eine beschränkte Folge reeller Zahlen. Dann ist die Menge der Häufungspunke
HP (xn ) nicht leer (Satz 2.17) und ebenfalls beschränkt. Außerdem ist sie abgeschlossen
(siehe Übungsaufgaben). Folglich existiert das Maximum max HP (xn ), d.h. ein größter
Häufungspunkt von (xn ), und das Minimum min HP (xn ), d.h. ein kleinster Häufungs-
punkt von (xn ).
56 2 Metrische Räume
Definition 2.21. Sei (xn ) eine beschränkte Folge reeller Zahlen. Man nennt den größten
Häufungspunkt von (xn ) auch limes superior von (xn ) und bezeichnet ihn mit
Den kleinsten Häufungspunkt von (xn ) nennt man auch limes inferior von (xn ) und be-
zeichnet ihn mit
lim inf xn := lim xn := min HP (xn ).
n→∞
Ist (xn ) nicht nach oben beschränkt, so setzen wir lim sup xn := +∞.
n→∞
Ist (xn ) nicht nach unten beschränkt, so setzen wir lim inf xn := −∞.
n→∞
Satz 2.19 Sei (xn ) eine beschränkte Folge reeller Zahlen. Dann gilt
Beweis. (=⇒) Sei (xn ) gegen g ∈ R konvergent. Dann gilt HP (xn ) = {g} und somit
lim inf xn = lim inf xn = g.
n→∞ n→∞
(⇐=) Sei umgekehrt lim sup xn = lim inf xn = g . Dann gilt HP (xn ) = {g}, das heißt
n→∞ n→∞
jede konvergente Teilfolge von (xn ) konvergiert gegen g. Angenommen (xn ) würde nicht
gegen g konvergieren. Dann existiert ein ε > 0, so dass gilt
∀ n0 ∃ n ≥ n0 mit |xn − g| ≥ ε.
n0 = 1 =⇒ ∃ n1 ≥ 1 : |xn1 − g| ≥ ε,
n0 = n1 + 1 =⇒ ∃ n2 > n1 : |xn2 − g| ≥ ε, . . . ,
n0 = nk−1 + 1 =⇒ ∃ nk > nk−1 : |xnk − g| ≥ ε, . . .
Dadurch erhalten wir eine Teilfolge (xnk ) von (xn ) mit |xnk −g| ≥ ε, die ebenfalls beschänkt
ist. Nach Satz von Bolzano–Weierstraß enthält sie eine konvergente Teilfolge (xnki ), deren
Grenzwert g ∗ nach Konstruktion von g verschieden ist. Dies ist ein Widerspruch zu unserer
Voraussetzung. ⊓
⊔
ist in R konvergent.
Der Grenzwert der Folge (an ) heißt Eulerzahl e.
2.4 Folgen in metrischen Räumen 57
Beweis. Wir zeigen, dass (an ) eine monoton wachsende, nach oben beschränkte Folge ist.
Nach Satz 2.18 existiert dann ein Grenzwert für (an ).
1. Beschränktheit von (an ): Aus der binomischen Formel folgt
n k
1 n X n 1
an = 1 + = · .
n k n
k=0
n
1 k
Wir schätzen den Term k · n für 1 ≤ k ≤ n ab:
k−Faktoren
k z }| {
n 1 n(n − 1) · . . . · (n − (k − 1))
· =
k n k! · n
| · n {z · . . . · n}
k−mal
1 1 2 (k − 1)
= ·1· 1− · 1− · ... · 1 − (∗)
k! n n n
| {z }
≤1
1
≤
k!
Folglich gilt für alle n ∈ N
1 n
an = 1 +
n
1 1 1 1
≤ 1 + + + + ... +
1! 2! 3! n!
1 1 1 1 1
=1+ + + + + ... +
1 2 2·3 2·3·4 2 · 3 · ... · n
1 1 1 1 1
≤ 1 + 0 + 1 + 2 + 3 + . . . + n−1
2 2 2 2 2
X 1 k
n−1
=1+
2
k=0
1 − ( 21 )n
=1+ (geometrische Summe)
1 − 12
< 3.
Beweis. Aus dem Beweis von Satz 2.20 folgt an ≤ bn < 3 für alle n ∈ N. Folglich ist (bn )
eine nach oben beschränkte, monoton wachsende Folge. Nach Satz 2.18 existiert deshalb
ein Grenzwert von (bn ) und es gilt
e = lim an ≤ lim bn .
n→∞ n→∞
Andererseits gilt für m ≤ n wegen Formel (∗) aus dem Beweis von Satz 2.20
Xn k
1 n n 1
an = 1 + =
n k n
k=0
1
(1 − (1 − n1 )(1 − n2 )
n) (1 − n1 ) · . . . · (1 − n−1
n )
=1+1+ + + ... +
2! 3! n!
(1 − n1 ) (1 − n1 ) · . . . · (1 − m−1
n )
≥1+1+ + ... + .
2! m!
Wir halten m fest und gehen in dieser Ungleichung mit n gegen +∞. Dann folgt
1 1
e = lim an ≥ 1 + 1 + + ... + = bm ∀ m ∈ N.
n→∞ 2! m!
Deshalb gilt lim bm ≤ e und wir erhalten zusammenfassend e = lim bn . ⊓
⊔
m→∞ n→∞
Um die Eulerzahl genauer berechnen zu können, beweisen wir die folgende Fehler-
abschätzung.
P
n
1
Satz 2.22 Es sei bn = k! . Dann gilt für jedes n ∈ N die folgende Abschätzung für
k=0
die Eulerzahl e:
1
bn < e < bn +
n · n!
Beweis. Für festes n gilt e − bn = lim (bk − bn ) . Für k > n erhalten wir
k→∞
1 1
bk − b n = + ... +
(n + 1)! k!
1 1 1 1
= 1+ + + ... +
(n + 1)! (n + 2) (n + 2)(n + 3) (n + 2) · . . . · k
1 1 1 1
< 1+ + + ... +
(n + 1)! (n + 2) (n + 2)2 (n + 2)k−n−1
1 k−n
1 1 − ( n+2 )
= · 1 (geometrische Summe)
(n + 1)! 1 − ( n+2 )
1 1 1 n+2 1 n(n + 2)
< · 1 = · = · .
(n + 1)! 1 − n+2 (n + 1)! n + 1 n · n! (n + 1)2
Mittels der Fehlerabschätzung aus Satz 2.22 kann man Näherungswerte für e angeben.
Man erhält zum Beispiel für n = 10:
10
X 1 1
b10 = = 2.7182815 . . . = 0.00000002 . . .
k! 10 · 10!
k=0
e ≈ 2.7182815 .
1 1 1 1
bq = + + + ... +
0! 1! 2! q!
ist bq · q! ganzzahlig. Somit ist auch e · q! − bq · q! ganzzahlig. Das ist aber ein Widerspruch
zu 0 < e · q! − bq · q! < 1q < 1. ⊓
⊔
Um mittels der Definition nachzuweisen, dass eine Folge konvergiert, muß man ihren
Grenzwert kennen. In diesem Abschnitt lernen wir eine Klasse von metrischen Räumen
kennen, in denen man die Konvergenz einer beliebigen Folge überprüfen kann, ohne ihren
Grenzwert zu kennen.
Definition 2.22. Sei (X, d) ein metrischer Raum. Eine Folge (xn ) in (X, d) heißt Cauchy–
Folge, wenn zu jedem ε > 0 ein (von ε abhängiges) n0 ∈ N existiert, so dass d(xn , xm ) < ε
für alle n, m ≥ n0 .
Beweis. Sei ε = 1. Dann existiert ein n0 ∈ N so dass d(xn , xm ) < 1 für alle n, m ≥ n0 .
Insbesondere bedeutet das, dass xn ∈ K(xn0 , 1) für alle n ≥ n0 .
Wir setzen
r := max { d(xn0 , x1 ), d(xn0 , x2 ), . . . , d(xn0 , xn0 −1 ) } + 1.
Dann gilt xn ∈ K(xn0 , r) für alle n ∈ N. Also ist die Folge (xn ) beschränkt. ⊓
⊔
60 2 Metrische Räume
Satz 2.25 Jede konvergente Folge in einem metrischen Raum ist eine Cauchy–Folge.
Beweis. Sei (xn ) eine gegen x konvergente Folge und ε > 0. Dann existiert ein n0 ∈ N mit
d(xn , x) < 2ε für alle n ≥ n0 . Für n, m ≥ n0 folgt dann aus der Dreiecksungleichung
ε ε
d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < + = ε.
2 2
Somit ist (xn ) eine Cauchy-Folge. ⊓
⊔
Es gibt Cauchy-Folgen, die nicht konvergieren. Als ein Beispiel betrachten wir den metri-
schen Raum (X, d) mit X = (0, 1] ⊂ R und der Metrik d(x, y) = |x − y|. Sei xn := n1 . Die
Folge (xn ) ist eine Nullfolge in R, folglich ist sie eine Cauchy-Folge in (R, d). Sie ist dann
auch Cauchyfolge in (X, d), hat aber in X keine Grenzwert, da 0 6∈ X.
Definition 2.23. Ein metrischer Raum (X, d) heißt vollständig, wenn jede Cauchy–Folge
in (X, d) konvergiert.
In einem vollständigen, metrischen Raum kann man also die Konvergenz einer Folge un-
tersuchen, ohne ihren Grenzwert zu kennen. Man prüft dafür die Cauchy–Bedingung
Wir sehen uns zunächst Beispiele für vollständige metrischer Räume an.
Satz 2.26 Die reellen Zahlen R mit der Standardmetrik d(x, y) = |x − y| sind ein
vollständiger metrischer Raum.
Beweis. Sei (xn ) eine Cauchy–Folge reeller Zahlen. Dann ist (xn ) beschränkt. Nach dem
Satz von Bolzano-Weierstraß existiert eine konvergente Teilfolge (xnk ) von (xn ). Sei x =
lim xnk und ε > 0. Dann existieren k0 , n0 ∈ N, so dass
k→∞
ε
|x − xnk | < 2 ∀ k ≥ k0
ε
|xn − xm | < 2 ∀ n, m ≥ n0 .
Sei nun n ≥ n0 . Wir wählen ein k ≥ k0 mit nk ≥ n0 . Dann folgt aus der Dreiecksunglei-
chung
ε ε
|xn − x| ≤ |xn − xnk | + |xnk − x| < + < ε .
2 2
Also konvergiert die Folge (xn ) gegen x. ⊓
⊔
Beispiel 1: Die metrischen Räume (0, +∞), (0, a), (0, a] mit der Standardmetrik sind
nicht vollständig.
Beispiel 2: Der metrische Raum der rationalen Zahlen Q (mit der Standardmetrik) ist
nicht vollständig.
2.5 Vollständige metrische Räume 61
Satz 2.27 Sind (X1 , d1 ), . . . , (Xk , dk ) vollständige metrische Räume, so ist auch das Pro-
dukt (X, d) dieser metrischen Räume vollständig.
Daraus erhalten wir di (xni , xmi ) < ε für alle n, m ≥ n0 und jedes i ∈ {1, . . . , k}. Folglich
sind die Folgen (xni )∞
n=1 Cauchy–Folgen in (Xi , di ) für jedes i ∈ {1, . . . , k}. Da (Xi , di )
vollständige metrische Räume sind, konvergieren die Folgen (xni )∞ n=1 gegen ein yi ∈ Xi .
Somit gilt nach Satz 2.12 lim xn = (y1 , . . . , yk ) ∈ X1 × . . . × Xk . ⊓
⊔
n→∞
Folgerung 2.2 Die metrischen Räume C, Rk und Ck (jeweils mit der Standardmetrik)
sind vollständig.
Satz 2.28 Sei (X, d) ein vollständiger metrischer Raum und A ⊂ X eine Teilmenge.
Dann ist der metrische Raum (A, dA := d|A×A ) genau dann vollständig, wenn A abge-
schlossen ist.
Beweis. (⇐=): Sei A abgeschlossen und (an ) eine Cauchy–Folge in (A, dA ). Dann ist (an )
auch Cauchy–Folge in (X, d), die, da (X, d) vollständig ist, gegen ein x ∈ X konvergiert.
Da A abgeschlossen ist, liegt jeder Grenzwert einer Folge von Elementen aus A wieder in
A (Folgerung 2.1). Somit ist x ∈ A, das heißt (an ) konvergiert in A. Folglich ist (A, dA )
ein vollständiger metrischer Raum.
(=⇒): Sei nun (A, dA ) vollständig. Wir zeigen, dass dann A abgeschlossen ist. Sei x ∈ cl(A).
Nach Satz 2.13 existiert eine Folge an ∈ A mit lim an = x. Damit ist (an ) eine Cauchy–
n→∞
Folge in (A, dA ) und somit in A konvergent. Das heißt, x liegt in A. Folglich gilt cl(A) ⊂ A.
Die Teilmenge A ⊂ X ist also abgeschlossen. ⊓
⊔
62 2 Metrische Räume
Wir wissen, dass nicht jeder metrische Raum vollständig ist. Man kann aber jeden metri-
schen Raum vervollständigen. Abschließend beschreiben wir diese Vervollständigungspro-
zedur, die uns zeigt, dass man jeden metrischen Raum als dichten Teilraum eines gewissen,
bis auf Isometrie eindeutig bestimmten, vollständigen metrischen Raumes auffassen kann.
Diese Prozedur wird in der Analysis, vor allem bei der Untersuchung partieller Differenti-
algleichungen, vielfältig angewendet3 .
Der metrische Raum (X, ˜ ist bis auf Isometrie eindeutig bestimmt, d.h. ist (X ′ , d′ ) ein
e d)
weiterer vollständiger metrischer Raum und ϕ′ : X −→ X ′ eine Abbildung mit den Eigen-
˜ −→ (X ′ , d′ ) so dass F ◦ϕ = ϕ′ .
e d)
schaften 1. und 2., dann existiert eine Isometrie F : (X,
folgt, dass mit d(xn , yn ) → 0 und d(yn , zn ) → 0 stets d(xn , zn ) → 0 gilt. Dies zeigt die
Transitivität von ∼. Die Menge Xe sei die Menge der Äquivalenzklassen von Cauchy-Folgen
bzgl. der Relation ∼:
3
In der Vorlesung haben wir den Vervollständigungssatz als Fakt zitiert und aus Zeitgründen nur die
Beweisidee angegeben. Es lohnt sich aber, den vollständigen Beweis anzusehen. Zum einen ist dies ein
zentrales Resultat der Analysis. Zum anderen üben Sie beim Durcharbeiten des Beweises viele Begriffe
und Techniken der bisherigen Vorlesungen Analysis I* und Lineare Algebra I*.
2.5 Vollständige metrische Räume 63
e := CF(X, d)/ ∼ .
X
Die Äquivalenzklasse der Cauchy-Folge (xn ) ∈ CF(X, d) bezeichnen wir mit [(xn )].
Folglich ist die Folge der reellen Zahlen (d(xn , yn )) eine Cauchy-Folge im metrischen Raum
R. Da R vollständig ist, konvergiert diese Folge, d.h. es existiert lim d(xn , yn ) . Wir defi-
n→∞
e den Abstand
nieren für zwei Elemente ξ = [(xn )] und η = [(yn )] von X
˜ η) := lim d(xn , yn ) .
d(ξ,
n→∞
Diese Definition ist korrekt, d.h. sie hängt nicht von der Wahl der Repräsentanten (xn )
bzw. (yn ) in den Äquivalenzklassen ξ bzw. η ab. Sind nämlich (xn ) ∼ (x′n ) und (yn ) ∼ (yn′ ),
so gilt nach Vierecksungleichung
˜ η) = lim d(xn , yn )
d(ξ,
n→∞
≤ lim (d(xn , wn ) + d(wn , yn ))
n→∞
˜ ρ) + d(ρ,
= d(ξ, ˜ η) .
˜ definiert.
e d)
Damit haben wir einen metrischen Raum (X,
ϕ : X −→ Xe
x 7−→ x̃
64 2 Metrische Räume
Die Abbildung ϕ : X −→ ϕ(X) ist offensichtlich bijektiv und es gilt nach Definition von
d˜
˜
d(ϕ(x), ˜ ỹ) = lim d(x, y) = d(x, y).
ϕ(y)) = d(x̃,
n→∞
˜ von (X,
(X, d) ist also isometrisch zum Teilraum (ϕ(X), d) ˜
e d).
˜ kn , x̃k′ n ′ )
d(xknk , xk′ nk′ ) = d(x̃ k k
˜ kn , ξk ) + d(ξ
≤ d(x̃ ˜ k , ξk′ ) + d(ξ
˜ k′ , x̃k′ n ′ )
k k
1 ˜ k , ξk ′ ) + 1 .
< + d(ξ
k k′
Da (ξk )∞ e ˜
k=1 eine Cauchy-Folge in (X, d) ist, existiert zu vorgegebenem ε > 0 ein Index
k0 ∈ N, so dass
˜ k , ξk ′ ) , 1 , 1 <
d(ξ
ε
∀ k, k ′ ≥ k0 .
k k′ 6
Folglich ist
ε
d(xknk , xk′ nk′ ) < ∀ k, k ′ ≥ k0 . (∗∗)
2
und somit (xknk )∞ k=1 eine Cauchy-Folge in (X, d). Die Äquivalenzklasse dieser Folge sei
˜ gegen ξ konvergiert.
e d)
ξ := [(xknk )]. Wir zeigen, dass (ξk ) in (X,
Aus (∗) und (∗∗) folgt
˜ k , ξ) ≤ d(ξ
d(ξ ˜ k , x̃kn ) + d(x̃
˜ kn , ξ)
k k
e ist bewiesen.
Folglich konvergiert (x̃n ) gegen ξ und die Dichtheit von ϕ(X) in X
2.6 Kompakte und folgenkompakte Teilmengen metrischer Räume 65
so dass ϕ′ : (X, d) −→ (ϕ′ (X), d′ ) eine Isometrie und ϕ′ (X) ⊂ X ′ dicht ist. Dann definiert
die Abbildung
f : ϕ(X) −→ ϕ′ (X)
ϕ(x) 7−→ ϕ′ (x)
offensichtlich eine Isometrie zwischen den metrischen Räumen (ϕ(X), d) ˜ und (ϕ′ (X), d′ ).
Wir erweitern f zu einer Isometrie F zwischen (X, e d) ˜ und (X ′ , d′ ): Sei ξ ∈ X e und ξ =
lim x̃n für eine Folge (x̃n ) aus ϕ(X). Da (x̃n ) eine Cauchy-Folge in ϕ(X) ist, ist auch
n→∞
ihr Bild (f (x̃n )) eine Cauchy-Folge in ϕ′ (X). Sei ξ ′ := lim f (x̃n ) ∈ X ′ . ξ ′ ist korrekt
n→∞
definiert, d.h. unabhängig von der Wahl der Folge (x̃n ). Sei nämlich (ỹn ) eine weitere
˜ n , ỹn ) = d′ (f (x̃n ), f (ỹn )) → 0 , also lim f (ỹn ) = ξ ′ . Wir
Folge mit ξ = lim ỹn , so gilt d(x̃
n→∞ n→∞
erhalten somit eine Fortsetzung von f zu einer Abbildung
e −→ X ′
F :X
ξ = lim x̃n 7−→ ξ ′ = lim f (x̃n ) .
n→∞ n→∞
˜ η) = lim d(x̃
d(ξ, ˜ n , ỹn ) = lim d′ (f (x̃n ), f (ỹn )) = d′ (ξ ′ , η ′ ) = d′ (F (ξ), F (η)).
n→∞ n→∞
Bemerkung: Eine Möglichkeit zur Konstruktion der reellen Zahlen aus den rationalen
Zahlen besteht darin, die in Satz 2.29 beschriebene Vervollständigungsprozedur für die
Menge der rationalen Zahlen Q mit dem Abstand d(x, y) = |x − y| auszuführen. Die
entstehende Menge Qe erfüllt dann die Axiome der reellen Zahlen aus Kapitel 1.
Definition 2.25. Eine Teilmenge A eines metrischen Raumes (X, d) heißt folgenkompakt,
falls jede Folge in A eine in A konvergente Teilfolge besitzt.
Ist die gesamte Menge X folgenkompakt, so nennt man den metrischen Raum (X, d) fol-
genkompakt.
Bemerkung: Sei (X, d) ein metrischer Raum und A ⊂ X. Dann ist A ⊂ X genau dann
folgenkompakt, wenn der metrische Raum (A, d|A×A ) folgenkompakt ist.
Wir betrachten zunächst einige Beispiele für folgenkompakte Mengen. Im folgenden seien
R, C, Rk und Ck immer mit der Standardmetrik versehen.
66 2 Metrische Räume
Beweis. Sei A ⊂ R eine abgeschlossene und beschränkte Menge und (an ) eine Folge in A.
Dann ist (an ) ebenfalls beschränkt. Nach dem Satz von Bolzano-Weierstraß existiert eine
konvergente Teilfolge (ank ) von (an ). Der Grenzwert x dieser Teilfolge liegt in X. Nun gilt
aber x = lim ank ∈ cl(A) (siehe Satz 2.13). Da A abgeschlossen ist, ist A = cl(A), also
k→∞
liegt x in A. Die Menge A ist demnach folgenkompakt. ⊓
⊔
Satz 2.31 Sei (X, d) das Produkt der metrischen Räume (X1 , d1 ), . . . , (Xk , dk ) und seien
Aj ⊂ Xj folgenkompakte Mengen in (Xj , dj ), j = 1, . . . , k. Dann ist die Menge A :=
A1 × A2 × . . . × Ak folgenkompakt in (X, d).
Beweis. Den Beweis wird analog zum Beweis von Satz 2.27 geführt. Wir überlassen ihn
dem Leser als Übungsaufgabe. ⊓
⊔
Satz 2.32 Sei (X, d) ein metrischer Raum und B ⊂ X folgenkompakt. Dann ist jede
abgeschlossene Teilmenge A ⊂ B ebenfalls folgenkompakt.
Beweis. Sei (an ) eine beliebige Folge in A. Dann ist (an ) auch Folge in B und besitzt, da
B folgenkompakt ist, eine in B konvergente Teilfolge (anj ). Sei b = lim anj ∈ cl(A). Da A
j→∞
abgeschlossen ist, ist cl(A) = A und somit b ∈ A. Also enthält (an ) eine in A konvergente
Teilfolge. Damit ist A folgenkompakt. ⊓
⊔
Satz 2.33 Jede beschränkte und abgeschlossene Teilmenge von C, Ck und Rk ist folgen-
kompakt.
Beweis. Da Ck isometrisch zu R2k ist, genügt es, die Behauptung für die reellen Vek-
torräume Rk zu beweisen. Sei A eine beschränkte und abgeschlossene Teilmenge von Rk .
Da A beschränkt ist, gibt es einen Quader W ⊂ Rk , der A enthält. Da W folgenkompakt
und A abgeschlossen ist, ist A auch folgenkompakt. ⊓
⊔
Es gibt metrische Räume mit abgeschlossenen und beschränkten Teilmengen, die nicht
folgenkompakt sind. Sei z.B. X eine unendliche Menge mit der diskreten Metrik
(
0 x=y
d(x, y) =
1 x 6= y.
2.6 Kompakte und folgenkompakte Teilmengen metrischer Räume 67
In diesem metrischen Raum ist jede Teilmenge abgeschlossen und beschränkt. Eine abzähl-
bare Teilmenge A := {a1 , a2 , . . . , } ⊂ X ist aber nicht folgenkompakt: Eine Folge in (X, d)
ist genau dann konvergent, wenn sie ab einem bestimmten Index konstant ist. Folglich
besitzt die Folge (an ) keine konvergente Teilfolge.
Als nächstes beschäftigen wir uns mit speziellen Eigenschaften folgenkompakter Mengen.
Dazu zunächst folgende Definition.
Definition 2.26. Sei (X, d) ein metrischer Raum und A ⊂ X. Die Menge A heißt total
beschränkt, wenn es zu jedem ε > 0 endlich viele Punkte a1 , a2 , . . . , ak ∈ A gibt, so
S
k
dass A ⊂ K(ai , ε) . Ist die gesamte Menge X total beschränkt, so sagt man, dass der
i=1
metrische Raum (X, d) total beschränkt ist.
Eine total beschränkte Menge ist auch beschränkt, denn für endlich viele Kugeln gilt
Satz 2.34 Jede folgenkompakte Teilmenge eines metrischen Raumes ist abgeschlossen,
total beschränkt und insbesondere auch beschränkt.
A 6⊂ K(a1 , ε0 ) ∪ . . . ∪ K(ak , ε0 ).
Wir betrachten zunächst k = 1 und einen Punkt a1 ∈ A. Dann ist A 6⊂ K(a1 , ε0 ). Wir
wählen einen Punkt a2 ∈ A \ K(a1 , ε0 ). Dann gilt d(a1 , a2 ) ≥ ε0 > 0. Da A 6⊂ K(a1 , ε0 ) ∪
K(a2 , ε0 ), existiert ein a3 ∈ A \ (K(a1 , ε0 ) ∪ K(a2 , ε0 )). Also gilt d(a3 , a1 ) ≥ ε0 > 0 und
d(a3 , a2 ) ≥ ε0 > 0 . Wir führen dieses Verfahren fort und erhalten eine Folge von Punkten
a1 , a2 , a3 , . . . in A mit d(ai , aj ) ≥ ε0 > 0 für alle i 6= j. Diese Folge kann aber keine
konvergente Teilfolge enthalten. Dies widerspricht der Folgenkompaktheit von A. ⊓
⊔
Aus den Sätzen 2.33 und 2.34 erhalten wir eine spezielle Eigenschaft folgenkompakter
Mengen in den metrischen Räumen Rk und Ck .
Satz 2.35 Eine Teilmenge in Rk und in Ck ist genau dann folgenkompakt, wenn sie be-
schränkt und abgeschlossen ist.
Wie wir oben an einem Beispiel gesehen hatten, ist diese Charakterisierung folgenkompak-
ter Mengen in allgemeinen metrischen Räumen nicht möglich. Man hat aber für vollständi-
ge metrische Räume das folgende Kriterium für Folgenkompaktheit.
68 2 Metrische Räume
Satz 2.36 Sei (X, d) ein vollständiger metrischer Raum. Eine Teilmenge in (X, d) ist
genau dann folgenkompakt, wenn sie abgeschlossen und total beschränkt ist.
Nachdem wir bisher folgenkompakte Teilmengen betrachtet haben, die durch spezielle
Eigenschaften von Folgen definiert wurden, betrachten wir als nächstes einen Kompakt-
heitsbegriff, der mit Hilfe von offenen Mengen definiert wird.
Definition 2.27. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Eine Fami-
lie U = {Ui }i∈I von Teilmengen von X heißt offene Überdeckung von A, falls die folgenden
beiden Eigenschaften gelten:
(1) Ui ⊂ X ist offen für alle i ∈ I.
S
(2) A ⊂ Ui .
i∈I
S
Eine Teilmenge Û ⊂ U der Überdeckung U heißt Teilüberdeckung, wenn A ⊂ U.
U ∈Û
Eine Teilüberdeckung heißt endlich, wenn sie endlich viele Elemente enthält.
Definition 2.28. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt kompakt,
wenn man aus jeder offenen Überdeckung von A eine endliche Teilüberdeckung auswählen
kann. Ist die gesamte Menge X kompakt, so sagt man, dass der metrische Raum (X, d)
kompakt ist.
Es gilt wiederum, dass eine Teilmenge A eines metrischen Raumes (X, d) genau dann kom-
pakt ist, wenn der metrische Raum (A, d|A×A ) kompakt ist.
Im Folgenden beweisen wir, dass in metrischen Räumen beide Kompaktheitsbegriffe äqui-
valent sind.
Satz 2.37 Eine Teilmenge eines metrischen Raumes ist genau dann kompakt, wenn sie
folgenkompakt ist.
Damit könnte A aber nur endlich viele Folgenglieder von (an ) enthalten. Dies ist ein
Widerspruch zur Wahl von (an ). Also war unsere Annahme falsch und A ist folgenkompakt.
2.6 Kompakte und folgenkompakte Teilmengen metrischer Räume 69
1 ε ε ε
d(y, x) ≤ d(y, anl ) + d(anl , x) ≤ + < + = ε.
nl 2 2 2
Daraus folgt
1
K(anl , ) ⊂ K(x, ε) ⊂ U ∈ U ,
nl
d.h. wir können K(anl , n1l ) ∩ A sogar durch eine einzige Menge von U überdecken. Dies
widerspricht der Wahl von K(anl , n1l ). Somit war unsere Annahme falsch, d.h. aus jeder
offenen Überdeckung U von A kann man eine endliche Teilüberdeckung auswählen. A ist
also kompakt. ⊓
⊔
Folgerung 2.4 Kompakte Teilmengen metrischer Räume haben die folgenden Eigenschaf-
ten:
1. Jede kompakte Menge ist abgeschlossen.
2. Jede kompakte Menge ist total beschränkt, insbesondere beschränkt.
3. Jede abgeschlossene Teilmenge einer kompakten Menge ist selbst kompakt.
4. Das Produkt kompakter Mengen ist kompakt.
5. Eine Teilmenge im metrischen Raum Rn ist genau dann kompakt, wenn sie beschränkt
und abgeschlossen ist.
6. Eine Teilmenge in einem vollständigen metrischen Raum ist genau dann kompakt,
wenn sie abgeschlossen und total beschränkt ist.
Weitere Eigenschaften kompakter Mengen findet man in den Übungsaufgaben. Einen Spe-
zialfall der 5. Ausage dieser Folgerung findet man häufig unter dem Namen Überdeckungs-
satz von Heine/Borel.
70 2 Metrische Räume
Bemerkung: Wenn man sich den Satz 2.37 ansieht, fragt man sich natürlich, warum man
denn überhaupt zwei verschiedene Kompaktheitsbegriffe definiert, wenn diese dann doch
übereinstimmen. Ein Grund dafür ist, dass man die kompakten Mengen dadurch auf zwei
völlig verschiedene Weisen charakterieren kann (einmal durch Eigenschaften von Folgen,
zum anderen durch Eigenschaften offener Überdeckungen). Beide Varianten haben zum
Nachweis von Kompaktheit in verschiedenen Situationen jeweils Vorteile.
Der tieferliegende Grund ist aber der folgende: Die metrischen Räume sind eine spezielle
Klasse der sogenannten topologischen Räume, die wir hier kurz ergänzend einführen wol-
len:
Sei X eine nichtleere Menge. Eine Topologie auf X ist eine Familie T von Teilmengen von
X, die folgende Eigenschaften hat:
1. X, ∅ ∈ T .
2. Die Vereinigung beliebig vieler Teilmengen aus T ist ebenfalls in T .
3. Der Durchschnitt endlich vieler Teilmengen aus T ist ebenfalls in T .
Das Paar (X, T ) nennt man dann topologischen Raum. Die Elemente in T heißen die
offenen Mengen des topologischen Raumes (X, T ).
Ist (X, d) ein metrischer Raum, so bilden die offenen Mengen des metrischen Raumes nach
Satz 2.4 eine Topologie auf X. Jeder metrische Raum ist folglich ein spezieller topologischer
Raum. In topologischen Räumen kann man kompakte und folgenkompakte Mengen auf
die gleiche Weise definieren, wie im metrischen Raum. Man kann dann zeigen, dass es
sowohl topologische Räume gibt mit kompakten Mengen, die nicht folgenkompakt sind als
auch topologische Räume mit folgenkompakten Mengen, die nicht kompakt sind !!. Für
topologische Räume, die zu den Grundstrukturen der Analysis gehören, fallen die beiden
Kompaktheitsbegriffe also nicht mehr zusammen.
Definition 2.29. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt zusam-
menhängend, wenn es keine offenen und zueinander disjunkten Teilmengen U, V ⊂ X gibt,
so dass A ⊂ U ∪ V , A ∩ U 6= ∅ und A ∩ V 6= ∅.
Ist die Menge X selbst zusammenhängend, so nennt man den metrischen Raum (X, d)
zusammenhängend.
Beispiel: Sei X = R2 , U, V ⊂ X offene Teilmengen von X und A ⊂ X wie im Bild. Dann
ist A nicht zusammenhängend. U
A
2.7 Zusammenhängende Teilmengen und Zusammenhangskomponenten eines metrischen Raumes 71
Bemerkung: Nach Definition ist ein metrischer Raum (X, d) zusammenhängend, wenn
er sich nicht in die disjunkte Vereinigung zweier offener nichtleerer Mengen zerlegt. Man
kann wiederum zeigen, dass eine Teilmenge A eines metrischen Raumes (X, d) genau dann
zusammenhängend ist, wenn der metrische Raum (A, d|A×A ) zusammenhängend ist.
Wir beschreiben nun die zusammenhängenden Mengen im metrischen Raum R mit der
Standardmetrik d(x, y) = |x − y|.
Satz 2.38 Eine Teilmenge A ⊂ R ist genau dann zusammenhängend, wenn sie mit je
zwei Punkten a, b ∈ A auch das Intervall [a, b] vollständig enthält. Die einzigen zusam-
menhängenden Teilmengen in R sind folglich R, (−∞, b), (−∞, b], (a, ∞), [a, ∞), (a, b),
[a, b], (a, b], [a, b) und {a}.
Da U ∪ V die Menge A überdeckt, liegt z in U . Da U offen ist, existiert ein ε > 0 mit
(z − ε, z + ε) ⊂ U . Also gilt (z − ε, z + ε) ∩ [a, b] ⊂ U ∩ [a, b]. Es folgt min{z + ε, b} =
sup((z − ε, z + ε) ∩ [a, b]) ≤ sup(U ∩ [a, b]) = z. Dann muss b ≤ z gelten. Da andererseits
z ∈ [a, b], folgt b = z und somit z ∈ V . Da U und V disjunkt sind und z ∈ U , kann das
nicht gelten. Damit war unsere Annahme, dass A nicht zusammenhängend ist, falsch. ⊓ ⊔
Bemerkung: Der analoge Beweis liefert, dass jede Verbindungstecke zwischen zwei Punk-
ten im metrischen Raum Rn zusammenhängend ist.
Weitere zusammenhängende Teilmengen erhält man durch die folgenden beiden Sätze.
Satz 2.39 Sei (X, d) ein metrischer Raum und A ⊂ X eine zusammenhängende Teilmen-
ge. Gilt A ⊂ B ⊂ cl(A), so ist B ebenfalls zusammenhängend.
Insbesondere ist der Abschluss einer zusammenhängenden Menge selbst zusammenhängend.
B ∩ U = ∅ im Gegensatz zur Wahl von U , d.h. wir erhalten einen Widerspruch. Folglich
war unsere Annahme, dass B nicht zusammenhängend ist, falsch. ⊓
⊔
Satz 2.40 Sei (X, d) ein metrischer Raum und Ai , i ∈ I, beliebig viele zusammenhängen-
T
de Teilmengen mit nichtleerem Durchschnitt B := Ai 6= ∅.
S i∈I
Dann ist auch die Vereinigung A := Ai zusammenhängend.
i∈I
Beweis. Wir nehmen an, A wäre nicht zusammenhängend. Dann existieren offene, dis-
junkte Mengen U, V ⊂ X mit A ⊂ U ∪ V, A ∩ U 6= ∅ und A ∩ V 6= ∅. Für i ∈ I gilt dann
auch Ai ⊂ U ∪ V . Da Ai zusammenhängend ist, muss entweder Ai ∩ U = ∅ oder Ai ∩ V = ∅
gelten. Wir setzen
I1 := {i ∈ I | Ai ⊂ V } und I2 := {i ∈ I | Ai ⊂ U }.
Da A ∩ U 6= ∅ und A ∩ V 6= ∅ gilt I1 6= ∅ =
6 I2 . Wir erhalten
[ [ [
A= Ai = Ai ∪ Ai
i∈I i∈I1 i∈I2
und [ [
Ai ∩ Ai ⊂ V ∩ U = ∅.
i∈I1 i∈I2
T
Da für alle i ∈ I gilt ∅ =
6 B := Ak ⊂ Ai , folgt
k∈I
[ [
B⊂ Ai ∩ Ai = ∅.
i∈I1 i∈I2
Dies ist ein Widerspruch. Folglich war die Annahme falsch und A ist zusammenhängend.
⊓
⊔
Wir zeigen abschließend, dass sich jeder metrische Raum in disjunkte zusammenhängende
Teilmengen zerlegt.
Definition 2.30. Sei (X, d) ein metrischer Raum und x ∈ X. Die Menge
[
C(x) := A
A zush.
x∈A
Bemerkung:
(1) Nach Satz 2.40 ist C(x) zusammenhängend. Somit ist C(x) die größte zusammenhängen-
de Teilmenge von X, die x enthält.
(2) Jede Zusammenhangskomponente von (X, d) ist abgeschlossen.
Nach Satz 2.39 ist nämlich der Abschluss cl(C(x)) der Zusammenhangskomponente C(x)
ebenfalls zusammenhängend. Folglich gilt cl(C(x)) ⊂ C(x), also cl(C(x)) = C(x). Somit ist
2.8 Banachräume und Hilberträume 73
C(x) abgeschlossen.
(3) Sind x, y ∈ X, so gilt entweder C(x) = C(y) oder C(x) ∩ C(y) = ∅.
Wir betrachten den Fall, dass C(x) ∩ C(y) 6= ∅. Dann ist C(x) ∪ C(y) zusammenhängend
(nach Satz 2.40) und enthält x und y. Folglich gilt C(x)∪C(y) ⊂ C(x) und C(x)∪C(y) ⊂ C(y)
und somit C(x) = C(y) = C(x) ∪ C(y).
Satz 2.41 Sei (X, d) ein metrischer Raum. Dann zerlegt sich X in disjunkte Zusammen-
hangskomponenen, d.h.
[
X= Ci ,
i∈I
wobei die Mengen Ci zusammenhängend, abgeschlossen und paarweise disjunkt sind, und
Ci = C(xi ) für jeweils einen Punkt xi ∈ X gilt.
In diesem Abschnitt betrachten wir spezielle vollständige metrische Räume, deren Basis-
menge Vektorräume sind und deren Metrik durch eine Norm bzw. durch ein Skalarprodukt
gegeben ist.
Definition 2.31. Ein Vektorraum über dem Körper K (oder ein K-Vektorraum) ist ein
Tripel [V, +, ·], wobei V eine nichtleere Menge und + und · zwei Operationen
+ : V × V −→ V (Addition)
(v, w) 7−→ v + w
Wir werden Vektorräume auch kurz mit V bezeichnen, wenn die Operationen + und ·
klar sind. Ist K der Körper der reellen Zahlen, so heißt V reeller Vektorraum, ist K der
Körper der komplexen Zahlen, so heißt V komplexer Vektorraum. Die algebraische Theo-
rie von Vektorräumen wird in der Vorlesung über lineare Algebra behandelt. Insbesondere
wird dort erklärt werden, was die Dimension eines Vektorraumes ist. In der Analysis-
Vorlesung interessieren wir uns für topologische Eigenschaften von Vektorräumen, insbe-
sondere zunächst für die Definition einen geeigneten Konvergenzbegriffes für Folgen in
Vektorräumen. Dazu benutzt man Normen.
74 2 Metrische Räume
Definition 2.32. Sei V ein reeller oder komplexer Vektroraum. Eine Norm auf V ist eine
Abbildung k · k : V −→ R mit den folgenden Eigenschaften:
1. kxk ≥ 0 für alle x ∈ V und kxk = 0 ⇐⇒ x = 0.
2. kα · xk = |α| · kxk für alle α ∈ K und x ∈ V .
3. kx + yk ≤ kxk + kyk (Dreiecksungleichung).
Das Paar (V, k · k) heißt normierter Vektorraum.
wobei x = (x1 , . . . , xn ). Die Norm k · k2 auf dem Rn bzw. Cn ist die in Kapitel 1.4
betrachtete Euklidische Norm.
2. Sei X eine nichtleere Menge und bezeichne B(X) den Vektorraum aller beschränkten
reellwertigen Funktionen
R × B(X) −→ B(X)
(λ, f ) 7−→ λ · f mit (λ · f )(x) := λ · f (x).
Dann ist durch
kf k∞ := sup |f (x)| , f ∈ B(X)
x∈X
Auf jedem normierten Vektorraum wird durch die Norm auf kanonische Weise eine Metrik
induziert, die wir im Folgenden immer auf normierten Vektorräumen festlegen werden:
2.8 Banachräume und Hilberträume 75
Satz 2.42 Sei (V, k · k) ein normierter Raum. Dann ist die Abbildung d : V × V → R,
d(x, y) := kx − yk , x, y ∈ V,
Beweis. Der Beweis wird genauso wie für die Euklidische Norm in Kapitel 1.4., Satz 1.23
geführt. Dort haben wir nur die Norm-Eigenschaften, aber nicht die konkrete Gestalt der
Norm benutzt. ⊓
⊔
Definition 2.33. Ein normierter Vektorraum (V, k · k) heißt Banachraum, wenn er (als
metrischer Raum) vollständig ist.
Wir werden nun zeigen, dass die Vektorräume Rn und Cn mit jeder Norm Banachräume
sind. Dazu führen wir die folgende Äquivalenzrelation für Normen ein:
Definition 2.34. Sei V ein reeller oder komplexer Vektorraum. Zwei Normen k · k1 und
k · k2 auf V heißen äquivalent, wenn es positive Konstanten a, b ∈ R+ gibt, so dass gilt
Satz 2.43 Seien k · k1 und k · k2 zwei äquivalente Normen auf dem Vektorraum V . Dann
stimmen alle topologischen Eigenschaften von (V, k·k1 ) und (V, k·k2 ) überein. Insbesondere
gilt für Folgen (xn ) in V und für Teilmengen A ⊂ V :
1. (xn ) −→ x ∈ V bzgl. k · k1 gdw. (xn ) −→ x ∈ V bzgl. k · k2 .
2. (xn ) ist Cauchy-Folge bzgl. k · k1 gdw. (xn ) ist Cauchy-Folge bzgl. k · k2 .
3. A ist offen bzgl. k · k1 gdw. A ist offen bzgl. k · k2 .
4. A ist abgeschlossen bzgl. k · k1 gdw. A ist abgeschlossen bzgl. k · k2 .
5. A ist kompakt bzgl. k · k1 gdw. A ist kompakt bzgl. k · k2 .
6. A ist zusammenhängend bzgl. k · k1 gdw. A ist zusammenhängend bzgl. k · k2 .
Beweis. Aus (∗) folgen für die Kugeln Ki (x, ε) bzgl. der Norm k · ki die folgenden Bezie-
hungen
ε
K1 (x, ε) ⊂ K2 (x, b · ε) , K2 (x, ε) ⊂ K1 (x, ) ∀ ε > 0.
a
Da Konvergenz von Folgen, Cauchy-Folgen und offene Mengen mittels ε-Kugeln definiert
sind, folgt die Äquivalenz dieser Eigenschaften für k · k1 und k · k2 aus diesen Beziehungen
der Kugeln zueinander. Eine Menge ist abgeschlossen, wenn ihr Komplement offen ist.
Die Äquivalenz der Offenheit liefert somit auch die Äquivalenz der Abgeschlossenheit.
Kompakte und zusammenhängende Mengen sind ebenfalls durch offene Mengen definiert,
deshalb sind auch diese Eigenschaften für beide Normen äquivalent. ⊓
⊔
76 2 Metrische Räume
Satz 2.44 Alle Normen auf den Vektorräumen Rn bzw. Cn sind zueinander äquivalent.
Beweis. Wir beweisen die Behauptung für den reellen Vektorraum Rn . Der Beweis für Cn
wird analog geführt.
Sei k · k2 : Rn −→ R die Euklidische Norm auf dem Rn und N : Rn −→ R eine beliebige
Norm. Da die Äquivalenz von Normen eine Äquivalenzrelation ist, genügt es zu zeigen,
dass die Normen k · k2 und N äquivalent sind. Wir müssen also positive reelle Konstanten
a und b finden, so dass
Wir setzen a := inf{N (y) | kyk2 = 1} ≥ 0 . Dann gilt N (x) ≥ a · kxk2 für alle x ∈ Rn . Es
bleibt zu zeigen, dass a > 0.
Angenommen a = 0. Sei S n−1 := {y ∈ Rn | kyk2 = 1 } die Sphäre vom Radius 1 im Rn .
Nach Definition von a existiert eine Folge (xn ) in S n−1 mit N (xn ) −→ a = 0. Da die
Sphäre S n−1 in Rn beschränkt und abgeschlossen bzgl. der Euklidischen Norm k · k2 ist,
ist sie folgenkompakt bzgl. k · k2 (siehe Satz 2.33). Folglich existiert eine Teilfolge (xnk )
von (xn ), die gegen einen Vektor y0 ∈ S n−1 bzgl. k · k2 konvergiert. Wir erhalten dann aus
der Dreiecksungleichung für N und der in (1) bewiesenen Ungleichung
Bei k gegen +∞ konvergiert die rechte Seite dieser Ungleichung gegen 0. Folglich ist
N (y0 ) = 0 und somit y0 = 0. Dies widerspricht y0 ∈ S n−1 . Somit ist a > 0. ⊓
⊔
Da Rn und Cn mit der Euklidischen Norm vollständig sind, folgt aus den Sätzen 2.43 und
2.44, dass die Vektroräume Rn und Cn mit jeder Norm Banachräume sind. In der Vorlesung
2.8 Banachräume und Hilberträume 77
über lineare Algebra wird beweisen, dass jeder reelle Vektorraum der Dimension n < +∞
isomorph zu Rn und jeder komplexe Vektorraum der Dimension n < +∞ isomorph zu Cn
ist. Dies liefert
Für ∞–dimensionale Vektorräume gilt Satz 2.44 und die daraus abgeleitete Folgerung
nicht mehr. Im Laufe der Analysis-Vorlesung werden wir weitere vollständige und unvoll-
ständige unendlich-dimensionale normierte Vektorräume, insbesondere Vektorräume von
Funktionen, kennenlernen. Solche Vektorräume spielen bei der Untersuchung partieller
Differentialgleichungen eine wichtige Rolle.
Abschließend befassen wir uns mit dem Begriff des Skalarproduktes auf einem Vektorraum,
den wir bereits in einem Spezialfall in Kapitel 1.4. betrachtet haben.
Definition 2.35. Sei H ein reeller oder komplexer Vektorraum und bezeichne K den da-
zugehörigen Körper der reellen bzw. komplexen Zahlen. Ein Skalarprodukt auf H ist eine
Abbildung h·, ·i : H × H −→ K mit folgenden Eigenschaften:
Ein Beispiel für ein Skalarprodukt auf dem Vektorraum Cn kennen wir bereits aus Kapitel
1.4: Xn
hz, wiC :=n zj · w̄j , , wobei z = (z1 , . . . , zn ), w = (w1 , . . . , wn ).
j=1
Satz 2.45 Sei h·, ·i ein Skalarprodukt auf dem Vektorraum H. Dann ist durch
p
kxk := hx, xi , x ∈ H,
eine Metrik auf H definiert. Des Weiteren gilt die Cauchy-Schwarzsche Ungleichung:
wobei die Gleichheit genau dann angenommen wird, wenn x und y linear abhängig sind.
Beweis. Der Beweis wird wie in Kapitel 1.4., Satz 1.22 geführt. Dort haben wir dies für das
spezielle Skalarprodukt h·, ·iCn auf Cn bewiesen. Wir haben dabei aber nicht die spezielle
Form des Skalarproduktes, sondern nur seine allgemeinen Eigenschaften benutzt. ⊓
⊔
78 2 Metrische Räume
Bemerkung: Ein Vektorraum (H, h·, ·i) mit Skalarprodukt ist im Folgenden immer mit
p
der von h·, ·i erzeugten Norm kxk = hx, xi und der dadurch induzierten Metrik versehen.
Ist eine Norm gegeben, so möchte man gern wissen, ob diese durch ein Skalarprodukt wie
oben beschrieben definiert ist. Dies ist nicht immer der Fall. Ein Kriterium dafür liefert
der Satz
Satz 2.46 Sei (V, k · k) ein normierter Vektorraum. Es existiert genau dann ein Salarpro-
dukt h·, ·i mit kxk2 = hx, xi für alle x ∈ V , wenn für die Norm das Parallelogrammgesetz
gilt:
kx + yk2 + kx − yk2 = 2(kxk2 + kyk2 ) ∀x, y ∈ V.
Beweis. Übungsaufgabe. ⊓
⊔
Definition 2.36. Ein Hilbertraum ist ein Vektorraum H mit Skalarprodukt h·, ·i, dessen
p
zugehöriger normierter Raum (H, k · k = h·, ·i) ein Banachraum ist.
Reihen in Banachräumen
Reihen sind spezielle Folgen in Vektorräumen. Sie werden z.B. oft benutzt, um Funk-
tionen zu definieren oder Funktionen geeignet zu approximieren. Die Untersuchung der
Konvergenz von Reihen ist deshalb von besonderem Interesse. In diesem Kapitel werden
wir Reihen in Banachräumen behandeln und Kriterien für ihre Konvergenz kennenlernen.
Im gesamten 3. Kapitel bezeichnet E einen Banachraum über dem Körper der reellen oder
der komplexen Zahlen mit der Norm k · k. Als Spezialfall kann man sich an Stelle von E
zum Beispiel die reellen Zahlen R bzw. die komplexen Zahlen C mit dem Betrag der Zahlen
als Norm oder die Vektorräume Rn bzw. Cn mit der Euklidischen Norm
X n 1
2
kxk := |xk |2 , x = (x1 , . . . , xn ),
k=1
P
n
Den Vektor sn := x1 + . . . + xn = xk nennt man die n-te Partialsumme der Reihe.
k=1
∞
P
Eine Reihe xk in E heißt konvergent, falls die Folge der Partialsummen (sn ) in E
k=1
konvergiert. Ist (sn ) konvergent, so heißt s := lim sn Wert der Reihe und man schreibt
n→∞
∞
X
s= xk .
k=1
∞
X ∞
X
xk = +∞ oder xk = −∞.
k=1 k=1
Die Reihe ist in diesem Fall in R divergent. Gilt xk ≥ 0 für alle k ∈ N, so bedeutet die
Schreibweise
X∞
xk < +∞,
k=1
gilt.
3.2 Konvergenzkriterien für Reihen in Banachräumen 81
Beweis. Da der Banachraum E vollständig ist, konvergiert die Folge der Partialsummen
sn = x1 + . . . + xn genau dann, wenn sie eine Cauchy-Folge ist. Dies ist nach Definition
der Cauchy-Folge genau dann erfüllt, wenn zu jedem ε > 0 ein n0 ∈ N existiert, so dass
für alle m ≥ n ≥ n0 die Ungleichung ksm − sn−1 k < ε gilt, was äquivalent zum Cau-
chy–Kriterium (∗) ist. ⊓
⊔
Der folgende Satz gibt ein nützliches notwendiges Kriterium für die Konvergenz einer
Reihe an:
∞
P
Satz 3.2 Ist eine Reihe xk im Banachraum E konvergent, so ist die Folge der Rei-
k=1
henglieder (xk ) eine Nullfolge in E.
∞
P
Beweis. Zum Beweis nutzen wir das Cauchy–Kriterium für m = n. Konvergiert xk ,
k=1
dann existiert für alle ε > 0 ein n0 ∈ N, so dass kxn k < ε für alle n ≥ n0 . Daraus folgt
lim xn = 0. ⊓
⊔
n→∞
∞
X
zk = 1 + z + z2 + z3 + z4 + . . .
k=0
Behauptung:
∞
P 1
1. Ist |z| < 1, so konvergiert die geometrische Reihe und für ihren Wert gilt zk = 1−z .
k=0
∞
P
2. Ist |z| ≥ 1, so divergiert die geometrische Reihe zk .
k=0
1 − z n+1
sn = 1 + z + . . . + z n = .
1−z
1
Für |z| < 1 ist (z n+1 ) eine Nullfolge und somit gilt lim sn = 1−z .
n→∞
∞
P
Für |z| ≥ 1 ist |z k | ≥ 1 und somit ist (z k ) keine Nullfolge. Deshalb ist z k divergent
k=0
(siehe Satz 3.2). ⊓
⊔
∞
P
Satz 3.3 Ist eine Reihe xk im Banachraum E absolut–konvergent, so ist sie auch
k=1
konvergent und für die Werte der Reihen gilt
X∞
X ∞
xk
≤ kxk k. (∗∗)
k=1 k=1
∞
P
Beweis. Sei kxk k konvergent. Entsprechend dem Cauchy-Kriterium gibt es zu jedem
k=1
ε > 0 ein n0 ∈ N, so dass
Reihen im Banachraum E kann man addieren und mit reellen bzw. komplexen Zahlen mul-
tiplizieren. Im folgenden bezeichnet K den Körper der reellen Zahlen, falls E ein reeller
Banachraum ist, bzw. den Körper der komplexen Zahlen, falls E ein komplexer Banach-
raum ist.
3.2 Konvergenzkriterien für Reihen in Banachräumen 83
Satz 3.4 Seien (xk ) und (yk ) Folgen im Banachraum E und λ, µ ∈ K. Konvergieren die
P∞ P∞ ∞
P
Reihen xk und yk gegen x bzw. y , so konvergiert die Reihe (λxk +µyk ) gegen
k=1 k=1 k=1
λx + µy.
P
n P
n P
n
Beweis. Seien sn := xk , sˆn := yk und s∗n := (λxk + µyk ) . Dann gilt
k=1 k=1 k=1
s∗n = λsn + µsˆn . Die Behauptung des Satzes folgt aus den Grenzwertsätzen für Folgen in
Vektorräumen (analog zu Satz 2.16). ⊓
⊔
∞
P
Beweis. Wir nutzen wiederum das Cauchy–Kriterium. Sei ck konvergent. Dann gibt es
k=1
für alle ε > 0 ein n0 ∈ N, so dass
cn + . . . + cm < ε ∀ m ≥ n ≥ n0 .
Beispiel 3: Sei E = C. Wir betrachten eine Folge komplexer Zahlen (ak ) mit |ak | ≤ 1 für
alle k ∈ N und z ∈ C mit |z| < 1.
∞
P
Behauptung: Die Reihe ak z k ist absolut–konvergent und für ihren Wert gilt:
k=0
∞
X 1
k
ak z ≤ .
1 − |z|
k=0
Beweis. Dies folgt aus dem Majorantenkriterium und der Konvergenz der geometrischen
Reihe, da
∞
X 1
|ak z k | = |ak | · |z|k ≤ |z|k und |z|k = .
1 − |z|
k=0
⊓
⊔
84 3 Reihen in Banachräumen
kxk+1 k
Beweis. 1. Sei α = lim sup kxk k < 1 . Dann existiert ein k0 ∈ N, so dass
k→∞
kxk+1 k 1+α
< <1 ∀ k ≥ k0 .
kxk k 2
Folglich gilt
1+α
kxk+1 k < kxk k ∀ k ≥ k0
2
und somit j
1+α
kxk0 +j k < kxk0 k ∀j ≥ 0.
2
3.2 Konvergenzkriterien für Reihen in Banachräumen 85
∞
P
α+1
Da 2 < 1, konvergiert die geometrische Reihe ( α+1 j
2 ) . Aus dem Majorantenkriterium
j=0
∞
P
folgt dann, dass die Reihe xk absolut konvergiert.
k=1
kx k kx k
2. Sei nun β = lim inf kxk+1
kk
> 1 . Dann sind höchstens endlich viele der Zahlen kxk+1 kk
k→∞
kleiner als 1. Folglich existiert ein k0 ∈ N, so dass 0 < kxk k ≤ kxk+1 k für alle k ≥ k0 gilt.
∞
P
Also ist (xk ) keine Nullfolge. Nach Satz 3.2 ist deshalb die Reihe xk divergent. ⊓
⊔
k=1
Beispiel 4: Ob man das Wurzel- oder das Quotientenkriterium anwendet, muß man an-
hand der Gestalt der Reihenglieder entscheiden. Das Wurzelkriterium ist leistungsfähiger
P∞
als das Quotientenkriterium. Betrachten wir z.B. E = R und die Reihe xk , wobei
k=1
xk := 2−k für gerade k und xk := 8−k für ungerades k sei. Das Wurzelkriterium zeigt
√
Konvergenz an, da lim sup k xk = 12 gilt, während das Quotientkriterium keine Aussage
k→∞
xk+1 xk+1
liefert, da lim infxk = 0 und lim sup xk = +∞ gilt.
k→∞ k→∞
absolut–konvergent.
k
Beweis. Wir benutzen das Quotientenkriterium mit xk = zk! :
xk+1 z k+1 · k! |z|
=
xk z k · (k + 1)! = k + 1 −→ 0
ist absolut-konvergent, falls |z| < 1 und divergent, falls |z| > 1.
86 3 Reihen in Banachräumen
k p |z| √
Beweis. Wir benutzen das Wurzelkriterium. Mit xk := zk ist k |xk | = √ k . Da lim k k =
p p k k→∞
1 gilt, konvergiert die Folge ( k |xk |) gegen |z|. Damit ist lim sup k |xk | = |z| und das
k→∞
Wurzelkriterium liefert die Behauptung. ⊓
⊔
Wir interessieren uns natürlich auch dafür, was mit der Konvergenz für z ∈ C mit |z| = 1
passiert. Für z = 1 ist die obige Reihe gerade die harmonische Reihe, also divergent. Um
die anderen Fälle mit |z| = 1 behandeln zu können, beweisen wir ein weiteres Kriterium.
Da (an ) eine Nullfolge ist, existiert zu jedem ε > 0 ein n0 ∈ N, so dass kσm − σn k < ε
für alle m > n ≥ n0 . Damit ist (σn ) eine Cauchy–Folge und konvergiert im Banachraum
E. ⊓
⊔
Beispiel 7 (Fortsetzung):
P∞ k
z
Die Reihe k ist konvergent für z ∈ C mit |z| = 1 und z 6= 1.
k=1
∞
P zk
Das folgende Bild zeigt das Konvergenzverhalten der Reihe k .
k=1
iR 6
divergent i konvergent
-
1
R
absolut konvergent
ist konvergent. Wir werden später sehen, dass ihr Wert − ln 2 ist.
Als nächstes betrachten wir Reihen reeller Zahlen, die sich so verhalten wie die alternie-
rende harmonische Reihe.
∞
P
Definition 3.3. Eine Reihe xk reeller Zahlen heißt alternierend, wenn die Reihenglie-
k=1
der ihr Vorzeichen wechseln, d.h. wenn
xk+1 > 0 ⇐⇒ xk < 0 ∀ k ∈ N.
n
X
k
s − (−1) bk ≤ bn+1
k=1
Beweis. Zum Beweis benutzen wir das Abel–Dirichlet–Kriterium. Wir setzen in Satz 3.8
xk := (−1)k und ak := bk . Dann ist sn = x1 + . . . + xn ∈ {0, −1}, also beschränkt, und (ak )
Pn
eine monoton fallende Nullfolge. Folglich konvergiert (−1)k bk . Für den Wert s dieser
k=1
Reihe gilt
und somit
|s − sn | < |sn+1 − sn | = bn+1 .
konvergiert nach dem Leibnitz-Kriterium. Wir werden später sehen, dass der Grenzwert
π
4 ist.
sn := x1 + . . . + xn
tm := x1 + 2x2 + 4x4 + . . . + 2m x2m .
Zunächst schätzen wir diese beiden Partialsummen gegeneinander ab. Nach Voraussetzung
ist die Folge (xk ) monoton fallend. Somit gilt für alle n < 2m+1
2m Summanden
z }| {
sn = x1 + . . . + xn ≤ x1 + (x2 + x3 ) + . . . + (x2m + . . . + x2m+1 −1 )
≤ x1 + 2x2 + . . . + 2m x2m = tm .
Folglich gilt
s n ≤ tm ∀ n < 2m+1 (∗).
sn = x1 + . . . + x2k + . . . + xn
2m−1 Summanden
z }| {
≥ x1 + x2 + (x3 + x4 ) + . . . + (x2m−1 +1 + . . . + x2m )
1 1
≥ x1 + x2 + 2x4 + . . . + 2m−1 x2m = tm .
2 2
Folglich gilt
2sn ≥ tm ∀ n ≥ 2m (∗∗).
∞
P
Nach Satz 2.18 konvergiert dann die Folge (tm ), also die Reihe 2j x2j .
j=0
∞
P
(⇐=): Sei 2j x 2j konvergent. Dann ist die Folge (tm ) konvergent und folglich beschränkt.
j=0
Wegen (∗) ist dann auch die Folge (sn ) beschränkt. Außerdem ist (sn ) monoton wachsend.
∞
P
Nach Satz 2.18 konvergiert dann die Folge (sn ), also die Reihe xk . ⊓
⊔
k=1
Beweis. Da p > 0, sind die Voraussetzungen von Satz 3.10 erfüllt. Dann gilt
∞
X ∞
X ∞
X
1 j 1
konvergiert ⇐⇒ 2 j p = (2(1−p) )j konvergiert.
kp (2 )
k=1 j=0 j=0
∞
P
Die geometrische Reihe (2(1−p) )j konvergiert genau dann, wenn 2(1−p) < 1 d.h. genau
j=0
dann, wenn p > 1 gilt. ⊓
⊔
Wir haben bereits gesehen, dass man konvergente Reihen in Banachräumen addieren und
mit Skalaren multiplizieren kann. Betrachtet man nur Reihen im Banachraum der kom-
plexen Zahlen (E = C), so kann man sie auch auf bestimmte Weise multiplizieren.
∞
P ∞
P
Definition 3.4. Seien ak und bk zwei Reihen in C. Wir betrachten eine neue Reihe
k=0 k=0
∞
P
ck mit den Reihengliedern
k=0
k
X
ck := aj · bk−j = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0
j=0
∞
P ∞
P ∞
P
Die Reihe ck heißt Cauchy–Produkt der Reihen ak und bk .
k=0 k=0 k=0
Wir wollen die Frage untersuchen, unter welchen Bedingungen aus der Konvergenz der Rei-
∞
P ∞
P ∞
P
hen ak und bk die Konvergenz des Cauchy-Produktes ck folgt. Im allgemeinen
k=0 k=0 k=0
folgt sie nicht.
90 3 Reihen in Banachräumen
Diese Reihen konvergieren nach dem Leibnitz–Kriterium für alternierende Reihen. Be-
P
k
trachten wir aber die Folge ck = aj bk−j , so erhalten wir
j=0
Xk k
X
(−1)j (−1)k−j (−1)k
ck = √ ·√ = p .
j=0
j+1 k − j + 1 j=0 (j + 1)(k − j + 1)
Es gilt
2 2 2
1 1 1
(k − j + 1)(j + 1) = k+1 − k−j ≤ k+1
2 2 2
und folglich
k+1 2(k + 1)
|ck | ≥ 1 = −→ 2.
2k
+1 k+2
∞
P
Damit ist (ck ) keine Nullfolge und die Reihe ck somit divergent.
k=0
∞
P ∞
P
Satz 3.11 Seien ak und bk konvergente Reihen komplexer Zahlen und sei min-
k=0 k=0
destens eine der beiden Reihen absolut–konvergent. Dann konvergiert ihr Cauchy–Produkt
P∞
ck und für die Werte der Reihen gilt
k=0
∞
X X
∞ X
∞
ck = ak · bk .
k=0 k=0 k=0
∞
P P
n P
n
Beweis. Sei oBdA ak absolut–konvergent. Wir setzen An := ak , Bn := bk ,
k=0 k=0 k=0
P
n
Cn := ck . Weiterhin bezeichne A := lim An , B = lim Bn und βn = Bn − B . Dann
k=0 n→∞ n→∞
erhalten wir
Cn = c 0 + c 1 + . . . + c n
= a0 b0 + (a0 b1 + a1 b0 ) + . . . + (a0 bn + a1 bn−1 + . . . + an b0 )
= a0 · Bn + a1 · Bn−1 + . . . + an · B0
= a0 (βn + B) + a1 (βn−1 + B) + . . . + an (β0 + B)
= An · B + a0 βn + a1 βn−1 + . . . + an β0 .
| {z }
=:γn
Somit konvergiert die Folge (γn ) gegen 0 und die Folge (Cn = An · B + γn ) gegen A · B. ⊓
⊔
In einer endlichen Summe kann man die Summanden beliebig umordnen, ohne den Wert
der Summe zu verändern. Dies ist für Reihen (”unendliche Summen”) nicht mehr der
Fall. Abschließend untersuchen wir deshalb die Frage, unter welchen Bedingungen man
Reihenglieder umordnen kann, ohne die Konvergenz zu verlieren.
∞
P
Definition 3.5. Sei xk eine Reihe im Banachraum E und f : N −→ N eine bijektive
k=1
P∞ ∞
P
Abbildung. Die Reihe xf (k) heißt Umordnung von xk .
k=1 k=1
92 3 Reihen in Banachräumen
Man kann die Glieder einer Reihe nicht beliebig umordnen. Betrachten wir z.B. die Reihe
1 1 1 1 1 1
√ − √ + √ − √ + √ − √ ± ... (∗)
1 1 2 2 3 3
Die Reihe (∗) ist konvergent, denn für die Partialsummen gilt
)
s2m = 0
1 dh. sm −→ 0.
s2m+1 = √m+1
∞
P ∞
P ∞
P
Beweis. Sei xf (k) eine Umordnung von xk . Nach Voraussetzung ist xk absolut-
k=1 k=1 k=1
∞
P
konvergent, also auch konvergent, d.h. es existiert ein s ∈ E mit s = xk . Es bezeichne
k=1
Aus (∗) folgt ksp − s∗p k < 2ε für alle p ≥ p0 . Da die Folge (sp ) gegen s konvergiert, gibt es
auch ein n∗0 ∈ N so dass ksp − sk < 2ε für alle p > n∗0 . Damit erhalten wir
Ohne die Voraussetzung der absoluten Konvergenz gilt Satz 3.13 nicht mehr. Es gilt sogar
der folgende ziemlich erstaunliche Satz:
∞
X ∞
X
pm = +∞ , qm = −∞ (∗)
m=1 m=1
∞
P
Wir konstruieren nun die gesuchte Umordnung der Reihe ak . Wegen (∗) kann man
k=1
schrittweise eine Folge jeweils kleinster Indizes n0 , n1 , n2 , . . . mit der folgenden Eigenschaft
wählen:
94 3 Reihen in Banachräumen
P
n0
n0 so dass pm > s
m=1
Pn0 P
n1
n1 so dass pm + qm < s
m=1 m=1
Pn0 Pn1 P
n2
n2 > n0 so dass pm + qm + pm > s
m=1 m=1 m=n0 +1
Pn0 Pn1 P
n2 P
n3
n3 > n1 so dass pm + qm + pm + qm < s
m=1 m=1 m=n0 +1 m=n1 +1
..
.
Die Reihe
Als Anwendung der Konvergenzkriterien aus Kapitel 3.2 betrachten wir in diesem Ab-
schnitt spezielle Reihen im Banachraum der komplexen Zahlen, die sogenannten Potenz-
reihen.
Definition 3.6. Sei z0 ∈ C und (an ) eine Folge komplexer Zahlen. Eine Potenzreihe mit
dem Zentrum z0 ist eine Reihe komplexer Zahlen der Form
∞
X
P (z) := an (z − z0 )n , z ∈ C.
n=0
Wir wollen die Frage untersuchen, für welche z ∈ C die Potenzreihe P (z) konvergiert.
Offensichtlich konvergiert die Potenzreihe P (z) für z = z0 und es gilt P (z0 ) = a0 .
∞
P
Satz 3.15 Sei P (z) = an (z − z0 )n eine Potenzreihe mit dem Zentrum z0 und sei
n=0
z1 6= z0 .
1. Ist P (z1 ) konvergent, so ist P (z) für jedes z ∈ C mit |z − z0 | < |z1 − z0 | absolut-
konvergent.
2. Ist P (z1 ) divergent, so ist P (z) für jedes z ∈ C mit |z − z0 | > |z1 − z0 | divergent.
3.5 Komplexe Potenzreihen 95
∞
P
Beweis. Zu 1: Da die Reihe P (z1 ) = an (z1 −z0 )n konvergiert, ist die Folge (an (z1 −z0 )n )
n=0
eine Nullfolge, also insbesondere beschränkt. Sei C ∈ R so gewählt, dass |an (z1 −z0 )n | ≤ C
für alle n ∈ N0 . Dann gilt
n
n z − z0
z − z0 n
n
|an (z − z0 ) | = |an (z1 − z0 ) |
≤C · .
z1 − z0 z1 − z0
Wir können die Aussage aus Satz 3.15 jetzt auch folgendermaßen formulieren:
∞
P
Satz 3.16 Sei P (z) := an (z−z0 )n eine komplexe Potenzreihe mit Zentrum z0 ∈ C und
n=0
dem Konvergenzradius R. Dann ist P (z) für jeden Punkt z ∈ K(z0 , R) absolut-konvergent
und für jeden Punkt z ∈ C \ cl K(zo , R) divergent.
1
falls λ ∈ R+
λ
R= 0 falls λ = +∞
+∞ falls λ = 0.
p p
Beweis. Sei α := lim sup n
|an (z − z0 )n | = lim sup n |an | · |z − z0 | = λ · |z − z0 | . Nach
n→∞ n→∞
dem Wurzelkriterium konvergiert P (z) für α < 1 und divergiert für α > 1.
(1) Sei 0 < λ < +∞. Dann folgt sofort:
( 1
konvergiert für alle z mit |z − z0 | < λ
P (z)
divergiert für alle z mit |z − z0 | > λ1 .
Folglich ist R = λ1 .
(2) Sei λ = 0, dann ist auch α = 0. Somit konvergiert P (z) für alle z ∈ C und der
Konvergenzradius R ist +∞.
(3) Sei λ = +∞. Dann gilt (
0 z = z0
α=
+∞ z 6= z0 .
Die Reihe P (z) divergiert also für alle z 6= z0 . Somit ist R = 0. ⊓
⊔
In Kapitel 1.2 haben wir Potenzen aq definiert, wobei a eine positive reelle Zahl und der
Exponent q eine rationale Zahl bezeichnet. In diesem Abschnitt wollen wir Potenzen az für
komplexe Exponenten z ∈ C erklären und die Eigenschaften dieser Potenzen untersuchen.
Dazu betrachten wir zunächst die folgende komplexe Potenzreihe:
∞
X zn z2 z3
E(z) := =1+z+ + + ...
n! 2! 3!
n=0
. . · e} = en
. . + 1}) = E(1) · . . . · E(1) = e| · .{z
E(n) = E(1| + .{z
| {z }
n−mal n−mal n−mal
1 1
Für n ∈ −N gilt E(n) = E(−n) = e−n = en . Folglich ist E(n) = en für alle n ∈ Z. Sei
n
nun q ∈ Q und q = m , wobei n ∈ Z und m ∈ N. Dann ist
Definition 3.8. Unter der komplexen Potenz ez der Eulerzahl e verstehen wir den Wert
der Potenzreihe E(z), d.h.
∞
X zn
ez := E(z) = .
n!
n=0
98 3 Reihen in Banachräumen
Die Funktion
exp : C −→ C
z 7−→ ez
heißt Exponentialfunktion.
Satz 3.20 Die Funktion exp|R : R −→ R+ ist streng monoton wachsend und bijektiv.
Außerdem gilt:
Somit ist die Funktion exp|R streng monoton wachsend. Insbesondere ist sie deshalb in-
jektiv. Es bleibt zu zeigen, dass exp|R : R → R+ surjektiv ist.
Sei y ∈ R+ . Wir suchen eine Zahl s ∈ R mit es = y. Dazu betrachten wir die folgenden
Mengen
A := {x ∈ R | ex < y} und B := {x ∈ R | y ≤ ex }.
Sei s ∈ R die auf Grund des Vollständigkeitsaxioms der reellen Zahlen existierende Schnitt-
zahl des Dedekindschen Schnittes (A|B). Wir zeigen nun, dass es = y gilt.
Wir wissen, dass a ≤ s ≤ b für alle a ∈ A, b ∈ B. Sei (an ) eine Folge in A, die gegen s
konvergiert. Dann gilt ean < y und
|s − an |
|es − ean | = |ean ||e(s−an ) − 1| < |y| · −→ 0.
1 − |s − an |
Daraus folgt lim ean = es ≤ y. Sei (bn ) eine Folge in B, die gegen s konvergiert. Dann
n→∞
gilt ebn ≥ y und
3.6 Anwendung: Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen 99
|bn − s|
|ebn − es | = |es ||e(bn −s) − 1| ≤ |es | · −→ 0.
1 − |bn − s|
Definition 3.9. Die Umkehrfunktion von exp|R bezeichnen wir mit ln : R+ −→ R und
nennen ln(y) den natürlichen Logarithmus von y.
Die Zahl ln(y) ist also eindeutig bestimmt durch die Bedingung eln(y) = y. Daraus ergeben
sich folgende Eigenschaften für den natürlichen Logarithmus:
Das folgende Bild zeigt den Funktionsverlauf der reellen Funktionen exp|R und ln.
R6 .
..
.. e x
..
..
...
..
...
...
..
e ...
...
.
..
.....
.
....
....
....
............................
.................
ln(x)
1 .
.......
.
..
.......
. ............
..........
..
..
..
.........
. ..
..
..........
.
........
.............. ......
......
...................................
...
.
....
..... -
...
...
..
1 R
...
...
...
...
..
..
...
.
..
..
..
..
Dies rechtfertigt die folgende Definition der komplexen Potenzen einer positiven reellen
Zahl a:
Definition 3.10. Sei a ∈ R+ und z ∈ C. Unter der Potenz az verstehen wir die komplexe
Zahl
∞
X (z · ln(a))n
az := eln(a)·z = .
n!
n=0
1. 1z = 1 und a0 = 1.
2. az · bz = (ab)z .
3. az · aw = az+w .
4. a−z = a1z .
5. (ax )z = ax·z .
expa : R −→ R+
x 7−→ ax
bijektiv, streng monoton wachsend, falls a > 1, und streng monoton fallend, falls 0 < a < 1.
Die Umkehrfunktion zu expa bezeichnen wir mit
loga : R+ −→ R
und nennen loga (y) den Logarithmus von y zur Basis a. Aus den Potenzgesetzen von Satz
3.22 folgen dann unmittelbar die Aussagen des folgenden Satzes.
Satz 3.23 Die Funktion loga : R+ −→ R ist bijektiv, streng monoton wachsend, falls
a > 1, und streng monoton fallend, falls 0 < a < 1. Für x, y ∈ R+ , ρ ∈ R und a ∈ R+ gilt:
1. loga x = ln x
ln a .
2. loga (x · y) = loga x + loga y.
3. loga (xρ ) = ρ · loga x.
4. loga ( xy ) = loga (x) − loga (y).
5. loga (1) = 0, loga (a) = 1.
4
In diesem Abschnitt bezeichnen (X, dX ) und (Y, dY ) metrische Räume, A ⊂ X eine Teil-
menge von X und f : A ⊂ X −→ Y eine auf A definierte Abbildung. Die Vektorräume
Rn und Cn , n ∈ N, seien immer mit der Euklidischen Metrik versehen.
x3 − y 3 (x − y)(x2 + xy + y 2 ) xy
= = (x − y) 1 + .
x2 + y 2 x2 + y 2 x2 + y 2
Wegen x2xy
+y 2
≤ 1
2 , folgt
3
|f (x, y)| ≤ |x − y|.
2
Sei nun ((xn , yn )) eine beliebige gegen (0, 0) konvergente Folge in A. Dann gilt xn −→ 0
und yn −→ 0 , somit xn − yn −→ 0 und folglich |f (xn , yn )| −→ 0. Wir erhalten also
lim f (xn , yn ) = 0 für alle Folgen (xn , yn ) −→ (0, 0) und somit lim f (x, y) = 0. ⊓
⊔
n→∞ (x,y)→(0,0)
102 4 Stetige Abbildungen zwischen metrischen Räumen
Beweis. Wir betrachten die Folgen (an ) und (bn ) in A mit an := ( n1 , n1 ) und bn := ( n12 , n1 ).
Dann gilt
1
an = ( n1 , n1 ) −→ (0, 0), f (an ) = 1
n3
+ 14
= n
n2 +1
−→ 0,
n2 n
1
bn = ( n12 , n1 ) −→ (0, 0), f (bn ) = 1
n4
+ 14
= 1
2 −→ 21 .
n4 n
Satz 4.1 Sei f : A ⊂ X −→ Y eine Abbildung und x0 ∈ HP (A). Dann sind die folgenden
Bedingungen äquivalent:
1. lim f (a) = y0 .
a→x0
d.h. so dass für alle a ∈ A mit 0 < dX (x0 , a) < δ gilt dY (y0 , f (a)) < ε.
Beweis. (1) =⇒ (2): Sei lim f (a) = y0 . Angenommen 2. gilt nicht, das heißt es existiert
a→x0
ein ε0 > 0, so dass es zu jedem δ > 0 ein a ∈ A gibt mit 0 < dX (x0 , a) < δ und
dY (y0 , f (a)) ≥ ε0 . Wir wählen speziell δ = n1 . Dann erhalten wir eine Folge (an ) in
A \ {x0 } so dass dX (x0 , an ) < n1 und dY (y0 , f (an )) ≥ ε0 gilt. Daraus folgt an −→ x0 und
f (an ) 6−→ y0 . Dies steht aber im Widerspruch zu der Voraussetzung lim f (an ) = y0 .
n→∞
(2) =⇒ (1): Sei 2. erfüllt. Wir betrachten eine gegen x0 konvergente Folge (an ) in A \ {x0 }.
Sei ε > 0. Nach Voraussetzung existiert ein δ > 0, so dass
f A ∩ KX (x0 , δ) \ {x0 } ⊂ KY (y0 , ε).
Da (an ) gegen x0 konvergiert, existiert ein n0 ∈ N, so dass dX (x0 , an ) < δ für alle n ≥ n0 .
Folglich ist dY (y0 , f (an )) < ε für alle n ≥ n0 . Also konvergiert (f (an )) gegen y0 und zwar
für jede Folge (an ) in A \ {x0 } mit an −→ x0 . ⊓
⊔
Wir betrachten als nächstes den Fall, dass der metrische Raum (Y, dY ) ein Produktraum
ist.
Sei x0 ∈ HP (A). Dann hat f in x0 genau dann einen Grenzwert, wenn jede Komponente
fj von f in x0 einen Grenzwert hat und für diese Grenzwerte gilt:
lim f (a) = ( lim f1 (a), . . . , lim fn (a)).
a→x0 a→x0 a→x0
Beweis. Die Behauptung folgt aus dem Satz 2.12 über die Konvergenz von Folgen in
Produkträumen. ⊓
⊔
Spezialfall: Für eine Abbildung f : A ⊂ X −→ C gilt im Falle der Existenz der Grenz-
werte:
lim f (a) = lim Re(f (a)) + i · lim Im(f (a)).
a→x0 a→x0 a→x0
Die speziellen Rechenregeln für konvergente Folgen in Vektorräumen, siehe Satz 2.16,
liefern unmittelbar die folgenden Aussagen über Grenzwerte von Abbildungen mit Werten
in Vektorräumen1 :
1
Im Beweis von Satz 2.16 hatten wir lediglich die Eigenschaften eines Vektorraumes und die Eigenschaften
von Skalarprodukt und Norm benutzt und nicht die spezielle Situation für den Kn .
104 4 Stetige Abbildungen zwischen metrischen Räumen
Im metrischen Raum R hatten wir außer den konvergenten Folgen auch Folgen betrachtet,
die gegen +∞ oder −∞ streben und diesen den uneigentlichen Grenzwert ±∞ zugeordnet.
Wir betrachten die analoge Situation für Grenzwerte von Abbildungen f : A ⊂ X −→ Y ,
wobei X = R oder Y = R ist. Dabei treten 3 Fälle auf:
Satz 4.4 Sei f : A ⊂ X −→ R eine Abbildung von einer Teilmenge eines metrischen
Raumes X in die reellen Zahlen und x0 ∈ HP (A). Dann sind folgende Bedingungen
äquivalent:
Beweis. Der Beweis wird analog zum Beweis von Satz 4.1 geführt. ⊓
⊔
Folge (an ) in (c, +∞) mit an −→ +∞. Wir schreiben in diesem Fall lim f (a) = y0 .
a→+∞
Analog definiert man lim f (a) = y0 .
a→−∞
Satz 4.5 Mit den obigen Bezeichnungen sind folgende Bedingungen äquivalent:
1. lim f (a) = y0 .
a→+∞
2. Für alle ε > 0 existiert ein M > 0 so dass dY (f (a), y0 ) < ε für alle a > M .
Beweis. Der Beweis wird analog zum Beweis von Satz 4.1 geführt. ⊓
⊔
Beweis. Die erste Behauptung folgt, da |f1 (t)| = 1t . Für die 2. Behauptung betrachte man
die Folge (tn = nπ). Da f2 (2kπ) = 1 und f2 ((2k + 1)π) = −1 , hat die Bildfolge (f2 (tn ))
zwei verschiedene Häufungspunkte. ⊓
⊔
Satz 4.6 Sei f : (α, β) ⊂ R −→ R eine monoton wachsende Funktion. Dann existieren
für jedes x0 ∈ (α, β) die einseitigen Grenzwerte in R und es gilt
106 4 Stetige Abbildungen zwischen metrischen Räumen
lim f (a) = sup{f (t) | α < t < x0 } und lim f (a) = inf{f (t) | x0 < t < β}.
a→x−
0 a→x+
0
Beweis. Da f monoton wächst, ist die Menge {f (t) | α < t < x0 } von oben durch f (x0 )
beschränkt. Folglich existiert das Supremum
Nach Definition des Supremums gibt es zu jedem ε > 0 ein t∗ ∈ (α, x0 ), so dass
y0 − ε < f (t∗ ) ≤ y0 . Da f monoton wachsend ist, gilt desweiteren
Sei nun δ := x0 − t∗ . Dann folgt aus (∗), dass für alle |x0 − t| < δ mit t < x0 die
Abschätzung |y0 − f (t)| < ε gilt. Somit ist lim f (t) = y0 .
t→x−
0
Analog beweist man lim f (t) = inf{f (t) | β > t > x0 }. ⊓
⊔
t→x+
0
x
Beispiel 5: Sei a > 1 gegeben. Dann gilt lim a = +∞.
x→+∞ x
Beweis. Es ist
x2 · ln2 (a)
ax = ex·ln(a) = 1 + x · ln(a) + + ... .
2!
Für a > 1 ist ln(a) > 0. Für x > 0 erhalten wir somit
ax 1 ln2 (a) ln2 (a)
= + ln(a) +x · ... >
+ |{z} · x.
x |x {z } 2! 2
>0
>0
ax
Da offensichtlich lim x = +∞, folgt lim = +∞. ⊓
⊔
x→+∞ x→+∞ x
x
Beispiel 6: Es gilt lim = +∞.
x→+∞ ln(x)
x ln(x)
Beweis. Wir wissen, dass ln(x) = eln(x) . Sei (xn ) eine gegen +∞ strebende Folge. Dann
gilt yn := ln(xn ) → +∞, da ln streng monoton wachsend und bijektiv ist. Aus Beispiel 5
ln(xn )
erhalten wir lim eln(xn ) = +∞. ⊓
⊔
n→+∞
ln(1+x)
Beispiel 7: Es gilt lim x = 1.
x→0
x
Beweis. Für x > −1 gilt 1+x ≤ ln(1 + x) ≤ x (siehe Übung 10). Daraus folgt
1 ln(1 + x)
≤ ≤1, falls x > 0, und
1+x x
1 ln(1 + x)
≥ ≥1, falls − 1 < x < 0.
1+x x
1 ln(1+x)
Da lim = 1, folgt aus den Grenzwertsätzen lim = 1. ⊓
⊔
x→0 1+x x→0 x
4.2 Stetige Abbildungen (Definition und Beispiele) 107
1
Beispiel 8: Es gilt lim (1 + x) x = e und lim (1 + x1 )x = e.
x→0 x→+∞
|x|
Beweis. Nach Satz 3.19 gilt |ex − 1| ≤ 1−|x| für alle |x| < 1. Folglich ist lim ean = 1
n→∞
für jede Nullfolge (an ). Sei nun (xn ) eine beliebige Nullfolge in R mit xn 6= 0 und
un := ln(1+x
xn
n)
− 1 . Aus Beispiel 7 ergibt sich, dass (un ) eine Nullfolge ist. Also gilt
1 1
1 = lim eun = lim eln (1+xn )· xn · e−1 = lim (1 + xn ) xn · e−1
n→∞ n→∞ n→∞
und somit
1
lim (1 + xn ) xn = e.
n→∞
⊓
⊔
1. f heißt stetig im Punkt x0 ∈ X, falls zu jedem ε > 0 ein δ > 0 existiert, so dass
Y
6
graph(f )
f (x0 ) 62ε •
?
-
x0 X
Satz 4.7 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen. Dann sind
folgende Bedingungen äquivalent:
1. f : X −→ Y ist in x0 ∈ X stetig.
108 4 Stetige Abbildungen zwischen metrischen Räumen
2. f : X −→ Y ist in x0 ∈ X folgenstetig.
3. x0 ist ein isolierter Punkt von X oder x0 ist ein Häufungspunkt von X und es gilt
lim f (x) = f (x0 ).
x→x0
Da die Folge (xn ) gegen x0 konvergiert, existiert ein n0 ∈ N, so dass xn ∈ KX (x0 , δ) für
alle n ≥ n0 . Folglich ist f (xn ) ∈ KY (f (x0 ), ε) für alle n ≥ n0 . Also konvergiert (f (xn ))
gegen f (x0 ).
(2) =⇒ (3) : Jeder Punkt x0 ∈ X ist entweder isoliert oder ein Häufungspunkt von X.
Ist x0 ∈ HP (X), so existiert eine gegen x0 konvergente Folge (xn ) in X \ {x0 }. Nach (2)
konvergiert dann für jede dieser Folgen die Bildfolge (f (xn )) gegen f (x0 ), das heißt es gilt
lim f (x) = f (x0 ).
x→x0
(3) =⇒ (1) : Wenn x0 ein isolierter Punkt ist, so existiert ein δ > 0, so dass KX (x0 , δ) =
{x0 }. Dann ist
f (KX (x0 , δ)) = {f (x0 )} ⊂ KY (f (x0 ), ε)
Als nächstes betrachten wir ein spezielles Kriterien für die Stetigkeit reeller Funktionen2 .
Satz 4.8 Sei f : A ⊂ R −→ R eine reelle Funktion und x0 ∈ (α, β) ⊂ A. Dann ist f in
x0 genau dann stetig, wenn die beiden einseitigen Grenzwerte in x0 existieren und
Angenommen, f sei in x0 nicht stetig. Dann ist f in x0 nicht folgenstetig, d.h. es existiert
eine Folge (an ) in A, die gegen x0 konvergiert, deren Bildfolge aber nicht gegen f (x0 )
2
Auf Teilmengen A ⊂ R betrachten wir im Folgenden ebenfalls die durch den Betrag definierte Metrik.
4.2 Stetige Abbildungen (Definition und Beispiele) 109
konvergiert. Da dann fast alle Folgenglieder an von x0 verschieden sind, existiert eine
Teilfolge (ank ) von (an ) mit ank < x0 oder eine Teilfolge (ank ) von (an ) mit ank > x0 , deren
Bildfolge (f (ank )) nicht gegen f (x0 ) konvergiert. Dies widerspricht der Voraussetzung
lim f (x) = lim f (x) = f (x0 ). ⊓
⊔
x→x0 − x→x0 +
Satz 4.8 zeigt, dass es genau drei verschiedene Typen von Unstetigkeitsstellen einer reellen
Funktion gibt. Die Funktion f : A ⊂ R −→ R ist genau dann in x0 ∈ (α, β) ⊂ A unstetig,
wenn einer der folgenden Fälle vorliegt:
(1)Hebbare Unstetigkeitsstelle
Beide einseitigen Grenzwerte von f in x0 existieren in R und stimmen überein, sind aber
ungleich f (x0 ). In diesem Fall kann man die Unstetigkeit von f in x0 durch Abände-
rung von f (x0 ) beheben.
Beispiel:
0 x = 0 R
6
f (x) :=
1 x 6= 0 f
)(
Der Punkt x0 = 0 ist eine hebbare Unstetig- • -
keitsstelle. R
(2)Sprungstelle
Die beiden einseitigen Grenzwerte von f in x0 existieren in R, sind aber voneinander
verschieden. Unter dem Sprung σ(f, x0 ) von f in x0 verstehen wir die Differenz der
einseitigen Grenzwerte
Beispiel: R
6 f
x + x
x 6= 0
|x|
f (x) := 1 (
0 x=0
• -
Dann ist der Punkt x0 = 0 eine Sprungstelle ) −1 R
und der Sprung σ(f, x0 ) = 2.
(3)Unstetigkeitsstelle 2. Art 3
Mindestens einer der beiden einseitigen Grenzwerte von f in x0 existiert nicht in R.
Die folgenden Beispiele zeigen die beiden typischen Fälle für diese Situation:
Als erstes betrachten wir die Dirichlet-Funktion
3
Hebbare Unstetigkeitsstellen und Sprungstellen nennt man auch Unstetigkeitsstellen 1. Art.
110 4 Stetige Abbildungen zwischen metrischen Räumen
1 x ∈ Q
h(x) :=
0 x 6∈ Q
Sei 1 R
x x 6= 0 6
f (x) :=
0 x=0
f
Der Punkt x0 = 0 ist eine Unstetigkeitsstel- -
le zweiter Art, denn lim f (x) = +∞ und R
x→0+
lim f (x) = −∞.
x→0−
Satz 4.9
1. Eine monotone Funktion f : A ⊂ R −→ R ist in x0 ∈ (α, β) ⊂ A genau dann stetig,
wenn
lim f (x) = lim f (x).
x→x0 + x→x0 −
Als nächstes stellen wir einige Eigenschaften stetiger Abbildungen zwischen metrischen
Räumen zusammen, die sich unmittelbar aus der Definition der Stetigkeit, der Äquivalenz
zur Folgenstetigkeit und den Rechenregeln für konvergente Folgen ergeben.
Beweis. Sei (xn ) eine Folge in X, die gegen x0 konvergiert. Da f in x0 stetig und somit
folgenstetig ist, konvergiert die Folge (f (xn )) in Y gegen f (x0 ). Wegen der Stetigkeit von g
in f (x0 ) konvergiert dann die Folge (g(f (xn )) = (g ◦ f )(xn )) gegen g(f (x0 )) = (g ◦ f )(x0 ).
Folglich ist g ◦ f in x0 folgenstetig und somit stetig. ⊓
⊔
4.2 Stetige Abbildungen (Definition und Beispiele) 111
Satz 4.11 Seien (X, dX ) und (Y, dY ) metrische Räume und A eine Teilmenge von X. Ist
f : X −→ Y stetig, so ist auch die Einschränkung f|A : A −→ Y stetig bzgl. der auf A
durch dX induzierten Metrik dA := (dX )|A×A .
Beweis. Sei (an ) eine Folge in A, die im metrischen Raum (A, dA ) gegen a ∈ A konvergiert.
Dann konvergiert (an ) auch bzgl. der Metrik dX von X gegen a. Nach Voraussetzung
konvergiert (f (an )) gegen f (a) in Y , also ist f|A in a folgenstetig und somit stetig. ⊓
⊔
Satz 4.12
1. Sei f : X −→ Y1 × . . . × Yn eine Abbildung in das Produkt metrischer Räume und
f = (f1 , . . . , fn ) die Komponentendarstellung von f . Die Abbildung f ist genau dann
in x0 ∈ X stetig, wenn jede Komponente fj : X −→ Yj , j = 1, . . . , n , in x0 stetig ist.
2. Sei f : X1 × X2 −→ Y stetig in (x1 , x2 ) ∈ X1 × X2 . Dann ist
h1 : X1 −→ Y in x1 stetig ,
x 7−→ f (x, x2 )
h2 : X2 −→ Y in x2 stetig .
x 7−→ f (x1 , x)
Satz 4.13 Sei X ein metrischer Raum und (V, k · k) ein normierter Vektorraum über dem
Körper K der reellen oder der komplexen Zahlen.
wobei alle aj und bj komplexe Zahlen sind. Dann ist die rationale Funktion
f := PP21 : A := {z ∈ C | P2 (z) 6= 0} ⊂ C −→ C
an z n + an−1 z n−1 + . . . + a1 z + a0
f (z) :=
bm z m + bm−1 z m−1 + . . . + b1 z + b0
auf A stetig.
f : R+ × C −→ C
(a, z) 7→ az
ist stetig.
Beweis. Sei (a0 , z0 ) ∈ R+ × C. Wir betrachten eine beliebige gegen (a0 , z0 ) konvergente
Folge ((an , zn )). Dann gilt an −→ a0 und zn −→ z0 . Da nach der natürliche Logarithmus
stetig ist, folgt
lim ln(an ) · zn = ln(a0 ) · z0 .
n→∞
Die rechte Seite von (*) konvergiert bei n → +∞ gegen 0 und somit gilt lim aznn = az00 .
n→∞
Folglich ist f in (a0 , z0 ) folgenstetig, also stetig. ⊓
⊔
Beispiel 5: Seien a0 ∈ R+ und z0 ∈ C fixiert. Aus Satz 4.12 und Beispiel 4 folgt die
Stetigkeit der Abbildungen
d : X × X −→ R
(x, y) 7−→ d(x, y)
ist stetig.
Beweis. Sei (x, y) ∈ X ×X und ((xn , yn )) eine Folge, die in X ×X gegen (x, y) konvergiert.
In einem metrischen Raum gilt die Vierecksungleichung
Da xn → x und yn → y, folgt d(xn , x) → 0 und d(yn , y) → 0 und somit d(xn , yn ) → d(x, y).
⊓
⊔
Beispiel 7: Sei V ein Vektorraum über dem Körper K der reellen oder der komplexen
Zahlen. Dann ist jede Norm k · k : V −→ R und jedes Skalarprodukt h·, ·i : V × V −→ K
stetig bezüglich der von der Norm bzw. vom Skalarprodukt auf V induzierten Metrik.
Beweis. Dies folgt aus dem Verhalten des Skalarproduktes und der Norm bei konvergenten
Folgen (Satz 2.16), welches die Folgenstetigkeit der beiden Abbildungen zeigt. ⊓
⊔
Als nächstes definieren wir zwei Stetigkeitsbegriffe, die stärker als die gewöhnliche Stetig-
keit sind.
Definition 4.4.
1. Eine Abbildung f : X −→ Y heißt gleichmäßig stetig, wenn zu jedem ε > 0 ein δ > 0
existiert, so dass
f (KX (x, δ)) ⊂ KY (f (x), ε)
(Im Unterschied zur Definition der Stetigkeit hängt hier die Größe von δ nur von ε,
aber nicht von x ab.)
2. Eine Abbildung f : X −→ Y heißt lipschitzstetig, wenn es eine positive Konstante
L ∈ R+ gibt, so dass für alle x1 , x2 ∈ X
Satz 4.14 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen. Dann gilt:
Beweis. Stetigkeit folgt per Definition aus gleichmäßiger Stetigkeit. Wir müssen also nur
zeigen, dass jede lipschitzstetige Abbildung gleichmäßig stetig ist.
Sei f lipschitzstetig mit Lipschitz–Konstante L und ε > 0. Wir setzen δ := Lε . Seien nun
x1 , x2 ∈ X mit dX (x1 , x2 ) < δ = Lε . Aus der Lipschitzstetigkeit folgt dann
Die folgenden beiden Beispiele zeigen, dass die Umkehrungen der Aussagen des Satzes 4.14
nicht gelten.
Beispiel 1:
Die Abbildung
Y6
..
+
..
..
.. Für ein fixes ε muß δ
f : R −→ R ..
..
..
1
..
..
..
..
..
für x → 0 immer kleiner
x 7−→ ..
..
..
gewählt werden.
x ..
..
..
..
...
...
ist stetig, aber nicht gleichmäßig stetig. ε⌢ ...
...
...
⌣ ....
....
ε⌢
......
.........
...............
...........................
⌣ .......................................
)-
................
() (
δ δ X
Die rechte Seite von (∗) konvergiert bei x −→ 0 gegen +∞. Man kann also für ein gegebenes
ε > 0 kein δ > 0 finden, so dass die rechte Seite von (∗) für jedes x > 0 kleiner als ε bleibt.
Folglich ist f nicht gleichmäßig stetig. ⊓
⊔
f : R+ −→ R+
√
x 7−→ x
Beweis. Es gilt
√ √ p
| x − y| ≤ |x − y| ∀ x, y ∈ R+ .
√ √
(siehe Übungsaufgabe 10). Für ε > 0 setzen wir δ := ε2 . Ist |x−y| < δ, so folgt | x− y| ≤
ε. Somit ist f gleichmäßig stetig.
Angenommen f wäre lipschitzstetig mit der Lipschitz-Konstanten L, das heißt
4.3 Eigenschaften stetiger Abbildungen 115
√ √
| x − y| ≤ L|x − y| ∀ x, y ∈ R+ .
Dann gilt √
x − √y 1
∀ x, y ∈ R+ .
x − y = √x + √y ≤ L
Für hinreichend kleine x und y kann man aber √ 1√ beliebig groß machen. Dies ergibt
x+ y
den Widerspruch. ⊓
⊔
Satz 4.15 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen. Dann sind
folgende Bedingungen äquivalent:
1. f ist stetig.
2. Das Urbild jeder offenen Menge ist offen.
3. Das Urbild jeder abgeschlossenen Menge ist abgeschlossen.
Beweis. (1. =⇒ 2.) Sei f : X −→ Y stetig und U ⊂ Y offen. Wir wollen zeigen, dass das
Urbild
f −1 (U ) := {x ∈ X | f (x) ∈ U } ⊂ X
dann ebenfalls offen ist. Ist f −1 (U ) = ∅, so ist die Behauptung erfüllt. Sei also f −1 (U ) 6= ∅
und x0 ∈ f −1 (U ) ein beliebig gewählter Punkt. Dann gilt f (x0 ) ∈ U , und da U ⊂ Y offen
ist, existiert ein ε > 0 mit KY (f (x0 ), ε) ⊂ U . Da f in x0 stetig ist, gibt es ein δ > 0, so
dass
f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε) ⊂ U.
KX (x0 , δ) ⊂ f −1 (U ).
f −1 (Y \ M ) = X \ f −1 (M ).
Sei nun das Urbild f −1 (U ) jeder offenen Menge U ⊂ Y offen. Wir betrachten eine beliebige
abgeschlossene Menge A ⊂ Y . Dann ist Y \ A offen in Y und folglich f −1 (Y \ A) =
X \ f −1 (A) offen in X. Dies bedeutet, dass f −1 (A) abgeschlossen in X ist. Damit ist 2.
=⇒ 3. bewiesen. Die Umkehrung zeigt man analog. ⊓
⊔
Wir betrachten als nächstes das Verhalten von zusammenhängenden Mengen bei stetigen
Abbildungen:
Satz 4.16 Sei f : X −→ Y eine stetige Abbildung zwischen metrischen Räumen. Dann
ist das Bild jeder zusammenhängenden Menge ebenfalls zusammenhängend.
Beweis. Sei A ⊂ X eine zusammenhängende Menge. Wir wollen zeigen, dass dann auch
das Bild f (A) ⊂ Y zusammenhängend ist. Angenommen f (A) ⊂ Y wäre nicht zusam-
menhängend. Dann existieren offene Mengen U, V ⊂ Y mit
• U ∩ V = ∅,
• f (A) ⊂ U ∪ V ,
• f (A) ∩ U 6= ∅ und f (A) ∩ V 6= ∅.
Da f stetig ist, sind nach Satz 4.15 die Urbilder f −1 (U ) und f −1 (V ) ebenfalls offen.
Desweiteren gilt für diese Urbilder
• f −1 (U ) ∩ f −1 (V ) = f −1 (U ∩ V ) = f −1 (∅) = ∅,
• A ⊂ f −1 (f (A)) ⊂ f −1 (U ∪ V ) = f −1 (U ) ∪ f −1 (V ),
• A ∩ f −1 (U ) 6= ∅ und A ∩ f −1 (V ) 6= ∅ , da ein a ∈ A mit f (a) ∈ U und ein b ∈ A mit
f (b) ∈ V existieren.
Folglich ist A nicht zusammenhängend, was ein Widerspruch zur Voraussetzung ist. ⊓
⊔
Beweis. Nach Satz 4.16 ist f (A) ⊂ R zusammenhängend und deshalb nach Satz 2.38 ein
(verallgemeinertes) Intervall. Das heißt mit a, b ∈ f (A) und a < b ist auch [a, b] ⊂ f (A).
⊓
⊔
4.3 Eigenschaften stetiger Abbildungen 117
Definition 4.5. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt bogen-
zusammenhängend (oder wegzusammenhängend), falls zu je zwei Punkten a, b ∈ A eine
stetige Abbildung ω : [0, 1] ⊂ R −→ A ⊂ X existiert, so dass ω(0) = a und ω(1) = b.
Die Abbildung ω heißt Weg in A von a nach b.
Beispiele:
1. Konvexe Mengen im Rn :
Eine Teilmenge A ⊂ Rn heißt konvex, wenn mit je zwei Punkten x, y ∈ A auch die
Verbindungsstrecke xy := {x + t(y − x) | t ∈ [0, 1]} vollständig in A liegt. Jede konvexe
Menge ist bogenzusammenhängend, da die Abbildung ω : [0, 1] −→ A
ω(t) := x + t(y − x)
2. Sternförmige Mengen im Rn :
Eine Teilmenge A ⊂ Rn heißt sternförmig, wenn ein Punkt x0 ∈ A existiert, so dass für
jeden Punkt x ∈ A die Verbindungsstrecke x0 x vollständig in A liegt. Jede sternförmige
Menge ist bogenzusammenhängend. Sind x, y ∈ A, so ist die Vereinigung der Strecken
xx0 ∪x0 y in A enthalten und man kann sie als Bild eines Weges von x nach y darstellen.
Satz 4.18 Sei f : X −→ Y eine stetige Abbildung. Dann ist das Bild jeder bogenzusam-
menhängenden Teilmenge ebenfalls bogenzusammenhängend.
Beweis. Sei A ⊂ X bogenzusammenhängend. Wir wollen zeigen, dass das Bild f (A)
ebenfalls bogenzusammenhängend ist. Seien x, y ∈ f (A) zwei Punkte in f (A). Dann
existieren a, b ∈ A mit x = f (a), y = f (b). Da A bogenzusammenhängend ist, gibt
es einen (stetigen) Weg ω : [0, 1] −→ A von a nach b. Wir betrachten die Abbildung
f ◦ ω : [0, 1] −→ f (A) ⊂ Y . Da f und ω stetig sind, ist f ◦ ω ebenfalls stetig. Weiterhin
118 4 Stetige Abbildungen zwischen metrischen Räumen
gilt (f ◦ ω)(0) = f (ω(0)) = f (a) = x und (f ◦ ω)(1) = f (ω(1)) = f (b) = y, d.h. f ◦ ω ist
ein Weg in f (A) von x nach y. ⊓
⊔
Als nächstes beschäftigen wir uns mit dem Verhalten von kompakten Mengen bei stetigen
Abbildungen:
Satz 4.19 Sei f : X −→ Y eine stetige Abbildung. Dann ist das Bild jeder kompakten
Menge ebenfalls kompakt.
Beweis. Sei K ⊂ X eine kompakte Teilmenge. Wir wollen zeigen, dass dann auch das Bild
f (K) ⊂ Y kompakt ist. Sei U = {Ui }i∈I eine beliebige offene Überdeckung von f (K), das
heißt die Mengen Ui sind offen in Y und es gilt
[
f (K) ⊂ Ui .
i∈I
Da f stetig ist, sind die Urbilder f −1 (Ui ) in X offen (siehe Satz 4.15). Außerdem gilt
[ [
K ⊂ f −1 Ui = f −1 (Ui ).
i∈I i∈I
eine offene Überdeckung von K. Da K ⊂ X kompakt ist, existiert eine endliche Teilüber-
deckung von K aus U ∗ , das heißt es existieren i1 , . . . , in ∈ I, so dass
K ⊂ f −1 (Ui1 ) ∪ . . . ∪ f −1 (Uin ) = f −1 Ui1 ∪ . . . ∪ Uin .
Somit ist {Ui1 , . . . , Uin } eine endliche Teilüberdeckung von f (K) aus U . Folglich ist f (K)
kompakt. ⊓
⊔
Die folgenden beiden Sätze sind Anwendungen der gerade bewiesenen Eigenschaft stetiger
Abbildungen.
Beweis. Sei K ⊂ X kompakt. Dann ist f (K) ⊂ R ebenfalls kompakt, und somit ins-
besondere beschränkt und abgeschlossen (Folgerung 2.4). Da f (K) ⊂ R beschränkt
ist, existieren das Infimum S∗ := inf(f (K)) und das Supremum S ∗ := sup(f (K)). Da
f (K) abgeschlossen ist, liegen sowohl das Supremum S ∗ als auch das Infimum S∗ in
f (K). D.h. es existieren Punkte a, b ∈ K mit S∗ = f (a) = min{f (x) | x ∈ K} und
S ∗ = f (b) = max{f (x) | x ∈ K} . ⊓
⊔
Beweis. Angenommen f|K : K −→ Y wäre nicht gleichmäßig stetig. Dann existiert ein
ε0 > 0, so dass es für alle δ > 0 einen Punkt xδ ∈ K gibt mit
Wir setzen δ = n1 . Dann erhalten wir für jedes n ∈ N zwei Punkte xn , x∗n ∈ K mit
1
dX (xn , x∗n ) < und dY (f (xn ), f (x∗n )) ≥ ε0 .
n
Betrachten wir nun die Folgen (xn ) und (x∗n ) in K genauer. Da K kompakt, also nach
Satz 2.37 folgenkompakt ist, existiert eine Teilfolge (xnk ) von (xn ), die gegen einen Punkt
x0 ∈ K konvergiert. Wir zeigen, dass die Teilfolge (x∗nk ) von (x∗n ) ebenfalls gegen x0
konvergiert. Es gilt
d(x0 , x∗nk ) ≤ d(x0 , xnk ) + d(xnk , x∗nk ) .
| {z } | {z }
→0 < n1
k
Daher gilt x∗nk −→ x0 ∈ K. Da f stetig, also auch folgenstetig ist, konvergieren dann die
Bildfolgen f (xnk ) und f (x∗nk ) für k gegen +∞ gegen f (x0 ). Somit ist
0 < ε0 ≤ d(f (xnk ), f (x∗nk )) ≤ d(f (xnk ), f (x0 )) + d(f (x0 ), f (x∗nk )) .
| {z } | {z }
→0 →0
Beispiel: Sei X = (0, 1) ∪ {2} ⊂ R und Y = (0, 1] ⊂ R. Wir betrachten die Abbildung
f : X −→ Y gegeben durch
(
t falls t ∈ (0, 1)
f (t) :=
1 falls t = 2.
120 4 Stetige Abbildungen zwischen metrischen Räumen
f ist stetig und bijektiv, da f|(0,1) = id(0,1) und 2 ∈ X ein isolierter Punkt ist. Aber
f −1 : (0, 1] −→ (0, 1) ∪ {2} ist nicht stetig, da (0, 1] zusammenhängend, aber f −1 ((0, 1]) =
(0, 1) ∪ {2} nicht zusammenhängend ist.
Beispiel: Der Rn ist homöomorph zur Kugel K(x0 , r) um einen Punkt x0 ∈ Rn vom
Radius r. Die folgende Abbildung ist ein Homöomorphismus:
f : K(x0 , r) −→ Rn
x−x0
x 7−→ r−kx−x0 k
Beweis. Dies folgt aus den vorherigen Sätzen über das Verhalten von offenen, abgeschlos-
senen, kompakten, zusammenhängenden bzw. bogenzusammenhängenden Mengen bei ste-
tigen Abbildungen und aus der Äquivalenz von Stetigkeit und Folgenstetigkeit. ⊓
⊔
Will man nachweisen, dass eine bijektive stetige Abbildung ein Homöomorphismus ist, so
muß man die Stetigkeit der inversen Abbildung nachweisen. Ist der Urbildraum kompakt,
so kann man sich diesen Nachweis sparen, denn es gilt der folgende Satz:
Definition 4.7. Sei X ein metrischer Raum. Eine Abbildung f : X −→ X heißt kontrahie-
rend (oder Kontraktion), wenn sie lipschitzstetig mit einer Lipschitzkonstanten 0 < L < 1
ist, das heißt wenn
x1 := f (x0 ),
x2 := f (x1 ) = f 2 (x0 ),
..
.
xn := f (xn−1 ) = f 2 (xn−2 ) = . . . = f n (x0 ).
Dann gilt
Für n > m folgt mit der Dreiecksungleichung und der Formel für die geometrische Summe
122 4 Stetige Abbildungen zwischen metrischen Räumen
Wir benötigen für die Stetigkeit der Grenzfunktion f eine stärkere Konvergenzeigenschaft
der Folge (fn ).
Definition 4.9. Die Folge der Abbildungen (fn ) konvergiert gleichmäßig gegen eine Grenz-
funktion f : X −→ Y , falls zu jedem ε > 0 ein n0 ∈ N existiert, so dass
Schreibweise: fn ⇉ f .
Bei gleichmäßiger Konvergenz, konvergiert die Folge (fn (x)) für jeden Punkt x ∈ X mit
der ”gleichen Geschwindigkeit” gegen f (x).
Aus gleichmäßiger Konvergenz folgt offensichtlich die Konvergenz der Folge (fn ).
Beweis. Sei x0 ∈ X beliebig fixiert. Wir zeigen, dass f in x0 stetig ist. Sei ε > 0. Da (fn )
gleichmäßig gegen f konvergiert, existiert ein n0 ∈ N mit
ε
dY (fn (x), f (x)) < ∀ n ≥ n0 , ∀ x ∈ X.
3
Die Abbildung fn0 ist in x0 stetig, folglich gibt es ein δ > 0, so dass
ε
dY (fn0 (x0 ), fn0 (x)) < ∀ x ∈ X mit dX (x0 , x) < δ.
3
Für x ∈ X mit dX (x0 , x) < δ erhalten wir damit
dY (f (x), f (x0 )) ≤ dY (f (x), fn0 (x)) + dY (fn0 (x), fn0 (x0 )) + dY (fn0 (x0 ), f (x0 ))
ε ε ε
< + + = ε.
3 3 3
Somit ist f in x0 ∈ X stetig. ⊓
⊔
Beweis. Sei f die Grenzfunktion der Folge (fn ), d.h. f (x) = lim fn (x). Nach Satz 4.25
n→∞
ist f in x0 stetig. Folglich existiert der Grenzwert
⊓
⊔
124 4 Stetige Abbildungen zwischen metrischen Räumen
4.5 Funktionenreihen
In diesem Abschnitt wenden wir die im vorigen Abschnitt über Funktionenfolgen erhal-
tenen Resultate auf Funktionenreihen an. Insbesondere wollen wir weitere Aussagen über
Potenzreihen machen.
Im folgenden bezeichnet (X, d) einen beliebigen metrischen Raum und (E, k · k) einen Ba-
nachraum. Seien fn : X −→ E Abbildungen von X nach E, n = 0, 1, 2, . . .. Wir bilden aus
der Folge (fn ) die Folge der Partialsummen (sm ):
sm := f0 + f1 + f2 + · · · + fm , m ∈ N0 .
P
m
Definition 4.10. Die Folge sm := fn heißt Funktionenreihe mit den Gliedern fn .
n=0
∞
P
Wir bezeichnen sie symbolisch mit fn .
n=0
∞
P
Die Funktionenreihe fn heißt punktweise (bzw. gleichmäßig) konvergent, falls die Funk-
n=0
tionenfolge (sm ) punktweise (bzw. gleichmäßig) konvergiert.
Aus den Sätzen 4.25 und 4.26 erhält man dann sofort
Als nächstes beweisen wir ein Kriterium für die gleichmäßige Konvergenz von Funktionen-
reihen.
∞
P
Beweis. Sei ε > 0. Da die Reihe Mn konvergiert, gibt es nach dem Cauchy–Kriterium
n=0
(Satz 3.1) ein n0 ∈ N0 , so dass
Also ist die Folge (sm (x)) für jedes x ∈ X eine Cauchy–Folge im Banachraum E. Da E
vollständig ist, konvergiert die Folge (sm (x)). Sei f (x) := lim sm (x) . Die Funktionenrei-
m→∞
∞
P
he fn konvergiert somit punktweise gegen die Grenzfunktion f : X −→ E. Gehen wir
n=0
in (∗) mit k gegen ∞, so folgt wegen der Stetigkeit der Norm
lim ksk (x) − sm (x)k = k lim sk (x) − sm (x)k = kf (x) − sm (x)k ≤ ε ∀ x ∈ X, ∀ m > n0 .
k→∞ k→∞
∞
P
Somit konvergiert die Funktionenreihe fn sogar gleichmäßig gegen f . Die Stetigkeit
n=0
der Grenzfunktion f unter der Voraussetzung der Stetigkeit der fn folgt aus dem vorigen
Satz. ⊓
⊔
Wir wenden diese Sätze nun auf komplexe Potenzreihen an. Sei (an ) eine Folge komplexer
Zahlen, z0 ∈ C und
∞
X
P (z) := an (z − z0 )n , z ∈ C,
n=0
die Potenzreihe mit den Koeffizienten an und dem Zentrum z0 . R bezeichne den Konver-
genzradius der Potenzreihe P . In Kapitel 3.2. hatten wir Formeln zur Berechnung von R
hergeleitet (siehe Sätze 3.17 und 3.18). Wir wissen bereits:
Wir beweisen nun, dass die durch die Potenzreihe P auf dem Konvergenzkreis definierte
Funktion stetig ist.
126 4 Stetige Abbildungen zwischen metrischen Räumen
∞
P
Satz 4.29 Sei P (z) := an (z − z0 )n eine Potenzreihe mit dem Konvergenzradius R.
n=0
Dann gilt:
∞
P
1. Die Potenzreihe P (z) = an (z − z0 )n konvergiert gleichmäßig auf jeder kompakten
n=0
Teilmenge K ⊂ K(z0 , R).
Wir betrachten ein z1 ∈ K(z0 , R) mit η(K) < |z1 − z0 | < R. Da die Reihe P (z1 ) =
∞
P
an (z1 − z0 )n konvergiert, sind ihre Reihenglieder eine Nullfolge, also insbesondere be-
n=0
schränkt. Somit existiert eine Zahl M > 0 , so dass |an (z1 − z0 )n | < M für alle n ∈ N0 .
Wir erhalten daraus
n
n
n (z − z0 ) η(K)
n
|an (z − z0 ) | = an (z1 − z0 ) · ≤M· ∀ z ∈ K.
(z1 − z0 )n |z1 − z0 |
| {z }
=:Mn
∞
P
η(K)
Nach Wahl von z1 ist |z1 −z0 | < 1 . Folglich ist die geometrische Reihe Mn konvergent.
n=0
Nach Satz 4.28 konvergiert dann P (z) gleichmäßig auf K.
(2) Sei z ∈ K(z0 , R) gegeben. Wir wählen ein ε(z) > 0, so dass
Da die Menge cl(K(z, ε(z))) sowohl abgeschlossen als auch beschränkt ist, ist sie kom-
pakt. Folglich konvergiert die Funktionenreihe P (z) auf cl(K(z, ε(z))) gleichmäßig und die
Grenzfunktion P|cl(K(z,ε(z))) : cl(K(z, ε(z)) −→ C ist stetig. Da dies für alle z ∈ K(z0 , R)
gilt, ist P auf dem gesamten Konvergenzkreis K(z0 , R) stetig. ⊓
⊔
Als Anwendung der Stetigkeit der Grenzfunktion von Potenzreihen beweisen wir abschlie-
ßend den folgenden Identitätssatz.
1. lim wm = z0 und
m→∞
so gilt an = bn für alle n ∈ N0 , das heißt die Potenzreihen P und Q sind identisch.
Insbesondere sind P und Q identisch, wenn sie auf einer (beliebig kleinen) offenen Umge-
bung des Zentrums z0 übereinstimmen.
Beweis. Sei (wm ) eine Folge in K(z0 , R) \ {z0 } , die gegen z0 konvergiert und für die
P (wm ) = Q(wm ) gilt. Wir beweisen an = bn durch Induktion über den Index n.
Ind.–Anfang: Es ist zu zeigen, dass a0 = b0 gilt. Da (wm ) gegen z0 konvergiert und P und
Q auf K(z0 , R) stetig sind, folgt
Die Potenzreihen P1 und Q1 konvergieren auf K(z0 , R), denn für z 6= z0 gilt
P
n
P (z) − ak (z − z0 )k
k=0
P1 (z) = ,
(z − z0 )n+1
P
n
Q(z) − bk (z − z0 )k
k=0
Q1 (z) = .
(z − z0 )n+1
⊓
⊔
In diesem Abschnitt werden wir die Ihnen vielleicht bereits aus der Schule bekannten tri-
gonometrischen und Hyperbelfunktionen wiederholen und sie auf die komplexen Zahlen
fortsetzen. Als Ausgangspunkt benutzen wir die komplexe Potenzreihe, die die Exponen-
tialfunktion definiert:
exp : C −→ C,
P∞ n
z
z 7−→ ez := n! .
n=0
128 4 Stetige Abbildungen zwischen metrischen Räumen
Mit Hilfe der Exponentialfunktion definieren wir jetzt die trigonometrischen Funktionen.
Wir betrachten zunächst die Exponentialfunktion auf der imaginären Achse.
Für eit mit t ∈ R gilt
iR
|eit |2 = eit · eit = eit · e−it = e0 = 1. i6
eit
sin t
Die komplexe Zahl eit liegt also auf der Kreislinie
t -
S 1 := {z ∈ C | |z| = 1}. Den Realteil von eit nen- cos t 1 R
nen wir Cosinus der reellen Zahl t, den Imaginärteil
von eit nennen wir Sinus von t:
eit + e−it eit − e−it
cos(t) := Re(eit ) = , sin(t) := Im(eit ) = .
2 2i
Dann erhält man unmittelbar
Diese Potenzreihen haben Konvergenzradius +∞, sind also für jedes z ∈ C absolut kon-
vergent.
Durch Einsetzen von ez in die Definitionen und Anwenden von ez+w = ez · ew erhält man
die folgenden Rechenregeln für Sinus und Cosinus:
1 1
sin2 (z) + cos2 (z) = − (e2iz + e−2iz − 2) + (e2iz + e−2iz + 2) = 1.
4 4
1 1
cos(z) + i · sin(z) = (eiz + e−iz ) + (eiz − e−iz ) = eiz .
2 2
4.6 Die trigonometrischen und die Hyperbelfunktionen im Komplexen 129
Als nächstes diskutieren wir nochmal den Kurvenverlauf der reellen Funktionen cos|R und
sin|R . Zunächst sehen wir uns die Nullstellen an:
Satz 4.31 Die Funktion cos|R : R −→ R hat auf dem Intervall (0, 2) genau eine Nullstelle.
Beweis. 1. Existenz der Nullstelle: Aus der Definition von cos folgt cos(0) = 1. Anderer-
seits ist
∞
X 22n
cos(2) = (−1)n
(2n)!
n=0
∞
2 X 22n
=1−2+ + (−1)n
3 (2n)!
n=3
X∞
1 24r−2 24r
=− − −
3 (4r − 2)! (4r)!
r=2
X∞
1 24r−2 4
=− − · 1−
3 (4r − 2)! 4r(4r − 1)
r=2 | {z }
>0
1
<− .
3
(Die Umordnung der Reihe in der 3. Zeile konnten wir wegen ihrer absoluten Konvergenz
vornehmen). Da cos(0) = 1 > 0, cos(2) < − 13 < 0 und cos|R : R −→ R stetig ist, folgt aus
dem Zwischenwertsatz, dass ein ξ ∈ (0, 2) mit cos(ξ) = 0 existiert.
2. Eindeutigkeit der Nullstelle: Dazu zeigen wir, dass cos|R auf (0, 2) streng monoton
fallend ist. Die Funktion sin|R ist auf (0, 2) positiv, da
130 4 Stetige Abbildungen zwischen metrischen Räumen
∞
X x2n+1
sin(x) = (−1)n
(2n + 1)!
n=0
X∞
x4r+1 x4r+3
= −
(4r + 1)! (4r + 3)!
r=0
X∞
x4r+1 x2
= · 1−
(4r + 1)! (4r + 2)(4r + 3)
r=0 | {z }
>0
>0 ∀ x ∈ (0, 2).
π
Definition 4.11. Die Nullstelle von cos|R auf dem Intervall (0, 2) heißt .
2
Wir werden später weitere Eigenschaften der Zahl π (sie ist irrational und transzendent)
und ihre genauere Berechnung kennenlernen.
Nach Satz 4.31 gilt cos( π2 ) = 0 und sin( π2 ) = 1 , woraus
π π
ei 2 = i , eiπ = (ei 2 )2 = −1 und e2πi = (eiπ )2 = 1
Der Vergleich von Real- und Imaginärteil in der Eulerschen Formel liefert dann die folgen-
den Beziehungen zwischen Sinus und Cosinus:
R
R 6
6
1 cos x
1 sin x
-
- π 3
π 3 2 π 2π 2π R
π 2π 2π R
2 −1
−1
4.6 Die trigonometrischen und die Hyperbelfunktionen im Komplexen 131
Satz 4.32 1. Die Exponentialfunktion exp : C −→ C ist periodisch mit der Periode 2πi,
das heißt es gilt ez = ez+2πi für alle z ∈ C.
2. Die Funktionen sin : C −→ C und cos : C −→ C sind periodisch mit der Periode 2π,
d.h. für alle z ∈ C gilt sin(z + 2π) = sin(z) und cos(z + 2π) = cos(z) .
3. ez = 1 ⇐⇒ z = 2πik für ein k ∈ Z.
4. Die Funktion sin : C −→ C hat nur die (reellen) Nullstellen xk = πk, k ∈ Z.
Die Funktion cos : C −→ C hat nur die (reellen) Nullstellen yk = π2 + kπ, k ∈ Z.
5. Zu jedem z ∈ S 1 = {z ∈ C | |z| = 1} existiert genau eine reelle Zahl t ∈ [0, 2π) mit
z = eit = cos(t) + i sin(t).
Beweis.
(1) Da e2πi = 1 , folgt ez+2πi = ez · e2πi = ez .
(2) Aus der Definition von Sinus erhält man:
ez = e2πik = (e2πi )k = 1k = 1.
eiz − e−iz
0 = sin(z) = ⇐⇒ eiz = e−iz ⇐⇒ e2iz = 1 ⇐⇒ z ∈ Zπ.
2i
eiz + e−iz π
0 = cos(z) = ⇐⇒ eiz = −e−iz ⇐⇒ e2iz = −1 = eiπ ⇐⇒ z ∈ + πZ.
2 2
(5) Sei z ∈ S 1 = {z ∈ C | |z| = 1}. Wir wollen zeigen, dass es genau ein t ∈ [0, 2π) gibt,
mit z = eit = cos(t) + i sin(t). Sei z = x + iy, dann gilt x2 + y 2 = 1 sowie |x| ≤ 1. Wir
beweisen nun durch Fallunterscheidung: (a) Sei x = 1. Dann ist y = 0 und t = 0 eindeutige
Lösung von x = cos t, y = sin t in [0, 2π).
(b) Sei x = −1. Dann ist y = 0 und t = π eindeutige Lösung von x = cos t, y = sin t in
[0, 2π).
132 4 Stetige Abbildungen zwischen metrischen Räumen
(c) Bleibt also noch der Fall x ∈ (−1, 1) zu betrachten. Sei x ∈ (−1, 1). Dann existieren
genau zwei Werte α, β mit
Ist y > 0, so ist y = sin α und t = α die Lösung. Ist y < 0, so ist y = sin β und t = β die
Lösung. ⊓
⊔
Mittels der Sinus- und Cosinusfunktion definieren wir die Funktionen Tangens (tan) und
Cotangens (cot):
π
tan : C \ + Zπ −→ C
2
sin(z)
z 7−→ tan(z) :=
cos(z)
cot : C \ Zπ −→ C
cos(z)
z 7−→ cot(z) :=
sin(z)
Beide Funktionen sind offensichtich stetig. Aus den Eigenschaften von Sinus und Cosinus
erhält man die folgenden Eigenschaften von Tangens- und Cotangensfunktion:
1. tan und cot sind π-periodische, ungerade Funktionen.
2. Es gelten folgende Additionstheoreme:
tan(z) + tan(w) cot(z) · cot(w) − 1
tan(z + w) = und cot(z + w) = .
1 − tan(z) · tan(w) cot(z) + cot(w)
Definition 4.12. Die Umkehrfunktion von sin|[− π , π ] heißt Arcussinus und wird mit arcsin
2 2
bezeichnet.
−1
(sin|[− π +kπ, π +kπ] ) (x) = (−1)k · arcsin(x) + kπ.
2 2
Man nennt sie auch die Zweige der Umkehrfunktion von Sinus.
4.6 Die trigonometrischen und die Hyperbelfunktionen im Komplexen 133
Definition 4.13. Die Umkehrfunktion von cos|[0,π] heißt Arcuscosinus und wird mit arccos
bezeichnet.
2k + 1 − (−1)k
(cos|[kπ,(k+1)π] )−1 (x) = (−1)k · arccos(x) + · π.
2
Definition 4.14. Die Umkehrfunktion von tan|[− π , π ] heißt Arcustangens und wird mit
2 2
arctan bezeichnet.
Definition 4.15. Die Umkehrfunktion von cot|[0,π] heißt Arcuscotangens und wird mit
arccot bezeichnet.
ez − e−z
sinh(z) := ,
2
ez + e−z
cosh(z) := .
2
Aus der Reihendarstellung für ez folgt
∞
X z 2n+1 z3 z5
sinh(z) = =z+ + + ...
(2n + 1)! 3! 5!
n=0
X∞
z 2n z2 z4
cosh(z) = =1+ + + ...
(2n)! 2! 4!
n=0
Wir bildenauch hier die Quotienten beider Funktionen und erhalten Tangens hyperbolicus
tanh : C \ π2 i + Zπi −→ C:
134 4 Stetige Abbildungen zwischen metrischen Räumen
sinh(z) e2z − 1
tanh(z) := = 2z
cosh(z) e +1
und Cotangens hyperbolicus coth : C \ Zπi −→ C:
cosh(z) e2z + 1
coth(z) := = 2z .
sinh(z) e −1
Alle diese Hyperbelfunkionen sind offensichtlich stetig. Durch Einsetzen der Exponential-
abbildung in die Definitionen und die Rechenregeln für die trigonometrischen Funktionen
erhält man folgende Rechenregeln für die Hyperbelfunktionen:
1. sinh(z) = −i sin(iz) und cosh(z) = cos(iz) für alle z ∈ C.
2. cosh2 (z) − sinh2 (z) = 1 für alle z ∈ C:
cosh2 (z) − sinh2 (z) = cos2 (iz) − (−i · sin(iz))2 = cos2 (iz) + sin2 (iz) = 1.
so beschreiben die reellen hyperbolischen Funktionen die Punkte der Hyperbel Hyp :=
{(x, y) ∈ R2 | x2 − y 2 = 1, x > 0} (dies motiviert den Namen dieser Funktionenklasse):
Hängt man ein ideales Seil zwischen zwei Punkten über der Erdoberfläche auf, so wird die
entstehende Seilkurve durch die Funktion b cosh(ax) beschrieben. Dies werden wir später
im Abschnitt über Differentialgleichungen beweisen.
Die Funktion sinh|R : R −→ R ist bijektiv. streng monoton wachsen und hat die Nullstelle
x = 0. Die Funktion cosh|R : R −→ R nimmt ihre Werte in [1, +∞) an, sie ist steng
monoton wachsend und bijektiv von [0, +∞) auf [1, +∞). Dabei ist cosh(0) = 1. Wir
können deshalb die Umkehrfunktionen betrachten:
Die Funktion tanh|R : R −→ (−1, 1) ⊂ R ist streng monoton wachsend und bijektiv. Die
Funktion coth|R\{0} : R\{0} −→ R\[ − 1, 1] ist streng monoton fallend und bijektiv.
Satz 4.33 Es bestehen die folgenden Beziehungen zwischen den Umkehrfunktionen der
Hyperbelfunktionen und der Logarithmusfunktion:
p
arsinh(x) = ln(x + x2 + 1) , x ∈ R,
p
arcosh(x) = ln(x + x2 − 1) , x ≥ 1,
1 1 + x
artanh(x) = ln , |x| < 1,
2 1−x
1 x + 1
arcoth(x) = ln , |x| > 1.
2 x−1
Beweis. Übungsaufgabe. ⊓
⊔
Als Anwendung unserer bisherigen Erkenntnisse über stetige Funktionen beweisen wir den
Fundamenalsatz der Algebra, der weitreichende Konsequenzen sowohl in der Algebra als
auch in vielen Bereichen der Analysis hat.
Beweis. Sei Q ∈ C[z] ein komplexes Polynom vom Grad n ≥ 1. Dann gibt es komplexe
Zahlen a0 , a1 , . . . , an mit an 6= 0, so dass
(1) Zuerst zeigen wir, dass für ein beliebig vorgegebenes α > 0 ein r > 0 existiert, so dass
|Q(z)| ≥ α für alle |z| ≥ r.
e
Wir definieren dazu Q(z) durch
an−1 1 a0 1
Q(z) = an z n 1 + + ... + , z 6= 0.
an z an z n
| {z }
e
=:Q(z)
a0
Sei nun β := 1 + an−1
an + . . . + an ≥ 1. Für |z| ≥ 2β folgt dann
136 4 Stetige Abbildungen zwischen metrischen Räumen
an−1 1 a0 1 an−1 a0 1
e
|Q(z)| ≤ + . . . + ≤ + . . . +
an |z| an |z|n an an |z|
1 1
≤β· ≤ .
|z| 2
e
Dies zeigt, dass |1 + Q(z)| ≥ 1
und
2
1
|Q(z)| = |an z n | · |1 + Q̃(z)| ≥ |an | · |z|n für alle |z| ≥ 2β.
2
1
n
Setzen wir r := max{2β, |a2αn | }, so erhalten wir
|Q(z)| ≥ µ + 1 ∀ |z| ≥ r.
q : C −→ R
z 7→ |Q(z)|
stetig ist, existiert ein Minimum von q auf cl K(0, r) , das heißt, es existiert ein ξ ∈
cl K(0, r) mit |Q(ξ)| = µ. Wir zeigen, dass Q(ξ) = 0 gilt. Wir nehmen an, dass Q(ξ) 6= 0
ist und betrachten
Q(z + ξ)
H(z) := .
Q(ξ)
Da |Q(ξ)| = min{|Q(z)| | z ∈ C}, gilt |H(z)| ≥ 1 für alle z ∈ C. Da H(0) = 1, hat H die
Form
H(z) = bn z n + . . . + bm z m + 1 ,
wobei bm , bm+1 , . . . , bn komplexe Zahlen sind, n ≥ m ≥ 1 und bm 6= 0. Für die komplexe
Zahl w := − |bbm
m
|
der Norm 1 existiert ein ψ ∈ R, so dass w = eimψ (siehe Satz 4.32). Dann
ist bm eimψ = −|bm |. Wir betrachten nun H auf den komplexen Zahlen der Form z = ̺ · eiψ
mit ̺ > 0. Dann gilt
Somit ist |H(̺ · eiψ )| < 1 für hinreichend kleine ̺. Dies ist ein Widerspruch zu |H(z)| ≥ 1
für alle z ∈ C. Somit war unsere Annahme falsch und es gilt Q(ξ) = 0. ⊓
⊔
4.8 Approximationssätze für stetige Abbildungen 137
Q1 (z) ist dabei ein Polynom vom Grad n − 1. Ist n − 1 ≥ 1, so hat Q1 eine Nullstelle und
wir können einen weiteren Linearfaktor von Q1 abspalten. Dieses Verfahren funktioniert
n–mal. ⊓
⊔
In diesem Abschnitt werden wir untersuchen, wie man stetige Abbildungen durch gewisse
”einfache” stetige Abbildungen approximieren kann. Dazu ist zunächst zu klären, was wir
unter ”approximieren” verstehen wollen. Wir benötigen dazu eine Metrik auf dem Raum
der stetigen Abbildungen, mit der wir Konvergenz beschreiben können.
Wir betrachten zwei metrische Räume (X, dX ) und (Y, dY ) und bezeichnen mit C(X, Y )
die Menge aller stetigen Abbildungen von X nach Y :
C(X, Y ) := {f : X −→ Y | f stetig }.
Um auf C(X, Y ) eine geeignete Metrik zu definieren, setzen wir nun voraus, dass der
metrische Raum X kompakt ist. Wir definieren für f, h ∈ C(X, Y )
Da die Metrik dY stetig ist, ist die Abbildung x ∈ X 7→ dY (f (x), h(x)) ∈ R stetig, sie
besitzt also tatsächlich ein Maximum auf dem kompakten metrischen Raum X. Aus den
138 4 Stetige Abbildungen zwischen metrischen Räumen
Eigenschaften der Metrik dY erhält man ohne Probleme, dass d∞ eine Metrik auf dem
Raum der stetigen Abbildungen C(X, Y ) ist.
Ist der Bildraum ein normierter K-Vektorraum (V, k · k), so trägt auch die Menge der
stetigen Abbildungen C(X, V ) eine K-Vektoraumstruktur (K ist hier der Körper der reellen
oder der komplexen Zahlen). Zur Erinnerung: Für f, h ∈ C(X, V ) und λ ∈ K definieren
wir
Die Norm k · k auf V liefert dann eine Norm k · k∞ auf dem Vektorraum C(X, V ):
Die durch k · k∞ gegebene Metrik auf C(X, V ) stimmt mit der Metrik d∞ überein, die auf
C(X, V ) durch die durch k · k gegebene Metrik dk·k von V induziert wird:
Im folgenden sind die Mengen C(X, Y ) bzw. C(X, V ) immer mit der Metrik d∞ bzw. der
Norm k · k∞ versehen.
Satz 4.36 Sei X ein kompakter metrischer Raum und Y ein beliebiger metrischer Raum.
1. Sei (fn ) eine Folge stetiger Abbildungen fn ∈ C(X, Y ). Die Folge (fn ) konvergiert im
metrischen Raum C(X, Y ) genau dann gegen f ∈ C(X, Y ), wenn die Funktionenfolge
(fn ) gleichmäßig gegen f konvergiert.
2. Ist Y vollständig, so ist C(X, Y ) vollständig.
3. Ist V ein Banachraum, so ist C(X, V ) ebenfalls ein Banachraum.
Beweis. (1) Die erste Behauptung folgt aus der Äquivalenz der folgenden Bedingungen:
fn −→ f in C(X, Y )
⇐⇒ ∀ ε > 0 ∃ n0 ∈ N so dass d∞ (fn , f ) < ε ∀ n ≥ n0
⇐⇒ ∀ ε > 0 ∃ n0 ∈ N so dass max{dY (fn (x), f (x)) | x ∈ X} < ε ∀ n ≥ n0
⇐⇒ ∀ ε > 0 ∃ n0 ∈ N so dass dY (fn (x), f (x)) < ε ∀ n ≥ n0 ∀ x ∈ X.
⇐⇒ (fn ) konvergiert gleichmäßig gegen f .
(2) Sei der metrische Raum (Y, dY ) vollständig. Wir zeigen, dass dann auch (C(X, Y ), d∞ )
vollständig ist. Sei (fn ) eine Cauchy–Folge in C(X, Y ) und ε > 0. Dann existiert ein n0 ∈ N,
so dass für alle x ∈ X
Folglich ist die Folge (fn (x)) für jedes x ∈ X eine Cauchy–Folge in Y . Da Y vollständig
ist, existiert f (x) := lim fn (x) auf X. Da die Metrik dY stetig ist, folgt aus (∗) für jedes
n→∞
x∈X
lim dY (fn (x), fm (x)) = dY (fn (x), lim fm (x)) = dY (fn (x), f (x)) ≤ ε ∀n ≥ n0 .
m→∞ m→∞
Dies zeigt, dass die Funktionenfolge (fn ) gleichmäßig gegen f konvergiert. Nach Satz 4.25
ist f stetig und nach (1) konvergiert die Folge (fn ) in C(X, Y ) gegen f .
(3) ist ein Spezialfall von (2). ⊓
⊔
In verschiedenen Situationen kann man stetige Abbildungen durch ”einfache” stetige Ab-
bildungen approximieren. Ein Beispiel kennen wir bereits:
∞
P
Sei ak xk eine komplexe Potenzreihe mit dem Konvergenzradius R > 0 und bezeichne
k=0
P
n
pn (x) := ak xk ihre n-te Partialsumme. Dann ist die Funktion
k=0
f : (−R, R) ⊂ R −→ C
∞
P
t 7−→ a k tk
k=0
stetig und die Folge der Polynome (pn ) konvergiert gleichmäßig gegen f auf jedem kom-
pakten Intervall [a, b] ⊂ (−R, R).
Wir wollen nun beliebige stetige Funktionen aus C([a, b], K) durch Polynome approximie-
ren. Wir bezeichnen mit P ([a, b], K) diejenigen stetigen Funktionen, die mittels Polynomen
definiert sind:
Beweis. (1) Es genügt, die Behauptung für das Intervall [0, 1] zu zeigen:
Sei die Behauptung für das Intervall [0, 1] bewiesen und [a, b] ein beliebiges Intervall. Wir
betrachten den Homöomorphismus
φ : [0, 1] −→ [a, b]
t 7−→ a + (b − a)t.
gegeben. Sei nun f ∈ C([a, b], K) und h := f ◦ φ ∈ C([0, 1], K). Nach unserer Annahme
existiert eine Polynomfolge (pn ), die auf [0, 1] gleichmäßig gegen h konvergiert. Dann ist
qn := pn ◦ φ−1 eine Polynomfolge, die auf [a, b] gleichmäßig gegen f = h ◦ φ−1 konvergiert.
(2) Sei f ∈ C([0, 1], K). Unter dem n-ten Bernstein–Polynom zu f verstehen wir das
folgende Polynom n-ten Grades:
Xn k n
B[f ]n (x) := f (1 − x)n−k · xk .
n k
k=0 | {z }
=:βk,n (x)
Da [0, 1] kompakt ist, ist die Funktion f sogar gleichmäßig stetig. Folglich existiert zu
jedem ε > 0 ein δ > 0 so dass
ε
|f (x1 ) − f (x2 )| < ∀ x1 , x2 ∈ [0, 1] mit |x1 − x2 | < δ. (∗∗)
2
C
Wir fixieren nun ein n0 ∈ N mit n0 > ε·δ 2
und zeigen, dass
X k
(1)
(∗∗) ε X εX
n
(2) ε
Sn (x) ≤ f − f (x) · βk,n (x) ≤ · βk,n (x) ≤ βk,n (x) = .
n 2 2 2
In (x) In (x) k=0
2
Ist k ∈ Jn (x), so gilt ( nk − x)2 ≥ δ 2 , also (k−nx)
n2 δ 2
≥ 1 . Für den Summanden Rn (x) ergibt
sich
X n k o (k − nx)2
Rn (x) ≤ f + |f (x)| · βk,n (x) · 2 2
n | n{zδ }
Jn (x)
≥1
(∗),(3) n
X
2C
≤ · (k − nx)2 βk,n (x)
n2 δ 2
|k=0 {z }
=nx(1−x)
2C
= x(1 − x).
nδ 2
C 2C
Sei nun n ≥ n0 > εδ 2
. Dann ist nδ 2
< 2ε . Für x ∈ [0, 1] gilt außerdem
1 1 1
x(1 − x) = x − x2 = −(x − )2 + < .
2 4 4
ε
Folglich ist Rn (x) < 2 . Insgesamt erhalten wir
Somit konvergiert die Folge der Bernstein-Polynome (B[f ]n ) auf [0, 1] gleichmäßig gegen
die stetige Funktion f . ⊓
⊔
Wir wollen den Weierstraßschen Approximationssatz nun auf Funktionen mit beliebigem
kompakten Definitionsbereich verallgemeinern.
Wir betrachten dazu einen beliebigen kompakten metrischen Raum X und den Banach-
raum C(X, K) der stetigen reell- bzw. komplexwertigen Funktionen auf X mit der Norm
k · k∞ und fragen uns, wann eine Teilmenge R ⊂ C(X, K) dicht in C(X, K) liegt.
Definition 4.18. Unter einer Unteralgebra von C(X, K) versteht man einen linearen Un-
terraum4 R ⊂ C(X, K) mit der zusätzlichen Eigenschaft, dass mit zwei Funktionen
f, g ∈ R auch das Produkt f · g, definiert durch (f · g)(x) = f (x) · g(x), in R liegt.
Ein Beispiel für eine Unteralgebra ist die im Weierstraßschen Approximationssatz betrach-
tete Menge der Polynome P ([a, b], K) ⊂ C([a, b], K).
Wir wollen nun Bedingungen dafür angeben, dass eine Unteralgebra R ⊂ C(X, K) dicht
in C(X, K) liegt. Als Hilfsmittel beweisen wir zunächst folgende Lemmata.
4
Ein linearer Unterraum ist eine Teilmenge von C(X, K), die abgeschlossen gegenüber den Vektorraum-
Operationen ist.
142 4 Stetige Abbildungen zwischen metrischen Räumen
Lemma 4.19. Sei X ein kompakter metrischer Raum. Ist R ⊂ C(X, K) eine Unteralgebra
im Banachraum der stetigen K-wertigen Funktionen auf X, so ist auch der Abschluss
cl(R) ⊂ C(X, K) eine Unteralgebra.
Beweis. Seien f, g ∈ cl(R) ⊂ C(X, K) stetige Funktionen, die im Abschluss der Unteralge-
bra R liegen. Dann existieren Folgen stetiger Funtionen (fn ) und (gn ) mit fn , gn ∈ R, die
bzgl. k · k∞ gegen f bzw. g konvergieren. Da R eine Unteralgebra ist, liegen die stetigen
Funktionen fn + gn , λ · fn und fn · gn ebenfalls in R, wobei λ ∈ K. Mit den Normeigen-
schaften sieht man sofort, dass die Folgen (fn + gn ) und (λ · fn ) bzgl. k · k∞ gegen f + g
bzw. λ · f konvergieren. Somit liegen f + g und λ · f in cl(R). Es bleibt zu zeigen, dass
auch f · g in cl(R) liegt.
Da die Folge (fn ) konvergiert, ist sie beschränkt, d.h. es existiert eine Konstante C ∈ R+
mit
|fn (x)| ≤ kfn k∞ ≤ C ∀ n ∈ N ∀ x ∈ X.
|g(x)| ≤ kgk∞ ∀ x ∈ X.
kf · g − fn · gn k∞ = kf · g − fn · g + fn · g − fn · gn k∞
= kg(f − fn ) + fn (g − gn )k∞
≤ kg(f − fn )k∞ + kfn (g − gn )k∞
= max{|g(x)| |f (x) − fn (x)|} + max{|fn (x)| |g(x) − gn (x)|}
x∈X x∈X
≤ kgk∞ · kf − fn k∞ + C · kg − gn k∞
Da (fn ) gegen f und (gn ) gegen g konvergiert, folgt aus dieser Ungleichung, dass fn · gn
gegen f · g konvergiert. Somit ist f · g ∈ cl(R). ⊓
⊔
Lemma 4.20. Sei X ein kompakter metrischer Raum und R ⊂ C(X, R) eine Unteralge-
bra, die alle konstanten Funktionen enthält. Dann liegen für zwei Funktionen f, g ∈ R die
Funktionen |f | , max{f, g} und min{f, g} im Abschluss cl(R).
|f (x)| ≤ kf k∞ =: C ∈ R+ ∀ x ∈ X.
√
Wir betrachten die stetige Funktion w : x ∈ [0, C 2 ] 7−→ x ∈ R . Sei (pn ) eine Folge von
Polynomen, die auf [0, C 2 ] gleichmäßig gegen w konvergiert. Eine solche Folge existiert
nach Satz 4.37. Dann konvergiert die Funktionenfolge (pn ◦ f 2 ) auf X gleichmäßig gegen
w ◦f 2 = |f | . Folglich konvergiert die Folge (pn ◦f 2 ) im metrischen Raum (C(X, R), k·k∞ )
gegen |f |. Da R eine Algebra ist, ist mit f ∈ R auch jede Potenz f i ∈ R. Außerdem liegen
4.8 Approximationssätze für stetige Abbildungen 143
Pn i
nach Voraussetzung alle konstanten Funktionen in R. Seien pn (x) = i=0 ani x die obigen
Polynome. Dann folgt:
Xn
2
pn ◦ f = ain (f 2 )i ∈ R.
i=1
Somit ist |f | der Grenzwert einer Folge von Elementen aus R und folglich gilt |f | ∈ cl(R).
(2) Seien f, g ∈ R. Dann sind f + g und f − g Elemente in R, weil R ein Unterraum von
C(X, R) ist. Aus (1) folgt |f − g| ∈ cl(R) und |f + g| ∈ cl(R). Da Nach Lemma 4.19 der
Abschluß cl(R) ebenfalls eine Unteralgebra ist, erhalten wir
max{f, g} = 21 (f + g + |f − g|)
∈ cl(R).
min{f, g} = 12 (f + g − |f − g|)
⊓
⊔
Mit Hilfe dieser Lemmata beweisen wir den folgenden Approximationssatz für reellwertige
Funktionen:
Dann ist R dicht in (C(X, R), k.k∞ ), d.h. zu jedem f ∈ C(X, R) existiert eine Folge von
Funktionen (fn ) aus R, die auf X gleichmäßig gegen f konvergiert.
h := (s − r) · g + r ∈ R.
kf − fε k∞ < ε:
Seien a, b ∈ X zwei beliebige Punkte. Nach (1) existiert eine Funktion ha,b ∈ R mit
ha,b (a) = f (a) und ha,b (b) = f (b). (Falls a = b, so setzen wir in (1) x0 = a = b, r = f (a)
und y0 , s beliebig). Da f und ha,b stetig sind, ist die Teilmenge
n εo ε
Ua,b := x ∈ X | ha,b (x) > f (x) − = (ha,b − f )−1 (− , +∞) ⊂ X
2 2
offen. Nach Definition ist a ∈ Ua,b . Sei b ∈ X ein fixiertes Element. Dann ist Ub :=
{Ua,b }a∈X eine offene Überdeckung von X. Da X kompakt ist, existiert eine endliche
Teilüberdeckung Ub∗ ⊂ Ub , d.h. es existieren endlich viele Punkte a1 , a2 , . . . , an ∈ X, so
dass
X = Ua1 ,b ∪ Ua2 ,b ∪ . . . ∪ Uan ,b .
fb := max{ha1 ,b , . . . , han ,b }.
Nach Lemma 4.20 ist fb ∈ cl(R). Ist x ∈ X, so gilt x ∈ Uaj ,b für einen Index j ∈ {1, . . . , n}.
Damit erhalten wir
ε
fb (x) ≥ haj ,b (x) > f (x) − .
2
Wir haben zur Funktion f ∈ C(X, R) also zunächst für jedes b ∈ X eine Funktion fb ∈
cl(R) gefunden, so dass
ε
fb (x) > f (x) − ∀ x ∈ X. (∗)
2
Da f und fb stetig sind, ist die Teilmenge
n εo ε
Vb := x ∈ X | fb (x) < f (x) + = (fb − f )−1 (−∞, ) ⊂ X
2 2
offen. Aus der Definition der Funktionen ha,b folgt, dass fb (b) = f (b), d.h. b ∈ Vb . Folglich
ist V := {Vb }b∈X eine offene Überdeckung von X. Da X kompakt ist, existiert eine
endliche Teilüberdeckung V ∗ ⊂ V, d.h. es existieren endlich viele Punkte b1 , b2 , . . . , bk ∈ X,
so dass
X = Vb 1 ∪ Vb 2 ∪ . . . ∪ Vb k .
g := min{fb1 , . . . , fbk }.
Aus den Lemmata 4.19 und 4.20 folgt g ∈ cl(R). Ist x ∈ X, so gilt x ∈ Vbi für einen Index
i ∈ {1, . . . , k}. Damit erhalten wir
ε
g(x) ≤ fbi (x) < f (x) + .
2
Andererseits existiert für x ∈ X ein l ∈ {1, . . . , k} mit g(x) = fbl (x) und folglich gilt wegen
(∗)
4.8 Approximationssätze für stetige Abbildungen 145
ε
g(x) = fbl (x) > f (x) − .
2
Wir haben also eine stetige Funktion g ∈ cl(R) gefunden, so dass
ε ε
f (x) − < g(x) < f (x) − ∀ x ∈ X,
2 2
also
ε
kf − gk∞ < .
2
Da g im Abschluss von R liegt, gibt es eine Funktion fε ∈ R mit
ε
kg − fε k∞ < .
2
Wir erhalten somit
ε ε
kf − fε k∞ ≤ kf − gk∞ + kg − fε k∞ < + = ε.
2 2
Damit ist bewiesen, dass die Unteralgebra R dicht in C(X, R) liegt. ⊓
⊔
Als nächstes beweisen wir einen analogen Approximationssatz für komplexwertige Funk-
tionen.
Dann ist R dicht in C(X, C), d.h., für jede Funktion f ∈ C(X, C) existiert eine Folge von
Funktionen (fn ) in R, die auf X gleichmäßig gegen f konvergiert.
Beweis. Wir betrachten die folgende Teilmenge im Raum der reellwertigen stetigen Funk-
tionen:
R∗ := {f ∈ R | Im(f ) = 0} ⊂ C(X, R).
Dann gilt
Ist X = [a, b] ⊂ R und P ([a, b], R) ⊂ C([a, b], R) die Menge der reellen Polynome, so
erfüllt P ([a, b], R) die Bedingungen an die Unteralgebra R im Satz 4.38. Die Menge der
komplexen Polynome P ([a, b], C) ⊂ C([a, b], C) erfüllt die Bedingungen der Unteralgebra
R im Satz 4.39.
Wir wenden nun die Approximationssätze von Stone-Weierstraß auf eine weitere Klasse
von Funktionen an und beweisen Approximationssätze für periodische Funktionen.
Eine Funktion f : R −→ K heißt 2π-periodisch, wenn f (x + 2π) = f (x) für alle x ∈ R.
Wir bezeichnen den K-Vektorraum der 2π-periodischen Funktionen mit
Obwohl R nicht kompakt ist, können wir wegen der Periodizität die folgende Maximum-
Norm auf C(R, K)per definieren: Für f ∈ C(R, K)per ist
Wir werden nun die periodischen Funktionen C(R, K)per mit den stetigen Funktionen auf
der Kreislinie S 1 := {z ∈ C | |z| = 1} identifizieren.
Lemma 4.21. Die normierten Vektorräume (C(R, K)per , k · k∞ ) und (C(S 1 , K), k · k∞ )
sind isometrisch.
Beweis. Sei z ∈ S 1 . Nach Satz 4.32 wissen wir, dass es genau eine reelle Zahl t(z) ∈ [0, 2π)
gibt mit z = eit(z) = cos(t(z))+i sin(t(z)). Für f ∈ C(R, K)per definieren wir f ∗ : S 1 −→ K
durch
f ∗ (z) := f (t(z)).
Da die Umkehrfunktionen von Sinus und Cosinus stetig sind und f 2π-periodisch, ist f ∗
stetig (Übungsaufgabe). Die Abbildung
ist ein Vektorraum-Isomorphismus, der auch mit dem Produkt von Funktionen verträglich
ist (d.h. ein Algebren-Isomorphimus). Die Umkehrabbildung von φ ist durch
gegeben, wobei hier h ∈ C(S 1 , K). φ ist isometrisch, da für alle f ∈ C(R, K)per
⊓
⊔
Definition 4.22. Ein reelles trigonometrisches Polynom ist eine 2π-periodische Funktion
f ∈ C(R, R)per mit
m
X
f (t) := a0 + ak cos(kt) + bk sin(kt) ∀ t ∈ R,
k=1
wobei a0 , a1 , . . . , am , b1 , . . . , bm ∈ R und m ∈ N.
Satz 4.40 Sei f ∈ C(R, R)per eine stetige, 2π-periodische, reellwertige Funktion. Dann
existiert eine Folge reeller trigonometrischer Polynome (fn ), die auf R gleichmäßig gegen
f konvergiert.
Beweis. Wir bezeichnen mit P die Menge der reellen trigonometrischen Polynome. Wegen
der Additionstheoreme
1
cos(kt) · cos(lt) = {cos((k + l)t) + cos((k − l)t)}
2
1
cos(kt) · sin(lt) = {sin((k + l)t) − sin((k − l)t)}
2
1
sin(kt) · sin(lt) = {cos((k − l)t) − cos((l + k)t)}
2
ist P eine Unteralgebra von C(R, R) . Wir betrachten die Unteralgebra P ∗ := φ(P) ⊂
per
C(S 1 , R) und wenden auf sie den Satz von Stone-Weierstraß 4.38 an. P enthält per Defi-
nition alle konstanten Funktionen. Für f (t) := cos(t) gilt f ∗ (z) = Re(z), für f (t) := sin(t)
gilt f ∗ (z) = Im(z). Also trennt P ∗ Punkte. Somit liegt P ∗ dicht in C(S 1 , R) und aus
Lemma 4.21 folgt, dass P dicht in C(R, R)per ist. ⊓
⊔
Definition 4.23. Ein komplexes, trigonometrisches Polynom ist eine 2π–periodische Funk-
tion f ∈ C(R, C)per mit
M
X
f (t) = ck eikt ,
k=−m
wobei m, M ∈ N0 und ck ∈ C.
Satz 4.41 Sei f ∈ C(R, C)per eine stetige, 2π-periodische, komplexwertige Funktion.
Dann existiert eine Folge komplexer trigonometrischer Polynome (fn ), die auf R gleichmäßig
gegen f konvergiert.
Beweis. Wir gehen analog zu Satz 4.40 vor und betrachten die Menge der komplexen
trigonometrischen Polynome Q ⊂ C(R, C)per ≃ C(S 1 , C). Man zeigt leicht, dass Q die
Eigenschaften der Unteralgebra aus Satz 4.39 erfüllt. ⊓
⊔
5
In diesem Kapitel behandeln wir die Differentialrechnung für Funktionen einer reellen
Variablen mit Werten in normierten Vektorräumen. Die Ideen zur Entwicklung der Dif-
ferentialrechnung gehen bis ins 17. Jahrhundert zurück. Sie sind eng verbunden mit dem
Versuch, Probleme der Geometrie durch Einsatz analytischer Methoden zu lösen (z.B.
Bestimmung von Tangenten oder von Figuren und Körpern mit maximalen Flächeninhal-
ten) sowie mit den Erfordernissen, die die Behandlung von Problemen aus der Mechanik
(Verständnis von Geschwindigkeit und Beschleunigung sowie von Kraft und Trägheit) an
die Mathematik stellte. Für einen kurzen historischen Abriß empfehle ich das Buch von
W.Walter: Analysis I, § 10.
Die Grundidee der Differentialrechnung für Funktionen einer reellen Variable ist das Stu-
dium des lokalen Änderungsverhaltens der Funktion in der Nähe eines Punktes mit Hilfe
der Approximation der Funktion durch lineare Abbildungen (Tangenten) bzw. durch Po-
lynome. Die Eigenschaften dieser linearen bzw. polynomialen Approximation lassen viele
Aussagen über das lokale Verhalten der Funktion zu.
In diesem Kapitel bezeichnet E einen normierten Vektorraum über dem Körper K der
reellen oder komplexen Zahlen mit der Norm k · k und I ⊂ R ein reelles Intervall1 .
1. Ableitung von f .
1
Hier sind auch alle Sorten verallgemeinerter Intervalle zugelassen, die mehr als einen Punkt enthalten.
150 5 Differentialrechnung für Funktionen einer reellen Variablen
f (x0 + h) − f (x0 )
f ′ (x0 ) = lim ,
h→0 h
konvergieren die die Sekanten beschreibenden Richtungsvektoren bei h → 0 gegen den
Vektor f ′ (x0 ) ∈ E. Somit konvergieren die Sekanten Sh bei h → 0 gegen die durch
beschriebene Gerade in E. Diese Gerade heißt Tangente an die Kurve Γ im Punkt f (x0 ).
Die Tangente Tx0 approximiert die Abbildung f bzw. die durch sie beschriebene Kurve
Γ ⊂ E nahe x0 in erster Näherung, das heißt, es gilt
Interpretation in der Mechanik: In der Mechanik beschreibt man die Bewegung eines
Massenpunktes bzw. eines Objektes P im Raum durch eine differenzierbare Abbildung
s : I ⊂ R → R3 . Dabei ist I das Zeitintervall, in dem man die Bewegung beschreiben will
und s(t) ∈ R3 ist der Ort, an dem sich der Massenpunkt bzw. das Objekt P zum Zeitpunkt
t befindet. Dann ist die Ortsänderung pro Zeiteinheit gleich dem Differenzenquotienten
s(t)−s(t0 ) 0)
t−t0 . Folglich gibt der Vektor s′ (t0 ) = lim s(t)−s(t
t−t0 ∈ R3 die Geschwindigkeit von P
t→t0
zur Zeit t = t0 an und ks′ (t0 )|| ihren Betrag.
Beweis. Sei (xn ) eine Folge in I, die gegen x0 konvergiert. OBdA. sei xn 6= x0 für alle n ∈ N.
Die Bildfolge (f (xn )) konvergiert gegen f (x0 ), denn unter Ausnutzung der Stetigkeit der
Norm k · k erhalten wir:
f (xn ) − f (x0 )
n→∞
kf (xn ) − f (x0 )k = |xn − x0 |
−→ 0 · kf ′ (x0 )k = 0.
xn − x0
Mit Hilfe der Produktregel erhält man dann sofort die Quotientenregel. ⊓
⊔
f (g(xn )) − f (g(x0 ))
lim = g ′ (x0 ) · f ′ (g(x0 )).
n→∞ xn − x0
2. Fall: Es gelte g(xn ) = g(x0 ) für unendlich viele n ∈ N. Wir betrachten die Teilfolge
(xnk ) dieser Folgenglieder von (xn ). Da g in x0 differenzierbar ist, gilt dann
g(xnk ) − g(x0 )
g ′ (x0 ) = lim = 0.
k→∞ xnk − x0
Demnach ist
f (g(xnk )) − f (g(x0 ))
lim = lim 0 = 0 = g ′ (x0 ) · f ′ (g(x0 )).
k→∞ xnk − x 0 k→∞
Unter Benutzung des 1. Falles erhalten wir die erforderliche Konvergenz für die gesamte
Folge (xn ). ⊓
⊔
Satz 5.4 (Ableitung der inversen Abbildung) Sei f : I −→ J eine bijektive Abbil-
dung zwischen zwei Intervallen und x0 ∈ I. f habe folgende Eigenschaften:
Dann ist die Umkehrabbildung f −1 : J −→ I in f (x0 ) differenzierbar und für ihre Ablei-
tung gilt:
1
(f −1 )′ (f (x0 )) = ′ .
f (x0 )
f −1 (y) − f −1 (f (x0 )) x − x0 1
= = f (x)−f (x0 )
. (∗∗)
y − f (x0 ) f (x) − f (x0 )
x−x0
2
Die Reihenfolge der Faktoren wurde so gewählt, weil man die Vektoren aus E nach Vereinbarung von
links mit den Skalaren multipliziert.
5.1 Differenzierbare Abbildungen 153
Sei nun (yn ) eine Folge in J mit yn 6= f (x0 ), die gegen f (x0 ) konvergiert. Da f −1 in
f (x0 ) stetig ist, konvergiert die Folge (xn := f −1 (yn )) gegen x0 = f −1 (f (x0 )). Da f in x0
differenzierbar ist, folgt dann mit (**)
f −1 (yn ) − f −1 (f (x0 )) 1
lim = ′ .
n→∞ yn − f (x0 ) f (x0 )
⊓
⊔
Ohne die Voraussetzung f ′ (x0 ) 6= 0 ist die inverse Abbildung in f (x0 ) i.a. nicht diffe-
renzierbar. Wir betrachten dazu als Beispiel die bijektive und differenzierbare Abbildung
f : R −→ R mit f (x) = x3 . f ist bijektiv und differenzierbar, es gilt f (0) = 0 und
f ′ (0) = 0. Die inverse Abbildung f −1 : R −→ R ist gegeben durch
√
3 y falls y > 0,
−1
f (y) := 0 falls y = 0,
p 3
− |y| falls y < 0.
f −1 ist in 0 stetig, aber nicht diferenzierbar. Z.B. existiert bereits der rechtsseitige Grenz-
wert des Differenzenquotienten von f −1 für x gegen 0+ nicht, da
√
f −1 (x) − f −1 (0) 3
x 1
= = √3
.
x x x2
ist auf dem kompakten Intervall [−1, 1] ⊂ R gleichmäßig konvergent. Deswegen sind
P
lim und auf diesem Intervall vertauschbar und wir erhalten
∞
eh − 1 X hn−1
lim = lim = 1.
h→0 h h→0 n!
n=1
ex+h − ex eh − 1
exp′ (x) = lim = lim ex · = ex = exp(x).
h→0 h h→0 h
154 5 Differentialrechnung für Funktionen einer reellen Variablen
Somit ist
1
ln′ (x) = für alle x ∈ R+ .
x
pa (x) := xa = eln(x)·a
1 xa
p′a (x) = exp′ (ln(x) · a) · a · ln′ (x) = eln(x)·a · a · = · a = a · xa−1 .
x x
(expb )′ (x) = eln(b)·x · ln(b) = ln(b) · bx = ln(b) · expb (x) für alle x ∈ R.
und
∞
cos(h) − 1 X h2n−1
lim = (−1)n lim = 0.
h→0 h h→0 (2n)!
n=1
und
cos(x + h) − cos(x) cos(x) cos(h) − sin(x) sin(h) − cos(x)
=
h h
cos(h) − 1 sin(h)
= cos(x) · − sin(x) ·
h h
h→0
−→ − sin(x).
Bezeichnung: C (k) (I, E) bezeichne den Vektorraum aller k-fach stetig differenzierbaren
Abbildungen von I nach E. C ∞ (I, E) bezeichne den Vektorraum aller glatten Abbildungen
von I nach E.
156 5 Differentialrechnung für Funktionen einer reellen Variablen
Diese Funktion f ist differenzierbar, aber f ′ ist in 0 nicht stetig. Um dies einzusehen,
betrachten wir zunächst x 6= 0. Dann ist
1 1 1 1 1
f ′ (x) = 2x · sin + x2 · cos · − 2 = 2x · sin − cos .
x x x x x
Für den Differenzenquotienten von f in x = 0 gilt
somit ist f ′ (0) = 0. Die Funktion f : R −→ R ist also differenzierbar. Da cos( x1 ) für x → 0
keinen Grenzwert hat, hat auch f ′ keinen Grenzwert in x = 0. Somit ist die Ableitung f ′
in x = 0 nicht stetig. Insbesondere ist f auch nicht 2–mal differenzierbar in x = 0.
R
6
1 f0
2
f1 -
−1 − 21 1
2 1
R
Die Funktion f0 hat also die Periode 1. Wir definieren nun für n ∈ N die Funktionen
2. Die Funktionen fn sind auf R beschränkt, da |fn (x)| ≤ 21 4−n =: Mn für alle x ∈ R.
Aus den Eigenschaften der geometrischen Reihe folgt für die Reihe der Schranken:
X∞ ∞
1X 1 n 2
Mn = = < ∞.
2 4 3
n=0 n=0
∞
P
Somit ist die Funktionenreihe fn gleichmäßig konvergent auf R. Wir bezeichnen
n=0
mit f ihre Grenzfunktion.
Aus (1) und (2) folgt, dass f : R −→ R stetig ist. Trotzdem ist f nirgends differenzierbar,
wie wir jetzt sehen werden:
Sei x ∈ R beliebig gegeben. Für n ∈ N wählen wir hn := 41 · 4−n oder hn := − 41 · 4−n
derart, dass fn zwischen x und x + hn linear ist. Nach Konstruktion sind dann fk für alle
k ≤ n zwischen x und x + hn linear. Da die linearen Abschnitte von fn den Anstieg ±1
haben, folgt
fk (x + hn ) − fk (x)
= ±1 ∀ k ≤ n.
hn
fk (x+hn )−fk (x)
Für k > n ist hn = 4−(n+1) eine Periode von fk . Folglich ist hn = 0 für alle
k > n und daher gilt
n n
f (x + hn ) − f (x) X fk (x + hn ) − fk (x) X
= = ±1.
hn hn
k=0 k=0
Diese Partialsummenfolge kann für n → ∞ nicht konvergieren, da die Reihenglieder keine
Nullfolge sind. Somit existiert der Grenzwert f ′ (x) = lim f (x+hhnn)−f (x) nicht.
n→∞
In diesem Abschnitt werden wir die Mittelwertsätze der Differentialrechnung für reellwer-
tige differenzierbare Funktionen f : I ⊂ R −→ R beweisen und mit ihrer Hilfe Aussagen
über den Kurvenverlauf der durch f definierten Kurve graph(f ) := {(x, f (x) | x ∈ I}
machen.
Definition 5.4. Man sagt: Eine Funktion f : I ⊂ R −→ R nimmt in x0 ∈ I ein lokales
Maximum (bzw. lokales Minimum) an, falls ein ε > 0 existiert, so dass
f (y) ≤ f (x0 ) (bzw. f (y) ≥ f (x0 )) für alle y ∈ I mit |y − x0 | < ε.
R6
lok. Maximum
f (x01 )
f (x02 )
lok. Minimum
-
a x01 x02 b R
158 5 Differentialrechnung für Funktionen einer reellen Variablen
Beweis. Sei f (x0 ) ein lokales Maximum von f . Dann existiert ein ε > 0, so dass
f (x)−f (x0 )
x−x0 ≤0 für alle x > x0 mit |x − x0 | < ε und
f (x)−f (x0 )
x−x0 ≥0 für alle x < x0 mit |x − x0 | < ε.
f (x)−f (x0 )
Da der Grenzwert f ′ (x0 ) = lim x−x0 nach Voraussetzung existiert, muss gelten
x→x0
Aus f ′ (x0 ) = 0 folgt im Allgemeinen nicht, dass f in x0 ein lokales Maximum oder Mi-
nimum hat. Wir betrachten zum Beispiel f (x) = x3 . Dann ist f ′ (0) = 0, aber 0 ist kein
lokaler Extremwert von f . Zu beachten ist außerdem, dass die Aussage von Satz 5.5 nicht
für die Randpunkte des Definitionsbereiches I von f gilt.
Satz 5.6 (Satz von Rolle) Sei f : [a, b] −→ R stetig und auf (a, b) differenzierbar. Wei-
terhin gelte f (a) = f (b). Dann existiert ein Punkt x0 ∈ (a, b) mit f ′ (x0 ) = 0.
Beweis. Ist f konstant auf [a, b], so ist die Behauptung trivial. Ist f nicht konstant, so
existiert ein x1 ∈ (a, b), so dass entweder
Wir betrachten zunächst den ersten Fall. Da f : [a, b] −→ R stetig und [a, b] kompakt ist,
nimmt f auf [a, b] ein globales Maximum an. Das Maximum liegt wegen obiger Annahme
nicht auf den Randpunkten. Folglich existiert ein x0 ∈ (a, b) mit
Nach Satz 5.5 folgt dann f ′ (x0 ) = 0. Der Beweis für den zweiten Fall verläuft analog mit
Hilfe des globalen Minimums. ⊓
⊔
Nach dem Satz von Rolle existiert ein ξ ∈ (a, b) mit ϕ′ (ξ) = 0. Wir erhalten somit
⊓
⊔
Wir werden den Mittelwertsatz von Lagrange jetzt anwenden, um Aussagen über den
Kurvenverlauf der durch f : I ⊂ R −→ R definierten Kurve Γ = graph(f ) im R2 zu
machen.
Beweis. Seien x1 , x2 ∈ (a, b) und x1 < x2 . Wir wenden den Mittelwertsatz von Lagrange
auf f |[x1 ,x2 ] an. Nach diesem Satz existiert ein ξ ∈ (x1 , x2 ), so dass
f (x2 ) − f (x1 )
f ′ (ξ) = .
x2 − x1
Da x2 − x1 > 0, folgen die Behauptungen aus Satz 5.8. ⊓
⊔
3
Sofern nichts anderes gesagt wird, lassen wir im Folgenden bei offenen Intervallen (a, b) auch a, b ∈ {±∞}
zu.
160 5 Differentialrechnung für Funktionen einer reellen Variablen
Als Anwendung beweisen wir zunächst die folgende Charakterisierung der Exponential-
funktion.
Folgerung 5.1 Seien a, c ∈ R gegebene Konstanten. Dann existiert genau eine differen-
zierbare Funktion f : R −→ R mit f ′ = cf und f (0) = a. Diese Funktion ist gegeben durch
f (x) = aecx für alle x ∈ R.
Beweis. Die Funktion f : R −→ R mit f (x) := aecx erfüllt f ′ (x) = caecx = cf (x) und
f (0) = a. Sei nun f : R −→ R eine beliebige Funktion mit f ′ = cf und f (0) = a. Wir
setzen F (x) := f (x) · e−cx . Dann gilt
Somit ist F konstant. Da F (0) = a, gilt a = f (x) · e−cx und folglich f (x) = aecx für alle
x ∈ R. ⊓
⊔
Satz 5.10 Sei f : (a, b) −→ R eine differenzierbare Funktion, die in x0 ∈ (a, b) zweimal
differenzierbar ist. Es gelte
1. f ′ (x0 ) = 0 und
2. f ′′ (x0 ) < 0 (bzw. f ′′ (x0 ) > 0).
Dann hat f in x0 ein isoliertes lokales Maximum (bzw. Minimum), das heißt, es existiert
ein ε > 0, so dass f (x) < f (x0 ) (bzw. f (x) > f (x0 )) für alle x ∈ (a, b) mit 0 < |x−x0 | < ε.
Beweis. Wir beweisen nur den Fall f ′′ (x0 ) < 0. Der Beweis für f ′′ (x0 ) > 0 verläuft analog.
Aus
f ′ (x) − f ′ (x0 )
f ′′ (x0 ) = lim <0
x→x0 x − x0
folgt, dass ein δ > 0 existiert, so dass
f ′ (x) − f ′ (x0 )
<0
x − x0
Nach Satz 5.9 ist daher f |(x0 −δ,x0 ) streng monoton wachsend, während f |(x0 ,x0 +δ) streng
monoton fallend ist. Somit hat f in x0 ein isoliertes lokales Maximum. ⊓
⊔
5.2 Die Mittelwertsätze der Differentialrechnung und Anwendungen 161
Ist f konvex, so liegt die Kurve graph(f ) := {(x, f (x)) | x ∈ (a, b)} ⊂ R2 für beliebige
x1 , x2 ∈ (a, b) unterhalb der Geraden durch (x1 , f (x1 )) und (x2 , f (x2 )). Ist f konkav, so
liegt graph(f ) für beliebige x1 , x2 ∈ (a, b) oberhalb der Geraden durch (x1 , f (x1 ) und
(x2 , f (x2 )).
f (x2 ) •
f (x1 ) • f (x1 ) •
- -
x1 x2 x1 x2
R R
1. f ist genau dann konvex, wenn f ′′ (x) ≥ 0 für alle x ∈ (a, b).
2. f ist genau dann konkav, wenn f ′′ (x) ≤ 0 für alle x ∈ (a, b).
Beweis. Wir zeigen nur die erste Behauptung. Der Beweis der zweiten Behauptung wird
analog geführt.
(⇐= ) Sei f ′′ (x) ≥ 0 für alle x ∈ (a, b). Nach Satz 5.9 ist f ′ auf (a, b) monoton wachsend.
Seien x1 , x2 ∈ (a, b), x1 < x2 und λ ∈ (0, 1). Wir setzen x := λx1 + (1 − λ)x2 . Dann ist
x1 < x < x2 . Nach dem Mittelwertsatz existieren ein ξ1 ∈ (x1 , x) und ein ξ2 ∈ (x, x2 ), so
dass
f (x) − f (x1 ) f (x2 ) − f (x)
= f ′ (ξ1 ) ≤ f ′ (ξ2 ) = .
x − x1 x2 − x
Da x − x1 = (1 − λ)(x2 − x1 ) und x2 − x = λ(x2 − x1 ), erhalten wir
differenzierbar und es gilt ϕ′ (x0 ) = 0 und ϕ′′ (x0 ) < 0. Nach Satz ?? hat ϕ daher in x0 ein
isoliertes lokales Maximum, das heißt, es existiert ein h > 0 mit [x0 − h, x0 + h] ⊂ (a, b),
so dass ϕ(x0 − h) < ϕ(x0 ) und ϕ(x0 + h) < ϕ(x0 ). Deshalb gilt
1 1
f (x0 ) = ϕ(x0 ) > (ϕ(x0 − h) + ϕ(x0 + h)) = (f (x0 − h) + f (x0 + h)).
2 2
Mit λ = 21 , x1 = x0 − h und x2 = x0 + h folgt, dass f nicht konvex ist.
Definition 5.6. Sei f : (a, b) −→ R eine stetige Funktion. Der Punkt x0 ∈ (a, b) heißt
Wendepunkt von f , wenn ein Intervall (x0 − ε, x0 + ε) ⊂ (a, b) existiert, so dass entweder
f |(x0 −ε,x0 ) konkav und f |(x0 ,x0 +ε) konvex ist oder Umgekehrtes gilt.
Satz 5.12 Sei f : (a, b) ⊂ R −→ R zweimal stetig differenzierbar. Ist x0 ∈ (a, b) ein
Wendepunkt von f , so gilt f ′′ (x0 ) = 0.
Wir haben den Mittelwertsatz der Differentialrechnung für reellwertige Funktionen bewie-
sen. Für komplexwertige oder vektorwertige Funktionen gilt der Mittelwertsatz in dieser
Form nicht mehr. Wir betrachten als Beispiel die Funktion f : [0, 2π] −→ R2 :
Es gilt aber der folgende Mittelwertsatz für vektorwertige (und damit auch für komplex-
wertige) Funktionen:
Beweis. 1. Zum Beweis des Satzes benötigen wir das folgende Lemma:
Lemma 5.7. Sei f : [a, b] −→ E in x0 ∈ (a, b) differenzierbar, und seien (αk ) und (βk )
Folgen in [a, b] mit αk < x0 < βk , die beide gegen x0 konvergieren. Dann gilt
f (βk ) − f (αk )
lim = f ′ (x0 ).
k→∞ β k − αk
βk −x0
Beweis. Wir betrachten yk := βk −αk ∈ (0, 1). Dann gilt:
f (βk ) − f (αk )
− f ′ (x0 )
β k − αk
f (βk ) − f (x0 ) ′ f (αk ) − f (x0 ) ′
= yk · − f (x0 ) + (1 − yk ) · − f (x0 ) .
|{z} βk − x0 | {z } αk − x 0
beschr. beschr.
2. Wir beweisen nun die Aussage des Satzes. Sei L := b−a 3 und M := kf (b) − f (a)k. Wir
betrachten die Funktion g : [a, a + 2L] ⊂ R −→ E, definiert durch g(s) := f (s + L) − f (s).
Dann gilt:
g(a) + g(a + L) + g(a + 2L) = f (b) − f (a)
und somit
M ≤ kg(a)k + kg(a + L)k + kg(a + 2L). (⋆)
Wir überlegen uns zunächst, dass ein s1 ∈ (a, a+2L) existiert mit kg(s1 )k ≥ 13 M . Nehmen
wir an, dass für alle s ∈ (a, a + 2L) die Ungleichung kg(s)k < 13 M gilt. Da die Funktion
g : [a, a + 2L] −→ E und die Norm k · k stetig sind, erhalten wir auch
1 1
kg(a)k ≤ M und kg(a + 2L)k ≤ M.
3 3
Dies widerspricht (⋆), es gibt also ein s1 ∈ (a, a + 2L) mit kg(s1 )k ≥ 31 M .
Sei nun t1 := s1 + L ∈ (a, b). Dann gilt:
Wir wiederholen nun diese Konstruktion, indem wir statt des Intervalls [a, b] das Intervall
[s1 , t1 ] betrachten. Dadurch erhalten wir Folgen (sn ) und (tn ), so dass gilt
1 1
[sn , tn ] ⊂ (sn−1 , tn−1 ), tn − s n = (b − a), kf (tn ) − f (sn )k ≥ · M.
3n 3n
Wir haben also eine Intervallschachtelung (In := [sn , tn ]), bei der die Länge der Intervalle
In gegen 0 konvergiert. Nach dem Satz über die Intervallschachtelung existiert dann ein
∞
T
ξ ∈ R mit In = {ξ}. Es gilt somit
n=1
sn −→ ξ, tn −→ ξ, s n < ξ < tn
und
kf (tn ) − f (sn )k M M
≥ n
= .
tn − s n (tn − sn ) · 3 b−a
Aus Lemma 5.7 folgt nun
f (tn ) − f (sn )
f ′ (ξ) = lim
n→∞ tn − s n
und damit
f (tn ) − f (sn )
kf (tn ) − f (sn )k
kf ′ (ξ)k =
lim
= lim
n→∞ tn − s n n→∞ tn − s n
M kf (b) − f (a)k
≥ = .
b−a b−a
⊓
⊔
164 5 Differentialrechnung für Funktionen einer reellen Variablen
Dies aber bedeutet, dass f lipschitzstetig mit der Lipschitz-Konstanten C ist. Sei nun
f : [a, b] −→ E stetig differenzierbar. Dann ist f ′ stetig, d.h. f ′ ∈ C([a, b], E). Da [a, b]
kompakt ist, existiert
Abschließend beweisen wir mit Hilfe des verallgemeinerten Mittelwertsatzes von Cauchy
die Regeln von L’Hospital. Diese Regeln liefern ein einfaches Verfahren, Grenzwerte von
Brüchen zweier Funktionen zu bestimmen, wenn bei Limesbildung Ausdrücke der Form 00
oder ∞∞ auftreten.
Da g ′ (x) 6= 0 für x ∈ (xn , x0 ) (bzw. (x0 , xn )), ist g(xn ) 6= 0 (Satz von Rolle). Damit folgt
f (xn ) f ′ (ξn )
= ′ .
g(xn ) g (ξn )
5.2 Die Mittelwertsätze der Differentialrechnung und Anwendungen 165
Da (xn ) gegen x0 konvergiert, ist auch (ξn ) gegen x0 konvergent und wir erhalten
f ′ (x)
2. Fall: lim g(x) = +∞ und lim ′ = 0.
x→x0 x→x0 g (x)
Sei (xn ) eine gegen x0 konvergente Folge in (a, b) mit xn < x0 und ε > 0. Nach Voraus-
setzung existiert ein x∗ ∈ (a, x0 ), so dass
′
f (x)
g(x) > 0 und für alle x ∈ (x∗ , x0 ).
g ′ (x) < ε
und damit
f (xn ) f (x∗ ) g(x ∗)
g(xn ) ≤ g(xn ) + ε 1 − g(xn ) .
Wir erhalten:
f (xn )
lim sup ≤ ε.
n→∞ g(xn )
Da ε beliebige Werte annehmen kann, folgt daraus
f (xn )
lim =0
n→∞ g(xn )
f (x)
lim = 0.
x→x0 g(x)
166 5 Differentialrechnung für Funktionen einer reellen Variablen
f ′ (x)
3. Fall: lim g(x) = +∞ und lim ′ = c ∈ R beliebig.
x→x0 x→x0 g (x)
Wir betrachten die Funktion f1 (x) := f (x) − c · g(x). Dann ist
f1′ (x) f ′ (x)
lim = lim − c = 0.
x→x0 g ′ (x) x→x0 g ′ (x)
f ′ (x)
4. Fall: lim f (x) = lim g(x) = +∞ und lim ′ = +∞.
x→x0 x→x0 x→x0 g (x)
g ′ (x) g(x)
Dann gilt lim ′ = 0 und aus dem 2. Fall folgt sofort lim = 0. Nach Vorausetzung
x→x0 f (x) x→x0 f (x)
f (x)
sind f und g in einer Umgebung von x0 positiv. Folglich gilt lim = +∞.
x→x0 g(x)
f ′ (x)
5. Fall: lim f (x) = lim g(x) = +∞ und lim ′ = −∞.
x→x0 x→x0 x→x0 g (x)
Dieser Fall kann nicht auftreten, da sonst f oder g in einer Umgebung von x0 monoton
fallend wären und somit nicht gegen +∞ konvergieren würden. ⊓
⊔
f (x)
lim = c.
x→∞ g(x)
Beweis. OBdA. sei a > 0. Wir betrachten die Funktionen f1 (x) = f ( x1 ) und g1 (x) = g( x1 )
auf dem Intervall (0, a1 ). Dann gilt
1 1 1 1
f1′ (x) = − 2 f ′ und g1′ (x) = − 2 g ′ 6= 0
x x x x
und daher
f1′ (x) f ′ ( x1 ) Vor.
lim = lim = c.
x→0+ g1′ (x) x→0+ g ′ ( x1 )
Mit Satz 5.15 folgt dann
f (x) f1 (x)
lim = lim = c.
x→∞ g(x) x→0+ g1 (x)
⊓
⊔
Mit Hilfe der Regeln von L’Hospital können wir Grenzwerte von Funktionen und damit
auch von Folgen in vielen Fällen leichter ausrechnen, als es mit den Methoden der vorigen
Kapitel möglich war.
5.3 Differentiation von Funktionenfolgen und -reihen 167
Beispiele:
1. Für jede positive reelle Zahl α gilt:
ln(x) 1 1
lim = lim = lim = 0,
x→∞ xα x→∞ x · αxα−1 x→∞ αxα
ex ex ex
lim α = lim = . . . = lim = +∞,
x→∞ x x→∞ αxα−1 x→∞ α(α − 1) · . . . · (α − [α] − 1) · xα−([α]+1)
Beweis. (1) Wir zeigen als erstes, dass die Funktionenfolge (fn ) gleichmäßig gegen eine
Grenzfunktion f : [a, b] −→ E konvergiert.
Sei ε > 0. Da (fn (x0 )) konvergent ist, existiert ein n0 ∈ N, so dass für alle m ≥ n ≥ n0
ε
kfn (x0 ) − fm (x0 )k < . (A)
2
Weil (fn′ ) gleichmäßig konvergiert, gibt es ein n1 ∈ N, so dass für alle t ∈ [a, b] und für alle
m ≥ n ≥ n1
ε
kfn′ (t) − fm
′
(t)k < . (B)
2(b − a)
Wir wenden den Mittelwertsatz für Vektorfunktionen auf fn − fm : [a, b] −→ E an: Für
zwei Werte x, t ∈ [a, b] existiert ein ξm,n zwischen x und t mit
kfn (x) − fm (x)k ≤ k(fn (x) − fm (x)) − (fn (x0 ) − fm (x0 ))k + kfn (x0 ) − fm (x0 )k
ε ε
< + =ε (D)
2 2
für alle m ≥ n ≥ n∗ := max{n0 , n1 } und für alle x ∈ [a, b]. (fn ) ist also eine ”gleichmäßige”
Cauchy-Folge. Insbesondere ist (fn (x)) für jedes x ∈ [a, b] eine Cauchyfolge in E. Da E
vollständig ist, konvergiert diese Folge. Wir definieren f : [a, b] −→ R
Gehen wir in (D) mit m gegen ∞, so folgt wegen der Stetigkeit der Norm
Da ϕn −ϕm stetig ist, gilt diese Abschätzung auch für t = x. (ϕn ) ist also eine ”gleichmäßi-
ge” Cauchy-Folge. Mit den gleichen Argumenten wie im Schritt (1) erhalten wir, dass die
Grenzwerte ϕ(t) := lim ϕn (t) für jedes t ∈ [a, b] existieren und dass die Folge (ϕn ) auf
n→∞
[a, b] gleichmäßig auf gegen ϕ konvergiert. Da die Funktionen ϕn stetig sind, ist auch ϕ
stetig und wir erhalten
⊓
⊔
Das Intervall (x0 − ρ, x0 + ρ) nennt man auch das Konvergenzintervall von P . Wir unter-
suchen zunächst das Verhalten von P in den Randpunkten des Konvergenzintervalls.
1. Ist P (x0 + ρ) konvergent, so ist P|(x −ρ,x +ρ] in x0 + ρ linksseitig stetig, d.h. es gilt
0 0
P∞
lim P (x) = P (x0 + ρ) = an ρ .n
x→(x0 +ρ)− n=0
2. Ist P (x0 − ρ) konvergent, so ist P|[x −ρ,x +ρ) in x0 − ρ rechtsseitig stetig, d.h. es gilt
0 0
∞
P
lim P (x) = P (x0 − ρ) = (−1) an ρn .
n
x→(x0 −ρ)+ n=0
Beweis. Wir beweisen die erste Behauptung. Der Beweis der zweiten Behauptung erfolgt
P
m
analog. Nach Voraussetzung konvergiert die Folge der Partialsummen sm = an ρn gegen
n=0
s = P (x0 + ρ). Wir müssen zeigen, dass für jedes ε > 0 ein δ > 0 existiert, so dass
|P (x) − s| < ε für alle x ∈ (x0 − ρ, x0 + ρ) mit x0 + ρ − x < δ .
Wir setzen y := x − x0 . Aus den Eigenschaften der geometrischen Reihe und dem Cauchy–
Produkt von Reihen folgt für alle y mit |y| < ρ:
∞
X
P (y + x0 ) = an y n
n=0
∞
y y −1 X
= 1− 1− · an y n
ρ ρ
n=0
X ∞ n X ∞
y y
= 1− · · an y n
ρ ρ
|n=0 {z } n=0
| {z }
abs. konv. abs. konv.
∞ m
y X nX y k o
= 1− am−k y m−k
ρ ρ
m=0 k=0
X∞
y y m
= 1− · sm .
ρ ρ
m=0
Außerdem gilt
5.4 Potenzreihen mit reellem Zentrum 171
∞ m
y y −1 y X y
s= 1− 1− ·s= 1− s· .
ρ ρ ρ ρ
m=0
Sei nun ε > 0 gegeben. Da (sm ) gegen s konvergiert, existiert ein n0 ∈ N mit
ε
|sm − s| < ∀ m ≥ n0 .
2
0 −1
nP
ε·ρ
Wir setzen M := |sm − s| und δ := min{ρ, 2M } . Für |y| < ρ mit ρ − y < δ gilt
m=0
y δ
0<1− < .
ρ ρ
Wegen δ ≤ ρ gilt außerdem y > 0. Daraus folgt
0 −1
nX m ∞
X m !
y y y
|P (y + x0 ) − s| ≤ 1− · |sm − s| · + |sm − s| ·
ρ ρ m=n0
ρ
m=0
n0 −1 ∞
δ X y ε X y m
< · |sm − s| + 1 − ·
ρ ρ 2 m=n ρ
m=0 0
δ ε
≤ ·M +
ρ 2
ε ε
≤ + = ε.
2 2
Somit ist die Funktion P im Punkt x0 + ρ linksseitig stetig. ⊓
⊔
Als nächstes zeigen wir, dass die Grenzfunktion einer Potenzreihe mit reellem Zentrum
auf dem Konvergenzintervall auch differenzierbar ist.
∞
P
Satz 5.20 Sei P (x) = an (x − x0 )n eine Potenzreihe mit reellem Zentrum x0 ∈ R und
n=0
positivem Konvergenzradius ρ > 0. Dann ist P : (x0 − ρ, x0 + ρ) ⊂ R −→ K differenzierbar
und es gilt
∞
X
′
P (x) = nan (x − x0 )n−1 .
n=1
Offensichtlich konvergiert die Potenzreihe P (x0 ). Wir betrachten nun die Reihe der Ab-
leitungen
X∞ ∞
X
Q(x) := fn′ (x) = nan (x − x0 )n−1 .
n=0 n=1
172 5 Differentialrechnung für Funktionen einer reellen Variablen
Da
p
n
p
lim sup n|an | = lim sup n |an |,
n→∞ n→∞
stimmen die Konvergenzradien von P und Q überein. Q konvergiert also gleichmäßig auf
jedem kompakten Teilintervall des Konvergenzintervalls (x0 − ρ, x0 + ρ). Nach Satz 5.18
ist P ist deshalb für jedes 0 < r < ρ auf dem Intervall Ir := [x0 − r, x0 + r] differenzierbar
und es gilt
∞
X
P ′ (x) = nan (x − x0 )n−1 für alle x ∈ Ir .
n=1
Als Anwendung berechnen wir die Zahl π. Dazu betrachten wir die Funktion
arctan : R −→ (− π2 , π2 ). R
π 6
Aus dem Additionstheorem für cos erhält man 2
tan π4 = 1, also arctan(1) = π4 . Wir zeigen nun π
•
4
-
∞
P x2k+1
arctan 1 R
arctan x = (−1)k 2k+1 für alle |x| ≤ 1.
k=0
− π2
Beweis. Die Funktion arctan ist differenzierbar und es gilt arctan′ (x) = x21+1 . Aus den
∞
P 1
Eigenschaften der geometrischen Reihe erhält man andererseits (−x2 )k = 1+x 2 für alle
k=0
∞
P
x ∈ (−1, 1). Folglich gilt arctan′ (x) = (−1)k x2k für alle x ∈ (−1, 1).
k=0
Wir betrachten die Potenzreihe
∞
X x2k+1
Q(x) := (−1)k .
2k + 1
k=0
Folglich ist arctan′ (x) = Q′ (x) für alle x ∈ (−1, 1). Da Q(0) = arctan(0) = 0, erhalten wir
arctan(x) = Q(x) für alle x ∈ (−1, 1) und somit
∞
X x2k+1
arctan(x) = (−1)k für alle |x| < 1.
2k + 1
k=0
Außerdem gilt Q(−1) = −Q(1). Nach dem Abelschen Grenzwertsatz 5.19 ist damit Q in
x = ±1 (einseitig) stetig und
π
Da 4 = arctan(1), gilt für π die Leibnizformel
∞
P
π 1 1 1 1
4 =1− 3 + 5 − 7 ± ... = (−1)k 2k+1 .
k=0
Diese Reihe konvergiert sehr langsam gegen π4 . Man benötigt etwa 1000 Summanden,
um π auf 3 Stellen genau zu erhalten. Wesentlich schneller konvergente Reihen mit dem
Grenzwert π4 erhält man durch den folgenden Trick:
Durch Umkehrung der Additionstheoreme folgt für x · y 6= 1
x+y
arctan(x) + arctan(y) = arctan .
1−x·y
Wir setzen in diese Gleichung spezielle Werte für x und y ein und erhalten:
1 5 1
2 arctan = arctan (x = y = ),
5 12 5
5 120 5
2 arctan = arctan (x = y = ),
12 119 12
1 120 1
arctan(1) + arctan = arctan (x = 1, y = ).
239 119 239
Daraus folgt
π 1 1
= arctan(1) = 4 · arctan − arctan (∗)
4 5 239
∞ 2k+1 ∞
X (−1) k 1 X (−1)k 1 2k+1
= 4· − . (⋆⋆)
2k + 1 5 2k + 1 239
k=0 k=0
Die Formel (∗) findet man auch unter dem Namen Machinsche Formel. Der englische
Astronom John Machin (1680-1751) hat diese Formel 1706 gefunden und mit ihrer Hilfe
die ersten 100 Nachkommastellen von π berechnet.
∞
P
Ist s = (−1)k ak eine alternierende Reihe mit monoton fallender Nullfolge positiver
k=0
reeller Zahlen (ak ), so kann man den Fehler bei der Näherungsrechnung nach Satz 3.9
folgendermaßen abschätzen:
n
X
s − (−1)k ak ≤ an+1 .
k=0
174 5 Differentialrechnung für Funktionen einer reellen Variablen
Für den Fehler F1 bei Addition von 8 Reihengliedern der ersten Reihe in (⋆⋆) gilt
4 1
F1 ≤ · 17 < 4 · 10−13 .
|17 {z5 }
=a8
Für den Fehler F2 bei Addition von 2 Reihengliedern der zweiten Reihe in (⋆⋆) gilt
1 1
F2 ≤ · 5
< 3 · 10−13 .
5 239
| {z }
a2
Wir erhalten also bereits durch die Addition sehr weniger Reihenglieder in (⋆⋆) eine sehr
gute Näherung von π, die weniger als 3 · 10−12 vom wahren Wert abweicht. Die Addition
dieser ersten Reihenglieder ergibt z.B. für die ersten 10 Nachkommastellen von π:
Wir kennen aus Kapitel 4 bereits einige Funktionen, die durch Potenzreihen definiert sind.
In diesem Abschnitt wollen wir untersuchen, unter welchen Bedingungen man eine Funk-
tion f : I ⊂ R −→ R als Potenzreihe darstellen kann.
Bevor wir beginnen, vereinbaren wir zunächst einige nützliche, in der Literatur gebräuch-
liche Abkürzungen.
• h1 (x) = h2 (x) + o(g(x)) für x → x0 , ist die Abkürzung für h1 (x) − h2 (x) = o(g(x))
für x → x0 . Analog für O(g(x)).
• Insbesondere heißt h(x) = o((x − x0 )n ) für x → x0 , dass
h(x)
lim = 0.
x→x0 (x − x0 )n
h(x) geht für x → x0 also schneller gegen 0 als (x − x0 )n . Man sagt auch h verschwindet
in x0 von höherer als n-ter Ordnung. Für h1 (x) = h2 (x) + o((x − x0 )n ) für x → x0 ,
sagt man auch h2 approximiert h1 in x0 von höherer als n-ter Ordnung.
5.5 Reell-analytische Funktionen und Taylorreihen 175
Man sagt in diesem Fall auch, dass f in einer Umgebung von x0 in eine Potenzreihe
entwickelbar ist. Ist U ⊂ R ein offenes Intervall, so heißt f : U −→ R reell-analytisch,
wenn f in jedem Punkt von U reell-analytisch ist.
∞
P
Beweis. Nach Voraussetzung existiert eine Potenzreihe Q(x) := ak (x − x0 )k mit
k=0
positivem Konvergenzradius ρ > 0 und ein r > 0, so dass f (x) = Q(x) für alle
x ∈ U := (x0 − min{r, ρ}, x0 + min{r, ρ}). Nach Satz 5.20 ist die Funktion f auf U
differenzierbar und für ihre Ableitung gilt
∞
X
f ′ (x) = k · ak (x − x0 )k−1 ∀ x ∈ U.
k=1
Diese Potenzreihe kann man wiederum auf U gliedweise ableiten ohne den Konvergenzbe-
reich zu verkleinern. Nach Satz 5.20 existiert wiederum f ′′ (x) mit
∞
X
f ′′ (x) = k(k − 1)ak (x − x0 )k−2 ∀ x ∈ U.
k=2
176 5 Differentialrechnung für Funktionen einer reellen Variablen
Durch weiteres Anwenden des Satzes 5.20 folgt, dass f auf U beliebig oft differenzierbar
ist mit der n-ten Ableitung
∞
X
f (n) (x) = k(k − 1) · . . . · (k − n + 1)ak (x − x0 )k−n ∀ x ∈ U.
k=n
Nach Satz 5.21 hat die Taylorreihe T (f, x0 )(x) einer in x0 reell-analytischen Funktion f
positiven Konvergenzradius. Des Weiteren stimmt f in einer Umgebung von x0 mit ihrer
Taylorreihe überein. Beide Eigenschaften sind für C ∞ -Funktionen i.a. nicht erfüllt, wie die
folgenden Beispiele zeigen. Es gibt also C ∞ –Funktionen, die nicht reell-analytisch sind:
Beispiel 2: Eine glatte Funktionen mit überall konvergenter Taylorreihe, die nicht mit
ihrer Taylorreihe übereinstimmt:
Sei f : R −→ R die Funktion
( 1
e− x2 für x > 0
f (x) :=
0 für x ≤ 0.
f ist unendlich oft differenzierbar und für die Ableitungen in x0 = 0 gilt f (k) (0) = 0 für
alle k ∈ N0 (Übungsaufgabe). Für die Taylorreihe von f in x0 = 0 erhalten wir damit
T (f, 0)(x) = 0 für alle x ∈ R. Nach Definition ist aber f (x) 6= 0 für alle x > 0.
Wir wollen nun Bedingungen finden, unter denen eine C ∞ –Funktion reell-analytisch ist.
Dazu betrachten wir die Taylorpolynome von f , die als Partialsummen der Taylorreihe
auftreten und untersuchen ihre Abweichung von f :
5.5 Reell-analytische Funktionen und Taylorreihen 177
dj
Tn (f, x0 )(x0 ) = f (j) (x0 ) für j = 0, . . . , n.
dxj
d.h. das n-te Taylorpolynom Tn (f, x0 ) approximiert f in x0 von höherer als n-ter Ordnung.
′ d
Rn+1 = f′ − Tn+1 (f, x0 ) = f ′ − Tn (f ′ , x0 ).
dx
Wir wenden nun die Induktionsvoraussetzung auf die n-mal differenzierbare Funktion f ′
an und erhalten f ′ (x) = Tn (f ′ , x0 )(x) + o((x − x0 )n ) . Folglich existiert für alle ε > 0 ein
δ > 0, so dass
178 5 Differentialrechnung für Funktionen einer reellen Variablen
′
|Rn+1 (x)| |f ′ (x) − Tn (f ′ , x0 )(x)|
= <ε ∀ x ∈ I mit 0 < |x − x0 | < δ. (⋆)
|x − x0 |n |x − x0 |n
Sei x ∈ I mit 0 < |x − x0 | < δ. Die Funktion Rn+1 ist zwischen x0 und x differenzierbar.
Nach dem Mittelwertsatz existiert ein ξ zwischen x und x0 , so dass
(⋆)
′
|Rn+1 (x) − Rn+1 (x0 ) | ≤ |Rn+1 (ξ)||x − x0 | < ε · |ξ − x0 |n |x − x0 | < ε|x − x0 |n+1 .
| {z }
=0
Rn+1 (x)
Wir erhalten (x−x n+1 < ε für alle x ∈ I mit 0 < |x − x0 | < δ. Daraus folgt
0)
Ist f unendlich oft differenzierbar, so stimmt f (x) genau dann mit der Taylorreihe
T (f, x0 )(x) überein, wenn
lim Rn (f, x0 )(x) = 0.
n→∞
Wir interessieren uns deshalb für explizite Formeln für das Restglied Rn (f, x0 )(x), die es
ermöglichen, dieses Kriterium zu überprüfen bzw. den Fehler bei der Approximation von
f (x) durch das n–te Taylorpolynom Tn (f, x0 )(x) zu beschreiben.
Beweis. Sei x ∈ I ein fixierter Punkt mit x 6= x0 . Wir betrachten die differenzierbare
Funktion g : I −→ R mit
g(y) := f (x) − Tn (f, y)(x).
Dann gilt g(x) = 0, g(x0 ) = Rn (f, x0 )(x) und
n
!
d X f (k) (y)
g ′ (y) = − (x − y)k
dy k!
k=0
n
X n
X
f (k+1) (y) f (k) (y)
=− (x − y)k + k(x − y)k−1
k! k!
k=0 k=1
(x − y)n (n+1)
=− f (y).
n!
5.5 Reell-analytische Funktionen und Taylorreihen 179
Nach dem Mittelwertsatz der Differentialrechnung existiert ein θ ∈ (0, 1), so dass
=y
z }| {
g(x) − g(x0 ) = g ′ (x0 + θ(x − x0 )) · (x − x0 )
(x − x0 )n+1 (1 − θ)n (n+1)
=− f (x0 + θ(x − x0 )).
n!
Folglich ist
Beweis. Die Funktion f (x) := ln(x + 1) ist auf (−1, ∞) beliebig oft differenzierbar und es
gilt f (0) = 0 sowie
(n − 1)!(−1)n+1
f (n) (x) = für alle n ∈ N.
(1 + x)n
180 5 Differentialrechnung für Funktionen einer reellen Variablen
Wir zeigen, dass diese Reihe für alle x ∈ (−1, 1) gegen f (x) konvergiert. Dazu betrachten
wir die Cauchy–Form des Restgliedes: Es existiert ein θ ∈ (0, 1) mit
Ist |x| < 1, so gilt 1 − θ < 1 − θ|x| und 1 + θx ≥ 1 − θ|x| > 1 − |x| > 0 . Daraus folgt für
x ∈ (−1, 1)
n+1 (1 − θ)
n
n+1 (1 − θ|x|)
n |x|n+1 1 − θ|x| n
|Rn (f, 0)(x)| = |x| < |x| < ·
(1 + θx)n+1 (1 + θx)n+1 1 − |x| 1 + θx
|x| n+1
≤ ,
1 − |x|
und somit lim Rn (f, 0)(x) = 0 . Also konvergiert die Taylorreihe T (f, 0)(x) für |x| < 1
n→∞
gegen f (x):
X∞
(−1)n+1 n
ln(1 + x) = x für alle |x| < 1.
n
n=1
Beweis. Wir bestimmen zunächst wieder die Taylorreihe von f in x0 = 0. f (x) = (1 + x)α
ist auf (−1, ∞) beliebig oft differenzierbar und es gilt f (0) = 1 sowie
und daher
f (k) (0) α(α − 1) · . . . · (α − k + 1) α
= = .
k! k! k
5.6 Lokale Extrema für Funktionen einer reellen Variablen 181
Wir wissen bereits, dass die Binomialreihe Bα (x) für |x| < 1 konvergiert (siehe Übungs-
aufgabe 36). Wir zeigen nun, dass ihr Grenzwert f (x) = (1 + x)α ist. (Für α ∈ N ist die
Reihe endlich und wir erhalten die Binomische Formel). Wir betrachten dazu wieder die
Cauchy–Form des Restgliedes
f (n+1) (θx)
Rn (f, 0)(x) = (1 − θ)n xn+1
n!
α(α − 1) · . . . · (α − n)
= (1 + θx)α−n−1 (1 − θ)n xn+1
n!
α−1
=α· (1 − θ)n xn+1 (1 + θx)α−n−1
n
α−1 1 − θ n n+1
=α· x (1 + θx)α−1 .
n 1 + θx
| {z }
<1 für |x|<1
Damit konvergiert die Binomialreihe Bα (x) = T (f, 0)(x) für x ∈ (−1, 1) gegen f (x). ⊓
⊔
In Satz 5.10 hatten wir bereits ein Kriterium für die Existenz eines lokalen Extremwertes
einer 2-mal differenzierbaren Funktion kennengelernt. Mit Hilfe der Ergebnisse des letzten
Abschnittes können wir dieses Kriterium nun verallgemeinern.
f (n−1) (x)
Deshalb gibt es ein δ > 0, so dass x−x0 > 0 für alle x mit 0 < |x − x0 | < δ. Daraus
folgt
Wir approximieren f durch das (n−2)–te Taylorpolynom und benutzen die Lagrange-Form
des Restgliedes:
Ist n gerade, so ist f (n−1) (ξ)(x − x0 )n−1 > 0 für alle x mit 0 < |x − x0 | < δ. Somit ist
f (x) > f (x0 ) für alle x mit 0 < |x − x0 | < δ, d.h. f hat in x0 ein lokales Minimum.
Ist n ungerade, so gilt
(
(n−1) n−1 > 0 auf (x0 , x0 + δ)
f (ξ)(x − x0 )
< 0 auf (x0 − δ, x0 ).
Folglich hat f in x0 keinen lokalen Extremwert. Mit analogen Argumenten behandelt man
den Fall f (n) (x0 ) < 0. ⊓
⊔
Ist f in x0 ∈ (a, b) unendlich oft differenzierbar und gilt f (n) (x0 ) = 0 für alle n, so kann
man keine allgemeinen Aussagen über das Vorliegen eines lokalen Extremwertes machen.
Sollen die Extrema von f auf einem abgeschlossenen Intervall [a, b] bestimmt werden,
so sind außer den Stellen x0 ∈ (a, b) mit f ′ (x0 ) = 0 auch noch die Intervallenden zu
untersuchen. In diesen Intervallenden gilt das Kriterium aus Satz 5.24 nicht!
6
Nachdem wir in Kapitel 5 die Differentialrechung für Funktionen einer reeller Variablen
behandelt haben, wollen wir uns jetzt mit Funktionen befassen, die von mehreren reellen
Variablen abhängen. Auch für solche Funktionen werden wir einen Differenzierbarkeitsbe-
griff einführen und untersuchen, welche Rückschlüsse die Eigenschaften der Ableitungen
auf das Verhalten der Funktion selbst zulassen.
In dem gesamten Kapitel studieren wir Funktionen f : U ⊂ Rn −→ E, die von einer
offenen Teilmenge U ⊂ Rn in einen reellen normierten Vektorraum (E, k · kE ) abbilden.
Den Rn betrachten wir ebenfalls als normierten Vektorraum mit der Euklidischen Norm
k · k. Wie wir aus Kapitel 4 wissen, ist es für Konvergenzfragen allerdings egal, welche
Norm auf dem Rn wir benutzen, denn sie sind alle zueinander äquivalent.
Zunächst erinnern wir uns nochmals daran, wie wir die Differenzierbarkeit für Funktionen
einer Variablen definiert hatten: Eine Funktion f : U ⊂ R −→ E heißt in x0 ∈ U
differenzierbar, wenn der Grenzwert
f (x0 + h) − f (x0 )
lim =: f ′ (x0 ) ∈ E
h→0 h
existiert. Dies lässt sich auch schreiben als
Lemma 6.2. Sei L : Rn → E eine lineare Abbildung. Dann existiert eine positive Kon-
stante CL ∈ R, so dass
Beweis. Wir betrachten die kanonische Basis (e1 , . . . , en ) im Vektorraum Rn . Dann gilt
für alle x = (x1 , . . . , xn ) ∈ Rn :
X
n Xn
L(x) = L x i ei = xi L(ei ) und somit
i=1 i=1
n
X n
X
kL(x)kE ≤ |xi | · kL(ei )kE ≤ max{kL(ei )kE | i = 1, . . . , n} · |xi | ≤ CL kxk,
i=1 i=1
wobei CL eine geeignete Konstante ist, die man aus der Äquivalenz der Normen im Rn
erhält. Sei nun (yk ) eine Folge im Rn , die gegen x0 konvergiert. Dann gilt
k→∞
kL(yk ) − L(x0 )kE ≤ CL kyk − x0 k −→ 0.
Dann folgt e
L(h) − L(h)
lim = 0.
h→0 khk
6.1 Ableitung, Richtungsableitung und Gradient einer Funktion 185
e
Da beide Abbı́ldungen linear sind, gilt L(0) = L(0). Sei nun x ∈ Rn \{0} und t ∈ R.
Betrachten wir die Folgen h := tx für t → 0+ , so erhalten wir wegen der Linearität von L
e
und L
e
L(tx) − L(tx) e
|t| L(x) − L(x) L(x) − L̃(x)
0 = lim = lim = .
t→0+ ktxk t→0 |t|
+ kxk kxk
e
Also ist L(x) = L(x) für alle x ∈ Rn .
Zu 2) Sei f : U ⊂ Rn −→ E in x0 ∈ U differenzierbar und (xk ) eine gegen x0 konvergente
Folge in U . Dann gilt nach Dreiecksungleichung
kf (xk ) − f (x0 ) − L(xk − x0 )kE
kf (xk ) − f (x0 )kE ≤ · kxk − x0 k + kL(xk − x0 )kE .
kxk − x0 k | {z } | {z }
| {z } →0 →0
→0
Die ersten beiden Konvergenzen folgen aus der Definition der Differenzierbarkeit und der
Stetigkeit der Norm. Für die dritte Konvergenz benutzen wir die Stetigkeit der linearen
Abbildung L. Folglich konvergiert die Folge (f (xk )) gegen f (x0 ). Somit ist f in x0 folgens-
tetig, also auch stetig. ⊓
⊔
betrachtet, das heißt, es gilt ∇a f (x0 ) = h′ (0), wobei h die Funktion h(t) := f (x0 + ta) ist.
Aus Kapitel 4.1 (Beispiel 2) wissen wir, dass f in x0 := (0, 0) nicht stetig, also auch nicht
differenzierbar ist. Ist a = (0, 0), so folgt aus der Definition sofort ∇a f (x0 ) = 0. Für einen
beliebigen Vektor a = (a1 , a2 ) ∈ R2 mit a 6= (0, 0) gilt:
( 2
a2
f (x0 + ta) − f (x0 ) f (ta) t3 a1 a22 a1 a22 t→0 a1 a1 6= 0,
= = 2 2 4 4 = 2 2 4 −→
t t t(t a1 + t a2 ) a1 + t a2 0 a1 = 0.
Beweis. (1) Wir schätzen zunächst die Norm der Abbildung f ab. Jede multilineare Ab-
bildung f : Rn1 × . . . × Rnk −→ E ist stetig. Insbesondere existiert ein δ > 0, so dass für
alle kx1 k, . . . , kxk k ≤ δ gilt
Somit existiert für jede multilineare Abbildung f : Rn1 × . . . × Rnk −→ E eine Konstante
C > 0 mit
kf (x1 , . . . , xk )kE ≤ C · kx1 k · . . . · kxk k.
k
X
f (x1 + a1 , . . . , xk + ak ) − f (x1 , . . . , xk ) − f (x1 , . . . , xj−1 , aj , xj+1 , . . . , xk )
j=1
| {z }
=:L(a)
X
= f (x1 , . . . , aj1 , . . . , aj2 , . . . , xk )
j1 <j2
X
+ f (x1 , . . . , aj1 , . . . , aj2 , . . . , aj3 , . . . , xk ) + . . . + f (a1 , . . . , ak ).
j1 <j2 <j3
Jeder Summand auf der rechten Seite enthält mindestens 2 Faktoren der Form kaj k. Da
kaj1 k · kaj2 k ≤ 12 (kaj1 k2 + kaj2 k2 ) ≤ 21 kak2 , kann man alle Summanden auf der rechten
Seite durch kak2 abschätzen. Daraus folgt
kf (x + a) − f (x) − L(a)kE
lim ≤ lim C · (. . .) · kak = 0.
a→0 kak a→0 ⊓
⊔
Beweis. Die Aussagen 1a) und 3. folgen direkt aus der Definition und den Grenzwertsätzen,
die Ausagen 1b) und 1c) folgen mit analogen Argumenten wie für Funktionen einer Va-
riablen. Wir lassen dies deshalb als Übungsaufgabe.
Wir beweisen hier nur die Kettenregel. Wir setzen dazu y0 := f (x0 ), L := Df (x0 ) und
L̃ = Dg(f (x0 )) und betrachten die Abbildungen
e
kL(ϕ(x))kE ≤ CL
e kϕ(x)kRm für alle x ∈ U .
Folglich ist
kL̃(ϕ(x))kE kϕ(x)kRm
0 ≤ lim ≤ C · lim = 0.
x→x0 kx − x0 k x→x 0 kx − x0 k
| {z }
=0
6.1 Ableitung, Richtungsableitung und Gradient einer Funktion 189
kψ(y)kE
Dies zeigt den 1. Grenzwert. Sei ε > 0. Da lim = 0, existiert ein δ > 0, so dass
y→y0 ky−y0 k
kψ(f (x))kE < εkf (x) − y0 kRm für alle x ∈ U mit kf (x) − y0 kRm < δ.
und damit
kψ(f (x))k kϕ(x)k
≤ε +ε · CL ∀ |x − x0 | < δ1 .
kx − x0 k kx − x k
| {z 0 }
x→x0
→ 0
Daraus folgt
kψ(f (x))kE
lim = 0,
x→x0 kx − x0 k
womit die Kettenregel bewiesen ist.
Ist n = 1, so ist g ◦ f : U ⊂ R → E eine Funktion, die nur von einer reellen Variablen
abhängt. Dann erhalten wir die folgende spezielle Form der Kettenregel für die Ableitung
in x0 :
(g ◦ f )′ (x0 ) = D(g ◦ f )(x0 )(1) = Dg(f (x0 )) Df (x0 )(1) = Dg f (x0 ) f ′ (x0 ) .
⊓
⊔
Ist gradf (x0 ) = 0, so sind alle Richtungsableitungen von f im Punkt x0 Null. In den
regulären Punkten x0 ∈ U gilt:
Beweis. Sei a ∈ Rn mit kak = 1. Dann folgt aus der Cauchy-Schwarzschen Ungleichung
CSU
∇a f (x0 ) = hgradf (x0 ), ai ≤ kgradf (x0 )k · kak = kgradf (x0 )k. (∗)
gradf (x0 )
Für a := kgradf (x0 )k gilt in (*) die Gleichheit. Dies ist die einzige Richtung a für die
in (*) Geichheit gilt, denn wie wir wissen, gilt in der Cauchy-Schwarzschen Ungleichung
genau dann die Gleichheit, wenn beide Vektoren linear abhängig sind. Die Gleichheit in
(*), also der maximal mögliche Wert von ∇a f (x0 ), bei kak = 1, wird somit genau dann
angenommen wenn a in die Richtung von gradf (x0 ) zeigt. ⊓
⊔
Beispiel: Höhenlinien
Wir betrachten die Abbildung, die die Höhe eines Ortes über dem Mehresspiegel angibt:
f : U ⊂ R2 −→ R
(x, y) 7−→ Höhe des Ortes über dem Meeresspiegel.
Dann sieht man die Niveauflächen von f als Höhenlinien auf der Landkarte.
z
grad f (x_0)
Mc
x
Definition 6.7. Sei p ∈ Mc ein regulärer Punkt auf einer Niveaufläche von f . Der Tan-
gentialraum an die Niveaufläche Mc im Punkt p ∈ Mc ist die Menge der Vektoren
6.1 Ableitung, Richtungsableitung und Gradient einer Funktion 191
n o
X ∈ Rn | ∃ differenzierbare Kurve γ : (−ε, ε) −→ Mc ⊂ Rn mit
Tp Mc := .
γ(0) = p, γ ′ (0) = X
gradf (p) ⊥ X.
Beweis. Sei γ : (−ε, ε) −→ Mc eine differenzierbare Kurve mit γ(0) = p und γ ′ (0) = X.
Da Mc die Niveaufläche zum Funktionswert c ist, gilt f (γ(t)) = c für alle t ∈ (−ε, ε).
Nach der Kettenregel ist dann
0 = (f ◦ γ)′ (0) = Df (γ(0)) γ ′ (0) = Df (p)(X) = hgradf (p), Xi.
Also steht der Gradient gradf (p) senkrecht auf X, d.h. grad f (p) ⊥ X. ⊓
⊔
Wir werden später sogar noch mehr zeigen: Ist p ∈ U ein regulärer Punkt von f , so gilt
für die Niveaufläche Mc , die p enthält
Mr 2
Um das zu beweisen, bestimmen wir zunächst den Gradienten von f . Sei p = (p1 , p2 , p3 )
und h = (h1 , h2 , h3 ). Dann gilt:
192 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
Folglich ist gradf (p) = 2p und wir erhalten für den Tangentialraum an die Sphäre nach
Satz 6.5:
Tp Sr2 ⊂ {X ∈ R3 | hX, pi = 0}.
Andererseits: Sei X ∈ R3 ein Vektor mit hX, pi = 0. Wir betrachten die differenzierbare
Kurve γ : (−ε, ε) → Sr2 ,
kXk kXk r
γ(t) := cos t · p + sin t · · X.
r r kXk
Das Bild von γ liegt auf der Sphäre, und es gilt γ(0) = p und γ ′ (0) = X. Wir erhalten
folglich X ∈ Tp Sr2 und somit
{X ∈ R3 | hX, pi = 0} ⊂ Tp Sr2 .
Beweis. Wir betrachten die Abbildung h : [0, 1] → R definiert durch h(t) := f (x+t(y−x)).
Nach Voraussetzung ist h auf [0, 1] differenzierbar. Daher exis-
tiert nach dem Mittelwertsatz von Lagrange ein θ ∈ (0, 1) mit
y
h(1) − h(0) = h′ (θ) · (1 − 0) = h′ (θ). x U ⊂ Rn
Nach Definition von h und aufgrund der Kettenregel ist dies äquivalent zu
Beweis. (1) Wenn die Abbildung f konstant ist, so gilt für jede Richtungsableitung
f (x + ta) − f (x) 0
∇a f (x) = lim = lim = 0,
t→0 t t→0 t
ϕa : (−ε(x0 ), ε(x0 )) −→ R
a t 7−→ ϕa (t) := f (x0 + ta)
x
wohldefiniert und differenzierbar und es gilt nach Kettenregel
U
ϕ′a (t) = Df (x0 + ta)(a) = 0 ∀ t ∈ (−ε(x0 ), ε(x0 )).
Folglich ist ϕa auf (−ε(x0 ), ε(x0 )) konstant. Da aber ϕa (0) = f (x0 ) für alle a ∈ Rn mit
kak = 1, ist f auf K(x0 , ε(x0 )) konstant. Seien nun x, y ∈ U beliebige, aber fixierte Punkte.
Da U bogenzusammenhängend ist, existiert eine stetige Abbildung σ : [0, 1] −→ U ⊂ Rn
mit σ(0) = x und σ(1) = y. Wir betrachten die offene Überdeckung {K(σ(t), ε(σ(t))}t∈[0,1]
von σ([0, 1]). Da [0, 1] kompakt und σ stetig ist, ist auch σ([0, 1]) kompakt.
Wir wissen aus Kapitel 2, dass jede bogenzusammenhängende Teilmenge eines metri-
schen Raumes auch zusammenhängend ist, die Umkehrung gilt im Allgemeinen nicht.
Eine offene Teilmenge U ⊂ Rn ist aber genau dann zusammenhängend, wenn sie bo-
genzusammenhängend ist (siehe Übungsaufgaben). Satz 6.7 gilt somit auch für offene,
zusammenhängende Mengen U ⊂ Rn .
Wie wir aus der Vorlesung über Lineare Algebra wissen, ist jede lineare Abbildung L :
Rn −→ E durch ihre Werte auf den Vektoren einer Basis eindeutig bestimmt. Für den
Vektorraum Rn bietet sich hier die kanonische Basis e = (e1 , . . . , en ) mit
besonders an. Im nächsten Abschnitt werden wir die Differentiale von f durch die Vektoren
Df (x0 )(ei ) = ∇ei f (x0 ) ∈ E beschreiben.
Beweis. Nach Satz 6.2 wissen wir, dass die Richtungsableitungen ∇ei f (u), und somit die
partiellen Ableitungen von f in u ∈ U existieren. Außerdem folgt aus der Definition der
P
n
partiellen Ableitungen für h = (h1 , . . . , hn ) = hi ei :
i=1
X
n n
X n
X ∂f
Df (u)(h) = Df (u) hi ei = hi · Df (u)(ei ) = hi (u).
∂xi ⊓
⊔
i=1 i=1 i=1
Aus Beispiel 1 in Abschnitt 6.1. wissen wir, dass die partiellen Ableitungen existieren
können, ohne dass die Funktion differenzierbar ist. Wir fragen wir uns deshalb, wie man
den partiellen Ableitungen ansehen kann, ob die Funktion differenzierbar ist. Dazu geben
wir ein hinreichendes Kriterium für den Fall von Funktionen mit Werten in einem endlich-
dimensionalen Vektorraum E = Rm an.
6.2 Die partiellen Ableitungen 195
Wir betrachten die Funktion g1 (x) := f (x, u2 , . . . , un ) . Nach Voraussetzung existiert die
∂f
Ableitung g1′ (x) = ∂x 1
(x, u2 , . . . , un ) . Wenden wir den Mittelwertsatz auf g1 an, so erhal-
ten wir eine Zahl ξ1 zwischen u1 und u1 + h1 , so dass gilt
∂f
f (u1 + h1 , u2 , . . . , un ) − f (u1 , . . . , un ) = h1 · (ξ1 , u2 , . . . , un ) .
∂x1
Analog existiert für alle j ∈ {2, . . . , n} ein ξj zwischen uj und uj + hj , so dass gilt
Folglich gilt
n
X∂f X n
∂f X n ∂f ∂f
f (u + h) − f (u) = hj (cj ) = hj (u) + hj (cj ) − (u) .
∂xj ∂xj ∂xj ∂xj
j=1 j=1 j=1
| {z } | {z }
=: L(h), L linear =: R(h)
Es bleibt zu zeigen, dass R(h) = o(khk) für h → 0. Mit der Cauchy-Schwarzschen Unglei-
chung erhalten wir:
X n ∂f ∂f CSU
|R(h)| = hj · (cj ) − (u) ≤ khk · kbk,
∂xj ∂xj
j=1 | {z }
=:bj = bj (h)
196 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
|R(h)|
0≤ ≤ kb(h)k.
khk
Für h → 0 gilt cj (h) → u und somit wegen der Stetigkeit der partiellen Ableitungen in u
auch bj (h) → 0, also kb(h)k → 0. Daraus folgt
|R(h)|
lim = 0.
h→0 khk
Bemerkung:
1. Die Stetigkeit der partiellen Ableitungen ist nicht notwendig für die Differenzierbarkeit.
Als Beispiel betrachten wir dei Funktion f : R2 −→ R mit
(x2 + y 2 ) sin √ 1 für x2 + y 2 > 0,
x 2 +y 2
f (x, y) :=
0 für x = y = 0.
∂F X m
(u) = DF (u)(ei ) = Df (g(u)) Dg(u)(ei ) = Df (g(u)) Dgj (u)(ei ) · ej
∂xi
j=1
X
m
∂g m
X ∂gj
j
= Df (g(u)) (u) · ej = (u) · Df (g(u))(ej )
∂xi ∂xi
j=1 j=1
m
X ∂gj ∂f
= (u) · (g(u)).
∂xi ∂yj
j=1 ⊓
⊔
Aus der Vorlesung über linearen Algebra ist bekannt, dass man lineare Abbildungen durch
Matrizen beschreiben kann. Wir erinnern nochmal an das Verfahren:
Sei V n ein endlich-dimensionaler reeller Vektorraum und a = (a1 , . . . , an ) eine Basis von
V n . Dann ist die Abbildung φa : V −→ Rn ,
x1
X n .
φa (v) = φa xi ai := .
.
|i=1{z } xn
=v
ein Isomorphismus der Vektorräume. Sei nun W m ein weiterer endlich-dimensionaler re-
eller Vektorraum, b = (b1 , . . . , bm ) eine Basis in W m und L : V n −→ W m eine lineare
Abbildung. Dann kann man L die durch das folgende Diagramm definierte (m × n)-Matrix
Mba (L) zuordnen:
L
V / W
φa φb
Mba (L)
Rn / Rm .
Dann gilt
Mba (L) = φb (L(a1 )) φb (L(a2 )) ... φb (L(an )) .
In der i-ten Spalte dieser Matrix stehen also die Komponenten des Vektors L(ai ) bezüglich
der Basis b.
In diesem Sinne ordnen wir nun dem Differential einer differenzierbaren Abbildung f :
U ⊂ Rn −→ Rm eine (m × n)-Matrix zu:
M (Df (u)) = φe Df (u)(e1 ) ... φe Df (u)(en )
∂f
∂f
= φe (u) ... φe (u)
∂x1 ∂xn
∂f1 ∂f1 ∂f1
(u) (u) . . . (u)
∂x1 . ∂x2
..
∂xn
..
=
.. . ... .
∂fm ∂fm ∂fm
∂x1 (u) ∂x2 (u) . . . ∂xn (u)
Auf diese Weise entstehen partielle Ableitungen höherer Ordnung. Die Funktion
∂kf ∂ ∂ k−1 f
:= : U ⊂ Rn −→ E
∂xik · · · ∂xi1 ∂xik ∂xik−1 · · · ∂xi1
heißt (falls sie existiert) k–te partielle Ableitung von f nach den Variablen xi1 , . . . , xik .
Insbesondere schreibt man zur Abkürzung
∂kf ∂kf
=: .
∂xi . . . ∂xi ∂xki
Wir fragen uns nun, ob man bei den höheren partiellen Ableitungen die Reihenfolge der
Ableitungen vertauschen kann. Wir betrachten zunächst zwei Beispiele:
∂f ∂f ∂2f ∂f
(x, y) = 3x2 y 2 , (x, y) = 2x3 y sowie (x, y) = 6x2 y = (x, y).
∂x ∂y ∂y∂x ∂x∂y
In diesem Fall kann man die Reihenfolge der partiellen Ableitungen nach x und y vertau-
schen.
∂f x4 + 4x2 y 2 − y 4 ∂f x4 − 4x2 y 2 − y 4
(x, y) = y , (x, y) = x .
∂x (x2 + y 2 )2 ∂y (x2 + y 2 )2
Der folgende Satz gibt eine hinreichende Bedingung dafür an, dass man die Reihenfolge
der partiellen Ableitungen vertauschen kann.
Satz 6.11 (Lemma von Schwarz) Sei f ∈ C k (U, Rm ) eine k-fach stetig differenzierba-
re Funktion. Dann sind alle partiellen Ableitungen der Ordnung ≤ k unabhängig von der
Reihenfolge des Differenzierens. Insbesondere gilt für f ∈ C 2 (U, Rm )
∂2f ∂2f
= .
∂xi ∂xj ∂xj ∂xi
200 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
Beweis. Es genügt wieder, die Behauptung für reellwertige Funktionen zu zeigen. Außer-
dem genügt es, für jede C 2 –Funktion f : U ⊂ R2 −→ R
∂2f ∂2f
=
∂x1 ∂x2 ∂x2 ∂x1
zu zeigen. Die Behauptung die für partiellen Ableitungen höherer Ordnung beweist man
dann durch Induktion. Sei u = (u1 , u2 ) ∈ U und seien h = (h1 , h2 ) so gewählt, dass
h1 , h2 6= 0 und
[u1 − |h1 |, u1 + |h1 |] × [u2 − |h2 |, u2 + |h2 |] ⊂ U.
Wir betrachten die Funktion ϕ(x) := f (x, u2 + h2 ) − f (x, u2 ). Dann ist ϕ auf dem Intervall
[u1 − |h1 |, u1 + |h1 |] differenzierbar. Nach dem Mittelwertsatz existiert ein ξ1 zwischen u1
und u1 + h1 , so dass gilt
Sei nun
Dann gilt
∂2f ∂2f
(ξ˜1 , ξ˜2 ) = (ξ1 , ξ2 ) .
∂x1 ∂x2 ∂x2 ∂x1
Bei h = (h1 , h2 ) → (0, 0) konvergieren sowohl (ξ1 , ξ2 ) als auch (ξ˜1 , ξ˜2 ) gegen u = (u1 , u2 ).
2f ∂2f
Da die partiellen Ableitungen ∂x∂1 ∂x 2
und ∂x 2 ∂x1
in (u1 , u2 ) nach Voraussetzung stetig sind,
folgt mit h = (h1 , h2 ) → (0, 0)
∂2f ∂2f
(u) = (u).
∂x1 ∂x2 ∂x2 ∂x1
⊓
⊔
6.3 Die Taylorformel für Funktionen mehrerer reeller Variablen 201
Bemerkung: In der Literatur wird oft die folgende Bezeichnung für die partiellen Ablei-
tungen benutzt:
∂f ∂ ∂f ∂2f
fx := , fxy := = .
∂x ∂y ∂x ∂y∂x
Wie Funktionen einer reeller Variablen, kann man auch Funktionen mehrerer reeller Va-
riablen durch ihre Taylorpolynome approximieren. Um dies zu beschreiben führen wir
zunächst einige Bezeichungen ein.
Definition 6.11. Ein Multiindex ist ein n–Tupel von natürlichen Zahlen α = (α1 , . . . , αn ),
αj ∈ N0 . Die Zahl |α| := α1 +. . .+αn heißt die Ordnung des Multiindex und wir definieren
α! := (α1 !) · . . . · (αn !). Für y = (y1 , . . . , yn ) ∈ Rn sei
y α := y1α1 · . . . · ynαn .
∂ |α| f ∂ |α| f
:= .
∂xα (∂x1 )α1 · · · (∂xn )αn
Beweis. Wir betrachten die Funktion g : [0, 1] −→ R mit g(t) := f (x0 + t(x − x0 )). Dann
ist g ∈ C k+1 ([0, 1], R). Wir wenden auf g die Taylorformel für Funktionen einer reellen
Variablen an und erhalten: Es existiert ein θ ∈ (0, 1), so dass
k
X 1 (j) 1
g(1) = g (0) + g (k+1) (θ) .
j! (k + 1)!
j=0 | {z }
Lagrange-Restglied
2! ∂2f ∂2f
Der Faktor α! in (∗∗) ist notwendig, da in (∗) ∂xi ∂xj = ∂xj ∂xi zweimal auftritt, während
∂2f
in (∗∗) nur einmal vorhanden ist.
∂x2i
Analog erhält man durch mehrfaches Anwenden der Kettenregel und etwas Kombinatorik
X j! ∂ |α| f
g (j) (0) = (x0 ) · (x − x0 )α .
α! ∂xα
|α|=j
Damit folgt,
X 1 ∂ |α| f X 1 ∂ k+1 f
α
f (x) = (x 0 ) · (x − x 0 ) + (ξ) · (x − x0 )α
α! ∂xα α! ∂xα
|α|≤k |α|=k+1
mit ξ := x0 + θ(x − x0 ). ⊓
⊔
In diesem Abschnitt wollen wir mit Hilfe der Differentialrechnung Kriterien für das Vorlie-
gen lokaler Extremwerte für reellwertige Funktionen, die von mehreren reellen Variablen
abhängen, herleiten. Dazu erinnern wir zunächst an einige Kenntnisse aus der Vorlesung
Lineare Algebra.
Algebraische Fakten:
1. Jede symmetrische reelle (n × n)-Matrix ist diagonalisierbar, d.h. sie hat n reelle Ei-
genwerte.
2. Für eine symmetrische reelle (n × n)-Matrix A gilt:
A>0 ⇐⇒ alle Eigenwerte von A sind positiv.
A<0 ⇐⇒ alle Eigenwerte von A sind negativ.
A≥0 ⇐⇒ alle Eigenwerte von A sind ≥ 0.
A≤0 ⇐⇒ alle Eigenwerte von A sind ≤ 0.
3. Für eine symmetrische reelle (n × n)- Matrix (Aij ) bezeichne
A11 . . . A1k
.
A(k) := .. · · · ...
Ak1 . . . Akk
1. f nimmt in x0 ∈ U ein lokales Minimum an, falls ein ε > 0 existiert, so dass
f (x) ≥ f (x0 ) für alle x ∈ U mit kx − x0 k < ε.
2. f nimmt in x0 ∈ U ein striktes (oder isoliertes) lokales Minimum an, falls ein ε > 0
existiert, so dass f (x) > f (x0 ) für alle x ∈ U mit 0 < kx − x0 k < ε.
3. f nimmt in x0 ∈ U ein lokales Maximum an, falls ein ε > 0 existiert, so dass
f (x) ≤ f (x0 ) für alle x ∈ U mit kx − x0 k < ε.
4. f nimmt in x0 ∈ U ein striktes (oder isoliertes) lokales Maximum an, falls ein ε > 0
existiert, so dass f (x) < f (x0 ) für alle x ∈ U mit 0 < kx − x0 k < ε.
1. Hat f in x0 ∈ U ein lokales Maximum (lokales Minimum), so ist x0 ein kritischer Punkt
von f und die Hesse-Matrix Hessf (x0 ) ist negativ semidefinit (positiv semidefinit).
2. Ist x0 ∈ U ein kritischer Punkt von f und die Hesse-Matrix Hessf (x0 ) negativ definit
(positiv definit), so nimmt f in x0 ein isoliertes lokales Maximum (isoliertes lokales
Minimum) an.
Beweis. Wir zeigen die Behauptungen nur für den Fall eines lokalen Maximums. Die Aus-
sagen für das lokale Minimum folgt dann durch Übergang von f zu −f .
(1) f habe in x0 ∈ U ein lokales Maximum. Sei a = (a1 , . . . an ) ∈ Rn . Da x0 ein in-
nerer Punkt von U ist, existiert ein ε > 0, so dass die Funktion g : (−ε, ε) −→ R mit
g(t) := f (x0 + ta) definiert ist. g ist 2-mal differenzierbar und hat in t = 0 ein lokales
Maximum. Folglich gilt g ′ (0) = 0 und g ′′ (0) ≤ 0. Aus der Kettenregel für Differentiale
folgt:
0 = g ′ (0) = Df (x0 )(a).
Dies gilt für alle a ∈ Rn . Folglich ist Df (x0 ) = 0, also x0 ∈ U ein kritischer Punkt von f .
Aus der Kettenregel für partielle Ableitungen folgt:
n
X ∂f
g ′ (t) = (γ(t)) · ai ,
∂xi
i=1
X n
∂2f
g ′′ (t) = (γ(t)) · ai aj .
∂xi xj
i,j=1
Folglich ist
n
X
′′ ∂2f
0 ≥ g (0) = (x0 ) · ai aj = a Hessf (x0 ) at .
∂xi xj
i,j=1
es eine Kugel K(x0 , r) ⊂ U um x0 gibt, so dass Hessf (ξ) < 0 für alle ξ ∈ K(x0 , r). Dazu
betrachten wir die Abbildung F : Rn × U −→ R
n
X ∂2f
F (a, x) := a Hessf (x) at = (x) · ai aj .
∂xi xj
i,j=1
Da f zweifach stetig-differenzierbar ist, ist F stetig. Da F (a, x0 ) < 0 für alle a ∈ Rn , existie-
ren wegen der Stetigkeit von F für jedes a ∈ Rn Kugeln K(a, εa ) ⊂ Rn und K(x0 , µa ) ⊂ U ,
so dass F |K(a,εa )×K(x0 ,µa ) < 0. Wir betrachten nun die folgende offene Überdeckung U der
Sphäre S n−1 := {a ∈ Rn | kak = 1}:
[
U := K(a, εa ).
a∈S n−1
Da die Sphäre S n−1 kompakt ist, kann man aus U eine endliche Teilüberdeckung auswählen.
Es gibt also p1 , . . . , pN ∈ S n−1 so dass
Wir betrachten nun die Kugel K(x0 , r) um x0 ∈ U mit r := min(µp1 , . . . µpN ). Für diese
Kugel gilt dann F |S n−1 ×K(x0 ,r) < 0 und somit auch
Folglich ist die Hesse-Matrix Hessf (ξ) negativ definit für alle ξ ∈ K(x0 , r).
Wir approximieren die Funktion f nun bei x0 durch das Taylorpolynom 1. Grades und
erhalten für alle x ∈ K(x0 , r) ein ξ ∈ x0 x ⊂ K(x0 , r), so dass
1
f (x) = f (x0 ) + hgradf (x0 ), x − x0 i + (x − x0 ) Hessf (ξ) (x − x0 )t .
2
Da x0 ein kritischer Punkt von f ist, gilt gradf (x0 ) = 0. Außerdem wissen wir aus dem
oben Bewiesenen, dass die Hesse-Matrix Hessf (ξ) negativ definit ist. Daraus folgt
für alle x ∈ K(x0 , r) mit x 6= x0 . Dies zeigt, dass f in x0 ein isoliertes lokales Maximum
hat. ⊓
⊔
Wir wollen untersuchen, in welchen Punkten f lokale Extremwerte annimmt. Dazu gehen
wir folgendermaßen vor:
1. Bestimmen die kritischen Punkte von f : Sei p = (x, y, z). Es gilt
Folglich ist p = (x, y, z) genau dann ein kritischer Punkt von f , wenn das Gleichungssystem
2 −2 0 x 6
−2 4 2 y = 0
0 2 6 z −2
erfüllt ist. Dieses hat genau eine Lösung, nämlich p0 = (8, 5, −2).
2. Bestimme die Hesse-Matrix in den kritischen Punkten, also hier im Punkt p0 :
∂2f ∂2f ∂2f
∂x∂x ∂x∂y ∂x∂z
2 −2 0
∂2f ∂2f ∂2f
Hessf (p0 ) = ∂y∂x ∂y∂y ∂y∂z
(p0 ) = −2 4 2 =: H.
∂2f ∂2f ∂2f 0 2 6
∂z∂x ∂z∂y ∂z∂z
3. Untersuche Hessf (p0 ) auf Definitheit. Dazu kann man die Eigenwerte von H bestimmen
oder die Determinanten der Hauptminoren von H ausrechnen. Wir betrachten letzeres:
!
2 −2
det H(1) = H11 = 2, det H(2) = det = 4, det H(3) = det H = 16.
−2 4
Alle diese Determinanten sind positiv, folglich ist Hessf (p0 ) positiv definit. f hat in p0
somit ein striktes lokales Minimum. Weitere lokale Extrema existieren nicht.
Beispiel 2: Zylinderkoordinaten im R3
Beispiel 3: Kugelkoordinaten im R3
z
Wir betrachten die Abbildung 6
f : (0, ∞) × (− π2 , π2 ) × (0, 2π) −→ R3 \ [0, ∞) × {0} × R
f (r, u, v) := r cos(u) cos(v), r cos(u) sin(v), r sin(u) . P
r•
-
(r, u, v) heißen Kugelkoordinaten des Punktes vu•
y
P = f (r, u, v).
+
x
Die Bijektivität der Abbildungen in den letzten drei Beispielen folgt aus ihrer geometri-
schen Konstruktion. Die Abbildungen sind offensichtlich C ∞ . Um zu überprüfen, ob die
inverse Abbildung ebenfalls C ∞ ist, müßte man sie ausrechnen. Wir werden im folgen-
den eine Möglichkeit angeben, mit denen man sich die explizite Berechnung der inversen
Abblildung ersparen kann. Zunächst hat man folgende notwendige Bedingung dafür, dass
f : U −→ V ein Diffeomorphismus ist.
Satz 6.14 Sei f : U −→ V ein Diffeomorphismus zwischen offenen Mengen des Rn . Dann
ist das Differential Df (x) : Rn −→ Rn für alle x ∈ U ein Isomorphismus, und es gilt
Bemerkung: Für Funktionen einer Variablen gilt auch die Umkehrung von Satz 6.14:
Sei f : U ⊂ R −→ R eine C 1 -Abbildung von einer offenen Teilmenge U ⊂ R mit f ′ (x) 6= 0
für alle x ∈ U . Dann gilt:
1. V = f (U ) ⊂ R ist offen und
2. f : U −→ V ist ein Diffeomorphismus.
In höheren Dimensionen gilt diese Aussage nicht mehr! Als Beispiel betrachten wir die
Abbildung f : R2 −→ R2 definiert durch
Diese Abbildung ist stetig differenzierbar (sogar unendlich oft) und für die Determinante
der Jacobi-Matrix von f gilt:
!
ex cos y −ex sin y
det(Df (x, y)) = det = e2x > 0.
x x
e sin y e cos y
Folglich ist das Differential Df (x, y) : R2 −→ R2 ein Isomorphismus für alle (x, y) ∈ R2 .
Aber f ist offensichtlich nicht injektiv, f also kein Diffeomorphismus, da f −1 nicht global
existiert.
Wir wollen nun untersuchen, unter welchen Bedingungen eine C 1 –Funktion f wenigstens
lokal eine C 1 -Umkehrfunktion besitzt.
Wenden wir den Mittelwertsatz von Lagrange auf die Funktion fi in der j–ten Variablen
an, so erhalten wir ein ξij zwischen aj und bj mit
n
X ∂fi
fi (b) − fi (a) = (bj − aj ) (b1 , . . . , bj−1 , ξij , aj+1 , . . . , an ) .
∂xj | {z }
j=1
∈Q
Daraus folgt
n
X
|fi (b) − fi (a)| ≤ |bj − aj | · M ≤ n · M · kb − ak
j=1
und damit
1
P
n 2 p
kf (b) − f (a)k = |fi (b) − fi (a)|2 ≤ n · n2 · M 2 · kb − ak2 ≤ n2 M kb − ak. ⊓
⊔
i=1
Beweis. 1. Schritt: Wir zeigen die Behauptung zunächst unter der Zusatzbedingung, dass
Df (x0 ) = IdRn . Dann ist die Jacobi-Matrix von f im Punkt x0 die Einheitsmatrix, d.h.
∂fi
es gilt ∂x j
(x0 ) = δij . Wir wählen nun einen Quader K ⊂ U , der x0 als inneren Punkt
enthält, so dass gilt
f (x)
f d
x
f (x0 ) Ve
x0
K f (K)
U
f (∂K)
(3) Wir wollen nun die Umgebung U e von x0 definieren. Dazu beweisen wir zunächst, dass
für jedes y ∈ Ve genau ein x ∈ Int(K) existiert mit f (x) = y. Die Eindeutigkeit wurde
bereits in (1) gezeigt. Wir müssen also nur die Existenz nachweisen. Sei y ∈ Ve gegeben.
Wir betrachten die Abbildung
gy : K −→ R
x 7−→ gy (x) := ky − f (x)k2 = hy − f (x), y − f (x)i .
Da K kompakt und gy stetig ist, nimmt gy auf K ein absolutes Minimum an. Die
Abschätzung (B) zeigt, dass dieses absolute Minimum nicht auf dem Rand von K an-
genommen wird, sondern im Inneren von K. Das heißt, es existiert ein u0 ∈ Int(K), in
dem gy sein absolutes Minimum annimmt. Wir zeigen nun, dass f (u0 ) = y gilt. Da u0
ein kritischer Punkt von gy ist, erhalten wir mit der Produktregel für Ableitungen von
Skalarprodukten
∂gy D ∂f E
0= (u0 ) = −2 (u0 ), y − f (u0 ) .
∂xj ∂xj
Damit stehen alle Spaltenvektoren der Jacobi-Matrix von gy im Punkt u0 senkrecht auf
dem Vektor y − f (u0 ). Da nach Wahl des Quaders K die Jacobi-Matrix in allen Punkten
6.5 Der Satz über den lokalen Diffeomorphismus 211
von K regulär ist, bilden ihre Spaltenvektoren eine Basis des Rn . Folglich ist y − f (u0 ) der
Nullvektor, also f (u0 ) = y.
Wir setzen nun U e := Int(K) ∩ f −1 (Ṽ ). Dann ist Ũ eine offene Umgebung von x0 in U
e −→ Ve ist bijektiv.
und f |Ue : U
(5) Wir zeigen als nächstes, dass (f |Ue )−1 : Ṽ −→ Ũ differenzierbar ist. Sei dazu y =
f (x) ∈ Ve mit x ∈ U
e und Lx := Df (x). Wir zeigen, dass (f | e )−1 in y differenzierbar ist.
U
e
Da f in x differenzierbar ist, gilt für x + h ∈ U
Daraus folgt
L−1 −1
x (f (x + h) − f (x)) = h + Lx (o(khk)).
Setzen wir y1 := f (x + h), so ist (f |Ue )−1 (y1 ) − (f |Ue )−1 (y) = x + h − x = h und es folgt
Da L−1
x linear ist, müssen wir für die Diffenzierbarkeit von (f |U
e)
−1 in y nur noch das
Verhalten des Restgliedes untersuchen und −L−1x (o(khk)) = o(ky1 − yk) für y1 → y zeigen.
Da Lx linear ist, existiert eine Konstante C ∈ R+ , so dass kL−1
−1
x (v)k ≤ Ckvk für alle
n
v ∈ R . Daraus erhalten wir
k − L−1
x (o(khk))k ko(khk)k ko(khk)k khk
0≤ ≤C· =C· ·
ky1 − yk ky1 − yk khk kf (x + h) − f (x)k
Die Formel (A) zeigt uns, dass khk ≤ 2kf (x + h) − f (x)k, folglich gilt
k − L−1
x (o(khk))k ko(khk)k
0≤ ≤ 2C · . (C)
ky1 − yk khk
Da (f |Ue )−1 stetig ist, folgt aus y1 → y, dass h → 0 und die Abschätzung (C) liefert
k − L−1
x (o(khk))k
lim = 0.
y1 →y ky1 − yk
Somit ist (f |Ue )−1 in y differenzierbar und es gilt Df −1 (f (x)) = (Df (x))−1 .
(6) Als letztes zeigen wir, dass aus f ∈ C k auch (f |Ue )−1 ∈ C k folgt. Bezeichne zur
Abkürzung g := (f |Ue )−1 . Da die Jacobi-Matrix von g in y ∈ Ve die inverse Matrix der
Jacobi-Matrix von f in x = g(y) ist, zeigt uns die Vorschrift zur Berechnung inverser
Matrizen, dass die partiellen Ableitungen von g in y rationale Funktionen der partiellen
Ableitungen von f in x sind, d.h. es existieren rationale Funktionen Rkl in n2 Variablen,
so dass
212 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
∂gk ∂f
i
(y) = Rkl (g(y)), i, j = 1, . . . , n . (D)
∂yl ∂xj
Ist f eine C 1 -Funktion, so sind die partiellen Ableitungen von f stetig, g ist ebenfalls
stetig, somit sind die partiellen Ableitungen von g ebenfalls stetig. Successives Ableiten
der Formel (D) zeigt, dass g k-fach stetig differenzierbar ist, wenn f k-fach stetig differen-
zierbar ist.
Damit ist die Behauptung des Satzes für den Fall bewiesen, dass Df (x0 ) = IdRn gilt.
2. Schritt: Wir zeigen nun die Behauptung des Satzes im allgemeinen Fall. Sei f eine
beliebige Abbildung mit den Voraussetzungen des Satzes. Wir setzen L := Df (x0 )−1 und
betrachten die Abbildung fe := L ◦ f : U ⊂ Rn −→ Rn . Dann ist fe eine C k -Abbildung und
es gilt nach Kettenregel
Wir können also auf fe unsere Erkenntnisse aus dem 1. Schritt anwenden und erhalten
Umgebungen U e von x0 und Ve von fe(x0 ), so dass fe| e : U e −→ Ve ein C k -Diffeomorphismus
U
ist. Dann ist f |Ue := L−1 ◦ fe|Ue : U
e −→ Ve ′ := L−1 (Ve ) ebenfalls ein C k -Diffeomorphismus.
⊓
⊔
1. V := f (U ) ⊂ Rn ist offen.
2. Ist f zusätzlich injektiv, so ist f : U −→ V ein C k -Diffeomorphismus.
Beweis. (1) Nach Satz 6.15 existiert für alle x ∈ U eine Umgebung Ux von x und Vx von
S
f (x), so dass f |Ux : Ux −→ Vx ein C k -Diffeomorphismus ist. Dann gilt U = Ux und
x∈U
[ [
f (U ) = f |Ux (Ux ) = Vx =: V.
x∈U x∈U
f1 (x1 , . . . , xN ) = 0,
f2 (x1 , . . . , xN ) = 0,
..
.
fm (x1 , . . . , xN ) = 0.
Um diese Fragen zu beantworten, versucht man, die Gleichungen nach einer oder mehreren
Variablen aufzulösen.
In der Vorlesung über Lineare Algebra haben Sie sich mit dieser Frage für den Spezialfall
linearer Gleichungssysteme beschäftigt. In diesem Fall ist f durch eine (m × N )-Matrix
A = (Aki ) und einen Vektor b = (b1 , . . . , bm )t definiert:
In diesem Spezialfall gilt das folgende: Ist A eine Matrix von maximalem Rang, d.h. vom
Rang m, und seien oBdA. die letzten m Spalten von A linear unabhängig. Dann kann
man das lineare Gleichungssystem Ax = b nach den letzten m Variablen auflösen, d.h. es
existieren eindeutig bestimmte Funktionen ϕ = (ϕ1 , . . . , ϕm ) : RN −m −→ Rm , so dass
t
Ax = b ⇐⇒ x = x1 , . . . , xN −m , ϕ1 (x1 , . . . , xN −m ), . . . , ϕm (x1 , . . . , xN −m ) .
Mit den Methoden der Differentialrechnung können wir nun auch Aussagen über die
Auflösbarkeit von nicht-linearen Gleichungssystemen machen. Wir möchten auch in diesem
Fall Funktionen ϕ : W ⊂ RN −m −→ Rm finden, so dass
Mit anderen Worten, wir wollen die Lösungsmenge von f (x) = 0 explizit als Graph einer
Funktion ϕ beschreiben. Zunächst sehen wir uns drei Beispiele an, die Unterschiede zum
linearen Fall zeigen.
214 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
f (x, y) = x − y 3 .
√
Man kann die Gleichung x − y 3 = 0 nach y auflösen und erhält y = 3 x =: ϕ(x). Die
Lösungsmenge der Gleichung x − y 3 = 0 ist der Graph der Funktion ϕ. Diese Funktion ist
im Punkt x = 0 nicht differenzierbar.
f (x, y) = x2 .
Die Lösungsmenge der Gleichung f (x, y) = x2 = 0 ist die y-Achse. Man kann diese
Gleichung nicht nach y auflösen, es gibt aber eine Auflösung nach x: Der Graph von
x = ψ(y) := 0 beschreibt die y-Achse.
Im nächsten Satz geben wir Bedingungen dafür an, wann man die Lösungsmenge einer
Gleichung f (x) = 0 wenigstens lokal nach einer bestimmten Zahl von Variablen auflösen
kann, d.h. wann man sie lokal als Graph einer Funktion ϕ beschreiben kann. Dabei kann
man in der Regel zwar ϕ nicht konkret angeben, man hat aber Formeln für ihre Ableitun-
gen.
Dann existieren offene Umgebungen U0 ⊂ U von (a, b) und A(a) ⊂ Rn von a, sowie eine
eindeutig bestimmte Funktion ϕ : A(a) ⊂ Rn −→ Rm mit
1. ϕ(a) = b, y
(a, b) = (a, ϕ(a))
1
2. f (x, ϕ(x)) = 0 für alle x ∈ A(a). S
3. f −1 (0) ∩ U0 = graph(ϕ), ϕ
x
d.h., in einer Umgebung des Punktes (a, b) ist die
a
Lösungsmenge der Gleichung f (x, y) = 0 durch
den Graphen der Funktion ϕ beschrieben.
Darüber hinaus gilt:
4. ϕ : A(a) ⊂ Rn −→ Rm ist differenzierbar.
5. Falls f ∈ C k , so ist auch ϕ ∈ C k .
6. Für die partiellen Ableitungen der Funktion ϕ gilt:
−1
∂ϕl ∂fk ∂fk
(x) = − (x, ϕ(x)) ◦ (x, ϕ(x)) ∀ x ∈ A(a).
∂xi ∂yl ∂xi
| {z } | {z } | {z }
∈Rm×n ∈Rm×m ∈Rm×n
Beweis. 1) Konstruktion von ϕ (d.h. Auflösung von f (x, y) = 0 nach y = (y1 , . . . , ym )):
Wir wenden dazu den Satz über den lokalen Diffeomorphismus an. Wir betrachten die
Abbildung F : U ⊂ Rn × Rm −→ Rn × Rm , definiert durch
ein C -Diffeomorphismus. Wir betrachten die inverse Abbildung (F |U0 )−1 : V0 −→ U0 mit
1
den Komponenten
(F |U0 )−1 =: (F1− , F2− ).
↑ ↑
Rn Rm
216 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
e
U
y U0
y
S1 (a, b) = (a, ϕ(a))
Ve
V0
F
x x
a (a, 0)
F −1
Folglich gilt
F1− (x, y) = x,
f (x, F2− (x, y)) = y ∀ (x, y) ∈ V0 .
Die Eindeutigkeit der Funktion ϕ mit den Eigenschaften 1) - 3) folgt aus der Konstruktion.
2) Differenzierbarkeit von ϕ:
Wenn f eine C k -Funktion ist, dann ist nach Definition auch F eine C k -Funktion. Nach
dem Satz über den lokalen Diffeomorphismus ist die inverse Funktion (F |U0 )−1 ebenfalls
C k , das gleiche gilt dann auch für ihre Komponente F2− . Da ϕ(x) = F2− (x, 0), ist auch
ϕ eine C k -Funktion. Nach Voraussetzung ist f mindestens C 1 . Somit ist ϕ auf jeden Fall
eine C 1 -Funktion, also insbesondere differenzierbar (siehe Satz 6.9).
3) Die Formel für die partiellen Ableitungen von ϕ:
Wir wenden die Kettenregel für partielle Ableitungen auf die Funktion
g : A(a) ⊂ Rn −→ Rm ,
∂g
0= (x)
∂xi
Xn m
∂f ∂xj X ∂f ∂ϕl
= (x, ϕ(x)) · + (x, ϕ(x)) · (x)
∂xj ∂xi ∂yl ∂xi
j=1 |{z} l=1
=δij
m
X
∂f ∂f ∂ϕl
= (x, ϕ(x)) + (x, ϕ(x)) · (x).
∂xi ∂yl ∂xi
l=1
In diesem Abschnitt wollen wir den Satz über implizite Funktionen benutzen, um eine
Formel für die Tangentialebenen an gleichungsdefinierte Teilmengen des RN herzuleiten.
1. Ein Punkt p ∈ U heißt regulärer Punkt von φ, wenn das Differential von φ im Punkt
p, d.h. Dφ(p) : RN −→ Rm , surjektiv ist.
2. Ein Punkt c ∈ φ(U ) ⊂ Rm heißt regulärer Wert von φ, wenn das Urbild φ−1 (c) ⊂ U
nur aus regulären Punkten von φ besteht.
3. Ist c ∈ φ(U ) ⊂ Rm ein regulärer Wert von φ, so nennt man die Niveaumenge
M := {x ∈ U | φ(x) = c} ⊂ RN
Bemerkung:
• Ist m = 1, also φ reellwertig, so ist Dφ(p) genau dann surjektiv, wenn gradφ(p) 6= 0.
Unsere Definition stimmt also mit der in Abschnitt 6.1. für reellwertige Funktionen
gegebenen überein.
218 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
• Das
Differential
Dφ(p) : RN −→ Rm ist genau dann surjektiv, wenn die Jacobi-Matrix
∂φk
∂xi (p) maximalen Rang hat, also m linear unabhängige Spalten besitzt. Wir können
in diesem Fall den Satz über implizite Funktionen auf den Punkt p ∈ M anwenden.
Somit besitzt jeder Punkt p einer (N − m)-dimensionalen Untermannigfaltigkeit M
eine Umgebung U (p) ⊂ M , die der Graph einer C k -Funktion ϕp : Ap ⊂ RN −m → Rm
ist. Man kann U (p) also durch (N − m) reelle Parameter aus Ap eindeutig beschreiben.
(Dies ist der Grund dafür, der Menge M die Dimension (N − m) zuzuordnen).
Wir erinnern nochmal an die Definition des Tangentialraums und der Tangentialebene an
eine Untermannigfaltigkeit aus Kaptitel 6.1:
T anp M = p + Tp M.
Der folgende Satz rechtfertigt diese Bezeichnungen. Er zeigt, dass Tp M tatsächlich ein
(N − m)-dimensionaler Unterraum des Vektorraumes RN ist, und T anp M somit die durch
p und Tp M aufgespannte Ebene.
Tp M = Ker Dφ(p)
= {v ∈ RN | Dφ(p)(v) = 0}
= {v ∈ RN | hgradφ1 (p), vi = . . . = hgradφm (p), vi = 0}.
Tp M = (gradφ(p))⊥ .
mit (u1 , . . . , uN ). Wollen wir die ersten (N −m) von den letzten m-Variablen unterscheiden,
so benutzen wir wie im Satz über implizite Funktionen die Bezeichungen
(u1 , . . . , uN −m , uN −m+1 . . . , uN ).
| {z } | {z }
=:(x1 ,...,xN −m ) =:(y1 ,...,ym )
Sei p = (p′ , p′′ ) ∈ RN −m × Rm . Nach dem Satz über implizite Funktionen gibt es offe-
ne Umgebungen U (p) ⊂ M von p und A(p′ ) ⊂ RN −m von p′ , sowie eine C k -Funktion
ϕ : A(p′ ) −→ Rm so dass graph(ϕ) = U (p) . Wir betrachten nun einen Vektor
v = (v1 , . . . , vN −m , vN −m+1 , . . . , vN ) ∈ RN −m × Rm .
| {z } | {z }
=:v ′ =:v ′′
Dann gilt:
∂φk
Dφ(p)(v) = 0 ⇐⇒ (p) v t = 0
∂uj
N
X ∂φk
⇐⇒ (p) vj = 0 ∀ k = 1, . . . , m
∂uj
j=1
−m
NX Xm
∂φk ∂φk
⇐⇒ (p) vi = − (p) vN −m+l ∀ k = 1, . . . , m
∂xi ∂yl
i=1 l=1
∂φk ′ t ∂φk
⇐⇒ (p) (v ) = − (p) (v ′′ )t
∂xi ∂yl
−1
∂φk ∂φk
⇐⇒ − (p) ◦ (p) (v ′ )t = (v ′′ )t
∂yl ∂xi
Satz6.17 ∂ϕk ′
⇐⇒ (p ) (v ′ )t = (v ′′ )t
∂xi
⇐⇒ Dϕ(p′ )(v ′ ) = v ′′ .
Für einen Vektor v = (v ′ , v ′′ ) ∈ Ker Dφ(p) betrachten wir nun das Geradenstück im
Definitionsbereich von ϕ, das in Richung v ′ durch p′ geht. Dieses ist durch σ(t) := p′ + tv ′
für t ∈ (−ε, ε), ε hinreichend klein, parametrisiert. Dann ist die Kurve γ : (−ε, ε) → RN ,
γ(t) := σ(t), ϕ(σ(t)) ,
Folglich gilt v ∈ Tp M . ⊓
⊔
220 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
Tp M = {v ∈ R3 | hgradφ(p), vi = 0} = {(v1 , v2 , v3 ) ∈ R3 | p1 v1 + p2 v2 = p3 v3 }.
Der Beweis von Satz 6.18 zeigt, dass man den Tangentialraum einer gleichungsdefinier-
ten Untermannigfaltigkeit auch mit Hilfe der sie lokal explizit als Graph beschreibenden
Funktion ϕ ausdrücken kann. Wir formulieren dies abschließend nochmal als Satz:
den Graphen der Funktion ϕ. Dann ist M eine n-dimensionale (gleichungsdefinierte) Un-
termannigfaltigkeit des Rn+m und für den Tangentialraum gilt
T(x,ϕ(x)) M = { v1 , . . . , vn , Dϕ(x)(v) | v ∈ Rn }
| {z }
=:v
∂ϕ ∂ϕ ∂ϕ
= span 1, 0, . . . , 0, (x) , 0, 1, . . . , 0, (x) , . . . , 0, . . . , 0, 1, (x) .
∂x1 ∂x2 ∂xn
Beweis. Wir betrachten die Abbildung φ : A × Rm −→ Rm , gegeben durch
φ(x, y) := ϕ(x) − y.
M := {(x, y, z) ∈ R3 | z = x2 + y 2 + 1}.
ϕ(x, y) := x2 + y 2 + 1.
In Abschnitt 6.4 hatten wir Bedingungen für das Vorliegen lokaler Extrema einer C 2 -
Funktion f : U ⊂ Rn −→ R hergeleitet. Oft benötigt man das Extremwertverhalten einer
Funktion, wenn die Variablen einer zusätzlichen Nebenbedingung unterworfen sind. Sei
zum Beispiel f : R3 → R eine Temperaturverteilung. Wir wollen dann z.B. wissen, was
die maximale Temperatur auf der Oberfläche eines Gegenstandes im R3 ist, und wo dieses
Maximum angenommen wird. Auch solche Fragen kann man in speziellen Fällen mit den
Methoden der Differentialrechnung behandeln.
Wir betrachten hier den Fall, dass die Nebenbedingungen in der Form eines Gleichungs-
systems
g1 (x1 , . . . , xn ) = 0,
g2 (x1 , . . . , xn ) = 0,
..
.
gm (x1 , . . . , xn ) = 0.
Wir erinnern nochmal an folgendes Kriterium für lokale Extrema ohne Nebenbedingun-
gen2 : Hat eine C 1 -Funktion f : U ⊂ Rn → R ein lokales Extremum in p ∈ U , so ist
gradf (p) = 0. Der folgende Satz verallgemeinert dieses Kriterium auf den Fall von Extre-
ma mit Nebenbedingungen und ist insbesondere anwendbar, wenn die Nullstellenmenge
Ng = g −1 (0) eine (n − m)-dimensionale Untermannigfaltigkeit des Rn ist.
Hat f in p ein lokales Extremum unter der Nebenbedingung g(x) = 0, dann existieren
eindeutig bestimmte Konstanten λ1 , . . . , λm ∈ R, so dass
Beweis von Satz 6.20. Da rang(Dg(p)) = m, können wir OBdA voraussetzen, dass die
ersten m Zeilen der Jacobi-Matrix von g im Punkt p linear unabhängig sind:
∂g1 ∂g1
(p) . . . (p)
∂x1. ∂xm
..
det
.. . 6= 0,
∂gm ∂gm
∂x1 (p) . . . ∂xm (p)
(Anderenfalls ordnen wir die (x1 , . . . , xn ) entsprechend um). Dann hat das lineare Glei-
chungssystem
m
X ∂gv ∂f
λv · (p) = (p), i = 1, . . . , m, (2)
∂xi ∂xi
v=1
genau eine Lösung (λ1 , . . . , λm ) ∈ Rm . Dies ist ein Teil der gesuchten Gleichung (1), er
enthält die ersten m der insgesamt n Komponenten von gradf . Es bleibt zu zeigen, dass
(1) auch für die Komponenten i = m + 1, . . . , n erfüllt ist.
Wir bezeichnen p =: (p̂, p′ ) mit p̂ = (p1 , . . . , pm ) und p′ = (pm+1 , . . . , pn ) und analog
x =: (x̂, x′ ) mit x̂ = (x1 , . . . , xm ) und x′ = (xm+1 , . . . , xn ). Nach dem Satz über implizite
Funktionen kann man
g x1 , . . . , xm , xm+1 , . . . , xn = 0
| {z } | {z }
x̂ x′
Wir leiten diese Gleichung nach den Variablen xµ für µ = m + 1, . . . , n ab und erhalten
mit der Kettenregel für partielle Ableitungen:
m
X ∂gv ∂ϕi ′ ∂gv
0 = (p) · (p ) + (p) ∀ ν = 1, . . . , m,
∂xi ∂xµ ∂xµ
i=1
bzw.
X ∂gv m
∂gv ∂ϕi ′
(p) = − (p) · (p ) ∀ ν = 1, . . . , m. (3)
∂xµ ∂xi ∂xµ
i=1
Nach Voraussetzung hat f in p = (ϕ(p′ ), p′ ) einen lokalen Extremwert unter der Nebenbe-
dingung g(x) = 0, daher hat ψ in p′ ein lokales Extremum. Folglich ist gradψ(p′ ) = 0 und
mit der Kettenregel folgt
X ∂f m
∂ψ ′ ∂ϕi ′ ∂f
0= (p ) = (p) · (p ) + (p) = 0 ∀ µ = m + 1, . . . , n
∂xµ ∂xi ∂xµ ∂xµ
i=1
bzw.
X ∂f m
∂f ∂ϕi ′
(p) = − (p) · (p ), ∀ µ = m + 1, . . . , n. (4)
∂xµ ∂xi ∂xµ
i=1
Setzen wir (2) und (3) nacheinander in (4) ein, so ergibt sich
XX m m
∂f (2) ∂gv ∂ϕi ′
(p) = − λv · (p) · (p )
∂xµ ∂xi ∂xµ
i=1 v=1
m
X
(3) ∂gv
= λv · (p) ∀ µ = m + 1, . . . , n. (5)
∂xµ
v=1
Wir setzen nun voraus, dass die Nullstellenmenge Ng = g −1 (0) eine n − m-dimensionale
Untermannigfaltigkeit des Rn ist. Dann ist die Voraussetzung an g in Satz 6.20 in jedem
Punkt p ∈ Ng erfüllt. Zur Bestimmung der lokalen Extrema von f |Ng : Ng → R können
wir folgendermaßen vorgehen:
Wir definieren die Funktion F : U × Rm −→ R durch
224 6 Differentialrechnung für Funktionen mehrerer reeller Variablen
m
X
F (x1 , . . . , xn , c1 , . . . , cm ) := f (x) − cν gν (x)
ν=1
und betrachten ihre kritischen Punkte (p, λ). Dann gilt gradF (p, λ) = 0 , d.h. die kritischen
Punkte von F erfüllen das sogenannte Lagrangesche Gleichungssystem
∂F
(p, λ) = 0 ∀ i = 1, . . . , n,
∂xi
∂F
(p, λ) = 0, ∀ ν = 1, . . . , m.
∂cν
Offensichtlich sind die kritischen Punkte (p, λ) von F gerade diejenigen Punkte p ∈ Ng , in
denen die notwendige Bedingung (1) aus Satz 6.20 erfüllt ist. Wir können also Satz 6.20
folgendermaßen umformulieren:
Beispiel 1: Wir bestimmen Maxima und Minima der Funktion f (x, y) = x · y auf der
Sphäre S 1 = {(x, y) ∈ R2 | x2 + y 2 = 1}:
1) Wir wissen bereits aus Abschnitt 6.1, dass S 1 eine 1-dimensionale Untermannigfaltigkeit
des R2 ı̂st. Die definierende Gleichung lautet g(x, y) := x2 + y 2 − 1 = 0.
2) Wir betrachten die Funktion
∂F
(x, y, c) = y − 2cx = 0
∂x
∂F
(x, y, c) = x − 2cy = 0,
∂y
∂F
(x, y, c) = −x2 − y 2 + 1 = 0.
∂c
Aus den ersten beiden Gleichungen folgt cx2 = cy 2 . c = 0 können wir ausschließen, sonst
1 2 2 2 2
q(0, 0) 6∈ S . Somit
wäre (x, y) = q gilt x = y und daher |x| = |y|. Da außerdem x +y = 1,
folgt x = ± 12 und y = ± 12 . Damit sind die einzig möglichen Punkte p ∈ S 1 , in denen
f |S 1 einen lokalen Extremwert annehmen könnte
1 1 1 1 1 1 1 1
p∈ √ ,√ , √ , −√ , −√ , √ , −√ , −√
2 2 2 2 2 2 2 2
mit den Funktionswerten
1 für p = ± √1 , √1
2
f (p) = 2 2
− 1 für p = ± √12 , − √12 .
2
Beispiel 2: Wir bestimmen den Lotpunkt des Punktes P = (1, 0, 0) auf die Ebene
E := {(x, y, z) ∈ R3 | z = x + y}, also den Punkt P0 ∈ E, der den kleinsten Abstand zu P
hat: Der Abstand von P zu E ist definiert als
Außerhalb eines kompakten Bereiches der Ebene überschreiten die Abstände zu P einen
gegebenen Abstand. Folglich existiert ein P0 ∈ E mit dist(P, E) = d(P, P0 ). Um P0 zu
finden, betrachten wir das Quadrat der Abstandsfunktion
∂F
(x, y, z, c) = 2(x − 1) + c = 0,
∂x
∂F
(x, y, z, c) = 2y + c = 0,
∂y
∂F
(x, y, z, c) = 2z − c = 0,
∂z
∂F
(x, y, z, c) = x + y − z = 0.
∂c
Die einzige Lösung dieses Gleichungssystems ist (x, y, z, c) = 32 , − 31 , 31 , 23 . Somit haben
wir unseren gesuchten Punkt P0 ∈ E gefunden: P0 = ( 23 , − 31 , 31 ).
Bemerkung: In diesem Beispiel ist die Nebenbedingung schon in expliziter Form durch
z = x + y gegeben. Dadurch könnten wir hier auch gleich so vorgehen wie im zweiten
Teil des Beweises von Satz 6.20. Wir setzen die Nebenbedingung z = x + y in die zu
minimierende Funktion f (x, y, z) = (x − 1)2 + y 2 + z 2 ein und bestimmt den Punkt, in
dem die entstehende Funktion
In diesem Kapitel beginnen wir mit der Integralrechnung. Die Integralrechnung wird durch
zwei verschiedene Problemstellungen motiviert:
In diesem Abschnitt behandeln wir zunächst die Integralrechnung für Funktionen einer
reellen Variablen. Wie in Kapitel 5 betrachten wir im gesamten Kapitel 7 Funktionen des
Typs f : I ⊂ R −→ E, wobei I ⊂ R ein Intervall1 und (E, k · k) ein normierter Vektorraum
über dem Körper K der reellen oder komplexen Zahlen ist.
Nicht jede Funktion besitzt eine Stammfunktion. Insbesondere kann diese Eigenschaft
vom gewählten Definitionsbereich abhängen (Übungsaufgabe). In Abschnitt 7.3. werden
wir zeigen, dass jede stetige Funktion f : [a, b] −→ E mit Werten in einem Banachraum E
eine Stammfunktion besitzt.
Definition 7.2. Sei f ∈ S(I, E). Unter dem unbestimmten Integral von f versteht man
die Menge aller Stammfunktionen von f . Wir bezeichnen diese Menge mit dem Symbol
Z
f (x) dx := {F : I ⊂ R −→ E | F Stammfunktion von f }
In der folgenden Liste stellen wir einige wichtige Grundintegrale zusammen. Der Beweis
erfolgt durch Ableiten der Stammfunktion.
Wichtige Grundintegrale:
Z
1
(1) xα dx = xα+1 + c. Dies gilt für α ∈ N auf R, für α ∈ −N\{−1} auf
α+1
(−∞, 0) und (0, ∞) sowie für α ∈ R\{Z} auf (0, ∞).
Z
1
(2) dx = ln |x| + c auf (0, ∞) und (−∞, 0).
x
Z
(3) ex dx = ex + cauf R.
Z Z
(4) cos x dx = sin x + c, sin x dx = − cos x + c auf R.
Z Z
(5) cosh x dx = sinh x + c, sinh x dx = cosh x + c auf R.
Z
1
(6) dx = arctan x + c auf R.
1 + x2
Z artanh(x) + c auf (−1, 1)
1 1 1 + x
(7) dx = ln + c = .
1 − x2 2 1 − x arcoth(x) + c auf (−∞, −1) ∪ (1, ∞)
7.1 Stammfunktionen und ihre Berechnung 229
Z
1
(8) √ dx = arsinh(x) + c auf R.
1 + x 2
Z
1
(9) √ dx = arcsin x + c auf (−1, 1).
1 − x2
Z p arcosh(x) + c
1 auf (1, ∞)
(10) √ dx = ln |x + x2 − 1| + c = .
2
x −1 −arcosh(−x) + c auf (−∞, −1)
Z
e(a+ib)x
(11) e(a+ib)x dx = + c auf R für a + ib 6= 0.
(a + ib)
Z
dx x−a
(12) = ln |x − (a + ib)| + i · arctan + c für b 6= 0.
(x − (a + ib)) b
Z
dx 1 1
(13) n
=− · + c für n ∈ N, n > 1.
(x − (a + ib)) n − 1 (x − (a + ib))n−1
2. Partielle Integration:
Seien f, g : I ⊂ R −→ E differenzierbar und f · g ′ ∈ S(I, E). Dann gilt f ′ · g ∈ S(I, E)
und Z Z
f (x)g(x) dx = − f (x)g ′ (x) dx + f (x)g(x) + c.
′
3. Substitutionsregel:
g ∈ S(I, E) habe die Stammfunktion G, f : J ⊂ R −→ I ⊂ R sei differenzierbar. Dann
hat die Funktion g ∗ := f ′ · (g ◦ f ) : J ⊂ R −→ E die Stammfunktion G∗ := G ◦ f , das
heißt Z Z
g(y) dy = f ′ (x) · g(f (x)) dx.
y=f (x)
Beweis. Der Beweis folgt aus den Rechenregeln für die Ableitung (Summen- und Produkt-
regel, Kettenregel, komponentenweises Differenzieren). ⊓
⊔
230 7 Integralrechnung für Funktionen einer reellen Variablen
R
Beispiel 2: Berechung von In := sinn (x), n ∈ N0 .
Wir nehmen an, dass sinn (x) eine Stammfunktion besitzt und benutzen partielle Integra-
tion:
Z
In = − sinn−1 (x) · cos′ (x) dx
Z
part. Int. n−1 d
= − sin (x) · cos(x) + sinn−1 (x) · cos(x) dx
dx
Z
= − sin n−1
(x) · cos(x) + (n − 1) sinn−2 (x) 1 − sin2 (x) dx
1 n−1
Jn = cosn−1 (x) · sin(x) + Jn−2 für n ≥ 2
n n
mit J0 = x + c und J1 = sin(x) + c.
Seien P, Q ∈ K[z] Polynome über dem Körper K, K ∈ {R, C}, und Q 6= 0. Wir be-
trachten eine Teilmenge A ⊂ K, auf der Q keine Nullstelle hat. Dann heißt die Funktion
f : A ⊂ K −→ K mit P (x)
f (x) :=
Q(x)
7.1 Stammfunktionen und ihre Berechnung 231
Sei Q ∈ C[z] ein komplexes Polynom vom Grad n ≥ 1. Dann hat Q n komplexe Nullstel-
len. Sind ξ1 , . . . , ξm die verschiedenen Nullstellen von Q mit der Vielfachheit jeweils νj ,
so kann man Q in Linearfaktoren zerlegen:
Nach Definition von a gilt P (ξ1 ) − aS(ξ1 ) = 0. Ist P − aS = 0, so gilt die Behauptung.
Sei nun P − aS 6≡ 0. Dann kann man den Linearfaktor (z − ξ1 ) abspalten, das heißt es gilt
P (z) − aS(z) = (z − ξ1 )S̃(z). Es folgt
P (z) (∗) a e
S(z)
= + .
Q(z) ν
(z − ξ1 ) 1 (z − ξ1 )ν1 −1 · S(z)
Q vor, wobei ξ1 mit Vielfachheit ν1 − 1 auftritt. Die Koeffizienten in der Zerlegung des
zweiten Summanden sind nach Ind.-Voraussetzung eindeutig bestimmt, somit ist auch
C1ν1 := a eindeutig bestimmt. ⊓
⊔
Ist Q ∈ R[x] ein reelles Polynom, so tritt mit jeder echt komplexen Nullstelle ξ = a + ib
von Q auch die konjugiert-komplexe Zahl ξ = a − ib als Nullstelle mit der gleichen Viel-
fachheit auf. Dies liefert die folgende speziellere Partialbruchzerlegung für reelle rationale
Funktionen:
Beweis. Wir betrachten f als komplexe rationale Funktion und machen ihre Partialbruch-
zerlegung wie in Satz 7.3. Es existieren also komplexe Zahlen Alk , Blk , Cjk , so dass
s µj r ν
P (x) X X Cjk XXl
Alk Blk
f (x) = = + + ∀ x ∈ R, x 6= λj .
Q(x) (x − λj )k (x − ξl )k (x − ξ l )k
j=1 k=1 l=1 k=1
0 = f (x) − f (x)
X s Xµj r νl
Cjk − C jk X X Alk − B lk Blk − Alk
= + + ∀ x ∈ R, x 6= λj .
(x − λj )k (x − ξl )k (x − ξ l )k
j=1 k=1 l=1 k=1
a) Wir multiplizieren f (z) mit Q(z). Dann erhalten wir eine Gleichung für zwei Polynome
und können die Konstanten Cjk durch Koeffizientenvergleich bestimmen.
7.1 Stammfunktionen und ihre Berechnung 233
b) Wir setzen n spezielle Werte z1 , . . . , zn ∈ C in die Gleichung (∗) ein und erhalten ein
lineares Gleichungssystem für die Konstanten Cjk , das wir lösen können.
c) Wir multiplizieren (∗) mit (z − ξj )νj und erhalten für den Koeffizienten Cjνj
P (z) P (z)
Cjνj = lim · (z − ξj )νj = lim Q .
z→ξj Q(z) z→ξj (z − ξi )νi
i6=j
z+1 P (z)
f (z) = = .
z4 3 2
−z +z −z Q(z)
Q(z) z4 − z3 + z2 + z
= = z 2 + 1.
z(z − 1) z2 − z
Somit sind die weiteren Nullstellen von Q gleich ±i. Wir erhalten für die Partialbruchzer-
legung
C1 C2 C3 C4
f (z) = + + + .
z z−1 z−i z+i
Zur Berechnung der Koeffizienten wenden wir Methode c) an, das heißt
z+1 1
C1 = lim = = −1,
z→0 (z − 1)(z − i)(z + i) −1 · (−i) · i
z+1
C2 = lim = 1.
z→1 z(z − i)(z + i)
i
Durch analoges Rechnen erhält man C3 = 2 und C4 = − 2i . Somit gilt
1 1 i i
f (z) = − + + − .
z z − 1 2(z − i) 2(z + i)
Offensichtlich gilt
Q(x) = (x2 + 1)2 = (x − i)2 (x + i)2 .
Folglich sind ξ1 = i und ξ2 = −i zweifache Nullstellen von Q. Wir erhalten für die Partial-
bruchzerlegung:
A B A B
f (z) = + 2
+ + .
(z − i) (z − i) (z + i) (z + i)2
Den Koeffizienten B bestimmen wir mit Methode c):
234 7 Integralrechnung für Funktionen einer reellen Variablen
2z 3 + 2z 2 + 2z − 2 −2i − 2 + 2i − 2
B = lim 2
= = 1.
z→i (z + i) 4i2
Setzen wir dann zum Beispiel die speziellen Werte x = 0 und x = 1 ein, so erhalten wir
das folgende Gleichungssystems für A und A:
0=A+A
A 1 A 1
1= + 2
+ + .
1 − i (1 − i) 1 + i (1 + i)2
Seien P, Q ∈ C[z] komplexe Polynome und I ⊂ R ein Intervall, das keine Nullstellen von
Q enthält. Wir wollen das Integral
Z
P (x)
dx auf I
Q(x)
berechnen. Dazu gehen wir folgendermaßen vor:
P (x) P2 (x)
= P1 (x) + ,
Q(x) Q(x)
R P (x)
Dadurch kann man Q(x) dx vollständig berechnen.
d) Sind die Polynome P und Q reell, so beschreibt man die Stammfunktion ebenfalls
als reelle Funktion. Wir gehen wie oben vor und fassen am Schluß die auftretenden
komplexen und konjugiert komplexen Summanden zu reellen Funktionen zusammen.
Für echt komplexe Zahlen ξ = a + bi, b 6= 0 erhält man:
Z
p
A A 2 2
x−a
+ dx = 2 · Re(A) · ln (x − a) + b − 2 · Im(A) · arctan +c
x−ξ x−ξ b
und
Z
A A 1 A A
k
+ dx = − k−1
+ +c
(x − ξ) (x − ξ)k k−1 (x − ξ) (x − ξ)k−1
1 A(x − ξ)k−1 + A(x − ξ)k−1
=− + c.
k−1 (x2 − 2x · a + |ξ|2 )k−1
Z
1. Typ: R(eax ) dx mit a ∈ R, a 6= 0 :
Substituiere y := eax , dy = aeax dx.
Z
2. Typ: R(eax , sinh ax, cosh ax) dx mit a ∈ R, a 6= 0:
Substituiere y := eax , dy = aeax dx und bnutze
ax −ax eax −e−ax
cosh ax = e +e 2 und sinh ax = 2 .
Z
3. Typ: R(cos x) · sin x dx
Substituiere y := cos x, dy = − sin x dx.
Z
4. Typ: R(sin x) · cos x dx
Substituiere y := sin x, dy = cos x dx.
Z
5. Typ: R(sin x, cos x, tan x, cot x) dx
Substituiere y := tan x2 und benutze
2 dy 1−y 2 2y 2y 1−y 2
dx = 1+y 2 , cos x = 1+y 2 , sin x = 1+y 2
, tan x = 1−y 2
, cot x = 2y .
Z
6. Typ: R(sinh x, cosh x, tanh x, coth x) dx
Substituiere y := tanh x2 oder drücke die Hyperbelfunktionen durch die Exponentialfunk-
tion aus und gehe wie für Typ 1 vor.
Z r !
ax + b n
7. Typ: R x, dx mit a, b, c, d ∈ R und ad − bc 6= 0:
cx + d
q
Substituiere y := n ax+b
cx+d
Z 1 1 1
8. Typ: R x n , x m , x p , . . . dx
1
Substituiere y := x r , dx = ry r−1 dy, wobei r = kgV (n, m, p, . . .).
Z p
9. Typ: x2 + a2 ) dx mit a ∈ R, a > 0:
R(x,
√
Substituiere x := a sinh y, dx = a cosh y dy , x2 + a2 = a cosh y.
Z p
10. Typ: x2 − a2 ) dx mit a ∈ R, a > 0:
R(x,
√
Substituiere x := a cosh y , dx = a sinh y dy, x2 − a2 = |a sinh y|.
Z p
11. Typ: a2 − x2 ) dx mit a ∈ R, a > 0:
R(x,
√
Substituiere x = a sin y, dx = a cos y dy, a2 − x2 = | cos y|.
7.1 Stammfunktionen und ihre Berechnung 237
Z p
12. Typ: R(x, ax2 + bx + c) dx :
Substituiere y = √ax+b
2
. Dann weiter substitutieren t = sinh y, t = cosh y oder t = cos y.
|b −ax|
Z
√ √
13. Typ: R(x, ax + b,
cx + d) dx
√
Kann durch Substitution y := ax + b, dx = a1 y dy auf Typ 12 zurückgeführt werden.
Definition 7.3. Sei f ∈ S(I, E) und a, b ∈ I. Unter dem bestimmten Integral von f von
a nach b versteht man den Vektor (bzw. für E = K die Zahl):
Zb
f (x) dx := F (b) − F (a) ∈ E,
a
Wir werden auch die folgende Bezeichnung benutzen: F (b) − F (a) =: F (x)|ba
4. Partielle Integration:
Seien f, g : I ⊂ R −→ E differenzierbar, a, b ∈ I, f · g ′ ∈ S(I, E). Dann gilt
Zb Zb
′
f (x)g(x) dx = − f (x)g ′ (x) dx + f (b)g(b) − f (a)g(a).
a a
238 7 Integralrechnung für Funktionen einer reellen Variablen
5. Substitutionsregel:
Sei g ∈ S(I, E) und f : J ⊂ R −→ I ⊂ R differenzierbar. Dann gilt
Zb f (b)
Z
′
g(f (x))f (x) dx = g(y) dy.
a f (a)
Um diese Formel nachzuweisen, benutzen wir die Rekursionsformel für die Stammfunktion
In (x) von sinn (x) aus Beispiel 2. Es gilt I0 (x) = x + c, I1 (x) = − cos x + c, und
1 n−1
In (x) = − sinn−1 x · cos x + · In−2 (x) für n ∈ N, n > 1.
n n
Somit erhalten wir
n−1 π n−1 π
In (0) = · In−2 (0) und In = · In−2 ,
n 2 n 2
sowie π π
π
I0 (0) = 0, I1 (0) = −1 und I0 = , I1 = 0.
2 2 2
Daraus folgt
2k − 1 (2k − 1)(2k − 3)
I2k (0) = · I2k−2 (0) = · I2k−4 (0)
2k (2k)(2k − 2)
(2k − 1)(2k − 3) · . . . · 3 · 1
= ... = · I0 (0) = 0.
2k(2k − 2) · . . . · 2
Die zweite Motivation für die Entwicklung der Integralrechnung entstand aus dem Ver-
such, Längen, Flächeninhalte und Volumen zu berechnen. Wir werden hier zunächst das
Riemann-Integral behandeln, das in rigoroser Form von Bernard Riemann in seiner Ha-
bilitationsschrift (1854) definiert wurde. Im Rahmen der Maß- und Integrationstheorie
im 3. Semester werden wir später das Lebesgue-Integral kennenlernen, das etwas bessere
Eigenschaften als das Riemann-Integral hat. Für einen kurzen historischen Überblick zur
Entwicklung der Integralrechnung verweisen wir auf das 9. Kapitel des Buches Analysis I
von W. Walter.
Zunächst formulieren wir einige Forderungen, die ein vernünfig definierter geometrischer
Flächeninhalt µ(A) für Teilmengen A ⊂ R2 erfüllen sollte:
1. µ(A) ≥ 0,
2. µ([a, b] × [c, d]) = (b − a) · (d − c),
3. Int(A) ∩ Int(B) = ∅ =⇒ µ(A ∪ B) = µ(A) + µ(B),
4. A ⊂ B =⇒ µ(A) ≤ µ(B).
5. µ(A) ist invariant gegen Euklidische Bewegungen (z.B. Drehungen, Verschiebungen).
Legt man diese Eigenschaften zugrunde, so kann man den Flächeninhalt einer Teilmenge
A ⊂ R2 bestimmen, in dem man sie in Mengen ”einfacher” Form zerlegt. Z.B. kann man
Mengen der Form
a b
zerlegen, wobei die obere Begrenzungskurve durch einen Funktionsgraphen gegeben wird.
Es genügt deshalb, den Flächeninhalt von Mengen der Form
zu kennen, wobei f eine nicht-negative Funktion auf dem Intervall [a, b] ist. Mit solchen
Mengen werden wir uns nun beschäftigen. Ihr Flächeninhalt wird durch das Riemann-
Integral von f (falls es existert) beschrieben.
Wir definieren im Folgenden das Riemannsche Integral für Funktionen f : [a, b] ⊂ R −→ E,
wobei E ein Banachraum über R oder C ist.
240 7 Integralrechnung für Funktionen einer reellen Variablen
Definition 7.4. Sei I = [a, b] ⊂ R ein kompaktes Intervall. Unter einer Zerlegung (oder
Unterteilung) von I versteht man eine Menge von Punkten P = {x0 , x1 , . . . , xn } mit a =
x0 < . . . < xn = b. Ik := [xk−1 , xk ] heißt das k–te Teilintervall von P, L(Ik ) := xk − xk−1
die Länge von Ik und kPk := max{L(Ik ) | k = 1, . . . , n} die Feinheit der Zerlegung P.
Eine Zerlegung P e heißt Verfeinerung der Zerlegung P (symbolisch: P e ≥ P), falls Pe=P
e aus P durch Hinzunahme weiterer Teilungspunkte entsteht.
oder P
Definition 7.5. Sei f : [a, b] −→ E eine Funktion, P = {x0 , . . . , xn } eine Zerlegung von
[a, b] und ξ = (ξ1 , . . . , ξn ) ∈ Rn ein Tupel von Zahlen mit ξk ∈ Ik für k = 1, . . . , n. Dann
heißt
n
X
S(f, P, ξ) := L(Ik ) · f (ξk )
k=1
Riemannsche Summe für f bzgl. der Zerlegung P und der Stützstellen ξ = (ξ1 , . . . , ξn ).
Definition 7.6. Sei f : [a, b] −→ E. Der Vektor e ∈ E heißt Grenzwert der Riemannschen
Summen für f , falls für alle ε > 0 eine Zerlegung Pε existiert, so dass
Der Grenzwert der Riemannschen Summen ist, falls er existiert, eindeutig bestimmt. Wir
überlassen dem Leser den Beweis als Übungsaufgabe.
Zb
R f (x) dx := lim S(f, P, ξ)
P
a
Bemerkung:
1. Für eine Funktion f : [a, b] −→ E, die sowohl eine Stammfunktion besitzt als auch
Riemann-integrierbar ist, stimmen das Riemann-Integral und das bestimmte Integral
überein, d.h.,
Zb Zb
R f (x) dx = f (x) dx.
a a
A := {(x, y) ∈ R2 | a ≤ x ≤ b, 0 ≤ y ≤ f (x)}.
Rb
Dann ist µ(A) := f (x) dx der Flächeninhalt von A. (Man benutzt dies als Definition
a
für den Flächeninhalt. Dies entspricht der geometrischen Vorstellung und Motivation).
3. Es gibt Funktionen, die Stammfunktionen besitzen, aber nicht Riemann-integrierbar
sind. Wir betrachten als Beispiel die Funktion F : [0, 1] ⊂ R −→ R
(
x2 sin x12 x ∈ (0, 1],
F (x) :=
0 x = 0.
F ist auf [0, 1] differenzierbar, aber f := F ′ ist auf [0, 1] nicht Riemann-integrierbar
(Übungsaufgabe 94).
4. Es gibt Funktionen, die Riemann-integrierbar sind, aber keine Stammfunktion besitzen.
Sei P = {x0 , x1 , ..., xn } eine Zerlegung des Intervalls [a, b] und seien e1 , ..., en ∈ E
Vektoren eines Banachraumes E. Eine Funktion f : [a, b] −→ E mit der Eigenschaft
Rb
Beweis. Sei e := f (x) dx. Nach Definition existiert eine Zerlegung P von [a, b], so dass
a
für beliebige Stützstellen ξ von P gilt
kS(f, P, ξ) − ek < 1.
Wir betrachten ein Teilintervall Iν von P. Für µ 6= ν fixieren wir Zahlen ξµ ∈ Iµ und
definieren
X
Mν := L(Iµ ) · f (ξµ ) ∈ E.
µ6=ν
Für jedes x ∈ Iν gilt dann kL(Iν ) · f (x) + Mν − ek < 1. Mit der Dreiecksungleichung folgt
Mν − e
M − e
Mν − e
1
ν
kf (x)k ≤
f (x) +
+
< +
L(Iν ) L(Iν ) L(Iν ) L(Iν )
für alle x ∈ Iν . Sei nun M := max L(I1ν ) (1 + kMν − ek) | ν = 1, . . . , n . Dann ist
kf (x)k ≤ M für alle x ∈ [a, b]. ⊓
⊔
242 7 Integralrechnung für Funktionen einer reellen Variablen
Beweis. (=⇒) Sei f : [a, b] −→ E Riemann-integrierbar und ε > 0 gegeben. Dann exis-
tieren e ∈ E und Pε , so dass gilt
ε
kS(f, P, ξ) − ek < ∀P ≥ Pε .
2
e ≥ Pε folgt dann
Für P, P
e ≤ kS(f, P, ξ) − ek + kS(f, P,
e ξ)k
kS(f, P, ξ) − S(f, P, e − ek ≤ ε.
e ξ)
(⇐=) Sei (εn ) eine Nullfolge positiver Zahlen. Nach Voraussetzung exisiert für jedes n ∈ N
eine Zerlegung Pn von [a, b] so dass
Wir bilden nun sukzessive die folgenden Zerlegungen Un von [a, b]:
U1 := P1 ,
U2 := P1 ∪ P2 = U1 ∪ P2 ,
U3 := P1 ∪ P2 ∪ P3 = U2 ∪ P3 , ...
Un := P1 ∪ . . . ∪ Pn = Un−1 ∪ Pn , ···
Dann ist Pn ≤ Un ≤ Un+1 ≤ . . .. Zu jeder Zerlegung Un wählen wir ein Tupel von
Stützstellen ξn . Sei ε > 0 gegeben. Dann existiert ein n0 ∈ N so dass εn < 2ε für alle
n ≥ n0 . Aus (∗) folgt dann für alle m ≥ n ≥ n0
ε
kS(f, Un , ξn ) − S(f, Um , ξm )k < εn < . (∗∗)
2
∞
Folglich bilden die Vektoren S(f, Un , ξn ) n=1 eine Cauchy–Folge im Banachraum E. Da
E vollständig ist, existiert e := lim S(f, Un , ξn ). Gehen wir in (∗∗) mit m gegen ∞, so
n→∞
erhalten wir
ε
kS(f, Un , ξn ) − ek ≤ ∀n ≥ n0 .
2
Sei nun P eine beliebige Zerlegung mit P ≥ Un0 . Da P, Un0 ≥ Pn0 , erhalten wir mit (∗)
Satz 7.8 Jede stetige Abbildung f : [a, b] ⊂ R −→ E mit Werten in einem Banachraum
E ist Riemann-integrierbar.
XN n
X
e e
e
kS(f, P, ξ) − S(f, P0 , ξ0 )k =
(yl − yl−1 ) · f (ξl ) − (xk − xk−1 ) · f (ξk )
l=1 k=1
XN
e
=
(yl − yl−1 ) · (f (ξl ) − f (ξkl ))
wobei Iel ⊂ Ikl
l=1
N
X
≤ kf (ξel ) − f (ξkl )k ·(yl − yl−1 )
| {z }
l=1 ε
< 2(b−a)
ε ε
< · (b − a) = .
2(b − a) 2
e Pee
Seien nun P, ≥ P0 . Die Dreiecksungleichung liefert
ee ee e ξ)k ee ee
e ≤ kS(f, P, e − S(f, P0 , ξ)k
e ξ)
kS(f, P, ξ) − S(f, P, ξ) − S(f, P0 , ξ)k + kS(f, P,
< ε.
Der nächste Satz zeigt, dass man das Riemann-Integral für eine Riemann-intergrierbare
Funktion als Grenzwert einer beliebigen Folge von Riemannschen Summen ausrechnen
kann.
Satz 7.9 Sei f : [a, b] −→ E eine Riemann-integrierbare Funktion, Pn eine Folge von
Zerlegungen von [a, b] mit kPn k −→ 0 und ξn Stützstellen von Pn . Dann gilt
Zb
f (x) dx = lim S(f, Pn , ξn ).
n→∞
a
Beweis. Nach Satz 7.6 ist f beschränkt, also existiert ein M > 0 so dass kf (x)k ≤ M für
alle x ∈ [a, b]. Sei ε > 0. Da f Riemann-integrierbar ist, existiert eine Zerlegung P ∗ von
[a, b], so dass
Zb
ε
S(f, P, ξ) − f (x) dx
<
2
a
244 7 Integralrechnung für Funktionen einer reellen Variablen
Da Pn ∪ P ∗ ≥ P ∗ , folgt
Zb
S(f, Pn , ξn ) − f (x) dx
≤ kS(f, Pn , ξn ) − S(f, Pn ∪ P0 , ξen )k +
a Zb
+
S(f, Pn ∪ P0 , ξen ) − f (x) dx
a
ε ε
≤ + = ε.
2 2
Z b
Dies gilt für alle n ≥ n0 . Somit folgt lim S(f, Pn , ξn ) = f (x)dx. ⊓
⊔
n→∞ a
Beispiel: Sei α > 0 eine positive reelle Zahl. Wir wollen den Grenzwert
n
X
1α + 2α + . . . + nα kα 1
lim = lim ·
n→∞ nα+1 n→∞ nα n
k=1
berechnen. Dazu betrachten wir die Funktion f (x) := xα auf [0, 1] und die Zerlegung
Pn = {0, n1 , n2 , . . . , n−1 1
n , 1}. f ist stetig, also Riemann-integrierbar und kPn k = n . Dann
α
ist f ( nk ) = nk α und kPn k → 0. Wir können also Satz 7.9 anwenden. f hat auch eine
Stammfunktion, deshalb stimmt das Riemann-Integral mit dem bestimmten Integral übe-
R1 R1 1
rein (siehe Übungsaufgabe 95). Daraus folgt f (x) dx = xα dx = α+1 und somit
0 0
Z1 n
X k 1 n
X
1 Satz 7.9 kα 1
= f (x) dx = lim f · = lim · .
α+1 n→∞ n n n→∞ nα n
0 k=1 k=1
7.2 Das Riemann-Integral 245
2. Ist f ∈ R([a, c], E) ∪ R([c, b], E), so ist f ∈ R([a, b], E) und es gilt
Zb Zc Zb
f (x) dx = f (x) dx + f (x) dx.
a a c
3. Ist f ∈ R([a, b], E), [α, β] ⊂ [a, b], so ist f ∈ R([α, β], E).
4. Sei f = (f1 , f2 ) : [a, b] −→ E := E1 × E2 eine Abbildung in einen Produktraum. Dann
ist f ∈ R([a, b], E) genau dann, wenn fi ∈ R([a, b], Ei ) für i = 1, 2. In diesem Fall gilt
b
Zb Z Zb
f (x) dx = f1 (x) dx, f2 (x) dx .
a a a
5. Ist E = C und f ∈ R([a, b], C), so ist auch f ∈ R([a, b], C) und es gilt
Zb Zb
f (x) dx = f (x) dx.
a a
7. Seien f, g ∈ R([a, b], E). Stimmen f und g auf einer dichten Teilmenge von [a, b]
überein, so gilt
Zb Zb
f (x) dx = g(x) dx.
a a
8. Ist f ∈ C([a, b], E) stetig, dann gilt
Zb
Zb
f (x) dx
≤ kf (x)k dx ≤ kf k∞ · (b − a).
a a
Beweis. Den Beweis lassen wir als Übungsaufgabe. Man benutzt den Satz 7.9 und die
entsprechenden Eigenschaften für Summen. ⊓
⊔
Als nächstes befassen wir uns mit Funktionenfolgen und untersuchen, unter welchen
Bedingungen die Grenzfunktion einer Folge Riemann-integrierbarer Funktionen wieder
Riemann-integrierbar ist.
246 7 Integralrechnung für Funktionen einer reellen Variablen
Beweis. Da (fn ) gleichmäßig gegen f konvergiert, existiert für alle ε > 0 ein n0 ∈ N (von
ε abhängig), so dass
ε 1
kf (x) − fn (x)k < · (∗)
4 b−a
für alle n ≥ n0 und für alle x ∈ [a, b].
(1) Wir zeigen zunächst, dass f Riemann-integrierbar ist. Da fn0 Riemann-integrierbar
ist, existiert eine Zerlegung P0 , so dass
e < ε
e ξ)k
kS(fn0 , P, ξ) − S(fn0 , P,
2
e ≥ P0 . Damit folgt
für alle Verfeinerungen P, P
e
e ξ)k
kS(f, P, ξ) − S(f, P,
e
e ξ)k
≤ kS(f, P, ξ) − S(fn0 , P, ξ)k + kS(fn0 , P, ξ) − S(fn0 , P,
e − S(f, P,
e ξ)
+kS(fn0 , P, e
e ξ)k
X
ε
X
≤
L(Ik ) f (ξk ) − fn0 (ξk )
+ +
L(Iel ) f (ξel ) − fn0 (ξel )
2
k l
(∗) ε 1 ε
< 2· · · (b − a) + = ε.
4 b−a 2
Folglich ist f Riemann-integrierbar.
(2) Als zweites beweisen wir die Vertauschbarkeit von Limes und Integral. Wir benutzen
wieder den Satz 7.9. Sei (Pm ) eine Folge von Zerlegungen von [a, b] mit kPm k → 0 und
seien ξm Stützstellen von Pm . Sei ε > 0. Nach Satz 7.9 existieren m0 und m0 (n), so dass
Zb
ε
Zb
ε
f (x) dx − S(f, Pm , ξm )
< und
fn (x) dx − S(fn , Pm , ξm )
<
4 4
a a
für alle m ≥ max(m0 , m0 (n)). Sei nun n ≥ n0 und m ≥ max{m0 , m0 (n)}. Dann folgt
Zb Zb
f (x) dx − fn (x) dx
a a
Zb
≤
f (x) dx − S(f, Pm , ξm )
+ kS(f, Pm , ξm ) − S(fn , Pm , ξm )k
a Zb
+
S(fn , Pm , ξm ) − fn (x) dx
a
ε ε ε
< + + < ε.
4 4 4
7.2 Das Riemann-Integral 247
Rb Rb
Somit gilt lim fn (x) dx = f (x) dx. ⊓
⊔
n→∞ a a
Satz 7.12 Sei (fn ) mit fn : [a, b] −→ K eine Folge Riemann-integrierbarer Funktionen
∞
P
und konvergiere die Funktionenreihe fn (x) auf [a, b] gleichmäßig gegen f : [a, b] −→ K.
n=1
Dann ist f Riemann-integrierbar und es gilt
Zb ∞ Z
X
b
Die gleichmäßige Konvergenz einer Funktionenfolge ist eine sehr starke Forderung, die
oft nicht erfüllt ist. Für das allgemeinere Lebesgue-Integral gilt die Vertauschbarkeit von
Limes und Integral unter wesentlich schwächeren Bedingungen (siehe Vorlesung Analysis
III).
1 1 1·3 4 4
p = 1 + k 2 sin2 x + k sin x + . . . (∗)
1 − k 2 sin2 x 2 2·4
Diese Reihe hat für |k| < 1 eine konvergente Majorante (die Reihe mit dem Grenzwert
√ 1 ). Nach dem Weierstraßschen Majorantenkriterium für Funktionenreihen ist die Rei-
1−k2
he (∗) auf [0, π2 ] gleichmäßig konvergent. Mit Satz 7.12 folgt daher
248 7 Integralrechnung für Funktionen einer reellen Variablen
π
Z2
dx
Ik = p
1 − k 2 sin2 x
0
π π
Z2 ∞ Z
X
2
1 · 3 · . . . · (2n − 1) 2n 2n
= dx + k sin x dx
2 · 4 · . . . · (2n)
0 n=1 0
π
∞
X Z2
π 1 · 3 · . . . · (2n − 1)
= + k 2n sin2n x dx
2 2 · 4 · . . . · (2n)
n=1 0
∞ !
π X 1 · 3 · . . . · (2n − 1) 2
= 1+ k 2n (siehe Bsp. 2’ aus Kap. 7.1).
2 2 · 4 · . . . · (2n)
n=1
Im letzten Schritt haben wir benutzt, dass das Riemann-Integral für die Funktion h(x) =
sin2n (x) auf [0, π/2] gleich dem bestimmten Integral ist. Dies ist möglich, da h sowohl
Riemann-integrierbar ist als auch eine Stammfunktion besitzt (siehe Übungsaufgaben).
Dann folgt:
1. Sind ξ beliebige Stützstellen von P, so gilt S(f, P) ≤ S(f, P, ξ) ≤ S(f, P).
e ≥ P gilt
2. Für P
e ≤ S(f, P)
inf f (x) · (b − a) ≤ S(f, P) ≤ S(f, P) e ≤ S(f, P) ≤ sup f (x) · (b − a).
x∈[a,b] x∈[a,b]
wobei
Zb Zb
f (x) dx ≤ f (x) dx.
a a
7.2 Das Riemann-Integral 249
1. f ist Riemann-integrierbar.
2. Für alle ε > 0 existiert eine Zerlegung Pε mit S(f, Pε ) − S(f, Pε ) < ε.
Zb Zb
3. f (x) dx = f (x) dx.
a a
Zb Zb Zb
In diesem Fall gilt f (x) dx = f (x) dx = f (x) dx.
a a a
Beweis. (1) =⇒ (2): Sei f Riemann-integrierbar. Nach dem Cauchy-Kriterium aus Satz
7.7 existiert zu jedem ε > 0 eine Zerlegung Pε mit
e < ε,
S(f, Pε , ξ) − S(f, Pε , ξ) (∗)
2
wobei ξ = (ξ1 , . . . , ξr ) und ξe = (ξe1 , . . . , ξer ) beliebige Stützstellen von Pε mit f (ξk ) ≥ f (ξek )
für k = 1, . . . , r sind. Wir wählen nun Folgen von Stützstellen (ξn ) und (ξen ), für die
f (ξkn ) → Mk und f (ξekn ) → mk für k = 1, . . . , r gilt, setzen diese in (∗) ein und gehen mit
n → ∞. Dann folgt
ε
S(f, Pε ) − S(f, Pε ) ≤ < ε.
2
(2) =⇒ (3): Für alle ε > 0 existiere eine Zerlegung Pε , so dass S(f, Pε ) − S(f, Pε ) < ε.
Es gilt
Zb Zb
S(f, Pε ) ≥ f (x) dx ≥ f (x) dx ≥ S(f, Pε )
a a
und daher
Zb Zb
0≤ f (x) dx − f (x) dx < ε
a a
für alle ε > 0. Dies zeigt die Gleichheit von unterem und oberem Riemann-Integral.
Rb Rb
(3) =⇒ (1): Sei f (x) dx = f (x) dx =: e. Dann existieren für jedes ε > 0 Zerlegungen
a a
e mit
P und P
ε e <e+ ε
S(f, P) > e − und S(f, P)
2 2
e − S(f, P) < ε. Sei nun Pε = P ∪ P̃. Dann gilt
Folglich ist S(f, P)
e − S(f, P) < ε.
S(f, Pε ) − S(f, Pε ) ≤ S(f, P)
Ist nun P eine Zerlegung von [a, b] mit P ≥ Pε . Dann liegen sowohl e als auch die Rie-
mannschen Summen S(f, P, ξ) für beliebige Stützstellen im Intervall S(f, Pε ), S(f, Pε ) .
250 7 Integralrechnung für Funktionen einer reellen Variablen
Folglich gilt kS(f, P, ξ) − e)k < ε. e ist also der Grenzwert der Riemannschen Summen für
f , d.h. f ist Riemann-integrierbar und
Z b Zb Zb
f (x) dx = f (x) dx = f (x) dx.
a
a a ⊓
⊔
Unser Ziel ist es nun zu zeigen, dass f : [a, b] −→ R genau dann Riemann–integrierbar
ist, wenn f beschränkt und “fast überall” stetig ist. Zunächst klären wir, was mit ”fast
überall” gemeint ist.
Definition 7.8. Eine Teilmenge A ⊂ R hat das Lebesgue–Maß Null (wir sagen auch kurz:
A ist eine Nullmenge), wenn für alle ε > 0 eine Folge von Intervallen I1 , I2 , . . . existiert,
so dass
∞
[ ∞
X
A⊂ Int(In ) und L(In ) < ε.
n=1 n=1
Man sagt: Eine Eigenschaft für Punkte einer Menge B ⊂ R gilt ”fast überall” wenn sie
für alle Punkte von (B \ N ullmenge) gilt.
Offensichtlich gilt:
Satz 7.14
∞
S
1. Seien A1 , A2 , . . . ⊂ R Nullmengen. Dann ist An ebenfalls eine Nullmenge.
n=1
2. Jede abzählbare Menge A ⊂ R ist eine Nullmenge.
Beweis. (1) Sei ε > 0. Da An Nullmengen für alle n ∈ N, existieren Intervalle In1 , In2 , . . .
mit
[∞ ∞
X ε
An ⊂ Int(Ini ) und L(Ini ) < n .
2
i=1 i=1
Daraus folgt
∞
[ ∞ [
[ ∞
A= An ⊂ Int(Ini ) (abzählbar viele Mengen)
n=1 n=1 i=1
und
X ∞
∞ X X∞
1 1 1
L(Ini ) < ε · n
=ε· · 1 = ε.
2 2 1− 2
n=1 i=1 n=1
Beweis. (⇐=) Sei f : [a, b] ⊂ R −→ R beschränkt und fast überall stetig. Dann existiert
ein C ∈ R+ mit |f (x)| < C für alle x ∈ [a, b]. Wir bezeichnen die Menge der Unstetig-
keitsstellen von f mit A, d.h.
Mit Hilfe der Oszillation kann man die Stetigkeit folgendermaßen charakterisieren: f ist
in x0 genau dann stetig, wenn osz(f, x0 ) = 0. Für die Punkte x0 ∈ [a, b] \ A (in denen f
ja stetig ist) existiert somit ein δ(x0 ) > 0, so dass
von [a, b]. Wir wählen nun eine Zerlegung P = {x0 , x1 , . . . , xn } von [a, b], deren Teilinter-
valle Ik in Int(Jnj ) oder in K(xi , δ(xi )) liegen, wobei i = 1, . . . , r und j = 1, . . . , N . Wir
bezeichnen mit J ∗ die Menge derjenigen Teilintervalle von P, die in einem Jnj liegen und
mit J ∗∗ die Menge der restlichen Teilintervallen von P. Dann gilt wegen |f (x)| ≤ C die
folgende Ungleichung
X X
S(f, P) − S(f, P) = (Mk − mk ) L (Ik ) + (Mk − mk ) L (Ik )
Ik ∈J ∗ Ik ∈J ∗∗
X X
≤ 2C L (Ik ) + ε · L (Ik ) = (2C + (b − a)) · ε.
Ik ∈J ∗ I ∈J ∗∗
| {z } |k {z }
<ε <b−a
A = A1 ∪ A 1 ∪ A 1 ∪ . . . .
2 3
Nach Satz 7.14 genügt es nun zu zeigen, dass die Mengen A 1 für jedes n ∈ N Nullmengen
n
sind. Sei n ∈ N fixiert und ε > 0 vorgegeben. Nach Voraussetzung existiert dann eine
Zerlegung P mit
ε
S(f, P) − S(f, P) < .
2n
Sei J ∗ die Menge der Teilintervalle Ik von P mit Int(Ik ) ∩ A 1 6= ∅. Nach Definition der
n
Oszillation folgt dann für x0 ∈ Int(Ik ) ∩ A 1
n
1
Mk − mk = sup f |Ik − inf f |Ik ≥ osz(f, x0 ) ≥ .
n
Daraus ergibt sich
1 X X ε
L (Ik ) ≤ (Mk − mk ) L (Ik ) ≤ S(f, P) − S(f, P) < .
n 2n
Ik ∈J ∗ Ik ∈J ∗
P
m
Außerdem wählen wir Intervalle Iek um die Teilungspunkte von P mit L(Iek ) < 2ε . Nach
k=1
Wahl von J ∗ folgt dann
[ m
[ X m
X ε ε
A1 ⊂ Int(Ik ) ∪ Int(Iek ), und L(Ik ) + L(Iek ) < + = ε.
n 2 2
Ik ∈J ∗ k=1 Ik ∈J ∗ k=1
Wir wissen aus dem letzten Abschnitt, dass jede stetige Funktion auf einem kompak-
ten Intervall Riemann-integrierbar ist. In diesem Abschnitt zeigen wir, dass jede stetige
Funktion auch eine Stammfunktion besitzt. Aus Übungsaufgabe 95 wissen wir, dass für
Riemann-integrierbare Funktionen, die eine Stammfunktion besitzen, das Riemann- und
das unbestimmte Integral übereinstimmen. Dies legt den folgenden Satz nahe:
Beweis. (1) Aus den Rechenregeln für Riemann-Integrale (Satz 7.10) folgt
Zx Zy
Zy
kF (x) − F (y)k =
R f (t) dt − R f (t) dt
=
R f (t) dt
a a x
Zy
≤ R kf (t)k dt ≤ |y − x| · kf k∞ .
x
Z x Z y
(Hier benutzen wir die Vereinbarung: R f (t) dt := − R f (t) dt falls x ≤ y.)
y x
(2) Sei ε > 0. Da f in x0 ∈ [a, b] stetig ist, existiert ein δ > 0, so dass kf (t) − f (x0 )k < ε
für alle t ∈ [a, b] mit |t − x0 | < δ. Also gilt für alle diese t:
F (t) − F (x )
1 Zt
0
− f (x0 )
=
· R f (u) du − f (x0 )
t − x0 |t − x0 |
x0
1 Zt
=
· R(f (u) − f (x0 )) du
|t − x0 |
x0
Zt
1
≤ · R kf (u) − f (x0 )k du
|t − x0 |
x0
1
≤ · ε|t − x0 | = ε.
|t − x0 |
Folglich ist
F (t) − F (x0 )
lim = F ′ (x0 ) = f (x0 ).
t→x0 t − x0
254 7 Integralrechnung für Funktionen einer reellen Variablen
(3) F ist eine Stammfunktion von f mit F (a) = 0. Somit gilt für das bestimmte Integral
von f über [a, b]:
Zb Zb
f (t) dt = F (b) − F (a) = F (b) = R f (t) dt.
a a ⊓
⊔
Rb
Für stetige Funktionen werden wir für das Riemann-Integral jetzt immer f (x) dx schrei-
a
ben. Wir können für dieses Integral sowohl die Eigenschaften des bestimmten Integrals
(z.B. Partielle Integration, Substitutionsregel) als auch die Eigenschaften des Riemann-
Integals (z.B. Monotonieverhalten, Normabschätzung) benutzen.
2n
1 n 1 X
f (x) := x (1 − x)n = · c k xk , wobei ck ∈ Z.
n! n!
k=n
Z1
πan 2an
0<I< sin πx dx = < 1.
n! n!
0
Wir zeigen nun, dass I ganzzahlig ist: Für die k-ten Ableitungen von f gilt f (k) (0) ∈ Z
und f (k) (1) ∈ Z für alle k ∈ N0 . Sei F : R −→ R die Funktion
F (x) := bn π 2n f (x) − π 2n−2 f (2) (x) + π 2n−4 f (4) (x) − . . . + (−1)n f (2n) (x) .
an−k
Nach unserer Annahme ist π 2(n−k) = bn−k
für 0 ≤ k ≤ n. Folglich gilt F (0), F (1) ∈ Z.
Außerdem erhalten wir
d
F ′ (x) sin πx − πF (x) cos πx = F (2) (x) + π 2 F (x) sin πx = bn π 2n+2 f (x) sin πx
dx
= an π 2 f (x) sin πx
und somit
1 ′
I= F (1) sin π − πF (1) cos π − F ′ (0) sin 0 + πF (0) cos 0 = F (1) + F (0) ∈ Z.
π
Also müßte I eine ganze Zahl in (0, 1) sein, was nicht möglich ist. Somit war unsere
Annahme falsch, d.h. π ist irrational.
7.4 Die Mittelwertsätze der Integralrechnung 255
Y 4k 2 n
π
2. Es gilt die Wallissche Formel: = lim .
2 n→∞ 4k 2 − 1
k=1
Zum Beweis betrachten wir das uns bereits bekannte Integral
π
Z2 1·3·...·(n−1) · π falls n gerade und n ≥ 2
n 2·4·...·n 2
An := sin x dx. =
2·4·...·(n−1) falls n ungerade und n ≥ 3.
0 1·3·...·n
Für x ∈ [0, π2 ] gilt sin2n+2 x ≤ sin2n+1 x ≤ sin2n x. Aus der Monotonie des Riemann–
Integrals folgt somit A2n+2 ≤ A2n+1 ≤ A2n . Wir erhalten also
A2n A2n+1 A2n+2 2n + 1
1 = lim ≥ lim ≥ lim = lim = 1.
n→∞ A2n n→∞ A2n n→∞ A2n n→∞ 2n + 2
Wir haben also in der letzten Ungleichung überall ein Gleichheitszeichen. Damit folgt
A2n+1 2 · 4 · . . . · (2n) 2 · 4 · . . . · (2n) 2
1 = lim = lim · ·
A2n
n→∞ n→∞ 1 · 3 · . . . · (2n + 1) 1 · 3 · . . . · · · (2n − 1) π
n
Y 2
(2k) 2
= lim · .
n→∞ (2k + 1)(2k − 1) π
k=1
Beweis. Da f : [a, b] → R stetig und [a, b] kompakt, existieren m := min{f (x) | x ∈ [a, b]}
und M := max{f (x) | x ∈ [a, b]}. Es folgt
Rb
f (x)g(x) dx
a
m = f (xmin ) ≤ ≤ M = f (xmax ).
Rb
g(x) dx
a
2
Mit den hier auftretenden Integralen meinen wir immer die Riemann-Integrale.
256 7 Integralrechnung für Funktionen einer reellen Variablen
Da f stetig ist, existiert nach dem Zwischenwertsatz ein ξ ∈ [xmin , xmax ] ⊂ [a, b], so dass
Rb
f (x)g(x) dx
a
f (ξ) = .
Rb
g(x) dx
a ⊓
⊔
Folgerung 7.1 Ist f : [a, b] −→ R stetig, dann existiert ein ξ ∈ [a, b], so dass gilt
Zb
f (x) dx = f (ξ) · (b − a).
a
Rb
Folgerung 7.2 Sei f : [a, b] −→ R stetig, f ≥ 0 und f (x) dx = 0. Dann gilt f = 0.
a
Beweis. Sei c ∈ (a, b). Wir betrachten Folgen (xn ) und (yn ) mit a ≤ xn < c < yn ≤ b und
xn → c, yn → c. Da f ≥ 0, gilt
Zyn Zb
0≤ f (x) dx ≤ f (x) dx = 0.
xn a
Folglich ist f (ξn ) = 0. Nach Konstruktion konvergiert die Folge (ξn ) gegen c. Da f stetig
ist, konvergiert dann auch f (ξn ) gegen f (c). Folglich ist f (c) = 0 für jedes c ∈ (a, b). Für
die Randpunkte folgt dies dann wegen der Stetigkeit von f . ⊓
⊔
Zb Zξ Zb
f (x)g(x) dx = g(a) f (x) dx + g(b) f (x) dx.
a a ξ
Zb Zb
′
F (x)g (x) dx = F (ξ) · g ′ (x) dx = F (ξ) · (g(b) − g(a)). (∗)
a a
7.5 Parameterabhängige Integrale 257
Zb Zb Zb b
f (x)g(x) dx = F ′ (x)g(x) dx = − F (x)g ′ (x) dx + F (x)g(x)
a
a a a
(∗)
= −F (ξ) g(b) − g(a) + F (b)g(b) − F (a)g(a)
= g(a) F (ξ) − F (a) + g(b) F (b) − F (ξ)
Zξ Zb
= g(a) f (x) dx + g(b) f (x) dx.
a ξ ⊓
⊔
In diesem Abschnitt integrieren wir Funktionen, die von zusätzlichen Parametern abhängen
und untersuchen, wann Integral und Ableitung vertauschbar sind.
Satz 7.19 Sei U ⊂ Rn offen und f : [a, b] × U ⊂ Rn+1 −→ R eine stetige Funktion. Sei
F : U −→ R definiert durch
Zb
F (x) := f (t, x) dt.
a
Dann gilt:
1. F : U ⊂ Rn −→ R ist stetig.
∂f ∂f
2. Existiert ∂x i
und ist ∂x i
: [a, b] × U −→ R stetig, so ist F : U −→ R nach xi stetig
differenzierbar und es gilt
Zb
∂F ∂f
(x) = (t, x) dt.
∂xi ∂xi
a
Beweis. (1) Sei x ∈ U . Wir wählen eine kompakte Umgebung W (x) ⊂ U von x. Nach
Voraussetzung ist f |[a,b]×W stetig. Da [a, b]×W kompakt ist, ist f |[a,b]×W sogar gleichmäßig
stetig, d.h., für alle ε > 0 existiert ein δ > 0, so daß
ε
|f (t, x + h) − f (t, x)| <
b−a
für alle t ∈ [a, b] und alle h ∈ Rn mit khk < δ. Es folgt
Zb Zb
|F (x + h) − F (x)| = f (t, x + h) − f (t, x) dt ≤ |f (t, x + h) − f (t, x)| dt
a a
Z b
ε
≤ dt = ε.
b−a
a
258 7 Integralrechnung für Funktionen einer reellen Variablen
(2) Um die Formel für die partielle Ableitung von F nach der Variablen xi zu beweisen,
betrachten wir die Funktion g : [a, b] × U × (−ε, ε) −→ R mit
(
f (t,x+λei )−f (t,x)
λ falls λ 6= 0,
g(t, x, λ) := ∂f
∂xi (t, x) falls λ = 0.
Da f stetig ist, ist g in allen Punkten (t, x, λ) des Definitionsbereiches mit λ 6= 0 stetig.
Wir zeigen nun die Stetigkeit von g in (t, x, 0). Dazu wenden wir den Mittelwertsatz der
Differentialrechnung auf die Funktion f in der xi -Komponente an. Ist λ 6= 0, so existiert
ein θλ ∈ (0, 1), so dass
∂f
f (t, x + λei ) − f (t, x) = (t, x + θλ · λei ) · λ.
∂xi
Folglich gilt
∂f
g(t, x, λ) = (t, x + θλ · λei ).
∂xi
Sei nun (tk , xk , λk ) eine Folge mit λk 6= 0, die gegen (t, x, 0) konvergiert. Dann konver-
∂f
giert die Folge (tk , xk + θλk · λk ei ) gegen (t, x). Nach Voraussetzung ist ∂x i
stetig. Somit
gilt
∂f ∂f
lim g(tk , xk , λk ) = lim (tk , xk + θλk · λk ei ) = (t, x) = g(t, x, 0).
k→∞ k→∞ ∂xi ∂xi
Folglich ist g auch in (t, x, 0) stetig. Wir wenden nun die Formel (∗) aus (1) auf g an und
erhalten
Zb
∂F F (x + λei ) − F (x) f (t, x + λei ) − f (t, x)
(x) = lim = lim dt
∂xi λ→0 λ λ→0 λ
a
Zb Zb Zb
(∗)
= lim g(t, x, λ) dt = lim g(t, x, λ) dt = g(t, x, 0) dt
λ→0 λ→0
a a a
Zb
∂f
= (t, x) dt.
∂xi
a
∂f ∂F
Da ∂xi auf [a, b] × U stetig ist, ist ∂xi nach (1) auf U stetig. ⊓
⊔
Wir betrachten nun die analoge Situation, wenn zusätzlich die Integralgrenzen von Para-
metern abhängen.
gZ1 (x)
G(x) := f (t, x) dt
g0 (x)
Zb Zy Zb
F (x) := f (t, x) dt, F0 (y, x) := f (t, x) dt, F1 (y, x) := f (t, x) dt.
a a y
Zb
∂F ∂f
(x) = (t, x) dt.
∂xi ∂xi
a
(2) Nach dem Hauptsatz der Differential- und Integralrechnung ist F0 (·, x) für festes x
eine Stammfunktion von f (·, x). Das heißt, es gilt ∂F
∂y (y, x) = f (y, x) für alle (y, x). Nach
0
Zb
∂ ∂g0 ∂f
F1 (g1 (x), x = −f (g1 (x), x)) · (x) + (t, x) dt.
∂xi ∂xi ∂xi
g1 (x)
Wir wollen nun auch Funktionen integrieren, die auf nicht-kompakten Intervallen definiert
sind.
existiert3 .
Ra
Analog definiert man f (t) dt für eine Funktion f : (c, a] −→ R, mit −∞ ≤ c < a.
c
Eine Funktion f : (c, d) −→ E mit −∞ ≤ c < d ≤ +∞ heißt uneigentlich Riemann-
integrierbar, wenn f |[a,b] für jedes kompakte Intervall [a, b] ⊂ (c, d) Riemann-integrierbar
Rd Rx0
ist und die uneigentlichen Riemann-Integrale f (t) dt und f (t) dt für ein x0 ∈ (c, d)
x0 c
existieren. Wir definieren dann
Zd Zx0 Zd
f (t) dt := f (t) dt + f (t) dt.
c c x0
Die Rechenregeln für Riemann-Integrale übertragen sich mit Hilfe der Grenzwertsätze auf
die uneigentlichen Integrale.
Wir zeigen, dass das uneigentliche Integral Γ (x) für jedes x ∈ R+ existiert:
(1) Für t > 0 gilt 0 < tx−1 e−t < tx−1 . Für 0 < α < 1 erhalten wir damit
Z1 Z1
x−1 −t 1 x 1 1 αx 1
0< t e dt < tx−1 dt = t = − < .
x α x x x
α α
R1 1
Da die Funktion g(α) = α tx−1 e−t dt für α → 0 monoton wachsend und durch x be-
schränkt ist, existiert der Grenzwert
3
Auch hier sind mit dem Integralzeichen immer die Riemann-Integrale gemeint.
7.6 Uneigentliche Riemann-Integrale 261
Z1 Z1
x−1 −t
lim t e dt = tx−1 e−t dt.
α→0
α 0
tx+1 1 tx+1
(2) Es gilt tx−1 e−t = et · t2
. Da lim t = 0 , existiert ein M > 0, so dass
t→∞ e
1
tx−1 e−t ≤ ∀ t ≥ M.
t2
Daraus folgt für alle β > M
Zβ Zβ
x−1 −t 1 1 β 1 1 1
t e dt ≤ dt = − = − < .
t2 t M M β M
M M
Rβ 1
Da h(β) = tx−1 e−t dt für β → ∞ monoton wachsend und durch M beschränkt ist,
M
existiert der Grenzwert
Zβ Z∞
x−1 −t
lim t e dt = tx−1 e−t dt.
β→∞
M M
Folglich existiert
Z∞ Z1 ZM Zβ
x−1 −t x−1 −t x−1 −t
t e dt = lim t e dt + t e dt + lim tx−1 e−t dt = Γ (x).
α→0+ β→∞
0 α 1 M
1. Γ (x + 1) = x · Γ (x) ∀ x > 0.
2. Γ (n) = (n − 1)! ∀ n ∈ N.
3. Γ (x · a + (1 − x) · b) ≤ Γ (a)x · Γ (b)1−x für alle a, b ∈ R+ und x ∈ (0, 1)
(d.h. die Funktion ln Γ ist konvex).
n!·nx
4. Γ (x) = lim x(x+1)·...·(x+n) (Gauß-Formel für die Γ –Funktion).
n→∞
√
5. Γ ( 12 ) = π.
Beweis. 1. Für x > 0 und 0 < ε < r folgt mit partieller Integration
Zr Zr Zr r
x −t −t ′ p.I.
t e dt = x
−t (e ) dt = x · tx−1 · e−t dt − tx e−t .
ε
ε ε ε
Induktionsschritt: Die Behauptung gelte für n. Mit 1. folgt dann Γ (n + 1) = nΓ (n) = n!.
3. Wir benutzen die Hölder–Ungleichung für Riemann-Integrale (siehe Übungsaufgaben):
Zr Zr 1 Zr 1
p p q
|f (t)g(t)| dt ≤ |f (t)| · |g(t)|q ,
ε ε ε
1 1 +
wobei p, q > 0 und p + q = 1 gelten. Seien x ∈ (0, 1) und a, b ∈ R . Wir setzen in der
a−1
−t
Hölder-Ungleichung p = x1 und q = 1−x
1
und betrachten die Funktionen f (t) := t p e p
b−1
− qt
und g(t) := t q e . Dann folgt
Zr Zr x Zr 1−x
a
+ qb −1 −t a−1 −t
t p e dt ≤ t e dt tb−1 e−t dt .
ε ε ε
Γ (x · a + (1 − x) · b) ≤ Γ (a)x · Γ (b)1−x .
4. Für x = 1 ist die angegebene Formel offensichtlich erfüllt. Sei nun x ∈ (0, 1). Für alle
natürlichen Zahlen n gilt die Formel n + x = (1 − x)n + x(n + 1). Wir benutzen, dass Γ
logarithmisch konvex ist und erhalten mit 1. und 2.
Des Weiteren gilt für x ∈ (0, 1) und n ∈ N die Formel n + 1 = x(n + x) + (1 − x)(n + 1 + x)
und wir erhalten analog mit 1.
Es folgt
n!(n + x)x−1 ≤ Γ (n + x). (∗∗)
x−1
an (x) n(n + x)x−1 n+x x x−1
lim = lim = lim = lim 1+ = 1.
n→∞ bn (x) n→∞ nx n→∞ n n→∞ n
Daher ist
(n − 1)! · nx
Γ (x) = lim bn (x) = lim
n→∞ n→∞ x(x + 1) · . . . · (x + n − 1)
n! · nx x+n
= lim
n→∞ x(x + 1) · . . . · (x + n) n
| {z }
−→1
n! · nx
= lim .
n→∞ x(x + 1) · . . . · (x + n)
Somit gilt die Gauß-Formel für Γ für x ∈ (0, 1]. Es bleibt zu zeigen, dass sie mit x auch
für x + 1 gilt. Dies folgt mit 1.:
n! nx
Γ (x + 1) = x · Γ (x) = lim ·x
n→∞ x(x + 1) · . . . · (x + n)
n! nx+1 x+1+n
= lim ·
n→∞ (x + 1) · . . . · (x + 1 + n) n }
| {z
−→1
n! nx+1
= lim .
n→∞ (x + 1) · . . . · (x + 1 + n)
5. Wir benutzen die Gauß-Formel für x = 21 und erhalten
√ √
1 n! n n! n
Γ = lim 1 1 = lim .
2 n→∞ ( + 1) · . . . · ( 1 + n) n→∞ (1 − 1 )(2 − 1 ) · . . . · (n − 1 )(n + 1 )
2 2 2 2 2 2 2
Mit der Wallisschen Formel folgt dann
2 Yn
1 n · (n!)2 k2
Γ = lim 1 Q n = 2 · lim
2 n→∞ (n + 1 ) · 1 1
k2 − 1
k=1 (k − 2 )(k + 2 ))
n→∞
2 2 k=1 4
π
= 2 · = π.
2
1 √
Somit gilt Γ ( 2 ) = π. ⊓
⊔
Z∞ √ Z∞
−x2 π 2 √
Beispiel 2: Die Integrale e dx = und e−x dx = π.
2
0 −∞
7.7 Die Länge von Kurven und der Flächeninhalt ebener Gebiete
In diesem Abschnitt werden wir die Integralrechnung benutzen, um Längen von Kurven
sowie Flächeninhalte ebener Gebiet zu bestimmen.
γ(t)
Wir interessieren uns also nicht nur für das Bild der Kurve Γ := γ(I) im Rn , sondern
auch dafür, wie die Kurve durchlaufen wird (z.B. mit welchem Zeitplan). Um die Länge
einer parametrisierten Kurve γ : I −→ Rn zu definieren, benutzen wir die geometrische
Intuition.
Sei P = {x0 < x1 < . . . < xm } eine endli-
che Menge von Teilungspunkten des Intervalls
I. Dann beschreibt
m
X • γ(x2 ) •
L(γ, P) := kγ(xk ) − γ(xk−1 )k γ(x1 ) • γ(b)
k=1
•
γ(a) •
die Länge des durch die Zerlegung P definierten γ(x3 )
Sehnenpolygons durch die Punkte γ(x0 ), γ(x1 ),
. . ., γ(xm ). (Ist I = [a, b], so setzt man x0 = a
und xm = b).
e ≥ P, so folgt aus der Dreiecksungleichung L(γ, P)
Ist P e ≥ L(γ, P).
Bemerkung:
1. Ist γ rektifizierbar und I = I1 ∪ I2 eine Zerlegung von I in zwei Teilintervalle, so gilt
L(γ) = L(γ|I1 ) + L(γ|I2 ).
2. Jede lipschitzstetige Kurve γ : I −→ Rn , die auf einem beschränkten Intervall definiert
ist, ist rektifizierbar, denn aus der Lipschitz-Bedingung kγ(t) − γ(s)k ≤ L(t − s) für
alle s, t ∈ I folgt für die Längen aller einbeschriebenen Sehnenpolygone
m
X m
X
L(γ, P) = kγ (xk ) − γ (xk−1 ) k ≤ L (xk − xk−1 ) ≤ L · Länge(I).
k=1 k=1
7.7 Die Länge von Kurven und der Flächeninhalt ebener Gebiete 265
stetig, schwankt aber bei t → 0 zu oft hin und her und ist deshalb nicht rektifizierbar
(Übungsaufgabe).
0, 5 π
f (x) = x cos x
0, 2 0, 4 0, 6 0, 8 1
−0, 5
−1
4. Das Bild einer stetigen parametrisierten Kurve [0, 1] → R2 kann ein ganzes Quadrat
ausfüllen (Peano-Kurven) (für ein Beispiel siehe K. Königsberger: Analysis I, Kapi-
tel 12, oder H. Sagan: Space-Filling Curves. Solche (pathologischen) Fälle wollen wir
ausschließen. Wir setzen deshalb im Folgenden voraus, dass unsere parametrisierten
Kurven γ : I → Rn nicht nur stetig, sondern differenzierbar sind.
Satz 7.22 Sei γ : [a, b] −→ Rn eine stetig differenzierbare parametrisierte Kurve. Dann
ist γ rektifizierbar und es gilt
Zb
L(γ) = kγ ′ (t)k dt.
a
Beweis. Da γ stetig differenzierbar ist, ist γ auch lipschitzstetig und damit rektifizierbar.
Rb
(1) Wir zeigen zuerst: L(γ) ≤ a kγ ′ (t)k dt:
Sei P = {a = x0 < x1 < . . . < xm = b} eine beliebige Zerlegung von [a, b]. Da γ
differenzierbar ist, gilt
266 7 Integralrechnung für Funktionen einer reellen Variablen
m
X m
Zxk
X
X m Zxk Zb
′
L(γ, P) = kγ(xk ) − γ(xk−1 )k =
γ (t) dt
≤ ′
kγ (t)k dt = kγ ′ (t)k dt
k=1 k=1 x k=1x a
k−1 k−1
(2) Wir zeigen nun, dass in (∗) Gleichheit gilt. Wir betrachten dazu die Hilfsfunktion
ℓ : [a, b] → [0, L(γ)],
ℓ(t) := L γ|[a,t] = sup{L γ|[a,t] , P | P Zerlegung von [a, t]}.
Zt+h
kγ(t + h) − γ(t)k ≤ L γ|[t,t+h] ≤ kγ ′ (s)k ds.
t
Wegen
L γ|[t,t+h] = L γ|[a,t+h] − L γ|[a,t] = ℓ(t + h) − ℓ(t)
folgt dann
wobei F die Stammfunktion von kγ ′ k bezeichnet. Durch Limesbildung lim ergibt sich
h→0+
ℓ(t + h) − ℓ(t)
kγ ′ (t)k ≤ lim ≤ F ′ (t) = kγ ′ (t)k.
h→0+ h
Also gilt
ℓ(t + h) − ℓ(t)
lim = kγ ′ (t)k.
h→0+ h
Auf analoge Weise zeigt man
ℓ(t + h) − ℓ(t)
lim = kγ ′ (t)k.
h→0− h
Also ist ℓ differenzierbar und es gilt ℓ′ (t) = kγ ′ (t)k. Damit erhalten wir
Zb Zb
′
L(γ) = ℓ(b) = ℓ(b) − ℓ(a) = ℓ (t) dt = kγ ′ (t)k dt.
a a ⊓
⊔
7.7 Die Länge von Kurven und der Flächeninhalt ebener Gebiete 267
Bemerkung:
1. Sei I ⊂ R ein nicht-kompaktes Intervall mit den Grenzen a und b, −∞ ≤ a < b ≤ +∞,
und γ : I −→ Rn eine parametrisierte C 1 –Kurve. Dann ist γ genau dann rektifizier-
Rb
bar, wenn das uneigentliche Riemann-Integral kγ ′ (t)k dt existiert. In diesem Fall gilt
a
Rb
wie für kompakte Intervalle L(γ) = kγ ′ (t)k dt. Ist der Grenzwert des uneigentlichen
a
Riemann-Integrals +∞, so sagen wir γ hat unendliche Länge.
2. Sei γ : I ⊂ R → Rn eine stückweise C 1 -Kurve, d.h., γ ist stetig und es existieren
endlich viele Teilungspunkte a = t0 < t1 < t2 < . . . < tm = b des Definitionsbereiches
I, so dass γ|(ti ,ti+1 ) stetig differenzierbar ist. Dann gilt
m
X m Ztk
X
L(γ) = L(γ|(ti ,ti+1 ) ) = kγ ′ (t)k dt.
k=1 k=1t
k−1
Z2π
L(γ) = r dt = 2πr und L(γ|[0,ϕ] ) = ϕ · r.
0
Z2π r Z2π p
2 b2
L(γ) = a sin t + 2 cos2 t dt = a 1 − k 2 cos2 t dt.
a
0 0
Dies ist ein elliptisches Integral, es ist nicht durch elementare Funktionen ausdrückbar.
√
Durch Reihenentwicklung von 1 − x (wie in Kapitel 7.2) erhalten wir
X∞ 1
L(γ) = 2aπ 1 + 2 (−1)j k 2j 1 · 3 · . . . · (2j − 1) .
j 2 · 4 · . . . · (2j)
j=1
Man kann eine Kurve Γ auf verschiedene Weisen (z.B. mit unterschiedlicher Geschwindig-
keit) durchlaufen.
e = b und τ (b)
b) Ist τ ′ (s) < 0, so ist τ monoton fallend, d.h., es gilt τ (a) e = a. Weiterhin
ist |τ ′ (s)| = −τ ′ (s) und es folgt
Za Zb
′
γ) = −
L (e kγ (t)kdt = kγ ′ (t)kdt = L(γ).
b a
Oft wählt man Parametrisierungen, bei denen die Kurve mit konstanter Geschwindigkeit
durchlaufen wird, z.B. mit der Geschwindigkeit 1, d.h. so, dass kγ ′ (t)k = 1. In diesem Fall
stimmt die Länge der Kurve mit der Länge des durchlaufenen Parameterintervalls überein.
Beweis. 1) (=⇒) Sei t0 ∈ I. Wir wählen ein kompaktes Intervall [a, b] ⊂ I mit t0 ∈ [a, b]
und betrachten die Längenfunktion ℓ : [a, b] → [0, L(γ)],
Zt
ℓ(t) := L γ|[a,t] = kγ ′ (s)k ds.
a
Dann gilt nach Voraussetzung ℓ(t) = t − a und somit ℓ′ (t) = 1. Andererseits ist nach dem
Hauptsatz der Differential- und Integralrechnung ℓ′ (t) = kγ ′ (t)k. Daraus folgt kγ ′ (t)k = 1
für alle t ∈ [a, b] und somit für alle t ∈ I.
Rβ
(⇐=) Wenn kγ ′ (t)k = 1 für alle t ∈ I, so gilt L γ[α,β] = kγ ′ (t)k dt = β − α für alle
α
[α, β] ⊂ I, d.h., γ ist auf Bogenlänge parametrisiert.
2) Wir betrachten wieder die Längenfunktion ℓ : I −→ I. e Wenn γ regulär ist, gilt ℓ′ (t) =
kγ ′ (t)k > 0. Folglich ist ℓ stetig differenzierbar und streng monoton wachsend. Deshalb
existiert eine differenzierbare Umkehrfunktion τ : Ie → I von ℓ. Für die Ableitung von τ
gilt dann τ ′ (s) = ℓ′ (τ1(s)) = kγ ′ (τ1(s))k > 0. Für γ
e := γ ◦ τ folgt mit Kettenregel
γ ′ (τ (s))
e′ (s) = γ ′ (τ (s)) · τ ′ (s) =
γ .
kγ ′ (τ (s))k
Also ist ke e
γ ′ (s)k = 1 für alle s ∈ I. ⊓
⊔
Als nächstes befassen wir uns mit dem Flächeninhalt ebener Gebiete.
n=2 Γ = Im γ
Ω
γ(a) = γ(b)
Ω bezeichne das von Γ := Im(γ) umschlossene Gebiet. Wir geben nun eine Formel an,
mit der man den Flächeninhalt von Ω mit Hilfe der Randkurve berechnen kann.
Beweis. 1) Wir betrachten zunächst parametrisierte Kurven γ, bei denen das Bild der Kur-
ve aus zwei zur y-Achse parallelen Geraden und zwei Bögen, die Graphen von Funktionen
f1 und f2 mit 0 < f1 < f2 sind, besteht.
f1 (x) f1 , f2 > 0
Zx2 Za Zt1
′
f1 (x) dx = f1 (x(t)) · x (t) dt = − y(t)x′ (t) dt.
x1 t1 a
Analog ergibt sich mit x = x(t), dx = x′ (t)dt sowie x1 = x(t2 ) und x2 = x(t3 ) für das
zweite Integral in (∗)
Zx2 Zt3
f2 (x) dx = y(t)x′ (t) dt.
x1 t2
KS geeignet legen
Beh.: Man kann Ω in eine endliche Zahl von Gebieten zerlegen, die die Form aus 1) haben.
Wir legen das Koordinatensystem so, dass Γ im positiven Quadranten liegt. Sei E die
y-Achse. Wir betrachten die stetig differenzierbare Abbildung
Da das Intervall [a, b] kompakt ist, hat ̺ nur endlich viele lokale Maxima und Minima. Wir
zeichnen in diesen Punkten, wie im Bild dargestellt, die zu E parallelen Geraden. Dann
zerlegt sich Ω in Gebiete der Form 1).
Wenn x′ (t) 6= 0, so ist x′ > 0 oder x′ < 0. Daher ist x(t) zwischen den kritischen Punkten
von x(t) monoton wachsend oder monoton fallend. Deshalb existiert eine Umkehrfunktion
t = t(x) und die Teilstücke von γ sind Graphen einer Funktion, d.h., γ(t) = (x(t), y(t))
mit y = y(t) = y(t(x)) =: f (x). Nun können wir die Fläche von Ω leicht berechnen:
272 7 Integralrechnung für Funktionen einer reellen Variablen
m
X
Area(Ω) = Area (Ωi )
i=1
wobei wir im letzten Schritt benutzt haben, dass alle Parameterabschnitte [ti , ti+1 ] genau
einmal auftreten. ⊓
⊔
so ist
Zb
1
Area(Ω) = r2 (t)ϕ′ (t) dt.
2
a
Lβ r(ϕ)eiϕ
γ (t2 ) Ω Lα
β γ (t1 )
α
γ(a) = γ(b)
Dann gilt
Zβ
1
Area(Ω) = r2 (ϕ) dϕ.
2
α
Beweis. Wir parametrisieren die Randkurve von Ω durch γ(t) = r(t)eiϕ(t) , t ∈ [a, b],
α, t ∈ [a, t1 ]
ϕ(t) = ϕ(t), t ∈ [t1 , t2 ]
β, t ∈ [t2 , b]
Wir substituieren ϕ = ϕ(t), dϕ = ϕ′ (t)dt. Da ϕ(t) auf [t1 , t2 ] streng monoton wachsend
ist, existiert eine Umkehrfunktion t = t(ϕ). Somit können wir r in Abhängigkeit von ϕ
darstellen, r = r(ϕ), und erhalten insgesamt
Zβ
1
Area(Ω) = r2 (ϕ) dϕ.
2
α ⊓
⊔
Ω
a x
Wir parametrisieren die Ellipse durch die Kurve γ(t) = (a cos t, b sin t) =: (x(t), y(t)) mit
t ∈ [0, 2π]. Dann ist nach Satz 7.25
Z2π Z2π
1 ′ ′
1
Area(Ω) = x(t)y (t) − y(t)x (t) dt = ab · cos2 t + sin2 t dt = πab.
2 2
0 0
r
P
Ω P
Der Weg, den der feste Punkt P während des Rollens zurücklegt, wird Astroide genannt
2 2 2
und ist bestimmt durch die Gleichung x 3 + y 3 = R 3 . Wir können die Astroide parame-
trisieren durch γ(t) = R cos3 t, sin3 t . Dann folgt für den Flächeninhalt des Gebietes Ω,
das durch die Astroide begrenzt wird
274 7 Integralrechnung für Funktionen einer reellen Variablen
Z2π
1
Area(Ω) = R2 cos3 t · 3 sin2 t · cos t + 3 cos2 t · sin t · sin3 t dt
2
0
Z2π
3
= R2 sin2 t cos2 t cos2 t + sin2 t dt
2
0
Z2π Z2π 2
3 2 3 1
= R2 (sin t cos t) dt = R2 sin 2t dt
2 2 2
0 0
Z2π
3
= R2 sin2 2t dt, x := 2t, dx = 2dt
8
0
π
Z4π Z2
3 2 3 2 π 3
= R sin2 x dx = R ·8 sin2 x dx = = πR2 .
16 16 4 8
0 0
gegeben.
π
2c
πc 2πc
Ω
n=3 n=4
r r
Z2π n Znπ Zπ
1 1 2 2 r2 1
Area(Kn ) = r2 2
sin ϕ dϕ = r · 2
sin t dt = · n sin2 t dt = πr2 .
2 2 2 n n 2
0 0 0