10.1007 - 978 3 642 28644 5 PDF

Springer-Lehrbuch
Rupert Lasser Frank Hofmaier
Analysis 1 C 2
Ein Wegweiser zum Studienbeginn

Rupert Lasser Frank Hofmaier
Technische Universität München, Technische Universität München,
Deutschland Deutschland
ISBN 978-3-642-28643-8 ISBN 978-3-642-28644-5 (eBook)

DOI 10.1007/978-3-642-28644-5
Mathematics Subject Classification (2010): 97I10, 97I30, 97I40
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;

detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer Spektrum
© Springer-Verlag Berlin Heidelberg 2012
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht
ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags.
Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und
die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be-
rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der
Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann
benutzt werden dürften.
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier
Springer Spektrum ist eine Marke von Springer DE.

Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media
www.springer-spektrum.de
Vorwort
Das vorliegende Buch beruht auf den Vorlesungen Analysis 1 und Analysis 2 im
Bachelor-Studium der Mathematik an der Technischen Universität München.
Die Analysis ist sicherlich eine der ältesten und anwendungsreichsten Theori-
en und somit ein klassisches Fach der Mathematik. Insofern kann dieses Buch nur
Ergebnisse enthalten, die wohlbekannt und auch in zahlreichen weiteren Büchern
zur Analysis zu finden sind. Unsere Referenzliste enthält nur einen kleinen Teil der
Gesamtheit von Lehrbüchern zu diesem Thema.
Über das gesamte Lehrbuch hinweg legen wir Wert auf die mathematische Präzi-
sion. Durch zahlreiche motivierende Beispiele werden die mathematischen Sach-
verhalte beleuchtet, der Idee folgend Abstraktes mit Konkretem zu verknüpfen.
Das Buch ist in 16 Kapitel unterteilt. Die ersten beiden Abschnitte geben die not-
wendigen Grundlagen zu reellen und komplexen Zahlen. Der zentrale Begriff der
Konvergenz steht im Mittelpunkt der drei folgenden Kapitel. Konvergenz wird nicht
nur im Bereich der reellen oder komplexen Zahlen sondern allgemein in metrischen
Räumen studiert. Es folgen Abschnitte über Stetigkeit, Differentiation und Integra-
tion. Die Kapitel 9 bis 11 befassen sich mit Konvergenz von Funktionsfolgen, insbe-
sondere Taylorreihen und Fourierreihen. Die wichtige Eigenschaft der Kompaktheit
bildet den Inhalt von Kapitel 12. Als vorbereitender Teil werden dann Grundlagen
zu normierten Vektorräumen präsentiert. Differenzierbarkeit im Mehrdimensiona-
len, Umkehrsatz und implizite Funktionen bilden die Basis der mehrdimensionalen
Analysis und sind Inhalt der Kapitel 14 und 15. Im letzten Kapitel werden elemen-
tare Lösungsmethoden von gewöhnlichen Differentialgleichungen vorgestellt.
Das vorliegende Buch umfasst somit die Analysis der ersten beiden Semester
des Bachelor-Studiums Mathematik und gibt an vielen Stellen Einblick in darüber-
hinaus gehende mathematische Sachverhalte. Eine Reihe von Übungsaufgaben am
Ende jedes Kapitels runden das Werk ab.
Garching b. München, Rupert Lasser

Februar 2012 Frank Hofmaier
v
Inhaltsverzeichnis
Einleitende Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.1 Archimedisch angeordnete Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Intervallschachtelung und Vollständigkeit . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Supremumseigenschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1 Konstruktion der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Folgen reller und komplexer Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.1 Folgen und Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Rechnen mit Grenzwerten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3 Asymptotische Gleichheit und rekursiv definierte Folgen . . . . . . . . . 30
3.4 Eine Intervallschachtelung für den Logarithmus . . . . . . . . . . . . . . . . . 32
3.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4 Metrische Räume und Cauchyfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.1 Metrische und normierte Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Cauchyfolgen und Vollständigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3 Skalarprodukt und Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4 Teilfolgen und Häufungswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.1 Konvergenz und absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3 Umordnungssatz und Cauchy-Produkt . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.4 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.5 Exponentialreihe und Eulersche Formel . . . . . . . . . . . . . . . . . . . . . . . . 71
vii
viii Inhaltsverzeichnis
5.6 Die Räume 1 , 2 und  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.7 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.1 Stetige Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.2 Eigenschaften stetiger reellwertiger Funktionen . . . . . . . . . . . . . . . . . 84
6.3 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.4 Stetige Funktionen auf [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7 Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.1 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.2 Mittelwertsatz und lokale Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.3 Ableitung der Umkehrfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8 Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.1 Regelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.2 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 119
8.3 Methoden zur Berechnung von Integralen . . . . . . . . . . . . . . . . . . . . . . 121
8.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9 Funktionenfolgen und gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . 129

9.1 Gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
9.2 Differentiation und Integration von Potenzreihen . . . . . . . . . . . . . . . . 133
9.3 Der Approximationssatz von Weierstraß . . . . . . . . . . . . . . . . . . . . . . . 136
9.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
10 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
10.1 Der Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt . . . . . . . . . . . . . . . 145
10.3 Der Abelsche Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
10.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
11 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
11.1 Trigonometrische Polynome und Fourierkoeffizienten . . . . . . . . . . . . 151
11.2 Konvergenz nach Dirichlet und Fejér . . . . . . . . . . . . . . . . . . . . . . . . . . 154
11.3 Konvergenz im quadratischen Mittel . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
11.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
12 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
12.1 Kompakte metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
12.2 Charakterisierung kompakter Mengen . . . . . . . . . . . . . . . . . . . . . . . . . 171
12.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Inhaltsverzeichnis ix
13 Normierte Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

13.1 Stetige lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
13.2 Kurven in Vektorräumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
13.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
14 Totale Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

14.1 Totale und partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
14.2 Richtungsableitungen und Niveaumengen . . . . . . . . . . . . . . . . . . . . . . 196
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen . . . . . . . . . . . 199
14.4 Ableitungen höherer Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
14.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
15 Umkehrsatz und implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

15.1 Invertierbare lineare Abbildungen und Diffeomorphismen . . . . . . . . . 213
15.2 Lokale Invertierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
15.3 Implizit definierte Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
15.4 Extrema unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
15.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
16 Elementar lösbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 231

16.1 Der Satz von Picard-Lindelöf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
16.2 Differentialgleichungen mit getrennten Variablen . . . . . . . . . . . . . . . . 239
16.3 Lineare Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . 241
16.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
Bezeichnungen und Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

Einleitende Anmerkungen
Wesen
Der Gegenstand der Mathematik ist schwer zu umgrenzen, jedenfalls schwieriger

als der von Physik, Chemie oder Brauwissenschaft etc. Für Mathematik ist nicht ihr
Gegenstand charakterisierend als vielmehr die Art des Schließens. Von Alexander
Markowitsch Ostrowski (1893-1986, Basel) [16] stammt folgendes Zitat:
Jedesmal, wenn man aus einem endlichen, übersichtlich dargestellten System von scharf
”
formulierten Prämissen logisch einwandfreie Schlüsse zieht, treibt man Mathematik.“
Insofern ließe sich als Gegenstand der Mathematik

alles beschreiben, was sich auf endlich viele scharf formulierte Grundtatsachen (Axiome)
”
zurückführen lässt.“
Auf diesem Hintergrund erklären sich zumindest die Wesenszüge, die die Mathe-
matik auszeichnen,
• die Schärfe der Begriffsbildung,
• die pedantische Sorgfalt im Umgang mit Definitionen,
• die Strenge der Beweise,
• die abstrakte Natur der mathematischen Objekte.
Mathematische Symbole
Um der lückenlosen Exaktheit und Klarheit zu genügen, hat sich eine Darstellung
mathematischer Überlegungen entwickelt (math. Symbolik), die für Nichtspezialis-
ten (bzw. nicht präzise und klar formulierende Personenkreise) schwer zugänglich
ist. Hermann Weyl (1885-1955, Princeton) sagt:
Ein auffälliger Zug aller Mathematik, der den Zugang zu ihr dem Laien so sehr erschwert,
”
ist der reichliche Gebrauch von Symbolen.“
1
2 Einleitende Anmerkungen
Der mathematische Formalismus ist kein überflüssiges Glasperlenspiel“. Die kom-

”
plexen Zusammenhänge, die höchsten Grad präziser Beschreibung bedürfen, lassen
sich verbal und romanhaft nicht mehr darstellen. (Ein schönes Beispiel findet man
in der Einleitung im Buch von H.Heuser: Lehrbuch der Analysis [9]).
Wir werden uns weitgehend an übliche Notation und Konventionen halten. Sym-
bole wie z.B. ∀ ( für alle“) oder ∃ ( es existiert...“) und Begriffe wie etwa Menge
” ”
oder Abbildung, die nicht nur in der Analysis sondern in allen Zweigen der Mathe-
matik von grundlegender Bedeutung sind, wollen wir als bekannt voraussetzen. Wir
verweisen hierzu auch auf die Bücher von O. Deiser [3] und H. Koch [12].
Historische Entwicklung
Betrachtet man die Erfolge der großen Mathematiker der Vergangenheit und die
heutigen Anforderungen an die Mathematik, so lassen sich orientiert um die eigent-
liche mathematische Methodik folgende weitere Aufgaben erkennen:
• präzise Abstraktion naturwissenschaftlicher, ingenieurwissenschaftlicher, lebens-
wissenschaftlicher oder ökonomischer Abläufe in klar definierte mathematische
Begriffe (mathematische Modellbildung),
• begleitende höchst-rechnerintensive Untersuchungen (numerische Simulation).
Letzteres ist eine Entwicklung der letzten Jahre, ermöglicht durch die Verfügbar-
keit leistungsfähiger Computer. In diesem Zusammenhang sollten die numerischen
Künste der großen Mathematiker (insbesondere Carl Friedrich Gauß, 1777-1855)
der Vergangenheit besonders erwähnt werden. Da wir uns hier mit Analysis, d.h. im
wesentlichen mit Infinitesimalrechnung befassen, wollen wir noch einen sehr kur-
zen Blick in deren Historie wagen. Die zentralen ersten Entwicklungspunkte wer-
den Newton (Isaac Newton, 1643-1727, London) und Leibniz (Gottfried Wilhelm
Leibniz, 1646-1716, Hannover, Berlin) zugeschrieben. Natürlich findet man bereits
bei Archimedes, Kepler, Cavalieri, Fermat, Pascal, Wallis, Huygens, Toricelli, Des-
cartes Vorläufer analytischer
Methodik. Folgendes scheint klar zu sein: Die beiden
Symbole d“ und “ wurden am 29. Oktober 1675 von Leibniz zum erstenmal ver-
” ”
wendet. Der Blick von Leibniz galt grob gesprochen dem Tangentenproblem und
der Quadratur (Berechnung von Flächeninhalten), symbolisch
dv = v dx .
Newton hingegen entwickelte die Differential- und Integralrechnung innerhalb der

so genannten Fluxionsrechnung. Dabei sind alle Größen zeitabhängig,
x = x(t) .
Die Fluxion“ bezeichnet dann ẋ, die Ableitung nach t.

”
Im Jahr 1699 entstand der Prioritätsstreit zwischen Newton und Leibniz. Dabei
wurde Leibniz vorgeworfen, die Differentialrechnung nicht selbständig erfunden,
sondern von Newton entlehnt zu haben. Bis 1710 wurden Argumente ausgetauscht,
Einleitende Anmerkungen 3
schließlich sprach sich eine eigens eingesetzte Kommission dahingehend aus, dass
Newton der erste Erfinder der Infinitesimalrechnung ist. Leibniz und Newton blie-
ben auch aus politischen Gründen zerstritten. Erst im 19. Jahrhundert setzte sich
durch, dass Leibniz und Newton unabhängig voneinander den Grundstock zur Ana-
lysis gelegt haben.
Seither haben sich Generationen von Mathematikern mit der Analysis beschäftigt,
die wir unmöglich alle hier erwähnen können. Zu den bekanntesten Lehrbüchern
zählen etwa die Werke von J. Dieudonné [4] oder W. Rudin [19]. Als deutsch-
sprachige Bücher auf diesem Gebiet seien unter anderen K. Königsberger [13], [14]
und H. Heuser [9] sowie O. Forster [7], [8] genannt.
Kapitel 1
Die reellen Zahlen
Die Menge IN := {1, 2, . . .} der natürlichen Zahlen wollen wir hier als bekannt vor-
aussetzen, ebenso wie die Menge ZZ := {0, ±1, ±2, . . .} der ganzen Zahlen. Weiter
schreiben wir IN0 := IN ∪ {0} = {0, 1, 2, . . .}. Diese Mengen sind allesamt diskret,
d.h. zwischen zwei aufeinander folgenden natürlichen (oder ganzen) Zahlen liegt
keine weitere natürliche (oder ganze) Zahl.
Eine wichtige Beweismethode, die auf den Grundeigenschaften von IN beruht,
ist das Induktionsprinzip: Ist M eine Menge mit den Eigenschaften
(i) 1 ∈ M (Die Zahl 1 ist ein Element von M),
(ii) n ∈ M ⇒ n + 1 ∈ M (Ist n ∈ M, dann folgt n + 1 ∈ M),
so gilt IN ⊆ M.
Aus dem Induktionsprinzip leitet sich die Beweismethode der vollständigen In-
duktion ab: Jeder natürlichen Zahl n ∈ IN sei eine Aussage A(n) zugeordnet (die
richtig oder falsch sein kann). Gelten
(i) A(1) ist richtig“ (Induktionsanfang),
”
(ii) A(n) ist richtig“ ⇒ A(n + 1) ist richtig“ (Induktionsschritt),
” ”
so gilt A(n) ist richtig“ für alle n ∈ IN.
”
Wir wollen dies hier nicht weiter vertiefen, sondern verweisen auf Lehrbücher
zur diskreten Mathematik, wie etwa Matoušek/Nešetřil [15] oder Taraz [20].
1.1 Archimedisch angeordnete Körper
Die Rechenoperationen (Addition, Multiplikation) führen uns von den natürlichen

und ganzen Zahlen zunächst zur Menge Q der rationalen Zahlen,
m
Q := : m ∈ ZZ, n ∈ IN .
n
R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 5

DOI 10.1007/978-3-642-28644-5_1, © Springer-Verlag Berlin Heidelberg 2012
6 1 Die reellen Zahlen
Die Menge Q genügt der folgenden Definition.
Definition 1.1. Sei K eine Menge (mit mindestens 2 Elementen), auf der zwei Ver-
knüpfungen + ( Addition“) und • ( Multiplikation“) gegeben sind, sodass gilt:
” ”
(K1) Assoziativität der Addition: a + (b + c) = (a + b) + c ∀a, b, c ∈ K.
(K2) Neutrales Element der Addition: Es gibt 0 ∈ K mit der Eigenschaft
0 + a = a + 0 = a ∀a ∈ K.
(K3) Inverses bezüglich Addition: Zu jedem a ∈ K gibt es −a ∈ K, sodass
a + (−a) = 0.
(K4) Kommutativität der Addition: a + b = b + a ∀a, b ∈ K.
(K5) Assoziativität der Multiplikation: a • (b • c) = (a • b) • c ∀a, b, c ∈ K.
(K6) Neutrales Element der Multiplikation: Es gibt 1 ∈ K mit der Eigen-
schaft 1 • a = a • 1 = a ∀a ∈ K.
(K7) Inverses bezüglich Multiplikation: Zu jedem a ∈ K, a = 0, gibt es
a−1 ∈ K, sodass a • a−1 = 1.
(K8) Kommutativität der Multiplikation: a • b = b • a ∀a, b ∈ K.
(K9) Distributivität: a • (b + c) = a • b + a • c ∀a, b, c ∈ K.
Dann heißt K ein kommutativer Körper.
An Stelle von a • b schreibt man auch kurz ab, statt a−1 gelegentlich auch 1a . Weiter
schreibt man a − b für a + (−b) und an := a • a •. . .• a.
n−mal
Folgerungen: Sei K ein kommutativer Körper. Für a, b ∈ K gilt dann

(i) −(−a) = a , (a−1 )−1 = a,
(ii) a • 0 = 0,
(iii) ab = 0 =⇒ a = 0 oder b = 0,
(iv) a(−b) = −(ab) , insbesondere a(−1) = −a,
(v) (−a)(−b) = ab.
Diese Eigenschaften kann man leicht aus den Axiomen (K1)-(K9) folgern. Man
fordert sie also nicht in der Definition, dennoch gelten sie in jedem kommutativen
Körper.
Wenn in obiger Definition alles außer (K8) erfüllt ist, spricht man von einem
(nicht-kommutativen) Körper; in der Algebra werden Körper genauer untersucht.
Wir wollen hier nur festhalten, dass Q mit der gewöhnlichen Addition und Multi-
plikation ein kommutativer Körper ist, IN und ZZ hingegen nicht. Wir werden bald
noch weitere Beispiele für kommutative Körper kennen lernen: die Menge IR der
reellen Zahlen sowie die Menge C der komplexen Zahlen.
Eine weitere Eigenschaft, die Q (und auch IR aber nicht C, wie wir noch sehen
werden) zu eigen ist, ist die Möglichkeit einer Anordnung.
1.1 Archimedisch angeordnete Körper 7
Definition 1.2. Ein kommutativer Körper K heißt angeordneter Körper, falls in

K eine Teilmenge der positiven Elemente (Schreibweise: a > 0 steht für a ist
”
positiv“) ausgezeichnet ist, die die folgenden Eigenschaften besitzt:
(A1) Für jedes a ∈ K gilt genau eine der drei Bedingungen
a > 0 oder a = 0 oder −a > 0.
(A2) Aus a > 0 und b > 0 folgen a + b > 0 sowie ab > 0.
Ein angeordneter Körper heißt archimedisch angeordneter Körper, wenn er zu-
sätzlich die folgende Eigenschaft hat:
(A3) Zu a > 0, b > 0 existiert ein n ∈ IN, sodass
na := a + a + . . .+ a > b gilt. (Archimedisches Axiom)

n−mal
Schreibweisen: Ist −a > 0, so heißt a negativ und man schreibt a < 0.

Ist a − b > 0, so heißt a größer als b und man schreibt a > b.
a ≥ b bezeichnet a > b oder a = b.
a a.
a ≤ b bezeichnet a 0 =⇒ ca < cb
(iv) a > b > 0 =⇒ 1a < 1b
(v) 0 ≤ a 0. (insbesondere 1 = 12 > 0)
In jedem angeordneten Körper gilt die folgende Ungleichung, die nach Jakob Ber-
noulli I (1654-1705, Basel) benannt ist. (Es gab noch einige weitere bekannte Ma-
thematiker namens Bernoulli.)
Satz 1.3 (Bernoulli-Ungleichung). Sei K ein angeordneter Körper. Für jedes x ∈ K

mit x ≥ −1 und alle n ∈ IN gilt
(1 + x)n ≥ 1 + nx . (1.1)
Beweis. Wir beweisen die Ungleichung mittels vollständiger Induktion.

Für n = 1 hat man sogar Gleichheit. Gelte nun (1.1) für ein n ∈ IN. Dann folgt
(iii) (vi)
(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x
und die Ungleichung ist auch für n + 1 erfüllt.

Mit dem archimedischen Axiom folgt:

Satz 1.4. Sei K ein archimedisch angeordneter Körper. Dann gelten:
(a) Ist b > 1, so gibt es zu jedem M > 0 ein n ∈ IN derart, dass bn > M.
(b) Ist 0 < q < 1, so gibt es zu jedem  > 0 ein n ∈ IN derart, dass qn <  .
Beweis. (a) Setze x := b − 1 > 0. Mit Satz 1.3 gilt bn = (x + 1)n ≥ 1 + nx. Mit (A3)
gibt es zu M > 0 ein n ∈ IN, sodass nx > M. Zusammengefasst gilt
bn ≥ 1 + nx > 1 + M > M .
Die Aussage (b) folgt aus (a), indem man b := q−1 und M :=  −1 setzt.

In jedem angeordneten Körper K kann man einen Absolutbetrag einführen. Für
a ∈ K definiert man
a falls a ≥ 0 ,
|a| :=
−a falls a < 0 .
Es gelten folgende Regeln:
(1) |ab| = |a| |b|

(2) |a + b| ≤ |a| + |b| und

|a| − |b|
≤ |a − b| (Dreiecksungleichung)
Beweis. Regel (1) erhält man mit den Folgerungen (iv) und (v) von Definition 1.1.
Wir kommen zum Nachweis von (2). Es gelten ±a ≤ |a|, ±b ≤ |b|, und damit
a + b ≤ |a| + |b| sowie −(a + b) ≤ |a| + |b|. Daraus folgt |a + b| ≤ |a| + |b|.
Die zweite Ungleichung erhält man aus |a| = |a − b + b| ≤ |a − b| + |b| und aus
|b| = |b − a + a| ≤ |b − a| + |a| = |a − b| + |a|; damit gilt ±(|a| − |b|) ≤ |a − b|.

Schreibweisen:
(1) Sind K ein kommutativer Körper und a1 , a2 , . . . , an ∈ K, so schreiben wir
abkürzend
n
 ak := a1 + a2 + . . . + an .
k=1
(2) Wir setzen 0! := 1 sowie (n + 1)! := (n + 1) (n!) für n ∈ IN0 , also 1! = 1,

2! = 2 , 3! = 6 , 4! = 24 usw. (n! spricht man als n Fakultät “).
”
(3) Für n, k ∈ IN0 , n ≥ k, erklären wir die Binomialkoeffizienten

n n!
:= .
k k! (n − k)!
Seien K ein kommutativer Körper, a, b ∈ K und n ∈ IN. Wenn wir (a + b)n

ausrechnen und dann zusammenfassen (vgl. Kapitel 1.4, Aufgabe 5), erhalten
wir die so genannte Binomialformel,
n
n k n−k
(a + b) = 
n
a b .
k=0 k
1.2 Intervallschachtelung und Vollständigkeit 9
1.2 Intervallschachtelung und Vollständigkeit
Die Menge Q der rationalen Zahlen ist uns noch nicht umfassend genug; beispiels-
weise gibt es keine rationale Zahl x derart, dass x2 = 2 gilt. Angenommen, es wäre
x ∈ Q, x2 = 2, so schreibe x = qp als gekürzten Bruch mit p, q ∈ ZZ. Dann gilt
2q2 = p2 . Dann enthält auch p die Zahl 2 als Faktor, d.h. p = 2r mit r ∈ ZZ. Folg-
lich ist 2q2 = p2 = 4r2 und dann q2 = 2r2 . Somit enthält q auch 2 als Faktor – im
Widerspruch dazu, dass qp gekürzt ist.
Mehr dazu findet man u.a. in [3, Kap. 1.1]. Wir wollen nun diese Lücken
”
auffüllen“.
n n+1
Beispiel 1.5. Für n ∈ IN seien an := n+1
n und bn := n+1n .
n+1
Für alle n ∈ IN gilt n > 1, also auch 0 < an < bn . Weiter gilt
2 n+1
an+1 (n + 2)n+1nn n + 1 (n2 + 2n)n+1 n + 1 n + 2n
= = =
an (n + 1)2n+1 n (n + 1)2n+2 n n2 + 2n + 1
n+1
n+1 1 n+1 1
= 1− ≥ 1− =1,
n (n + 1)2 n n+1
wobei wir im vorletzten Schritt die Bernoulli-Ungleichung verwendet haben. Eben-

so erhalten wir
2 n+2 n+2
bn (n + 1)2n+3 n n + 2n + 1 n 1
= = = 1+ 2
bn+1 (n + 2)n+2nn+1 n+1 n2 + 2n n+1 n + 2n

n n+2 n n+1
≥ 1+ 2 = =1.
n+1 n + 2n n+1 n
Damit gilt 0 < an ≤ an+1 < bn+1 ≤ bn für alle n ∈ IN und es folgt schließlich an < bk
für alle n, k ∈ IN.
6
Aus b5 = 65 = 46 656
15 625 < 3 erhalten wir an < 3 und damit

1 an 3
bn − an = an 1 + − an = < für alle n ∈ IN .
n n n
Hier stellt sich nun die Frage, ob es eine Zahl c gibt, sodass an ≤ c ≤ bn für alle
n ∈ IN gilt. In Kapitel 5.7, Aufgabe 8 werden wir zeigen, dass c ∈ / Q ist. Dies war
bereits ein erstes Beispiel für eine Intervallschachtelung; wir werden diesen Begriff
im Folgenden noch allgemein definieren.
In einem angeordneten kommutativen Körper K bezeichnen wir (a, b ∈ K, a ≤ b)

die Mengen
[a, b] := {x ∈ K : a ≤ x ≤ b} [a, b[ := {x ∈ K : a ≤ x < b}

]a, b] := {x ∈ K : a < x ≤ b} ]a, b[ := {x ∈ K : a < x < b}
als Intervalle. Erstere heißen abgeschlossen, letztere offen, die anderen bezeichnen
wir als halboffen. Ist I eines dieser Intervalle, so bezeichnet |I| := b − a die Länge
von I.
Definition 1.6. Sei K ein archimedisch angeordneter kommutativer Körper. Ei-

ne Intervallschachtelung ist eine Folge (In )n∈IN von abgeschlossenen Intervallen
In = [an , bn ] mit
(i) In+1 ⊆ In für alle n ∈ IN
(d.h. a1 ≤ . . . ≤ an ≤ an+1 ≤ . . . ≤ bn+1 ≤ bn ≤ . . . ≤ b1 ).
(ii) Zu jedem  > 0 existiert ein n ∈ IN mit |In | = bn − an <  .
Der Körper K heißt vollständig, falls zu jeder Intervallschachtelung (In )n∈IN genau
ein x ∈ K existiert mit x ∈ In für alle n ∈ IN.
Es gibt weitere äquivalente Charakterisierungen der Vollständigkeit, siehe Kapi-

tel 4.2 und auch [3]. Obige geht auf Karl Weierstraß (1815-1897, Berlin) zurück.
Die Menge IR der reellen Zahlen ist ein vollständiger archimedisch angeordneter
Körper. Wir werden uns künftig, wenn Aussagen über IR hergeleitet werden, letzt-
endlich nur auf die genannten Gesetze (Axiome) stützen. Diese Eigenschaften, d.h.
(K1),...,(K9), (A1), (A2), (A3) und die Vollständigkeit legen IR fest.
Der Körper Q ist nicht vollständig. Wir werden gleich feststellen, daß in IR stets
Wurzeln existieren, in Q nicht. Auch die im folgenden Beispiel konstruierte Zahl e
ist nicht rational (siehe auch Kapitel 5.7, Aufgabe 8).
n n+1
Beispiel 1.7 (Eulersche Zahl). Seien an := n+1 n , bn := n+1
n , In := [an , bn ],
so ist (In )n∈IN eine Intervallschachtelung, siehe Beispiel 1.5. Man bezeichnet

In = {e} .
n∈IN
Eine Näherung (im Dezimalsystem) für e ist
e ≈ 2.71828182845904523536...
Satz 1.8 (Existenz von Wurzeln). Zu jedem x ∈ IR, √x > 0, und k ∈ IN existiert genau
eine reelle Zahl y > 0 mit yk = x. Man schreibt y = k x oder y = x1/k .
Beweis. Sei zunächst x ≥ 1. Wir konstruieren eine Intervallschachtelung In = [an , bn ]

mit n−1
akn ≤ x ≤ bkn und |In | = 12 |I1 | für n ∈ IN . (1.2)
Dazu starten wir mit a1 := 1, b1 := x + 1, also
I1 = [a1 , b1 ] = [1, x + 1] .
Wegen x ≥ 1 gilt bk1 = (x + 1)k ≥ xk ≥ x ≥ 1k = ak1 , also ist (1.2) für n = 1 erfüllt.
1.2 Intervallschachtelung und Vollständigkeit 11
Ist In = [an , bn ] mit (1.2) gegeben, so sei m := 12 (an + bn ) = an + 12 (bn − an). Wir
setzen
[an , m] , falls mk ≥ x ,
In+1 = [an+1 , bn+1 ] :=
[m, bn ] , falls mk < x .
x
an m bn akn mk bkn
an+1 bn+1
Mit dieser Konstruktion ist (1.2) auch für In+1 erfüllt. Es ist In+1 ⊆ In ; ferner gibt es
n−1 
mit Satz 1.4 zu jedem  > 0 ein n ∈ IN mit 12 < x , also |In | <  .

Da IR vollständig ist, existiert y ∈ IR mit In = {y}.
n∈IN
Wir zeigen nun yk = x. Dazu beachte man, dass Ink := [akn , bkn ] ebenfalls eine Inter-
k
vallschachtelung ist. Es gilt In+1 ⊆ Ink , da In+1 ⊆ In , und
|Ink | = bkn − akn = (bn − an)(bk−1

n + bk−2 k−1 k−1
n an + . . . + an ) ≤ |In | k b1 .

Ist nun  > 0, so existiert ein n ∈ IN mit |In | < , also |Ink | <  .
kbk−1
1
Für alle n ∈ IN folgt x ∈ Ink mit (1.2) und wegen y ∈ In gilt yk ∈ Ink . Es gibt genau
k
ein Element in In und damit ist yk = x.
n∈IN
Zum Beweis der Eindeutigkeit nehmen wir an, es sei x = yk = zk mit y, z > 0. Aus
y < z folgt x = yk < zk = x, ein Widerspruch (ebenso bei y > z). Also gilt hier y = z.
Schließlich bleibt der Fall 0 < x < 1. k
1
Für x gibt es wie eben gezeigt ein y > 0 mit yk = 1x , also x = 1
yk
=
. 1
y

√
In Q kann man nicht Wurzeln jeder Zahl ziehen. Wie schon erwähnt ist 2 nicht
rational. Zur Bestimmung von Quadratwurzeln mittels Intervallschachtelung siehe
auch Kapitel 1.4, Aufgabe 8.
Zum Schluss dieses Abschnitts zeigen wir ein einfaches Lemma, das uns später
noch von Nutzen sein wird.
√ √ √
Lemma 1.9. Für 0 ≤ b < c und k ∈ IN gilt 0 < k c − k b ≤ k c − b.
√ √
Beweis. Aus k c ≤ k b folgt c ≤ b unmittelbar√aus den √ Anordnungsaxiomen, im
Widerspruch zur Voraussetzung. Also muss 0 < k c − k b sein.
√ √ √
Angenommen, es gilt k c − k b > k c − b, so folgt
√ √
k
√ √
k
√
k
√ √
c = ( k c)k > ( b + k c − b)k = ( b)k + k · ( b)k−1 · k c − b + · · · + ( k c − b)k
≥ b + (c − b) = c
(alle Summanden sind nicht-negativ). Dies ist ein Widerspruch; damit ist die rechte
Ungleichung ebenfalls bewiesen.

1.3 Supremumseigenschaft
Ist A ⊆ IR eine beliebige Menge reeller Zahlen, so heißt b ∈ IR eine obere Schranke
(bzw. untere Schranke) von A, falls a ≤ b (bzw. a ≥ b) für alle a ∈ A gilt. Besitzt
A eine obere Schranke, so heißt A nach oben beschränkt. Entsprechend definiert
man nach unten beschränkt. Gilt beides, so nennt man A beschränkt.
Liegt eine obere (bzw. untere) Schranke b von A sogar in A selbst, so heißt
diese Maximum (bzw. Minimum) von A; wir schreiben dann b = max A (bzw.
b = min A). Beachte, dass max A und min A wegen (A1) eindeutig bestimmt sind,
wenn sie existieren.
Definition 1.10. Eine Zahl s ∈ IR heißt Supremum einer Menge A ⊆ IR, falls gilt:
(i) s ist obere Schranke von A und
(ii) für jede obere Schranke t von A ist t ≥ s.
Das heißt, s ist die kleinste obere Schranke von A. Man schreibt s = sup A.
Entsprechend definiert man s als das Infimum von A ⊆ IR, falls gilt:
(i) s ist untere Schranke von A und
(ii) für jede untere Schranke t von A ist t ≤ s.
Das heißt, s ist die größte untere Schranke von A. Man schreibt s = inf A.
Bemerkung: Sei etwa A = [a, b] mit a, b ∈ IR, a < b, so ist b = max A = sup A. Das
Intervall Ã = [a, b[ hingegen besitzt ein Supremum b = sup Ã, aber kein Maximum.
Auch Supremum und Infimum brauchen nicht immer zu existieren. Beispiels-
weise besitzen die nach oben unbeschränkten Intervalle [a, [= {x ∈ IR : x ≥ a}
kein Supremum. Zur Frage der Existenz sei auf den nachfolgenden Satz verwiesen.
Existiert sup A (oder infA), so ist es eindeutig bestimmt: Sind s und s̃ zwei Suprema
von A, so muss s ≤ s̃ und s̃ ≤ s gelten, also s = s̃.
Satz 1.11 (Supremumseigenschaft). Jede nach oben (bzw. nach unten) beschränk-
te nicht-leere Menge A ⊆ IR besitzt ein Supremum (bzw. Infimum).
Beweis. Wir studieren hier nur den Fall, dass A nach oben beschränkt ist. Dazu
konstruieren wir eine Intervallschachtelung (In )n∈IN , In = [an , bn ], mit den Eigen-
schaften
n−1
(i) bn+1 − an+1 = 12 (bn − an) (daraus folgt |In | = 12 |I1 | für alle n),
(ii) bn ist obere Schranke von A,
(iii) an ist keine obere Schranke von A.
Wir beginnen mit I1 = [a1 , b1 ], wobei b1 eine beliebige obere Schranke von A und
a1 ∈ IR keine obere Schranke ist. Sind I1 , . . . , In bereits gefunden, sodass (i), (ii) und
(iii) gelten, dann sei mn := 12 (an + bn). Offensichtlich ist an ≤ mn ≤ bn . Nun setze

[an , mn ] , falls mn obere Schranke von A ist,
In+1 = [an+1 , bn+1 ] :=
[mn , bn ] , falls mn keine obere Schranke von A ist.
1.3 Supremumseigenschaft 13
Damit gilt In+1 ⊆ In und bn+1 − an+1 = 12 (bn − an ). Ferner ist bn+1 eine obere
Schranke von A und an+1 ist keine obere Schranke von A.
n−1 
Ist nun  > 0, so existiert laut Satz 1.4 ein n ∈ IN mit 12 < b1 −a 1
. Folglich gilt
|In | <  ; damit ist (In )n∈IN eine Intervallschachtelung.
Wegen der Vollständigkeit gibt es eine Zahl s ∈ IR mit

{s} = In .
n∈IN
Wir zeigen s = sup A. Dazu ist nachzuweisen:

(a) s ist eine obere Schranke von A und
(b) s ist kleinste obere Schranke von A.
Zu (a): Angenommen, es gibt x ∈ A mit s < x. Dann existiert zu  := x − s ein n ∈ IN
mit bn − an <  = x − s. Wegen s ∈ [an , bn ] gilt bn − s ≤ bn − an < x − s und damit
bn < x im Widerspruch dazu, dass bn obere Schranke von A ist.
Zu (b): Angenommen, es gibt eine obere Schranke s̃ von A mit s̃ < s. Dann existiert
zu  := s − s̃ ein n ∈ IN mit bn − an <  = s − s̃. Weiter folgt wegen s ∈ [an , bn ] nun
s − an ≤ bn − an < s − s̃, also an > s̃. Damit gilt aber an > s̃ ≥ x für alle x ∈ A, d.h. an
ist obere Schranke von A, ein Widerspruch.
Damit ist s = sup A gezeigt.

Man kann zeigen, dass ein archimedisch angeordneter Körper, der die Supremums-
eigenschaft erfüllt, stets vollständig ist. Daher kann man die Vollständigkeit auch
mittels Supremumseigenschaft definieren (das wird auch gelegentlich so gemacht).
Eine weitere Charakterisierung der Vollständigkeit erfolgt über so genannte Cauchy-
folgen, siehe Kapitel 4.2.
Lemma 1.12. Seien A, B nicht-leere nach oben beschränkte Teilmengen von IR.
(a) Ist A ⊆ B, so gilt sup A ≤ sup B.
(b) Bezeichnen A + B := {a + b : a ∈ A, b ∈ B}, rA := {ra : a ∈ A} für r ∈ IR und
A · B := {ab : a ∈ A, b ∈ B}, so hat man
sup(A + B) = sup A + supB ,

sup(rA) = r sup A , falls r ≥ 0 ,
sup(A · B) = sup A sup B , falls A, B ⊆ [0, [ .
Entsprechende Aussagen gelten für das Infimum, falls A und B nach unten be-
schränkt sind.
Beweis. Seien  := sup A,  := sup B.

(a) Es ist  eine obere Schranke von A, denn aus  ≥ x ∀x ∈ B folgt  ≥ x ∀x ∈ A.
Da  die kleinste obere Schranke von A und  eine obere Schranke von A ist, folgt
 ≤ .
(b) Aus a ≤  ∀a ∈ A und b ≤  ∀b ∈ B folgt a + b ≤  +  ∀a ∈ A, b ∈ B, also

sup(A + B) ≤  +  . Mit der Definition des Supremums als kleinste obere Schranke
existieren zu jedem  > 0 ein a0 ∈ A und ein b0 ∈ B mit a0 >  − 2 und b0 >  − 2 .
Damit ist a0 + b0 > ( +  ) −  . Da  > 0 beliebig klein gewählt werden darf, ist
 +  die kleinste obere Schranke von A + B.
Aus  ≥ x ∀x ∈ A folgt r ≥ rx ∀x ∈ A und weiter r ≥ y ∀y ∈ rA. Also ist r
eine obere Schranke von rA. Sei nun a < r . Dann ist ar <  , d.h. ar ist keine obere
Schranke von A; folglich gibt es ein x ∈ A mit ar < x. Damit ist rx ∈ rA und a < rx;
also ist a keine obere Schranke von rA. Damit folgt: r ist kleinste obere Schranke
von rA.
Im Fall A, B ⊆ [0, [ gilt  ,  ≥ 0. Für  = 0 oder  = 0 gilt A · B = {0} und
die Behauptung ist offensichtlich wahr. Wir können also  ,  > 0 annehmen. Aus
x ≤  ∀x ∈ A und y ≤  ∀y ∈ B folgt dann xy ≤  ∀x ∈ A, y ∈ B. Also ist 
eine obere Schranke von A · B. Wir nehmen nun an, dass  nicht die kleinste obere
Schranke von A · B ist. Dann gibt es ein c ∈ IR mit c <  und c ≥ x ∀x ∈ A · B. Wir
setzen  :=  −c
 + . Es gilt  > 0 und nach Definition des Supremums gibt es a ∈ A
mit a >  −  sowie b ∈ B mit b >  −  . Daraus folgt
ab > ( −  )( −  ) =  −  ( +  ) +  2 ≥  −  ( +  ) = c
im Widerspruch dazu, dass c obere Schranke von A · B ist. Damit ist  tatsächlich
die kleinste obere Schranke von A · B.
Die entsprechenden Aussagen für das Infimum zeigt man ganz analog.

Wir schließen diesen Abschnitt mit einigen Resultaten zur Lage von IN, ZZ und
Q innerhalb IR. Vorweg zeigen wir ein Resultat über IN, das auf den ersten Blick
selbstverständlich erscheint. Man bedenke aber, dass wir IR abstrakt nur als einen
vollständigen archimedisch angeordneten Körper erklärt haben; Begriffe wie Supre-
mum oder Maximum haben wir definiert völlig unabhängig davon, ob oder wie wir
IN in IR wiederfinden.
Satz 1.13. Sei A ⊆ IN ⊆ IR eine nicht-leere Menge natürlicher Zahlen. Es gilt:

(a) A besitzt ein Minimum.
(b) Ist A beschränkt, so hat A ein Maximum.
Beweis. (a) Sei U := {n ∈ IN : n ist untere Schranke von A}. Dann gilt offensicht-
lich 1 ∈ U. Außerdem ist U eine echte Teilmenge von IN, denn ist k ∈ A, so ist
k+1 ∈ / U. Mit dem Induktionsprinzip finden wir ein n0 ∈ U mit n0 + 1 ∈/ U, sonst
wäre U = IN.
Wir zeigen n0 = min A. Es gilt n0 ≤ n ∀n ∈ A. Zu zeigen bleibt n0 ∈ A. Wäre
n0 ∈
/ A, so wäre n0 < m ∀m ∈ A und damit m − n0 ≥ 1. Das heißt m ≥ n0 + 1 ∀m ∈ A,
woraus n0 + 1 ∈ U folgt – im Widerspruch zu oben.
(b) Sei s := sup A. Nach (A3) existiert ein n1 ∈ IN mit s < n1 . Damit gilt k ≤ s < n1
für alle k ∈ A, also n1 − k ∈ IN ∀k ∈ A. Laut (a) existiert m := min{n1 − k : k ∈ A}.
Dann ist n1 − m = max A.

1.4 Aufgaben 15
Satz 1.14. (a) Zu jedem x ∈ IR existiert genau ein k ∈ ZZ mit k ≤ x < k + 1.

(b) Zu je zwei reellen Zahlen a, b mit a < b gibt es eine Zahl r ∈ Q mit a < r < b.
Die Zahl k gemäß Aussage (a) wird mit [x] bezeichnet. Demnach ist [x] die größte
ganze Zahl, die kleiner oder gleich x ist. Man nennt [ ] auch Gaußklammer.
Beweis. (a) Nach (A3) existiert ein n ∈ IN mit 1 − x < n, also 1 < n + x. Laut
Satz 1.13 existiert eine größte Zahl m ∈ IN mit m ≤ n + x. Damit ist k := m − n
die größte ganze Zahl, die kleiner oder gleich x ist.
(b) Wähle n ∈ IN mit 1n na 1 1+an 1+k
n = a und b > n + a = n ≥ n = r.

1.4 Aufgaben
1. Beweisen Sie die im Anschluss an Definition 1.1 angegebenen Folgerungen.

Geben Sie in jedem Schritt an, welches Axiom Sie dabei benützen.
a
2. a. Seien a, b, c, d positive reelle Zahlen mit b < dc .
a a+c c
Folgern Sie aus den Axiomen: Es gilt stets b < b+d < d.
b. Gibt es positive reelle Zahlen a, b, c, d derart, dass ab + c a+c
d = b+d gilt?
3. Beweisen Sie die nach Definition 1.2 genannten Folgerungen.
4. Zeigen Sie, dass IF2 := {⊥, } mit den durch
⊥ + ⊥ := ⊥ , ⊥ + := , + ⊥ := , + := ⊥ ,
⊥ • ⊥ := ⊥ , ⊥ • := ⊥ , • ⊥ := ⊥ , • := ,
erklärten Operationen ein kommutativer Körper ist.
5. Seien K ein kommutativer Körper, a, b ∈ K und n ∈ IN.

Weisen Sie die Binomialformel
n
n k n−k
(a + b) = 
n
a b
k=0 k
mittels vollständiger Induktion nach.
6. Zeigen Sie: Zu jedem  > 0 gibt es ein N ∈ IN mit

1
√ < für alle n ≥ N .
n
7. Besitzen die folgenden Mengen ein Minimum, Maximum, Infimum, Supre-

mum ?
M1 := {x ∈ IR : x2 > 7}

n 1 1 1
M2 := (−1) 1 − : n ∈ IN M3 := + : m, n ∈ IN
n n m
Bestimmen Sie diese gegebenenfalls.
8. Arithmetrisches, Geometrisches und Harmonisches Mittel;

eine Intervallschachtelung für die Quadratwurzel.
Seien a, b positive reelle Zahlen. Wir setzen
a+b √ 1 2ab
A(a, b) := , G(a, b) := ab , H(a, b) := = .
2 A( 1a , 1b ) a+b
a. Zeigen Sie: Es gilt min{a, b} ≤ H(a, b) ≤ G(a, b) ≤ A(a, b) ≤ max{a, b},

wobei Gleichheit nur im Fall a = b auftritt.
Nun sei 0 < a < b. Wir setzen a1 := a, b1 := b und
an+1 := H(an , bn ) , bn+1 := A(an , bn ) für n ∈ IN .
b. Zeigen Sie: Für alle n ∈ IN gilt an < bn .

c. Zeigen√Sie: Die Intervalle In := [an , bn ] bilden eine Intervallschachtelung;
es gilt ab ∈ In ∀n ∈ IN.
1
d. Zeigen Sie: Für alle n ∈ IN gilt bn+1 − an+1 ≤ 4a (bn − an)2 .
√
√

1
e. Berechnen Sie eine Näherung c für 2 mit
c − 2
≤ 10000 .
9. Seien x ∈ IR \ Q und r ∈ Q. Zeigen Sie:

a. Es gilt x + r ∈ IR \ Q.
b. Im Fall r = 0 gilt auch rx ∈ IR \ Q.
Kapitel 2
Die komplexen Zahlen
In IR können wir zwar aus jeder positiven Zahl die Wurzel ziehen, aber es gibt
z.B. keine reelle Zahl x mit x2 = −1. Wir wollen nun einen kommutativen Körper
C, die Menge der komplexen Zahlen, konstruieren, in dem es eine Zahl i gibt mit
i2 = −1 und der die reellen Zahlen enthält. Dabei müssen wir allerdings auf die
archimedische Anordnung verzichten.
2.1 Konstruktion der komplexen Zahlen
Wir definieren die Menge der komplexen Zahlen als Menge von Paaren reeller
Zahlen, C := IR × IR = {(x, y) : x, y ∈ IR}. Eine komplexe Zahl z = (x, y) schreiben
wir auch in der Form
z = x + iy .
Dabei entspricht i = 0 + 1 i = (0, 1). Ferner heißen Re z := x der Realteil von z und
Im z := y der Imaginärteil von z. Wir fassen IR künftig als Teilmenge von C auf:
IR = {x + 0i : x ∈ IR} = {z ∈ C : Im z = 0} ⊂ C. Die Menge C ist mit
(x + iy) + (u + iv) := (x + u) + i(y + v) als Addition

und (x + iy)(u + iv) := (xu − yv) + i(xv + yu) als Multiplikation
ein kommutativer Körper; man kann leicht nachprüfen, dass (K1),. . . ,(K9) hier
erfüllt sind. Die imaginäre Einheit i ist dabei besonders ausgezeichnet. Es gilt
i2 = −1. Insbesondere gibt es keine Anordnung auf C, die (A1) und (A2) erfüllt,
denn dann müsste i2 > 0 gelten!
Für z ∈ C \ IR sind daher Aussagen wie z > 0 “ nicht sinnvoll. Man kann aber
”
einen Absolutbetrag in C einführen. Für z = x + iy ∈ C setzt man

|z| := x2 + y2 .
√
Dies ist im Fall x2 + y2 > 0 laut Satz 1.8 wohldefiniert; sonst setze 0 := 0.

18 2 Die komplexen Zahlen
Grafisch stellt man C üblicherweise i IR

als Ebene dar. Im kartesischen (x, y)-
Koordinatensystem ist |z| dann der Ab- i
z = (x, y) = x + iy
stand des Punktes z vom Nullpunkt. iy
|z|
Für z = x + iy nennt man z := x − iy die 0
zu z konjugiert komplexe Zahl. x IR
1
Es gelten die folgenden Rechenregeln,
−iy
die man leicht herleiten kann. z
Satz 2.1. Seien z, w ∈ C. Dann gelten:

(1) z + w = z + w , zw = z w
(2) z=z
(3) Re z = 12 (z + z) , Im z = 2i1 (z − z)
(4) |Re z| ≤ |z| , |Im z| ≤ |z|
(5) |z| ≤ |Re z| + |Im z|
√
(6) |z| = z z
(7) |z| = |z| = | − z|
(8) |zw| = |z| |w|
(9) Stets ist |z| ≥ 0 ; |z| = 0 ist äquivalent zu z = 0.
Gesondert wollen wir die Dreiecksungleichung aufführen.

Satz 2.2. Seien z, w ∈ C. Es gelten
(a) |z + w| ≤ |z| + |w| ,
(b) | |z| − |w| | ≤ |z − w| .
Beweis. Es ist
|z + w|2 = (z + w) (z + w) = z z + z w + z, w + w w
= |z|2 + 2Re (z w) + |w|2 ≤ |z|2 + 2 |Re (z w)| + |w|2
≤ |z|2 + 2 |z w| + |w|2 = (|z| + |w|)2 .
Daraus folgt (a). Die Aussage (b) zeigt man nun wie im Reellen.

Zur Veranschaulichung sei erwähnt, dass für a ∈ C und r > 0 durch
Ur (a) := {z ∈ C : |z − a| < r} und

Kr (a) := {z ∈ C : |z − a| ≤ r}
eine offene (bzw. abgeschlossene) Kreisscheibe um a mit Radius r bestimmt ist.

(Die Begriffe offen und abgeschlossen werden wir in Kapitel 12 noch allgemein
definieren.)
2.1 Konstruktion der komplexen Zahlen 19
Beispiel: Für festes w ∈ C umfasst die Menge

{z ∈ C : |z − w| = 2} genau diejenigen kom-
plexen Zahlen, die von w den Abstand 2 ha-
ben. Es handelt sich also um einen Kreis mit
Mittelpunkt w und Radius 2. √
i 2(1 + i)
Die Abbildung
√ √ w=1
rechts zeigt diese für
und w = 2(1 + i). Im Fall w = 2(1 + i) 0
liegt der Nullpunkt auf diesem Kreis, denn für 1
z = 0 gilt hier

√ 2 √ 2
|z − w| = |w| = 2 + 2 =2.
Wir nennen eine Teilmenge A ⊆ C beschränkt, falls es ein M ≥ 0 gibt, sodass

|z| ≤ M für alle z ∈ A gilt. Beachte aber, dass man Begriffe wie Supremum und
Maximum für Teilmengen von C nicht einführen kann.
Die folgende wichtige algebraische Eigenschaft des Körpers C sollte nicht un-
erwähnt bleiben.
Satz 2.3 (Fundamentalsatz der Algebra). Seien a0 , . . . , an−1 ∈ C. Die Gleichung
zn + an−1zn−1 + . . . + a1z + a0 = 0
hat in C mindestens eine Lösung.
Bemerkung: Im Reellen stimmt diese Aussage nicht, z.B. gibt es keine reelle Zahl
x, die die Gleichung x2 + 1 = 0 erfüllt.
Der Fundamentalsatz der Algebra wurde erstmals von Carl Friedrich Gauß be-
wiesen, inzwischen ist eine Vielzahl ganz unterschiedlicher Beweise bekannt. Mit
den uns bis hier zur Verfügung stehenden Mitteln können wir diesen Satz allerdings
noch nicht beweisen; wir werden dieses Resultat für unsere Zwecke auch nicht wei-
ter benötigen. Mit Mitteln der Funktionentheorie kann man den Fundamentalsatz
der Algebra recht leicht zeigen, bei Remmert/Schumacher [17] etwa findet man vier
verschiedene Beweise. Für weitere Beweise dieses Satzes, die nur auf Resultaten
der Analysis basieren, sei u.a. auf Königsberger [13] oder Beals [2] verwiesen. Für
einen rein algebraischen Beweis siehe z.B. Karpfinger/Meyberg [11].
Beispiel: Die dritten Einheitswurzeln.

Wir wollen alle komplexen Zahlen bestimmen, die die Gleichung
z3 = 1
erfüllen. Wie üblich schreiben wir z = x + iy. Dann ist
(x + iy)3 = x3 + 3x2 iy + 3x(iy)2 + (iy)3 = x3 − 3xy2 + i(3x2 y − y3) .

20 2 Die komplexen Zahlen
Es gilt also z3 = 1 + 0i genau dann, wenn
x3 − 3xy2 = 1 und 3x2 y − y3 = 0 (2.1)
erfüllt ist. √
Für y = 0 lautet die zweite Gleichung 3x2 = y2 ; es folgt y = ± 3 x. Setzen√wir
dies in die erste Gleichung ein, ergibt sich −8x3 = 1, also x = − 12 und y = ± 12 3.
Für y = 0 ist die zweite Gleichung in (2.1) erfüllt und die erste Gleichung liefert
x3 = 1, also x = 1.
Die Gleichungen (2.1) sind daher genau dann erfüllt, wenn x und y einer der
Bedingungen
1 1√
(1) x=− , y= 3,
2 2
1 1√
(2) x=− , y=− 3,
2 2
(3) x = 1, y=0,
genügen.
√
Insgesamt haben wir also drei z1 = − 12 + 12 3 i
Lösungen von z3 = 1 gefunden.
Es gilt |z1 | = |z2 | = |z3 | = 1 und z3 = 1
z1 + z2 + z3 = 0. Diese Punkte
bilden die Ecken eines gleich-
seitigen Dreiecks, siehe auch
Aufgabe 5. √
z2 = − 12 − 12 3 i
2.2 Aufgaben
1. Stellen Sie die folgenden komplexen Zahlen in der Form x + iy dar:

a. 2i + 2i1
1+3i
b. 1−2i
c. (1 + i)43
2. Skizzieren Sie die folgenden Punktmengen in C:

a. {z ∈ C : |z| = c} für c = 12 , c = 1 und c = 2
b. {z ∈ C : Re z > 0}

c. z ∈ C : z = 1z
2.2 Aufgaben 21
3. Geben Sie für

a. z = i ,
b. z = 1 + i ,
c. z = 2 − 3i ,
d. z = − √12 − √12 i ,
jeweils z2 , i z und 1z in der Form x + iy an und skizzieren Sie alle diese Punkte
in der komplexen Ebene.
4. Gegeben Sei eine komplexe Zahl w. Bestimmen Sie alle z ∈ C mit z2 = w.
5. Es seien z1 , z2 , z3 ∈ C mit z1 + z2 + z3 = 0 und |z1 | = |z2 | = |z3 | = c > 0. Zeigen

Sie: z1 , z2 , z3 sind die Eckpunkte eines gleichseitigen Dreiecks.
Tipp: Schreiben Sie die Ausdrücke |z1 − z2 |2 + |z2 − z3 |2 , |z2 − z3 |2 + |z3 − z1 |2
und |z3 − z1 |2 + |z1 − z2 |2 mit Hilfe von |z|2 = z z als Summe und benutzen Sie
die Voraussetzungen um zu folgern, dass |z1 − z2 | = |z2 − z3 | = |z3 − z1 | gilt.
6. Zeigen Sie: Für alle z, w ∈ C gilt

|z + w|2 + |z − w|2 = 2 |z|2 + |w|2 .
Interpretieren Sie diese Gleichung geometrisch.
7. Für z, w ∈ C sei
z ≺ w : ⇐⇒ Re z < Re w oder
Re z = Re w und Im z < Im w .
Zeigen Sie: ≺ erfüllt (A1). Insbesondere gilt für beliebige z, w ∈ C genau eine
der drei Bedingungen z ≺ w, z = w oder w ≺ z.
Zeigen Sie weiter, dass (A2) hier nicht gilt.
Kapitel 3
Folgen reller und komplexer Zahlen
Wir haben in Kapitel 1 gesehen, dass man mit Folgen von Intervallen
reelle
n Zahlen
definiert. Dort haben wir schon beobachten können, dass an = 1 + 1n der Euler-
Zahl e mit wachsendem n immer näher kommt.
Auf Fourier (Jean-Baptiste Joseph Fourier, 1768-1830, Paris) geht etwa die nähe-
rungsweise Bestimmung von 4 durch Folgen sn , die sich als Summen schreiben,
zurück:
1 1 1 1
sn = 1 − + − + . . . ± (−1)n ,
3 5 7 2n + 1
siehe auch Kapitel 11.2, Beispiel (1).
Was passiert, wenn man Summen
1 1 1
rn = 1 + + + ... +
2 3 n
betrachtet, nähern sie sich einer Zahl an (und was genau ist darunter überhaupt zu
verstehen?); wenn ja, welcher? Darüber hinaus stellen sich Fragen nach möglichst
schneller Näherung an bestimmte Zahlen, z.B. e oder  .
Obige Annäherung an 4 ist sehr langsam. Beispielsweise wird heutzutage
√
8 n (4k)! 1103 + 26390k 1
sn = 
9801 k=0 (k!)4 396 4k
−→

zur Berechnung von etwa 2 Milliarden Stellen von  benutzt. Letzteres stammt von
Srinivasa Ramanujan (1887-1920, Madras, Cambridge).
3.1 Folgen und Grenzwerte
Eine Folge (an )n∈IN reeller Zahlen an ∈ IR (oder komplexer Zahlen an ∈ C) ist eine
Abbildung von der Menge der natürlichen Zahlen in die Menge der reellen (oder
komplexen) Zahlen, d.h. jedem n ∈ IN wird eine Zahl an zugeordnet. Zunächst sei

24 3 Folgen reller und komplexer Zahlen
erwähnt, dass eine Folge (an )n∈IN etwas anderes ist als die Menge {an : n ∈ IN}.
Bei der Folge
kommt es auf die Reihenfolge an. So sind etwa ((−1)n )n∈IN und
n+1
(−1) n∈IN
zwei verschiedene Folgen, während die Menge der Folgenglieder in
beiden Fällen {−1, 1} ist.
Analog kann man auch Folgen der Form (an )n∈IN0 oder gar (an )n∈ZZ erklären.
Definition 3.1. Sei (an )n∈IN eine Folge reeller (oder komplexer) Zahlen. Man sagt,
die Folge konvergiert gegen a ∈ IR (bzw. a ∈ C), falls gilt:
Zu jedem  > 0 existiert ein N ∈ IN mit
|an − a| <  für alle n ≥ N .
Die Zahl a heißt dann Grenzwert (auch: Limes) der Folge.
 C
 
IR
a
Alle an mit n ≥ N Alle an mit n ≥ N

liegen in ]a −  , a +  [. liegen in U (a).
Bemerkung: Grenzwerte sind eindeutig bestimmt.
Beweis. Seien a, b Grenzwerte der Folge (an )n∈IN . Dann gibt es zu jedem  > 0
natürliche Zahlen N, M mit
|an − a| <  für alle n ≥ N und |an − b| <  für alle n ≥ M .
Daraus folgt |b − a| = |(ak − a) − (ak − b)| ≤ |ak − a| + |ak − b| < 2 , wobei etwa
k := max{N, M} sei.
Für jedes  > 0 gilt also |b − a| < 2 ; es bleibt nur |b − a| = 0.

Schreibweise: Konvergiert die Folge (an )n∈IN gegen a, so schreibt man
a = lim an oder an → a mit n →  .

n→
Gilt speziell lim an = 0, so bezeichnet man (an )n∈IN auch als Nullfolge.
n→
Beispiele:
(1) Sei an := a für alle n ∈ IN. Dann gilt lim an = a, denn |an − a| = 0 ∀n ∈ IN.
n→
1
(2) Sei an := n für n ∈ IN. Hier gilt lim an = 0.
n→
1

Begründung:

Zu  > 0 existiert N ∈ IN mit  < N, vgl. (A3); folglich gilt

1 − 0
= 1 ≤ 1 <  für alle n ≥ N.
n n N

1
(3) Sei an := n+1
n = 1 + 1n für n ∈ IN. Es gilt lim an = 1, denn
1 − n+1
n

= .
n
n→
3.1 Folgen und Grenzwerte 25
n
(4) Sei an := 1 + 1n für n ∈ IN. Es gilt lim an = e (Beispiel 1.7, Korollar 3.4).
n→
(5) Seien q ∈ C mit |q| < 1, an := qn
für n ∈ IN.
Es ist lim an = 0 wegen |qn − 0| = |q|n und Satz 1.4(b).
n→
n
1
(6) Seien q ∈ C mit |q| < 1, sn :=  qk für n ∈ IN. Es gilt lim sn = 1−q .
k=0 n→
Begründung: Für q = 0 ist (1 − q)sn = 1 − qn+1 und folglich

n+1 1
qn+1

sn − 1
=
1 − q − = =
1 (5)
|q|n+1 −→ 0 .

1 − q

1 − q 1 − q

1 − q
|1 − q|
n
Sei (an )n∈IN eine Folge und sn :=  ak wie im vorangehenden Beispiel.
k=1
Falls (sn )n∈IN konvergiert, so schreibt man

 ak := n→
lim sn .
k=1
Man bezeichnet dies als Reihe und (sn )n∈IN als Folge ihrer Partialsummen.
Man kann (und das wird tatsächlich gemacht) den Ausdruck

 ak
k=1
auch als einfache Abkürzung für die Folge der Partialsummen (sn )n∈IN verwenden.
Dieses Symbol hat also, je nach Zusammenhang, zwei verschiedene Bedeutungen:
Es bezeichnet entweder die Reihe an sich oder aber deren Grenzwert.

Beispielsweise nennt man  qk die Geometrische Reihe.
k=0
Wir werden in Kapitel 5 noch in einer allgemeineren Situation auf Reihen zu spre-
chen kommen.
Satz 3.2. Ist (an )n∈IN eine konvergente Folge, so ist die Menge {an : n ∈ IN} be-
schränkt.
Beweis. Sei a := lim an . Dann existiert ein N ∈ IN mit |an − a| < 1 ∀n ≥ N, also
n→
|an | ≤ |an − a| + |a| < 1 + |a| ∀n ≥ N .
Mit M := max {|a1 |, |a2 |, . . . , |aN−1 |, 1 + |a|} gilt nun |an | ≤ M für alle n ∈ IN.

Wir haben mit Satz 3.2 eine notwendige Bedingung für die Konvergenz einer
Folge, nämlich die Beschränktheit von {an : n ∈ IN}, gefunden. Zum Beispiel kann
(qn )n∈IN nicht konvergieren, falls |q| > 1 ist, da dann {qn : n ∈ IN} unbeschränkt ist,
siehe Satz 1.4(a).
Der folgende Satz enthält ein hinreichendes Kriterium für Konvergenz. Eine Fol-
ge (an )n∈IN reeller Zahlen heißt monoton wachsend (bzw. monoton fallend), falls
an+1 ≥ an (bzw. an+1 ≤ an ) für alle n ∈ IN gilt.
Satz 3.3. (a) Jede monoton wachsende und nach oben beschränkte Folge (an )n∈IN
reeller Zahlen konvergiert gegen das Supremum von {an : n ∈ IN}, d.h.
lim an = sup{an : n ∈ IN} .

n→
(b) Jede monoton fallende und nach unten beschränkte Folge (an )n∈IN reeller Zah-
len konvergiert gegen das Infimum von {an : n ∈ IN}, d.h. lim an = inf{an : n ∈ IN}.
n→
Beweis. Wir führen den Nachweis hier nur für den Fall einer monoton wachsenden
und nach oben beschränkten Folge.
Laut Satz 1.11 existiert s := sup{an : n ∈ IN}. Sei nun  > 0. Dann gibt es ein
N ∈ IN mit aN > s −  , denn sonst wäre s nicht die kleinste obere Schranke. Mit
aN ≤ an ≤ s folgt |an − s| ≤ s − aN <  für alle n ≥ N.

Man schreibt auch sup an := sup{an : n ∈ IN}, inf an := inf{an : n ∈ IN}.

n∈IN n∈IN
Wir notieren noch eine einfache Folgerung.
Korollar 3.4. Sei (In )n∈IN eine Intervallschachtelung, In = [an , bn ], so gilt

lim an = sup an = a = inf bn = lim bn mit In = {a} .
n→ n∈IN n∈IN n→
n∈IN
3.2 Rechnen mit Grenzwerten
Die folgenden Rechenregeln erleichtern die Bestimmung von Grenzwerten.
Satz 3.5. Seien (an )n∈IN , (bn )n∈IN zwei Folgen mit a = lim an und b = lim bn .
n→ n→
Es gelten:
(1) lim |an | = |a|
n→
(2) lim ( an ) =  a ( ∈ C)
n→
(3) lim (an + bn ) = a + b

n→
(4) lim (an bn ) = ab

n→
(5) Ist b = 0, so existiert ein n0 ∈ IN mit bn = 0 für alle n ≥ n0 , und die Folge
(an /bn )n≥n0 konvergiert gegen ab .
√ √
(6) Ist an ≥ 0 für alle n, so gilt lim k an = k a (k ∈ IN).
n→
3.2 Rechnen mit Grenzwerten 27
Beweis. (1) Seien  > 0 und N ∈ IN mit |an − a| <  ∀n ≥ N. Dann gilt auch
| |an | − |a| | ≤ |an − a| <  ∀n ≥ N.
(2) Der Fall  = 0 ist trivial. Andernfalls findet man zu  > 0 nun ein N ∈ IN mit
|an − a| < | | ∀n ≥ N. Damit gilt | an −  a| <  ∀n ≥ N.
(3) Zu  > 0 wähle N ∈ IN mit |an − a| <  /2 und |bn − b| <  /2 für alle n ≥ N. Es
folgt
 
|(an + bn) − (a + b)| ≤ |an − a| + |bn − b| < + = für alle n ≥ N .
2 2
(4) Nach Satz 3.3 existiert ein M > 0 mit |an | ≤ M für alle n ∈ IN.
Setze K := max{|b|, M}. Zu  > 0 existiert ein N ∈ IN mit |an − a| <  /2K und
|bn − b| <  /2K für alle n ≥ N. Damit gilt
 
|an bn −ab| = |an(bn −b)+(an −a)b| ≤ |an||bn −b|+|b||an −a| < K +K =
2K 2K
für alle n ≥ N.
(5) Mit dem vorangehenden Ergebnis genügt es, den Fall an = 1 zu betrachten.
Es existiert ein n0 ∈ IN mit |b| − |bn| ≤ |b − bn | < |b| 2 für alle n ≥ n0 . Folglich gilt
|b|
2 ≤ |b n | für alle n ≥ n 0 . Insbesondere gilt b n =
0 für alle n ≥ n0 .
1 1
Es bleibt noch zu zeigen, dass n→
lim bn = b gilt.
n≥n0
Zu  > 0 existiert ein N ∈ IN, N ≥ n0 mit |bn − b| < 2 |b|2 ∀n ≥ N. Damit gilt

1 1

bn − b
2

−
=

= 1 |bn − b| ≤ 2 |bn − b| < 2  |b| = 

bn b

bn b
|bn | |b| |b|2 |b|2 2
für alle n ≥ N.

Zum Nachweis von (6) benötigen wir noch folgendes Resultat.
Satz 3.6. Seien (an )n∈IN eine konvergente Folge mit a = lim an und c ∈ IR.
n→
(a) Ist an ∈ IR mit an ≤ c (bzw. an ≥ c) für alle n ∈ IN, so gilt a ≤ c (bzw. a ≥ c).
(b) Ist |an | ≤ c (bzw. |an | ≥ c) für alle n ∈ IN, so gilt |a| ≤ c (bzw. |a| ≥ c).
Beweis. (a) Seien zunächst an ≤ c für alle n ∈ IN. Ist a > c, so findet man zu  :=
a − c ein m ∈ IN mit |am − a| <  . Daraus folgt am = am − a + a ≥ a − |am − a| >
a −  = c, ein Widerspruch. Es gilt also a ≤ c.
Im Fall an ≥ c gilt −an ≤ −c und wir erhalten analog −a ≤ −c, also a ≥ c.
(b) Aus an → a folgt |an | → |a| laut Rechenregel (1) aus Satz 3.5. Mit dem eben
Bewiesenen folgt die Behauptung.

Zu Satz 3.6 sei noch erwähnt, dass aus an > c für alle n nicht notwendigerweise
auch a > c folgt. Als Gegenbeispiel dient etwa an := 1n .
Beweis (von Satz√ 3.5(6)). Wegen an ≥ 0 für alle n ist laut Satz 3.6 auch a ≥ 0. Daher
existiert die Zahl k a.
Sei nun  > 0. Dann ist  k > 0 und es gibt ein N ∈ IN derart, dass |an − a| <  k
gilt für alle n ≥ N. Mit Lemma 1.9 folgt

√ √

k an − k a
≤ k |an − a| ≤ 
√ √
für alle n ≥ N. Also ist lim k an = k a.

n→
√
Beispiel: lim n2 + n − n = 12 .
n→
Beweis. Es ist
√ √
( n2 + n − n)( n2 + n + n) n 1
2
n +n −n = √ =√ =
2
n +n +n 2
n +n +n 1 + 1n + 1
1
und mit lim = 0 sowie den Rechenregeln aus Satz 3.5 folgt
n→ n
1 1 1
lim n2 + n − n = lim =√ =
n→ n→
1 + 1n + 1 1 + 0+ 1 2
wie behauptet.

Wir notieren noch eine weitere Folgerung.
Satz 3.7. Seien (an )n∈IN , (bn )n∈IN und (cn )n∈IN Folgen reller Zahlen mit an ≤ cn ≤ bn
für alle n ∈ IN.
Falls (an )n∈IN und (bn )n∈IN konvergent sind mit dem selben Grenzwert a, so gilt
auch lim cn = a.
n→

Beweis. Sei  > 0. Dann gibt es N1 , N2 ∈ IN mit |an − a| < 3 für alle n ≥ N1 und
|bn − a| < 3 für alle n ≥ N2 .
Aus an ≤ bn folgt mit der Dreiecksungleichung
bn − an = |bn − an| = |bn − a − (an − a)| ≤ |bn − a| + |an − a| ,
folglich gilt bn − an < 23  für alle n ≥ N := max{N1 , N2 }.

Außerdem gilt wegen an ≤ cn ≤ bn auch cn − an ≤ bn − an . Insgesamt erhalten
wir damit
|cn − a| = |cn − an + an − a|
≤ |cn − an| + |an − a| = cn − an + |an − a| ≤ bn − an + |an − a| <  .
für alle n ≥ N. Es ist also lim cn = a wie behauptet.

n→
3.2 Rechnen mit Grenzwerten 29
Beispiel: Es gilt ⎧
⎨1
⎪ für 0 ≤ x < 1 ,
1
lim = 12 für x = 1 ,
n→ 1 + xn ⎪
⎩
0 für x ≥ 1 .
1 1
Beweis. Wir beginnen mit dem einfachsten Fall x = 1. Hier ist 1+xn = 2 für alle
1 1
n ∈ IN, also auch lim 1+xn = 2.
n→
Im Fall 0 ≤ x < 1 gilt lim xn = 0; mit den Rechenregeln aus Satz 3.5 erhalten wir
n→
1 1
lim n
= =1.
n→ 1+x 1+0
1 1 1 1
Für x > 1 gilt 0 < 1+xn < xn und lim n = 0; mit Satz 3.7 folgt lim n = 0.

n→ x n→ 1+x
1
n=8
n=4
n=2 Die Abbildung zeigt das
1 1
2
Verhalten von 1+x n für
0 ≤ x ≤ 2 und n = 2, 4, 8.
x
1 2
Weitere wichtige Grenzwerte:

√
(1) lim n a = 1 für jedes a > 0 ,
n→
√
(2) lim n n = 1 ,
n→
nk
(3) lim n = 0 für jedes k ∈ IN und z ∈ C mit |z| > 1 .
n→ z
Beweis. (1) Wir betrachten zunächst den Fall a ≥ 1.

√
Für n ∈ IN setzen wir an := n a − 1. Mit der Bernoulli-Ungleichung (Satz 1.3)
erhalten wir a = (1 + an)n ≥ 1 + nan, also an ≤ a−1
n .
Wegen a ≥ 1 gilt weiter an ≥ 0 für alle n√und laut Satz 3.7 erhalten wir mit
lim a−1
n = 0 schließlich lim an = 0, also lim
n
a = 1.
n→ n→ n→
Es bleibt noch zu zeigen, dass die Behauptung auch für 0 < a < 1 gilt. In diesem
Fall ist 1a > 1 und wir können das bereits Bewiesene mit 1a an Stelle von a benützen:
Es gilt
√ 1 1
lim n a = lim = =1.
n→ n→ n 1
a lim n 1a
n→
√
(2) Für n ∈ IN setzen wir an := n
n − 1, dann gilt an ≥ 0 und weiter
n(n − 1) 2 n(n − 1) 2
n = (1 + an)n = 1 + n an + an + · · · + ann ≥ 1 + an
2 2
für n ≥ 2, da alle Summanden auf der rechten Seite positiv sind. Nun folgt

n(n − 1) 2 n 2 2
n−1 ≥ an ⇒ 1 ≥ an ⇒ an ≤
2 2 n

für alle n ≥ 2. Mit lim 2n = 0 und Satz 3.7 erhalten wir lim an = 0, also
n→ n→
√
lim n
n=1.
n→
n+1
(3) Sei x := |z| − 1 > 0. Für jedes n ∈ IN mit n > 2k + 1, also 2 > k + 1, ist

n n n n(n − 1) · · ·(n − k) k+1 n k+1 xk+1
|z| = (1 + x) > xk+1 = x > ;
k+1 (k + 1)! 2 (k + 1)!
daraus folgt

k

n
k+1

< nk 1 (k + 1)! = 2 (k + 1)! n→
−→ 0

zn
n k+1 xk+1 xk+1 n
2
nk
und mit Satz 3.7 erhalten wir lim n = 0.

n→ z
3.3 Asymptotische Gleichheit und rekursiv definierte Folgen
Für p, q ∈ IN, 0 , . . . , a p ; 0 , . . . , q ∈ C,  p = 0, q = 0, gilt

⎧
 / , falls p = q ,
p
 p n +  p−1 n p−1 + · · · + 0 ⎨ p q
lim = 0 , falls p<q,
n→ q nq + q−1 nq−1 + · · · + 0 ⎩
konvergiert nicht, falls p > q .
Der Grenzwert hängt also nur vom jeweils ersten Term in Zähler und Nenner ab.
Dies gibt Anlass zu folgender Definition.
Definition 3.8. Zwei Folgen (an )n∈IN , (bn )n∈IN heißen asymptotisch gleich, falls
lim bann = 1 gilt. Man schreibt: an ∼
= bn für n → .
n→
Hierbei wird nicht verlangt, dass die Folgen (an )n∈IN oder (bn )n∈IN selbst konvergent
sind. Insbesondere gilt
 p n p +  p−1 n p−1 + · · · + 0 ∼
= p np (0 , . . . ,  p ∈ C) .
3.3 Asymptotische Gleichheit und rekursiv definierte Folgen 31
Beispiel 3.9 (Wallissches Produkt). Für n ∈ IN sei

n
2 4 6 2n 2k
pn := · · ··· = .
1 3 5 2n − 1 k=1 2k − 1
√ √
Es gilt pn ∼
=  n, wobei  ∈ IR ist mit 2 ≤  ≤ 2.
pn
Beweis. Einerseits ist √
n
monoton fallend, denn
p 2
√n+1
n+1 n (2n + 2)2 4n(n + 1) 4n2 + 4n
pn = = = <1;
√
n
n + 1 (2n + 1)2 (2n + 1)2 4n2 + 4n + 1
andererseits ist √ pn monoton wachsend, denn

n+1
p 2
√n+1
n+2 n + 1 (2n + 2)2 4(n + 1)3
= = >1.
√ pn n + 2 (2n + 1)2 4n3 + 12n2 + 9n + 2
n+1
Daraus folgt
√ p1 pn pn
2 = √ ≤ ··· ≤ √ ≤ √ ≤ · · · ≤ p1 = 2 .
2 n+1 n
Also ergibt sich mit Satz 3.3 nun

pn pn √
lim √ = inf √ =:  ≥ 2 (3.1)
n→ n n∈IN n
pn pn
und lim √ = sup √ =:  ≤ 2 . (3.2)
n + 1 n∈IN n + 1
n→
√
Insbesondere ist mit (3.1) gezeigt, dass pn ∼
=  n gilt.
Weiter gilt auch  =  wegen
√pn √
n n+1
= √ →1.
√ pn n
n+1
Insbesondere erhält man durch

!
pn pn
In := √ ,√
n+1 n

eine Intervallschachtelung mit In = { }.

n∈IN
√
Tatsächlich gilt  =  ; zum Beweis siehe Kapitel 8.3.
Es ist oft sinnvoll oder sogar nötig, eine Folge rekursiv zu definieren, d.h. mittels
einer Vorschrift, die angibt, wie man an+1 aus a1 , . . . , an berechnet.
Beispiel 3.10 (Algorithmus zur Bestimmung der Quadratwurzel). Sei x > 0.

Dann ist durch

1 x
a1 := x , an+1 := an + für n ∈ IN ,
2 an
eine Folge (an )n∈IN erklärt.

Wir wollen uns überlegen, ob diese Folge konvergent ist. Falls an > 0 ist, so folgt
auch an+1 > 0. Zusammen mit a1 = x > 0 erhalten wir induktiv an > 0 für alle
n ∈ IN, insbesondere ist der Bruch axn überhaupt erklärt.
Wenn wir annehmen, dass lim an =:  existiert, so gilt auch lim an+1 =  und
n→ n→

1 x 1 x
 = lim an+1 = lim an + = + ,
n→ n→ 2 an 2 
falls  = 0.
√
Wegen  = 12 ( + x√) ⇒ 2 2 =  2 + x ⇒  = ± x kommen als Grenzwert
nur die Werte 0 und ± x in Frage. Wir haben allerdings noch nicht gezeigt, dass
die Folge konvergent ist!
√
Behauptung: Es gilt lim an = x.
n→
Beweis. Für jedes n ∈ IN gilt

√
√ 1 √ x 1 2 √ (an − x)2
an+1 − x = an − 2 x + = an − 2 x an + x = ≥0.
2 an 2an 2an
Weiter ist
√
√ 1 √ an − x 1 √
0 ≤ an+1 − x = an − x ≤ an − x
2 an 2

≤1

1 √ 1 1 √ 1 √
≤ ··· ≤ a2 − x = (x + 1) − x = n ( x − 1)2 .
2n−1 2n−1 2 2
1 √ 2 √
Mit lim n ( x − 1) = 0 erhalten wir nun lim an − x = 0 wie gewünscht.

n→ 2 n→
3.4 Eine Intervallschachtelung für den Logarithmus
Folgendes Konzept stammt von Adolf Hurwitz (1859-1919, Königsberg; Studium in

München). Wir werden in Kapitel 6.3 sehen, dass es sich bei dem hier konstruierten
so genannten Logarithmus in der Tat um die Umkehrung der Exponentialfunktion
handelt.
3.4 Eine Intervallschachtelung für den Logarithmus 33
Wir betrachten für beliebiges x > 0 eine rekursiv definierte Folge (xn )n∈IN0 . Es seien
√
x0 := x , xn+1 := xn (n ∈ IN0 ) . (3.3)
Wir zeigen, dass unabhängig vom Startwert x immer lim xn = 1 gilt.

n→
Beweis. Ist x0 = x ≥ 1, so ist auch xn ≥ 1 ∀n ∈ IN und daher xn+1 ≤ x2n+1 = xn ,

d.h. (xn )n∈IN0 ist monoton fallend und nach unten beschränkt. Laut Satz 3.3 existiert
 := lim xn ≥ 1. Da aber auch  = lim xn+1 ist, gilt
n→ n→
 2 = lim x2n+1 = lim xn =  .

n→ n→
Daraus folgt  = 0 oder  = 1. Schließlich ist  = 0 aber nicht möglich wegen

xn ≥ 1 ∀n ∈ IN.
Ist 0 < x < 1, so betrachte 1x als Startwert. Mit √1x = 1x folgt dann analog zu
obiger Berechnung ebenfalls die Behauptung.

Lemma 3.11. Sei x > 0. Mit der in (3.3) erklärten Folge (xn )n∈IN0 setze

n 1
an := 2 1 − , bn := 2n (xn − 1) . (3.4)
xn
Dann ist (In )n∈IN0 mit In := [an , bn ] eine Intervallschachtelung.
Beweis. Wir zeigen zunächst bn+1 ≤ bn und an ≤ an+1 sowie an ≤ bn für alle n ∈ IN.
Dazu benutzen wir die Ungleichungen
1
(i) 2(y − 1) ≤ y2 − 1 und (ii) y+ ≥2
y
für beliebiges y > 0, die man leicht aus y2 − 2y + 1 = (y − 1)2 ≥ 0 folgern kann.
Mit (i) erhalten wir
bn+1 = 2n+1(xn+1 − 1) ≤ 2n (x2n+1 − 1) = 2n (xn − 1) = bn sowie

1 1 1
an+1 = −2n+1 − 1 ≥ −2n − 1 = 2 n
1 − = an
xn+1 x2n+1 xn

und mit (ii) schließlich an = 2n 1 − x1n ≤ 2n (xn − 1) = bn .
Also sind (an )n∈IN0 und (bn )n∈IN0 konvergente Folgen, siehe Satz 3.3, denn
(an )n∈IN0 ist monoton steigend, beschränkt nach oben durch b0 und (bn )n∈IN0 ist
monoton fallend, beschränkt nach unten durch a0 .

Wegen an xn = 2n 1 − x1n xn = 2n (xn − 1) = bn und lim xn = 1 gilt lim an = lim bn .
n→ n→ n→
Damit ist gezeigt, dass (In )n∈IN0 eine Intervallschachtelung ist.

Ausgehend von x > 0 haben wir über (3.3) und (3.4) eine Intervallschachtelung
(In )n∈IN0 mit In = [an , bn ] definiert. Bezeichne ln(x) := lim an = lim bn , also
n→ n→

{ln(x)} = In .
n∈IN0
Wir nennen diese Zahl den (natürlichen) Logarithmus von x.
Satz 3.12. Für alle x, y > 0 gelten

(a) ln(1) = 0 ,
√
(b) 1 − 1x ≤ ln(x) ≤ x − 1 und 2 1 − √1x ≤ ln(x) ≤ 2( x − 1) ,
(c) ln(xy) = ln(x) + ln(y) . (Funktionalgleichung des Logarithmus)
Beweis. (a) Für x = 1 gilt xn = 1, also an = bn = 0 für alle n ∈ IN, und somit
ln(1) = 0.
(b) Wie in Lemma 3.11 gezeigt, gilt an ≤ ln(x) ≤ bn ∀n ∈ IN0 (wobei an , bn von
x > 0 abhängen). Für n = 0 erhält man
1
1−
≤ ln(x) ≤ x − 1 .
x
√ √
Für n = 1 gilt x1 = x, also hat man 2 1 − √1x ≤ ln(x) ≤ 2( x − 1).
√
(c) Es sei z := xy > 0. Wir betrachten nun x0 = x, y0 = y, z0 = z und xn+1 = xn ,
√ √
yn+1 = yn , zn+1 = zn gemäß (3.3).
Unter Benutzung der bn zu x bzw. y bzw. z erhält man
ln(z) = lim 2n (zn − 1) = lim 2n (xn yn − 1) = lim (2n xn (yn − 1) + 2n(xn − 1))
n→ n→ n→

= lim xn lim 2n (yn − 1) + lim 2n (xn − 1) = ln(y) + ln(x)
n→ n→ n→
wie behauptet.

Korollar 3.13. Es gelten

(a) ln 1x = − ln(x) für alle x > 0,
(b) 0 < x < y ⇒ ln(x) < ln(y).
Beweis. (a) Mit der Funktionalgleichung erhalten wir

1 1
ln + ln(x) = ln x = ln(1) = 0 .
x x
(b) Setze c := yx . Mit c > 1 folgt aus Satz 3.12(b) zunächst ln(c) ≥ 1 − 1c > 0; mit
der Funktionalgleichung folgt nun ln(y) = ln(cx) = ln(c) + ln(x) > ln(x).

3.5 Aufgaben 35
ln(x)
Der Logarithmus wird
zwar beliebig groß, aber
äußerst langsam. Um im
Maßstab der Abbildung
30 cm auf der y-Achse
an Höhe zu gewinnen x
(A4-Blatt), braucht man
auf der x-Achse 100 Mil-
lionen Kilometer (≈ 23 ×
Abstand Erde – Sonne).
3.5 Aufgaben
1. Welche der Folgen

1 1 − 2n
an := √ , bn := , cn := (−1)n
n+1 5 + 3n
sind konvergent ? Bestimmen Sie gegebenenfalls den Grenzwert. Benutzen Sie

dabei direkt die Definition 3.1 und keine weiteren Resultate aus Kapitel 3.
2. Berechnen Sie die Grenzwerte der durch

n2 + 3n + 2 5n8 − 7n − 1
an := und bn :=
n3 + 1 n8 + n4 + n2 + 1
erklärten Folgen.
3. Ist die durch

1 n
an := 1 − 2
n
erklärte Folge (an )n∈IN konvergent ? Bestimmen Sie ggf. den Grenzwert.
4. Zeigen Sie mit Hilfe von Satz 3.3, dass die durch
1 1 1
an := + + ···+
1+n 2+n n+n
erklärte Folge (an )n∈IN konvergiert.
5. Es sei (an )n∈IN eine Folge komplexer Zahlen. Zeigen Sie:

Die Folge (an )n∈IN ist konvergent genau dann, wenn (Re an )n∈IN und (Im an )n∈IN
beide konvergent sind.
6. Untersuchen Sie die Folgen auf Konvergenz und bestimmen Sie gegebenenfalls
den Grenzwert.
√ √
a. an := n + t − n mit t > 0
√
b. bn := n + nt − n mit t > 0
√
c. c1 := 1 , cn+1 := 2 + cn für n ∈ IN
√
d. dn := n an + bn mit 0 ≤ a ≤ b (Hinweis: bn ≤ an + bn ≤ 2bn )
7. Es seien (an )n∈IN eine Folge komplexer Zahlen und a ∈ C.

Zeigen Sie, dass die folgenden drei Aussagen äquivalent sind.
(i) Zu jedem  > 0 gibt es ein N ∈ IN mit |an − a| <  für alle n ≥ N.
(ii) Zu jedem  > 0 gibt es ein N ∈ IN mit |an − a| ≤  für alle n ≥ N.

(iii) Zu jedem  > 0 gibt es ein N ∈ IN mit |an − a| < 2 für alle n ≥ N.
8. Das Arithmetisch-geometrische Mittel.

Es seien a, b ∈ IR mit 0 < a < b. Wir setzen a0 := a, b0 := b und
an+1 := G(an , bn ) , bn+1 := A(an , bn ) für n ∈ IN0 ,
wobei A und G wie in 1.4, Aufgabe 8, erklärt sind. Zeigen Sie:

a. Für alle n ∈ IN0 gilt an < bn .
b. Die Intervalle In := [an , bn ] bilden eine Intervallschachtelung.
1
c. Für alle n ∈ IN0 gilt bn+1 − an+1 ≤ 8a (bn − an)2 .
Kapitel 4
Metrische Räume und Cauchyfolgen
Wir haben den Begriff der Konvergenz sowohl für reelle als auch für komplexe
Folgen erklärt. Dabei haben wir nur den Begriff des Abstandes“ zwischen x und y
”
benützt, nämlich |x − y|.
Hat man einen sinnvollen Abstandsbegriff in anderen Räumen als IR oder C, so
kann man dort auch Konvergenz erklären.
4.1 Metrische und normierte Räume
Wir führen nun einen allgemeinen Abstandsbegriff auf beliebigen Mengen ein.
Definition 4.1. Sei M eine Menge. Eine Abbildung d : M × M → IR heißt Metrik,

wenn
(M1) d(a, b) ≥ 0 und d(a, b) = 0 ⇐⇒ a = b,
(M2) d(a, b) = d(b, a),
(M3) d(a, c) ≤ d(a, b) + d(b, c), (Dreiecksungleichung)
für alle a, b, c ∈ M gilt. Man sagt dann, (M, d) ist ein metrischer Raum, und nennt
d(a, b) den Abstand von a und b.
Beispiele:
(1) Auf IR oder C haben wir eine natürliche“ Metrik, d(x, y) := |x − y|.
”
Wir schreiben künftig IK für IR oder C.
(2) Auf jeder Menge M = ∅ ist durch

0 , für a = b ,
d(a, b) :=
1 , für a = b ,
eine Metrik gegeben, die diskrete Metrik.

38 4 Metrische Räume und Cauchyfolgen
(3) Sei M := {0, 1}n := {x = (x1 , . . . , xn ) : x1 , . . . , xn ∈ {0, 1} }. Durch
d(x, y) := |x1 − y1 | + . . . + |xn − yn |
(die Anzahl der Stellen, an denen x und y verschiedene Einträge haben) ist
eine Metrik definiert. Sie heißt Hamming-Abstand.
(4) Auf IK haben wir bereits zwei Metriken, die natürliche und die diskrete Me-
trik. Eine weitere ist durch
|x − y|
d(x, y) :=
1 + |x − y|
definiert. (M1), (M2) sind offensichtlich erfüllt.

Um (M3) zu zeigen, verwenden wir folgende Hilfsaussage: Für 0 ≤ s ≤ t gilt
s t
s(1 + t) = s + st ≤ t + st = t(1 + s) und daraus folgt 1+s ≤ 1+t .
Mit s = |x − z| und t = |x − y| + |y − z| gilt
|x − z| (|x − y| + |y − z|)
d(x, z) = ≤
1 + |x − z| 1 + (|x − y| + |y − z|)
|x − y| |y − z|
= +
1 + (|x − y| + |y − z|) 1 + (|x − y| + |y − z|)
|x − y| |y − z|
≤ + = d(x, y) + d(y, z) ,
1 + |x − y| 1 + |y − z|
also ist (M3) ebenfalls erfüllt.

Man beachte, dass in einem metrischen Raum (M, d) jede Teilmenge L ⊆ M mit
d|L, der Einschränkung von d auf L, ein metrischer Raum ist.
Ist die zu Grunde liegende Menge sogar ein IK-Vektorraum (IK = IR oder C), so
erhält man Metriken u.a. über so genannte Normen.
Definition 4.2. Sei X ein IK-Vektorraum. Eine Abbildung · : X → IR heißt

Norm, wenn
(N1) x ≥ 0 und x = 0 ⇐⇒ x = 0,
(N2)  x = | |x,
(N3) x + y ≤ x + y, (Dreiecksungleichung)
für alle x, y ∈ X und alle  ∈ IK gilt. Weiter heißt (X, · ) dann normierter Raum.
Man sieht sofort, daß bei gegebener Norm · durch
d(x, y) := x − y (4.1)
eine Metrik auf X definiert wird.

Die Metriken auf einem IK-Vektorraum, die durch Normen gemäß (4.1) bestimmt
sind, kann man einfach charakterisieren.
4.1 Metrische und normierte Räume 39
Satz 4.3. Sei X ein IK-Vektorraum. Eine Metrik d auf X wird gemäß (4.1) von einer
Norm definiert genau dann, wenn
(a) d(x + a, y + a) = d(x, y) und
(b) d( x,  y) = | | d(x, y),
für alle x, y ∈ X,  ∈ IK gilt.
Beweis. Bei gegebener Norm · setzen wir d(x, y) := x − y für x, y ∈ X. Dann

gelten
d(x + a, y + a) = (x + a) − (y + a) = d(x, y) und

d( x,  y) = ( x) − ( y) = | | d(x, y) .
Sei umgekehrt d mit (a) und (b) gegeben. Wir setzen nun x := d(x, 0) für x ∈ X.
Dann gilt x = 0 ⇐⇒ d(x, 0) = 0 ⇐⇒ x = 0. Ferner ist
(b)
 x = d( x,  0) = | | d(x, 0) = | |x .
Schließlich gilt auch

(a)
x + y = d(x + y, 0) = d(x, −y) ≤ d(x, 0) + d(0, −y)
(b)
= d(x, 0) + d(−y, 0) = x + y .
Es bleibt zu prüfen, dass zwischen der so definierten Norm und d die Beziehung
(4.1) gilt. In der Tat ist
(a)
x − y = d(x − y, 0) = d(x, y)
wie behauptet.

Beispiel: Normen auf IKd . Für x = (x1 , . . . , xd ) seien

d
x1 :=  |xk | ,
k=1
1/2
d
x2 :=  |xk | 2
,
k=1
x := max |xk | .

k=1,...,d
Die Eigenschaften (N1) und (N2) gelten offensichtlich in allen drei Fällen. Die
Dreiecksungleichung (N3) ist für · 1 und ·  ebenfalls einfach zu sehen.
Die Dreiecksungleichung für · 2 heißt auch Minkowski-Ungleichung (Hermann
Minkowski, 1864-1909, Zürich, Göttingen). Zu deren Nachweis benötigen wir die
Cauchy-Ungleichung; auch Cauchy-Schwarz-Ungleichung oder Cauchy-Schwarz-

Bunjakowski-Ungleichung genannt (Augustin Louis Cauchy, 1789-1857, Paris;
Viktor Jakowlewitsch Bunjakowski, 1804-1889, Petersburg; Hermann Amandus
Schwarz, 1843-1921, Berlin).
Satz 4.4 (Cauchy-Ungleichung). Seien (a1 , . . . , ad ) , (b1 , . . . , bd ) ∈ IRd . Dann gilt

1/2 1/2

d
d d

 ak bk
≤  a2k  b2k .

k=1
k=1 k=1
Beweis. Es ist
2
d d d d d d d
 a2k  b2k −  ak bk =   a2k b2i −   ak bk ai bi .
k=1 k=1 k=1 k=1 i=1 k=1 i=1
Auf der rechten Seite fallen die Summanden für k = i jeweils weg; wir erhalten
d d d d d d 2 2
  a2k b2i −   ak bk aibi =   ak bi − ak bk ai bi
k=1 i=1 k=1 i=1 k=1 i = 1
i = k
d d 2 2
=   ak bi − 2ak bk ai bi + a2i b2k
k=1 i=k+1
d d
=   (ak bi − ai bk )2 ≥ 0
k=1 i=k+1
und weiter 2
d d d
 ak bk ≤  a2k  b2k .
k=1 k=1 k=1
Da die Summen auf der rechten Seite nicht negativ sind, ist

1/2 1/2

d
d d

 ak bk
≤  a2k  b2k

k=1
k=1 k=1
wie gewünscht.

Satz 4.5 (Minkowski-Ungleichung). Seien x = (x1 , . . . , xd ) , y = (y1 , . . . , yd ) ∈ IKd .
Dann gilt x + y2 ≤ x2 + y2.
Beweis. Es ist
d d
x + y22 =  |xk + yk |2 ≤  |xk + yk | (|xk | + |yk |)
k=1 k=1
und mit Hilfe der Cauchy-Ungleichung erhalten wir

4.1 Metrische und normierte Räume 41
d d
 |xk + yk | |xk | +  |xk + yk | |yk |
k=1 k=1
1/2 1/2 1/2 1/2
d d d d
≤  |xk + yk | 2
 |xk |
2
+  |xk + yk |
2
 |yk |2
k=1 k=1 k=1 k=1
= x + y2 (x2 + y2) .
Daraus folgt x + y2 ≤ x2 + y2.

Damit ist gezeigt, dass auch · 2 eine Norm auf IKd ist. Man nennt sie die Eukli-
dische Norm. Der normierte Raum (IRd , · 2) heißt Euklidischer Raum.
Die folgende Abbildung zeigt für jede der Normen · 1 , · 2 und ·  in IR2
die so genannte Einheitskugel K1 (0) := {x ∈ IR2 : x ≤ 1}.
(0, 1) (0, 1) (1, 1)
(1, 0)
(1, 0) (1, 0)
Für x = (x1 , x2 ) mit x1 ≤ 1 Die Einheitskugel bezüglich Die Einheitskugel bzgl.
gilt x1 ∈ [−1, 1] und · 2 ist genau die Kreisscheibe ·  ist das Quadrat
x2 ∈ [−1 + |x1 |, 1 − |x1 |]. {(x1 , x2 ) ∈ IR2 : x21 + x22 ≤ 1}. [−1, 1]2 .
Beispiel: Der Raum  .

Wir bezeichnen den Raum aller beschränkten Folgen reeller (oder komplexer)
Zahlen mit  . Mit den für x = (xn )n∈IN , y = (yn )n∈IN und  ∈ IK definierten Ope-
rationen (x + y)n := xn + yn und ( x)n :=  xn ist dies ein IK-Vektorraum.
Wir wollen sehen, dass durch x := sup |xn | eine Norm auf  erklärt ist.
n∈IN
Die Eigenschaften (N1) und (N2) sind leicht ersichtlich. Zum Nachweis der
Dreiecksungleichung seien x, y ∈  . Für jedes k ∈ IN gilt |xk + yk | ≤ |xk | + |yk | ≤
sup{|xn | : n ∈ IN} + sup{|yn | : n ∈ IN}, also auch
x + y = sup{|xk + yk | : k ∈ IN}

≤ sup{|xn | : n ∈ IN} + sup{|yn | : n ∈ IN} = x + y .
Bezeichnungen: Ist (M, d) ein metrischer Raum, so definieren wir
Ur (a) := {b ∈ M : d(b, a) < r} und Kr (a) := {b ∈ M : d(b, a) ≤ r}

sowie Sr (a) := {b ∈ M : d(b, a) = r}
für feste a ∈ M, r > 0.

4.2 Cauchyfolgen und Vollständigkeit
Für Folgen (an )n∈IN , an ∈ M, liegt es nun auf der Hand, einen Konvergenzbegriff
einzuführen.
Definition 4.6. Seien (M, d) ein metrischer Raum und (an )n∈IN eine Folge in M.
(i) Die Folge (an )n∈IN heißt konvergent gegen a ∈ M, falls zu jedem  > 0 ein
N ∈ IN existiert mit
d(an , a) <  für alle n ≥ N .

d
Man schreibt lim an = a oder an −→ a.
n→
(ii) Die Folge (an )n∈IN heißt Cauchyfolge, falls zu jedem  > 0 ein N ∈ IN exis-
tiert mit
d(an , am ) <  für alle n, m ≥ N .
(iii) Der Raum (M, d) heißt vollständig, falls jede Cauchyfolge in M konver-
giert. Ein vollständiger normierter Raum heißt Banachraum (Stefan Ba-
nach, 1892-1945, Lemberg).
x
Beispiel: Für x ∈ IR setze  (x) := 1+|x| . Dann ist durch
d(x, y) := | (x) −  (y)|
eine Metrik d auf IR erklärt, sodass (IR, d) nicht vollständig ist.
Beweis. Aus der Definition folgt unmittelbar, dass d(z, y) ≥ 0 ist für alle x, y ∈ IR;
im Fall x = y gilt offensichtlich d(x, y) = 0.
Sei nun d(x, y) = 0, so folgt
x y
= ⇒ x(1 + |y|) = y(1 + |x|) ⇒ x + x |y| = y + y |x| .
1 + |x| 1 + |y|
In den Fällen x, y ≥ 0 oder x, y ≤ 0 erhalten wir x |y| = y |x| und damit x = y. An-
dernfalls können wir ohne Einschränkung annehmen, dass x > 0 und y ≤ 0 gilt. Wir
erhalten −x |y| = y |x| und weiter x + x |y| = y − x |y| ⇒ 2x |y| = y − x. Wegen x > 0
und y ≤ 0 ist dies ein Widerspruch.
Es gilt also d(x, y) = 0 ⇐⇒ x = y. Damit ist (M1) gezeigt; (M2) ist offenbar
auch erfüllt. Seien x, y, z ∈ IR, dann gilt

x z
x y y z
d(x, z) =

− = − + −
1 + |x| 1 + |z|

1 + |x| 1 + |y| 1 + |y| 1 + |z|

x y
y z
≤

− + − = d(x, y) + d(y, z) ,
1 + |x| 1 + |y|

1 + |y| 1 + |z|
womit (M3) auch gezeigt ist. Folglich ist d eine Metrik.

4.2 Cauchyfolgen und Vollständigkeit 43
Es sei an := n für a ∈ IN.

Für beliebiges N ∈ IN und N ≤ m ≤ n gilt dann

n m
n(1 + m) − m(1 + n)
n−m
d(an , am ) =
− = =
1 + n 1 + m

(1 + n)(1 + m)
(1 + n)(1 + m)
n 1 1
≤ = ≤ .
n(m + 1) m + 1 N
1
Wenn wir zu  > 0 also N ∈ IN so wählen, dass N <  ist, erhalten wir
d(an , am ) <  für alle n, m ≥ N ,
d.h. (an )n∈IN ist eine Cauchyfolge in (IR, d).

d
Angenommen, es gibt a ∈ IR mit an → a. Offensichtlich ist dann a > 0.
Für n ∈ IN, n > 2a, folgt

n

n a
|n − a| 1

d(an , a) =
− = > 2
= .
1 + n 1 + |a|
(1 + n)(1 + |a|) 2n(1 + |a|) 4(1 + |a|)
1
Zu  = 4(1+|a|) gibt es demnach kein N ∈ IN derart, dass gilt
d(an , a) <  für alle n ≥ N

d
im Widerspruch zu an → a. Die Folge konvergiert also nicht.
Wir haben hiermit eine Cauchyfolge in (IR, d) gefunden, die nicht konvergiert. Folg-
lich ist (IR, d) nicht vollständig.

Bemerkungen:
(1) Eine Folge in (M, d) kann gegen höchstens einen Grenzwert konvergieren.
Man kann den Beweis aus Abschnitt 3.1 fast wörtlich kopieren.
(2) Auch nach Definition√ 4.6
√ ist Q mit der natürlichen Metrik nicht vollständig:
In jedem Intervall [ 2, 2 + 1n ] finden wir ein an ∈ Q. Damit ist (an )n∈IN eine
Cauchyfolge in Q, konvergiert aber nicht (in Q).
(3) Jede konvergente Folge (an )n∈IN in (M, d) ist eine Cauchyfolge, denn seien
a = lim an und  > 0, so gibt es ein N ∈ IN mit d(an , a) < 2 für alle n ≥ N,
n→
und damit gilt
 
d(an , am ) ≤ d(an , a) + d(a, am) < + = falls n, m ≥ N .
2 2
Wenn wir im Folgenden von Konvergenz in IR oder C (ohne zusätzliche Angabe)
sprechen, meinen wir stets Konvergenz in der natürlichen (Betrags-)Metrik.
Satz 4.7. Jede Cauchyfolge (an )n∈IN in IR ist konvergent.

1
Beweis. Zu k ∈ IN gibt es nk ∈ IN mit |an − am | 2k+1 für alle n, m ≥ nk . Wir können
diese so wählen, dass nk+1 ≥ nk gilt. Definiert man Intervalle mittels

1
Ik := x ∈ IR : |x − ank | ≤ k ,
2
dann ist an ∈ Ik für alle n ≥ nk . Weiter gilt Ik+1 ⊆ Ik : Ist nämlich x ∈ Ik+1 , so gilt
1 1
|x − ank+1 | ≤ 2k+1 . Da mit nk+1 ≥ nk auch |ank+1 − ank | < 2k+1 ist, folgt
1
|x − ank | ≤ |x − ank+1 | + |ank+1 − ank | < , also x ∈ Ik .
2k
1
Die Länge der Ik ist 2k−1
. Somit ist (Ik )k∈IN eine Intervallschachtelung.


Gemäß der Vollständigkeit von IR nach Definition 1.6 sei nun Ik = {a}.
k=1
Wir zeigen, dass lim an = a gilt.
n→
Ist  > 0, so wähle k ∈ IN mit 1
2k
< 2 . Für n ≥ N := nk gilt dann
1 1  
|an − a| ≤ |an − ank | + |ank − a| < + < + = .
2k+1 2k 2 2
Folglich konvergiert die Folge (an )n∈IN gegen a.

Bemerkung: Im Beweis von Satz 4.7 haben wir die Vollständigkeit von IR bezüglich
Intervallschachtelungen benutzt um Vollständigkeit bzgl. Cauchyfolgen zu zeigen.
Fordert man in der Konstruktion der Menge IR als vollständigen archimedisch
angeordneten Körper die Vollständigkeit mittels Cauchyfolgen, so kann man daraus
wiederum die Vollständigkeit bezüglich Intervallschachtelungen zeigen.
Darüberhinaus ist auch die Supremumseigenschaft (vgl. Satz 1.11) eine äquiva-
lente Charakterisierung der Vollständigkeit von IR.
Weitere Details zur Menge der reellen Zahlen findet man u.a. in [3].
Konvergenz im Euklidischen Raum:

Es sei (xn )n∈IN eine Folge in IKd , xn = (xn,1 , ..., xn,d ). Wegen
d
 |xn,k − xk |2 → 0 ⇐⇒ xn,k → xk für alle k ∈ {1, . . . , d}
k=1
konvergiert (xn )n∈IN gegen x ∈ IKd bzgl. · 2 genau dann, wenn alle Komponen-
tenfolgen (xn,k )n∈IN gegen xk konvergieren.
Ebenso sieht man, dass (xn )n∈IN Cauchyfolge in (IKd , · 2 ) ist, genau dann,
wenn alle Komponentenfolgen (xn,k )n∈IN , k = 1, . . . , d, Cauchyfolgen in IK sind.
Damit folgt:
Korollar 4.8. Der Euklidische Raum (IRd , · 2 ) ist vollständig. Insbesondere ist
auch C (mit der natürlichen Metrik) vollständig.
4.3 Skalarprodukt und Orthogonalität 45
Wir wollen noch ein Beispiel für einen weiteren Banachraum angeben.
Sei M eine beliebige Menge, und bezeichne B(M) den Raum aller beschränkten
Funktionen f : M → IK, d.h. B(M) enthält genau diejenigen Abbildungen f , für
die { f (x) : x ∈ M} eine beschränkte Teilmenge von IK ist. Mit f , g ∈ B(M) und
 ∈ IK gilt offensichtlich auch f + g ∈ B(M) und  f ∈ B(M), daher ist B(M) ein
IK-Vektorraum. Weiter sei
f  := sup | f (x)| .
x∈M
Man kann direkt nachrechnen, dass ·  eine Norm auf B(M) ist.
Gelegentlich schreibt man auch · M an Stelle von ·  .
Satz 4.9. Der normierte Raum (B(M), ·  ) ist ein Banachraum.
Beweis. Zu zeigen bleibt, dass jede Cauchyfolge in (B(M), ·  ) konvergiert.
Sei ( fn )n∈IN eine Cauchyfolge in (B(M), ·  ). Zu jedem  > 0 gibt es demnach
ein N ∈ IN mit fn − fm  <  für alle m, n ≥ N.
Für beliebiges x ∈ M folgt daraus | fn (x) − fm (x)| <  ∀ m, n ≥ N, wobei N un-
abhängig von x ist. Folglich ist ( fn (x))n∈IN eine Cauchyfolge in IK. Diese ist kon-
vergent, da IK vollständig ist. Also existiert der Grenzwert lim fn (x) =: f (x).
n→
Sei n ≥ N zunächst fest gewählt.
Es ist lim | fn (x) − fm (x)| = | fn (x) − f (x)| und damit | fn (x) − f (x)| ≤  ∀x ∈ M.
m→
Da fn beschränkt ist, ist somit auch f beschränkt. Weiter gilt
fn − f  = sup | fn (x) − f (x)| ≤  für alle n ≥ N ,

x∈M
also konvergiert die Folge ( fn )n∈IN im Raum (B(M), ·  ) gegen f ∈ B(M).

4.3 Skalarprodukt und Orthogonalität
Definition 4.10. Sei X ein IK-Vektorraum. Eine Abbildung ·, · : X × X → IK heißt

Skalarprodukt, wenn
(S1) x, x ≥ 0 und x, x = 0 ⇐⇒ x = 0,
(S2)  x, y =  x, y,
(S3) x, y = y, x,
(S4) x + y, z = x, z + y, z,
für alle x, y, z ∈ X und alle  ∈ IK gilt. Einen Vektorraum mit Skalarprodukt bezeich-
net man auch als Prähilbertraum.
Weiter sagt man, x und y sind orthogonal, falls x, y = 0 ist.
Sei I eine beliebige Indexmenge. Eine Menge {xi : i ∈ I} ⊆ X heißt orthonormal,
falls xi , x j = 0 für i = j und xi , xi = 1 für alle i ∈ I gilt.

Wit werden sehen, dass in einem Prähilbertraum X durch x := x, x eine Norm
erklärt ist. Die Eigenschaften (N1) und (N2) sind offensichtlich. Zum Nachweis der
Dreiecksungleichung (N3) sind noch einige Überlegungen nötig.
Satz 4.11 (Pythagoras). Sei {x1 , . . . , xn } eine endliche orthonormale Menge in

einem Prähilbertraum X.
Dann gilt " "2
n " n "
" "
x =  |x, xk | + "x −  x, xk xk " .
2 2
k=1
" k=1
"
n
Beweis. Mit s :=  x, xk xk und der Orthonormalität erhalten wir
k=1
# $
n n n n n
s2 =  x, xk xk ,  x, x j x j =   x, xk x, x j xk , x j =  |x, xk |2
k=1 j=1 k=1 j=1 k=1
n
sowie s, x =  |xk , x|2 = x, s. Insgesamt gilt also
k=1
n
x − s2 = x − s, x − s = x, x − x, s − s, x + s, s = x2 −  |x, xk |2
k=1
wie behauptet.

Eine unmittelbare Konsequenz ist die Besselsche Ungleichung (Friedrich Wilhelm

Bessel, 1784-1846, Königsberg): Ist {x1 , . . . , xn } eine endliche orthonormale Menge
in einem Prähilbertraum X, so gilt
n
x2 ≥  |x, xk |2 für alle x ∈ X . (4.2)
k=1
Korollar 4.12 (Cauchy-Schwarz-Ungleichung). Sei X ein Prähilbertraum.

Für alle x, y ∈ X gilt |x, y| ≤ x y.
Beweis. Im Fall y = 0 ist die Behauptung klar. Andernfalls betrachte die orthonor-
1
male Menge {x1 } mit x1 = y y und benutze (4.2).

Aus der Cauchy-Schwarz-Ungleichung erhält man weiter
x + y2 = x + y, x + y = x2 + 2Rex, y + y2

≤ x2 + 2 |x, y| + y2 ≤ x2 + 2 x y + y2 = (x + y)2
und damit die Dreiecksunleichung für · . Damit ist nun auch bewiesen, dass es
sich hierbei tatsächlich um eine Norm handelt. Ist X mit dieser Norm vollständig,
so bezeichnet man X als einen Hilbertraum (David Hilbert, 1862-1943, Göttingen).
4.3 Skalarprodukt und Orthogonalität 47
Beispiel: Das gewöhnliche Skalarprodukt in IKd : Durch

d
x, y :=  xk yk für x = (x1 , . . . , xd ) , y = (y1 , . . . , yd ) ∈ IKd
k=1
wird ein Skalarprodukt erklärt, wie man leicht nachrechnen kann.

Als zugehörige Norm ergibt sich
1/2
d
x = x, x =  |xk |2
k=1
die Euklidische Norm. Laut Korollar 4.8 ist IKd mit dieser Norm vollständig, also
ein Hilbertraum.
Satz 4.13. Seien {x1 , . . . , xn } eine endliche orthonormale Menge in einem Prä-
hilbertraum X und x ∈ X. Bezeichne
n n
s :=  x, xk xk und t :=   k xk mit 1 , . . . , n ∈ IK .
k=1 k=1
Es gilt x −t ≥ x − s, wobei Gleichheit genau dann gilt, falls k = x, xk für alle
k = 1, . . . , n ist.
Damit ist s also dasjenige Element aus dem von {x1 , . . . , xn } aufgespannten Un-
terraum von X, welches den kleinsten Abstand von x hat.
Beweis. Es gilt
n n n
x − t2 = x, x −  k xk , x −  k x, xk −  k k
k=1 k=1 k=1
n n
= x, x −  x, xk x, xk +  (k − x, xk ) (k − x, xk )
k=1 k=1
n n
= x2 −  |x, xk |2 +  |k − x, xk |2
k=1 k=1
n
≥ x2 −  |x, xk |2 = x − s2 ,
k=1
wobei die letzte Gleichung exakt der Satz von Pythagoras ist. Gleichheit gilt offen-
sichtlich genau im Fall k = x, xk für alle k = 1, . . . , n.

Beispiel: Wir bestimmen im Euklidischen IR3 den Punkt s in der von x1 := (1, 0, 0)
und x2 := (0, 1, 1) aufgespannten Ebene, welcher von x := (2, 3, 4) den geringsten
Abstand hat.
Es gilt s = x, x1 x1 + x, x2 x2 = 2x1 + 7x2 = (2, 7, 7).
4.4 Teilfolgen und Häufungswerte
Eine notwendige Eigenschaft für die Konvergenz einer Folge (an )n∈IN in einem me-
trischen Raum ist deren Beschränktheit.
Dabei heißt eine Teilmenge A in einem metrischen Raum (M, d) beschränkt,
falls ein K ≥ 0 und ein Punkt b ∈ M existieren mit d(a, b) ≤ K für alle a ∈ A.
Satz 4.14. Ist (an )n∈IN eine Cauchyfolge in einem metrischen Raum (M, d), so ist
{an : n ∈ IN} beschränkt.
Den Nachweis führt man wie den von Satz 3.2. Man beachte, dass jede konvergente
Folge eine Cauchyfolge ist.
Eine analoge Aussage zu Satz 3.3 existiert deshalb nicht, da Monotonie in metri-
schen Räumen nicht sinnvoll erklärt werden kann. Folgende Überlegungen umge-
hen dieses Problem, und gelten natürlich auch für IR. Streicht man aus einer Folge
(an )n∈IN einige Glieder, so erhält man eine neue Folge. Formal kann man dies wie
folgt beschreiben.
Definition 4.15. Ist n1 < n2 < . . . < nk < . . . eine Folge natürlicher Zahlen, so heißt
(ank )k∈IN eine Teilfolge von (an )n∈IN. .
Ist z.B. an = (−1)n , so sind sowohl (bk )k∈IN mit bk = 1 als auch (ck )k∈IN mit ck = −1
Teilfolgen von (an )n∈IN . Selbstverständlich hat (an )n∈IN noch weitere Teilfolgen.
Satz 4.16. Ist (an )n∈IN eine Folge in einem metrischen Raum (M, d), die gegen
a ∈ M konvergiert, so konvergiert auch jede Teilfolge (ank )k∈IN gegen a.
Beweis. Ist n1 < n2 < . . ., so gilt nk ≥ k für alle k ∈ IN. Zu  > 0 existiert ein N ∈ IN
mit d(ak , a) <  für alle k ≥ N.
d
Folglich gilt auch d(ank , a) <  für alle k ≥ N, also ank −→ a mit k → .

Lemma 4.17. Es seien (an )n∈IN eine Folge in einem metrischen Raum (M, d) und
a ∈ M. Folgende drei Aussagen sind äquivalent:
(i) Zu jedem  > 0 und jedem N ∈ IN gibt es ein n ≥ N mit d(an , a) <  .
(ii) Für jedes  > 0 ist die Menge {n ∈ IN : d(an , a) <  } unendlich.
(iii) Es gibt eine Teilfolge (ank )k∈IN von (an )n∈IN , die gegen a konvergiert.
Beweis. Wir zeigen (i)⇒(iii)⇒(ii)⇒(i).

Gilt (i), so existiert zu  = 1 und N = 1 ein n1 ≥ 1 mit d(an1 , a) < 1. Betrachte
nun  = 12 und N = n1 + 1. Dazu existiert n2 ≥ N > n1 mit d(an2 , a) < 12 . Rekursiv
erhält man n1 < n2 < . . . mit d(ank , a) < 1k für alle k ∈ IN, also lim ank = a.
k→
Gilt (iii), so existiert zu beliebigem  > 0 ein N ∈ IN mit d(ank , a) <  für alle
k ≥ N, d.h. {nk ∈ IN : k ≥ N} ⊆ {m ∈ IN : d(am , a) <  }, womit letztere Menge
unendlich ist.
4.4 Teilfolgen und Häufungswerte 49
Schließlich gelte (ii). Seien  > 0 und N ∈ IN vorgegeben. Dann muss es einen
Index n geben mit n ≥ N und d(an , a) <  , denn sonst wäre {n ∈ IN : d(an , a) <  }
endlich.

Definition 4.18. Sei (an )n∈IN eine Folge in einem metrischen Raum (M, d). Ein Ele-
ment a ∈ M heißt Häufungswert von (an )n∈IN , falls für jedes  > 0 die Menge
{n ∈ IN : d(an , a) <  } unendlich ist.
Lemma 4.17 liefert demnach drei gleichwertige Charakterisierungen der Aussage
a ist Häufungswert von (an )n∈IN “.
”
Satz 4.19 (Bolzano-Weierstraß). Jede beschränkte Folge (an )n∈IN reeller Zahlen
besitzt einen Häufungswert.
Beweis. Da {an : n ∈ IN} beschränkt ist, existieren A1 , B1 ∈ IR mit {an : n ∈ IN} ⊆

[A1 , B1 ] =: I1 . Wir konstruieren rekursiv Ik = [Ak , Bk ] mit
(i) [Ak , Bk ] enthält unendlich viele Glieder von (an )n∈IN ,
(ii) [Ak+1 , Bk+1 ] ⊆ [Ak , Bk ] ,
1
(iii) Bk − Ak = 2k−1
(B1 − A1 ) .
Dazu gehen wir wie folgt vor: Ist [Ak , Bk ] gegeben, so setze M := 12 (Ak + Bk ). Da
[Ak , Bk ] unendlich viele Glieder von (an )n∈IN enthält, sind mindestens in einem der
beiden Intervalle [Ak , M] und [M, Bk ] unendlich viele an . Wir setzen

[Ak , M] , falls in [Ak , M] unendlich viele an liegen,
[Ak+1 , Bk+1 ] :=
[M, Bk ] , sonst.


Damit ist (Ik )k∈IN eine Intervallschachtelung. Sei Ik = {a}.
k=1
Nun ist a Häufungswert von (an )n∈IN , denn zu  > 0 existiert ein k ∈ IN mit
[Ak , Bk ] ⊆ U (a) =]a −  , a +  [, also enthält ]a −  , a +  [ unendlich viele an .

Korollar 4.20. Jede beschränkte Folge (an )n∈IN in (IRd , · 2 ) besitzt einen Häu-
fungswert. (Insbesondere hat jede beschränkte Folge in C einen Häufungswert.)
Beweis. Sei etwa an = (an,1 , . . . , an,d ) ∈ IRd . Wir betrachten die beschränkte Folge
(an,1 )n∈IN in IR. Laut Satz 4.19 und Lemma 4.17 existiert eine konvergente Teilfolge
(ank ,1 )k∈IN von (an,1 )n∈IN .
Betrachte nun (ank ,2 )k∈IN . Wir setzen bk,2 := ank ,2 . Wieder existiert eine konver-
gente Teilfolge (bk ,2 )∈IN .
Geht man weiter so vor bis zur d-ten Komponente, erhält man eine Teilfolge
(anm )m∈IN von (an )n∈IN , die in (IRd , · 2 ) konvergiert, da jede der Komponenten-
folgen (anm , j )m∈IN , j = 1, . . . , d, in IR konvergiert.

Definition 4.21. Man sagt, eine Folge (an )n∈IN reeller Zahlen divergiert gegen 
(oder konvergiert uneigentlich gegen ), wenn es zu jedem C > 0 ein N ∈ IN gibt,
sodass an > C für alle n ≥ N gilt.
Divergiert (−an )n∈IN gegen , so sagt man, dass (an )n∈IN gegen − divergiert.
Beispiel: (qn )n∈IN divergiert gegen , falls q > 1 ist.
Es sei (an )n∈IN eine nach oben beschränkte Folge reeller Zahlen. Für jedes n ∈ IN
existiert bn := sup{ak : k ≥ n} und (bn )n∈IN ist eine monoton fallende Folge. Wir
unterscheiden zwei Fälle:
• Ist {bn : n ∈ IN} nach unten beschränkt, dann existiert nach Satz 3.3

lim sup an := lim bn = inf bn = inf sup ak .
n→ n→ n∈IN n∈IN k≥n
• Ist {bn : n ∈ IN} nicht nach unten beschränkt, so divergiert (bn )n∈IN gegen −,
und wir schreiben
lim sup an := − .
n→
Falls (an )n∈IN nicht nach oben beschränkt ist, so setzen wir lim sup an := .
n→
Man bezeichnet lim sup an als Limes superior der Folge (an )n∈IN .
n→
Analog führen wir den Limes inferior von (an )n∈IN ein. Falls die Folge (an )n∈IN
nach unten beschränkt ist, betrachten wir cn := inf{ak : k ≥ n}. Dann ist (cn )n∈IN
eine monoton wachsende Folge.
• Ist {cn : n ∈ IN} nach oben beschränkt, so setzen wir

lim inf an := lim cn = sup cn = sup inf ak .
n→ n→ n∈IN n∈IN k≥n
• Ist {cn : n ∈ IN} nicht nach oben beschränkt, so schreiben wir
lim inf an :=  .
n→
Ist schließlich (an )n∈IN nicht nach unten beschränkt, so setzen wir lim inf an := −.
n→
Beispiele:
(1) Sei an := n.
Hier gilt lim sup an = , da {an : n ∈ IN} nicht nach oben beschränkt ist.
n→
Für den Limes inferior gilt cn = inf{ak : k ≥ n} = n. Da (cn )n∈IN nicht nach
oben beschränkt ist, folgt lim inf an = .
n→
Achtung: Es ist lim inf an = inf an !
n→ n∈IN
4.4 Teilfolgen und Häufungswerte 51
(2) Sei an := (−1)n n. Es gilt
lim sup an =  und lim inf an = − ,

n→ n→
da (an )n∈IN weder nach oben noch nach unten beschränkt ist.
(3) Seien a < b und
a für n ungerade ,
an :=
b für n gerade .
Dann gilt lim sup an = b und lim inf an = a, denn bn = b, cn = a ∀n ∈ IN.
n→ n→

(4) Sei an := (−1)n1 + 1n , d.h. (an )n∈IN = −2, 32 , − 43 , 54 , − 65 , . . . .Es gilt

1 + 1n für n gerade ,
bn = sup{ak : k ≥ n} = 1
1 + n+1 für n ungerade .
Folglich ist lim sup an = lim bn = 1. Ferner haben wir

n→ n→

− 1 + 1n für n ungerade ,
cn = inf{ak : k ≥ n} = 1

− 1 + n+1 für n gerade ,
also lim inf an = lim cn = −1.

n→ n→
Bemerkung: Da, falls (an )n∈IN nach oben und unten beschränkt ist, offensichtlich
cn = inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} = bn gilt, folgt stets
lim inf an ≤ lim sup an .

n→ n→
Dies ist auch richtig für eine unbeschränkte Folge (an )n∈IN , wenn wir − < a < 
für a ∈ IR vereinbaren.
Satz 4.22. Eine Folge (an )n∈IN reeller Zahlen ist genau dann konvergent, wenn
− < lim inf an = lim sup an < 

n→ n→
gilt. Wir haben dann Gleichheit der drei Grenzwerte, lim inf an = lim an = lim sup an .
n→ n→ n→
Beweis. Sei (an )n∈IN konvergent gegen a. Zu  > 0 existiert also ein N ∈ IN mit
a −  < an < a +  für alle n ≥ N. Es folgt
a −  ≤ inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} ≤ a + 
für n ≥ N und damit a −  ≤ lim inf an ≤ lim sup an ≤ a +  .

n→ n→
Da  > 0 beliebig war, folgt lim inf an = lim an = lim sup an .
n→ n→ n→
Gelte nun a = lim inf an = lim sup an für ein a ∈ IR.

n→ n→
Zu  > 0 existiert also ein N ∈ IN mit
a −  < inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} < a + 
für alle n ≥ N. Es ist dann a −  < an < a +  für n ≥ N, also lim an = a.

n→
Bemerkung: Man kann sich leicht überlegen, dass für uneigentliche Konvergenz
folgendes gilt: Eine Folge (an )n∈IN reeller Zahlen ist genau dann uneigentlich kon-
vergent gegen  (bzw. −), falls
lim inf an = lim sup an =  (bzw. −) .

n→ n→
Wir wollen nun noch die Beziehung zu Häufungswerten aufzeigen.
Satz 4.23. (a) Eine nach oben beschränkte Folge (an )n∈IN reeller Zahlen hat genau
dann mindestens einen Häufungswert, wenn a∗ := lim sup an endlich ist.
n→
In diesem Fall ist a∗ der größte Häufungswert von (an )n∈IN .
(b) Eine nach unten beschränkte Folge (an )n∈IN reeller Zahlen hat genau dann min-
destens einen Häufungswert, wenn a∗ := lim inf an endlich ist.
n→
In diesem Fall ist a∗ der kleinste Häufungswert von (an )n∈IN .
Beweis. Wir zeigen nur (a); der Beweis von (b) geht ganz analog.
Sei s ein Häufungswert von (an )n∈IN . Dann gilt bn := sup{ak : k ≥ n} ≥ s, also
ist (bn )n∈IN konvergent mit a∗ = lim bn ≥ s.
n→

Ist umgekehrt a∗ := lim sup an ∈ IR, so gibt es zu  > 0 ein N ∈ IN mit bn − a∗ < 2
n→
für alle n ≥ N, denn (bn )n∈IN konvergiert monoton fallend gegen a∗ . Weiter gibt es zu
jedem n0 ∈ IN ein n ≥ n0 mit |an − a∗ | <  ; laut Lemma 4.17 ist a∗ ein Häufungswert
von (an )n∈IN .

Bemerkung: Unbeschränkte Folgen können durchaus Häufungswerte haben. Zum

Beispiel hat (an )n∈IN mit

1
für n ungerade ,
an = n
(−1)n/2 n für n gerade .
einen Häufungswert 0, ist aber nach oben und unten unbeschränkt.
Korollar 4.24. Sei (an )n∈IN eine nach oben und unten beschränkte reelle Folge.
Dann ist lim inf an der kleinste und lim sup an der größte Häufungswert von (an )n∈IN .
n→ n→
Beweis. Die beidseitige Beschränktheit liefert, dass lim bn und lim cn existieren.
n→ n→
Nun wende Satz 4.23 an.

4.5 Aufgaben 53
Nützlich ist folgende Ungleichung. Seien (an )n∈IN und (dn )n∈IN zwei Folgen reeller
Zahlen mit an ≤ dn für alle n ≥ N, wobei N eine feste natürliche Zahl ist. Es gilt
lim inf an ≤ lim inf dn , (4.3)

n→ n→
lim sup an ≤ lim sup dn . (4.4)

n→ n→
Zum Schluss halten wir noch eine charakteristische Eigenschaft von Limes superior
und Limes inferior fest.
Satz 4.25. (a) Seien (an )n∈IN eine nach oben beschränkte Folge reeller Zahlen und
x ∈ IR mit x > lim sup an . Dann existiert N ∈ IN mit an < x für alle n ≥ N.
n→
(b) Seien (an )n∈IN eine nach unten beschränkte Folge reeller Zahlen und x ∈ IR mit
x < lim inf an . Dann existiert N ∈ IN mit an > x für alle n ≥ N.
n→
Beweis. Wir zeigen nur die Aussage (a).

Angenommen, die Behauptung gilt nicht. Dann gibt es also zu jedem N ∈ IN ein
n ≥ N mit an ≥ x. Damit existiert eine Teilfolge (ank )k∈IN mit ank ≥ x für alle k ∈ IN.
Satz 4.19 liefert nun eine konvergente Teilfolge mit Limes größer oder gleich x im
Widerspruch zur Voraussetzung.

4.5 Aufgaben
1. Seien (an )n∈IN eine Folge in einem metrischen Raum (M, d) und a ∈ M. Zeigen
Sie, dass die folgenden drei Aussagen äquivalent sind.
(i) Zu jedem  > 0 gibt es ein N ∈ IN mit d(an , a) <  für alle n ≥ N.
(ii) Zu jedem  > 0 gibt es ein N ∈ IN mit d(an , a) ≤  für alle n ≥ N.

(iii) Zu jedem  > 0 gibt es ein N ∈ IN mit d(an , a) < 2 für alle n ≥ N.
2. Es sei d : C × C → IR gegeben durch

|z − w| , falls  ≥ 0 existiert mit z =  w ,
d(z, w) :=
|z| + |w| , sonst.
Zeigen Sie, dass d eine Metrik ist.
3. Sei d die Metrik aus dem Beispiel zu Definition 4.6. Gibt es eine Norm · in
IR derart, dass d(x, y) = x − y für alle x, y ∈ IR gilt ?
4. Zeigen Sie: Jede Folge reeller Zahlen besitzt eine monotone Teilfolge.
5. Geben Sie jeweils Folgen (an )n∈IN , (bn )n∈IN mit lim an =  und lim bn = 
n→ n→
an, sodass gilt:
a. lim (an − bn ) = 0 b. lim (an − bn) =  c. lim (an − bn) = −

n→ n→ n→
d. lim an =1 e. lim an =0 f. lim an =

n→ bn n→ bn n→ bn
6. Zwei Normen · a und · b auf X heißen äquivalent, wenn c,C > 0 existieren
derart, dass
c · xa ≤ xb ≤ C · xa
gilt für alle x ∈ X.
Zeigen Sie, dass die Normen · 1, · 2 und ·  auf IRd äquivalent sind.
7. Bestimmen Sie alle Häufungswerte der Folgen (an )n∈IN mit

n
a. an := 1 + 1n ,
b. an := 2n + 1,
c. an := in ,
d. an := 1n in .
8. Geben Sie jeweils eine Folge (an )n∈IN reeller Zahlen an derart, dass die Menge
der Häufungswerte von (an )n∈IN
a. leer,
b. die Menge {0, 1},
c. die Menge ZZ,
ist.
9. Bestimmen Sie Limes Inferior und Limes Superior der Folgen (an )n∈IN mit
1−2n
a. an := (−1)n 5+3n ,
b. an := i + (−i)n ,
n
√
n n
c. an := a + bn (a, b ≥ 0).
Kapitel 5
Reihen
Wir haben in Kapitel 3.1 bereits definiert, was Konvergenz einer Reihe

 ak
k=1
im Fall ak ∈ IK bedeutet. Wir wollen diesen Begriff auf beliebige normierte Räume
ausdehnen. Seien die ak nun Elemente eines normierten Raumes (X, · ). Wie in
IK betrachten wir die Partialsummen
n
sn :=  ak ∈ X .
k=1
Wenn die Folge (sn )n∈IN der Partialsummen gegen ein s ∈ X konvergiert, so sagen
wir, dass die Reihe in X gegen s konvergiert und schreiben

s=  ak .
k=1
5.1 Konvergenz und absolute Konvergenz
Zunächst füllen wir unseren Vorrat an Beispielen auf.

(1) Die Geometrische Reihe: Sei q ∈ C. Es gilt

1
1 + q + q2 + ... =  qk = 1 − q für |q| < 1 ,
k=0
siehe Beispiel (6) in Kapitel 3.1. Wir werden sehen (als Anwendung von
Korollar 5.2), dass die Reihe für |q| ≥ 1 nicht konvergiert.

56 5 Reihen

1
(2) Die Harmonische Reihe  k konvergiert nicht.
k=1
n
1
Mehr noch, die Folge ihrer Partialsummen sn :=  k divergiert gegen .
k=1
Beweis. Für k ∈ IN und n ≥ 2k gilt

1 1 1
sn = 1 + + + ···+
2 3 n
1 1 1 1 1 1 1
≥ 1+ + + + + ···+ + · · · + k−1 + ···+ k
2 3 4 5 8 2 +1 2
1 1 1 1 1
≥ 1 + + 2 + 4 + · · · + 2k−1 k = 1 + k .
2 4 8 2 2
Daher divergiert sn gegen . Es ist sogar lim inf sn =  = lim sup sn .

n→ n→

1 1
(3) Die Eulersche Zahl. Es gilt lim 1 + =: e =  .
n→ n k=0 k!
Wir haben die Zahl e in Beispiel 1.7 durch eine Intervallschachtelung erklärt.
Zu zeigen bleibt das zweite Gleichheitszeichen.
n n
Beweis. Bezeichne sn :=  k!1 und tn := 1 + 1n . Es gilt
k=0

n 1 n 1 n 1
tn = 1 + + + ···+
1 n 2 n2 n nn
1 n(n − 1) 1 n(n − 1)(n − 2)

= 1+1+ + + ···
2! n2 3! n3
1 n(n − 1) · · ·(n − (n − 1))
+
n! nn

1 1 1 1 2
= 1+1+ 1− + 1− 1− + ···
2! n 3! n n

1 1 2 n−1
+ 1− 1− ··· 1 − .
n! n n n
Folglich haben wir tn ≤ sn und mit (4.3) folgt e = lim tn ≤ lim inf sn .
n→ n→
Für n ≥ m gilt ferner

1 1 1 1 m−1
tn ≥ 1 + 1 + 1− + ···+ 1− ··· 1 − .
2! n m! n n
Hält man m fest, so folgt mit n →  nun

1 1
e = lim tn ≥ 1 + 1 + + ···+ = sm
n→ 2! m!
5.1 Konvergenz und absolute Konvergenz 57
und mit m →  erhalten wir schließlich
lim sup sm ≤ e ≤ lim inf sn ,

m→ n→
also lim sn = e.

n→

1
(4) Die Reihe  k(k + 1) .
k=1
1
Hier können wir die Partialsummen direkt ausrechnen. Mit k(k+1) = 1k − k+1
1
erhalten wir
n
1 1 1 1 1 1 1
sn =  = 1− + − + · · ·+ − = 1− .
k=1 k(k + 1) 2 2 3 n n+1 n+1
Die Folge (sn )n∈IN ist konvergent; es gilt


1
 k(k + 1) = n→
lim sn = 1 .
k=1
Wir kommen zu einigen elementaren Eigenschaften konvergenter Reihen.

Satz 5.1. Sei (ak )k∈IN eine Folge in einem normierten Raum (X, · ).

Falls die Reihe  ak in (X, · ) konvergiert, so gilt:
k=1
" "
" n "
" "
"  ak " <  für alle n > m ≥ N . (5.1)
"k=m+1 "
Ist (X, · ) ein Banachraum (also vollständig), so folgt aus (5.1) die Konvergenz
der Reihe in (X, · ).
Insbesondere ist in (IRd , · 2 ) die Bedingung (5.1) äquivalent zur Konvergenz
der Reihe.
Beweis. Wegen
n m n
sn − sm =  ak −  ak =  ak
k=1 k=1 k=m+1
ist die Bedingung (5.1) äquivalent dazu, dass die Folge der Partialsummen eine
Cauchyfolge bildet.
Die erste Aussage gilt, da jede konvergente Folge eine Cauchyfolge ist, vgl. Be-
merkung (3) in Kapitel 4.2. In einem Banachraum gilt nach Definition 4.6 auch die
Umkehrung; insbesondere ist (IRd , · 2) ein Banachraum, siehe Satz 4.8.

Korollar 5.2. Sei (ak )k∈IN eine Folge in einem normierten Raum (X, · ).

Konvergiert die Reihe  ak , so gilt ak → 0 in (X, · ) mit k → .
k=1
58 5 Reihen
Beweis. Man muss nur in Satz 5.1 speziell n = m + 1 wählen.

Die Umkehrung gilt jedoch nicht! Ein prominentes Gegenbeispiel ist die Harmo-
nische Reihe. Hier gilt ak = 1k → 0; wie wir bereits festgestellt haben, ist die Reihe

1
 k divergent.
k=1
Anwendung: Die Geometrische Reihe


 qn
n=0
ist im Fall |q| ≥ 1 divergent, denn für n →  gilt hier qn → 0.

 
Zu jeder Reihe  ak mit ak ∈ (X, · ) können wir eine Reihe  ak bilden,
k=1 k=1
deren Summanden nicht-negative reelle Zahlen sind.
Korollar 5.3. Sei (ak )k∈IN eine Folge in einem Banachraum (X, · ).
 
Konvergiert die Reihe  ak in IR, so konvergiert die Reihe  ak in X.
k=1 k=1
Beweis. Es ist " "

" n " n
" "
"  ak " ≤  ak .
"k=m+1 " k=m+1
 
Erfüllt  ak die Bedingung (5.1) in IR, so gilt diese also auch für  ak in X.

k=1 k=1
Definition 5.4. Sei (ak )k∈IN eine Folge in einem normierten Raum.
 
Die Reihe  ak heißt absolut konvergent, falls  ak konvergiert.
k=1 k=1
Korollar 5.3 besagt also, dass jede absolut konvergente Reihe konvergent ist.
Weiter ist folgende hinreichende Bedingung für Konvergenz von Reihen mit nicht-
negativen Gliedern sehr nützlich.
Satz 5.5. Sei (ak )k∈IN eine Folge reeller Zahlen mit ak ≥ 0 für alle k ∈ IN. Die Reihe

 ak konvergiert genau dann, wenn die Menge Ihrer Partialsummen beschränkt ist.
k=1
Beweis. Die Folge (sn )n∈IN der Partialsummen ist hier offensichtlich monoton
wachsend.
Mit Satz 3.3 folgt aus der Beschränktheit von {sn : n ∈ IN} die Konvergenz (der
Folge der Partialsummen), also ist die Reihe in diesem Fall konvergent.
Ist {sn : n ∈ IN} hingegen unbeschränkt, so divergiert (sn )n∈IN gegen .

5.2 Konvergenzkriterien 59
5.2 Konvergenzkriterien
Oft kann man Konvergenz durch Vergleich mit bekannten Reihen zeigen.

Satz 5.6 (Majorantenkriterium). Seien  ck eine konvergente Reihe mit ck ≥ 0
k=1
für alle k, sowie (ak )k∈IN eine Folge in einem Banachraum (X, · ) und k0 ∈ IN mit

ak ≤ ck für alle k ≥ k0 . Dann konvergiert die Reihe  ak absolut.
k=1
 
Die Reihe  ck bezeichnet man dann als (konvergente) Majorante für  ak .
k=1 k=1
n
Beweis. Sei  > 0. Laut Satz 5.1 existiert N ≥ k0 mit  ck <  für n > m ≥ N.
k=m+1
Da
n n
 ak ≤  ck
k=m+1 k=m+1

gilt, folgt wiederum mit Satz 5.1 die absolute Konvergenz von  ak .

k=1

1
Anwendung: Die Reihe  k2 .
k=1
1 1
Für k ≥ 2 gilt k2
≤ (k−1)k . Da die Reihe

1
 (k − 1)k ,
k=2
wie in Beispiel (4) gezeigt, konvergent ist, folgt mit dem Majorantenkriterium die

1
Konvergenz der Reihe  k2
.
k=1
Den Grenzwert dieser Reihe können wir hier allerdings nicht bestimmen. Wir
werden dies in Kapitel 11.2, Beispiel (2) mit Hilfe von Fourierreihen tun; es gilt

1 2
 k2
= 6 .
k=1
Bemerkung: Das Majorantenkriterium beinhaltet das so genannte Minoranten-


kriterium. Sei  ck divergent mit ck ≥ 0 für alle k.
k=1
Ist (ak )k∈IN eine Folge in (X, · ) mit ak ≥ ck für alle k ≥ k0 , so kann die

Reihe  ak jedenfalls nicht absolut konvergieren, denn sonst wäre (ak )k∈IN eine
k=1
konvergente Majorante für (ck )k∈IN .
Die folgenden Konsequenzen aus dem Majorantenkriterium werden meistens für

Reihen in IK formuliert. Die Verallgemeinerung für Reihen in einem Banachraum
kann man sich einfach überlegen.
60 5 Reihen
Satz 5.7 (Quotientenkriterium). Sei (ak )k∈IN eine Folge in IK. Wenn ein Index k0 ∈
IN und eine reelle Zahl q mit 0 ≤ q < 1 existieren, sodass
|ak+1 | ≤ q |ak | für alle k ≥ k0


gilt, dann ist die Reihe  ak absolut konvergent.
k=1
Beweis. Für k > k0 gilt
|ak | ≤ qk−k0 |ak0 | = (|ak0 |q−k0 ) qk .


Da  qk konvergiert (Geometrische Reihe), können wir das Majorantenkriterium
k=k0

anwenden und erhalten die absolute Konvergenz von  ak .

k=1
Bemerkung: Hat man nur |ak+1 | < |ak | für alle k ≥ k0 , so lässt sich daraus nicht die

Konvergenz der Reihe  |ak | herleiten.
k=1
 
1 1
Zum Beispiel erfüllen die Harmonische Reihe  k und auch die Reihe  k2
die
k=1 k=1
Beziehung |ak+1 | < |ak |. Während die Harmonische Reihe divergiert, konvergiert
die zweite Reihe.
Satz 5.8 (Quotientenkriterium). Sei (ak )k∈IN eine Folge in IK mit ak = 0 ∀ k ∈ IN.



a
ak
< 1 gilt, dann konvergiert  ak absolut.
Wenn lim sup
k+1
k→ k=1



ak+1
Wenn k0 ∈ IN existiert mit

a
≥ 1 für alle k ≥ k0 , dann ist  ak divergent.
k
k=1

Beweis. Sei a∗ := lim sup

k+1 ∗
ak
< 1. Dann existiert q mit a < q < 1 und aus
k→

ak
< q für alle k ≥ k0 . Laut Satz 5.7 folgt
Satz 4.25 erhalten wir k0 ∈ IN mit
k+1
nun die erste Behauptung.
Die zweite Aussage impliziert |an | ≥ |ak0 | > 0 für alle n ≥ k0 . Also ist die Bedin-
gung an → 0 hier nicht erfüllt und mit Satz 5.1 folgt die Divergenz der Reihe.


k 3 3k
Beispiel: Die Reihe  .
k=1 k!
Hier gilt

ak+1
(k + 1)3 3k+1 k!

= 3 1 3

a
= 1 + ,
k (k + 1)! k3 3k k+1 k

k→ a
= 0 < 1. Die Reihe ist daher laut Quotientenkriterium konvergent.
also lim
k+1
k
Satz 5.9 (Wurzelkriterium). Sei (ak )k∈IN eine Folge in IK. Wenn es c, q ∈ IR mit
0 ≤ q < 1 und c ≥ 0 gibt derart, dass
|ak | ≤ c qk für alle k ∈ IN


gilt, so ist  ak absolut konvergent.
k=1
Beweis. Man kann direkt das Majorantenkriterium anwenden mit


c  qk
k=1
als konvergente Majorante.

Das Wurzelkriterium wird oft in folgender Form geschrieben.
Satz 5.10 (Wurzelkriterium). Sei (ak )k∈IN eine Folge in IK. Bezeichne

a∗ := lim sup k |ak | .
k→
Es gilt:

(a) Ist a∗ < 1, dann konvergiert die Reihe  ak absolut.
k=1

(b) Ist 1 < a∗ ≤ , dann divergiert  ak .
k=1

Beweis. (a) Sei q mit a∗ < q < 1. Laut Satz 4.25 existiert ein N ∈ IN mit k
|ak | < q
für alle k ≥ N. Damit gilt |ak | < qk für alle k ≥ N und mit

|a j |
c := max : j = 1, . . . , N
qj
erhalten wir schließlich |ak | ≤ c qk für alle k ∈ IN. Die absolute Konvergenz der
Reihe folgt nun aus Satz 5.9.

(b) Ist 1 < a∗ ≤ , so existiert eine Teilfolge mit nm |anm | → a∗ für m → . Damit
ist |an | > 1 für unendlich viele n ∈ IN; insbesondere gilt also an → 0 und mit Korollar
5.2 folgt die Divergenz.

Bemerkung: Im Fall a∗ = 1 erlaubt Satz 5.10 keine Aussage zu Konvergenz oder
 
1 1
Divergenz. Betrachte z.B. wieder die Reihen  k und  k2
.
k=1 k=1
 √ k

k
Beispiel: Die Reihe k−1 .
k=1
√
Mit k |ak | = k k − 1 und lim k |ak | = 0 haben wir hier insbesondere a∗ < 1; das
k→
Wurzelkriterium liefert Konvergenz der Reihe.
62 5 Reihen
Das Wurzelkriterium (Satz 5.10) hat einen größeren Anwendungsbereich als das
Quotientenkriterium (Satz 5.8); es gilt folgendes.
Lemma 5.11. Sei (cn )n∈IN eine Folge positiver Zahlen.

√ c
Dann gilt lim sup n cn ≤ lim sup n+1
cn .
n→ n→
Beweis. Mit der Konvention r <  für alle r ∈ IR gilt die Behauptung im Fall
c
cn =  offensichtlich.
lim sup n+1
n→
cn+1
Im Fall a := lim sup cn ∈ IR gibt es zu beliebigem  > 0 ein m ∈ IN mit
n→
cn+1
≤ a+ für alle n ≥ m ;
cn
es folgt cn+1 ≤ (a +  ) cn für alle n ≥ m. Wir erhalten induktiv
cm+p ≤ (a +  ) p cm für alle p ∈ IN

√
und weiter m+p cm+p ≤ (a +  ) m+p (a+cm )m für alle p ∈ IN. Damit ergibt sich

√ √ cm
lim sup n cn = lim sup cm+p ≤ (a +  ) lim sup
m+p m+p
n→ p→ p→ (a +  )m

cm
= (a +  ) lim sup n = (a +  ) ,
n→ (a +  )m
wobei wir zwei Mal Satz 4.23(a) benutzt haben. Dies gilt für jedes  > 0; es folgt
√ c
lim sup n cn ≤ a = lim sup n+1
cn wie behauptet.

n→ n→
Man findet leicht Reihen, deren Konvergenz man mittels Wurzelkriterium, nicht
aber mit dem Quotientenkriterium

feststellen kann. Sei etwa a2 j = a2 j+1 = 0 für

ak+1

alle j ∈ IN, so gilt lim sup
a
≥ 1; dennoch ist lim sup k |ak | < 1 möglich.
k
k→ k→
Der folgende Satz verallgemeinert die Beweisidee, die beim Nachweis der Di-
vergenz der Harmonischen Reihe benutzt wurde.
Satz 5.12 (Verdichtungskriterium). Sei (ak )k∈IN eine Folge reeller Zahlen mit
a1 ≥ a2 ≥ a3 ≥ · · · ≥ 0.

Die Reihe  ak konvergiert genau dann, wenn
k=1

 2n a2n = a1 + 2a2 + 4a4 + 8a8 + · · ·
n=0
konvergiert.
Beweis. Wir verwenden Satz 5.5 und zeigen die Beschränktheit der jeweiligen Par-
tialsummen. Dazu seien sn := a1 + a2 + · · · + an und tm := a1 + 2a2 + · · · + 2m a2m .
Für n ≤ 2m gilt
sn ≤ a1 + (a2 + a3) + · · · + (a2m + · · · + a2m+1−1 )

≤ a1 + 2a2 + · · · + 2m a2m = tm .
Für n ≥ 2m gilt andererseits
sn ≥ a1 + a2 + (a3 + a4) + · · · + (a2m−1+1 + · · · + a2m )

1 1 1 1 1
≥ a1 + 2a2 + 4a4 + · · · + 2m a2m = tm .
2 2 2 2 2
Daher sind die Folgen (sn )n∈IN und (tm )m∈IN entweder beide beschränkt oder beide
unbeschränkt.

Beispiele:

1
(1) Die Reihe  ns mit s ∈ Q.
n=1
Sie konvergiert für s > 1 und divergiert für s ≤ 1.
1
Beweis. Sei zunächst s ≤ 0. Dann gilt ns → 0 und mit Korollar 5.2 folgt
Divergenz.

Im Fall s > 0 betrachten wir die verdichtete“ Reihe  2n a2n . Es ist
” n=0
 
1
 2n 2ns =  2(1−s)n .
n=0 n=0
Weiter gilt 2(1−s) < 1 genau dann, wenn 1 − s < 0, also s > 1 ist und mit der
Konvergenz bzw. Divergenz der Geometrischen Reihe folgt schließlich die
Behauptung.


1
(2) Die Reihe  n (ln n)s .
n=2
Diese konvergiert für s > 1 und divergiert für s ≤ 1.
Beweis. Für s ≤ 0 ist die Harmonische Reihe eine Minorante und es folgt
die Divergenz. Sei nun s > 0. Da ln n monoton wächst, können wir Satz 5.12
anwenden. Hier gilt
  
1 1 1 1
 2n 2n (ln 2n )s =  (n ln 2)s = (ln 2)s  ns
n=1 n=1 n=1
und mit (1) folgt die Behauptung.

64 5 Reihen
Seien (ak )k∈IN0 und (bk )k∈IN0 zwei Folgen in IK. Weiter sei A−1 := 0 und bezeichne
n 
An :=  ak die n-te Partialsumme der Reihe  ak .
k=0 k=0
Für alle m, n ∈ IN0 , m < n, gilt
n n n n−1
 ak bk =  (Ak − Ak−1) bk =  Ak bk −  Ak bk+1
k=m k=m k=m k=m−1
n−1
=  Ak (bk − bk+1) + An bn − Am−1 bm . (5.2)
k=m
Die Gleichung (5.2) ist auch unter dem Namen Abelsche partielle Summation
bekannt (Niels Henrik Abel, 1802-1829, Norwegen). Mit ihrer Hilfe wenden wir
uns Reihen zu, deren Glieder Produkte sind. Folgendes Kriterium ist benannt nach
Johann Peter Gustav Lejeune Dirichlet (1805-1859, Berlin, Göttingen).
Satz 5.13 (Dirichlet). Seien (ak )k∈IN0 und (bk )k∈IN0 zwei Folgen in IK mit folgenden
Eigenschaften:
n
(i) Die Partialsummen An =  ak bilden eine beschränkte Folge.
k=0
(ii) Es gilt b0 ≥ b1 ≥ b2 ≥ · · · ≥ 0 und
(iii) lim bk = 0.
k→

Dann konvergiert die Reihe  ak bk .
k=0
Beweis. Nach (i) gilt M := sup |An | < .

n∈IN0

Sei  > 0. Wegen (iii) existiert N ∈ IN mit bN < 2M . Für n ≥ m ≥ N erhalten wir
mit (ii) und (5.2) nun

n

n−1

 ak bk
=
 Ak (bk − bk+1 ) + An bn − Am−1 bm

k=m

k=m

n−1
≤M  (bk − bk+1) + bn + bm = 2M bm ≤ 2M bN <  .
k=m
Mit Satz 5.1 folgt die Konvergenz.

Korollar 5.14. Sei (ck )k∈IN eine Folge reeller Zahlen mit
(i) |c1 | ≥ |c2 | ≥ |c3 | ≥ · · · ,
(ii) c2k−1 ≥ 0 und c2k ≤ 0 für alle k ∈ IN,
(iii) lim ck = 0.
k→

Dann konvergiert die Reihe  ck .
k=1
5.3 Umordnungssatz und Cauchy-Produkt 65
Beweis. Man hat nur Satz 5.13 anzuwenden mit ak = (−1)k+1 und bk = |ck |.

In Korollar 5.14 handelt es sich um eine alternierende Reihe, d.h. ihre Glieder
sind abwechselnd positiv und negativ. Dieses Resultat wird oft wie folgt formuliert.
Korollar 5.15 (Leibniz-Kriterium). Ist (bk )k∈IN eine monoton fallende Nullfolge,

so konvergiert die Reihe  (−1)k+1 bk .
k=1
Das folgende Beispiel zeigt, dass auf die Monotonie im Leibniz-Kriterium nicht
verzichtet werden kann. Seien etwa
2 1
a2n−1 := und a2n := für n ∈ IN .
n n
4
Es gilt 0 < ak ≤ k für alle k ∈ IN und daher lim ak = 0. Allerdings ist die Reihe
 k→
 (−1)k+1 a k nicht konvergent:
k=1
Betrachten wir dazu die Folge (sn )n∈IN der Partialsummen. Für gerades n, also für
n = 2m mit m ∈ IN, gilt
m
1
sn =  .
k=1 k
Die Folge der Partialsummen ist daher divergent.
5.3 Umordnungssatz und Cauchy-Produkt


Die Reihe  (−1)k+1 1k ist laut Leibniz-Kriterium konvergent. Einerseits ist
k=1

1 1 1 1 1 1 5
1+ − + + − + + − + +··· < .
2 3 4 5 6 7 6

<0 <0
Wenn wir die gleichen Summanden aber in einer anderen Reihenfolge aufaddieren,
etwa immer zwei positive und dann einen negativen, erhalten wir

1 1 1 1 1 1 1 1 5
1+ − + + − + + − +··· > .
3 2 5 7 4 9 11 6 6

>0 >0
Die Reihenfolge der einzelnen Summanden in einer Reihe spielt also eine wichtige
Rolle. Wir wollen nun zeigen, dass man im Fall einer absolut konvergenten Rei-
he die Summanden beliebig umordnen kann, und der Grenzwert sich dabei nicht
ändert. Die obige Reihe ist nicht absolut konvergent. Den Wert der Reihe können
66 5 Reihen
wir an dieser Stelle noch nicht berechnen; dazu verweisen wir auf Kapitel 10.3,
Gleichung (10.2).
 
Ist  : IN → IN bijektiv, so bezeichnen wir  a (k) als Umordnung der Reihe  ak .
k=1 k=1
Satz 5.16 (Umordnungssatz). Ist eine Reihe in einem normierten Raum absolut
konvergent, dann konvergiert auch jede Umordnung dieser Reihe und alle Umord-
nungen haben den selben Grenzwert.

Beweis. Sei  ak absolut konvergent. Weiter seien  : IN → IN bijektiv und
k=1
n n
sn :=  ak , rn :=  a (k)
k=1 k=1
die Partialsummen der ursprünglichen bzw. der umgeordneten Reihe. Nach Voraus-
setzung ist (sn )n∈IN konvergent. Wir müssen zeigen, dass lim (sn − rn ) = 0 gilt.
n→
Dazu betrachten wir für n ∈ IN die Menge Mn := IN \ { (1),  (2), . . . ,  (n)}; ihr
kleinstes Element bezeichnen wir mit mn . Wir erhalten
" "
" "
" "
sn − rn = " 
"k∈{1,...,n}∩M
a k −  a k "
"
n k∈{ (1),..., (n)}∩{n+1,n+2,...}
≤  ak +  ak
k∈{1,...,n}∩Mn k∈{ (1),..., (n)}∩{n+1,n+2,...}
 
≤  ak +  ak ,
k=mn k=n+1
wobei wir die absolute Konvergenz der Reihe benutzt haben, da letztere Ausdrücke
sonst gar nicht existieren.
Wegen Mn ⊇ Mn+1 ist die Folge (mn )n∈IN monoton wachsend.
Außerdem gibt es zu jedem j ∈ IN ein k j mit j =  (k j ); dann ist j ∈ / Mk j und
/ Mn für alle n ≥ k j . Die Folge (mn )n∈IN ist deshalb nicht beschränkt.
weiter j ∈

Sei nun  > 0. Laut Satz 5.1 gibt es ein N ∈ IN mit  ak < 2 .
k=N
Für alle n mit n ≥ N und mn ≥ N gilt folglich sn − rn <  . Daher haben wir
lim (sn − rn ) = 0, was äquivalent zu
n→
 
 ak =  a (k)
k=1 k=1
ist. Die umgeordnete Reihe konvergiert also gegen den selben Grenzwert wie die
ursprüngliche.

5.3 Umordnungssatz und Cauchy-Produkt 67
 
Satz 5.17 (Cauchy-Produkt). Seien  an und  bn konvergente Reihen in IK.
n=0 n=0
n
Für n ∈ IN0 setze cn :=  ak bn−k .
k=0
 
Wenn  an absolut konvergent ist, dann ist die Reihe  cn konvergent mit
n=0 n=0

  
 cn =  a n  bn .
n=0 n=0 n=0
Beweis. Nach Voraussetzung existieren die Grenzwerte

  
 ak =:  ,  bk =:  und  |ak | =: x .
k=0 k=0 k=0
Wir bezeichnen die Partialsummen der Reihen mit

n n n
n :=  ak , n :=  bk , n :=  ck ,
k=0 k=0 k=0
und setzen n := n −  für n ∈ IN0 . Damit gilt
n = a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 bn + a1 bn−1 + · · · + an b0 )

= a0 n + a1 n−1 + · · · + an 0
= a0 ( + n ) + a1( + n−1) + · · · + an( + 0 )
= n  + a0 n + a1 n−1 + · · · + an 0 .

=:rn
Wir müssen zeigen, dass lim n =  gilt.

n→
Wegen lim n =  bleibt lediglich lim rn = 0 zu zeigen.
n→ n→
Sei  > 0. Wegen lim n = 0 gibt es N ∈ IN mit |n | <  für alle n ≥ N. Es folgt
n→
|rn | ≤ |an 0 + · · · + an−N N | + |an−N−1 N+1 + · · · + a0 n |

≤ |an 0 + · · · + an−N N | +  (|an−N−1 | + · · · + |a0|)
≤ |an 0 + · · · + an−N N | +  x
für n ≥ N. Aus lim an = 0 erhalten wir lim |an 0 + · · · + an−N N | = 0. Daher gilt
n→ n→
lim sup |rn | ≤  x. Da  beliebig gewählt werden kann, bleibt nur lim |rn | = 0.

n→ n→
  
Die Reihe  cn bezeichnet man als Cauchy-Produkt der Reihen  an und  bn .
n=0 n=0 n=0
Wenn letztere beide nicht absolut konvergent sind, so ist deren Cauchy-Produkt
möglicherweise nicht konvergent, vgl. Aufgabe 7a.
68 5 Reihen
5.4 Potenzreihen
Definition 5.18. Ist (ck )k∈IN0 eine Folge komplexer Zahlen, so heißt der Ausdruck

 ck zk
k=0
eine Potenzreihe. Die ck nennt man die Koeffizienten der Reihe.

Wir wollen untersuchen, für welche Werte von z ∈ C eine Potenzreihe konver-
giert, und werden gleich sehen, dass jede Potenzreihe für alle z im Inneren eines
gewissen Kreises konvergiert und für z aus dem Äußeren divergiert.

Gelegentlich werden auch Reihen der Form  ck (z − z0 )k betrachtet. Man be-
k=0
zeichnet z0 dann als Entwicklungspunkt.

Satz 5.19. Sei  ck zk eine Potenzreihe. Setze
k=0
1
 := lim sup k
|ck | und R :=
k→ 
(dabei ist R = , falls  = 0 und R = 0, falls  = ). Damit gilt:

(a) Ist |z| < R, so ist die Reihe absolut konvergent.
(b) Ist |z| > R, so ist die Reihe divergent.
Beweis. Setze ak := ck zk .

Laut dem Wurzelkriterium (Satz 5.10) konvergiert die Reihe  ak absolut, falls
k=0
lim sup k |ak | = |z| lim sup k |ck | < 1 ist, und divergiert im Fall |z| lim sup k |ck | > 1.
k→ k→ k→
Das ist exakt die Behauptung.

Die Zahl R heißt Konvergenzradius der Potenzreihe. Offensichtlich gilt
%

R = sup r ≥ 0 :  ck rk konvergiert absolut ,
k=0
wobei R =  zu setzen ist, falls diese Menge nicht beschränkt ist.

Man kann den Konvergenzradius in vielen Fällen auch mit Hilfe des Quotienten-
kriteriums bestimmen.

Satz 5.20. Sei  ck zk eine Potenzreihe.
k=0

c
1
Wenn  := lim
k+1ck
existiert, so ist R =  ihr Konvergenzradius.
k→
(wiederum mit R = , falls  = 0 und R = 0, falls  = )
5.4 Potenzreihen 69
Beweis. Es gilt

ck+1 zk+1

ck+1

<1.
lim
k→
ck zk
< 1 ⇐⇒ |z| k→
lim
ck

=
Im Fall  = 0 erhalten wir mit dem Quotientenkriterium (Satz 5.8):

1
Die Reihe konvergiert

für |z| <  = R absolut. Ist hingegen |z| > R, so gibt es ein

ck+1
1
N ∈ IN derart, dass
ck
> |z| gilt für alle k ≥ N, und es folgt

ck+1 zk+1

c zk
≥ 1 für alle k ≥ N ;
k
die Reihe divergiert.

Im Fall  = 0 gilt |z| < 1 für alle z ∈ C. Die Reihe konvergiert dann absolut für
alle z ∈ C, d.h. R = ; die Aussage gilt also auch in diesem Fall.

Beispiele:

zk
(1) Die Exponentialreihe exp(z) :=  k! .
k=0
|zk +1| k! |z|
Ihr Konvergenzradius ist R = , denn mit (k+1)! |zk |
= k+1 → 0 und Satz 5.8
folgt absolute Konvergenz für alle z ∈ C.

z2k+1 z3 z5 z7
(2) Die Sinusreihe sin(z) :=  (−1)k (2k + 1)! = z − 3! + 5! − 7! ± · · · und
k=0

z2k z2 z4 z6
die Cosinusreihe cos(z) :=  (−1)k (2k)! = 1 − 2! + 4! − 6! ± · · ·
k=0
Sie konvergieren beide für jedes z ∈ C, denn die Exponentialreihe ist jeweils
konvergente Majorante. Also haben diese Reihen ebenfalls den Konvergenz-
radius R = .
 k
z
(3) Die Reihe  hat den Konvergenzradius R = 1.
k=1 k

(4) Die Reihe  kk zk hat den Konvergenzradius R = 0.
k=1

(5) Die Geometrische Reihe  zk hat den Konvergenzradius R = 1.
k=0
(6) Für s ∈ C und k ∈ ZZ verallgemeinern wir die Binomialkoeffizienten,
⎧
⎪ s(s − 1) · · · (s − k + 1)
⎪
⎨ für k ∈ IN ,
s k!
:= 1 für k = 0 ,
k ⎪
⎪
⎩
0 für k < 0 .
70 5 Reihen
Die Binomialreihe zum Exponenten s ∈ C ist definiert durch


s k s(s − 1) 2
Bs (z) :=  z = 1 + sz + z + ···
k=0 k 2!

s
Im Fall s ∈ IN0 gilt = 0 für k > s. Insbesondere für s = n ist damit
k
n
n n
Bn (z) =  z = (1 + z)n .
k=0 k
/ IN0 , so hat die Potenzreihe Bs (z) den Konvergenzradius R = 1. Es gilt

Ist s ∈
nämlich

s k+1

z
|s − k|
s k
k+1

s
= |z|
= |z|
− → |z| mit k →  ,

zk
k
k+1 k + 1 k + 1
also haben wir absolute Konvergenz für |z| < 1 und Divergenz für |z| > 1.
Wurzel- und auch Quotientenkriterium liefern keine Aussage über das Konvergenz-
verhalten auf dem Rand des Konvergenzkreises, also für diejenigen z mit |z| = R. In
der Tat gibt es Potenzreihen, die für manche z mit |z| = R konvergieren, für andere
jedoch nicht.
Die Geometrische Reihe hat den Konvergenzradius R = 1 und konvergiert für
kein z mit |z| = 1.

Satz 5.21. Sei  ck zk eine Potenzreihe mit Konvergenzradius R = 1 und es gelte
k=0
c0 ≥ c1 ≥ c2 ≥ · · · ≥ 0 sowie lim ck = 0.
k→
Dann konvergiert die Potenzreihe für alle z ∈ C mit |z| = 1, z = 1.
n
Beweis. Wir setzen an := zn , bn := cn und An :=  zk .
k=0
Es gilt (1 − z)An = 1 − zn+1. Ist nun |z| = 1, z = 1, so erhalten wir

1 − zn+1
|An | =
 zk
=

≤ 2

k=0
1 − z
|1 − z|
für alle n ∈ IN0 und mit Satz 5.13 folgt nun die Behauptung.

  k
zk z
Anwendung: Die Reihen  k
und  2 .
k
k=1 k=1
Sie erfüllen beide die Voraussetzungen von Satz 5.21 (die Tatsache, dass es hier
keinen 0-ten“ Koeffizienten gibt, spielt keine Rolle, wie man sich leicht überlegen
”
kann), sind also konvergent für alle z mit |z| = 1, z = 1.
Allerdings konvergiert erstere nicht für z = 1 (Harmonische Reihe), während die
zweite für z = 1 konvergent ist (siehe auch die Anwendung nach Satz 5.6).
5.5 Exponentialreihe und Eulersche Formel 71
5.5 Exponentialreihe und Eulersche Formel
Die Exponentialreihe ist uns im vorigen Abschnitt bereits begegnet. Sie hat den
Konvergenzradius R = , ist also für alle z ∈ C konvergent. Daher ist durch

zk
exp(z) :=  k!
k=0
eine Abbildung exp : C → C erklärt. Man bezeichnet sie als Exponentialfunktion.

Sie spielt eine herausragende Rolle in der Analysis ( natürliches“ Wachstum) und
”
steht in engem Zusammenhang mit den trigonometrischen Funktionen Sinus und
Cosinus (die wir bisher nur über Potenzreihen definiert haben!). Aus der absoluten
Konvergenz der Reihe erhalten wir für z, w ∈ C mit dem Cauchy-Produkt (Satz 5.17)

 n   n k
z wn z wn−k
  =  
n=0 n! n=0 n! n=0 k=0 k! (n − k)!

 
1 n n! (z + w)n
=   k! (n − k)! zk wn−k
n! k=0
=  n!
.
n=0 n=0
Es gilt also die Funktionalgleichung der Exponentialfunktion,
exp(z + w) = exp(z) exp(w) (5.3)
für alle z, w ∈ C. Weiter betrachten wir die Reihen

 
(−1)k 2k (−1)k
cos(z) :=  z und sin(z) :=  (2k + 1)! z2k+1 .
k=0 (2k)! k=0
Beide werden durch die Exponentialreihe majorisiert und sind deshalb für alle z ∈ C
absolut konvergent. Für n ∈ IN erhalten wir
4n+1
(iz) j 1 1 1 1 4n
 j!
= 1 − z2 + z4 − z6 ± · · · +
2 4! 6! (4n)!
z
j=0

1 3 1 5 1 4n+1
+i z − z + z ∓ · · · + z
3! 5! (4n + 1)!
2n 2n
(−1)k 2k (−1)k 2k+1
=  z +i  z .
k=0 (2k)! k=0 (2k + 1)!
Grenzwertbildung n →  liefert nun die als Eulersche Formel bekannte Gleichung
exp(iz) = cos(z) + i sin(z) . (5.4)
Mit cos(z) = cos(−z) und sin(z) = − sin(−z) folgt exp(−iz) = cos(z) − i sin(z).
72 5 Reihen
Weitere Eigenschaften der Exponentialfunktion:


1 1
(1) Es gilt exp(1) =  = e = lim 1 + , vgl. Kapitel 5.1, Beispiel(3).
k=0 k! n
n→
1
(2) Für alle z ∈ C gilt exp(−z) = exp(z) und insbesondere exp(z) = 0, denn die
Funktionalgleichung (5.3) liefert exp(z) exp(−z) = exp(z − z) = exp(0) = 1.
(3) Es ist exp(x) > 0 für alle x ∈ IR; genauer gilt sogar exp(x) > 1 für x > 0 und
0 < exp(x) < 1 für x < 0.
Beweis. Die Aussage für x > 0 ist klar, da in der Reihe dann alle Glieder
positiv sind; die Aussage für x < 0 folgt nun mit (2).

(4) Für x, y ∈ IR mit x < y gilt exp(x) < exp(y).
Beweis. Laut (3) gilt exp(y − x) > 1; Funktionalgleichung und (2) liefern
exp(y)
exp(y − x) = exp(y) exp(−x) =
exp(x)
und insgesamt folgt exp(x) < exp(y).

(5) Für alle t ∈ IR gilt | exp(it)| = 1.
Beweis. Aus der Eulerschen Formel (5.4) erhalten wir cos(t) = Re (exp(it))
sowie sin(t) = Im (exp(it)) und damit exp(−it) = exp(it) für t ∈ IR. Ande-
1
rerseits gilt auch exp(it) = exp(−it) ; es bleibt also nur | exp(it)| = 1.

exp(it)
i sin(t) Fasst man C als Euklidischen Raum auf,
so liegen die Punkte z = exp(it) auf dem
1 Kreis um den Nullpunkt mit Radius 1. Es gilt
cos(t) cos(t) = Re (exp(it)), sin(t) = Im (exp(it))
sowie
1 = | exp(it)|2 = (cos(t))2 + (sin(t))2 .
Satz 5.22 (Additionstheoreme für Sinus und Cosinus). Für z, w ∈ C gilt
cos(z + w) = cos z cos w − sin z sin w und

sin(z + w) = sin z cos w + cosz sin w .
Beweis. Mit Hilfe von Eulerscher Formel und Funktionalgleichung erhalten wir
cos(z + w) + i sin(z + w) = exp(i(z + w)) = exp(iz) exp(iw)

= (cos z + i sin z)(cos w + i sin w)
= cos z cos w − sin z sin w + i(sin z cos w + cosz sin w)
5.6 Die Räume 1 , 2 und  73
und
cos(z + w) − i sin(z + w) = exp(−i(z + w)) = exp(−iz) exp(−iw)

= (cos z − i sin z)(cos w − i sin w)
= cos z cos w − sin z sin w − i(sin z cosw + cosz sin w) .
Addieren bzw. subtrahieren wir die Gleichungen, so folgt die Behauptung.

5.6 Die Räume 1 , 2 und 
Den normierten Raum  = {a = (an )n∈IN : an ∈ IK , {an : n ∈ IN} beschränkt} mit

der Norm a = sup |an | kennen wir bereits aus Kapitel 4.1. Wir definieren nun
n∈IN
 
1 := {a = (an )n∈IN : an ∈ IK ,  |an| < } , a1 :=  |an| , und
n=1 n=1
1/2
 
2
:= {a = (an )n∈IN : an ∈ IK ,  |an| 2
< } , a2 :=  |an| 2
.
n=1 n=1
Es ist nicht schwer einzusehen, dass 1 mit · 1 ein normierter Raum ist. Dies kann
einfach auf direktem Wege gezeigt werden.
Für 2 sind hierzu einige weitere Überlegungen nötig.
Aus a = (an )n∈IN ∈ 2 und b = (bn )n∈IN ∈ 2 folgt a + b = (an + bn )n∈IN ∈ 2 ,
denn es ist |an + bn |2 ≤ |an |2 + 2|an| |bn | + |bn|2 ≤ 2(|an |2 + |bn |2 ).
Auch in 2 gilt eine Cauchy-Ungleichung (vgl. Satz 4.4).
Satz 5.23 (Cauchy-Ungleichung). Seien a = (an )n∈IN ∈ 2 und b = (bn )n∈IN ∈ 2 .
Dann gilt ab = (an bn )n∈IN ∈ 1 und
1/2 1/2
  
ab1 =  |an bn| ≤  |an | 2
 |bn| 2
= a2 b2 .
n=1 n=1 n=1
Beweis. Aus Satz 4.4 erhalten wir

1/2 1/2
d d d
 |anbn | ≤  |an | 2
 |bn| 2
n=1 n=1 n=1
1/2 1/2
 
≤  |an |2  |bn|2 = a2 b2 < 
n=1 n=1
für jedes d ∈ IN. Damit folgt (an bn )n∈IN ∈ 1 und die Ungleichung ist erfüllt.

74 5 Reihen
Analog zum Beweis von Satz 4.5 folgt nun die Minkowski-Ungleichung in 2 . Für
alle a, b ∈ 2 gilt
a + b2 ≤ a2 b2 .
Damit ist nun leicht ersichtlich, dass auch 2 mit · 2 ein normierter Raum ist.
Zum Schluss zeigen wir noch, dass die hier betrachteten Räume vollständig sind.
Satz 5.24. Die normierten Räume ( p , · p), p ∈ {1, 2, }, sind Banachräume.
Beweis. Wir müssen nur noch die Vollständigkeit zeigen.

Sei (an )n∈IN eine Cauchyfolge in p . Man beachte, dass hier an ∈ p ist, also etwa
an = (an,1 , an,2 , an,3 , . . .). Zu  > 0 gibt es dann N ∈ IN mit
1/p

an − am p =  |an,k − am,k | p
< (p = 1, 2)
k=1
bzw. an − am  = sup |an,k − am,k | <  (p = )

k∈IN
für m, n ≥ N. Damit ist für jedes k ∈ IN die Folge (an,k )n∈IN eine Cauchyfolge in IK.
Also existiert der Grenzwert k := lim an,k .
n→
· p
Zu zeigen bleibt  = (k )k∈IN ∈ p und an −→  .
Mit m →  erhalten wir für alle n ≥ N und l ∈ IN nun
1/p
l
 |an,k − k | p
≤ bzw. sup |an,k − k | ≤  .
k=1,...,l
k=1
Damit gilt auch

1/p

 |an,k − k | p
≤ bzw. sup |an,k − k | ≤ 
k∈IN
k=1
für alle n ≥ N und es folgt die Behauptung.

Satz 5.25. In 2 ist durch


a, b :=  ak bk
k=1
ein Skalarprodukt erklärt. Mit diesem ist 2 ein Hilbertraum.
Beweis. Mit Satz 5.23 sehen wir, dass die Reihe a, b in der Tat für alle a, b ∈ 2
konvergiert. Die geforderten Eigenschaften eines Skalarproduktes kann man nun
mit Hilfe der Rechenregeln für Grenzwerte einfach nachprüfen.

Weiter gilt nach Konstruktion a, a = a2 und mit dieser Norm ist 2 laut
Satz 5.24 vollständig. Also ist 2 ein Hilbertraum.

5.7 Aufgaben 75
5.7 Aufgaben
1. Welche der folgenden Reihen sind konvergent ?

  
nn n2 + 3n n2
a.  n! + nn b.  n3 − 3n c.  n!
n=1 n=1 n=1
 
n! an
d.  nn e.  n
(a > 0)
n=1 n=1 1 + a
2. Zeigen Sie:
 |an | 
Wenn die Reihe  an absolut konvergent ist, dann ist  konvergent.
n=1 n=1 n
3. Zeigen Sie, dass die folgenden Reihen konvergieren und bestimmen Sie ihren
Grenzwert.

n−1
a. 
n=1 n!

1
b.  n(n + 2)
n=1

an
c.  n+1
(a ∈ C , a = −1)
n=0 (a + 1)

d.  (−1)n a2n (a ∈ C)
n=0
4. Bestimmen Sie die Konvergenzradien der folgenden Potenzreihen.

  
nn zn
 (n + 1)! zn  (n + (−1)n)!  2nzn
2
a. b. c.
n=0 n=0 n=1
 
2n n
d.  n
z e.  (an + bn)zn (a, b > 0)
n=0 n=1
5. Finden Sie ein Beispiel einer Reihe, deren Konvergenz man mit dem Wurzelkri-
terium (Satz 5.10), nicht aber mit dem Quotientenkriterium (Satz 5.8) folgern
kann.
6. Sei (bk )k∈IN eine monoton fallende Nullfolge. Laut Leibniz-Kriterium existiert
der Grenzwert

s :=  (−1)k+1bk .
k=1
Zeigen Sie: Für die Partialsummen sn dieser Reihe gilt |sn − s| ≤ bn+1 ∀n ∈ IN.
76 5 Reihen

(−1)n
7. a. Die Reihe  √
n+1
ist laut Leibniz-Kriterium konvergent.
n=0
Zeigen Sie, dass das Cauchy-Produkt dieser Reihe mit sich selbst divergent
ist. Betrachten Sie also
n
(−1)n
an := bn := √
n+1
und cn :=  ak bn−k für n ∈ IN
k=0

und zeigen Sie, dass die Reihe  cn nicht konvergiert.
n=0

b. Folgern Sie, dass die Reihe  √1 nicht konvergiert.
n
n=1

1
8. Zeigen Sie, dass e = exp(1) =  n! irrational ist.
n=0
Gehen Sie dabei wie folgt vor:

N
1 2
Zeigen Sie Sie zunächst 0 < e −  n! ≤ (N+1)! für n ∈ IN.
n=0
p
Nehmen Sie nun an, es sei e ∈ Q, d.h. es gebe p ∈ ZZ, N ∈ IN mit e = N und
folgern Sie daraus
N
1
N! e −  ∈ IN.
n=0 n!
Leiten Sie hieraus unter Benutzung obiger Abschätzung einen Widerspruch her.
9. a. Zeigen Sie: Für z ∈ C und n ∈ IN gilt
(cos z + i sin z)n = cos(nz) + i sin(nz) .
b. Geben Sie sin(3z) mit Hilfe von cosz und sin z an.
10. Die Folge der Fibonacci-Zahlen wird definiert durch
a0 := 0 , a1 := 1 , an+1 := an + an−1 für n ∈ IN .
a. Zeigen Sie: Für alle n ∈ IN gilt an+1 an−1 − a2n = (−1)n .

an+1
Für n ∈ IN betrachten wir qn := .
an
b. Zeigen Sie, dass die Folge (qn )n∈IN konvergent ist.
n
Hinweis: Es gilt qn+1 − 1 =  (qk+1 − qk ).
k=1
c. Bestimmen Sie den Grenzwert lim qn .

n→
1
Tipp: Es gilt qn+1 = 1 +
qn
5.7 Aufgaben 77
 
11. Seien  an zn und  bn zn Potenzreihen mit Konvergenzradien Ra bzw. Rb .
n=0 n=0
n
Weiter sei cn :=  ak bn−k für n ∈ IN0 .
k=0
Zeigen Sie: Für z ∈ C mit |z| < min{Ra , Rb } gilt

  
 anzn  bnzn =  cn zn .
n=0 n=0 n=0
12. Eine Reihe der Form


ak
 ks
k=1
(hier zunächst für s ∈ Q) heißt Dirichletsche Reihe.

Zeigen Sie:
 
ak ak
a. Konvergiert  k s0 für ein s0 , so konvergiert  ks für jedes s > s0 .
k=1 k=1
b. Es gibt  ∈ IR, sodass die Reihe konvergiert für s >  und divergiert für
s < .
13. Zeigen Sie: Es gilt 1 2  .

Kapitel 6
Stetigkeit
Wir werden den Begriff der Stetigkeit hier für Abbildungen zwischen metrischen
Räumen einführen. In Kapitel 12 werden wir diesen Begriff weiter ausbauen.
Die Stetigkeit kann noch allgemeiner in beliebigen so genannten topologischen
Räumen, die nicht notwendigerweise eine Metrik tragen müssen, erklärt werden.
Wir werden dies am Ende von Kapitel 12.2 kurz aufgreifen; mehr dazu findet man
in Lehrbüchern zur Topologie, wie etwa [10] oder [18].
6.1 Stetige Abbildungen
Definition 6.1. Seien (X, dX ) und (Y, dY ) metrische Räume.

Eine Abbildung f : X → Y heißt stetig in p ∈ X, falls für jedes  > 0 eine Zahl
 > 0 existiert, sodass gilt:
dY ( f (x), f (p)) <  für alle x ∈ X mit dX (x, p) <  .
Ist f stetig in allen Punkten p ∈ X, so heißt f stetig (oder stetig auf X).
Den Raum der stetigen Funktionen X → Y bezeichnen wir mit C(X,Y ). Im Fall
Y = IK mit der natürlichen Metrik schreiben wir C(X) an Stelle von C(X, IK).

f (p) f (p)

 
p p
Zu jedem  > 0 gibt es ein  > 0 derart, dass dY ( f (x), f (p)) <  für alle
x ∈ X mit dX (x, p) <  gilt. Man beachte, dass  von  und auch von p
abhängen kann.

80 6 Stetigkeit
Mit der Bezeichnung UrdX (x) := {y ∈ X : dX (y, x) < r}, vgl. Kapitel 4.1, kann man
die Stetigkeit wie folgt ausdrücken:
Die Abbildung f ist stetig in p genau dann, wenn es zu jedem  > 0 ein  > 0
gibt mit
f UdX (p) ⊆ UdY ( f (p)) .
Sind z.B. X = M ⊆ IR und Y = IR (jeweils mit der gewöhnlichen Metrik), so heißt

Stetigkeit in p ∈ M, dass zu jedem  > 0 ein  > 0 existiert mit
f ( ]p −  , p +  [ ) ⊆ ] f (p) −  , f (p) +  [ .
Beispiele:
(1) Die konstante Funktion f : IR → IR, f (x) = c, ist stetig, denn es gilt stets
| f (x) − f (p)| = 0 <  .
(2) Die Funktion f : IR → IR, f (x) = x2 ist stetig.


Beweis. Zu p ∈ IR,  > 0 wähle  = min 1, 2|p|+1 .
Ist dann nämlich |x − p| <  , so gilt
| f (x) − f (p)| = |x2 − p2| = |x + p| |x − p| ≤ (|x| + |p|) |x − p|
und mit |x| ≤ |x − p| + |p| erhalten wir weiter
(|x| + |p|) |x − p| ≤ (|x − p| + 2|p|) |x − p| ≤ (1 + 2|p|) |x − p| <  .
Es gilt also | f (x) − f (p)| <  für alle x ∈ IR mit |x − p| <  .

(3) Die Funktion f : IR → IR,
⎧
⎨ 1 für x > 0 ,
f (x) = sgn (x) := 0 für x = 0 ,
⎩
−1 für x < 0 ,
ist nicht stetig in p = 0, denn für  ≤ 1 gibt es kein passendes“  > 0, sodass
”
sgn ( ] −  ,  [ ) ⊆ ] −  ,  [ gilt, weil stets sgn ( ] −  ,  [ ) = {−1, 0, 1} ist.
(4) Sei (M, d) ein metrischer Raum. Die Identität f : M → M, f (x) = x ist stetig,
denn zu  > 0 kann man  =  wählen. Aus |x − p| <  folgt dann immer
| f (x) − f (p)| <  .
(5) Seien (M, d) ein metrischer Raum, b ∈ M ein fester Punkt. Die Funktion
f : M → IR, f (x) = d(x, b) ist stetig.
Beweis. Zu  > 0 wähle  =  . Aus d(x, p) <  folgt dann mit der Drei-
ecksungleichung | f (x) − f (p)| = |d(x, b) − d(p, b)| ≤ d(x, p) <  =  .

(5) Sei (IRd , · 2 ) der d-dimensionale Euklidische Raum. Für j ∈ {1, . . . , d}
bezeichnen wir mit  j : IRd → IR,  j (x) = x j , die Projektion auf die j-te Ko-
6.1 Stetige Abbildungen 81
ordinate (Koordinatenfunktion). Die Funktionen  j sind stetig, denn wegen

| j (x) −  j (p)| ≤ x − p2 können wir  =  wählen.
(6) Sei  j : 2 → IK,  j (a) = a j , für a = (a1 , a2 , . . .) ∈ 2 , j ∈ IN. Analog zu
vorigem Beispiel zeigt man, dass auch diese Koordinatenfunktionen stetig
sind.
Der folgende Satz liefert eine Charakterisierung der Stetigkeit mittels Folgen.
Satz 6.2 (Folgenkriterium). Seien (X, dX ), (Y, dY ) metrische Räume, f : X → Y
eine Abbildung und p ∈ X.
Die Abbildung f ist genau dann in p stetig, wenn gilt: Für jede gegen p konver-
gente Folge (xn )n∈IN in X konvergiert die Bildfolge ( f (xn ))n∈IN in Y gegen f (p).
Beweis. Seien f stetig in p ∈ X und (xn )n∈IN eine Folge in X mit p = lim xn .
n→
Zu  > 0 gibt es dann ein  > 0, sodass dY ( f (x), f (p)) <  für alle x ∈ X mit
dX (x, p) <  gilt. Weiter existiert zu  ein N ∈ IN mit dX (xn , p) <  für alle n ≥ N.
Damit folgt dY (( f (xn ), f (p)) <  für alle n ≥ N, d.h. lim f (xn ) = f (p).
n→
Für die umgekehrte Implikation sei nun vorausgesetzt, dass f nicht stetig in p ist.
Das heißt: Es gibt ein  > 0, sodass für jedes  > 0 ein Punkt x ∈ X existiert mit
sowohl dX (x, p) <  als auch dY ( f (x), f (p)) ≥  .
Insbesondere gibt es dann zu jedem n ∈ IN einen Punkt xn ∈ X mit dX (xn , p) < 1n
und dY ( f (xn ), f (p)) ≥  .
Damit ist (xn )n∈IN konvergent gegen p in X, aber ( f (xn ))n∈IN konvergiert nicht
gegen f (p) in Y .

Schreibweise: Seien X,Y metrische Räume, D ⊆ X und f : D → Y eine Abbildung.
Falls f (xn ) → c ∈ Y gilt für jede Folge (xn )n∈IN in D, die gegen p ∈ X konvergiert,
so schreibt man lim f (x) = c. Falls f in p stetig ist, haben wir damit also c = f (p).
x→p
Zu f : X → Y und g : Y → Z bezeichnen wir die durch g ◦ f (x) := g( f (x)) erklärte

Abbildung g ◦ f : X → Z als Komposition von f und g. Wir wollen zeigen, dass die
Komposition zweier stetiger Funktionen auch wieder stetig ist.
Satz 6.3. Seien (X, dX ), (Y, dY ) und (Z, dZ ) drei metrische Räume sowie p ∈ X.
Wenn die Abbildungen f : X → Y stetig in p und g : Y → Z stetig in f (p) ∈ Y
sind, dann ist g ◦ f : X → Z stetig in p.
Beweis. Sei  > 0.
Da g stetig in f (p) ist, gibt es  > 0 mit g UdY ( f (p)) ⊆ UdZ (g( f (p))).

Zu  > 0 gibt es nun  > 0 mit f UdX (p) ⊆ UdY ( f (p)), weil f stetig in p ist.
Zusammen haben wir

g ◦ f UdX (p) ⊆ g UdY ( f (p)) ⊆ UdZ (g ◦ f (p)) ,
also ist g ◦ f stetig in p.

82 6 Stetigkeit
Sind X ein metrischer Raum, f : X → IK, g : X → IK Abbildungen und  ∈ IK, so

sind durch
( f + g)(x) := f (x) + g(x) , ( f )(x) :=  f (x) , ( f g)(x) := f (x) g(x)
weitere Abbildungen f + g,  f , f g : X → IK erklärt.

1 1 1
Ist f (x) = 0 für alle x ∈ X, so ist f : X → IK definiert durch f (x) := f (x) .
Satz 6.4. Seien (X, d) ein metrischer Raum, f : X → IK und g : X → IK stetig in

p ∈ X sowie  ∈ IK. Dann sind auch f + g,  f und f g stetig in p. Ist f stets = 0, so
ist auch 1f stetig in p.
Beweis. Wir verwenden das Folgenkriterium (Satz 6.2).

Ist (xn )n∈IN konvergent gegen p, so konvergieren auch f (xn ) gegen f (p) und
g(xn ) gegen g(p).
Laut den Rechenregeln für Grenzwerte (Satz 3.5) konvergieren ( f + g)(xn ) ge-
gen ( f + g)(p) und  f (xn ) gegen  f (p) sowie f g(xn ) gegen f g(p) und, unter der
gegebenen Voraussetzung, 1f (xn ) gegen 1f (p).

Beispiele:
(1) Mit Satz 6.4 sind Polynome P : IK → IK, P(x) = an xn + an−1xn−1 + · · · + a0 ,
mit n ∈ IN, a0 , . . . , an ∈ IK, stetige Funktionen.
(2) Seien P und Q zwei Polynome. Setzt man M := {x ∈ IK : Q(x) = 0}, so ist
P
Q : M → IK stetig. Funktionen dieser Bauart heißen rationale Funktionen.
Es liegt nun auf der Hand zu fragen, ob auch durch (konvergente) Potenzreihen
erklärte Funktionen stetig sind.
Sei M eine beliebige Menge und bezeichne B(M) den Raum aller beschränkten
Funktionen f : M → IK. Weiter sei
f M := sup | f (x)| .
x∈M
Man kann direkt nachrechnen, dass · M eine Norm auf B(M) ist. (Aus Satz 4.9
wissen wir bereits, dass B(M) mit dieser Norm sogar vollständig, also ein Banach-
raum, ist.)
Satz 6.5. Seien (X, d) ein metrischer Raum und p ∈ X. Ferner seien fn : X → IK
(n ∈ IN) beschränkte Funktionen, die in p stetig sind.

Wenn die Reihe  fn X konvergent ist, dann ist durch
n=1

f (x) :=  fn (x) für x ∈ X
n=1
eine in p stetige Funktion f : X → IK definiert.

6.1 Stetige Abbildungen 83
 
Beweis. Für jedes x ∈ X ist  fn X eine konvergente Majorante von  fn (x).
n=1 n=1
Daher ist f : X → IK überhaupt erklärt (wohldefiniert). Zu zeigen bleibt noch die
Stetigkeit in p.
Für jedes x ∈ X und (zunächst beliebiges) N ∈ IN gilt

N N
 

| f (x) − f (p)| ≤
 fn (x) −  fn (p)
+  | fn (x)| +  | fn (p)| .

n=1 n=1

n=N+1 n=N+1
 
Sei  > 0. Da  fn X konvergiert, gibt es ein N ∈ IN mit  fn X < 3 .
n=1 n=N+1


Damit ist  | fn (x)| < 3 für alle x ∈ X. Somit haben wir
n=N+1

N N
2

| f (x) − f (p)| ≤
 fn (x) −  fn (p)
+  .

n=1 n=1

3

N N
Wähle nun  > 0, sodass

 fn (x) −  fn (p)
<


3 für alle x mit d(x, p) <  ist.
n=1 n=1
Dann gilt | f (x) − f (p)| <  für alle x ∈ X mit d(x, p) <  .
Folglich ist f stetig in p.

Mit Hilfe von Satz 6.5 können wir zeigen, dass jede Potenzreihe im Inneren ihres
Konvergenzkreises eine stetige Funktion darstellt. Genauer gilt folgendes:

Korollar 6.6. Sei  ck zk eine Potenzreihe mit Konvergenzradius R. Dann ist durch
k=0

f (z) :=  ck zk
k=0
eine in UR (0) stetige (falls 0 < R < ) bzw. in ganz C stetige (falls R = ) Funktion
f erklärt.
Beweis. Sei z ∈ UR (0). Dann gibt es r mit |z| < r < R. Die durch fk (z) := ck zk ,
k ∈ IN, erklärten Funktionen sind auf X := Ur (0) beschränkt und stetig. Ferner gilt
fk X ≤ |ck | rk , also ist
 
 fk X ≤  |ck | rk <  ,
k=0 k=0
da die Potenzreihe in UR (0) absolut konvergiert. Nun folgt mit Satz 6.5 die Stetigkeit
im Punkt z.
Da dies für jedes z ∈ UR (0) gilt, haben wir die Stetigkeit auf ganz UR (0).
Die Aussage im Fall R =  folgt ganz analog, wenn man C an Stelle von UR (0)
betrachtet.

84 6 Stetigkeit
Laut Korollar 6.6 sind u.a. die folgenden Funktionen stetig.

(1) Die Exponentialfunktion ist stetig auf ganz C.
(2) Sinus und Cosinus sind stetig auf ganz C.
(3) Die Binomialreihe zum Exponenten s,

s k
Bs (z) =  z ,
k=0 k
vgl. Kapitel 5.4, Beispiel (6), ist stetig auf U1 (0).

(4) Die Potenzfunktion z → az := exp(z ln a) ist stetig auf ganz C. Diese allge-
meinen Potenzen für beliebiges z ∈ C werden wir in Kapitel 6.3 noch genauer
untersuchen.
Bemerkung: Die im Beweis zu Korollar 6.6 benutzte Einschränkung auf Ur (0) mit

r < R ist notwendig, da  fk UR (0) möglicherweise divergiert, wie z.B. bei der
 k=0
Potenzreihe  zk .
k=0
 
sin x 1 (−1)k 2k+1
(−1)k 2k
Anwendung: Für x = 0 gilt x = x  (2k+1)!
x = 
(2k+1)!
x , insbesondere
k=0 k=0

(−1)k 2k
ist die Reihe auf der rechten Seite konvergent. Die Potenzreihe f (z) :=  (2k+1)! z
k=0
stellt daher eine auf ganz C stetige Funktion dar und mit dem Folgenkriterium er-
halten wir
sin x
lim = lim f (x) = f (0) = 1 .
x→0 x x→0
6.2 Eigenschaften stetiger reellwertiger Funktionen
Wir wenden uns nun stetigen Funktionen zu, die auf Teilmengen von IR definiert
und reellwertig sind.
Satz 6.7 (Nullstellensatz). Sei f : [a, b] → IR stetig mit f (a) < 0 und f (b) > 0 oder
f (a) > 0, f (b) < 0.
Dann existiert mindestens ein x0 ∈ ]a, b[ mit f (x0 ) = 0.
Beweis. Im Fall f (a) < 0, f (b) > 0 konstruieren wir rekursiv eine Intervallschach-
telung (In )n∈IN0 mit In = [an , bn ], f (an ) < 0, f (bn ) ≥ 0 und |In | = 21n |I0 |.
Dazu beginnen wir mit I0 := [a, b]. Sei In mit den angegebenen Eigenschaften
bereits gefunden. Dann betrachten wir m := 12 (an + bn ) und definieren

[an , m] , falls f (m) ≥ 0 ,
[an+1 , bn+1 ] :=
[m, bn ] , falls f (m) < 0 .
6.2 Eigenschaften stetiger reellwertiger Funktionen 85

Damit haben wir eine Intervallschachtelung und es gibt x0 mit {x0 } = In .
n∈IN0
Nun gilt lim an = x0 = lim bn und, da f stetig ist, erhalten wir mit Satz 6.2
n→ n→
0 ≥ lim f (an ) = f (x0 ) = lim f (bn ) ≥ 0 ,

n→ n→
also f (x0 ) = 0.
Der Beweis im Fall f (a) > 0 und f (b) < 0 geht ganz analog.

Korollar 6.8 (Zwischenwertsatz). Sei f : [a, b] → IR stetig.
Zu jedem c ∈ ] f (a), f (b)[ (falls f (a) < f (b) gilt) bzw. c ∈ ] f (b), f (a)[ (falls
f (b) < f (a) ist), existiert ein x0 ∈ ]a, b[ mit f (x0 ) = c.
Beweis. Betrachte g : [a, b] → IR, g(x) := f (x) − c, und wende Satz 6.7 auf g an.

Anschaulich besagt der Zwischenwertsatz, dass f jeden Wert zwischen f (a) und
f (b) annimmt:
Im Fall f (a) < f (b) ist [ f (a), f (b)] ⊆ f ([a, b]).
Gilt f (a) > f (b), so ist [ f (b), f (a)] ⊆ f ([a, b]).
Anwendung: Es gibt eine kleinste positive Zahl x0 ∈ ]0, 2[ mit cos(x0 ) = 0.

Beweis. Es gilt cos(0) = 1 und

(−1)k 2k 4 42 4 42
cos(2) =  2 = 1− + 1− + ∓ ···
k=0 (2k)! 2! 4! 5·6 5·6·7·8
n
2  4 2 1 3
< −1 +  = −1 + 4
=− ,
3 n=0 30 3 1 − 30 13
also cos(0) > 0 und cos(2) < 0. Mit der Stetigkeit des Cosinus folgt zunächst, dass
es mindestens eine Zahl c ∈]0, 2[ gibt mit cos(c) = 0.
Wir betrachten M := {c > 0 : cos(c) = 0} und setzen x0 := inf M. Dann gibt es
eine Folge (xn )n∈IN in M mit xn → x0 für n → . Mit dem Folgenkriterium erhalten
wir cos(x0 ) = lim cos(xn ) = 0 und wegen cos(0) = 1 gilt x0 = 0, also x0 ∈ M.
n→
Folglich ist x0 die kleinste positive Nullstelle des Cosinus.

Wir sind jetzt in der Lage, weitere wichtige Eigenschaften von Sinus und Cosinus
herzuleiten. Aus Kapitel 5.5 wissen wir bereits, dass
sin2 x + cos2 x = 1
für alle x ∈ IR gilt. Dabei sind sin2 x und cos2 x abkürzende Schreibweisen für
(sin x)2 bzw. (cos x)2 .
Üblicherweise
 setzt man  := 2x0 . Es gilt also cos 2 = 0 und daher sin 2 = 1
oder sin 2 = −1.
Behauptung: Für x ∈ ]0, 2[ gilt sin x > 0.

86 6 Stetigkeit
Beweis. Für x ∈ ]0, 2[ ist
sin(x) 1  (−1)k 2k+1 x2 x4 x6

=  x = 1 − + − ± ···
x x k=0 (2k + 1)! 3! 5! 7!

x2 x2 x4
> 1− 1+ + + ···
3! 4·5 4·5·6·7
n
4  4 4 1 1
> 1−  = 1− 4
= > 0,
3! n=0 20 3! 1 − 20 6
also auch sin(x) > 0.


Folglich bleibt nur sin 2 = 1. Weiter erhalten wir für alle z ∈ C mit den Additions-
theoremen (Satz 5.22)

• cos z + 2 = cos(z) cos 2 − sin(z) sin 2 = − sin(z),

• sin z + 2 = sin(z) cos 2 + cos(z) sin 2 = cos(z),

• cos( ) = cos 2 + 2 = − sin 2 = −1 und damit sin( ) = 0,
• cos(z +  ) = cos(z) cos( ) − sin(z) sin( ) = − cos(z),
• sin(z +  ) = sin(z) cos( ) + cos(z) sin( ) = − sin(z),
• cos(z + 2 ) = cos(z +  ) cos( ) − sin(z +  ) sin( ) = cos(z),
• sin(z + 2 ) = sin(z +  ) cos( ) + cos(z +  ) sin( ) = sin(z).
Mit der Eulerschen Formel (5.4) folgt exp(i ) = cos( ) + i sin( ) = −1 und mit
Hilfe der Funktionalgleichung (5.3) erhalten wir schließlich
exp(z + 2 i) = exp(z) exp(2 i) = exp(z) (cos(2 ) + i sin(2 )) = exp(z)
für alle z ∈ C.
Als weitere Folgerung aus Satz 6.7 wollen wir noch einen Fixpunktsatz notieren.
Fixpunktsätze sind wichtige mathematische Instrumente. So wird uns etwa der so
genannte Fixpunktsatz von Banach (Satz 15.4) später noch von großem Nutzen sein.
Korollar 6.9 (Fixpunktsatz). Sei f : [a, b] → [a, b] stetig.

Dann existiert ein x0 ∈ [a, b] mit f (x0 ) = x0 .
Beweis. Nach Voraussetzung gilt a ≤ f (x) ≤ b für alle x ∈ [a, b]. Ist f (a) = a oder
f (b) = b, so bleibt nichts zu zeigen.
Seien also a < f (a) und f (b) < b. Die Funktion g : [a, b] → IR, g(x) := f (x) − x,
ist stetig mit g(a) > 0 und g(b) < 0. Laut Satz 6.7 existiert x0 ∈ ]a, b[ mit g(x0 ) = 0.
Damit gilt f (x0 ) = x0 .

6.2 Eigenschaften stetiger reellwertiger Funktionen 87
b
Die stetige Funktion f : [a, b] → [a, b] besitzt
mindestens einen Fixpunkt x0 ∈ [a, b], d.h. es
gilt x0 = f (x0 ).
Anschaulich bedeutet dies, dass der Graph von
f die Winkelhalbierende in mindestens einem
a Punkt schneidet.
a b
Analog wie bei Folgen heißt eine Funktion f : [a, b] → IR monoton wachsend, wenn
aus y > x stets f (y) ≥ f (x) folgt. Falls aus y > x sogar immer f (y) > f (x) folgt,
so heißt die Funktion streng monoton wachsend. Entsprechend definiert man die
Eigenschaften (streng) monoton fallend.
Satz 6.10. Seien I ⊆ IR ein Intervall, f : I → IR streng monoton wachsend oder

streng monoton fallend und M := f (I).
Dann ist f : I → M bijektiv und die Umkehrfunktion f −1 : M → I ist stetig.
Beweis. Die Injektivität folgt direkt aus der strengen Monotonie. Zu zeigen bleibt
die Stetigkeit von f −1 .
Sei f streng monoton wachsend. Zu festem p ∈ M betrachte a ∈ I mit f (a) = p.
Wir müssen zeigen: Zu jedem  > 0 gibt es ein  > 0 derart, dass
|x − a| <  für alle x ∈ I mit | f (x) − p| < 
gilt. Dies ist genau dann der Fall, wenn die folgenden Bedingungen beide erfüllt
sind.
(i) Zu jedem  > 0 gibt es ein 1 > 0, sodass gilt:
a−x <  für alle x ∈ I , x < a , mit p − f (x) < 1 .
(ii) Zu jedem  > 0 gibt es ein 2 > 0, sodass gilt:
x−a <  für alle x ∈ I , x > a , mit f (x) − p < 2 .
Wir wollen nun sehen, dass (i) erfüllt ist.

Ist a ∈ I linker Randpunkt von I, so ist nichts zu zeigen. Sei also a ∈ I nicht
linker Randpunkt von I. Dann gibt es b ∈ I, b < a, mit a − b <  und wir setzen
1 := p − f (b).
Ist nun x ∈ I, x < a mit p − f (x) < 1 , so folgt f (b) < f (x) und damit b < x
wegen der Monotonie. Weiter folgt a − x < a − b <  , also ist (i) nachgewiesen.
Ganz analog zeigt man auch (ii).
Ebenso analog führt man auch den Beweis im Fall einer streng monoton fallenden
Funktion.

88 6 Stetigkeit
Bemerkung: Es wird bei Satz 6.10 nicht gefordert, dass f selbst stetig ist. Auch
braucht f (I) = M kein Intervall zu sein.
Unter der zusätzlichen Voraussetzung, dass f stetig ist, folgt mit dem Zwischen-
wertsatz allerdings, dass M ein Intervall ist.
Beispiel: Sei n ∈ IN. Die Funktion f : [0, [ → [0, [, f (x) := xn , ist streng monoton
wachsend.√Die Umkehrfunktion ist die n−te Wurzelfunktion f −1 : [0, [ → [0, [,
f −1 (x) = n x. Nach Satz 6.10 ist diese stetig.
Wir führen noch einen weiteren Begriff ein.

Seien D ⊆ IR, Y ein metrischer Raum und f : D → Y eine Abbildung. Wenn
für jede Folge (xn )n∈IN in D, die gegen p ∈ IR konvergiert und xn > p ∀n erfüllt,
f (xn ) → c gilt, so bezeichnet man c als rechtsseitigen Grenzwert und schreibt
c = lim f (x). Gebräuchlich sind auch die Schreibweisen lim f (x) und f (p + 0).
x→p+0 x↓p
Entsprechend erklärt man ggf. auch einen linksseitigen Grenzwert und schreibt
dann lim f (x) oder lim f (x) bzw. f (p − 0).
x→p−0 x↑p
Wenn D ein Intervall und p ∈ D kein Randpunkt von D ist, so ist f offensichtlich
stetig in p genau dann, wenn rechts- und linksseitiger Grenzwert existieren und
übereinstimmen.
Satz 6.11. Sei f : [a, b] → IR monoton wachsend.

Für jedes p ∈ ]a, b[ existieren f (p + 0) sowie f (p − 0) und es gilt
f (p − 0) ≤ f (p) ≤ f (p + 0) .
Die Grenzwerte f (a + 0) und f (b − 0) existieren; es gelten f (a) ≤ f (a + 0) sowie

f (b − 0) ≤ f (b).
Entsprechende Aussagen gelten für monoton fallende Funktionen.
Beweis. Sei p ∈ ]a, b[. Da f monoton wachsend ist, existiert das Supremum c :=
sup{ f (x) : x ∈ [a, p[ } und es gilt c ≤ f (p).
Zu  > 0 existiert x ∈ [a, p[ mit c −  ≤ f (x ) ≤ c. Auf Grund der Monotonie
gilt deshalb
c −  ≤ f (x) ≤ c für alle x ∈ [x , p[ .
Ist nun (xn )n∈IN eine Folge in [a, p[ mit xn → p, so findet man ein N ∈ IN derart, dass
xn ∈ [x , p[ für alle n ≥ N gilt. Damit ist c − f (xn ) <  für alle n ≥ N.
Folglich gilt lim f (xn ) = c und damit c = f (p − 0).
n→
Die anderen Nachweise laufen analog.

Wir erwähnen noch, dass sich die Rechenregeln für Grenzwerte mit Hilfe von
Satz 6.4 auf lim f (x), lim f (x) und lim f (x) übertragen lassen.
x→p x→p±0 x→±
6.3 Exponentialfunktion und Logarithmus 89
Seien etwa lim f (x) = c und lim g(x) = b, so gelten

x→p x→p
lim ( f + g)(x) = c + b , lim ( f g)(x) = cb ,

x→p x→p
f c
und, falls b = 0 ist, haben wir lim (x) = .
x→p g b
6.3 Exponentialfunktion und Logarithmus
Die Exponentialfunktion ist eine auf ganz C stetige Funktion.

Schränken wir uns auf die reellen Zahlen ein, so erhalten wir eine streng monoton
wachsende Funktion exp : IR → ]0, [, wie wir aus Kapitel 5.5 bereits wissen.
An Hand der Reihendarstellung sieht man weiter, dass exp(x) > x für alle
x > 0 gilt. Daher ist die Bildmenge exp(IR) nach oben unbeschränkt. Weiter gilt
1
exp(−x) = exp(x) < 1x für x > 0. Zu jedem y ∈ ]0, [ gibt es deshalb ein x ∈ IR
mit exp(−x) < y < exp(x). Folglich existiert laut Zwischenwertsatz ein x0 ∈ IR mit
exp(x0 ) = y; also ist exp(IR) = ]0, [.
Nun können wir mit Satz 6.10 folgern, dass die reelle Exponentialfunktion eine
stetige Umkehrfunktion g : ]0, [→ IR besitzt; d.h. wir haben
g ◦ exp : IR → IR , g ◦ exp(x) = x
und exp ◦ g : ]0, [ → ]0, [ , exp ◦ g(y) = y .
1
Die Exponentialfunktion bildet IR
bijektiv auf das Intervall ]0, [ ab.
1
Wir werden sehen, dass g mit dem Logarithmus aus Kapitel 3.4 übereinstimmt.
Dazu sind jedoch noch einige Vorüberlegungen nötig.
Zunächst wollen wir eine weitere Charakterisierung der Exponentialfunktion
herleiten. Diese wird motiviert durch das Problem der stetigen Verzinsung“. Wächst
”
etwa ein Kapital K durch Zinsen in einem Jahr auf K(1 + x), so hat man nach dem
90 6 Stetigkeit
Teilneines Jahres, z.B. n = 12 bei monatlicher Verzinsung, einen Zuwachs auf

n-ten
K 1 + nx . Man fragt sich nun, ob ein Grenzwert für n →  existiert.
z n
Satz 6.12. Für alle z ∈ C gilt lim 1 + = exp(z).
n→ n
Für z = 1 kennen wir dies schon, vgl. Beispiel (3) in Kapitel 5.1.
Beweis. Wegen
n k
z n 
zk n z
exp(z) − 1 +
n
=  k! −  k nk
k=0 k=0
n 
n(n − 1) · · ·(n − k + 1) zk zk
=  1−
nk
+ 
k! k=n+1 k!
k=0
=: cnk
 n
zk zk
und lim  = 0 bleibt zu zeigen, dass  cnk = 0 gilt.
k=n+1 k! k!
n→
k=0
Dazu halten wir fest, dass 0 < cnk < 1 für alle k, n ∈ IN und lim cnk = 0 ist.
n→
Zu  > 0 finden wir (vgl. Satz 5.1) ein N ∈ IN derart, dass
n
|z|k
 < für alle m, n mit N < m < n
k=m k!
gilt. Damit erhalten wir

n zk
N
|z|k n
|z|k N
|z|k

 cnk
≤  cnk +  cnk <  cnk + .

k=0 k!
k=0 k! k=N+1 k! k=0 k!
Ganz rechts können wir nun den Grenzwert für n →  bilden; die Anzahl der Sum-
manden hängt hier nicht mehr von n ab. Damit folgt

n zk
N
|z|k

lim sup
 cnk
≤ lim  cnk + = 
n→
k=0 k!
n→
k=0 k!
und weiter, da dies für jedes  > 0 gilt, die Behauptung.

Nun wenden wir uns dem Logarithmus zu. Für x > 0 haben wir den Wert ln(x)
mittels einer Intervallschachtelung definiert.
Lemma 6.13. Für 0 < a < b gilt 1 − ab ≤ ln(b) − ln(a) ≤ ba − 1.

Beweis. Aus Satz 3.12 folgt zunächst 1 − ab ≤ ln 1a + ln(b) ≤ b
− 1 und mit
a
ln 1a = − ln(a), siehe Korollar 3.13, erhalten wir die Behauptung.

Satz 6.14. Die Funktion ln : ]0, [ → IR, definiert wie in Kapitel 3.4, ist stetig.
6.3 Exponentialfunktion und Logarithmus 91
Beweis. Seien p ∈ ]0, [ und (xn )n∈IN eine Folge in ]0, [, die gegen p konvergiert.

Zu  > 0 gibt es dann ein N ∈ IN mit

xpn − 1
<  und
xpn − 1
<  für alle n ≥ N.
Außerdem haben wir aus Lemma 6.13

xn
0 ≤ ln(xn ) − ln(p) ≤ −1 falls xn > p ,
p

p
0 ≤ ln(p) − ln(xn ) ≤ −1 falls xn 0 für alle x ∈ IR ist der Ausdruck ln(exp(x)) für alle reellen
Zahlen x erklärt.
Seien zunächst x > 0 und n ∈ IN. Setzt man a = n und b = x + n in die Unglei-
x
chung aus Lemma 6.13 ein, so ergibt sich n+x ≤ ln(n + x) − ln(n) ≤ nx .
n
Mit n(ln(n + x) − ln(n)) = n ln n+x
n = ln n+xn , vgl. Korollar 3.13, folgt
nx x n
≤ ln 1 + ≤x
n+x n
n
und Satz 3.7 liefert lim ln 1 + nx = x.
n→
Wegen der Stetigkeit des Logarithmus folgt mit Hilfe von Satz 6.12 nun
x n x n
x = lim ln 1 + = ln lim 1 + = ln(exp(x)) .
n→ n n→ n

1
Sei nun x < 0. Dann ist −x = ln(exp(−x)) = ln exp(x) = − ln(exp(x)).
Die Behauptung gilt also auch in diesem Fall; für x = 0 gilt sie offensichtlich.

Umgekehrt gilt dann für jedes x ∈ ]0, [ auch exp(ln(x)) = x.

Mit Hilfe von Exponentialfunktion und Logarithmus können wir nun allgemeine
Potenzfunktionen erklären. Für x > 0 und z ∈ C setzt man
xz := exp(z ln x) .
Ist speziell x = e, so hat man ez = exp(z), da ln(e) = 1 ist.

Für x, y > 0 und z, w ∈ C ergibt sich damit unmittelbar
1
x1 = x , x0 = 1 , xz xw = xz+w , x−z = , (xy)z = xz yz
xz
92 6 Stetigkeit
und für x > 0, y ∈ IR, z ∈ C gilt
(xy )z = (exp(y ln x))z = exp(z ln(exp(y ln x))) = exp(zy ln x) = xyz .
Die Wurzelfunktion ist ein Spezialfall der Potenzfunktionen. Ist z =  > 0, so ist
x → x eine streng monoton wachsende, stetige, bijektive Abbildung ]0, [ → ]0, [.
Die zugehörige Umkehrfunktion ist x → x1/ , denn (x )1/ = x (1/ ) = x1 = x.
Wir wollen noch verifizieren, daß für n ∈ IN die beiden Definitionen xn := x · · · x und
xn := exp(n ln x) übereinstimmen. Dies ist der Fall, denn es gilt
exp(n ln x) = exp (ln x + · · · + ln x) = exp(ln x) · · · exp(ln x) = x · · · x = xn .

n Summanden n Faktoren
√
Damit stimmt die Umkehrfunktion x → x1/n auch mit x → n
x überein.
6.4 Stetige Funktionen auf [a, b]
Wir leiten noch einige Eigenschaften für stetige Funktionen her, die auf Intervallen
der Form [a, b] definiert sind. Wir werden diese in Kapitel 12 noch verallgemeinern,
wenn wir stetige Funktionen auf so genannten kompakten Mengen untersuchen.
Satz 6.16. Sei f : [a, b] → IR stetig.

Dann ist f ([a, b]) eine beschränkte Teilmenge von IR und f nimmt Maximum und
Minimum an. Das heißt, es existieren ein p ∈ [a, b] mit f (p) = sup{ f (x) : x ∈ [a, b]}
und ein q ∈ [a, b] mit f (q) = inf{ f (x) : x ∈ [a, b]}.
Beweis. Wir führen den Nachweis nur für das Maximum. Sei

sup{ f (x) : x ∈ [a, b]} , falls f ([a, b]) nach oben beschränkt ist,
M :=
, falls nicht.
Dann existiert eine Folge (xn )n∈IN in [a, b] mit lim f (xn ) = M.
n→
Da (xn )n∈IN beschränkt ist, existiert nach Satz 4.19 eine Teilfolge
(xnk )k∈IN mit
lim xnk = p ∈ [a, b]. Mit der Stetigkeit von f folgt f (p) = lim f xnk = M.

k→ k→
Definition 6.17. Seien (X, dX ) und (Y, dY ) zwei metrische Räume. Eine Funktion
f : X → Y heißt gleichmäßig stetig auf X, falls zu jedem  > 0 ein  > 0 existiert,
sodass gilt:
dY ( f (x), f (x )) <  für alle x, x ∈ X mit dX (x, x ) <  .
Ist f : X → Y gleichmäßig stetig, so ist f offensichtlich in jedem Punkt p ∈ X stetig.

6.5 Aufgaben 93
Satz 6.18. Seien (Y, dY ) ein metrischer Raum und f : [a, b] → Y stetig.
Dann ist f auch gleichmäßig stetig.
Beweis. Angenommen, f ist nicht gleichmäßig stetig. Dann gibt es ein  > 0 derart,
dass für jedes n ∈ IN zwei Punkte xn , xn ∈ [a, b] existieren mit
1
|xn − xn | < und dY ( f (xn ), f (xn )) ≥  .
n
Laut Satz 4.19 existiert nun eine konvergente Teilfolge (xnk )k∈IN von (xn )n∈IN mit
lim xnk = p ∈ [a, b]. Mit |xnk − xnk | < n1k gilt auch lim xnk = p. Da f stetig ist, folgt
k→ k→
lim dY ( f (xnk ), f (xnk )) = dY ( f (p), f (p)) = 0

k→
im Widerspruch zu dY ( f (xnk ), f (xnk )) ≥  für alle k ∈ IN. Die Annahme ist demnach
nicht erfüllbar.

Beispiel: Die Funktion f : ]0, [→ IR, f (x) := 1x , ist auf jedem Intervall [c, 1] mit
0 < c < 1 gleichmäßig stetig, aber sie ist nicht gleichmäßig stetig auf ]0, 1].
Beweis. Für festes c mit 0 < c < 1 ist f nach Satz 6.18 gleichmäßig stetig auf [c, 1].
Um zu zeigen, dass f im Intervall ]0, 1] nicht gleichmäßig stetig ist, betrachte etwa
 = 1. Wir nehmen an, es gibt ein  > 0 mit

f (x) − f (y)
< 1 für alle x, y ∈ ]0, 1] mit |x − y| <  .
& '
Nun wählen wir a ∈ 0, 12 mit a <  .
Mit x := a und y := 2a gilt dann x, y ∈ ]0, 1] sowie |y − x| <  und weiter
1 1 1
| f (x) − f (y)| = − = >1=
a 2a 2a
im Widerspruch zur Annahme; es gibt also kein solches  .
Folglich ist f nicht gleichmäßig stetig auf ]0, 1].

6.5 Aufgaben
1. Zeigen Sie, dass
z → Re (z) , z → Im (z) , z → z und z → |z|
in ganz C stetig sind. Folgern Sie
exp(z) = exp(z) für alle z ∈ C .

94 6 Stetigkeit
2. Begründen Sie, dass lim cos(x)−1

x existiert, und berechnen Sie diesen Grenzwert.
x→0
3. Zeigen Sie, dass die Funktion f : IR → IR,

1
sin x für x = 0 ,
f (x) :=
0 für x = 0 ,
im Punkt x = 0 nicht stetig ist:

a. direkt an Hand der Definition; zeigen Sie, dass man beispielsweise zu  = 12
kein passendes“  finden kann;
”
b. mit dem Folgenkriterium (Satz 6.2).
4. Zeigen Sie, dass die Funktion f : IR → IR,

x sin 1x für x = 0 ,
f (x) :=
0 für x = 0 ,
auf ganz IR stetig ist.

Hinweis: Um die Stetigkeit im Nullpunkt zu zeigen, können Sie z.B. das Fol-
genkriterium und die Abschätzung | f (x) − f (0)| ≤ |x − 0| verwenden.
5. Seien f , g : IR → IR stetige Funktionen mit f (x) = g(x) für alle x ∈ Q.

Zeigen Sie, dass f (x) = g(x) für alle x ∈ IR gilt.
6. Seien (X, dX ) und (Y, dY ) metrische Räume.

Eine Funktion f : X → Y heißt Lipschitz-stetig, wenn es ein L > 0 gibt mit
dY ( f (x), f (y)) ≤ L dX (x, y) für alle x, y ∈ X .
a. Zeigen Sie: Jede Lipschitz-stetige Funktion ist gleichmäßig stetig.

b. Geben Sie eine Funktion f : IR → IR an, die in ganz IR stetig, aber nicht
Lipschitz-stetig ist.
7. Seien p ∈ IR und f : IR → IR eine stetige Funktion derart, dass f (x + p) = f (x)

für alle x ∈ IR gilt.
Zeigen Sie, dass f gleichmäßig stetig ist.
8. Zeigen Sie, dass die Funktion f : IR → IR, f (x) := cos(x2 ), nicht gleichmäßig
stetig ist.
√
Hinweis: Betrachten Sie f ( k ) für k ∈ IN.
6.5 Aufgaben 95
9. Zeigen Sie, dass es genau eine reelle Zahl x gibt, die die Gleichung x = e−x löst.
10. Seien M eine nicht-leere Menge und d : M × M → IR definiert durch

0 falls x = y ,
d(x, y) :=
1 sonst .
a. Zeigen Sie, dass (M, d) ein metrischer Raum ist.

b. Bestimmen Sie alle stetigen Abbildungen f : (M, d) → (M, d).
11. Sei f : IR → C eine im Punkt x = 0 stetige Funktion derart, dass
f (x + y) = f (x) + f (y) für alle x, y ∈ IR
gilt. Zeigen Sie, dass eine Zahl c ∈ C existiert mit
f (x) = cx für alle x ∈ IR .

Kapitel 7
Differentiation
Die Differentiation, mit der wir uns in diesem Kapitel beschäftigen werden, stellt
ein weiteres wichtiges Werkzeug der Analysis dar. Sie wird unter anderem durch
folgende Problemstellungen motiviert:
• Konstruktion einer Tangente an den Graphen einer Funktion in einem vorgege-
benen Punkt
• Lokale Approximation einer Funktion durch eine möglichst einfache Funktion,
nämlich ein Polynom ersten Grades
• Bestimmung der Momentangeschwindigkeit eines Teilchens
• als Gegenspieler der Integration“ (vgl. Kapitel 8)
”
Trotz der vielen Gesichter finden wir einen einfachen Zugang mittels Grenzwerten.
7.1 Differenzierbarkeit
Definition 7.1. Seien I ⊆ IR ein Intervall und x ∈ I. Eine Funktion f : I → IK nennt

man differenzierbar in x, falls der Grenzwert
f (t) − f (x)
lim
t →x t −x
t ∈ I , t = x
df
existiert. Wir bezeichnen diesen Grenzwert dann mit f (x) oder (x).
dt

Weiter heißt f (x) die Ableitung (oder Differentialquotient) von f in x.
Ist die Funktion f in jedem x ∈ I differenzierbar, so heißt f differenzierbar.
Falls x ein Randpunkt von I ist, wollen wir den Limes als rechts- bzw. linksseitigen
Grenzwert verstehen. Die Angabe t ∈ I, t = x werden wir künftig nicht mehr explizit
ausschreiben. Man sollte aber im Kopf behalten, welche t für die Grenzwertbildung
zugelassen sind.

98 7 Differentiation
Bemerkung: Man kann Differenzierbarkeit analog auch für Funktionen f : I → X

definieren, wobei X ein beliebiger normierter Raum ist, und zwar als Grenzwert in
X. Wir verzichten darauf an dieser Stelle, merken aber an, dass wir komplexwertige
Funktionen zulassen.
Satz 7.2. Sei f : I → IK im Punkt x ∈ I differenzierbar. Dann ist f stetig in x.
Beweis. Für t ∈ I, t = x haben wir
f (t) − f (x)
f (t) − f (x) = (t − x) → f (x) · 0 = 0 mit t → x .
t −x
Demnach ist f laut Folgenkriterium (Satz 6.2) stetig in x.

Die Umkehrung von Satz 7.2 gilt nicht; siehe etwa Beispiel (6).
Schreibt man die Gleichung des Beweises etwas um, erhält man folgendes. Mit
P(t) := f (x) + f (x) (t − x) gilt
f (t) − P(t)
lim =0,
t→x t −x
d.h. die lokale Approximation von f (t) durch P(t) ist schneller“ als die, mit der t
”
gegen x strebt. Man bezeichnet P(t) auch als lineare Approximation von f in x.
P
Die Abbildung zeigt die Graphen einer
f (x) f differenzierbaren Funktion f sowie der
durch P(t) := f (x)+ f (x)(t − x) erklärten
linearen Approximation.
Die durch die Abbildung P beschriebene
Gerade trifft den Graph von f an der Stelle
(x, f (x)) tangential.
x
Bevor wir einige Ableitungen berechnen, zeigen wir grundlegende Rechenregeln.
Satz 7.3. Seien f : I → IK und g : I → IK im Punkt x ∈ I differenzierbar und c ∈ IK.

Dann sind c f , f + g und f g in x differenzierbar. Ist g(x) = 0, so ist auch gf in x
differenzierbar. Dabei gelten:
• (c f ) (x) = c f (x)
• ( f + g) (x) = f (x) + g(x)
• ( f g) (x) = f (x) g(x) + f (x) g (x) (Produktregel)

f g(x) f (x) − g(x) f (x)
• (x) = (Quotientenregel)
g g(x)2
7.1 Differenzierbarkeit 99
Beweis. Die ersten beiden Aussagen folgen direkt aus den Rechenregeln für Grenz-
werte. Zur Produktregel betrachten wir
f (t) g(t) − f (x) g(x) g(t) − g(x) f (t) − f (x)

= f (t) + g(x) .
t −x t −x t −x
Grenzwertbildung t → x liefert nun ( f g) (x) = f (x) g(x) + f (x) g (x).
Zu zeigen bleibt die Quotientenregel. Dazu sei h := gf . Wir haben dann

h(t) − h(x) 1 f (t) − f (x) g(t) − g(x)
= g(x) − f (x) .
t −x g(t)g(x) t −x t −x
Mit g(t) → g(x) für t → x erhalten wir im Grenzwert
g(x) f (x) − f (x) g (x)

h (x) = .
g(x)2
Die Behauptungen zur Differenzierbarkeit sind mit der Bestimmung der Formeln
auch bewiesen.

Beispiele:
ct − cx
(1) Sei f : IR → IK, f (x) := cx mit c ∈ IK, so gilt f (x) = lim = c.
t→x t −x
(2) Seien n ∈ IN0 und f : IR → IR, f (x) := xn . Es gilt f (x) = nxn−1 .
Beweis. Für n = 0 gilt die Aussage offensichtlich. Gilt sie für ein n, so
setze h : IR → IR, h(x) := xn+1 = x f (x). Mit Induktionsvoraussetzung und
Produktregel folgt h (x) = 1 · f (x) + x f (x) = xn + xnxn−1 = (n + 1)xn.

Damit sind auch alle Polynome differenzierbar und alle rationalen Funktionen sind
differenzierbar, außer an den Punkten, an welchen der Nenner = 0 ist. Die Ablei-
tungen bestimmt man gemäß Satz 7.3.
Insbesondere erhalten wir nun mit der Quotientenregel für f : IR \ {0} → IR,
n−1
f (x) := x1n , dass die Ableitung f (x) = 0−nx
x2n
= x−n
n+1 ist. Also haben wir insgesamt
(xn ) = nxn−1 für alle n ∈ ZZ .
Es folgt eine weitere wichtige Regel, die wir oft nutzen werden. Sie betrifft die
Komposition von differenzierbaren Funktionen.
Satz 7.4 (Kettenregel). Seien I und J zwei Intervalle.
Wenn die Funktionen f : I → J im Punkt x ∈ I sowie g : J → IK in y = f (x) ∈ J
differenzierbar sind, so ist g ◦ f : I → IK in x differenzierbar und es gilt
(g ◦ f ) (x) = g (y) f (x) .

Beweis. Da g in y differenzierbar ist, ist die Funktion G : J → IK,

⎧
⎨ g(s) − g(y) für s = y ,
⎪
G(s) := s−y
⎪
⎩
g (y) für s = y ,
stetig im Punkt y und es gilt g(s) − g(y) = (s − y) G(s).

Man erhält weiter, da f stetig in x ist,
g( f (t)) − g( f (x)) ( f (t) − f (x)) G( f (t))

lim = lim = f (x) G( f (x)) = f (x) g (y)
t→x t −x t→x t −x
wie behauptet.

Weitere Beispiele:
(3) Sei f : IR → IK, f (x) := exp(cx), mit c ∈ IK. Aus der Funktionalgleichung
der Exponentialfunktion erhalten wir
exp(ct) − exp(cx) exp(c(x + h)) − exp(cx)

f (x) = lim = lim
t→x t −x h→0 h
exp(ch) − 1 exp(ch) − 1
= exp(cx) lim = c exp(cx) lim = c exp(cx) .
h→0 h h→0 ch
(4) Ist f : I → C in x ∈ I differenzierbar, so sind Re f : I → IR und Im f : I → IR
in x differenzierbar und es gilt
(Re f ) (x) = Re f (x) , (Im f ) (x) = Im f (x) .
Dies folgt direkt aus f = Re f + i Im f und der Tatsache, dass eine Folge
komplexer Zahlen genau dann konvergent ist, wenn die Folgen der Real- und
der Imaginärteile beide konvergent sind.
Betrachten wir nun f : IR → C, f (t) := exp(it) = cost + i sint, so erhalten wir
aus (1) als Ableitung f (t) = i exp(it) = i(cost + i sint) = − sint + i cost.
Somit haben wir
cos (t) = − sint und sin (t) = cost .
1 ln(t) − ln(x) 1
(5) Aus Lemma 6.13 erhalten wir ≤ ≤ für 0 < x < t.
t t −x x
Vertauscht man die Rollen von t und x, so ergibt sich
1 ln(t) − ln(x) 1
≤ ≤ für 0 < t < x .
x t −x t
Insgesamt erhalten wir daraus mit t → x die Ableitung des Logarithmus,
1
ln (x) = .
x
7.1 Differenzierbarkeit 101
(6) Die Funktion f : IR → IR,

1
x sin x für x = 0 ,
f (x) :=
0 für x = 0 ,
ist auf ganz IR stetig, vgl. Kapitel 6.5, Aufgabe 4. Für x = 0 erhalten wir mit
Produkt- und Kettenregel

1 1 1
f (x) = sin − cos .
x x x
Im Fall x = 0 sind beide Sätze nicht anwendbar. Wir betrachten

f (t) − f (0) 1
= sin .
t −0 t
Ein Grenzwert für t → 0 existiert nicht. Daher ist f in x = 0 nicht differen-

zierbar. Wir haben hier also ein Beispiel einer Funktion, die im Nullpunkt
stetig aber nicht differenzierbar ist.
(7) Die Funktion f : [0, [ → [0, [, f (x) := x2 , ist bijektiv und differenzierbar.
√
Ihre Umkehrabbildung f −1 : [0, [ → [0, [, f −1 (x) = x, ist im Nullpunkt
nicht differenzierbar, denn sonst müsste laut Kettenregel

1 = f −1 ◦ f (0) = f −1 ( f (0)) f (0)
gelten, was wegen f (0) = 0 nicht möglich ist.

Die Überlegung in Beispiel (7) kann man für jede bijektive differenzierbare Funk-
tion f durchführen. Sie belegt, dass für die Differenzierbarkeit von f −1 in y = f (x)
die Ableitung f (x) notwendigerweise ungleich Null sein muss. In Kapitel 7.3 wer-
den wir sehen, dass diese Bedingung auch hinreichend für die Differenzierbarkeit
der Umkehrfunktion ist.
Wenn die Ableitung f einer differenzierbaren Funktion selbst wieder differenzier-

bar ist, so bezeichnet man f := ( f ) als die zweite Ableitung von f . Entsprechend
erklärt man gegebenenfalls auch eine dritte Ableitung usw.
Statt f , f , . . . schreibt man auch f (2) , f (3) , . . .
Definition 7.5. Eine differenzierbare Funktion f : I → IK heißt stetig differenzier-
bar, wenn f : I → IK stetig ist.
Falls die Ableitungen f (1) , . . . , f (n) existieren und stetig sind, so sagt man, f ist
n-mal stetig differenzierbar.
Man beachte, dass jede differenzierbare Funktion stetig ist; daher folgt aus der
Existenz von f (k) bereits die Stetigkeit von f (k−1) .
Den Raum der n-mal stetig differenzierbaren Funktionen f : I → IK bezeichnen
wir mit Cn (I). Weiter schreiben wir C (I) für den Raum der beliebig oft (stetig)
differenzierbaren Funktionen.
Beispielsweise sind die Exponentialfunktion, Sinus und Cosinus sowie auch alle
Polynomfunktionen beliebig oft stetig differenzierbar.
Wir wollen ein Beispiel einer differenzierbaren, aber nicht stetig differenzierbaren,
Funktion angeben. Die Funktion f : IR → IR,

x2 sin 1x für x = 0 ,
f (x) :=
0 für x = 0 ,
ist in allen Punkten x = 0 differenzierbar. Die Ableitung erhalten wir mittels

Produkt- und Kettenregel; dort gilt

1 2 1 1 1 1
f (x) = 2x sin + x − 2 cos = 2x sin − cos .
x x x x x
Wir zeigen nun, dass f auch in x = 0 differenzierbar ist. Dazu betrachten wir

f (t) − f (0) 1
= t sin .
t −0 t

Da die Abbildung t → t sin 1t an der Stelle t = 0 stetig ist, erhalten wir mit dem
Folgenkriterium
f (t) − f (0) 1
lim = lim t sin =0,
t→0 t −0 t→0 t
also ist f im Nullpunkt differenzierbar mit f (0) = 0.
Allerdings kann man (etwa wiederum mit dem Folgenkriterium) leicht sehen,
dass f am Punkt x = 0 nicht stetig ist. Daher ist f dort auch nicht differenzierbar,
eine zweite Ableitung existiert hier also nicht.
7.2 Mittelwertsatz und lokale Extrema
Definition 7.6. Sei f : X → IR eine Funktion auf einem metrischen Raum X. Man
sagt, dass f ein lokales Maximum (bzw. lokales Minimum) im Punkt p ∈ X
besitzt, wenn ein r > 0 existiert derart, dass f (x) ≤ f (p) für alle x ∈ Ur (p) gilt
(bzw. f (x) ≥ f (p) für alle x ∈ Ur (p) gilt).
Lokale Maxima oder Minima nennen wir lokale Extrema.
Satz 7.7. Sei f : [a, b] → IR eine Funktion, die im Punkt x ∈ ]a, b[ ein lokales Extre-
mum besitzt.
Wenn f (x) existiert, dann gilt f (x) = 0.
Beweis. Wir betrachten nur den Fall eines lokalen Maximums; die Aussage für das
Minimum beweist man ganz analog.
7.2 Mittelwertsatz und lokale Extrema 103
Sei r > 0 gemäß Definition 7.6. Ohne Einschränkung können wir annehmen, dass
Ur (x) = ]x − r, x + r[ ⊆ ]a, b[ gilt.
f (t) − f (x)
Für x − r < t < x gilt ≥ 0 und mit t → x folgt f (x) ≥ 0.
t −x
f (t) − f (x)
Für x < t < x + r gilt ≤ 0 und mit t → x gilt nun f (x) ≤ 0.
t −x
Es bleibt also nur f (x) = 0.

Die Umkehrung von Satz 7.7 gilt nicht. Beispielsweise hat die Funktion x → x3 an
der Stelle x = 0 kein lokales Extremum, obwohl ihre Ableitung dort den Wert 0 hat.
Man beachte auch, dass Satz 7.7 nur eine Aussage über Extrema im Inneren des
Intervalls, also in ]a, b[, ermöglicht und auch nur an Punkten, wo f differenzierbar
ist. So hat etwa die Funktion f : [−1, 1] → IR, f (x) := |x|, ein Minimum im Punkt
x = 0, ist dort aber nicht differenzierbar, und sie hat Maxima jeweils bei x = 1 und
bei x = −1.
Als eine erste Folgerung erhalten wir ein Resultat, welches nach Michel Rolle
(1652-1719, Paris) benannt ist.
Satz 7.8 (Rolle). Sei f : [a, b] → IR eine stetige Funktion mit f (a) = f (b), die auf
]a, b[ differenzierbar ist.
Dann gibt es ein x ∈ ]a, b[ mit f (x) = 0.
Beweis. Ist f konstant, so ist nichts zu zeigen. Sei also f eine nicht-konstante
Funktion. Laut Satz 6.16 gibt es nun c, d ∈ [a, b] mit f (c) = max f ([a, b]) und
f (d) = min f ([a, b]).
Wegen f (a) = f (b) und da f nicht-konstant ist, muss mindestens einer der beiden
Punkte c oder d in ]a, b[ liegen, d.h. es gibt x ∈ ]a, b[ derart, dass f in x ein lokales
Extremum hat. Nach Satz 7.7 gilt f (x) = 0.

Man beachte, dass Differenzierbarkeit in den Randpunkten nicht erforderlich ist.
Nun können wir den so genannten Mittelwertsatz einfach herleiten. Wir formu-
lieren gleich eine leicht verallgemeinerte Version.
Satz 7.9. Seien f : [a, b] → IR und g : [a, b] → IR stetige Funktionen, die auf ]a, b[
differenzierbar sind. Dann gibt es ein x ∈ ]a, b[ mit
( f (b) − f (a)) g (x) = (g(b) − g(a)) f (x) .
Beweis. Die Funktion h : [a, b] → IR, h(x) := ( f (b)− f (a))g(x)−(g(b)−g(a)) f (x),

ist stetig, auf ]a, b[ differenzierbar, und es gilt
h(a) = f (b) g(a) − f (a) g(b) = h(b) .
Nach Satz 7.8 existiert ein x ∈ ]a, b[ mit h (x) = 0, woraus direkt die Behauptung
folgt.

Der Sonderfall g(x) = x wird Mittelwertsatz (der Differentialrechnung) genannt:

Satz 7.10 (Mittelwertsatz). Ist f : [a, b] → IR eine stetige Funktion, die auf ]a, b[
differenzierbar ist, so gibt es ein x ∈ ]a, b[ mit
f (b) − f (a)
f (x) = .
b−a
Eine physikalische Interpretation lautet wie folgt. Läuft man etwa 100 Meter in
10 Sekunden, so beträgt die Durchschnittsgeschwindigkeit 36 km/h. Laut dem
Mittelwertsatz gibt es dabei mindestens einen Zeitpunkt, an dem die Momentan-
geschwindigkeit (aufgefasst als Ableitung, also der Grenzwert der durchschnittli-
”
chen Geschwindigkeit, wenn die zurückgelegte Wegstrecke gegen 0 geht“) genau
36 km/h ist.
Aus dem Mittelwertsatz erhalten wir eine Reihe interessanter Ergebnisse zum
Verhalten von differenzierbaren Funktionen.
Korollar 7.11. Sei f : [a, b] → IR stetig und auf ]a, b[ differenzierbar. Dann gelten:
(i) Ist f (x) ≥ 0 für alle x ∈ ]a, b[, so ist f monoton wachsend.
(ii) Ist f (x) = 0 für alle x ∈ ]a, b[, so ist f konstant.
(iii) Ist f (x) ≤ 0 für alle x ∈ ]a, b[, so ist f monoton fallend.
Beweis. Für alle drei Aussagen ziehen wir die Gleichung
f (x2 ) − f (x1 ) = f (x) (x2 − x1 )
heran, die laut dem Mittelwertsatz für beliebige x1 , x2 ∈ [a, b], x1 < x2 , mit einem
geeigneten x ∈ ]x1 , x2 [ gilt.
Ist nun f (x) ≥ 0 für alle x ∈ ]a, b[, so folgt f (x1 ) ≤ f (x2 ), d.h. f wächst monoton.
Entsprechend geht man auch für die anderen beiden Aussagen vor.

Bemerkungen:
(1) In Korollar 7.11 gelten jeweils auch die Umgekehrten Implikationen. Ist etwa
f monoton wachsend, so gilt f (t)−t−x
f (x)
≥ 0 für alle x,t ∈ ]a, b[ und damit auch

f (x) ≥ 0, falls f in x differenzierbar ist.
(2) Gilt sogar f (x) > 0 für alle x ∈ ]a, b[ (oder f (x) < 0), so ist f streng monoton
wachsend (bzw. streng monoton fallend), wie sofort aus dem Nachweis von
Korollar 7.11 folgt.
Hier gilt die Umkehrung allerdings nicht! Die durch f (x) := x3 erklärte Funk-
tion ist zwar auf ganz IR streng monoton wachsend, aber ihre Ableitung nicht
überall positiv: Es gilt f (0) = 0.
(3) Mit Korollar 7.11(ii) gilt auch folgendes. Seien f , g : [a, b] → IK stetig und
auf ]a, b[ differenzierbar mit f (x) = g (x) für alle x ∈ ]a, b[. Dann existiert
eine Konstante c ∈ IK mit f (x) = g(x) + c für alle x ∈ [a, b]. Zum Nachweis
braucht man nur h := f − g zu betrachten.
Definition 7.12. Sei f : I → IK gegeben. Eine differenzierbare Funktion F : I → IK

heißt Stammfunktion von f , falls F = f gilt.
Laut Bemerkung (3) ist F bis auf eine additive Konstante durch f eindeutig be-
stimmt.
Korollar 7.13. Seien  ∈ IK sowie f : [a, b] → IK stetig und in ]a, b[ differenzierbar

derart, dass f (x) =  f (x) für alle x ∈ ]a, b[ ist.
Dann gilt
f (x) = c exp( x) für alle x ∈ [a, b] ,
wobei c ∈ IK eine Konstante ist.
Beweis. Setze g(x) := f (x) exp(− x). Für alle x ∈ ]a, b[ gilt damit
g (x) = f (x) exp(− x) −  f (x) exp(− x) = 0 .
Folglich ist g eine Konstante, also gilt f (x) = c exp( x) mit einem c ∈ IK zunächst
für alle x ∈ ]a, b[ und wegen der Stetigkeit dann auch für alle x ∈ [a, b].

Die Exponentialfunktion ist also die einzige differenzierbare Funktion f : IR → IR,

die den Bedingungen
• f = f
• f (0) = 1
genügt.
Wir geben noch weitere Ergänzungen zum Mittelwertsatz an. Das nächste Resul-
tat ist benannt nach Jean Gaston Darboux (1842-1917, Paris).
Korollar 7.14 (Darboux). Seien f : [a, b] → IR differenzierbar und c ∈ ] f (a), f (b)[,

falls f (a) < f (b) gilt (bzw. c ∈ ] f (b), f (a)[, falls f (b) < f (a) gilt).
Dann existiert x0 ∈ ]a, b[ mit f (x0 ) = c.
Beweis. Sei f (a) < c < f (b). Mit g(x) := f (x) − cx gilt g (a) < 0 und g (b) > 0.
Wegen
g(t) − g(a)
0 > g (a) = lim
t→a+ t −a
gibt es ein t1 ∈ ]a, b[ mit g(t1 ) < g(a). Ebenso folgt, dass ein t2 ∈ ]a, b[ existiert mit
g(t2 ) < g(b).
Laut Satz 6.16 nimmt g auf [a, b] sein Minimum an, und wegen der vorangehen-
den Überlegungen nimmt g dieses Minimum an einer Stelle in x0 ∈ ]a, b[ an. Mit
Satz 7.7 folgt g (x0 ) = 0. Daher gilt f (x0 ) = c.

Unter Verwendung des verallgemeinerten Mittelwertsatzes können einige Grenz-

werte recht einfach bestimmt werden. Wir leiten die so genannte L’Hospitalsche Re-
gel her (L’Hospital, Marquis de Sainte-Mesme, 1661-1704, Paris; die L’Hospitalsche
Regel stammt von Johann Bernoulli I, 1667-1748, Basel).
Satz 7.15. Seien f , g : ]a, b[ → IR differenzierbare Funktionen. Weiter sei g (x) = 0

für alle x ∈ ]a, b[ und es gelte lim f (x) = 0 = lim g(x).
x→b x→b
f (x)
Dann ist g(x) = 0 für alle x ∈ ]a, b[. Wenn lim =:  existiert, so gilt
x→b g (x)
f (x) f (x)
lim
=  = lim .
x→b g (x) x→b g(x)
Eine entsprechende Aussage gilt für x → a.

Dies gilt auch im Fall eines uneigentlichen Grenzwertes  = ± und auch bei
a = − oder b = .
Beweis. Sei zunächst b ∈ IR. Nach Voraussetzung kann man f und g fortsetzen zu
stetigen Funktionen auf ]a, b] und es gilt f (b) = 0 = g(b). Zu c ∈ ]a, b[ gibt es nach
dem Mittelwertsatz ein x ∈ ]c, b[ mit g(c) = g(c) − g(b) = g (x) (c − b). Dann ist
auch g(c) = 0 für alle c ∈ ]a, b[.
Laut Satz 7.9 existiert zu jedem c ∈ ]a, b[ ein x = x(c) ∈ ]c, b[ mit
f (c) f (c) − f (b) f (x)

= = .
g(c) g(c) − g(b) g (x)
Mit c → b gilt auch x(c) → b und es folgt die Behauptung.

Die Aussage für x → a beweist man ganz analog (zunächst für a ∈ IR).
Nun betrachten wir den ' b = . Ohne Einschränkung
& Fall & können
' wir a > 0 anneh-

men. Wir setzen  : 0, 1a → IR,  (t) := f 1t und  : 0, 1a → IR,  (t) := g 1t .
Die Funktion  ist differenzierbar mit

−g 1t
 (t) = = 0
t2
& '
für alle t ∈ 0, 1a und es gilt lim  (t) = 0 = lim  (t). Schließlich haben wir
t→0 t→0

1

 (t) t2 f t f 1t f (x)
lim = lim 2 1 = lim 1 = lim =
t→0  (t) t→0 t g t→0 g x→ g (x)
t t
und mit dem bereits Bewiesenen folgt

 (t) f 1t f (x)
 = lim = lim 1 = lim
t→0  (t) t→0 g x→ g(x)
t
wie behauptet.

Beispiele:
sin x cos x
(1) Es gilt lim = lim = 1.
x→0 x x→0 1

1 1 x − sinx
(2) Wir bestimmen lim − = lim .
x→0 sin x x x→0 x sin x
Mit f (x) := x − sin x und g(x) := x sin x sind die Voraussetzungen von
Satz 7.15 erfüllt; man beachte, dass g (x) = 0 in einem Intervall ]0, b[ mit
einem geeigneten b gilt. Wir erhalten
x − sin x 1 − cosx sin x
lim = lim = lim =0,
x→0 x sin x x→0 x cos x + sinx x→0 −x sin x + 2 cosx
wobei wir ein zweites Mal Satz 7.15 angewendet haben (nachdem wir uns
überzeugt haben, dass die Voraussetzungen wiederum erfüllt sind).
Eine zweite Regel von L’Hospital befasst sich mit dem Fall lim g(t) = ±.
t→b
Satz 7.16. Seien f , g : ]a, b[ → IR differenzierbare Funktionen. Weiter sei g (x) = 0

für alle x ∈ ]a, b[ und es gelte lim g(x) = .
x→b
f (x)
Wenn lim =:  existiert, so gilt
x→b g (x)
f (x) f (x)
lim
=  = lim .
x→b g (x) x→b g(x)
Eine entsprechende Aussage gilt für x → a.

Dies gilt auch im Fall eines uneigentlichen Grenzwertes  = ± und auch bei
a = − oder b = .
Beweis. Sei zunächst  ∈ IR. Zu  > 0 gibt es s ∈ ]a, b[ mit

f (x)

g (x) − 
<  und g(x) > 0 für alle x ∈ [s, b[ .
| f (s)| |g(s)|
Nun wähle t ∈ ]s, b[, sodass |g(x)| >  und |g(x)| >  für alle x ∈ [t, b[ gilt.
Für beliebiges x ∈ ]t, b[ gibt es laut Satz 7.9 ein  ∈ ]s, x[ mit
g ( ) ( f (x) − f (s)) = f ( ) (g(x) − g(s)) .
Dies können wir umformen zu

f (x) f ( ) g(s) f (s)
= 1− + .
g(x) g ( ) g(x) g(x)
Man erhält daraus

f (x)

f ( )

f ( ) g(s)

f (s)

g(x) − 
≤
g ( ) − 
+
g ( ) g(x)
+
g(x)
<  + (| | +  )  +  .
f (x)
Damit gilt lim = .
x→b g(x)
(x)
Nun sei  = . Zu M > 0 gibt es dann s ∈ ]a, b[ mit gf (x) ≥ M und g(x) > 0 für alle
x ∈ [s, b[. Wähle t ∈ ]s, b[ mit g(x) > − f (s) und g(x) > 2g(s) für alle x ∈ [t, b[.
Für beliebiges x ∈ ]t, b[ erhält man wiederum mit Hilfe von Satz 7.9 ein  ∈ ]s, x[,
sodass
f (x) f ( ) g(s) f (s) 1
= 1− + > M−1
g(x) g ( ) g(x) g(x) 2
f (x)
gilt. Damit folgt lim = .

x→b g(x)
Beispiele:
1
ln x x
(1) Es gilt lim x ln x = lim = lim = 0.
x→0 x→0 1 x→0 − x12
x
(2) Dieses Beispiel soll zeigen, dass man bei den L’Hospitalschen Regeln auf
die Voraussetzung g (x) = 0 nicht verzichten kann. Es stammt von O. Stolz
(1842-1905, Innsbruck).
Seien f (x) := x + sin x cos x und g(x) := f (x) exp(sin x). Ein Grenzwert
f (x)
lim = lim exp(− sin x) existiert nicht!
x→ g(x) x→
Hingegen ist
f (x) 2 cos2 x
lim
= lim
x→ g (x) x→ cos x exp(sin x) (2 cos x + f (x))
2 cos x exp(− sin x)

= lim =0,
x→ f (x) + 2 cosx
da der Zähler beschränkt bleibt und f (x) →  mit x →  gilt.

Von den Voraussetzungen ist zwar lim g(x) =  erfüllt, aber g (x) = 0 ist
x→
nicht möglich, auch nicht nach eventueller Einschränkung des Definitionsbe-
reichs, wegen

g (x) = cos x exp(sin x) (2 cos x + f (x)) = 0 für alle x = + k , k ∈ ZZ .
2
7.3 Ableitung der Umkehrfunktion
Satz 7.17. Sei f : I → IR streng monoton und differenzierbar in x ∈ I mit f (x) = 0.

Setze J := f (I).
−1 1
Dann ist f −1 : J → I in y = f (x) differenzierbar und es gilt f (y) = .
f (x)
7.3 Ableitung der Umkehrfunktion 109
Beweis. Sei (sn )n∈IN eine Folge in J mit sn → y = f (x) und sn = y ∀n. Bezeichnet
tn := f −1 (sn ), so ist tn = x und es gilt tn → x, da f −1 laut Satz 6.10 stetig ist. Folglich
haben wir
f −1 (sn ) − f −1 (y) tn − x 1
lim = lim =
n→ sn − y n→ f (tn ) − f (x) f (x)
wie behauptet.

Grafisch erhält man die Umkehr-

abbildung durch Spiegelung an
der Winkelhalbierenden.
Die Steigung der Tangente an
den Graph von f −1 im Punkt
tn = f −1 (sn ) f −1 (y, f −1 (y)) ist gleich dem Kehr-
wert der Steigung der Tangente
an den Graph von f im Punkt
x = f −1 (y) (x, f (x)) = ( f −1(y), y).
y sn
Beispiele:
' &
(1) Die Funktion f : − 2 , 2 → [−1, 1], f (x) := sin x, ist differenzierbar mit
f (x) = cos x.
& '
Wir wissen bereits, dass cos im Intervall − 2 , 2 positiv ist, also ist sin laut
Korollar 7.11
' dort & streng monoton wachsend. Man sieht unmittelbar, & dass f'
auch auf − 2 , 2 streng monoton
wachsend
ist, denn für alle x ∈ − 2 , 2
gilt schließlich −1 = f − 2 < f (x) < f 2 = 1.
' &
Die Umkehrfunktion f −1 : [−1, 1] → − 2 , 2 heißt Arcus-Sinus und wird
mit arcsin bezeichnet. Diese ist für alle y ∈ ] − 1, 1[ differenzierbar, und mit
y = sin x gilt
1 1 1 1
arcsin (y) = = = = .
cos x cos(arcsin y) 1 − y2
1 − sin2 (arcsin y)

2
−1
1
Die Abbildung zeigt den Graphen
' der
&
Funktion arcsin : [−1, 1] → − 2 , 2 .
− 2
sin(x)
(2) Die Funktion tan : IR \ (2k + 1) 2 : k ∈ ZZ → IR, tan(x) := cos(x)
, ist diffe-
renzierbar mit
cos2 (x) + sin2 (x) 1
tan (x) = 2
= = 1 + tan2 (x) .
cos (x) cos2 (x)
& '
Insbesondere ist f : − 2 , 2 → IR, f (x) := tan(x), streng
& monoton
' wachsend
und mit lim tan(x) = , lim tan(x) = − folgt f − 2 , 2 = IR.
x→ 2 x→− 2
& '
Nach Satz 7.17 existiert eine Umkehrfunktion f −1 : IR → − 2 , 2 ; wir be-
zeichnen diese mit arctan. Für die Ableitung gilt
1
arctan (tan(x)) = .
tan (x)
Mit y = tan(x) erhalten wir schließlich
1 1 1
arctan (y) = = = .
tan (arctan(y)) 1 + (tan(arctan(y))2 1 + y2
7.4 Aufgaben
1. Ist die Funktion f : IR → IR,

x2 cos ln(x2 ) für x = 0 ,
f (x) :=
0 für x = 0 ,
differenzierbar ? Bestimmen Sie gegebenenfalls die Ableitung f und untersu-

chen Sie diese ebenfalls auf Stetigkeit.
2. Zeigen Sie, dass die Funktion f : IR → IR, f (x) := |x|3 , zwei Mal differenzierbar
ist. Bestimmen Sie f und f . Zeigen Sie weiter, dass f an der Stelle x = 0
nicht differenzierbar ist.
3. Seien I ⊆ IR ein Intervall und f : I → IR differenzierbar derart, dass f be-

schränkt ist. Zeigen Sie, dass f Lipschitz-stetig ist.
4. Seien I ein offenes Intervall und f : I → IR eine zwei Mal differenzierbare Funk-
tion. Zeigen Sie:
a. Ist x0 ∈ I mit f (x0 ) = 0 und f (x0 ) < 0, so hat f in x0 ein lokales Maximum.
b. Ist x0 ∈ I mit f (x0 ) = 0 und f (x0 ) > 0, so hat f in x0 ein lokales Minimum.
Hinweis: Wenden Sie Korollar 7.11 zunächst auf f an Stelle von f an.
7.4 Aufgaben 111
5. Seien I ein Intervall und f : I → IR eine monoton wachsende differenzierbare

Funktion.
Zeigen Sie, dass f genau dann streng monoton wachsend ist, wenn es kein
Intervall J ⊆ I positiver Länge gibt mit f (x) = 0 ∀x ∈ J.
6. Bestimmen Sie alle lokalen Extrema von f : IR → IR, f (x) := x3 + ax2 + bx,
in Abhängigkeit von a, b ∈ IR und entscheiden Sie jeweils, ob es sich um ein
Maximum oder Minimum handelt.
7. Bestimmen Sie alle lokalen Extrema der Funktion f : IR → IR,

|x| ln(|x|) für x = 0 ,
f (x) :=
0 für x = 0 ,
und entscheiden Sie jeweils, ob es sich um ein Maximum oder Minimum han-
delt.
8. Bestimmen Sie die folgenden Grenzwerte.

1 1
a. lim −
x→0 x ln(x + 1)
ln(x) − x + 1
b. lim
x→1 (x − 1)2
ln(cos(ax))
c. lim (a, b ∈ IR, b = 0)
x→0 ln(cos(bx))

cos(x) − 1
d. lim exp
x→0 x2
9. Sei I ein Intervall. Eine Funktion f : I → IR heißt konvex, wenn
f ( x1 + (1 −  )x2) ≤  f (x1 ) + (1 −  ) f (x2)
für alle x1 , x2 ∈ I und für alle  ∈ [0, 1] gilt. Eine konvexe Funktion f heißt
streng konvex, wenn in obiger Ungleichung Gleichheit nur in den Trivialfällen
x1 = x2 oder  ∈ {0, 1} gilt.
a. Sei f : I → IR differenzierbar. Zeigen Sie: Die Funktion f ist genau dann
(streng) konvex, wenn f (streng) monoton wachsend ist.
b. Sei nun f : I → IR zwei Mal differenzierbar. Zeigen Sie: Die Funktion f ist
genau dann konvex, wenn f (x) ≥ 0 für alle x ∈ I ist.
c. Zeigen Sie weiter, dass für eine zwei Mal differenzierbare, streng konvexe
Funktion f nicht notwendigerweise f (x) > 0 für alle x ∈ I folgt.

2x
10. Gegeben sei die Funktion f : IR → IR, f (x) := arcsin 1+x2
.
a. Bestimmen Sie alle lokalen Extrema von f und entscheiden Sie jeweils, ob
es sich um ein Maximum oder Minimum handelt.
b. Zeigen Sie: Für −1 < x < 1 gilt f (x) = 2 arctan(x). Gilt eine ähnliche Iden-
tität auch für |x| > 1 ?
11. Die Funktionen Sinus Hyperbolicus und Cosinus Hyperbolicus sind wie folgt
definiert:
1 x
sinh : IR → IR , sinh(x) := e − e−x ,
2 cosh
1 x
cosh : IR → IR , cosh(x) := e + e−x .
2
Zeigen Sie:
a. Für alle x, y ∈ IR gilt
sinh
sinh(x + y) = cosh(x) sinh(y) + sinh(x) cosh(y) ,
cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y) .
b. Für alle x ∈ IR gilt cosh2 (x) − sinh2 (x) = 1.
c. Die Funktionen sinh und cosh sind differenzierbar mit
sinh (x) = cosh(x) und cosh (x) = sinh(x) .
d. Die Funktion sinh besitzt eine differenzierbare Umkehrabbildung arsinh :

IR → IR mit
1
arsinh (x) = √ .
2
x +1
e. Die Einschränkung von cosh auf das Intervall [0, [ besitzt eine in ]0, [
differenzierbare Umkehrabbildung arcosh : [1, [ → [0, [ mit
1
arcosh (x) = √ .
2
x −1
f. Es gilt

arsinh(x) = ln x + x2 + 1 für alle x ∈ IR ,

arcosh(x) = ln x + x2 − 1 für alle x ∈ [1, [ .
Kapitel 8
Integration
Die Grundidee der Integration ist es, den Inhalt der Fläche, die zwischen Graph
einer Funktion f : [a, b] → IR und x-Achse innerhalb der Intervallgrenzen liegt, zu
berechnen. Für so genannte Treppenfunktionen bereitet uns dies keine Probleme.
Mittels eines Grenzübergangs werden wir das Integral auf allgemeinere Funktionen
erweitern. Die anschauliche Vorstellung als Flächeninhalt gilt zwar für reellwertige
Funktionen, wir werden dennoch auch C-wertige Funktionen zulassen.
Neben dem Regel-Integral, welches wir in diesem Kapitel einführen, existie-
ren einige weitere Arten von Integralen, wie etwa das Riemann-Integral oder das
Lebesgue-Integral.
8.1 Regelfunktionen
Definition 8.1. Eine Funktion f : [a, b] → IK heißt Treppenfunktion, wenn es

a0 , . . . , an ∈ [a, b] mit a = a0 < a1 < . . . < an = b und c1 , . . . , cn ∈ IK gibt, sodass
f (x) = ck für alle x ∈ ]ak−1 , ak [ (k = 1, . . . , n)
gilt. Für die Werte f (a0 ), . . . , f (an ) wird nichts weiter vorausgesetzt.
Wir nennen a = a0 < a1 < . . . < an = b eine Teilung (oder Partition) von [a, b]
und bezeichnen ( b n
a
f (x) dx :=  ck (ak − ak−1) ∈ IK
k=1
als das Integral von f .

Man beachte, dass an jeder Sprungstelle“ von f ein Teilungspunkt liegt, aber
”
nicht jeder Teilungspunkt eine Sprungstelle zu sein braucht. Als Feinheit der Tei-
lung bezeichnet man das Maximum max{ak −ak−1 : k = 1, . . . , n}. Ist a j−1 < a < a j
für ein j = 1, . . . , n, so heißt die Teilung a = a0 < . . . < a j−1 < a < a j < . . . < an = b
feiner als a = a0 < . . . < an = b.

114 8 Integration
Anschaulich liefert das Integral einer nicht-

negativen Treppenfunktion den Inhalt der
Fläche zwischen Graph und x-Achse.
Der Wert des Integrals ändert sich nicht
bei verschiedenen Teilungen, die durch Hin-
zufügen oder Fortnehmen von passenden
Punkten auseinander hervorgehen.
a = a0 a1 an = b
Mit T ([a, b]) bezeichnen wir die Menge aller Treppenfunktionen f : [a, b] → IK.. Mit
zwei Treppenfunktionen f und g ist auch deren Summe eine Treppenfunktion; durch
Verfeinerung einer Teilung zu f und einer Teilung zu g erhält man eine gemeinsame
Teilung zu f und g. Offensichtlich ist auch  f ∈ T ([a, b]), falls f ∈ T ([a, b]) und
 ∈ IK. Daher ist T ([a, b]) ein IK-Vektorraum.
Weiter ist der Raum der Treppenfunktionen ein Untervektorraum von B([a, b]),
dem Raum der beschränkten Funktionen [a, b] → IK. Dieser ist laut Satz 4.9 mit der
so genannten Supremumsnorm ·  ein Banachraum.
Wir halten einige Eigenschaften des Integrals von Treppenfunktionen fest:
( b ( b ( b
(1) Für f , g ∈ T ([a, b]) gilt ( f (x) + g(x)) dx = f (x) dx + g(x) dx.
a a a
( b ( b
(2) Für f ∈ T ([a, b]) und  ∈ IK gilt  f (x) dx =  f (x) dx.
a a
(3) Sind f , g ∈ T ([a, b]) reellwertig und ist f (x) ≤ g(x) für alle x ∈ [a, b], so gilt
( b ( b
f (x) dx ≤ g(x) dx .
a a

( b
(b

(4) Für f ∈ T ([a, b]) gilt
f (x) dx
≤ | f (x)| dx ≤ f  (b − a).
a a
Beweis. Für (1) brauchen wir nur eine gemeinsame Teilung zu f und g zu wählen
und (2) folgt direkt aus der Definition. Zum Nachweis von (3) sei zunächst f ∈
T ([a, b]) mit f (x) ≥ 0 ∀x ∈ [a, b]. Hier gilt ab f (x) dx ≥ 0 und der allgemeine Fall
folgt mit Hilfe von (1), wenn wir f − g betrachten.
Aus einer Teilung a = a0 < . . . < an = b zu f erhalten wir schließlich noch

n
n

 ck (xk − xk−1 )
≤  |ck | (xk − xk−1 ) ≤ max |ck | (b − a) ≤ f  (b − a) ,

k=1
k=1 k=1,...,n
womit auch (4) gezeigt ist.

Wir merken noch an, dass der Wert des Integrals nicht von den Funktionswerten
f (a j ) an den Sprungstellen abhängt, die Norm f  hingegen schon.
Bei der Erweiterung des Integrals auf größere Funktionsklassen als die der Treppen-
funktionen ist die Vorgehensweise nicht mehr ganz so offensichtlich. Der einfachste
8.1 Regelfunktionen 115
Weg ist der, den Cauchy (1823) gewählt hat. Er lässt sich kurz wie folgt beschrei-
ben: Man dehne das Integral, das eine lineare (1), (2) und stetige (4) Abbildung
T ([a, b]) → IK darstellt, aus auf den Abschluss (vgl. Kapitel 12) des Raumes der
Treppenfunktionen im Banachraum (B([a, b]), · ).
Definition 8.2. Eine Funktion f : [a, b] → IK heißt Regelfunktion (oder integrier-
bar im Cauchyschen Sinn), wenn eine Folge ( fn )n∈IN in T ([a, b]) existiert, die im
Raum (B([a, b]), · ) gegen f konvergiert (d.h. lim fn − f  = 0).
n→
Man sagt dann, dass man f gleichmäßig durch Treppenfunktionen approximie-
ren kann. Den Raum der Regelfunktionen bezeichnen wir mit R([a, b]).
Wir haben R([a, b]) so gewählt, damit wir das Integral, das bisher für f ∈ T ([a, b])
erklärt ist, auch für f ∈ R([a, b]) einfach definieren können.
Seien f ∈ R([a, b]) eine Regelfunktion, und fn ∈ T ([a, b]) mit lim fn − f  = 0.
n→
Dann heißt ( (
b b
f (x) dx := lim fn (x) dx
a n→ a
das Regel-Integral von f .

Wir müssen uns noch klar machen, dass dieser Grenzwert überhaupt existiert und
unabhängig von der gewählten Folge ( fn )n∈IN ist.
Laut den Eigenschaften (1) und (4) des Integrals für Treppenfunktionen gilt

( b ( b

fn (x) dx − fm (x) dx
≤ fn − fm  (b − a)

a a
≤ ( fn − f  + f − fm  ) (b − a)
( b
und mit fn − f  → 0 folgt, dass fn (x) dx eine Cauchyfolge in IK ist.
a n∈IN
Damit ist die Existenz des Grenzwertes gesichert.
Ist (gn )n∈IN eine weitere Folge in T ([a, b]) mit lim gn − f  = 0, so gilt
n→

( b ( b

f (x) dx − g (x) dx
≤ fn − gn  (b − a)

a n a
n
≤ ( fn − f  + f − gn ) (b − a)
( b ( b
und es folgt lim gn (x) dx = lim fn (x) dx.
n→ a n→ a
Nun haben wir belegt, dass die Definition widerspruchsfrei ist.
Bemerkungen:
(1) Wir werden in Kürze eine Charakterisierung der Regelfunktionen geben, aus
der unmittelbar folgt, dass jede stetige Funktion f : [a, b] → IK eine Regel-
funktion ist. Also existiert für jede stetige Funktion das Regel-Integral.
116 8 Integration
(2) Wenn eine Folge ( fn )n∈IN von Regelfunktionen eine Cauchyfolge bezüglich
·  ist, dann konvergiert diese im Banachraum (B([a, b]), ·  ) gegen eine
Funktion f , vgl. Satz 4.9. Man kann leicht einsehen, dass dann auch f wieder
durch Treppenfunktionen approximiert werden kann, also eine Regelfunktion
ist. Folglich ist (R([a, b]), · ) ein Banachraum.
(3) Auf Konvergenz von Funktionsfolgen bezüglich ·  (gleichmäßige Kon-
vergenz) werden wir in Kapitel 9 noch ausführlicher zu sprechen kommen.
Beispiel: Sei f : [0, 1] → IR, f (x) := x.

( 1
Wir zeigen, dass f ∈ R([0, 1]) gilt und berechnen f (x) dx.
0
Zu n ∈ IN betrachten wir fn : [0, 1] → IR mit fn (0) = 0 und
! !
k k−1 k
fn (x) := für x ∈ , (k = 1, . . . , n) .
n n n
& &
Für x ∈ k−1 k k k−1 1 1
n , n gilt damit | f n (x) − f (x)| < n − n = n , also f n − f  ≤ n .
Somit ist f ∈ R([0, 1]) und
( 1 ( 1 n n
k 1 1 n(n + 1) 1
0
f (x) dx = lim
n→ 0
fn (x) dx = lim
n→
 n n = n→
lim 2  k = lim
n n→ 2n2
= .
2
k=1 k=1
Satz 8.3. Seien f , g ∈ R([a, b]) und  ∈ IK. Dann gelten:

( b ( b ( b
(1) ( f (x) + g(x)) dx = f (x) dx + g(x) dx.
a a a
( b ( b
(2)  f (x) dx =  f (x) dx.
a a
( b ( b
(3) Sind f , g reellwertig und f ≤ g, so gilt f (x) dx ≤ g(x) dx.
a a
(4) Auch | f | ist eine Regelfunktion und

( b
(b

f (x) dx
≤ | f (x)| dx ≤ f  (b − a) .

a a
Beweis. Die Behauptungen (1) und (2) folgen mit den Rechenregeln für Grenzwerte
direkt aus den entsprechenden Eigenschaften des Integrals für Treppenfunktionen.
Zum Nachweis von (3) genügt es wiederum zu zeigen, dass aus f ≥ 0 stets
b
a f (x) dx ≥ 0 folgt.
Sei also f ∈ R([a, b]) mit f (x) ≥ 0 für alle x ∈ [a, b]. Dann gibt es eine Folge
( fn )n∈IN von Treppenfunktionen mit f − fn  → 0. Mit fn+ (x) := max{ fn (x), 0}
ist auch fn+ ∈ T ([a, b]) und es gilt fn+ − f  → 0.
b + b
Nun ist a f n (x) dx ≥ 0 für alle n ∈ IN und damit auch a f (x) dx ≥ 0.
8.1 Regelfunktionen 117
Im Hinblick auf (4) halten wir fest, dass | | f (x)| − | fn (x)| | ≤ | f (x) − fn (x)| für alle
x ∈ [a, b] ist. Also gilt | f | − | fn |  ≤ f − fn  .
Da mit fn ∈ T ([a, b]) auch | fn | ∈ T ([a, b]) ist, folgt | f | ∈ R([a, b]). Für die Trep-
penfunktionen fn wissen wir

( b
( b

f (x) dx
≤ | fn (x)| dx ≤ fn  (b − a)

n
a

a
und lim f − fn  = 0. Mit

n→

(

(
( b ( b

b

b
lim
fn (x) dx
f (x) dx
, lim | fn (x)| dx = | f (x)| dx

n→ a a n→ a a
und lim fn  = f  folgen die Ungleichungen auch für f .

n→
Bemerkung: Für f : [a, b] → C, f ∈ R([a, b]) gilt stets auch Re f , Im f ∈ R([a, b]).
Außerdem ist
( b ( b ( b ( b
Re f (x) dx = Re f (x) dx und Im f (x) dx = Im f (x) dx .
a a a a
Schreibweise: Seien I, X zwei Mengen und f : I → X eine Abbildung. Ist weiter

J ⊆ I, so bezeichnen wir mit f |J die Einschränkung von f auf J, d.h. f |J ist diejenige
Funktion J → X, die mit f auf J übereinstimmt.
Satz 8.4. Seien a < b < c reelle Zahlen und f : [a, c] → IK eine Abbildung.
Es gilt f ∈ R([a, c]) genau dann, wenn f |[a, b] ∈ R([a, b]) und f |[b, c] ∈ R([b, c])
ist. Gegebenenfalls ist dann
( c ( b ( c
f (x) dx = f (x) dx + f (x) dx .
a a b
Beweis. Man braucht nur f |[a, b] und f |[b, c] mit Treppenfunktionen zu approxi-
mieren und nehme diese Treppenfunktionen zur Approximation von f .
Umgekehrt liefert jede Approximation von f mit Treppenfunktionen, eventuell
nach Hinzunahme von b als weiteren Teilungspunkt, Approximationen von f |[a, b]
und f |[b, c].

Vereinbarungsgemäß setzt man

( b ( a ( a
f (x) dx := − f (x) dx für a > b und f (x) dx := 0 .
a b a
Satz 8.5. Sei f : [a, b] → IK eine Abbildung.

Es gilt f ∈ R([a, b]) genau dann, wenn für jedes x ∈ ]a, b[ sowohl der linksseitige
Grenzwert f (x−) als auch der rechtsseitige Grenzwert f (x+), für x = a der rechts-
seitige Grenzwert f (a+) und für x = b der linksseitige Grenzwert f (b−) existieren.
118 8 Integration
Beweis. Sei f ∈ R([a, b]). Zu x0 ∈ [a, b[ und  > 0 finden wir eine Treppenfunktion
g ∈ T ([a, b]) mit f − g < 2 .
Dann existiert ein Intervall ]x0 , a j [, sodass g| ]x0 , a j [ konstant ist, wobei a j aus
einer Teilung von g ist. Für beliebige x, y ∈ ]x0 , a j [ gilt damit
| f (x) − f (y)| ≤ | f (x) − g(x)| + |g(y) − f (y)| <  .
Ist nun (xn )n∈IN eine gegen x0 konvergente Folge mit xn > x0 ∀n, so gibt es ein N ∈ IN
mit xn ∈ ]x0 , a j [ für alle n ≥ N. Mit obiger Abschätzung folgt, dass ( f (xn ))n∈IN eine
Cauchyfolge ist. Daher existiert der Grenzwert f (x0 +).
Analog argumentiert man für x0 ∈ ]a, b], um Existenz von f (x0 −) zu begründen.
Für die umgekehrte Beweisrichtung sei vorausgesetzt, dass f (x0 +) für x0 ∈ [a, b[
und f (x0 −) für x0 ∈ ]a, b] existieren. Wir nehmen an, dass f nicht durch Treppen-
funktionen approximiert werden kann.
Dann gibt es also ein  > 0, sodass f − g ≥  für alle g ∈ T ([a, b]) gilt. Wir
konstruieren daraus induktiv eine Intervallschachtelung ([an , bn ])n∈IN0 mit
sup | f (x) − g(x)| ≥  für alle g ∈ T ([an , bn ]) .

x∈[an ,bn ]
Dazu beginnen wir mit [a0 , b0 ] := [a, b]. Sind [a0 , b0 ], [a1 , b1 ], . . . , [an , bn ] bereits er-
klärt, so setzen wir M := 12 (an + bn ). Dann müssen auch auf mindestens einer der
Hälften [an , M] oder [M, bn ] alle Treppenfunktionen einen ·  -Abstand von f ha-
ben, der größer

oder gleich  ist. Wir können nun [an+1 , bn+1 ] entsprechend wählen.
Sei x0 = [an , bn ].
n∈IN0
Wir betrachten den Fall, dass x0 ∈ ]a, b[ ist (für die Fälle x0 = a oder x0 = b kann
man die Argumentation leicht anpassen). Da f (x0 +) und f (x0 −) existieren, gibt es
zu beliebigem  > 0 eine Zahl  > 0 mit
| f (x) − f (x0 +)| <  für alle x ∈ ]x0 , x0 +  [

und | f (x) − f (x0 −)| <  für alle x ∈ ]x0 −  , x0 [ .
Schließlich gibt es n ∈ IN mit [an , bn ] ⊆ ]x0 −  , x0 +  [. Definiert man die Treppen-

funktion g : [an , bn ] → IK durch
⎧
⎨ f (x0 −) für x ∈ [an , x0 [ ,
⎪
g(x) := f (x0 ) für x = x0 ,
⎪
⎩
f (x0 +) für x ∈ ]x0 , bn ] ,
so gilt sup | f (x) − g(x)| <  im Widerspruch zu oben.

x∈[an ,bn ]
Damit ist gezeigt, dass f ∈ R([a, b]) ist.

8.2 Der Hauptsatz der Differential- und Integralrechnung 119
Korollar 8.6. Es gilt C([a, b]) ⊆ R([a, b]), d.h. jede stetige Funktion ist eine Regel-
funktion. Auch jede monotone Funktion ist Regelfunktion.
Beweis. Ist f ∈ C([a, b]), so gilt f (x+) = f (x) = f (x−) für jedes x ∈ ]a, b[ sowie
f (a+) = f (a) und f (b−) = f (b). Mit Satz 8.5 folgt f ∈ R([a, b]).
Ist f monoton, so benutze Satz 6.11.

8.2 Der Hauptsatz der Differential- und Integralrechnung

( x
Satz 8.7. Sei f ∈ R([a, b]). Für x ∈ [a, b] setze F(x) := f (t) dt.
a
Dann ist F : [a, b] → IK gleichmäßig stetig. Ist f stetig in x0 ∈ [a, b], so ist F im
Punkt x0 differenzierbar, und es gilt
F (x0 ) = f (x0 ) .
Beweis. Falls f die Nullfunktion ist, ist nichts zu zeigen. Andernfalls ist f  > 0
und für a ≤ x < y ≤ b folgt mit Satz 8.3(4) sowie Satz 8.4

( y
|F(y) − F(x)| =
f (t) dt
≤ f  (y − x) .
x

Zu  > 0 wählt man  = f  und sieht, dass F gleichmäßig stetig ist.
Sei nun f stetig in x0 . Zu beliebigem  > 0 gibt es  > 0 mit | f (t) − f (x0 )| < 
für alle t ∈ ]x0 −  , x0 +  [ ∩ [a, b]. Für solche t mit t = x0 gilt dann

F(t) − F(x0 )

1 (t 1
( t
− f (x0 )
=

f (s) ds − f (x0 ) ds

t − x0 t − x0 x0 t − x0 x0

(

1 t
( f (s) − f (x0 )) ds
<  .
t − x0 x0
Daraus folgt F (x0 ) = f (x0 ).

Der folgende Satz zeigt uns, wie die meisten Integrale zu lösen sind, nämlich über
Stammfunktionen, vgl. Definition 7.12. Man nennt diesen zusammen mit Satz 8.7
auch Hauptsatz der Differential- und Integralrechnung, da Differenzieren und
Integrieren in Beziehung gesetzt werden.
Satz 8.8. Ist f ∈ R([a, b]) und existiert eine differenzierbare Funktion F : [a, b] → IK
mit F (x) = f (x) für alle x ∈ [a, b], so gilt
( b
f (x) dx = F(b) − F(a) .
a
120 8 Integration
1
Beweis. Sei m ∈ IN. Es gibt gm ∈ T ([a, b]) mit f − gm  < m(b−a) und dazu eine
Teilung a = a0 < a1 < . . . < anm = b, sodass gm | ]ak−1 , ak [= ck für k = 1, . . . , nm .
Da F differenzierbar ist, gibt es laut dem Mittelwertsatz (Satz 7.10) nun Punkte
k ∈ ]ak−1 , ak [ mit F(ak ) − F(ak−1 ) = f (k ) (ak − ak−1). Damit haben wir

nm nm
nm

 f (k ) (ak − ak−1 ) −  ck (ak − ak−1)
≤  | f (k ) − ck | (ak − ak−1)

k=1 k=1

k=1
nm
1 1
< 
m(b − a) k=1
(ak − ak−1) =
m
nm nm
und andererseits  f (k ) (ak − ak−1) =  (F(ak ) − F(ak−1 )) = F(b) − F(a).
k=1 k=1
Daraus folgt

nm
1

(F(b) − F(a)) −  ck (ak − ak−1)
< .

k=1

m
Mit m →  erhalten wir schließlich die Behauptung, da
nm ( b ( b
lim
m→
 ck (ak − ak−1) = lim m→ a
gm (x)dx =
a
f (x)dx
k=1
(laut Definition des Integrals) ist.

Bemerkung: Wenn eine solche Stammfunktion F existiert, so ist sie bis auf eine
additive Konstante eindeutig, siehe auch Bemerkung (3) zu Korollar 7.11.
Setzt man in Satz 8.8 sogar f ∈ C([a, b]) voraus, so folgt die Behauptung sofort aus
Satz 8.7, denn mit G(x) := ax f (t) dt gilt dann G (x) = f (x).
Damit haben wir F (x) = G (x) für alle x ∈ [a, b] und folglich ist G − F eine
Konstante. Wegen G(a) = 0 hat diese Konstante nun den Wert −F(a). Somit gilt

G(x) = F(x) − F(a) und ab f (t) dt = G(b) = F(b) − F(a).

Mit Satz 8.8 hat man nun eine sehr praktische Methode, das Integral ab f (x) dx zu
berechnen, vorausgesetzt man kennt eine Stammfunktion von f . Satz 8.7 sagt uns
weiter, dass zumindest jedes stetige f eine Stammfunktion besitzt.
Wir wollen noch einige Beispiele von Funktionen f angeben, für die wir bereits
eine Stammfunktion F kennen.
xn+1
(1) f : IR → IR, f (x) := xn (n ∈ IN) , F(x) = .
n+1
xa+1
(2) f : ]0, [ → IR, f (x) := xa (a ∈ IR, a = −1) , F(x) = .
a+1
1
(3) f : ]0, [ → IR, f (x) := , F(x) = ln x.
x
8.3 Methoden zur Berechnung von Integralen 121
(4) f : IR → IR, f (x) := ex , F(x) = ex .

(5) f : IR → IR, f (x) := sin x , F(x) = − cosx.
(6) f : IR → IR, f (x) := cos x , F(x) = sin x.
1
(7) f : IR → IR, f (x) := , F(x) = arctan x.
1 + x2
Schreibweise: Oft schreibt man für die Stammfunktionen von f einfach das Symbol
(
f (x) dx .
Man nennt dies das unbestimmte Integral von f . Natürlich ist dieses auch nur bis
auf eine additive Konstante festgelegt.
Weiter schreibt man auch F(x)|x=b b
x=a oder F(x)|a an Stelle von F(b) − F(a).
8.3 Methoden zur Berechnung von Integralen
Satz 8.9 (Partielle Integration). Seien f , g ∈ R([a, b]), zu denen differenzierbare

Funktionen F und G existieren mit F (x) = f (x) und G (x) = g(x) für alle x ∈ [a, b].
Dann gilt
( b ( b
F(x)g(x) dx = F(b)G(b) − F(a)G(a) − f (x)G(x) dx .
a a
Beweis. Durch H(x) := F(x)G(x) ist eine differenzierbare Funktion erklärt und die
Produktregel liefert H (x) = f (x)G(x) + F(x)g(x). Man beachte weiter, dass H eine
Regelfunktion ist (dies folgt etwa mit Satz 8.5). Mit Satz 8.8 erhalten wir nun
( b
F(b)G(b) − F(a)G(a) = H(b) − H(a) = H (x) dx
a
( b ( b
= f (x)G(x) dx + F(x)g(x) dx
a a
wie behauptet.

( b
Beispiel: Seien 0 < a < b. Wir berechnen das Integral ln x dx.
a
Dazu setzen wir F(x) = ln x und g(x) = 1. Dann gilt f (x) = 1x und als Stammfunk-
tion zu g wählen wir G(x) = x. Mittels partieller Integration erhalten wir
( b ( b
ln x dx = b ln b − a ln a − 1 dx = b ln b − b − (a ln a − a) .
a a
122 8 Integration
Damit haben wir auch gleich eine Stammfunktion des Logarithmus gefunden: Die
Funktion L : ]0, [ → IR, L(x) := x ln x − x, ist differenzierbar mit L (x) = ln x, oder,
als unbestimmtes Integral geschrieben,
(
ln x dx = x ln x − x .
Als weitere Anwendung der partiellen Integration leiten wir eine Rekursionsformel
zur Berechnung von
( (
cosn x dx und sinn x dx
her. (Hier steht wie üblich cosn x als Abkürzung für (cos x)n , entsprechend bei sin.)
Mit F(x) = cosn−1 x und G(x) = sin x in Satz 8.9 erhalten wir
( (
cosn x dx = cosn−1 x sin x + (n − 1) cosn−2 x sin2 x dx
(
= cosn−1 x sin x + (n − 1) cosn−2 x (1 − cos2 x) dx
( (
und daraus n cosn x dx = cosn−1 x sin x + (n − 1) cosn−2 x dx.
( (
Analog zeigt man auch n sinn x dx = − sinn−1 x cos x+ (n − 1) sinn−2 x dx.
 /2
Mit den Grenzen a = 0 und b = 2 ergibt sich nun für die durch cn := 0 cosn dx
erklärte Folge (cn )n∈IN die folgende Rekursionsformel:
(  /2 (  /2
2n c2n = 2n cos2n x dx = (2n − 1) cos2n−2 x dx = (2n − 1)c2n−2 .
0 0
Also haben wir

(  /2
2n − 1 2n − 1 2n − 3 1 2n − 1 2n − 3 1 
c2n = c2n−2 = ··· 1 dx = ··· .
2n 2n 2n − 2 2 0 2n 2n − 2 2 2
Ebenso gilt auch (2n + 1)c2n+1 = 2n c2n−1 und folglich
(  /2
2n 2n − 2 2 2n 2n − 2 2
c2n+1 = ··· cos x dx = ··· .
2n + 1 2n − 1 3 0 2n + 1 2n − 1 3
Dies wollen wir nun noch benutzen, um das Wallissche Produkt zu berechnen. In
Beispiel 3.9 haben wir die Folge (pn )n∈IN mit
n
2k
pn = 
k=1 2k −1
pn √
untersucht. Wir zeigen noch, dass lim √ =  gilt.
n→ n
8.3 Methoden zur Berechnung von Integralen 123
' &
Zunächst erhalten wir aus cos2n x ≥ cos2n+1 x ≥ cos2n+2 x für x ∈ 0, 2 , dass
(cn )n∈IN monoton fallend ist, und weiter
c2n+1 c2n+2 2n + 1
1≥ ≥ = →1 mit n →  ,
c2n c2n 2n + 2
c2n+1
also gilt lim = 1.
n→ c2n
Andererseits folgt aus den Gleichungen (3.1) und (3.2), dass
p2n 2
lim =
n→ 2n + 1 2
√ p2n  c2n+1
mit einer Zahl 2 ≤  ≤ 2 ist. Wegen = ergibt sich  2 =  , also
2n + 1 2 c2n
1 n
2k √
lim √
n→ n  2k − 1 = .
k=1
Der nächste Satz liefert uns noch ein weiteres nützliches Hilfsmittel zu Berechnung
von Integralen.
Satz 8.10 (Substitutionsregel). Seien f : [A, B] → IK stetig und  : [a, b] → [A, B]
stetig differenzierbar.
Dann gilt
( b (  (b)
f ( (y))  (y) dy = f (x) dx .
a  (a)
Beweis. Die stetige Funktion f besitzt laut Satz 8.7 eine Stammfunktion F. Nun ist
F ◦  differenzierbar; die Kettenregel (Satz 7.4) liefert (F ◦  ) (y) = f ( (y))  (y).
Nach Voraussetzung ist  stetig. Damit ist y → f ( (y))  (y) insbesondere eine
Regelfunktion und mit Satz 8.8 ergibt sich
( b (  (b)
f ( (y))  (y) dy = F( (b)) − F( (a)) = f (x) dx
a  (a)
wie behauptet.

Beispiele:
(1) Die Funktion  : IR → IR, ' (y)& := sin(y), ist stetig differenzierbar mit
 (y) = cos(y) und es gilt  0, 2 = [0, 1]. Damit ist
( 1 (  ( /2) (  /2
1 − x2 dx = 1 − x2 dx = 1 − sin2 y cosy dy
0  (0) 0
(  /2

= cos2 y dy = c2 = .
0 4
124 8 Integration
( 2 √
(2) Das Integral sin x dx.
0
Wir setzen  : IR → IR,  (y) := y2 . Die Abbildung  ist stetig differenzierbar
und bildet das Intervall [0,  ] auf [0,  2 ] ab. Weiter gilt  (y) = 2y und damit
( 2 √ (  ( ) √ ( 
sin x dx = sin x dx = sin  (y)  (y) dy
0  (0) 0
( 
= 2y sin y dy .
0
Mit Hilfe partieller Integration erhalten wir schließlich

( 
 ( 

2y sin y dy = 2y(− cosy)

− 2(− cosy) dy
0 0 0
= −2 cos  + 0 cos 0 + 2 sin  − 2 sin 0 = 2 .
8.4 Uneigentliche Integrale
Definition 8.11. Eine Funktion f : ] ,  [ → IR, die auf jedem Intervall [a, b] ⊆ ] ,  [
integrierbar ist, heißt uneigentlich integrierbar, wenn für ein (und damit für jedes)
c ∈ ] ,  [ die Grenzwerte
( c ( b
lim f (x) dx und lim f (x) dx
a↓ a b↑ c
existieren. Man nennt dann

(  ( c ( b
f (x) dx := lim f (x) dx + lim f (x) dx
 a↓ a b↑ c
das uneigentliche Integral von f über ] ,  [.

Diese Definition gilt sinngemäß auch in den Fällen  = − und  = .
Ist f auch auf dem abgeschlossenen Intervall [ ,  ] integrierbar, so stimmt das un-
eigentliche Integral natürlich mit dem gewöhnlichen Integral überein. Dies folgt
direkt mit Satz 8.7.
Beispiele:
( 
1
(1) Das Integral 2
dx.
− 1 + x
1
Eine Stammfunktion zu x → 1+x2
kennen wir bereits. Es gilt
( 0 ( b
1 1
lim dx+ lim dx = lim (− arctan a)+ lim arctan b =  .
a→− a 1 + x2 b→ 0 1 + x2 a→− b→
8.5 Aufgaben 125
( 0
(2) Das Integral ex dx.
−
Hier genügt es, den Grenzwert für a → − zu betrachten, denn die Exponen-
tialfunktion ist auf jedem Intervall [a, 0] stetig und damit dort auch integrier-
bar. Wir erhalten
( 0 ( 0
ex dx = lim ex dx = lim (e0 − ea ) = 1 .
− a→− a a→−
( 1
1
(3) Das Integral dx (s > 0).
0 xs
Für a ∈]0, 1[ gilt
⎧
1
( 1
1
( 1 ⎨ −s+1
1
x−s+1
a , falls s = 1 ,
−s
dx = x dx =
1
xs ⎩
a a
ln(x)
a , falls s = 1 .
Im Fall s = 1 existiert das Integral nicht, denn es ist lim ln(a) = −.
a↓0
Im Fall s > 1 ist lim a−s+1 = , also existiert das Integral hier ebenfalls nicht.
a↓0
Gilt 0 < s < 1, so ist −s + 1 > 0 und wir haben lim a−s+1 = 0, also
a↓0
( 1 ( 1
1 1 1 −s+1 1
dx = lim dx = lim 1 − a−s+1 = .
0 xs a↓0 a xs a↓0 −s + 1 1−s
8.5 Aufgaben
1. Berechnen Sie die folgenden Integrale.

(  /4 ( 4 2 ( 3
x − 3x + 4 x2
a. cos(3x −  ) dx b. √ dx c. √ dx
0 1 x 0 1 + x2
( 2 ( 1 ( 1
x
d. ln x dx e. x ex dx f. dx
1 0 0 x+1
2. a. Sei g : [a, b] → IR differenzierbar mit g(x) = 0 ∀x ∈ [a, b]. Zeigen Sie: Es

gilt

( b
g(b)
g (x)
dx = ln

.
a g(x) g(a)
(  /2
cosx − sin x
b. Berechnen Sie dx.
0 cosx + sin x
2x
c. Bestimmen Sie eine Stammfunktion von f : IR → IR, f (x) := x2 +1
.
126 8 Integration
( 2

2 für m = n ,
3. Seien m, n ∈ ZZ. Zeigen Sie: Es gilt einx e−imx dx =
0 0 für m = n .
( 
1 1
4. Zeigen Sie: Für s > 1 gilt dx = .
1 xs 1−s
5. Begründen Sie, warum der Grenzwert

( a
lim sin x dx
a→ −a
existiert, nicht aber das uneigentliche Integral

( 
sin x dx .
−
6. Prüfen Sie, ob die folgenden uneigentlichen Integrale existieren und berechnen

Sie gegebenenfalls deren Wert.
( 1 ( 1 ( 
1
a. √ dx b. ln x dx c. ln x dx
−1 1 − x2 0 0
7. a. Zeigen Sie, dass (R([a, b]), · ) ein Banachraum ist.

b. Sei nun ( fn )n∈IN eine Folge, die in (R([a, b]), · ) gegen f konvergiert.
Zeigen Sie: Es gilt
( b ( b
lim fn (x) dx = f (x) dx .
n→ a a
c. Konstruieren Sie eine Folge ( fn )n∈IN in R([0, 1]), welche punktweise gegen
f ∈ R([0, 1]) konvergiert, d.h. lim fn (x) = f (x) ∀x ∈ [0, 1], aber dass
n→
( 1 ( 1
lim fn (x) dx = f (x) dx
n→ 0 0
gilt.
8. Zeigen Sie, dass

1 für x ∈ Q ,
f : [0, 1] → IR , f (x) :=
/ Q,
0 für x ∈
keine Regelfunktion ist.

8.5 Aufgaben 127
9. Zeigen Sie: Ist f : [a, b] → C eine stetige Funktion mit

( b
| f (x)| dx = 0 ,
a
so gilt f (x) = 0 für alle x ∈ [a, b].
10. Die so genannte Gammafunktion wird wie folgt erklärt:

( 
 : ]0, [ → IR ,  (x) := t x−1 e−t dt .
0
a. Zeigen Sie, dass dieses uneigentliche Integral existiert.

Hinweis: Für 0 ≤ t < 1 gilt t x−1 e−t ≤ t x−1 . Weiter existiert eine positive
Zahl c mit t x−1 ≤ c e−t/2 für t ≥ 1.
b. Zeigen Sie
 (x + 1) = x  (x) für alle x ∈ ]0, [ .
c. Folgern Sie
 (n + 1) = n! für alle n ∈ IN .
Kapitel 9
Funktionenfolgen und gleichmäßige Konvergenz
Wir wollen eine Problemstellung bezüglich Folgen von Funktionen zunächst an

Hand von einigen Beispielen erörtern.
sin(nx)
(1) Für n ∈ IN sei fn : IR → IR, fn (x) := √ .
n
Offensichtlich existiert eine Grenzfunktion f (x) := lim fn (x) = 0.
n→
√
Weiter ist auch jedes fn differenzierbar mit fn (x) = n cos(nx). Andererseits
gilt f (x) = 0. Somit konvergiert fn keinesfalls gegen f .
(2) Sei fn : [0, 1] → IR, fn (x) := n2 x(1 − x2 )n . Hier haben wir fn (0) = 0 = fn (1)
für alle n ∈ IN und für x ∈ ]0, 1[ gilt lim fn (x) = 0. Hingegen gilt
n→
( 1 ( 1
1
1 1 yn+1
1
x(1 − x2)n dx = yn dy = =
0 2 0 2 n + 1
0 2n + 2
( 1
1
und folglich fn (x) dx = n2 → .
0 ( 1 2n + 2 ( 1
Somit konvergiert fn (x) dx nicht gegen lim fn (x) dx = 0.
0 0 n→
(3) Setzt man gn (x) := nx(1 − x2)n , so gilt

( 1 ( 1
1
lim gn (x) dx = = lim gn (x) dx = 0 .
n→ 0 2 0 n→
(4) Für n ∈ IN sei

k
1 , falls x = für ein k ∈ ZZ ,
fn (x) := n!
0 , sonst.
Damit ist fn | [0, 1] laut Definition 8.1 eine Treppenfunktion und folglich auch
integrierbar.

130 9 Funktionenfolgen und gleichmäßige Konvergenz
Als Grenzfunktion f (x) := lim fn (x) ergibt sich

n→

1 , falls x ∈ Q ,
f (x) =
0 , falls x ∈ IR \ Q ,
denn für x ∈ IR \ Q gilt fn (x) = 0 für alle n ∈ IN; ist x ∈ Q, etwa x = qp mit
p ∈ ZZ, q ∈ IN, so haben wir für n ≥ q auch n! x ∈ ZZ, also fn (x) = 1 ∀n ≥ q.
Damit ist f | [0, 1] ∈
/ R([0, 1]).
An diesen Beispielen sehen wir, dass bei (punktweiser) Konvergenz von Folgen
( fn (x))n∈IN die Differentiation oder Integration mit der Limesbildung nicht ver-
tauscht werden dürfen. Das letzte Beispiel zeigt sogar, dass für die Grenzfunktion
das Integral gar nicht gebildet werden kann. Mit anderen Worten: R([a, b]) ist nicht
abgeschlossen unter punktweiser Konvergenz.
9.1 Gleichmäßige Konvergenz
Wir kennen inzwischen einen Konvergenzbegriff für beschränkte Funktionen. Ist M

eine Menge, so ist der Raum (B(M), ·  ) der beschränkten Funktionen mit der
durch f  = sup | f (x)| erklärten Norm ein Banachraum und es gilt
x∈M
·
fn −→ f ⇐⇒ sup | fn (x) − f (x)| → 0 ,
x∈M
vgl. auch Satz 4.9. Störend ist hierbei noch, dass wir prinzipiell nur beschränkte
Funktionen betrachten können.
Definition 9.1. Sei M eine Menge. Eine Folge ( fn )n∈IN von Funktionen fn : M → IK
heißt gleichmäßig konvergent gegen f : M → IK, falls gilt:
| fn (x) − f (x)| <  für alle n ≥ N und alle x ∈ M .
Letzteres ist äquivalent zu sup | fn (x) − f (x)| → 0 mit n → .

x∈M
Wir schreiben: fn → f gleichmäßig auf M.
Sind f und alle fn beschränkt, so gilt fn → f gleichmäßig auf M genau dann, wenn
fn → f bezüglich ·  gilt.
Der folgende Satz behandelt gleichmäßige Konvergenz und Stetigkeit.

Satz 9.2. Seien (M, d) ein metrischer Raum und ( fn )n∈IN eine Folge von Funktionen
fn : M → IK, die gleichmäßig auf M gegen f : M → IK konvergiert.
Sind alle fn in einem Punkt a ∈ M stetig, so ist auch f stetig in a.
9.1 Gleichmäßige Konvergenz 131
Beweis. Sei  > 0. Auf Grund der gleichmäßigen Konvergenz gibt es ein N ∈ IN
mit | fn (x) − f (x)| < 3 für alle x ∈ M und alle n ≥ N.
Wegen der Stetigkeit von fN in a gibt es  > 0 derart, dass | fN (x) − fN (a)| < 3
für alle x ∈ M mit d(x, a) <  gilt. Die Grenzfunktion f erfüllt dann
| f (x) − f (a)| ≤ | f (x) − fN (x)| + | fN (x) − fN (a)| + | fN (a) − f (a)| < 
für alle x ∈ M mit d(x, a) <  . Folglich ist f stetig in a.

Bemerkung: Es muss nicht notwendigerweise gleichmäßige Konvergenz vorliegen,

damit eine punktweise Grenzfunktion stetiger Funktionen stetig ist. Die Folge von
Beispiel (2) konvergiert gegen die stetige Nullfunktion.
Sie konvergiert aber nicht

1 n 1
n
gleichmäßig, denn wegen 1 − n → exp(−1) gilt fn √n = n 3/2 1 − 1n → .
Demnach haben wir hier sogar fn − 0 → .
Der Raum C([a, b]) der stetigen Funktionen f : [a, b] → IK ist ein Untervektor-
raum des normierten Raumes (B([a, b]), ·  ), da jede auf [a, b] stetige IK-wertige
Funktion beschränkt ist, vgl. Satz 6.16.
Korollar 9.3. Der Raum (C([a, b]), · ) ist ein Banachraum.
Beweis. Zu zeigen bleibt nur die Vollständigkeit.

Sei ( fn )n∈IN eine Cauchyfolge bezüglich ·  in C([a, b]). Dann ist diese auch
Cauchyfolge in B([a, b]) und konvergiert, da (B([a, b]), ·  ) ein Banachraum ist
(siehe Satz 4.9), gegen eine Funktion f ∈ B([a, b]).
Weiter folgt nun mit Satz 9.2, dass f ∈ C([a, b]) ist. Also ist (C([a, b]), · ) ein
Banachraum wie behauptet.

Das nächste Resultat behandelt gleichmäßige Konvergenz und Integration.
Satz 9.4. Sei ( fn )n∈IN eine Folge in R([a, b]), die gleichmäßig gegen eine Funktion
f : [a, b] → IK konvergiert.
Dann ist f ∈ R([a, b]) und es gilt
( b ( b
f (x) dx = lim fn (x) dx .
a n→ a
( b

Insbesondere ist auch die Folge fn (x) dx konvergent.
a n∈IN
Beweis. Zu  > 0 gibt es nach Definition der Regelfunktionen für jedes n ∈ IN eine
Treppenfunktion gn : [a, b] → IK mit gn − fn  < 2 .
Nach Voraussetzung gibt es ein N ∈ IN mit fn − f  < 2 für alle n ≥ N. Damit
haben wir
gn − f  ≤ gn − fn  + fn − f  < 
für alle n ≥ N.
Folglich gilt gn → f bezüglich der ·  -Norm, also gleichmäßig auf [a, b]. Mit
anderen Worten: Die Funktion f ist durch Treppenfunktionen approximierbar und
somit eine Regelfunktion. Für das Integral gilt mit Satz 8.3 (4) nun

( b ( b

( b

f (x) dx − fn (x) dx
=
( f (x) − fn (x)) dx
≤ f − fn  (b − a)

a a a
und mit n →  folgt die Behauptung.

Die Aussage von Satz 9.4 beinhaltet auch, dass (R([a, b]), ·  ) ein Banachraum
ist, vgl. auch Bemerkung (2) zu Definition 8.2. Wir notieren noch eine unmittelbare
Folgerung.
Korollar 9.5. Sei ( fn )n∈IN eine Folge in R([a, b]) derart, dass die Reihe

f (x) =  fn (x)
n=1
N N→
gleichmäßig auf [a, b] konvergiert, d.h.  fn (x) −→ f (x) gleichmäßig auf [a, b].
n=1
( b  ( b
Dann ist f ∈ R([a, b]) und es gilt
a
f (x) dx =  a
fn (x) dx.
n=1
Nun wenden wir uns den Beziehungen zwischen gleichmäßiger Konvergenz und
Differentiation zu. An Hand von Beispiel (1) sehen wir, dass gleichmäßige Konver-
genz es nicht immer ermöglicht, Differentiation und Grenzwert zu vertauschen.
Satz 9.6. Sei ( fn )n∈IN eine Folge stetig differenzierbarer Funktionen fn : [a, b] → IK,
die punktweise gegen eine Funktion f : [a, b] → IK konvergiert. Weiter konvergiere
die Folge ( fn )n∈IN der Ableitungen gleichmäßig auf [a, b].
Dann ist f differenzierbar und es gilt
f (x) = lim fn (x) für alle x ∈ [a, b] .

n→
Beweis. Setze g(x) := lim fn (x). Nach Satz 9.2 ist g : [a, b] → IK stetig.
n→
Laut dem Hauptsatz der Differential- und Integralrechnung gilt
( x
fn (x) = fn (a) + fn (t) dt für alle x ∈ [a, b] und alle n ∈ IN .
a
( x ( x ( x
n→
Satz 9.4 liefert fn (t) dt −→ g(t) dt; damit ist f (x) = f (a) + g(t) dt.
a a a
Durch Differentiation erhalten wir schließlich f (x) = g(x).

9.2 Differentiation und Integration von Potenzreihen 133
9.2 Differentiation und Integration von Potenzreihen
In Kapitel 5.4 haben wir Potenzreihen eingeführt und untersucht; in Korollar 6.6
haben wir die Stetigkeit einer Potenzreihe im Inneren des Konvergenzkreises herge-
leitet, und zwar mittels eines Satzes über Majoranten (Satz 6.5). Zur Differentiation
von Potenzreihen benötigen wir ein Resultat zur gleichmäßigen Konvergenz, um
Satz 9.6 anwenden zu können.
Satz 9.7. Seien M eine Menge und fk : M → IK beschränkte Funktionen (k ∈ IN) mit

fk M := sup | fk (x)|. Weiter gelte  fk M < .
x∈M k=1

Dann konvergiert die Reihe  fk absolut und gleichmäßig auf M gegen eine
k=1

beschränkte Funktion f : M → IK mit f M ≤  fk M .
k=1

Beweis. Wie im Beweis von Satz 6.5 gilt, dass f (x) :=  fk (x) wohldefiniert ist;
k=1
die Reihe konvergiert absolut in jedem x ∈ M mit
 
| f (x)| ≤  | fk (x)| ≤  fk M .
k=1 k=1

Also ist f M ≤  fk M . Zu zeigen bleibt die gleichmäßige Konvergenz.
k=1
n
Dazu betrachten wir die Partialsummen sn (x) :=  fk (x).
k=1

Zu  > 0 existiert N ∈ IN, sodass  fk M <  für alle n ≥ N gilt.
k=n+1
Für alle x ∈ M und n ≥ N ist dann


 

|sn (x) − f (x)| =

 fk (x)
≤  | fk (x)| ≤  fk M <  .

k=n+1
k=n+1 k=n+1
Daher konvergiert (sn )n∈IN gleichmäßig gegen f .


1
Anwendung: Durch f (x) :=  n2 + x2 ist eine stetige Funktion f : IR → IR erklärt.
n=1
1 1
Beweis. Für n ∈ IN betrachte fn : IR → IR, fn (x) := n2 +x2
. Es gilt sup | fn (x)| = n2
.
x∈IR
 
1
Da  n2
konvergent ist, folgt mit Satz 9.7 gleichmäßige Konvergenz von  fn (x).
n=1 n=1
Weiter ist jedes fn stetig; mit Satz 9.2 folgt jetzt die Stetigkeit von f .

Wir wollen nun den vorangehenden Satz in Zusammenhang mit Potenzreihen
stellen. Für z0 ∈ C und  ≥ 0 bezeichne wie üblich K (z0 ) = {z ∈ C : |z − z0 | ≤  }
die abgeschlossene Kreisscheibe mit Mittelpunkt z0 und Radius  .

Satz 9.8. Sei  ck zk eine Potenzreihe mit Konvergenzradius R > 0.
k=0
Weiter sei 0 <  < R. Dann konvergiert die Potenzreihe absolut und gleichmäßig
auf K (0).

Die Reihe  k ck zk−1 konvergiert ebenfalls absolut und gleichmäßig auf K (0).
k=1

Insbesondere ist die Funktion f : ] − R, R[ → IK, f (x) :=  ck xk , differenzierbar mit
k=0

f (x) =  k ck xk−1 .
k=1
Mehr noch, f ist beliebig oft differenzierbar mit


f (n) (x) =  k(k − 1) · · · (k − n + 1) ck xk−n .
k=n
Beweis. Betrachte fk (z) := ck zk . Für |z| ≤  gilt | fk (z)| ≤ |ck  k |. Damit erhalten
wir fk K (0) ≤ |ck  k |. Wegen  < R ist die Reihe

 ck  k
k=0
absolut konvergent, siehe Satz 5.19.


Mit Satz 9.7 folgt die gleichmäßige Konvergenz von  ck zk auf K (0).
k=0
√
Aus k
k → 1 folgt lim sup k k|ck | = lim sup k |ck | = R1 . Die Reihe
k→ k→

 k ck zk−1
k=1
hat also ebenfalls den Konvergenzradius R. Mit der gleichen Argumentation wie
eben erhält man, dass auch diese gleichmäßig auf K (0) konvergiert.
Für die Aussagen zu den Ableitungen wählen wir zu x ∈ ]− R, R[ eine Zahl  > 0
mit |x| <  < R. Fasst man die Partialsummen
n
sn (x) :=  ck xk
k=0
als Funktionen sn : [− ,  ] → IK auf, so erhält man die Behauptung zu f nun mit
Satz 9.6. Durch Wiederholung dieser Beweisführung folgt schließlich auch die all-
gemeine Behauptung.

9.2 Differentiation und Integration von Potenzreihen 135
Bemerkung: Eine Potenzreihe mit Konvergenzradius R konvergiert zwar gleich-

mäßig auf jeder abgeschlossenen Kreisscheibe K (0) mit 0 <  < R, aber eventuell
nicht gleichmäßig auf der offenen Kreisscheibe UR (0) = {z ∈ C : |z| < R}.
Auch ist mit Satz 9.8 keine allgemeine Aussage über Konvergenz oder Divergenz
auf dem Rand des Konvergenzkreises, also für diejenigen z mit |z| = R, möglich. Das
Konvergenzverhalten für |z| = R der ursprünglichen und der differenzierten Reihe
kann verschieden sein, wie etwa das Beispiel zu Beginn von Kapitel 10.3 zeigt.
Satz 9.8 beinhaltet speziell
f (n) (0) = n! cn ∀n ∈ IN0 (9.1)
(dabei sei f (0) := f ). Diese Formel ist bemerkenswert: Man erhält die Koeffizienten
der Potenzreihe von f durch Ableitungen f (n) an einer einzigen Stelle. Umgekehrt
lassen sich die Ableitungen an dieser Stelle direkt aus den Koeffizienten bestim-
men. Man beachte aber, dass es Funktionen f gibt, die beliebig oft differenzierbar

f (n) (0)
sind, bildet man jedoch die Potenzreihe  cn zn mit cn = n! gemäß (9.1), so
n=0
konvergiert diese Reihe für kein z = 0 gegen f (z).
Eine solche werden wir in Kapitel 10.1, Beispiel (2) finden.

Korollar 9.9. Sei  ck zk eine Potenzreihe mit Konvergenzradius R > 0.
k=0
Dann ist die Funktion

ck k+1
F : ] − R, R[ → IK , F(x) :=  k+1
x ,
k=0

differenzierbar mit F (x) =  ck xk .
k=0

Beweis. Wegen lim sup k
k+1
ck
= lim sup k |ck | = 1

R hat auch die Reihe
k→ k→

ck k+1
 k+1
z
k=0
den Konvergenzradius R. Die Behauptung folgt direkt mit Satz 9.8.

Beispiel: Die Potenzreihenentwicklung des Arcus-Tangens.
Wir wissen bereits aus Kapitel 7.3, Beispiel (2), dass arctan differenzierbar ist mit
arctan (x) = 1+x
1
2.
 
1
Für |x| < 1 gilt weiter 1+x2
=  (−x2 )k =  (−1)k x2k (Geometrische Reihe).
k=0 k=0
Eine Stammfunktion dieser Reihe erhalten wir laut Korollar 9.9 durch

(−1)k 2k+1
F : ] − 1, 1[ → IR , F(x) :=  2k + 1
x .
k=0
Folglich gilt F (x) = arctan (x) für |x| < 1 und damit arctanx = F(x) + c mit einem
noch zu bestimmenden c. Einsetzen von etwa x = 0 liefert schließlich c = 0.
Also haben wir arctan x = F(x), zunächst für x ∈ ] − 1, 1[. Die Reihe F(x) kon-
vergiert laut Leibniz-Kriterium allerdings auch für x = ±1. Wir wollen noch zeigen,
dass ihr Wert auch dort mit dem Arcus-Tangens übereinstimmt.
Für x ∈ ] − 1, 1[ gilt (vgl. auch Kapitel 5.7, Aufgabe 6) die Abschätzung

n
(−1)k 2k+1
|x|2n+3

arctan(x) −  x
≤ .

k=0 2k + 1

2n + 3
Wegen der Stetigkeit aller beteiligten Ausdrücke gilt dies auch für x = ±1, also

n
(−1)k

arctan(1) − 
≤ .

k=0 2k + 1

2n + 3
Grenzwertbildung n →  liefert die Behauptung. Insgesamt haben wir damit


(−1)k 2k+1
arctan(x) =  2k + 1
x für x ∈ [−1, 1] .
k=0

 (−1)k 1 1 1
Insbesondere gilt = arctan(1) =  = 1 − + − ± ···
4 k=0 2k + 1 3 5 7
9.3 Der Approximationssatz von Weierstraß
Wie wir gezeigt haben, kann jede Potenzreihe mit Konvergenzradius R > 0 auf ab-
geschlossenen Intervallen [− ,  ] mit 0 <  < R gleichmäßig durch eine Folge von
Polynomen, nämlich den Partialsummen der Reihe, approximiert werden.
Wir wollen nun den Weierstraßschen Approximationssatz herleiten, der besagt,
dass sogar jede auf einem Intervall [a, b] stetige IK-wertige Funktion der Grenzwert
einer gleichmäßig konvergenten Folge von Polynomen ist. Dazu betrachten wir das
so genannte n-te Bernsteinpolynom zu einer Funktion f : [0, 1] → IK, welches wie
folgt definiert ist:
n
k n k
Bn (t; f ) :=  f t (1 − t)n−k .
k=0 n k
Unser Ziel ist, zu zeigen, dass für f ∈ C([0, 1]) stets
Bn (·; f ) − f  = sup |Bn (t; f ) − f (t)| → 0

t∈[0,1]
mit n →  gilt.
9.3 Der Approximationssatz von Weierstraß 137
Zunächst bestimmen wir Bn (t; f j ) für f j (t) := t j , j = 0, 1, 2.

Es gilt
n
n k
Bn (t; f0 ) =  t (1 − t)n−k = (t + (1 − t))n = 1 (9.2)
k=0 k

und für n ≥ 1 erhalten wir mit nk nk = n−1
k−1 nun
n n
k n k n−1 k
Bn (t; f1 ) =  n k
t (1 − t)n−k = 
k − 1
t (1 − t)n−k
k=0 k=1
n−1
n − 1 k+1
=  k
t (1 − t)n−(k+1) = t (t + (1 − t))n−1 = t . (9.3)
k=0
Für n ≥ 2 haben wir schließlich

n 2 n−1
k n k k + 1 n − 1 k+1
Bn (t; f2 ) =  t (1 − t)n−k =  t (1 − t)n−(k+1)
k=0 n k k=0 n k
n−1 n−1
1 n − 1 k+1 k n−1 k
=
n  k
t (1 − t)n−1−k
+ t
n k
t (1 − t)n−1−k
k=0 k=0
n−1
t t(n − 1) k n−1 k
=
n
+
n  n−1 k
t (1 − t)n−1−k
k=0
t t(n − 1) t(1 − t) 2
= + t= +t . (9.4)
n n n
Weiter gilt Bn (t; f + g) = Bn (t; f ) + Bn (t; g) sowie Bn (t;  f ) =  Bn (t; f ) für  ∈ IK
und f , g : [0, 1] → IK. Falls f und g reellwertige Funktionen sind mit f ≤ g, so ist
auch Bn (t; f ) ≤ Bn (t; g).
Satz 9.10 (Weierstraßscher Approximationssatz). Sei f ∈ C([a, b]).

Es existiert eine Folge von Polynomen (Pn )n∈IN derart, dass
lim Pn − f  = 0
n→
gilt. Ist f reellwertig, so können die Pn reell gewählt werden. Für a = 0 und b = 1
kann man Pn (t) = Bn (t; f ) wählen.
[a, b] = [0, 1] annehmen. Die allgemeine Aussage folgt dann,

Beweis. Wir können
t−a
indem wir f b−a betrachten.
Sei also f ∈ C([0, 1]). Da f nach Satz 6.18 gleichmäßig stetig ist, gibt es zu
beliebigem√  > 0 ein  > 0 derart, dass | f (s) − f (t)| <  für alle s,t ∈ [0, 1] mit
|s − t| <  gilt.
2 f 
Sei  :=  . Als nächstes zeigen wir
| f (s) − f (t)| ≤  +  (s − t)2 für alle s,t ∈ [0, 1] . (9.5)
Im Fall |s − t| <  gilt dies wegen der speziellen Wahl von  ; andernfalls ist
 +  (s − t)2 ≥  +  =  + 2 f  > | f (s)| + | f (t)| ≥ | f (s) − f (t)| .
Damit ist (9.5) bewiesen.

Wir betrachten die Funktion gs : [0, 1] → IR, gs (t) := (s − t)2 . Aus (9.5) erhalten
wir − −  gs ≤ f (s) − f ≤  +  gs für alle s ∈ [0, 1]. Es folgt
−Bn (· ;  +  gs ) = Bn (· ; − −  gs ) ≤ Bn (· ; f (s) − f ) ≤ Bn (· ;  +  gs )
und weiter
(9.2)
| f (s) − Bn (t; f )| = |Bn (t; f (s) − f )| ≤ Bn (t;  +  gs )

(9.3),(9.4) 2 t(1 − t) 2
=  +  Bn (t; gs ) =  +  s − 2 st +  +t
n
für alle s,t ∈ [0, 1]. Setzt man s = t, so folgt
t(1 − t) 
| f (t) − Bn (t; f )| ≤  +  ≤+
n n
für alle t ∈ [0, 1]. Mit n →  folgt schließlich die Behauptung, da  > 0 beliebig
wählbar ist.

9.4 Aufgaben
sin(nx)
1. Zeigen Sie, dass die mittels fn (x) := √
n
erklärte Funktionenfolge ( fn )n∈IN
gleichmäßig auf IR konvergiert.
2. Für x ∈ IR seien
nx4 2 nx
fn (x) := , gn (x) := e−nx und hn (x) := .
1 + nx2 1 + n 2 x2
Untersuchen Sie, ob die Funktionenfolgen ( fn )n∈IN , (gn )n∈IN bzw. (hn )n∈IN
gleichmäßig konvergent auf IR sind.
3. Seien I, J Intervalle und ( fn )n∈IN eine Folge von Funktionen fn : I → J, die

gleichmäßig gegen f : I → J konvergiert. Weiter sei g : J → IR gleichmäßig
stetig.
Zeigen Sie, dass die Folge (g ◦ fn )n∈IN ebenfalls gleichmäßig konvergent ist.
9.4 Aufgaben 139
4. Untersuchen Sie, ob die gegebenen Funktionenfolgen

(i) gleichmäßig konvergent sind,
(ii) einen stetigen Grenzwert haben.
a. fn : [0, 1] → IR, fn (x) := xn ,
' & 1
b. gn : 0, 12 → IR, gn (x) := xn ,
c. hn : [0, 1] → IR,
⎧ 1
⎪
⎪ 2nx , für 0 ≤ x ≤ 2n ,
⎨ 1 1
1 1
hn (x) := 2 − 2nx , für 2n < x ≤ n , n
⎪
⎪
⎩ Die Abbildung zeigt den
0, sonst . Graph der Funktion hn .
5. a. Zeigen Sie, dass durch


1
f (x) :=  (n + x)2 für x ≥ 0
n=1
eine stetige Funktion f : [0, [ → IR erklärt ist.

b. Begründen Sie, dass f differenzierbar ist.
( 1
c. Berechnen Sie f (x) dx.
0
6. Eine Folge ( fn )n∈IN von Funktionen fn ∈ R([a, b]) heißt konvergent im qua-
dratischen Mittel gegen f ∈ R([a, b]), falls
( b
lim | fn (x) − f (x)|2 dx = 0 .
n→ a
a. Zeigen Sie: Wenn eine Folge ( fn )n∈IN von Regelfunktionen gleichmäßig

auf [a, b] gegen f konvergiert, dann konvergiert die Folge auch im quadra-
tischen Mittel gegen f .
b. Geben Sie ein Beispiel einer Folge an, die im quadratischen Mittel aber
nicht gleichmäßig konvergent ist.
c. Zeigen Sie, dass mittels
( b
f (x) g(x) dx
a
ein Skalarprodukt auf C([a, b]) definiert ist. Warum ist dies kein Skalarpro-
dukt auf R([a, b]) ?
Zeigen Sie ferner, dass C([a, b]) mit der durch dieses Skalarprodukt er-
klärten Norm nicht vollständig ist.
7. Der Integralsinus (oder Sinus Integralis) ist definiert durch

( x
sint
Si : IR → IR , Si(x) := dt .
0 t

(−1)k
Zeigen Sie: Für x ∈ IR gilt Si(x) =  (2k + 1)! (2k + 1)
x2k+1 .
k=0
Kapitel 10
Taylorreihen
Aus der Gleichung (9.1) wissen wir, dass eine Funktion, die durch eine Potenzreihe
dargestellt wird, durch die Werte ihrer Ableitungen an einem einzigen Punkt ein-
deutig bestimmt ist. Wir wollen uns nun überlegen, inwiefern man allgemein eine
beliebig oft differenzierbare Funktion rekonstruieren kann, wenn man die Ableitun-
gen an einer bestimmten Stelle kennt. Ist eine Funktion nur n-mal differenzierbar, so
kann man sich immerhin fragen, ob man mit Kenntnis der Ableitungen an einer Stel-
le wenigstens in der Lage ist, diese Funktion näherungsweise zu bestimmen. Dies
führt uns zu den so genannten Taylorpolynomen und Taylorreihen (Brook Taylor,
1685-1731, Cambridge).
10.1 Der Satz von Taylor
Satz 10.1 (Taylor). Sei f : [a, b] → IK eine Funktion derart, dass f (n−1) stetig auf
[a, b] ist und f (n) (t) für alle t ∈ ]a, b[ existiert. Ferner seien c, x ∈ [a, b], c = x.
Dann existiert eine Zahl  zwischen x und c mit
n−1
f (k) (c) f (n) ( )
f (x) =  k!
(x − c)k +
n!
(x − c)n .
k=0
n−1
f (k) (c)
Beweis. Für t ∈ [a, b] bezeichne Tn−1 (t; f ) :=  k!
(t − c)k .
k=0
f (x) − Tn−1 (x; f )
Mit M := haben wir f (x) = Tn−1 (x; f ) + M (x − c)n .
(x − c)n
Es bleibt zu zeigen, dass n! M = f (n) ( ) für ein  ∈ ]c, x[ bzw.  ∈ ]x, c[ gilt.
Die Funktion g : [a, b] → IK, g(t) := f (t) − Tn−1 (t; f ) − M (t − c)n , ist in ]a, b[
n-mal differenzierbar mit
g(n) (t) = f (n) (t) − n! M .

142 10 Taylorreihen
Somit ist nur noch zu zeigen, dass es  zwischen x und c gibt mit g(n) ( ) = 0.
(k)
Für k = 0, . . . , n − 1 gilt Tn−1 (c; f ) = f (k) (c) und damit g(k) (c) = 0.
Nach Wahl von M ist g(x) = 0; laut dem Mittelwertsatz gibt es ein x1 zwischen x
und c mit g (x1 ) = 0. Mit dem Paar c, x1 folgt analog, dass ein x2 zwischen x1 und
c existiert mit g (x2 ) = 0. Nach n Schritten kommt man zu einem xn zwischen xn−1
und c mit g(n) (xn ) = 0. Mit  := xn folgt nun die Behauptung.

Bemerkung: Für n = 1 ist der Satz von Taylor genau der Mittelwertsatz.
f (n) ( )
Man bezeichnet den letzten Summanden Rn (x) := (x − c)n in Satz 10.1
n!
als Lagrange-Restglied (Joseph Louis Lagrange, 1736-1813, Berlin, Paris). Der
Satz zeigt, dass f durch ein Polynom vom Grad n − 1 näherungsweise beschrieben
werden kann; eine mögliche Fehlerabschätzung erhält man etwa, wenn man eine
Schranke für | f (n) | kennt. Die Polynome
n−1
f (k) (c)
Tn−1 (t; f ) :=  k!
(t − c)k
k=0
nennt man Taylorpolynome mit Entwicklungspunkt c. Ist f beliebig oft differen-

zierbar, so heißt

f (k) (c)
T f (t) :=  (t − c)k
k=0 k!
die Taylorreihe von f mit Entwicklungspunkt c. Ob die Taylorreihe von f mit f
übereinstimmt, kann nur über Abschätzung der Restglieder erfolgen. Verschärft man
die Voraussetzung an f , so erhält man ein Restglied in Integralform.
Satz 10.2. Sei f : [a, b] → IK eine n-mal stetig differenzierbare Funktion. Ferner
seien c, x ∈ [a, b].
Dann gilt
n−1 (k) ( x
f (c) 1
f (x) =  (x − c)k + (x − t)n−1 f (n) (t) dt .
k=0 k! (n − 1)! c
Beweis. Bezeichne Rn (t) := f (t) − Tn−1(t; f ).

(n)
Dann ist Rn : [a, b] → IK auch n-mal stetig differenzierbar und Rn (t) = f (n) (t).
(k) (k)
Wegen Tn−1 (c; f ) = f (k) (c) gilt weiter Rn (c) = 0 für k = 0, . . . , n − 1. Mit partieller
Integration erhalten wir
( x ( x
(n)
(x − t)n−1 f (n) (t) dt = (x − t)n−1Rn (t) dt
c c

t=x ( x
(n−1)
(n−1)
= (x − t)n−1 Rn (t)
+(n − 1) (x − t)n−2Rn (t) dt
t=c c
( x
(n−1)
= (n − 1) (x − t)n−2Rn (t) dt .
c
10.1 Der Satz von Taylor 143
Wiederholung der partiellen Integration führt schließlich zu

( x
(n − 1)(n − 2) · · · 1 (x − t)0 Rn (t) dt = (n − 1)! (Rn (x) − Rn (c)) = (n − 1)! Rn (x) ,
c
womit die Behauptung bewiesen ist.

Beispiele:
(1) Sei f : IR → IR, f (x) := exp(x). Mit c = 0 erhalten wir für beliebiges x = 0,
da f (k) (0) = 1 ∀k ∈ IN ist,

n−1 k
f (n) ( ) n
e|x| |x|n

f (x) − 
=
x
≤

k=0 k!

n!
n!
mit einem  zwischen 0 und x.

Damit kann man zeigen, dass e nicht rational ist:
Angenommen, es gelte e = qp mit p, q ∈ IN. Dann folgt q! e ∈ IN und auch
 := q! (e − 1 − 1!1 − 2!1 − · · · − q!1 ) ∈ IN. Mit obiger Restgliedabschätzung
e q! e
erhalten wir aber 0 <  = q! Rq+1 (1) ≤ (q+1)! = q+1 < 1. Daraus folgt ins-
besondere  ∈ / IN, ein Widerspruch!
T2
T1
Die Abbildung zeigt die Graphen der
Exponentialfunktion sowie der Taylor-
polynome T1 , T2 und T3 zum Entwick-
lungspunkt c = 0.
Man erkennt, dass das Restglied, also
die Differenz zwischen Taylorpolynom
und Funktionswert, in der Nähe des
Entwicklungspunktes klein ist, aber
rasch wächst, wenn man sich vom Ent- T3
wicklungspunkt entfernt.
(2) Sei f : IR → IR,

exp(−1/x2) für x = 0 ,
f (x) :=
0 für x = 0 .
Wir werden sehen, dass f beliebig oft differenzierbar ist und f (n) (0) = 0 gilt
für alle n ∈ IN0 . Damit ist die Taylorreihe von f mit Entwicklungspunkt c = 0
identisch 0, obwohl f nicht die Nullfunktion ist.
144 10 Taylorreihen
Es gilt sogar

(n)
pn (1/x) exp(−1/x2) für x = 0 ,
f (x) =
0 für x = 0 ,
wobei pn ein Polynom ist.

Beweis. Wir beweisen dies mit vollständiger Induktion. Für n = 0 ist die
Aussage offensichtlich erfüllt. Gilt die Behauptung für ein n, so erhalten wir
für x = 0 nun

d 1 1
f (n+1) (x) = pn exp − 2
dx x x

1 1 1 1 1
= exp − 2 −pn + 2p n .
x x x2 x x3
Setze pn+1 (t) := −t 2 pn (t) + 2t 3 pn (t). Da pn ein Polynom ist, ist auch pn+1
ein Polynom. Schließlich gilt
f (n) (t) − f (n) (0) pn (1/t) exp(−1/t 2)

f (n+1) (0) = lim = lim
t→0 t t→0 t
= lim s pn (s) exp(−s2 ) = 0 ,
s→
womit die Behauptung auch für n + 1 gezeigt ist.

(3) Wir wollen mit √ Hilfe des Satzes von Taylor und Restgliedabschätzung eine
Näherung für 2 bestimmen.
√
Dazu betrachten wir die Funktion f : [0, [ → IR, f (x) := x. Diese ist im
Intervall ]0, [ beliebig oft differenzierbar.
1 √1 √3 .
Es gilt f (x) = √
2 x
, f (x) = − und f (x) =
4 x3 8 x5
Das Taylorpolynom T3 zum Entwicklungspunkt c > 0 lautet demnach
√ t − c (t − c)2 (t − c)3
T3 (t; f ) = c+ √ − √ + √ .
2 c 8 c3 16 c5
Im Fall c = 1 und t = 2 erhalten wir T3 (2; f ) = 1 + 12 − 18 + 16

1
= 23
16 .
√
Um zu sehen, wie weit dieser Wert vom wahren“ Funktionswert 2 entfernt
”
ist, müssen wir die Differenz f (t) − T3 (t; f ) = R4 (t) abschätzen. Laut dem
Satz von Taylor gibt es ein  ∈ ]1, 2[ derart, dass
√ f (4) ( )
2 = f (2) = T3 (2; f ) + (2 − 1)4
4!
15
gilt, und mit f (4) (x) = − √ erhalten wir
16 x7
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt 145

√ 23

1 15

5
5

2 −
= | f (2) − T3(2; f )| =

=

≤ .
16
24 16  7

128  7
128
Mit anderen Worten: Die Zahl 23

16 als Näherungswert unterscheidet sich vom
√ 5
wahren Wert von 2 um nicht mehr als 128 .
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt
Häufig berechnet man Taylorreihen durch Umformung bekannter Reihen. Dazu

benötigen wir ein Ergebnis über Umstellungen in der Reihenfolge der Summation.
Lemma 10.3. Gegeben sei eine Doppelfolge (ai j )i∈IN , j∈IN von Zahlen ai j ∈ IK mit
folgenden Eigenschaften:

(i)  |ai j | = bi (absolute Konvergenz bei festem i),
j=1

(ii)  bi konvergiert.
i=1
   
Dann folgt   ai j =   ai j .
i=1 j=1 j=1 i=1
Beweis. Für n ∈ IN sei xn := 1n . Weiter sei x0 := lim xn = 0.

n→
Die Menge M := {x0 , x1 , x2 , . . .} ist mit der natürlichen Metrik ein metrischer
Raum. Zu jedem i ∈ IN definieren wir eine Funktion fi : M → IK mittels
 n
fi (x0 ) :=  ai j und fi (xn ) :=  ai j für n ∈ IN .
j=1 j=1
Es gilt lim fi (xn ) = fi (x0 ); laut Folgenkriterium (Satz 6.2) ist jedes fi stetig in x0 .
n→

Wegen | fi (xn )| ≤ bi für alle n ∈ IN0 folgt mit Satz 9.7, dass die Reihe  fi
i=1
gleichmäßig auf M gegen eine Grenzfunktion g : M → IK konvergiert und Satz 9.2
liefert dann die Stetigkeit von g im Punkt x0 .

Nach Konstruktion von g gilt weiter g(x1 ) =  ai1 sowie
i=1

  j j−1 
g(x j ) − g(x j−1) =  fi (x j ) − fi (x j−1 ) =   aik −  aik =  ai j
i=1 i=1 k=1 k=1 i=1

n n 
für j ≥ 2. Damit haben wir g(xn ) = g(x1 ) +  g(x j ) − g(x j−1) =   ai j .
j=2 j=1 i=1
146 10 Taylorreihen
Schließlich erhalten wir, mit dem Folgenkriterium angewandt auf g,

  n    
  ai j = n→
lim   ai j = lim g(xn ) = g(x0 ) =  fi (x0 ) =   ai j
n→
j=1 i=1 j=1 i=1 i=1 i=1 j=1
wie behauptet.

Bemerkung: Man beachte, dass die spezielle Wahl der Folge (xn )n∈IN im Beweis
von Lemma 10.3 keine Rolle spielt. Es kommt lediglich darauf an, dass der Grenz-
wert x0 = lim xn existiert und dass xn = xm für n = m gilt.
n→
Ein Beispiel für eine Doppelfolge, bei der die Reihenfolge der Summation nicht
vertauscht werden darf (und die folglich die Voraussetzungen von Lemma 10.3 nicht
erfüllt), bringen wir in Aufgabe 3 am Ende dieses Kapitels.
Satz 10.4. Sei f : ] − R, R[ → IK durch eine Potenzreihe mit Konvergenzradius R > 0
definiert, etwa

f (x) =  ck xk .
k=0
Weiter sei c ∈ ] − R, R[.

Für x ∈ UR−|c| (c) = ] c − (R − |c|) , c + (R − |c|) [ gilt dann

f (k) (c)
f (x) =  k!
(x − c)k .
k=0
Beweis. Für x ∈ UR−|c| (c) haben wir

  n
n
f (x) =  cn ((x − c) + c)n =  cn  k
(x − c)k cn−k .
n=0 n=0 k=0
n
Wir setzen ank := cn k (x − c)k cn−k für k = 0, . . . , n und ank := 0 für k > n. Da

  
n

n n−k
  |ank | =  
n k
c c (x − c)
=  |cn | ( |x − c| + |c| )
k
n
n=0 k=0 n=0 k=0 n=0
konvergiert, sind die Voraussetzungen von Lemma 10.3 erfüllt und wir erhalten
     
n
f (x) =   ank =   ank =   cn cn−k (x − c)k .
n=0 k=0 k=0 n=0 k=0 n=k k
Laut Satz 9.8 gilt


f (k) (c) 1  n
=  n(n − 1) · · ·(n − k + 1) cn cn−k =  cn cn−k
k! k! n=k n=k k
und die Behauptung ist bewiesen.

10.2 Potenzreihen mit allgemeinem Entwicklungspunkt 147
Bemerkung: Satz 10.4 gilt entsprechend auch im Fall R = .

Betrachten wir Reihen der Form

 ck (z − c)k
k=0
für ein c ∈ IK, so gibt es laut Satz 5.19 genau ein R ≥ 0 (oder R = ) derart, dass die
Reihe absolut konvergiert für z ∈ UR (c) und divergiert für |z| > R. Man braucht nur
u := z − c zu betrachten. Diesen Wert R nennen wir ebenfalls Konvergenzradius,
der Punkt c heißt Entwicklungspunkt.
Beispiel: Die Geometrische Reihe hat den Konvergenzradius 1; für |x| < 1 ist

1
f (x) :=  xk = 1 − x .
k=0
k+1
Sei c := − 12 . Aus 1
k! f (k) − 12 = 23 und mit Satz 10.4 ergibt sich
 k+1
1 2 1 k
= x+ (10.1)
1 − x k=0 3 2
zunächst für x ∈ ] − 1, 0[. Letztere Reihe hat allerdings den Konvergenzradius R = 32 .

Sie konvergiert daher sogar für x ∈ ] − 2, 1[.
Wir wollen noch einige wichtige Eigenschaften festhalten. Sei


f (z) =  ck (z − c)k
k=0
eine Potenzreihe mit Konvergenzradius R > 0 (oder R = ).

Die Funktion f ist in UR (c) = {z ∈ IK : |z − c| < R} stetig (vgl. Korollar 6.6).
Damit

folgt, dass (10.1) tatsächlich für alle x ∈ ] − 2, 1[ und sogar für alle x ∈ C mit
x + 1
< 3 gilt.
2 2
Im Folgenden sei c ∈ IR. Laut Satz 9.8 ist f in ]c − R, c + R[ beliebig oft differen-
zierbar und es gilt

f (n) (x) =  k(k − 1) · · · (k − n + 1) ck (x − c)k−n .
k=n
Die Taylor-Reihe von f mit Entwicklungspunkt c ist genau die Potenzreihe, denn es
ist f (n) (c) = n! cn . Insbesondere gilt also folgender Identitätssatz:
 
Korollar 10.5. Falls  ck (x − c)k =  dk (x − c)k für alle x ∈ ]c −  , c +  [ mit
k=0 k=0
einer Zahl  > 0 ist, so gilt ck = dk für alle k ∈ IN0 .
148 10 Taylorreihen
Analog zu Korollar 9.9 ergibt sich, dass durch


ck
F : ]c − R, c + R[ → IK , F(x) =  k + 1 (x − c)k+1
k=0
eine Stammfunktion von f gegeben ist.
10.3 Der Abelsche Grenzwertsatz
Wir beginnen mit einem Beispiel.

Die Funktion f : ]− 1, [ → IR, f (x) := ln(1 + x), ist differenzierbar mit f (x) = 1+x
1
.

Für |x| < 1 können wir f (x) als Potenzreihe schreiben: Es gilt f (x) =  (−1)k xk .
k=0
Eine Stammfunktion dieser Reihe können wir leicht angeben. Damit erhalten wir

xk+1
 (−1)k k+1 = f (x) + c mit einer Konstante c ∈ IR.
k=0
Einsetzen von etwa x = 0 liefert c = 0. Somit haben wir

xk+1
ln(1 + x) =  (−1)k k + 1 für |x| < 1 .
k=0
Laut dem Leibniz-Kriterium (Korollar 5.15) konvergiert die Reihe rechts auch noch
für x = 1. Um zu zeigen, dass sie gegen ln(2) konvergiert, benutzen wir den folgen-
den Satz. Man beachte, dass die differenzierte Reihe für x = 1 nicht konvergiert.
Satz 10.6 (Abelscher Grenzwertsatz).


Es sei f (x) =  ck (x − c)k eine Potenzreihe mit Konvergenzradius R > 0, c ∈ IR.
k=0

Für den Randpunkt x = c + R sei die Reihe  ck Rk auch konvergent.
k=0
Dann gilt

lim
x→(c+R)−
f (x) =  ck R k .
k=0

Insbesondere ist f : ]c − R, c + R] → IK, f (x) =  ck (x − c)k , stetig.
k=0
Beweis. Ersetzt man x durch Ry + c, so ergibt sich eine Potenzreihe um Null mit
Konvergenzradius 1.
 
Es reicht also, f (x) =  ck xk mit R = 1 und konvergenter Reihe  ck anzunehmen.
k=0 k=0
n
Mit Sn :=  ck für n ∈ IN0 und S−1 := 0 gilt
k=0
10.4 Aufgaben 149
N N N−1
 ck xk =  (Sk − Sk−1) xk = (1 − x)  Sk xk + SN xN
k=0 k=0 k=0
und mit N →  folgt


f (x) = (1 − x)  Sk xk für |x| < 1 ;
k=0



diese Reihe ist konvergent, denn es gilt
 Sk x
≤ max |Sn |  xk .

k
k=0 n∈IN0 k=0

Betrachte S := lim Sn =  ck .
n→ k=0
Zu  > 0 existiert N ∈ IN mit |S − Sn| < 2 ∀n ≥ N. Wir erhalten

| f (x) − S| =
(1 − x)  (Sk − S) x

k=0

N 

≤ (1 − x)  |Sk − S| |xk | + (1 − x)  |x|k
k=0 2 k=0

=1
N

≤ (1 − x)  |Sk − S| + .
k=0 2
N

Nun gibt es eine Zahl  > 0 mit (1 − x)  |Sk − S| < 2 für alle x ∈ ]1 −  , 1].
k=0
Damit haben wir schließlich | f (x) − S| <  für alle x ∈ ]1 −  , 1[. Folglich gilt
lim f (x) = S wie gewünscht.

x→1−
Kehren wir zurück zu unserem Beispiel. Mit Satz 10.6 erhalten wir nun

1 1 1 1
ln(2) =  (−1)k k + 1 = 1 − 2 + 3 − 4 ± · · · , (10.2)
k=0
den Wert der Alternierenden Harmonischen Reihe.
10.4 Aufgaben
1. Es sei I ein Intervall derart, dass für jedes x ∈ I auch −x ∈ I gilt.

Eine Funktion f : I → IK heißt gerade, wenn f (x) = f (−x) gilt für alle x ∈ I;
sie heißt ungerade, wenn f (x) = − f (−x) gilt für alle x ∈ I.
Zeigen Sie: Alle Taylorpolynome zum Entwicklungspunkt 0 (sofern sie existie-
ren) einer geraden/ungeraden Funktion sind ebenfalls gerade/ungerade.
150 10 Taylorreihen
2. Es sei f : IR → IR eine differenzierbare Funktion mit f = f und f (0) = 1.

Bestimmen Sie die Taylorreihe T f (x) von f zum Entwicklungspunkt 0. Für
welche x konvergiert diese gegen f (x) ?
3. Ein Gegenbeispiel zur Vertauschung bei Doppelsummen.

Für i, j ∈ IN sei
⎧ −1 0 0 0 ···
⎨0
⎪ für i < j , 1
2 −1 0 0 ···
ai j := −1 für i = j , 1 1
⎪
⎩ j−i 4 2 −1 0 ···
2 für i > j . 1 1 1
8 4 2 −1 · · ·
    .. .. .. .. . .
Zeigen Sie, dass   ai j =   ai j . . . . .
i=1 j=1 j=1 i=1
gilt und geben Sie an, welche der Voraussetzungen von Lemma 10.3 im vorlie-
genden Fall nicht erfüllt ist.
4. Lösung der Schwingungsgleichung mittels Taylor-Entwicklung.

Es sei f : IR → IR eine zwei Mal differenzierbare Funktion mit der Eigenschaft
f (x) + f (x) = 0 für alle x ∈ IR .
Zeigen Sie mit Hilfe der Talyor-Entwicklung von f , dass gilt:
f (x) = f (0) cos x + f (0) sin x für alle x ∈ IR .
5. Es seien  ∈ IR und f : IR → IR eine differenzierbare Funktion mit f (0) = 0

derart, dass f (x) = f ( x) gilt für alle x ∈ IR.
a. Zeigen Sie, dass f beliebig oft differenzierbar ist und berechnen Sie f (k)
für k ∈ IN.
b. Bestimmen Sie die Taylorreihe von f um den Nullpunkt und deren Kon-
vergenzradius.
c. Zeigen Sie mit Hilfe einer Abschätzung des Lagrangeschen Restglieds,
dass für | | ≤ 1 die Taylor-Reihe von f auf ganz IR gegen f konvergiert.

6. Sei z0 ∈ C. Die Potenzreihe  ck (z − z0 )k habe den Konvergenzradius R > 0.
k=0
Weiter sei z1 ∈ UR (z0 ). Zeigen Sie: Für alle z ∈ UR−|z1 −z0 | (z1 ) gilt
 
 ck (z − z0 )k =  b j (z − z1) j
k=0 j=0
 k
mit b j =  j ck (z1 − z0 )k− j .
k= j
Kapitel 11
Fourierreihen
Fourierreihen eignen sich zur Analyse von Funktionen, von denen man annimmt,
dass sie eine Überlagerung von Grundschwingungsfunktionen (mit bestimmten Fre-
quenzen) sind, d.h. von sin(kx), cos(kx) oder eikx . Dabei können diese Funktionen
Sprungstellen haben (so genannte Pulsfunktionen).
Zunächst ist eine Vorbemerkung zu periodischen Funktionen angebracht. Eine
Funktion f : IR → IK heißt periodisch mit der Periode  > 0, falls
f (x +  ) = f (x) für alle x ∈ IR
gilt. Es gilt dann auch f (x + k ) = f (x) für alle x ∈ IR und alle k ∈ ZZ.
Wir können immer davon ausgehen, dass eine Funktion mit Periode  = 2
vorliegt, indem wir f durch eine Funktion g mit g(x) := f 2 x ersetzen.
11.1 Trigonometrische Polynome und Fourierkoeffizienten
Ein trigonometrisches Polynom ist eine Summe der Form

n
a0
f (x) = +  (ak coskx + bk sin kx) (x ∈ IR)
2 k=1
mit Koeffizienten a0 , . . . , an ; b1 , . . . , bn ∈ IK.

Wegen cos x = 12 eix + e−ix und sin x = 2i1 eix − e−ix kann man obige Darstel-
lung auch schreiben als
n
f (x) =  ck eikx .
k=−n
a0 1
Dabei ist c0 = und ck =
2 sowie c−k = 12 (ak + ibk ) für k ∈ IN. Umge-
2 (ak − ibk )
kehrt gilt dann natürlich a0 = 2c0 , ak = ck + c−k und bk = 1i (c−k − ck ) für k ∈ IN.

152 11 Fourierreihen
Wegen
( 2
1 inx
2
einx dx = e
=0 für n = 0
0 in 0
erfüllt die doppelseitige“ Folge (ek )k∈ZZ von Funktionen ek (x) := eikx die folgende
”
Orthogonalitätsrelation: Es gilt
( (

1 2 1 2 i(k−m)x 1 für k = m ,
ek (x) em (x) dx = e dx =
2 0 2 0 0 für k = m .
n
Ist nun f (x) =  ck eikx ein trigonometrisches Polynom, so haben wir
k=−n
( 2 ( 2 n n ( 2
0
f (x) e−imx dx =
0
 ck eikx e−imx dx =  ck
0
ei(k−m)x dx = 2 cm
k=−n k=−n
für m ∈ {−n, . . ., n}. Das Integral auf der linken Seite können wir nicht nur für
trigonometrische Polynome, sondern für beliebige integrierbare Funktionen bilden.
Definition 11.1. Sei R p := { f ∈ R([0, 2 ]) : f (0) = f (2 )}.

Für f ∈ R p heißen die Zahlen
( 2
1
f)(k) := f (x) e−ikx dx , k ∈ ZZ ,
2 0
die Fourierkoeffizienten von f . Die formale Reihe


 f)(k) eikx
k=−
heißt Fourierreihe von f .
Bemerkungen:
(1) Die Fourierreihe ist zunächst nur ein formales Gebilde. Es gibt zahlreiche
Fälle, bei denen sie für kein x ∈ IR konvergiert.
(2) Wir werden die Konvergenz einer Fourierreihe (wenn nicht anders angege-
ben) wie folgt verstehen:
 n
 f)(k) e−ikx := lim
n→
 f)(k) e−ikx .
k=− k=−n
(3) Bezüglich Fourierreihen können wir 2 -periodische Funktionen g : IR → IK

und Funktionen f : [0, 2 ] → IK mit f (0) = f (2 ) als gleichwertig sehen.
Man kann f zu einer 2 -periodischen Funktion g : IR → IK fortsetzen mittels
g(x + 2 n) := f (x) für x ∈ [0, 2 [ und n ∈ ZZ. Wir werden die 2 -periodische
Fortsetzung stets auch wieder mit f bezeichnen.
11.1 Trigonometrische Polynome und Fourierkoeffizienten 153
Damit ist auch klar, dass die Fourierkoeffizienten f)(k) durch

( 2 (  +2
1 1
f)(k) = f (x) e−ikx dx = f (x) e−ikx dx
2 0 2 
für beliebiges  ∈ IR gegeben sind.

Als erstes Beispiel sei f eine so genannte Pulsfunktion,

1 für x ∈ [0,  ] ∪ {2 } ,
f (x) :=
−1 für x ∈ ] , 2 [ .
Es gilt f)(0) = 0 und für k = 0 erhalten wir

(  ( 2
) 1 −ikx −ikx 1 e−ikx
 e−ikx
2
f (k) = e dx − e dx =
−
2 0  2 −ik 0 −ik 
i −ik i −ik
= (e − 1) − (1 − e−ik ) = 2e −2
2 k 2 k

0 , falls k gerade ,
=
− 2ik , falls k ungerade .
Die Fourierreihe von f lautet also
2i  1 4  1
− 
 k=− 2k + 1
e i(2k+1)x
= 
 k=0 2k + 1
sin(2k + 1)x .
2

−1
Es ist aufschlussreich, die Partialsummen

n
4 1
S2n+1 f (x) :=
  2k + 1
sin((2k + 1)x)
k=0
für verschiedene n zu berechnen, um so die

Approximation von f (x) zu veranschaulichen.
Die Abbildung zeigt S1 f (x) und S3 f (x).
Jean-Baptiste Joseph Fourier (1768-1830, Paris) behauptete, dass für jedes f ∈ R p

deren Fourierreihe gegen f strebt (er benutzte diese Reihen, um die Wärmeleitung
in einem Körper zu beschreiben). Dies ist falsch. Man erkennt an obigem Beispiel,
dass etwa an der Stelle x =  die Fourierreihe gegen 0 = f ( ) konvergiert.
Viele Mathematiker (u.a. Cauchy) haben Fouriers Behauptung mit falschem Be-
weis nachgewiesen“. Erst Dirichlet brachte Ordnung in die Untersuchungen. Paul
”
du Bois-Reymond (1831-1889, Tübingen, Berlin) konnte zeigen: Es gibt eine ste-
tige 2 -periodische Funktion f , deren Fourierreihe an der Stelle x = 0 gegen 
divergiert.
Ein wichtiges Resultat stammt von Lipót Fejér (1880-1959, Budapest; damals
19-jährig). Er bewies, dass
n
|k|
 1 −
n + 1
f)(k) eikt → f (t) für n → 
k=−n
gilt, falls die 2 -periodische Funktion f stetig ist (sogar mit gleichmäßiger Konver-
genz). Wir werden in Satz 11.5 und Satz 11.6 darauf zurückkommen.
11.2 Konvergenz nach Dirichlet und Fejér
Wir zeigen zunächst wichtige Gleichheiten für gewisse trigonometrische Polynome.

n n
Für n ∈ IN betrachten wir Dn (x) :=  eikx = 1 + 2  cos(kx) und
k=−n k=1
n
1 n 1 n
|k|
Fn (x) :=  Dk (x) = n + 1  ((n + 1) − |k|) e =  1 − n + 1 eikx .
n + 1 k=0
ikx
k=−n k=−n
Man bezeichnet (Dn )n∈IN als Dirichlet-Kern und (Fn )n∈IN heißt Fejér-Kern.
/ {2k : k ∈ ZZ} gilt

Lemma 11.2. Für x ∈
2
sin (2n + 1) 2x 1 sin (n + 1) 2x
Dn (x) = und Fn (x) = .
sin 2x n+1 sin 2x
Weiter ist Dn (2k ) = 2n + 1 sowie Fn (2k ) = n + 1 für k ∈ ZZ.
Beweis. Die Behauptungen für x = 2k sind offensichtlich.

Andernfalls gilt
2n
ix 2n+1
e −1
Dn (x) = e−inx  (eix )k = e−inx
k=0 eix − 1

−inx ei(2n+1)x/2 ei(2n+1)x/2 − e−i(2n+1)x/2 sin (2n + 1) 2x
=e =
eix/2 eix/2 − e−ix/2 sin 2x
11.2 Konvergenz nach Dirichlet und Fejér 155
und mit Hilfe von cos(z − w) − cos(z + w) = 2 sin z sin w (siehe Satz 5.22) erhalten
wir weiter
x 2 x 2 n
sin
2
(n + 1) Fn (x) = sin
2  Dk (x)
k=0
n x x
=  sin sin (2k + 1)
k=0 2 2
n
cos(kx) − cos((k + 1)x)
=  2
k=0
2
1 − cos((n + 1)x) (n + 1)x
= = sin ,
2 2
womit die Behauptung gezeigt ist.

Zu f ∈ R p betrachten wir nun die folgenden trigonometrischen Polynome:
n n
|k|
Sn ( f )(x) :=  f (k) e
) ikx
und n ( f )(x) :=  1 − f)(k) eikx .
k=−n k=−n n+1
Das nächste Lemma gibt eine Integraldarstellung von Sn ( f ) und n ( f ) an.

Lemma 11.3. Sei f ∈ R p . Es gilt
( 2 ( 2
1 1
Sn ( f )(x) = f (y) Dn (x − y) dy = f (x − y) Dn (y) dy sowie
2 0 2 0
( 2 ( 2
1 1
n ( f )(x) = f (y) Fn (x − y) dy = f (x − y) Fn (y) dy
2 0 2 0
1 n
für alle x ∈ IR und es ist n ( f ) =  Sk ( f ).
n + 1 k=0
Beweis. Mit ( 2
n
|k| 1
n ( f )(x) =  1 −
n + 1 2  0
f (y) e −iky
dy eikx
k=−n
( n
1 2 |k|
= f (y)  1 − eik(x−y) dy
2 0 k=−n n + 1
( 2
1
= f (y) Fn (x − y) dy
2 0
ist die Gleichheit links in der zweiten Behauptung gezeigt. Die rechte Gleichung
erhält man durch Substitution mit t := x − y. Die entsprechenden Aussagen für Sn
beweist man ganz analog.
Daraus folgt die letzte Behauptung jetzt direkt mit der Definition von Fn .

Wir wollen sehen, unter welchen Bedingungen die Fourierreihe einer Funktion
f ∈ R p gegen f konvergiert. Mit anderen Worten, uns interessiert das Verhalten
von Sn ( f ) für n → . Darüberhinaus wollen wir auch n ( f ) auf Konvergenz unter-
suchen. Es stellt sich heraus, dass n in gewissen Fällen besser zur Approximation
geeignet ist als Sn . Dies liegt u.a. an folgenden Eigenschaften.
Lemma 11.4. Es gelten

(i) Fn (x) ≥ 0 für alle x ∈ IR,
( 2
1
(ii) Fn (x) dx = 1,
2 0
(iii) für jedes 0 <  <  konvergiert Fn (x) → 0 gleichmäßig auf [ , 2 −  ]

mit n → .
Beweis. Die erste Behauptung erkennt man sofort an Hand der Darstellung aus
Lemma 11.2. Weiter ist
( ( 2
1 2 1 n |k|
2 0
Fn (x) dx =  1 − n + 1 0 eikx dx ,
2 k=−n
wobei das Integral nur für k = 0 einen von Null verschiedenen Wert, nämlich 2 ,
hat. Somit ist auch die zweite Aussage gezeigt. Ist nun 0 <  <  , so erhalten wir,
wieder mit Lemma 11.2, für alle x ∈ [ , 2 −  ] die Abschätzung
2 2
1 1 1 1 n→
Fn (x) ≤ ≤ −→ 0 .
n+1 sin(x/2) n+1 sin( /2)
Der Ausdruck rechts hängt nicht mehr von x ab; daher konvergiert Fn (x) gleichmäßig
auf [ , 2 −  ].

Satz 11.5. Sei f ∈ R p . Ist f im Punkt x stetig, so gilt lim n ( f )(x) = f (x).
n→
Beweis. Sei  > 0. Auf Grund der Stetigkeit gibt es eine Zahl  > 0 derart, dass
| f (y) − f (x)| ≤ 2 für alle y mit |y − x| <  gilt.
Ohne Einschränkung können wir M := f  > 0 annehmen. Laut Aussage (iii)
von Lemma 11.4 gibt es N ∈ IN mit

|Fn (y)| ≤ für alle y ∈ [ , 2 −  ] und alle n ∈ IN .
4M
Mit den Resultaten (i) und (ii) aus Lemma 11.4 gilt ferner
(  ( 2 ( 2 ( 2
|Fn (y)| dy + |Fn (y)| dy ≤ |Fn (y)| dy = Fn (y) dy = 2
0 2  − 0 0
und wir erhalten schließlich


( 2 (

1 1 2
|n ( f )(x) − f (x)| =

f (x − y) Fn (y) dy − f (x) Fn (y) dy
2 0 2 0

(
2
=
( f (x − y) − f (x) ) Fn (y) dy
2 0
( 
1
≤ | f (x − y) − f (x)| Fn (y) dy
2 0
( 0
1
+ | f (x − y) − f (x)| Fn (y) dy
2 −
( 2  −
1
+ | f (x − y) − f (x)| Fn (y) dy
2 
( 2  − ( 2  −
 2M  M 
≤ + Fn (y) dy ≤ + dy ≤ 
2 2  2   4M
für alle n ≥ N.

Satz 11.6 (Fejér). Sei f ∈ R p stetig.

Dann gilt n ( f ) → f gleichmäßig auf [0, 2 ] mit n → .
Beweis. Da f laut Satz 6.18 gleichmäßig stetig ist, gibt es zu  > 0 ein  > 0 derart,
dass | f (y) − f (x)| < 2 für alle x, y mit |y − x| <  gilt, d.h.  hängt nicht von x ab.
Nun kann man exakt wie im Nachweis von Satz 11.5 vorgehen.

Wir notieren noch einige wichtige Folgerungen.

Korollar 11.7 (Weierstraßscher Approximationssatz). Sei f ∈ R p stetig.
Dann existiert eine Folge trigonometrischer Polynome (Pn )n∈IN , die gleichmäßig
auf IR gegen f konvergiert, also lim Pn − f  = 0.
n→
Beweis. Wähle Pn = n ( f ).

Korollar 11.8 (Eindeutigkeitssatz). Seien f , g ∈ R p stetig mit f)(k) = g)(k) ∀k ∈ ZZ.

Dann ist f = g.
Beweis. Aus der Voraussetzung folgt n ( f ) = n (g) für alle n ∈ IN0 . Mit Satz 11.6
erhalten wir f = g.

In den Beweisen zu Satz 11.5 und Satz 11.6 werden von Fn nur die Eigenschaften
aus Lemma 11.4 benutzt. Man erhält die selben Resultate daher auch, wenn man an
Stelle von Fn andere Systeme von trigonometrischen Polynomen verwendet, sofern
diese ebenfalls die Aussagen von Lemma 11.4 erfüllen.
Für den Dirichlet-Kern, also die Dn , ist dies allerdings nicht der Fall. Dennoch
gilt in vielen Fällen auch Sn ( f ) → f mit n → .
Satz 11.9 (Riemann-Lebesgue-Lemma). Sei f ∈ R([a, b]).

( b ( b
Dann gilt lim f (x) sin(nx) dx = 0 = lim f (x) cos(nx) dx.
n→ a n→ a
Insbesondere gilt für f ∈ R p damit lim f)(n) = 0.

|n|→
Beweis. Seien zunächst g eine Treppenfunktion und a = a0 < a1 < · · · < am = b,

sodass g(x) = ck für x ∈ ]ak−1 , ak [ gilt. Für n ∈ IN ergibt sich

( b

m
1

g(x) sin(nx) dx
=
 ck (cos(nak−1 ) − cos(nak ))
≤ 2  |ck | n→ −→ 0 .

a

n k=1
k=1 n
Sei nun f ∈ R([a, b]). Zu jedem  > 0 gibt es dann eine Treppenfunktion g mit

f − g < b−a und weiter

( b ( b
( b

a f (x) sin(nx) dx − a g(x) sin(nx) dx
≤ a | f (x) − g(x)| dx <  .
( b
Da  beliebig klein gewählt werden kann, bleibt nur lim f (x) sin(nx) dx = 0.
n→ a
Für cos zeigt man dies ganz analog. Die abschließende Behauptung ergibt sich
dann unmittelbar mit e−inx = cos(nx) − i sin(nx).

Nun können wir ein wichtiges Resultat über punktweise Konvergenz von Fourier-
reihen beweisen.
Wir erinnern uns (Satz 8.5), dass für eine Regelfunktion f ∈ R([a, b]) an einer
Stelle x ∈ [a, b] stets die einseitigen Grenzwerte f (x+) und f (x−) existieren.
Satz 11.10. Sei f ∈ R p . Wenn an einer Stelle x ∈ IR die einseitigen Ableitungen
f (x + t) − f (x+) f (x + t) − f (x−)
f (x+) := lim und f (x−) := lim
t→0+ t t→0− t
existieren, so gilt lim Sn ( f )(x) = 12 ( f (x+) + f (x−)).

n→
Wenn f überdies an der Stelle x stetig ist, konvergiert die Fourierreihe an diesem
Punkt also gegen den Funktionswert.
Beweis. Wegen Dn (−x) = Dn (x) ergibt sich mittels Substitution
( 0 ( 
f (x − y) Dn (y) dy = f (x + s) Dn (s) ds
− 0
und auch (  ( 
1
Dn (y) dy = Dn (y) dy =  .
0 2 −
Wir setzen dies in die Darstellung aus Lemma 11.3 ein und schreiben schließlich Dn
wie in Lemma 11.2. Damit erhalten wir
1
Sn ( f )(x) − ( f (x+) + f (x−))
2
( 
1 1
= f (x − y) Dn (y) dy − ( f (x+) + f (x−))
2 − 2
(
1 
= ( f (x + y) + f (x − y) − f (x+) − f (x−) ) Dn (y) dy
2 0
( 

1 f (x + y) − f (x+) f (x − y) − f (x−) y
= + sin (2n + 1) dy .
 0 2 sin 2y 2 sin 2y 2
Mit der Regel von L’Hospital (Satz 7.15) gilt weiter
f (x + y) − f (x+) f (x − y) − f (x−)
lim = f (x+) und lim = f (x−) .
y→0+ 2 sin 2y y→0+ 2 sin 2y
Daher ist g : [0,  ] → IK mit g(0) := f (x+) − f (x−) und
f (x + y) − f (x+) f (x − y) − f (x−)
g(y) := + für y = 0
2 sin 2y 2 sin 2y
im Nullpunkt stetig. Insbesondere ist g eine Regelfunktion und mit Satz 11.9 folgt
(
1 1  y
lim Sn ( f )(x) − ( f (x+) + f (x−)) = lim g(y) sin (2n + 1) dy = 0
n→ 2 n→  0 2
und damit die Behauptung.

Beispiele:
(1) Fourierkoeffizienten und Fourierreihe der Pulsfunktion f ∈ R p ,

1 für x ∈ [0,  ] ∪ {2 } ,
f (x) :=
−1 für x ∈ ] , 2 [ .
haben wir bereits berechnet. Mit Satz 11.10 folgt nun

⎧
4 
1 ⎨ 1 für x ∈ ]0,  [ ,
⎪
 2k + 1 sin(2k + 1)x = ⎪ −1 für x ∈ ] , 2 [ ,
 k=0 ⎩ 0 für x ∈ {0,  , 2 } .


Speziell für x = 2 erhalten wir mit sin (2k + 1) 2 = (−1)k den Wert
4  (−1)k  1 1 1
 2k + 1 = 1 ,
 k=0
also
4
= 1 − + − ± ···
3 5 7
(2) Sei f ∈ R p definiert durch f (x) := x2 für x ∈ [− ,  ]. Laut Satz 11.10 kon-
vergiert deren Fourierreihe überall gegen den Funktionswert.
( 
2
Wir berechnen die Fourierkoeffizienten. Es gilt f)(0) = x2 dx = ; mit
− 3
(  ( 
1 2 −ikx
 1
x2 e−ikx dx = x e
− 2x e−ikx dx
− −ik − −ik −

 ( 
1 1
1 4
= 2x e−ikx
− 2e−ikx dx = (−1)k 2
ik −ik − −ik − k
ergibt sich f)(k) = (−1)k k22 für k = 0 und wir erhalten

n n
Sn f (x) =  f)(k) eikx = f)(0) +  f)(k) eikx + f)(−k) e−ikx
k=−n k=1
n n
2 2 ikx 2 (−1)k
= +  (−1)k (e + e −ikx
) = + 4  cos(kx) .
3 k=1 k2 3 k=1 k
2
Setzen wir etwa x = 0 oder x =  ein, so haben wir

 
2 (−1)k (−1)k 2
0 = f (0) = +4  2
⇒  2
= und
3 k=1 k k=1 k 12
 
2 1 1 2
 2 = f ( ) = +4  2 ⇒  k2 = .
3 k=1 k k=1 6
11.3 Konvergenz im quadratischen Mittel
Man kann leicht nachprüfen, daß C p := { f ∈ R p : f stetig} mit

( 2
1
f , g := f (x) g(x) dx
2 0

ein Prähilbertraum ist. Mit der durch f 2 := f , f erklärten Norm ist C p ein
normierter Raum. Wir wissen auch bereits, dass {en : n ∈ ZZ} mit en (x) := einx eine
orthonormale Familie in C p bildet.
Für die Fourierkoeffizienten von f ∈ C p gilt nach Definition f)(k) = f , ek .
Die Besselsche Ungleichung (4.2) für C p liefert
( 2  
1
2 0
| f (x)|2 dx = f 22 ≥  | f , ek |2 =  | f)(k)|2 ;
k=− k=−
11.3 Konvergenz im quadratischen Mittel 161
insbesondere ist die Reihe rechts konvergent. Wir werden in Kürze sehen, dass hier
sogar Gleichheit gilt.
Satz 11.11. Seien f , g ∈ C p . Es gelten

(a) f − Sn( f )2 → 0 mit n → ,
( 2 
1
(b)
2 0
| f (x)|2 dx =  | f)(k)|2 , (Parsevalsche Gleichung)
k=−
( 2 
1
(c)
2 0
f (x) g(x) dx =  f)(k) g)(k).
k=−
Beweis. (a) Sei  > 0. Nach dem Satz von Fejér (Satz 11.6) gibt es N ∈ IN mit
| f (x) − n ( f )(x)| <  für alle x ∈ [0, 2 ] und alle n ≥ N. Damit gilt auch
( 2 1/2
1
f − n ( f )2 = | f (x) − n ( f )(x)|2 dx < für alle n ≥ N .
2 0
Betrachte nun für jedes n ∈ IN die orthonormale Familie {ek : k = −n, . . . , n}.
Satz 4.13 liefert f − Sn ( f )2 ≤ f − n ( f )2 . Damit gilt auch f − Sn ( f )2 < 
für alle n ≥ N.
(b) Laut dem Satz von Pythagoras (Satz 4.11) gilt
n
f − Sn( f )22 = f 22 −  | f)(k)|2 ≥ 0 .
k=−n
n
Mit (a) folgt lim  | f)(k)|2 = f 22 . Dies ist genau die Parsevalsche Gleichung.
n→ k=−n
(c) Mit der Cauchy-Schwarz-Ungleichung (Korollar 4.12) erhalten wir

# $

n

n

f , g −  f)(k) g)(k)
=
f , g −  f)(k) ek , g
= | f , g − Sn ( f ), g|

k=−n

k=−n

= | f − Sn( f ), g| ≤ f − Sn ( f )2 g2 .
Daraus folgt mit (a) die Behauptung.

Beispiel: Die Fourierkoeffizienten der durch f (x) := x2 für x ∈ [− ,  ] definierten

2
Funktion f ∈ C p kennen wir schon. Es gilt f)(0) = 3 und f)(k) = (−1)k k22 für k = 0.
Andererseits gilt
( 
1 1 1 5 4
f 22 = x4 dx = ( − (− )5 ) = .
2 − 2 5 5
2  2
4 2 2
Die Parsevalsche Gleichung liefert 5 = 3 +2  k2
.
k=1
Damit haben wir


1 1 4 4 4
 k4 = 8 5
−
9
=
90
.
k=1
Bemerkung: Die Folgerungen in Satz 11.11 gelten nicht nur für stetige Funktionen.
Darüberhinaus kann man Fourierkoeffizienten und Fourierreihen für eine weitaus
größere Klasse von Funktionen definieren, wenn man z.B. auch uneigentliche Inte-
grale zulässt oder indem man einen umfassenderen Integralbegriff benutzt, wie etwa
das Lebesgue-Integral. Man kann zeigen, dass die Eigenschaften (a), (b) und (c) aus
dem Satz äquivalent und sogar für alle Regelfunktionen erfüllt sind.
11.4 Aufgaben
1. Bestimmen Sie die Fourierkoeffizienten der 2 -periodischen Fortsetzung der

Funktion
0, x<0,
f : ] −  ,  ] → IR , f (x) :=
x, x≥0.
Für welche x konvergiert hier die Fourierreihe gegen den Funktionswert ?
2. Bestimmen Sie die Fourierreihe der durch f (x) := |x| für x ∈ [− ,  ] definierten
Funktion f ∈ R p und berechnen Sie damit den Wert der Reihe

1
 (2k + 1)2 .
k=0
3. Bestimmen Sie die Fourierreihe der durch f (x) := 2 − |x| für x ∈ [− ,  ] defi-
nierten Funktion f ∈ R p und berechnen Sie mit Hilfe der Parsevalschen Glei-
chung den Wert der Reihe

1
 (2k + 1)4 .
k=0
4. Seien f ∈ R p , y ∈ IR. Weiter sei Ty f : IR → IR, Ty f (x) := f (x − y).

Bestimmen Sie die Fourierkoeffizienten von Ty f .
5. Sei f ∈ R p eine reellwertige Funktion. Zeigen Sie: Es gilt

n
a0
Sn ( f )(x) = +  (ak cos(kx) + bk sin(kx) ) ,
2 k=1
wobei a0 , a1 , a2 , . . . und b1 , b2 , . . . reelle Zahlen sind.

11.4 Aufgaben 163
6. Sei f ∈ R p . Zeigen Sie: In der Darstellung

n
a0
Sn ( f )(x) = +  (ak cos(kx) + bk sin(kx) )
2 k=1
gilt:
f gerade =⇒ bk = 0 für alle k ∈ IN ,

f ungerade =⇒ ak = 0 für alle k ∈ IN0 .
7. Es sei f : IR → C eine stetig differenzierbare 2 -periodische Funktion.

a. Zeigen Sie: Es gilt )
f (k) = ik f)(k) für alle k ∈ ZZ.
b. Zeigen Sie: Es gilt d
dx n ( f )(x) = n ( f )(x) für alle n ∈ IN0 .
c. Folgern Sie, dass eine Folge (Pn )n∈IN trigonometrischer Polynome existiert
derart, dass (Pn ) gleichmäßig auf [0, 2 ] gegen f konvergiert und auch (Pn )
gleichmäßig auf [0, 2 ] gegen f konvergiert.
8. Seien f , g ∈ C p mit f)(k) = g)(k) für alle k ∈ ZZ.

Zeigen Sie, dass f = g gilt.
Kapitel 12
Kompaktheit
Erinnern wir uns an Satz 6.18, wo wir gezeigt haben, dass jede auf einem Inter-
vall der Form [a, b] stetige Funktion dort auch gleichmäßig stetig ist. Zu gegebenem
 > 0 können wir ein  > 0 finden, das für alle Punkte p ∈ [a, b] gut genug“ ist.
”
Wir betrachten nun Funktionen, deren Definitionsbereiche diese und verwandte Ei-
genschaften von [a, b] erfüllen. Zur Motivation wollen wir noch kurz einiges über
[a, b] festhalten.
(1) Da [a, b] beschränkt ist, besitzt jede Folge (xn )n∈IN in diesem Intervall ei-
ne konvergente Teilfolge, deren Grenzwert ebenfalls in [a, b] liegt. Das liegt
u.a. daran, dass die Randpunkte zur Menge [a, b] gehören; für ]a, b[ gilt dies
nicht, obwohl ]a, b[ beschränkt ist.
(2) Ist  > 0 gegeben, so reichen endlich viele Punkte x1 , . . . , xn ∈ [a, b], sodass
n
*
[a, b] ⊆ ]xk −  , xk +  [ gilt.
k=1
(3) Ist (Ik )k∈J mit einer beliebigen Index-Menge J eine Familie offener Intervalle
*
derart, dass [a, b] ⊆ Ik gilt, so reichen bereits endlich viele k1 , . . . , kn ∈ J
k∈J
aus, um [a, b] zu überdecken. (Dies haben wir noch nicht bewiesen!)
12.1 Kompakte metrische Räume
Die oben genannten drei Eigenschaften wollen wir auf beliebige metrische Räume
verallgemeinern.
Definition 12.1. Sei (X, dX ) ein metrischer Raum.

(1) Man nennt (X, dX ) folgenkompakt, falls jede Folge (xn )n∈IN in X eine in
(X, dX ) konvergente Teilfolge besitzt.

166 12 Kompaktheit
(2) Man sagt, (X, dX ) ist total beschränkt, falls für jedes  > 0 eine endliche
n
*
Menge von Punkten {x1 , . . . , xn } ⊆ X existiert, sodass X ⊆ U (xk ) gilt.
k=1
Die endliche Menge {x1 , . . . , xn } heißt dann  -Netz.
Bevor wir die Eigenschaft (3) formulieren können, benötigen wir eine exakte
Formulierung der Begriffe offen“ und abgeschlossen“ in metrischen Räumen.
” ”
Definition 12.2. Sei (X, dX ) ein metrischer Raum. Eine Teilmenge U ⊆ X heißt
offen in X, wenn es zu jedem a ∈ U ein  > 0 gibt mit U (a) ⊆ U. (Die leere
Menge ist auch offen!)
Eine Teilmenge A ⊆ X heißt abgeschlossen in X, wenn X \ A offen in X ist.
Eine Menge U ⊆ X heißt Umgebung von a ∈ X, falls ein  > 0 existiert mit
U (a) ⊆ U. Insbesondere ist U (a) für jedes  > 0 eine Umgebung von a in X.
Diese Umgebungen heißen  -Umgebungen.
Beispiele:
(1) In IR sind die Intervalle ]a, b[ offen und [a, b] abgeschlossen.
(2) In jedem metrischen Raum (X, dX ) ist X offen.
(3) In jedem metrischen Raum (X, dX ) ist U (a) offen und K (a) abgeschlossen.
Man beachte, dass es stets Mengen gibt, die sowohl abgeschlossen als auch offen
in X sind (z.B. X selbst). Es kann auch Teilmengen geben, die weder offen noch
abgeschlossen sind (z.B. Q in IR).
Weitere Beispiele:
(4) Die Intervalle [a, [ und ] − , b] sind abgeschlossen in IR. Die Intervalle
]a, [ und ] − , b[ sind offen in IR.

(5) Die Mengen ZZ und 1n : n ∈ ZZ \ {0} ∪ {0} sind abgeschlossen in IR.
(6) Sei X eine Menge versehen mit der diskreten Metrik, vgl. Beispiel (2) in
Kapitel 4.1. Dann ist jede Teilmenge von X offen und auch abgeschlossen.
Satz 12.3. Sei (X, dX ) ein metrischer Raum; U,V und Ui (i ∈ I, I eine beliebige
Indexmenge) seien offene Mengen in X. Dann gelten:
(a) ∅ und X sind offen in X.
(b) U ∩V ist offen in X.
*
(c) W := Ui ist offen in X.
i∈I
Beweis. (a) wissen wir bereits.

Zum Nachweis von (b) sei x ∈ U ∩V . Dann gibt es  > 0 mit U (x) ⊆ U und  > 0
mit U (x) ⊆ V . Für  := min( ,  ) gilt dann U (x) ⊆ U ∩V . Also ist U ∩V offen.
Wir zeigen noch (c). Ist x ∈ W so gilt x ∈ Ui0 *für (mindestens) ein i0 ∈ I und damit
existiert  > 0 mit U (x) ⊆ Ui0 , also U (x) ⊆ Ui .

i∈I
12.1 Kompakte metrische Räume 167
Satz 12.4. Seien (X, dX ) und (Y, dY ) metrische Räume, f : X → Y eine Abbildung.
Folgende Eigenschaften sind äquivalent:
(i) f ist stetig.
(ii) Für jede offene Teilmenge V ⊆ Y ist das Urbild f −1 (V ) offen in X.
(iii) Für jede abgeschlossene Teilmenge B ⊆ Y ist f −1 (B) abgeschlossen in X.
Beweis. (i)⇒(ii): Sei V offen in Y .
Zu a ∈ f −1 (V ) und b = f (a) ∈ V existiert ein  > 0 mit U (b) ⊆ V . Wegen der
Stetigkeit von f gibt es  > 0 mit f (U (a)) ⊆ U (b), also gilt U (a) ⊆ f −1 (V ).
Damit ist gezeigt, daß f −1 (V ) offen ist.
(ii)⇒(i): Seien a ∈ X,  > 0.
Da U ( f (a)) offen in Y ist, ist auch U := f −1 (U ( f (a))) offen in X. Daher gibt
es ein  > 0 mit U (a) ⊆ U.
Dies bedeutet f (U (a)) ⊆ U ( f (a)), d.h. f ist in a stetig.
(ii)⇒(iii): Sei B ⊆ Y abgeschlossen.
Dann ist Y \ B offen in Y und damit auch f −1 (Y \ B) = X \ f −1 (B) offen in X.
Somit ist f −1 (B) abgeschlossen.
Ganz analog zeigt man auch (iii)⇒(ii).

Sei nun K ⊆ (X, dX ). Eine offene Überdeckung von K ist eine Familie {Ui : i ∈ I}
(I eine beliebige Indexmenge) von offenen Teilmengen von X, sodass
+
K ⊆ Ui .
i∈I
Definition 12.5. Eine Teilmenge K des metrischen Raumes (X, dX ) heißt kompakt,
falls jede offene Überdeckung von K eine endliche Teilüberdeckung von K enthält.
Mit anderen Worten: Zu jeder offenen Überdeckung {Ui : i ∈ I} von K existieren
endlich viele Indizes i1 . . . , in ∈ I, sodass
n
+
K ⊆ Ui j
j=1
gilt. (Selbstverständlich kann auch K = X sein.)

Zunächst wollen wir zwei Beispiele für nicht kompakte Mengen angeben.
(1) Sei X = IR (mit der natürlichen Metrik). Dann ist {Un : n ∈ IN} mit Un :=
] − n, n[ eine offene Überdeckung von IR. Mit endlich vielen dieser Un kann
man offensichtlich nicht ganz IR überdecken. Also ist IR nicht kompakt.
& 1 1'
(2) Sei wieder X = IR und K = ]0, 1[. Es ist 3n , n : n ∈ IN eine offene Über-
deckung von ]0, 1[. Es gibt daraus keine endliche Teilüberdeckung, denn zu
jeder solchen Teilüberdeckung gehören endlich viele Indizes n1 , . . . , nk . Aus
diesen wähle den größten Index n.
k ,
* -
1 1 1
Dann ist 4n ∈
/ 3n j n j . Also ist ]0, 1[ nicht kompakt.
,
j=1
168 12 Kompaktheit
Wir werden in Kürze sehen, dass [0, 1] kompakt ist. Wir werden sogar zeigen, dass
eine Teilmenge K ⊆ IR genau dann kompakt ist, wenn sie beschränkt und abge-
schlossen ist. Ein erster Schritt ist der folgende Sachverhalt, der für jeden metrischen
Raum gilt.
Satz 12.6. Sei K eine kompakte Teilmenge des metrischen Raumes (X, dX ).
Dann ist K abgeschlossen und beschränkt.
Beweis. Zur Beschränktheit wähle a ∈ K. (Im Fall K = ∅ ist die Behauptung klar.)
Dann ist {Un (a) : n ∈ IN} eine offene Überdeckung von K und es gibt endlich viele
n1 , . . . , nk , sodass
k
+
K ⊆ Unk (a)
j=1
gilt. Mit m := max(n1 , . . . , nk ) folgt dann K ⊆ Um (a), also ist K beschränkt.

Wir müssen noch zeigen, dass X \ K offen ist. Sei dazu a ∈ X \ K. (Für X \ K = ∅ gilt
die Behauptung offensichtlich.) Zu zeigen ist, dass es  > 0 gibt mit U (a) ⊆ X \ K.
Für x ∈ K setzen wir  (x) := 12 d(x, a) > 0. Nun ist {U (x) (x) : x ∈ K} eine offene
Überdeckung von K und, da K kompakt ist, gibt es endlich viele x1 , . . . , xn ∈ K mit
n
+
K ⊆ U (x j ) (x j ) .
j=1
Weiter sei  := min{ (x1 ), . . . ,  (xn )}. Es gilt  > 0. Wir wollen noch einsehen,
dass U (a) ⊆ X \ K ist.
Zu jedem x ∈ K gibt es ein j ∈ {1, . . . , n} mit x ∈ U (x j ) (x j ), also d(x, x j ) <  (x j ).
Folglich gilt mit der Dreiecksungleichung
d(x, a) ≥ d(x j , a) − d(x, x j ) > 2 (x j ) − d(x, x j ) >  (x j ) ≥  ,
also x ∈
/ U (a). Damit gilt U (a) ⊆ X \ K.

Das nächste Resultat erleichtert den Nachweis der Kompaktheit einer Teilmenge
erheblich, falls man die Kompaktheit einer Obermenge weiß.
Satz 12.7. Sei K eine kompakte Teilmenge des metrischen Raumes (X, dX ).
Ist A ⊆ K abgeschlossen, so ist A kompakt.
Beweis. Sei {Ui : i ∈ I} eine offene Überdeckung von A.
Damit ist {Ui : i ∈ I} ∪ {X \ A} eine offene Überdeckung von K. Also existieren
endlich viele i1 , . . . , in ∈ I mit
n
+
K⊆ Ui j ∪ (X \ A)
j=1
n
*
(wobei man X \ A eventuell gar nicht braucht). Nun gilt A ⊆ Ui j .

j=1
12.1 Kompakte metrische Räume 169
Von großer Bedeutung ist der Begriff Kompaktheit in Verbindung mit der Stetigkeit.
Satz 12.8. Seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y eine stetige
Abbildung. Weiter sei K ⊆ X kompakt.
Dann ist auch f (K) kompakt.
Beweis. Sei {Ui : i ∈ I} eine offene Überdeckung von f (K) in Y .
Mit Satz 12.4 ist dann { f −1 (Ui ) : i ∈ I} eine offene Überdeckung von K, denn
jedes x ∈ K erfüllt f (x) ∈ Ui für ein geeignetes i ∈ I.
n
* n
*
Daher existieren i1 , . . . , in ∈ I mit K ⊆ f −1 (Ui j ) und es folgt f (K) ⊆ Ui j .
j=1 j=1
Also ist f (K) kompakt.

Korollar 12.9. Seien (X, dX ) ein kompakter metrischer Raum und f : X → IR eine
stetige Abbildung.
Dann nimmt f ihr Supremum und ihr Infimum an, d.h. es existieren a, b ∈ X mit
f (a) = sup{ f (x) : x ∈ X} = max{ f (x) : x ∈ X} ,

f (b) = inf{ f (x) : x ∈ X} = min{ f (x) : x ∈ X} .
Beweis. Laut Satz 12.8 ist f (X) kompakt, also auch abgeschlossen und beschränkt.
Folglich existieren M := sup{ f (x) : x ∈ X} und m := inf{ f (x) : x ∈ X} in IR.
Angenommen, es gilt M ∈ / f (X). Dann gäbe es, da IR \ f (X) offen ist, ein  > 0
mit ]M −  , M +  [ ⊆ IR \ f (X) und M −  wäre eine kleinere obere Schranke von
f (X) als M. Daher muss M ∈ f (X) und analog auch m ∈ f (X) sein.

Bemerkung: Korollar 12.9 verallgemeinert die Aussage von Satz 6.16, in welchem
X = [a, b] vorausgesetzt wird.
Korollar 12.10. Seien (X, dX ) und (Y, dY ) zwei metrische Räume. Weiter seien
(X, dX ) kompakt und f : X → Y eine stetige bijektive Abbildung.
Dann ist die Umkehrabbildung f −1 : Y → X auch stetig.
Beweis. Wir verwenden die Stetigkeits-Charakterisierung (iii) aus Satz 12.4.
Sei B ⊆ X abgeschlossen. Laut Satz 12.7 ist B kompakt, und mit Satz 12.8 folgt,
dass f (B) kompakt in Y ist. Nach Satz 12.6 ist schließlich f (B) = ( f −1 )−1 (B) ab-
geschlossen in Y .
Somit ist f −1 stetig.

Wir wollen uns kurz an einem Beispiel veranschaulichen, dass auf die Kompaktheit
von X nicht verzichtet werden kann.
Die Funktion f : [0, 2 [ → T := {z ∈ C : |z| = 1}, f (t) := eit = cost + i sint, ist
eine bijektive Abbildung von [0, 2 [ auf T. Sie ist bekanntermaßen stetig. Ihre Um-
kehrabbildung ist jedoch nicht stetig im Punkt 1 ∈ T, denn jede Umgebung dieses
Punktes wird durch f −1 abgebildet auf eine Menge, die auch Punkte in der Nähe
von 2 enthält.
170 12 Kompaktheit
Nach den gezeigten Ergebnissen ist es an der Zeit, kompakte Mengen näher zu
beschreiben. Notwendigerweise sind kompakte Mengen abgeschlossen und be-
schränkt. Für Teilmengen von IK (sogar IKn ) ist dies auch hinreichend für Kom-
paktheit, wie wir noch sehen werden.
Der nächste Satz und das folgende Korollar verallgemeinern eine Eigenschaft der
Intervallschachtelungen in IR.
Satz 12.11. Sei K = {Ki : i ∈ I} eine Familie von kompakten Teilmengen eines me-
trischen Raumes (X, d) derart, dass der Schnitt von endlich vielen Mengen aus K
stets nicht leer ist.

Dann gilt Ki = ∅.
i∈I
Beweis. Wir wählen ein festes K ∈ K und setzen Ui := X \ Ki . Angenommen, es gilt

*
∅ = Ki = K ∩ ( Ki ). Dann ist K ⊆ X \ ( Ki ), also K ⊆ Ui .
i∈I i∈I i∈I i∈I
Demnach ist {Ui : i ∈ I} ist eine offene Überdeckung von K.
Da K kompakt ist, reichen endlich viele Ui1 , . . . ,Uin aus, um K zu überdecken, etwa
n
* n

K ⊆ Ui j . Nun folgt K ∩ ( Ki j ) = ∅, im Widerspruch zu Voraussetzung.

j=1 j=1
Wir notieren noch einen Spezialfall.

Korollar 12.12. Ist {Kn : n ∈ IN} eine Folge kompakter (nicht leerer) Mengen eines


metrischen Raumes mit Kn ⊇ Kn+1 für alle n, so gilt Kn = ∅.
n=1
Wir erinnern an die Definition von folgenkompakt und total beschränkt. Der nächste
Satz sagt aus, dass ein kompakter metrischer Raum stets folgenkompakt ist.
Satz 12.13. In einem kompakten metrischen Raum (X, d) besitzt jede Folge (xn )n∈IN
eine konvergente Teilfolge.
Beweis. Wenn die Menge {xn : n ∈ IN} endlich ist, gibt es sogar eine konstante
Teilfolge und die Behauptung ist erfüllt.
Sei also {xn : n ∈ IN} unendlich. Wir benutzen Lemma 4.17 und nehmen an, dass
kein Punkt aus X Häufungswert von (xn )n∈IN ist. Dann gibt es zu jedem a ∈ X eine
offene Umgebung Va , die höchstens einen Punkt aus {xn : n ∈ IN} enthält (nämlich
xm , falls a = xm für ein m ∈ IN ist).
Andererseits ist {Va : a ∈ X} eine offene Überdeckung von X und, da X kompakt
ist, gibt es eine endliche Teilfamilie, die bereits ganz X überdeckt. Dies steht im
Widerspruch dazu, dass die Vereinigung endlich vieler der Va noch nicht einmal die
Menge {xn : n ∈ IN} ganz enthalten kann.
Daher ist die Annahme falsch. Die Folge besitzt demnach einen Häufungswert
und damit auch eine (vgl. Lemma 4.17) gegen diesen konvergente Teilfolge.

Satz 12.14. Sei (X, d) ein metrischer Raum. Ist X folgenkompakt, so ist X auch total
beschränkt und vollständig.
12.2 Charakterisierung kompakter Mengen 171
Beweis. Zum Nachweis der Vollständigkeit sei (xn )n∈IN eine Cauchyfolge in X. Wir
müssen zeigen, dass diese einen Grenzwert in X besitzt.
Da X folgenkompakt ist, existiert wenigstens eine konvergente Teilfolge (xnk )k∈IN
mit lim xnk =: x ∈ X.
k→
Sei  > 0. Es gibt N1 ∈ IN mit d(xn , xm ) < 2 für alle n, m ≥ N1 . Ferner gibt es
N2 ∈ IN mit d(xnk , x) < 2 für alle k ≥ N2 . Setze N := max{N1 , N2 }. Zu n ≥ N wählen
wir ein k ≥ N2 mit nk ≥ N1 und erhalten
d(xn , x) ≤ d(xn , xnk ) + d(xnk , x) <  .
Daher konvergiert auch (xn )n∈IN gegen x und die Vollständigkeit ist bewiesen.
Wir nehmen nun an, dass X nicht total beschränkt ist. Dann existiert ein  > 0,
sodass es kein  -Netz für X gibt. Nun können wir rekursiv eine Folge (xn )n∈IN kon-
struieren mit d(xn , xm ) ≥  für alle n, m ∈ IN, n = m:
Sind x1 , . . . , xn bereits gefunden, so erhält man xn+1 durch Auswahl eines Ele-
n
*
mentes aus X \ U (xk ) = ∅.
k=1
Offensichtlich gilt d(xk , xn+1 ) ≥  für alle k = 1, . . . , n. Diese Folge kann aber
keine konvergente Teilfolge enthalten. Damit ist die Behauptung nachgewiesen.
12.2 Charakterisierung kompakter Mengen
Betrachtet man Satz 12.13 und Satz 12.14 zusammen, so stellt sich die Frage, ob
aus totaler Beschränktheit plus Vollständigkeit die Kompaktheit folgt. In der Tat gilt
der folgende Satz.
Satz 12.15. Sei (X, d) ein metrischer Raum. Folgende Bedingungen sind äquivalent:
(i) X ist kompakt.
(ii) X ist folgenkompakt.
(iii) X ist total beschränkt und vollständig.
Beweis. Es bleibt nur noch die Implikation (iii)⇒(i) zu zeigen. Sei also X total
beschränkt und vollständig.
Wir nehmen an, dass X nicht kompakt ist, d.h. es existiere eine offene Überdeckung
{Ui : i ∈ I} von X, die keine endliche Teilüberdeckung von X enthält. Gestützt auf
diese Annahme konstruieren wir eine Folge (xn )n∈IN in X mit
1
(1) d(xn , xn+1 ) ≤ ,
2n−1
(2) U1/2n−1 (xn ) kann nicht durch eine endliche Teilüberdeckung von {Ui : i ∈ I}
überdeckt werden.
172 12 Kompaktheit
m
*
Wir starten mit n = 1. Sei {y1 , . . . , ym } ein 1-Netz. Dann ist X = U1 (yk ).
k=1
Nach Annahme existiert mindestens ein U1 (yk ), das nicht von endlich vielen Ui
überdeckt wird; wir setzen x1 := yk .
Seien x1 , . . . , xn bereits gefunden, sodass (1) und (2) gelten.
1
Da U1/2n−1 (xn ) offensichtlich total beschränkt ist, finden wir ein 2n -Netz für
U1/2n−1 (xn ), welches wir mit {y1 , . . . , ym } bezeichnen.
Wegen (2) kann U1/2n−1 (xn ) nicht durch endlich viele Ui überdeckt werden, also
existiert ein U1/2n (yk ) das auch nicht durch endlich viele Ui überdeckt wird. Setze
xn+1 := yk und die Folge (xn )n∈IN mit den geforderten Eigenschaften ist rekursiv
konstruiert.
Nun ist diese eine Cauchyfolge, denn für m > n gilt
d(xm , xn ) ≤ d(xm , xm−1 ) + d(xm−1 , xm−2 ) + . . . + d(xn+1, xn )

1 1 2 1
≤ + ...+ < = .
2m−2 2n−1 2n−1 2n−2
Da X vollständig ist, existiert x := lim xn ∈ X.
n→
Weiter gibt es j ∈ I mit x ∈ U j und  > 0 mit U (x) ⊆ U j . Dazu finden wir N ∈ IN
mit d(xn , x) < 2 und 2n−1
1
< 2 für alle n ≥ N. Für y ∈ U1/2N−1 (xN ) gilt nun
1 
d(y, x) ≤ d(y, xN ) + d(xN , x) < + < ,
2N−1 2
also U1/2N−1 (xN ) ⊆ U (x) ⊆ U j im Widerspruch zu (2). Damit war unsere Annahme
falsch und X ist kompakt.

Dieser wichtige Satz liefert eine Charakterisierung kompakter Mengen. Speziell für
Teilmengen A ⊆ (IKd , · 2 ) reicht es nun zu zeigen, dass A folgenkompakt ist.
Ziehen wir den Satz von Bolzano-Weierstraß (genauer: Korollar 4.20) heran, so
sieht man, dass noch zu untersuchen ist, für welche Mengen A ⊆ IKd folgendes gilt:
Ist (an )n∈IN eine konvergente Folge in IKd mit an ∈ A für alle n ∈ IN, so ist auch
a = lim an ∈ A. Dazu machen wir folgende Beobachtung.
n→
Lemma 12.16. Seien A eine beliebige Teilmenge eines metrischen Raumes (X, d)
und a ∈ X.
Es gibt eine Folge (an )n∈IN mit an ∈ A für alle n und a = lim an genau dann,
n→
wenn für jedes  > 0 der Schnitt A ∩U (a) nicht leer ist.
Beweis. Existiert eine derartige Folge, so gilt bei beliebigem  > 0 stets d(an , a) < 
für alle bis auf höchstens endlich viele n, also an ∈ A ∩U (a) für alle diese n.
Ist umgekehrt A ∩ U (a) = ∅ für alle  > 0, so gibt es zu jedem n ∈ IN ein an ∈ A
mit d(an , a) < 1n . Damit gilt a = lim an .

n→
12.2 Charakterisierung kompakter Mengen 173
Satz 12.17 (Charakterisierung abgeschlossener Teilmengen). Sei A eine Teil-

menge eines metrischen Raumes (X, d).
Die Menge A ist abgeschlossen in X genau dann, wenn für jede in X konvergente
Folge (an )n∈IN mit an ∈ A ∀n auch a := lim an ∈ A gilt.
n→
Beweis. Seien A abgeschlossen in X und (an )n∈IN eine Folge mit an ∈ A ∀n und
a = lim an .
n→
Wäre a ∈ X \ A, so gäbe es ein  > 0 mit U (a) ⊆ X \ A, da X \ A offen ist, und
damit U (a) ∩ A = ∅. Dies steht im Widerspruch dazu, dass U (a) sogar unendlich
viele an ∈ A enthalten muss.
Für die umgekehrte Implikation bezeichne
A := {a ∈ X : ∃ (an )n∈IN , an ∈ A ∀n ∈ IN , a = lim an } .

n→
Offensichtlich gilt immer A ⊆ A, denn zu a ∈ A kann man an = a ∀n wählen.

Nach Voraussetzung gilt nun A = A. Wir müssen zeigen, dass X \ A offen ist.
Sei dazu a ∈ X \ A = X \ A. Dann gibt es keine Folge (an )n∈IN mit an ∈ A ∀n und
a = lim an . Nach Lemma 12.16 existiert  > 0 mit U (a) ⊆ X \ A.
n→
Folglich ist X \ A offen, also A abgeschlossen in X.

Die Menge A aus dem Beweis von Satz 12.17 nennt man den Abschluss (oder die
abgeschlossene Hülle) von A. Jeder Punkt a ∈ A heißt Berührpunkt von A.
In IR gilt beispielsweise ]a, b[ = [a, b] = ]a, b]. Allgemein gilt Ur (x) = Kr (x).
Nun können wir alle kompakten Teilmengen in (IKd , · 2 ) charakterisieren.
Korollar 12.18. Sei K eine Teilmenge des Euklidischen Raumes (IKd , · 2).
Folgende Eigenschaften sind äquivalent:
(i) K ist kompakt.
(ii) K ist abgeschlossen und beschränkt.
Beweis. Die Implikation (i)⇒(ii) gilt in jedem metrischen Raum (Satz 12.6).
Sei nun K abgeschlossen und beschränkt.
Laut Korollar 4.20 besitzt jede Folge in K eine konvergente Teilfolge. Da K ab-
geschlossen ist, liegt auch deren Grenzwert in K, siehe Satz 12.17.
Also ist K folgenkompakt; mit Satz 12.15 ist K dann auch kompakt.

Insbesondere sind alle Kr (a) ⊆ IKd oder [a1 , b1 ] × . . . × [ad , bd ] ⊆ IRd kompakt.
Wir wollen noch ein Beispiel angeben für eine Teilmenge eines metrischen Raumes,
die zwar abgeschlossen und beschränkt, aber nicht kompakt ist.
174 12 Kompaktheit
In (2 , · 2), vgl. Kapitel 5.6, betrachten wir
em := (0, . . . , 0, 1, 0, 0, . . .)
↑
m-te Stelle
für m ∈ IN und M := {em : m ∈ IN}.

Die Menge M ist beschränkt,
√ denn es gilt x2 = 1 für alle x ∈ M. Weiter gilt für
k = m stets em − ek 2 = 2; daher ist eine Folge in M nur dann konvergent, wenn
sie ab einem gewissen Index konstant ist, und ihr Grenzwert gehört dann offensicht-
lich wieder zu M. Folglich ist M auch abgeschlossen in (2 , · 2).
Allerdings ist M nicht kompakt, denn wir können leicht eine offene Überde-
ckung von M angeben, die keine endliche Teilüberdeckung besitzt: Wir setzen
Vm := U1 (em ). Dann ist {Vm : m ∈ IN} nach Konstruktion eine offene√Überdeckung
von M. Da zwei beliebige Elemente aus M aber stets den Abstand 2 haben, gilt
Vm ∩ M = {em } für alle m. Damit ist auch klar, dass endlich viele der Vm niemals
ausreichen können, um M zu überdecken.
Abschließend wenden wir uns wieder stetigen Funktionen zu und erinnern an den
Begriff der gleichmäßigen Stetigkeit, siehe Definition 6.17.
Man beachte die Unterschiede zwischen gleichmäßiger Stetigkeit und Stetig-
keit. Aus gleichmäßiger Stetigkeit folgt Stetigkeit. Aber: Gleichmäßige Stetigkeit
ist die Eigenschaft einer Funktion auf einer Menge, Stetigkeit wird für Punkte aus
der Menge erklärt.
In der  - -Definition der Stetigkeit in einem Punkt p ∈ X kann das zu findende
 von p ∈ X abhängen. Bei gleichmäßiger Stetigkeit hängt  nur von  ab und die
 - -Bedingung gilt auf ganz X.
Wir zeigen noch eine Verallgemeinerung von Satz 6.18.
Satz 12.19. Seien (X, dX ) und (Y, dY ) zwei metrische Räume, f : X → Y eine stetige
Abbildung.
Ist (X, dX ) kompakt, so ist f gleichmäßig stetig auf X.
Beweis. Wir nehmen an, dass f nicht gleichmäßig stetig auf X ist. Dann gibt es
 > 0, sodass zu beliebigem n ∈ IN Punkte xn , yn ∈ X mit dX (xn , yn ) < 1n aber
dY ( f (xn ), f (yn )) ≥  existieren.
Da (X, dX ) kompakt und damit auch folgenkompakt ist, existiert eine Teilfolge
(xnk )k∈IN , die gegen ein x ∈ X konvergiert. Wegen dX (xn , yn ) < 1n konvergiert auch
ynk → x und mit der Stetigkeit von f folgt f (xnk ) → f (x) sowie auch f (ynk ) → f (x)
für k → . Andererseits gilt

 ≤ dY f (xnk ), f (ynk ) ≤ dY f (xnk ), f (x) + dY f (ynk ), f (x)
für alle k und wir erhalten einen Widerspruch.

12.3 Aufgaben 175
Bemerkung: Man kann den Begriff der Kompaktheit auch noch verallgemeinern,
ohne dabei auf einen metrischen Raum zurückgreifen zu müssen.
Seien M eine beliebige Menge und T ein System von Teilmengen von M mit den
folgenden Eigenschaften:
(i) ∅, M ∈ T
(ii) Der Schnitt zweier Mengen aus T gehört stets wieder zu T.
(iii) Die Vereinigung beliebig vieler Mengen aus T gehört stets wieder zu T.
Dann bezeichnet man T als eine Topologie auf M.
Satz 12.3 besagt also, dass die in einem metrischen Raum (X, d) offenen Men-
gen eine Topologie auf X bilden. In Anlehnung daran heißen die Elemente einer
Topologie offen, auch wenn kein metrischer Raum zu Grunde liegt. Nun kann man
auch abgeschlossene (als Komplemente von offenen) Mengen und mittels Überde-
ckungen auch kompakte Mengen erklären. Sogar Stetigkeit kann sinnvoll definiert
werden, wenn man hierzu die Charakterisierung analog zu Satz 12.4 verwendet. Ei-
ne Einführung in die Topologie findet man z.B. in Büchern von K. Jänich [10] oder
B. von Querenburg [18].
12.3 Aufgaben
1. Untersuchen Sie direkt an Hand der Definition (also ohne Hilfe von Korollar
12.18), welche der folgenden Mengen kompakt in IR sind:

A := ] − 1, 1[ B := 1n : n ∈ IN C := B ∪ {0}
2. Zeigen Sie: Jede endliche Teilmenge eines metrischen Raumes ist kompakt.
3. Seien K1 , . . . , Kn kompakte Mengen in einem metrischen Raum (X, d).

n
*
Zeigen Sie, dass auch K j kompakt ist.
j=1
4. Zeigen Sie, dass Q weder offen noch abgeschlossen in IR ist.
5. Zeigen Sie, dass ] − 1, 1[ weder offen noch abgeschlossen in C ist.
6. Seien X eine Menge, dX die diskrete Metrik auf X.

a. Zeigen Sie, dass jede Teilmenge M ⊆ X sowohl offen als auch abgeschlos-
sen in (X, dX ) ist.
b. Sei (Y, dY ) ein weiterer metrischer Raum. Bestimmen Sie alle stetigen Ab-
bildungen (X, dX ) → (Y, dY ).
176 12 Kompaktheit
7. Geben Sie jeweils ein Beispiel einer stetigen Funktion f : IR → IR an mit der
Eigenschaft:
a. Es gibt eine offene Menge U derart, dass f (U) nicht offen ist.
b. Es gibt eine abgeschlossene Menge A derart, dass f (A) nicht abgeschlossen
ist.
8. Gegeben seien die folgenden Mengen:

a. M ⊆ IRn endlich; X = IRn .
b. M = [0, 1]× ]0, 1[ ; X = IR2 .
c. M = {(x, y, z) ∈ IR3 : 0 < x2 + y2 + z2 < 1}; X = IR3 .

d. M = x, sin 1x ∈ IR2 : x = 0 ; X = IR2 .
Ist M offen in X ? Ist M abgeschlossen in X ? Bestimmen Sie jeweils den Ab-
schluss M von M in X.
9. a. Seien (M, d) ein vollständiger metrischer Raum und T ⊆ M.

Zeigen Sie: T ist abgeschlossen in M genau dann, wenn (T, d) vollständig
ist.
b. Folgern Sie: Ein abgeschlossener Unterraum eines Banachraumes ist selbst
auch ein Banachraum.
c. Bestimmen Sie den Abschluss des Raumes T ([a, b]) der Treppenfunktio-
nen in (B([a, b]), · ).
10. Gegeben sei eine Funktion f : I → IR auf einem kompakten Intervall I.

Zeigen Sie, dass f genau dann stetig ist, wenn der Graph
G f := {(x, f (x) ) : x ∈ I}
kompakt im IR2 ist.

Kapitel 13
Normierte Vektorräume
Als Vektorraum wollen wir diesem Kapitel stets einen Vektorraum über dem Körper
IR verstehen. Bevor wir Abbildungen von Intervallen in normierte Vektorräume un-
tersuchen, werden wir die Stetigkeit von linearen Abbildungen zwischen normierten
Vektorräumen diskutieren.
Seien V und W Vektorräume. Eine Abbildung L : V → W heißt linear, wenn
L( x +  y) =  L(x) +  L(y) für alle x, y ∈ V und alle  ,  ∈ IR gilt. Üblicherweise
schreibt man oft kurz Lx an Stelle von L(x).
Wenn wir von normierten Vektorräumen V und W sprechen, so bezeichnen wir,
wenn nicht anders angegeben, die zugehörigen Normen mit · V bzw. · W .
Einige Grundlagen, wie etwa den Begriff Basis eines Vektorraumes oder die Dar-
stellung einer linearen Abbildung zwischen endlichdimensionalen Vektorräumen
mittels einer Matrix, setzen wir hier als bekannt voraus. Darüberhinaus sei auch
auf Lehrbücher zur linearen Algebra, wie etwa G. Fischer [5], verwiesen.
13.1 Stetige lineare Abbildungen
Satz 13.1. Seien V und W normierte Vektorräume sowie L : V → W linear.

Die folgenden Eigenschaften sind äquivalent:
(i) Die Abbildung L ist gleichmäßig stetig auf V .
(ii) Die Abbildung L ist stetig im Nullpunkt 0V von V .
(iii) Die Menge {LxW : x ∈ V, xV ≤ 1} ist beschränkt.
Beweis. Der Schluss (i)⇒(ii) ist selbstverständlich.
Die Implikation (ii)⇒(iii) zeigen wir indirekt.
Angenommen, die Menge in (iii) ist unbeschränkt. Dann existiert zu jedem n ∈ IN
ein xn ∈ V mit xn V ≤ 1 und Lxn W ≥ n. Für yn := 1n xn gilt dann yn V ≤ 1n und
Lyn W = 1n Lxn W ≥ 1. Da für eine lineare Abbildung L : V → W stets L 0V = 0W
gilt, folgt wegen lim yn = 0V , dass L in 0V nicht stetig ist.
n→

178 13 Normierte Vektorräume
Zu zeigen bleibt (iii)⇒(i).

Nach Voraussetzung ist M := sup{LxW : x ∈ V, xV ≤ 1} < . Wir wollen
sehen, dass
Lx − LyW ≤ Mx − y für alle x, y ∈ V
gilt. Daraus folgt direkt die gleichmäßige Stetigkeit von L auf V .
Zum Nachweis braucht nur der Fall x = y betrachtet zu werden. Dann haben wir
1
x − yV > 0 und für z := x−y V
(x − y) gilt zV = 1.
1
Somit ist x−yV L(x − y)W = LzW ≤ M und wir sind am Ziel.

Definition 13.2. Zu jeder stetigen linearen Abbildung L : V → W normierter Vek-
torräume wird die Operatornorm definiert durch
L := sup{LxW : x ∈ V, xV ≤ 1} .
Die Menge aller stetigen linearen Abbildungen V → W bezeichnen wir mit L (V,W ).
Satz 13.3. Mit der Operatornorm ist L (V,W ) ein normierter Vektorraum.
Beweis. Die Gesamtheit der linearen Abbildungen V → W bildet (unter punktwei-
ser Addition und Skalarmultiplikation) einen Vektorraum. Da Summen und reelle
Vielfache stetiger Abbildungen wiederum stetig sind, ist die Teilmenge L (V,W )
ein Untervektorraum. Es bleibt zu zeigen, dass die Operatornorm auch tatsächlich
eine Norm ist.
Nach Konstruktion ist stets L ≥ 0. Im Fall L = 0 gilt Lx = 0V für alle x ∈ V
mit xV ≤ 1. Daraus folgt Lx = 0V für alle x ∈ V , also L = 0. Dies beweist (N1).
Für nichtleere, beschränkte Mengen B ⊆ IR und r ≥ 0 gilt bekanntlich sup(rB) =
r sup B. Dies liefert für  ∈ IR und L ∈ L (V,W ) stets  L = | | L; somit ist
auch (N2) erfüllt.
Für L, L ∈ L (V,W ) und x ∈ V haben wir
(L + L )xW = Lx + L xW ≤ LxW + L xW .
Zunächst folgt (L + L )xW ≤ L + L für x ∈ V mit xV ≤ 1 und daraus dann
(L + L ) ≤ L + L, die Dreiecksungleichung (N3).

Bemerkungen:
(1) Mit der Operatornorm erhält man die Abschätzung LxW ≤ L xV für
alle L ∈ L (V,W ) und alle x ∈ V .
(2) Im Fall V = W schreibt man L (V ) := L (V,V ) und nennt L ∈ L (V ) einen
stetigen Endomorphismus von V .
Mit L, L ∈ L (V ) gilt auch LL := L ◦ L ∈ L (V ). Aus der Abschätzung
LL xV ≤ L L xV ≤ L L xV ergibt sich schließlich noch die so
genannte Submultiplikativität der Operatornorm:
LL ≤ L L für alle L, L ∈ L (V ) .

13.1 Stetige lineare Abbildungen 179
x1
Beispiel: Für x = (xn )n∈IN ∈ 2 sei Lx := 1 , x22 , x33 , . . . .
1
Mit yn := n ist y = (yn )n∈IN ∈ 2 und laut Satz 5.23 gilt Lx = xy ∈ 1 .
Damit ist eine (wie man leicht nachprüfen kann) lineare Abbildung L : 2 → 1
erklärt. Da nach Satz 5.23 auch Lx1 ≤ x2 y2 gilt, haben wir insbesondere
Lx1 ≤ y2 für alle x ∈ 2 mit x2 ≤ 1.
Daraus folgt die Stetigkeit von L und auch L ≤ y2 .
1
Betrachtet man speziell x = y2 y, so gilt x2 = 1 und Lx1 = y2 .
Insgesamt erhalten wir
1
 2
1 
L = y2 =  n2 =√ .
6
n=1
Definition 13.4. Zwei Normen · und · auf einem Vektorraum V heißen äqui-
valent, wenn es Schranken M, M > 0 gibt mit
x ≤ M x und x ≤ M x für alle x ∈ V .
Satz 13.5. (a) Zwei Normen eines Vektorraums V sind genau dann äquivalent,
wenn sie die selben Cauchyfolgen besitzen.
(b) Äquivalente Normen haben die selben offenen Mengen.
Beweis. (a) Seien · und · äquivalente Normen und (xn )n∈IN eine Folge in V .
Dann gilt
xm − xn ≤ M xm − xn und xm − xn ≤ M xm − xn
für alle m, n ∈ IN. Daher ist eine Cauchyfolge in der einen Norm zugleich Cauchy-
folge in der anderen Norm.
Sind die Normen · und · nicht äquivalent, dann existiert wenigstens eine
der Schranken M, M nicht. Wenn etwa kein M im Sinne der Definition existiert,
dann gibt es zu jedem n ∈ IN ein xn ∈ V mit xn ≤ 1 und xn ≥ n2 .
Setzt man nun yn := 1n xn , so ist yn ≤ 1n , also lim yn = 0V bezüglich · .
n→
Wegen yn ≥ n ist aber (yn )n∈IN bezüglich · keine Cauchyfolge.
(b) Zu den auf V äquivalenten Normen · und · seien Schranken M, M > 0

gemäß der Definition gewählt. Die jeweiligen  -Kugeln um Punkte a ∈ V erfüllen

dann
U /M (a) ⊆ U (a) und U /M (a) ⊆ U (a) .
Hieraus folgt, dass jede Umgebung von a in der einen Norm auch eine Umgebung
von a in der anderen Norm enthält. Also hat V in jeder der beiden Normen die selben
offenen Mengen.

Satz 13.6. Sei {a1 , a2 , . . . , ad } eine Basis des d-dimensionalen normierten Vektor-
raumes V . Weiter sei IRd versehen mit der Maximumsnorm x = max |xk |.
1≤k≤d
Dann ist die durch
d
Lx :=  xk a k
k=1
definierte bijektive lineare Abbildung L : IRd → V stetig und ihre Umkehrabbildung

ist ebenfalls stetig.
d
Beweis. Mit M := max ak V erhalten wir LxV ≤  |xk | ak V ≤ d M x .
1≤k≤d k=1
Daher ist {LxV : x ∈ IRd , x ≤ 1} beschränkt und L laut Satz 13.1 stetig.
Da L−1 : V → IRd ebenfalls eine lineare Abbildung ist, genügt es, die Stetigkeit im
Nullpunkt nachzuweisen. Dazu sei  > 0.
Die Menge C := {x ∈ IRd : x =  } ist kompakt; nach Korollar 12.9 nimmt
die stetige Funktion x → LxV auf C ein Minimum an. Da C den Nullpunkt nicht
enthält, gilt weiter 0 < min LxV =:  .
x∈C
Zu jedem y ∈ V mit yV <  gibt es x ∈ C und  ∈ IR mit y = L( x) =  Lx, da
L eine bijektive lineare Abbildung ist. Wegen | | LxV = yV <  ≤ LxV gilt
| | < 1. Aus yV <  folgt also stets
L−1 (y) =  x = | | x = | |  <  .
Folglich ist L−1 im Nullpunkt von V stetig.

Satz 13.7 (Äquivalenz von Normen im endlichdimensionalem Raum). Sei V ein

d-dimensionaler Vektorraum. Es gilt:
(a) Je zwei Normen auf V sind äquivalent.
(b) Unter jeder Norm ist V vollständig und Grenzwerte in V sind unabhängig
von der Wahl der Norm.
Beweis. (a) Sind · 1 und · 2 zwei Normen auf V , so schreiben wir Vk (k = 1, 2)

für den mittels · k normierten Raum V . Nach Satz 13.6 ist bei gegebener Basis
{a1 , a2 , . . . , ad } von V durch
d
Lk x :=  x ja j für x ∈ IRd
j=1
eine bijektive lineare und samt Umkehrabbildung stetige Abbildung L : IRd → Vk

erklärt (bzgl. Maximumsnorm auf IRd ).
Damit ist auch L := L2 L−1
1 : V1 → V2 eine bijektive lineare und stetige Abbildung,
deren Umkehrung L−1 = L1 L−1 2 ebenfalls stetig ist. (Rein algebraisch betrachtet ist
L die Identität auf V .)
13.1 Stetige lineare Abbildungen 181
Mit den Schranken
M1 := sup{L−1 z1 : z ∈ V2 , z2 ≤ 1} und

M2 := sup{Ly2 : y ∈ V1 , y1 ≤ 1}
erhalten wir für alle y ∈ V die Abschätzungen
y2 = L(L−1 y)2 ≤ M2 L−1 y1 = M2 y1 sowie

y1 = L−1 (Ly)1 ≤ M1 Ly2 = M1 y2 .
Die beiden Normen sind daher äquivalent.

(b) Mit Satz 13.5 und der eben bewiesenen Aussage genügt es, eine Norm anzuge-
ben, mit welcher V vollständig ist. Man erhält sie z.B. aus der Euklidischen Norm
des IRd mittels " "
" d "
" "
"  x j a j " := x2 .
" j=1 "
0
d
Laut Korollar 4.8 ist (IR , ·2 ) vollständig. Hat man eine Cauchyfolge in (V, ·0 ),
so findet man deren Grenzwert nun über die entsprechende Folge in IRd .

Insbesondere sind auf IRd die Normen
1
d d 2
x1 =  |x j | , x2 =  x2j und x = max |x j |

j=1,...,d
j=1 j=1
äquivalent.
Korollar 13.8. Seien V und W normierte Vektorräume, V endlich-dimensional.
Dann ist jede lineare Abbildung L : V → W stetig.
Beweis. Seien {a1 , . . . , ad } eine Basis von V und · 0 die durch
" "
" d "
" "
"  x j a j " := x für x = (x1 , . . . , xd ) ∈ IRd
" j=1 "
0
d
erklärte Norm auf V . Für x =  x j a j ∈ V gilt dann
j=1
" "
" d " d
" "
LxW = "  x j L(a j )" ≤  |x j | L(a j )W ≤ d M x0 ,
" j=1 " j=1
W
wobei M := max L(a j )W sei.

1≤ j≤d
Mit Satz 13.1 folgt die Stetigkeit von L zunächst bezüglich · 0 und auf Grund
der Äquivalenz der Normen auch bezüglich aller anderer Normen auf V .

13.2 Kurven in Vektorräumen
Seien X ein metrischer Raum und I = [a, b] ein kompaktes Intervall. Eine stetige
Abbildung  : I → X bezeichnet man als Weg. Gilt  (a) =  (b), so heißt  ein
geschlossener Weg.
Beispiele
(1) In X = C mit der gewöhnlichen Metrik definiert  (t) := eit mit I = [0, 2 k]
für jedes k ∈ IN einen geschlossenen Weg.
(2) Gegeben seien ein Radius r > 0 und eine Ganghöhe“ 2 c > 0. Dann definiert
”
 (t) := (r cost, r sin t, ct) , t ∈ [0, 2 k] ,
einen Weg ( Schraubenlinie“) im IR3 . Ferner existiert der Grenzwert

”
 (t) −  (t0)
lim = (−r sin t0 , r cost0 , c) .
t → t0 t − t0
t = t0
Letzteres motiviert die folgende Definition.
Definition 13.9. Ein Weg  : [a, b] → V im endlich-dimensionalen normierten Vek-

torraum V heißt im Punkt t0 ∈ [a, b] differenzierbar, wenn der Grenzwert
 (t) −  (t0 )
lim =:  (t0 )
t → t0 t − t0
t = t0
existiert. Den Vektor  (t0 ) ∈ V bezeichnet man dann als Ableitung von  in t0 . Ist
 in jedem Punkt t ∈ [a, b] differenzierbar, so nennt man  eine differenzierbare
Kurve.
Wenn [a, b] eine Teilung t0 = a < t1 < . . . < tr = b besitzt derart, dass alle Re-
striktionen  |[tk−1 ,tk ] differenzierbar sind mit auf [tk−1 ,tk ] stetiger Ableitung, dann
heißt  eine stückweise stetig differenzierbare Kurve.
Ist  eine stetig differenzierbare Kurve, so bildet für jedes t0 ∈ I mit  (t0 ) = 0
die Menge { (t0 ) + s  (t0 ) : s ∈ IR} die Tangente an  im Punkt  (t0 ). Der Vektor
 (t0 ) heißt Tangentenvektor. Diejenigen Punkte t0 ∈ [a, b] mit Tangentenvektor
 (t0 ) = 0V werden singulär genannt. Besitzt  keine singulären Punkte, so heißt 
eine reguläre Kurve.
Bemerkung: Weder die Definition der Differenzierbarkeit noch der Wert der Ablei-
tung hängen von der Wahl der Norm in V ab (vgl. Satz13.7).
Zum Beispiel ist für jede stetig differenzierbare Funktion f : [a, b] → IR der
Graph  f von f , definiert durch  f : [a, b] → IR2 ,  f (t) := (t, f (t) ), eine reguläre
Kurve, da  f (t) = (1, f (t) ) ist.
13.2 Kurven in Vektorräumen 183
Die Gerade durch die Punkte  (t0 ) und  (t) ist die
T (t0 ) S (t0 ,t) Menge S (t0 ,t) := { (t0 )+s( (t)−  (t0 )) : s ∈ IR}.
s=2 Sei t = t0 zunächst fest gewählt, so gilt

s=1 r
S (t0 ,t) =  (t0 ) + ( (t) −  (t0 )) : r ∈ IR .
 (t) t − t0
s=0
Ist  im Punkt t0 differenzierbar, so erhalten wir die
 (t0 ) Tangente als Grenzwert“ von S(t0 ,t) für t → t0 ,
s = −1 ”
T (t0 ) := { (t0 ) + r  (t0 ) : r ∈ IR} .
Beispiel: Durch  : [−1, 1] → IR2 ,  (t) := (t 2 ,t 3 ), wird die so genannte Neilsche

Parabel definiert.
Sie ist eine stetig differenzierbare Kurve mit der Ableitung  (t) = (2t, 3t 2 ) und
hat genau einen singulären Punkt, nämlich t0 = 0.
1
Die Abbildung zeigt die Neilsche Parabel. 1

Man erkennt, dass es nicht möglich ist, eine
Tangente im Nullpunkt sinnvoll zu erklären.
−1
Seien V ein d-dimensionaler Vektorraum und {e1 , . . . , ed } eine Basis von V . Das
System der Koordinaten bezüglich dieser Basis identifiziert V mit IRd . Jede Kurve
 : [a, b] → V wird so durch ihre Koordinatenfunktionen k : [a, b] → IR beschrieben:
d
 (t) =  e j  j (t) .
j=1
Satz 13.10. Seien V ein d-dimensionaler normierter Vektorraum und {e1 , . . . , ed }

eine Basis von V .
Eine Abbildung  : [a, b] → V ist im Punkt t ∈ [a, b] genau dann differenzierbar,
wenn jede Koordinatenfunktion k : [a, b] → IR (k = 1, . . . , d) dort differenzierbar ist.
In diesem Fall gilt
d
 (t) =  e j  j (t) .
j=1
Beweis. Wegen der Äquivalenz aller Normen auf V können wir dort die Maximums-
norm zu Grunde legen.
 (s) −  (t)
Damit bedeutet lim =  (t) das selbe wie
s→t s−t

k (s) − k (t)
lim
− k (t)
für alle k ∈ {1, . . . , d} ,

s→t s−t
wobei k (t) die k-te Koordinate des Vektors  (t) bzgl. der Basis {e1 , . . . , ed } von V
bezeichne. Damit haben wir
d
 (t) =  ek k (t)
k=1
wie behauptet.

Definition 13.11. Sei  : [a, b] → V eine stückweise stetig differenzierbare Kurve im

d-dimensionalen normierten Raum V . Als Länge von  definieren wir
( b
l( ) :=  (t) dt .
a
Bemerkung: Die Kurvenlänge hängt von der Wahl der Norm ab. So hat beispiels-
weise die Strecke
s(t) = (1 + i)t , t ∈ [0, 1] ,
√
in der Euklidischen Norm (die in C mit dem Betrag übereinstimmt) die Länge 2,
während ihre Länge in der Maximumsnorm des IR2 gleich 1 ist.
Im Vektorraum V = IRd wird die Länge von Kurven immer auf die Euklidische
Norm bezogen, falls nicht ausdrücklich etwas anderes gesagt wird.
Die Abbildung gibt eine Motivation für die Definition der Länge.
Die Länge einer Kurve ist stets größer oder gleich der Länge eines
Streckenzuges, der gewisse Punkte der Kurve verbindet. Je feiner
man die Kurve unterteilt, desto besser wird die Länge approximiert.
In Satz 13.12 wird diese Überlegung präzisiert.
Satz 13.12. Seien V ein d-dimensionaler normierter Vektorraum und  : [a, b] → V

eine stückweise stetig differenzierbare Kurve.
Dann gilt für jede Teilung a = t0 < t1 < . . . < tr = b die Ungleichung
r
  (t j ) −  (t j−1) ≤ l( ) .
j=1
Ferner gibt es zu jedem  > 0 eine Schranke  > 0 derart, dass

r
0 ≤ l( ) −   (t j ) −  (t j−1) ≤ 
j=1
für alle Teilungen der Feinheit max (t j − t j−1 ) ≤  gilt.

1≤ j≤r
Zum Beweis verwenden wir folgendes auch sonst nützliches Resultat.

Lemma 13.13. Seien V ein d-dimensionaler normierter Vektorraum,  : [a, b] → V

eine stetig differenzierbare Kurve.
Zu jedem  > 0 gibt es eine Schranke  > 0 derart, dass
" "
"  (s) −  (t) "
" − 
(t)"≤
" s−t "
für alle s,t ∈ [a, b] mit 0 ≤ |s − t| ≤  gilt.
Beweis. Die Wahl von  hängt natürlich von der Norm auf V ab. Da aber je zwei
Normen äquivalent sind, genügt es, den Beweis für eine spezielle Norm zu führen.
d
Mit einer Basis {e1 , . . . , ed } von V beschreiben wir die Kurve  (t) =  ek k (t)
k=1
durch ihre stetig differenzierbaren Koordinaten-Funktionen k . Laut Mittelwertsatz
gibt es ein k zwischen s und t derart, dass

k (s) − k (t)

− 
(t)
= | (k ) −  (t)|

s−t k
k k
gilt. Die Ableitung k ist auf dem kompakten Intervall [a, b] gleichmäßig stetig
(Satz 12.19). Daher gibt es ein k > 0, sodass |k ( ) − k (t)| ≤  für alle  ,t ∈ [a, b]
mit | − t| ≤ k ist. Wir wählen nun  := min k und erhalten
1≤k≤d

k (s) − k (t)
max
− k (t)
≤ 

für s,t ∈ [a, b] mit 0 < |s − t| ≤ 
1≤k≤d
s−t
wie behauptet.

Beweis (von Satz 13.12). Wir beginnen mit einer Teilung a = a0 < a1 < . . . < aq = b,
auf deren Teilintervallen [ak−1 , ak ] die Restriktion von  stetig differenzierbar ist
(1 ≤ k ≤ q).
Sei  > 0. Wir verschaffen uns ein  > 0, das den folgenden vier Bedingungen
genügt.
(1) Zunächst wird  so klein gewählt, dass für Teilungen a = t0 < . . . < tr = b
der Feinheit max(t j − t j−1) ≤  stets
j

r


l( ) −   (t j )(t j − t j−1)
≤ .

j=1

4
gilt. Um Eindeutigkeit von  (t j ) zu erzielen, nehmen wir die linksseitige

Ableitung von  , falls t j einer der Teilungspunkte ak sein sollte. (Wir appro-
ximieren also mit einer speziellen Treppenfunktion.)
(2) Weiter wird  bzgl. der auf [a, b] gleichmäßig stetigen Abbildung  so klein

gewählt, dass  (s) −  (t) ≤ 4q für alle s,t ∈ [a, b] mit |s − t| ≤  gilt.

(3) Wir verlangen qM  ≤ 4 für M := sup  (t).
t∈[a,b]
(4) Schließlich wird  auch noch so klein gewählt, dass die Abschätzung in Lem-

ma 13.13 für jedes Teilintervall [ak−1 , ak ] mit  := 4(b−a) gültig ist.
Zu dem nun fixierten  > 0 sei a = t0 < . . . < tr = b eine Teilung der Feinheit ≤  .
Mit A bezeichnen wir die Menge der Indizes j, für die es ein k gibt mit
ak ∈ ]t j−1 ,t j [. Dann enthält die Menge A höchstens q Elemente. Damit gelten die
Abschätzungen

l( ) −   (t j ) −  (t j−1)

j=1

r r
=
l( ) −   (t j )(t j − t j−1 ) +  (  (t j ) (t j − t j−1) −  (t j ) −  (t j−1 ) )

j=1 j=1

r

≤ +   (t j ) −  (t j−1) −  (t j ) (t j − t j−1)
4 j=1
r
 
≤ +   (t j ) −  (t j−1 ) −  (t j ) (t j − t j−1 ) + q + qM 
4 j=1 4q
j∈A
/
r
3 
≤ + (t j − t j−1) ≤  .
4 j=1 4(b − a)
j∈A
/
r
Es bleibt zu zeigen, dass stets   (t j ) −  (t j−1 ) ≤ l( ) gilt.
j=1
Angenommen, dies ist nicht der Fall. Dann gibt es eine Teilung mit
r
  (t j ) −  (t j−1) − l( ) ≥ 0
j=1
für eine gewisse Zahl 0 > 0. Da die Summe auf der linken Seite beim Übergang
zu einer feineren Teilung nicht kleiner wird, bleibt die Ungleichung für alle feine-
ren Teilungen gültig. Mit einem  < 0 erhalten wir nun einen Widerspruch zu der
bereits bewiesenen Teilaussage.

Korollar 13.14 (Schrankensatz). Seien V ein d-dimensionaler normierter Vektor-

raum und  : [a, b] → V eine stetig differenzierbare Kurve mit beschränkter Ablei-
tung  (t) ≤ M für alle t ∈ [a, b].
Dann gilt  (b) −  (a) ≤ M(b − a).
Beweis. Dies ergibt sich aus dem ersten Teil von Satz 13.12 mit der gröbsten Tei-
lung t0 = a, t1 = b und der Standardabschätzung l( ) ≤ M(b − a), vgl. Satz 8.3(4).

Beispiele
(1) Die k-fach durchlaufene Kreislinie vom Radius r > 0,
r (t) = r eit , t ∈ [0, 2 k] ,
hat die Ableitung r (t) = ir eit . Sie hat daher in der durch den Betrag auf IR
definierten Norm die Länge
( 2 k
l(r ) = r dt = 2 kr .
0
(2) Die durch den Graph einer stetig differenzierbaren Funktion f : [a, b] → IR
erklärte Kurve  f (t) = (t, f (t) ) hat die Ableitung  f (t) = (1, f (t) ). Damit
ist Ihre Euklidische Länge
( b

l( f ) = 1 + f 2 (t) dt .
a
(3) Durch Abrollen eines Kreises vom Radius 1 auf der x-Achse des IR2 entsteht
als Bahnkurve eines Umfangspunktes die Zykloide  (t) = (1 (t), 2 (t) ) mit
1 (t) = t − sint und 2 (t) = 1 − cost.
2 (t)
1 (t) t 2
Ihre Euklidische Länge über einen Umlauf des Kreises ist

( 2 √ ( 2
2
l( ) = 2 − 2 cost dt = 2 sin2 (t/2) dt = −4 cos(t/2)
0 = 8 .
0 0
Definition 13.15 (Parametertransformation). Sei  : [a, b] → V ein Weg im d-

dimensionalen normierten Raum V . Ist  : [c, d] → [a, b] eine bijektive stetige Ab-
bildung, dann heißt  :=  ◦  der aus  durch Umparametrisierung mittels der
Parametertransformation  entstandene Weg. Da  als injektive stetige Abbil-
dung streng monoton ist, tritt genau einer der folgenden Fälle ein:
( (c),  (d) ) = (a, b) ,  heißt dann orientierungstreu .

( (c),  (d) ) = (b, a) ,  heißt in diesem Fall orientierungsumkehrend .
Sind  und die Umkehrabbildung  −1 stetig differenzierbar, so bezeichnet man

 als eine C1 -Parametertransformation. Insbesondere ist dann  nullstellenfrei,
also als stetige Funktion auf [c, d] von festem Vorzeichen, sign  = ±1, je nachdem,
ob  orientierungstreu oder orientierungsumkehrend ist.
Bemerkungen: Wenn auch  auf [a, b] stetig differenzierbar ist, so ist  :=  ◦ 

stetig differenzierbar mit Ableitung
 (t) =  ( (t)) ·  (t) .

∈V ∈IR
Dies ergibt sich mit Satz 13.10 aus der Kettenregel. Unter C1 -Parametertransforma-
tionen bleiben Kurvenlängen invariant, denn eine einfache Substitution ergibt
( d ( d

l( ) =  (t) dt = sign   ( (t) )  (t) dt
c c
(  (d) ( b
= sign   (s) ds =  (s) ds .
 (c) a
Betrachtet man speziell  =  −1 , wobei

( s
 (s) :=  ( ) d
s0
für ein festes s0 ∈ [a, b] sei, so ist  eine orientierungstreue C1 -Parametertransforma-

tion. Mittels Satz 7.17 erhalten wir
1 1
 (t) = =
 ( (t))  ( (t))
und damit  (t) = 1 für alle t ∈ [c, d]. Weiter gilt l( ) = d − c. Man sagt in diesem
Fall,  ist nach der Länge parametrisiert.
13.3 Aufgaben
x1
1. Für x = (xn )n∈IN ∈  sei Ax := 1 , x22 , x33 , . . . .
a. Zeigen Sie, dass A :  →  eine stetige lineare Abbildung ist und bestim-
men Sie A.
b. Zeigen Sie, dass A injektiv ist.
c. Ist A surjektiv ?
d. Weiter sei X := A( ) das Bild von A. Zeigen Sie, dass die Umkehrabbil-
dung A−1 : X →  nicht stetig ist.
13.3 Aufgaben 189
2. Zeigen Sie, dass in C([0, 1]) die durch

( 1
1
2
2
f  = max | f (x)| und f 2 = | f (x)| dx
x∈[0,1] 0
erklärten Normen nicht äquivalent sind.
3. Berechnen Sie die Länge der Neilschen Parabel, gegeben durch
 : [−1, 1] → IR2 ,  (t) := (t 2 ,t 3 ) ,
bezüglich jeder der drei Normen · 1, · 2 und · .
4. Die Astroide ist die durch
 : [0, 2 ] → IR2 ,  (t) := (cos3 t , sin3 t) ,
gegebene Kurve.
a. Begründen Sie, dass  stetig differenzierbar ist, und berechnen Sie  .
b. Berechnen Sie die Länge l( ).
c. Berechnen Sie alle Maximal- und Minimalstellen von  (t) .
d. Bestimmen Sie alle singulären Punkte von  .
1
1
1
1
Die Astroide aus Aufgabe 4 Die Kardioide aus Aufgabe 5
5. Die Kardioide ist die durch
 : [0, 2 ] → IR2 ,  (t) := ( (1 + cost) cost , (1 + cost) sint)
gegebene Kurve.
a. Bestimmen Sie alle singulären Punkte von  .
b. Bestimmen Sie alle Punkte von  mit horizontaler oder vertikaler Tangente.
c. Berechnen Sie die Länge l( ).
6. Sei c > 0. Die Abbildung
 : IR → C ,  (t) := exp(ct + it) ,
beschreibt eine logarithmische Spirale.

Für a < b bezeichne La,b die Länge der Einschränkung von  auf das Intervall
[a, b]. Berechnen Sie La,b und zeigen Sie, dass lim La,0 existiert.
a→−
Im
Re
Obwohl die logarithmische Spirale den Null-

punkt unendlich oft umrundet“, hat ihre
”
Länge bei festgehaltenem Endpunkt einen
endlichen Grenzwert.
Kapitel 14
Totale Differenzierbarkeit
Wir wollen nun den Begriff der Differenzierbarkeit, den wir in Kapitel 7 für reell-
wertige Funktionen auf Intervallen und in Kapitel 13 für Funktionen von Intervallen
in beliebige normierte Räume erklärt haben, ausdehnen auf Funktionen f : U → W ,
U ⊆ V , wobei V und W endlich-dimensionale normierte Vektorräume sind.
14.1 Totale und partielle Ableitungen
Definition 14.1. Seien V und W endlich-dimensionale normierte IR-Vektorräume,

U ⊆ V eine offene Menge in V . Eine Abbildung f : U → W heißt im Punkt a ∈ U
differenzierbar, wenn eine lineare Abbildung A ∈ L (V,W ) existiert derart, dass
die durch
f (a + h) = f (a) + Ah + R(h)
in einer Umgebung U0 ⊆ V von 0 ∈ V definierte Restfunktion R : U0 → W folgendes
erfüllt:
R(h)
lim =0∈W . (14.1)
h→0 hV
h =0
Zunächst müssen wir uns davon überzeugen, dass eine derartige lineare Abbildung
A ∈ L (V,W ), falls sie existiert, auch eindeutig festgelegt ist. Dies ist tatsächlich der
Fall: Sei
f (a + h) = f (a) + A1 h + R1(h) = f (a) + A2h + R2(h)
mit A1 , A2 ∈ L (V,W ) derart, dass R1 und R2 die Bedingung (14.1) erfüllen. Für
B := A1 − A2 ∈ L (V,W ) erhalten wir mit beliebigem h ∈ V , hV = 1, t > 0 dann
t B(h)W B(th)W R2 (th) − R1(th)W

B(h)W = = =
t thV thV
R1 (th)W R2 (th)W t→0
≤ + −→ 0 .
thV thV

192 14 Totale Differenzierbarkeit
Das heißt B(h) = 0 für alle h ∈ V mit hV = 1. Da B linear ist, folgt B(h) = 0 für
alle h ∈ V , also A1 = A2 .
Wenn die lineare Abbildung A gemäß Definition 14.1 existiert, so schreibt man auch
A = D f (a) oder A = f (a) und bezeichnet sie als die totale Ableitung oder das
totale Differential von f in a.
Im eindimensionalen Fall V = W = IR ist die lineare Abbildung A nichts anderes
als die Multiplikation mit einer reellen Zahl, nämlich dem Wert f (a).
Satz 14.2. Seien V und W endlich-dimensionale normierte Räume, U ⊆ V offen und

f : U → W eine Abbildung.
Ist f im Punkt a ∈ U differenzierbar, so ist f in a auch stetig.
Beweis. Wegen (14.1) existiert ein  > 0, sodass R(h)W ≤ hV für alle h ∈ V
mit hV ≤  gilt. Weiter können wir U (a) ⊆ U annehmen (sonst wähle man ein
entsprechend kleineres  ). Es gilt dann
f (a + h) − f (a)W ≤ AhW + R(h)W ≤ (A + 1) hV
für hV <  .

Mit dem Folgenkriterium (Satz 6.2) folgt nun die Stetigkeit von f in a.

Bemerkung: Wegen der Äquivalenz der Normen (Satz 13.7), spielt es hier keine
Rolle, welche Normen auf V und W gewählt wurden.
Beispiel: Sei f : IR2 → IR, f (x1 , x2 ) := (x1 − 1)(x2 − 1).

Für a = aa12 , h = hh12 ∈ IR2 gilt
f (a + h) − f (a) = (a1 + h1 − 1)(a2 + h2 − 1) − (a1 − 1)(a2 − 1)

= (a1 − 1)h2 + (a2 − 1)h1 + h1 h2
. /
a2 − 1 h1
= , + R(h) ,
a1 − 1 h2
wobei R(h) = h1 h2 ist.

Mit der Euklidischen Norm · 2 im IR2 gilt
1 2
|R(h)| |h1 h2 | (h + h22) 1
= 2 2
≤ 2 2 1 2 1/2 = h2 → 0 für h → 0 .
h2 (h1 + h2) 1/2 (h1 + h2 ) 2
Die Ableitung A = D f (a) = f (a) ∈ L (IR2 , IR) ist also gegeben durch
. /
a2 − 1 h1 h1
h → , = (a2 − 1, a1 − 1) .
a1 − 1 h2 h2
1×2−Matrix
14.1 Totale und partielle Ableitungen 193
Das vorangehende Beispiel gehört zu dem Fall, dass der Bildraum eindimensional
ist, d.h. f : U → IR mit U ⊆ IRn offen. Die Ableitung A von f in a ∈ U ist dann von
der Form
n
D f (a) h = Ah = c, h =  ck h k
k=1
n
mit c ∈ IR . Man hat also
n
R(h)
f (a + h) = f (a) +  ck hk + R(h) , lim =0.
k=1
h→0
h =0
h
Um die ck ∈ IR zu bestimmen, wählen wir h = tek , wobei ek den kanonischen k-ten

Einheitsvektor in IRn bezeichne (k = 1, . . . , n). Damit ist
1 1
( f (a + tek ) − f (a) ) = ck + R(ek t)
t t
und mit t → 0 folgt
f (ak + ekt) − f (a) f

ck = lim =: (a) .
t→0 t  xk
Man nennt dies die partielle Ableitung von f nach der k-ten Koordinate im Punkt
a. Die Ableitung von f an der Stelle a ∈ U hat also die Gestalt
D f (a) h = grad f (a) , h ,

f f
wobei grad f (a) := (a), . . . , (a) der Gradient von f im Punkt a heißt.
 x1  xn
Statt grad f (a) schreibt man gelegentlich auch  f (a). (Das Symbol  heißt Nabla).
Wir wenden uns nun dem Fall V = IR, W = IRm (mit kanonischer Basis) zu. Sei
f : U → IRm mit U ⊆ IR offen. Wir suchen A ∈ L (IR, IRm ) mit entsprechenden
Eigenschaften. Schreibt man
⎛ ⎞
f1 (x)
⎜ ⎟
f (x) = ⎝ ... ⎠ ,
fm (x)
so hat man das Problem der Differenzierbarkeit von f auf das Problem der Diffe-
renzierbarkeit der fk : U → IR (k = 1, . . . , m) zurückgeführt. Es gilt dann (beachte:
hier ist h ∈ IR) ⎛ ⎞
f1 (a)
⎜ ⎟
D f (a) h = ⎝ ... ⎠ h ,
fm (a)
vgl. auch Kapitel 13.2.
Wir kehren zurück zum allgemeinen Fall. Bevor wir uns überlegen, wie man die
lineare Abbildung D f (a) ∈ L (V,W ) als Matrix darstellen kann, werden wir noch
einige wichtige Eigenschaften differenzierbarer Abbildungen zusammenstellen. Die
folgenden sind unmittelbar ersichtlich.
(1) Ist f : V → W konstant, so ist D f (a) = 0.
(2) Ist f : V → W selbst linear, d.h. f ∈ L (V,W ), dann ist D f (a) = f . Mit der
Linearität von f gilt nämlich f (a + h) − f (a) = f (h), also ist in diesem Fall
R(h) = 0.
(3) Sind f , g : U → W in a ∈ U ⊆ V differenzierbar und  ∈ IR, so sind auch
f + g : U → W und  f : U → W in a differenzierbar mit
D( f + g)(a) = D f (a) + Dg(a) sowie D( f )(a) =  D f (a) .
Man kann auch die Kettenregel auf die vorliegende Situation verallgemeinern.
Satz 14.3 (Kettenregel). Seien V1 ,V2 ,V3 endlich-dimensionale normierte IR-Vektor-

räume, U1 ⊆ V1 , U2 ⊆ V2 offen und f : U1 → U2 , g : U2 → V3 Abbildungen.
Wenn f in a ∈ U1 differenzierbar und g in f (a) ∈ U2 differenzierbar ist, dann ist
die Abbildung g ◦ f : U1 → V3 in a differenzierbar und es gilt
D(g ◦ f )(a) = Dg( f (a)) D f (a) .
Beweis. Wir setzen R(h) := g ◦ f (a + h) − g ◦ f (a) − Dg( f (a)) D f (a) h. Es genügt

zu zeigen, dass zu jedem 0 <  < 1 ein  > 0 existiert mit
R(h)V3 ≤  hV1 für alle h ∈ V1 mit hV1 <  .
Denn daraus folgt, dass dieses R der Bedingung (14.1) genügt.

Sei also 0 <  < 1. Da D f (a) und Dg( f (a)) stetige lineare Abbildungen sind, gibt
es eine Schranke M ≥ 1 mit
D f (a) xV2 ≤ M xV1 für alle x ∈ V1 und

Dg( f (a)) yV3 ≤ M yV2 für alle y ∈ V2 .
Wegen der Differenzierbarkeit von g im Punkt f (a) existiert ferner ein  > 0 mit

g( f (a) + k) − g( f (a)) − Dg( f (a)) kV3 ≤ kV2
2M + 2
für alle k ∈ V2 mit kV2 <  .
Setzen wir speziell k := f (a + h) − f (a) ∈ V2 , so finden wir, da f in a differen-
zierbar ist, eine Zahl  > 0 mit

k − D f (a) hV2 ≤ hV1 für alle h ∈ V1 mit hV1 <  .
2M
14.1 Totale und partielle Ableitungen 195
Für hV1 <  gilt folglich

 
kV2 ≤ D f (a) hV2 + hV1 ≤ M hV1 + hV1 ≤ (M + 1) hV1 .
2M 2M

Sei nun  := min  , M+1 . Wir setzen alles zusammen und erhalten für hV1 < 
schließlich
g ◦ f (a + h) − g ◦ f (a) − Dg( f (a)) D f (a) hV3
≤ g( f (a) + k) − g( f (a)) − Dg( f (a)) kV3 + Dg( f (a)) (k − D f (a) h)V3
  
≤ kV2 + M k − D f (a) hV2 ≤ hV1 + hV1 .
2M + 2 2 2
(beachte: Hier gilt kV2 <  .)

Seien U ⊆ IRn offen, f : U → IRm eine Abbildung und {e1 , . . . , en } bzw. {w1 , . . . , wm }
die kanonischen Basen des IRn und IRm .
Die Komponenten von f sind die Funktionen f1 , . . . , fm : U → IR mit
m
f (x) =  fi (x) wi .
i=1
Für a ∈ U, i ∈ {1, . . . , m} und k ∈ {1, . . . , n} definieren wir
 fi fi (a + tek ) − fi (a)
(a) := lim ,
 xk t→0 t
vorausgesetzt dieser Grenzwert existiert.
 fi
Man nennt (a) die partiellen Ableitungen von f in a.
 xk
 fi
Gelegentlich schreibt man auch Dk fi (a) statt (a).
 xk
Satz 14.4. Seien U ⊆ IRn offen und f : U → IRm im Punkt a ∈ U differenzierbar.
 fi
Dann existieren die partiellen Ableitungen  xk (a) für alle k ∈ {1, . . . , n} und alle
i ∈ {1, . . . , m}. Ferner gilt
m
 fi
D f (a) ek =  (a) wi (k = 1, . . . , n)

i=1 xk
oder, geschrieben als Matrix bezüglich der kanonischen Basen,

⎛ f  f1
⎞
 x1 (a) · · ·  xn (a)
1
⎜ . .. ⎟
D f (a) = ⎜
⎝ .. . ⎠.
⎟
 fm  fm
 x (a) · · ·  xn (a)
1
Beweis. Für festes k ∈ {1, . . ., n} gilt, da f in a differenzierbar ist,
R(tek )
f (a + tek ) − f (a) = D f (a)(tek ) + R(tek ) , wobei lim =0.
t→0 t
Damit erhalten wir
m
f (a + tek ) − f (a) fi (a + tek ) − fi (a)
D f (a) ek = lim
t→0 t
= lim
t→0
 t
wi .
i=1
Aus der Konvergenz in IRm folgt komponentenweise Konvergenz, also hat jeder
Quotient in der Summe einen Grenzwert für t → 0. Folglich existieren die partiellen
Ableitungen  xfi (a) für i = 1, . . . , m.

k
Die (m × n)-Matrix
 fi
D f (a) = (a)
 xk i,k
heißt Jacobimatrix oder Funktionalmatrix von f in a. Um sie zu bestimmen,

braucht man nur die partiellen Ableitungen von f in a zu berechnen.
14.2 Richtungsableitungen und Niveaumengen
Seien U ⊆ IRn offen,  : ] ,  [ → U eine differenzierbare Kurve und f : U → IR

differenzierbar. Wir betrachten g : ] ,  [ → IR, g(t) := f ( (t)). Laut Kettenregel
(Satz 14.3) ist g differenzierbar und es gilt
Dg(t) = D f ( (t)) D (t) ,
wobei Dg(t) ∈ L (IR, IR), D f ( (t)) ∈ L (IRn , IR) und D (t) ∈ L (IR, IRn ) sind.
Nach Wahl der kanonischen Basis im IRn bekommt man

f f
D f ( (t)) = grad f ( (t)) = ( (t)), . . . , ( (t)) sowie
 x1  xn

D (t) = 1 (t), . . . , n (t) =  (t)
n
f 6 7
und damit dann g (t) = Dg(t) =  ( (t)) i (t) = grad f ( (t)) ,  (t) .
i=1  xi
Als spezielle Kurve betrachten wir noch den Fall  : IR → IRn ,  (t) = a + tu, mit
a, u ∈ IRn , u2 = 1; d.h.  beschreibt eine Gerade durch a in Richtung u.
Offensichtlich ist  (t) = u für alle t ∈ IR und insbesondere
6 7
Dg(0) = grad f (a) , u . (14.2)
14.2 Richtungsableitungen und Niveaumengen 197
Berechnet man g (0) = Dg(0) direkt als Differentialquotient, so gilt andererseits
g(t) − g(0) f (a + tu) − f (a)

Dg(0) = lim = lim .
t→0 t t→0 t
Letzteren Grenzwert nennt man die Richtungsableitung von f in Richtung u im
Punkt a. Man schreibt
f (a + tu) − f (a)
Du f (a) := lim .
t→0 t
Die Richtungsableitungen in Richtung der kanonischen Basisvektoren sind dann
nichts anderes als die partiellen Ableitungen Dek f (a) = xf (a).
k
Die folgenden Beispiele zeigen, dass alleine aus der Existenz der partiellen Ablei-
tungen jedoch nicht notwendigerweise die Differenzierbarkeit folgt.
(1) Sei f : IR2 → IR,

0 für (x, y) = (0, 0) ,
f (x, y) := xy
x2 +y2
für (x, y) = (0, 0) .
Da f längs der beiden Koordinatenachsen konstant ist, existieren im Null-

punkt die partiellen Ableitungen  xf (0, 0) = 0 und  yf (0, 0) = 0.
Wir betrachten nun die Einschränkung von f auf eine andere Gerade, gege-
ben etwa durch u = (cos  , sin  ) mit  = k2 , k ∈ ZZ. Es gilt
t 2 cos  sin 
t 2 cos2  +t 2 sin2 
= cos  sin  = 0 für t = 0 ,
f (tu) =
0 für t = 0 .
Die Abbildung t → f (tu) ist nicht stetig an der Stelle t = 0 und daher auch
nicht differenzierbar, also existieren die Richtungsableitungen von f in Rich-
tung u nicht. Weiter ist f im Nullpunkt nicht einmal stetig und daher auch
nicht (total) differenzierbar.
(2) Sei g : IR2 → IR,

0 für (x, y) = (0, 0) ,
g(x, y) := xy2
x2 +y2
für (x, y) = (0, 0) .
Mit u = (cos  , sin  ) gilt
g(0 + tu) − g(0) 1 t 3 cos  sin2 

= = cos  sin2  für alle t = 0 ,
t t t 2 cos2  + t 2 sin2 
also existieren die Richtungsableitungen Du g(0, 0) = cos  sin2  . Dies bein-

haltet insbesondere die partiellen Ableitungen.
Angenommen, g ist im Nullpunkt differenzierbar. Dann wäre

g g
gradg(0, 0) = (0, 0) , (0, 0) = (0, 0)
x y
8 9
und nach (14.2) weiter Du g(0, 0) = grad g(0, 0) , u = 0 für alle u ∈ IR2 mit
u2 = 1 im Widerspruch zur vorangegangenen Rechnung.
Bemerkung: In (14.2) wird Dg(0) maximal genau dann, wenn u ein positives Viel-
faches von grad f (a) ist (außer im Fall grad f (a) = 0). Mit anderen Worten, die
Richtungsableitung wird maximal, wenn man in Richtung des Gradienten schaut“.
”
Eine weitere geometrische Deutung des Gradienten erhält man durch Betrach-
tung der Niveaumenge N(a) von f in a ∈ U,
N(a) := {x ∈ U : f (x) = f (a)} .
Sei  : ] ,  [ → N(a) eine differenzierbare Kurve. Da die Komposition g(t) :=

f ( (t)) = f (a) konstant ist, gilt
6 7
0 = g (t) = grad f ( (t)) ,  (t) .
Ist nun  (t0 ) = a für ein t0 ∈ ] ,  [, so gilt grad f (a) ,  (t0 ) = 0. Anschaulich
kann man sagen, dass der Gradient von f im Punkt a senkrecht auf allen in der
Niveaumenge N(a) verlaufenden Kurven ( Höhenlinien“) steht.
”
Oft schreibt man die Niveaumengen auch in der Form Nc = {x ∈ U : f (x) = c},
wobei sinngemäß Nc = ∅ gilt, falls c nicht im Bild der Funktion f liegt.
Beispiele:
1 1
(1) Wir betrachten f : IR2 \ {(0, 0)} → IR, f (x, y) := = .
2
x +y 2 (x, y)2
Da f nur positive Werte annimmt, gibt es keine Niveaumengen Nc zu c ≤ 0.
Die Niveaumengen von f sind genau die Kreise um den Nullpunkt in IR2 ,
denn es gilt f (x, y) = c ⇐⇒ (x, y)2 = 1c für c > 0. Wir berechnen
f 1 3 x
(x, y) = − (x2 + y2 )− 2 (2x) = − und
x 2 (x, y)32
f 1 3 y
(x, y) = − (x2 + y2 )− 2 (2y) = −
y 2 (x, y)32
1
und erhalten grad f (x, y) = (−x, −y).
(x, y)32
Der Gradient zeigt also zum Nullpunkt hin“; je näher wir uns beim Null-
”
punkt befinden, um so größer ist er.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen 199
(2) Sei f : IR2 → IR, f (x, y) := xy.

Wir setzen f (x, y) = xy = c. Für c = 0 erhalten wir x = 0 oder y = 0, d.h. die
beiden Koordinatenachsen bilden die Niveaumenge N0 von f .
Für c = 0 ist insbesondere x = 0 und weiter gilt xy = c ⇐⇒ y = cx ; die
Niveaumenge Nc besteht aus zwei Hyperbelästen.
Hier ist grad f (x, y) = (y, x) und damit insbesondere grad f (0, 0) = (0, 0).
(3) Nun sei f : IR2 → IR, f (x, y) := x2 + 4y2.
Es gibt hier keine Niveaumengen Nc für negatives c und die Niveaumenge
N0 = {(0, 0)} besteht nur aus einem einzigen Punkt.
Für c > 0 setzen wir f (x, y) = x2 + 4y2 = c2 . Damit ist
1 2
y=± c − x2
2
und wir erhalten als Niveaumenge eine Ellipse mit Radien c (in x-Richtung)
und 12 c (in y-Richtung).
Es ist grad f (x, y) = (2x, 8y); auch in diesem Beispiel verschwindet grad f im
Nullpunkt.
y
y
x x
Die Abbildungen zeigen Niveaumengen und Gradienten der Funk-

tionen aus den Beispielen (2) und (3).
In beiden Fällen verschwindet der Gradient im Nullpunkt. Während
sich im linken Bild dort zwei Höhenlinien schneiden“, besteht die
”
Niveaumenge N0 im rechten Bild nur aus einem einzigen Punkt.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen
Wir wollen uns überlegen, unter welchen Bedingungen an die partiellen Ableitun-
gen die Differenzierbarkeit folgt.
Zunächst zeigen wir eine Folgerung des Mittelwertsatzes (Satz 7.10) für Funk-
tionen mit Werten in IRn .
Lemma 14.5. Sei g : [a, b] → IRm stetig und in ]a, b[ differenzierbar.

Dann existiert ein x ∈ ]a, b[ mit g(b) − g(a)2 ≤ g (x)2 (b − a).
Beweis. Wir setzen z := g(b) − g(a) und betrachten  : [a, b] → IR,  (t) := z, g(t).
Die Funktion  ist stetig auf [a, b] und differenzierbar auf ]a, b[. Laut dem Mittel-
wertsatz existiert ein x ∈ ]a, b[ mit
 (b) −  (a) =  (x) (b − a) = z, g (x) (b − a) .
Andererseits gilt  (b)−  (a) = z, g(b)−z, g(a) = z, z = z22 . Mit der Cauchy-
Schwarz-Ungleichung im IRm erhalten wir
z22 = z, g (x) (b − a) ≤ z2 g (x)2 (b − a) ,
also g(b) − g(a)2 = z2 ≤ g (x)2 (b − a).

Ein weiteres Lemma liefert nun eine analoge Aussage zum Schrankensatz (Korol-
lar 13.14). Dazu benötigen wir den folgenden Begriff. Eine Menge U ⊆ IRn heißt
konvex, falls für beliebige a, b ∈ U stets auch ta + (1 − t)b ∈ U ∀t ∈ [0, 1] gilt.
Anschaulich bedeutet dies, dass zu je zwei Punkten in U auch deren Verbindungs-
strecke ganz in U enthalten ist.
Lemma 14.6. Seien U ⊆ IRn offen und konvex sowie f : U → IRm differenzierbar.
Falls M ≥ 0 existiert mit D f (x) ≤ M für alle x ∈ U, so gilt
f (b) − f (a)2 ≤ M b − a2 für alle a, b ∈ U .
Beweis. Zu a, b ∈ U bezeichne I := {t ∈ IR : ta + (1 − t)b ∈ U}. Wir betrachten

 : I → U,  (t) := ta + (1 − t)b, und schließlich g : I → IRm , g(t) := f ( (t)).
Mit der Kettenregel folgt g (t) = Dg(t) = D f ( (t))  (t) = D f ( (t)) (a − b) und
damit insbesondere
g (t)2 ≤ D f ( (t)) b − a2 ≤ M b − a2 für alle t ∈ [0, 1] .
Laut Lemma 14.5 existiert nun ein x ∈ ]0, 1[ derart, dass
f (b) − f (a)2 = g(0) − g(1)2 ≤ g (x)2 ≤ M b − a2
gilt.

Bemerkung: Lemma 14.6 kann ohne große Schwierigkeiten auch für beliebige
endlich-dimensionale normierte IR-Vektorräume formuliert werden.
Wir notieren noch eine unmittelbare Folgerung.
Korollar 14.7. Seien U ⊆ IRn offen und konvex sowie f : U → IRm differenzierbar.
Wenn D f (a) = 0 für alle a ∈ U gilt, dann ist f konstant.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen 201
Im Fall reellwertiger Funktionen, also m = 1, können wir ein analoges Resultat zu

Satz 7.7 bezüglich lokaler Extrema herleiten.
Satz 14.8. Seien U ⊆ IRn offen und f : U → IR differenzierbar.

Falls f an der Stelle a ∈ U ein lokales Extremum besitzt, so gilt Du f (a) = 0 für
alle Richtungsableitungen (u ∈ IRn , u = 1). Insbesondere ist grad f (a) = 0.
Beweis. Sei u ∈ IRn , u = 1. Wir wählen ein Intervall I derart, dass a + tu ∈ U gilt
für t ∈ I. Da
f (a + tu) − f (a)
lim = Du f (a)
t→0 t
existiert, ist die Funktion g : I → IR, g(t) := f (a + tu), an der Stelle t = 0 differen-
zierbar mit g (0) = Du f (a). Nach Voraussetzung besitzt g im Nullpunkt ein lokales
Extremum und die Behauptung folgt mit Satz 7.7.

Die Umkehrung von Satz 14.8 gilt nicht, wie folgendes Beispiel zeigt.
Beispiel: Wir betrachten f : IR2 → IR, f (x, y) := sin(xy).

Die Funktion t → sin(t) besitzt Maxima genau an den Stellen t = (4k + 1) 2 und
Minima genau bei t = (4k + 3) 2 , k ∈ ZZ. Damit können wir auch die Maxima und
Minima von f angeben. Die Funktion f ist konstant auf den Mengen
At := {(x, y) ∈ IR2 : xy = t} .
Maxima sind A(4k+1)  ; Minima sind A(4k+3)  , k ∈ ZZ.

2 2
Wir berechnen grad f . Es gilt

grad f (x, y) = y cos(xy), x cos(xy) .
Man sieht, dass grad f (x, y) = 0 gilt für (x, y) ∈ A(2k+1)  , k ∈ ZZ, also an den Extre-
2
malstellen.
Doch es gibt noch einen weiteren Punkt, an welchem der Gradient verschwin-
det: Es ist grad f (0, 0) = 0. Am Nullpunkt besitzt f jedoch kein lokales Extremum;
in jeder Umgebung gibt es Punkte mit positivem und auch welche mit negativem
Funktionswert.
Definition 14.9. Sei U ⊆ IRn offen.

Eine differenzierbare Funktion f : U → IRm heißt stetig differenzierbar, wenn
a → D f (a) eine stetige Abbildung U → L (IRn , IRm ) ist, also wenn folgendes gilt:
Zu beliebigen a ∈ U und  > 0 gibt es  > 0 derart, dass
D f (b) − D f (a) <  für alle b ∈ U mit b − a < 
ist (wobei links die Operator-Norm in L (IRn , IRm ) zu betrachten ist).

Den Raum aller stetig differenzierbaren Funktionen f : U → IRm bezeichnen wir
mit C1 (U, IRm ). Im Fall m = 1 schreiben wir kurz C1 (U), vgl. Definition 7.5.
Satz 14.10. Sei U ⊆ IRn offen.

Eine Funktion f : U → IRm ist stetig differenzierbar genau dann, wenn sämtliche
partielle Ableitungen
 fi
: U → IR , i = 1, . . . , m , k = 1, . . . , n ,
 xk
existieren und stetig sind.
Beweis. Sei f ∈ C1 (U, IRm ). Wir wissen aus Satz 14.4, dass alle partiellen Ablei-
tungen existieren und dass
 fi
(a) = D f (a) ek , wi
 xk
mit den kanonischen Basen {w1 , . . . , wn } von IRn sowie {e1 , . . . , em } von IRm gilt
(i = 1, . . . , n; k = 1, . . . , m). Mit der Cauchy-Schwarz-Ungleichung erhalten wir

 fi  fi

(a) − (b)
= |D f (a) ek , wi − D f (b) ek , wi |

x  xk
k
≤ (D f (a) − D f (b)) ek 2 ≤ D f (a) − D f (b) ,
wobei wir ek 2 = 1 = wi 2 benutzt haben.

 fi
Somit sind die Funktionen  xk : U → IR stetig.
Für die Umkehrung können wir uns auf den Fall m = 1 beschränken, denn wir haben
zu zeigen, dass
f (a + h) − f (a) − J f (a) h
lim =0
h→0 h
gilt, wobei J f (a) die Jacobi-Matrix ist. Daher reicht es, jede Komponenten-Funktion
fi : U → IR zu untersuchen.
Zu a ∈ U und  > 0 wählen wir r > 0 mit

f f

Ur (a) ⊆ U

und
 x (x) −  x (a)
< n
k k
für alle x ∈ Ur (a) und k ∈ {1, . . . , n}. Sei nun h = (h1 , . . . , hn ) ∈ IRn mit h2 < r.
Setzt man v0 := 0 und vk := (h1 , . . . , hk , 0, . . . , 0) für k = 1, . . . , n, so gilt
n
f (a + h) − f (a) =  ( f (a + vk ) − f (a + vk−1) ) .
k=1
Wegen vk 2 < r gilt a + vk ∈ Ur (a) für alle k. Da Ur (a) konvex ist, sind die Ver-
bindungsstrecken zwischen a + vk−1 und a + vk ganz in Ur (a) enthalten. Ferner
ist a + vk = a + vk−1 + hk ek . Laut dem Mittelwertsatz, angewendet auf die stetig
differenzierbare Funktion k : [0, 1] → IR, k (t) := f (a + vk−1 + t hk ek ), existiert
k ∈ ]0, 1[ mit
14.4 Ableitungen höherer Ordnung 203
f
f (a + vk ) − f (a + vk−1) = hk (a + vk−1 + k hk ek ) .
 xk
Weiter gilt

f f


h k

 x (a + vk−1 + k hk ek ) − hk  x (a)
≤ |hk | n
k k
und wir erhalten

n
f

f (a + h) − f (a) −  (a) hk

k=1  x k

n n
f
=
 ( f (a + vk ) − f (a + vk−1) ) −  (a) hk

k=1 k=1  x k

n f f n


=
 (a + vk−1 − k hk ek ) − (a) hk
≤  |hk | ≤  h2

k=1  xk  xk
n k=1
für alle h ∈ IRn mit h2 < r. Daher ist f in a differenzierbar und D f (a) = grad f (a).
Da nach Voraussetzung jede Komponente von grad f stetig in a ist, folgt schließ-
lich die Stetigkeit von a → D f (a) = grad f (a).

Bemerkung: Zusammenfassend wollen wir folgende Implikationen festhalten.

 fi
(1) U ⊆ IRn , f : U → IRm differenzierbar =⇒ existieren.
 xk
Die Umkehrung gilt jedoch nicht, wie wir schon an Hand von Beispielen in
Kapitel 14.2 gesehen haben.
 fi
(2) U ⊆ IRn , f : U → IRm stetig differenzierbar⇐⇒ existieren und sind stetig.
 xk
14.4 Ableitungen höherer Ordnung
Seien V und W endlich-dimensionale normierte IR-Vektorräume, U ⊆ V offen sowie

f : U → W eine differenzierbare Funktion. Ist die Ableitung D f : U → L (V,W )
wieder differenzierbar, so bezeichnet man
D(D f ) : U → L (V, L (V,W ) )
als zweite Ableitung. Falls existent können wir sukzessive höhere Ableitungen bil-
den. Dabei wächst die Dimension des Wertebereiches jeweils an. Beispielsweise ist
dim(L (V,W ) ) = dim(V ) dim(W ).
Wenn wir stetige Differenzierbarkeit ins Auge fassen, können wir wieder auf
skalarwertige Funktionen, nämlich die partiellen Ableitungen, zurückgreifen. Wir
betrachten deshalb eine Funktion f : U → IR mit U ⊆ IRn offen. Allerdings treffen

wir auf
2 f  f
D j (Di f ) = =
 x j  xi  x j  xi
einerseits und
2 f  f
Di (D j f ) = =
 xi  x j  xi xj
andererseits (falls diese Ableitungen existieren).
Beispiel: Sei f : IR2 → IR,

⎧ 2 2
⎨ xy x − y
⎪
für (x, y) = (0, 0) ,
f (x, y) := x2 + y2
⎪
⎩
0 für (x, y) = (0, 0) .
Die partiellen Ableitungen an einer Stelle (x, y) = (0, 0) können wir mit Produkt-
und Quotientenregel direkt bestimmen. Wir erhalten
x2 − y2 2x(x2 + y2 ) − 2x(x2 − y2) y(x2 − y2) 4x2 y3

D1 f (x, y) = y + xy = +
x2 + y2 (x2 + y2 )2 x2 + y2 (x2 + y2 )2
x(x2 − y2 ) 4x3 y2
und D2 f (x, y) = 2 2
− 2 .
x +y (x + y2 )2
Auch im Nullpunkt ist f partiell differenzierbar, denn die Grenzwerte
f (t, 0) − f (0, 0) f (0,t) − f (0, 0)

lim =0 und lim =0,
t→0 t t→0 t
existieren; also gilt D1 f (0, 0) = 0 sowie D2 f (0, 0) = 0.
Wir wollen nun noch sehen, dass auch die zweiten Ableitungen D1 (D2 f )(0, 0)
und D2 (D1 f )(0, 0) existieren, aber nicht den selben Wert haben.
Wegen
D2 f (t, 0) − D2 f (0, 0) t −0
lim = lim =1
t→0 t t→0 t
D1 f (0,t) − D1 f (0, 0) −t − 0
und lim = lim = −1
t→0 t t→0 t
haben wir hier D1 (D2 f )(0, 0) = 1 = −1 = D2 (D1 f )(0, 0).
Das folgende Resultat zeigt, unter welchen Umständen die Reihenfolge der Dif-
ferentiation vertauscht werden darf.
Satz 14.11 (Schwarz). Seien U ⊆ IRn offen und f : U → IR eine Funktion, deren
zweite Ableitungen D j (Di f ) existieren und in x ∈ U stetig sind (i, j = 1, . . . , n).
Dann gilt D j (Di f )(x) = Di (D j f )(x).
Beweis. Man kann sich auf n = 2 einschränken. Seien x = (x1 , x2 ) und a = (a1 , a2 )
mit a1 = 0, a2 = 0. Wir betrachten
g(t) := f (t, x2 + a2) − f (t, x2 ) und h(t) := f (x1 + a1 ,t) − f (x1 ,t)
(für diejenigen t ∈ IR, sodass g und h definiert sind).

Aus dem Mittelwertsatz (Satz 7.10) erhalten wir 1 ∈ ]0, 1[ mit
f (x1 + a1 , x2 + a2 ) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 , x2 )

= g(x1 + a1) − g(x1 ) = a1 g (x1 + 1 a1 )
= a1 (D1 f (x1 + 1 a1 , x2 + a2) − D1 f (x1 + 1 a1 , x2 ) ) (14.3)
und analog 2 ∈ ]0, 1[ mit
f (x1 + a1 , x2 + a2 ) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 , x2 )

= a2 (D2 f (x1 + a1, x2 + 2 a2 ) − D2 f (x1 , x2 + 2 a2 ) ) . (14.4)
Nochmalige Anwendung des Mittelwertsatzes auf (14.3) bzgl. der zweiten Veränder-
lichen liefert 3 ∈ ]0, 1[ mit
1
( f (x1 + a1, x2 + a2) − f (x1 , x2 + a2 ) − f (x1 + a1 , x2 ) + f (x1 , x2 ) )
a1 a2
= D2 D1 f (x1 + 1 a1 , x2 + 3 a2 ) .
Ebenso erhalten wir aus (14.4), wenn wir den Mittelwertsatz auf die erste Variable
anwenden, 4 ∈ ]0, 1[ mit
1
( f (x1 + a1, x2 + a2) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 x2 ) )
a1 a2
= D1 D2 f (x1 + 4 a1 , x2 + 2 a2 ) .
Mit a1 → 0, a2 → 0 sowie der Stetigkeit von D1 D2 f und D2 D1 f folgt schließlich

die Behauptung.

Seien V,W endlich-dimensionale normierte IR-Vektorräume und U ⊆ V offen. Wir

nennen eine Funktion f : U → W zwei Mal stetig differenzierbar, wenn sämt-
liche zweite partielle Ableitungen aller Komponentenfunktionen von f existieren
und stetig sind.
Den Raum der zwei Mal stetig differenzierbaren Funktionen f : U → W bezeich-
nen wir mit C2 (U,W ). Wieder schreiben wir kurz C2 (U), falls W = IR ist. Entspre-
chend definiert man ggf. auch Ck (U,W ) für k > 2.
Wir sind nun in der Lage, Taylorpolynome (vgl. Kapitel 10.1) für f ∈ Ck (U) zu
erklären. Wir wollen uns hier auf den Fall k = 2 beschränken.
Satz 14.12 (Taylorentwicklung in IRn ). Seien U eine offene, konvexe Menge im IRn
und f : U → IR zwei Mal stetig differenzierbar.
Dann gilt
1 n
2 i,
f (x) = f (a) + grad f (a) , x − a + Di D j f (a) (xi − ai )(x j − a j ) + R2 (x − a) ,
j=1
2 (x−a)
für a, x ∈ U, wobei das Restglied R2 der Bedingung lim Rx−a 2 = 0 genügt.
x→a
Beweis. Wegen der Stetigkeit der zweiten partiellen Ableitungen im Punkt a gibt es
zu jedem  > 0 und 1 ≤ i, j ≤ n ein  > 0 derart, dass

|Di D j f (a + h) − DiD j f (a)| ≤ für h ≤  (14.5)
n2
gilt. Nun betrachten wir bei festem x ∈ U die Hilfsfunktion F : [0, 1] → IR,
F(t) := f (a + (x − a)t) .
Sie ist zweimal stetig differenzierbar. Deshalb gibt es laut dem Satz von Taylor
(Satz 10.1) ein  ∈ ]0, 1[ mit
1 1
F(1) = F(0) + F (0) + F (0) + (F ( ) − F (0) ) .
2 2
Dabei ist F(1) = f (x), F(0) = f (a) und
n
F (t) = grad f (a + (x − a)t) , x − a =  D j f (a + (x − a)t) (x j − a j ) ,
j=1
n
siehe Formel (14.2), sowie F (t) =  Di D j f (a + (x − a)t) (xi − ai )(x j − a j ).
i, j=1
Folglich gilt
1 n
2 i,
f (x) = f (a) + grad f (a) , x − a + Di D j f (a) (xi − ai )(x j − a j ) + R2 (x − a)
j=1
1 n
2 i,
mit R2 (x − a) = (Di D j f (a + (x − a) ) − DiD j f (a) ) (xi − ai )(x j − a j ).
j=1
Für x − a ≤  liefert (14.5) die Abschätzung
1  2
|R2 (x − a)| ≤ n x − a2 <  x − a2 ,
2 n2
woraus die behauptete Bedingung folgt.

Hat man eine Abbildung f : U → IR, für die alle zweiten partiellen Ableitungen in
x ∈ U existieren (U ⊆ IRn ), so kann man diese in Matrixform angeben. Die Matrix
⎛ ⎞
D1 D1 f (x) · · · D1 Dn f (x)
⎜ .. .. ⎟
H f (x) = ⎝ . . ⎠
Dn D1 f (x) · · · Dn Dn f (x)
heißt Hessematrix von f im Punkt x. Der Satz von Schwarz (Satz 14.11) besagt
also, dass H f (x) symmetrisch ist, falls die zweiten partiellen Ableitungen von f im
Punkt x stetig sind.
Definition 14.13. Eine reelle symmetrische (n × n)-Matrix A heißt positiv defi-
nit, falls Ah, h > 0 für alle h ∈ IRn \ {0} gilt. Sie heißt positiv semidefinit, falls
Ah, h ≥ 0 für alle h ∈ IRn \ {0} gilt.
Die Matrix A heißt negativ (semi-)definit, falls Ah, h < 0 (bzw. Ah, h ≤ 0)
für alle h ∈ IRn \ {0} gilt.
Falls Vektoren h+ , h− ∈ IRn existieren mit Ah+ , h+ > 0 und Ah− , h− < 0, so
heißt A indefinit.
Aus der Linearen Algebra wissen wir, dass zu jeder reellen symmetrischen
(n × n)-Matrix eine Orthonormalbasis des IRn aus Eigenvektoren von A existiert.
Daraus ergibt sich folgendes: A ist positiv definit (bzw. positiv semidefinit) genau
dann, wenn alle ihre Eigenwerte positiv (bzw. ≥ 0) sind. A ist genau dann nega-
tiv definit (bzw. negativ semidefinit), wenn alle ihre Eigenwerte negativ (bzw. ≤ 0)
sind. Dagegen ist die Matrix indefinit genau dann, wenn sie Eigenwerte beiderlei
Vorzeichens besitzt.
ab
Im Fall reeller symmetrischer (2 × 2)-Matrizen A = gilt speziell:
bc
A indefinit ⇐⇒ det A = ac − b2 < 0 ,

A positiv definit ⇐⇒ det A > 0 und a > 0 ,
A negativ definit ⇐⇒ det A > 0 und a < 0 ,
A semidefinit, aber nicht definit ⇐⇒ det A = 0 .
Für den Beweis sei auf Lehrbücher zur Linearen Algebra verwiesen, z.B. [5].
Ist f : U → IR eine differenzierbare Funktion (U ⊆ IRn ), so bezeichnet man a ∈ U

als stationären oder kritischen Punkt, wenn grad f (a) = 0 gilt.
Satz 14.8 besagt, dass Extremalstellen notwendigerweise kritische Punkte sind.
Das Beispiel direkt im Anschluss an Satz 14.8 zeigt weiter, dass nicht jeder kritische
Punkt ein Extremum zu sein braucht, vgl. auch Aufgabe 3.
Der nachfolgende Satz liefert für zwei Mal stetig differenzierbare Funktionen
eine Charakterisierung gewisser kritischer Punkte mit Hilfe der Hessematrix.
In diesem Zusammenhang bezeichnen wir a ∈ U als ein isoliertes lokales Extre-
mum von f , wenn a ein lokales Extremum ist und ein  > 0 existiert derart, dass
U (a) kein weiteres lokales Extremum enthält.
Satz 14.14. Seien U ⊆ IRn offen und f : U → IR zwei Mal stetig differenzierbar.
Weiter seien a ∈ U ein kritischer Punkt von f und H f (a) die Hessematrix von f im
Punkt a. Es gilt:
(1) Ist H f (a) indefinit, so ist a kein lokales Extremum von f .
(2) Ist H f (a) positiv definit, so ist a ein isoliertes lokales Minimum von f .
(3) Ist H f (a) negativ definit, so ist a ein isoliertes lokales Maximum von f .
Beweis. Mit grad f (a) = 0 vereinfacht sich die Taylorformel (Satz 14.12) zu
1
f (a + h) − (a) = H f (a) h , h + R2(h)
2
R2 (h)
für h mit hinreichend kleiner Norm und es gilt lim 2 = 0.
h→0 h
(1) Es gibt zwei Vektoren h+ und h− (mit Norm 1) im IRn sowie Skalare a+ > 0,
a− < 0 mit H f (a) h± , h± = a± . Für alle hinreichend kleinen t ∈ IR \ {0} gilt
deshalb
1
t −2 ( f (a + th±) − f (a) ) = a± + t −2R2 (th± ) ,
2
also nimmt die Differenz f (a + h) − f (a) in jeder Umgebung von a sowohl positive
als auch negative Werte an.
(2),(3) Ist auf der kompakten Sphäre Sn−1 := {h ∈ IRn : h = 1} der Wert
H f (a) h , h von festem Vorzeichen  = 1 oder  = −1, dann finden wir (siehe
Korollar 12.9) ein m > 0 mit
 H f (a) h , h ≥ m , falls h = 1 .
Daraus folgt für alle x ∈ IRn \ {0} von hinreichend kleiner Norm die Abschätzung
 m
 x−2 ( f (a + x) − f (a) ) = H f (a) x−1 x , x−1x +  x−2R2 (x) > .
2 4
Folglich ist a ein isoliertes Minimum oder Maximum von f , je nachdem, ob  = 1
oder  = −1 ist.

Beispiel: Wir suchen alle lokalen Extrema der Funktion f : IR2 → IR,
f (x, y) := 2x3 − 3x2 + 6xy2 + 4y3 .
Mit grad f (x, y) = 6(x2 − x + y2, 2y(x + y) ) gilt
grad f (x, y) = (0, 0) ⇐⇒ (y = 0 und x ∈ {0, 1}) oder

(y = −x und x(2x − 1) = 0) .

Es gibt also drei kritische Punkte a1 = (0, 0), a2 = (1, 0) und a3 = 12 , − 12 .
14.5 Aufgaben 209

12x − 6 12y
Nun bestimmen wir die Hessematrix. Wir haben H f (x, y) =
12y 12x + 24y
und damit

−6 0 6 0 0 −6
H f (a1 ) = , H f (a2 ) = , H f (a3 ) = .
0 0 0 12 −6 −6
Da H f (a2 ) positiv definit ist, handelt es sich bei a2 um ein lokales Minimum. Weiter
ist H f (a3 ) indefinit, folglich ist a3 kein Extremum. Schließlich ist H f (a1 ) negativ
semidefinit. In diesem Fall liefert Satz 14.14 keine Aussage. Wir müssen auf ande-
rem Wege feststellen, ob es sich hier um ein Extremum handelt. In der Tat nimmt
f wegen f (0, y) = 4y3 in jeder Umgebung des Nullpunkts sowohl positive als auch
negative Werte an. Demnach liegt hier kein Extremum vor.
14.5 Aufgaben
1. Zeigen Sie, dass die folgenden Funktionen differenzierbar sind und bestimmen
Sie deren Jacobimatrix.
⎛ ⎞
3x2
⎜ sin(3x) ⎟
a. f : IR → IR4 , f (x) := ⎜
⎝ 42 ⎠
⎟
cos(x2 )

4x2 y3
b. g : IR3 → IR2 , g(x, y, z) :=
xyez + exy
c. h : ]0, [ ×IR2 → IR , h(x, y, z) := sin(zx) ln(x + y2 )
2. Bestimmen Sie die kritischen Punkte der Funktionen
f : IR2 → IR , f (x, y) := 2x3 − 3x2 + 2y3 + 3y2 ,

1 3
g : IR2 → IR , g(x, y) := y2 ex + x −x+5,
3
und h : IR2 → IR , h(x, y) := x3 − 3xy2 .
Untersuchen Sie jeweils, ob es sich um ein lokales Maximum, ein lokales Mi-
nimum oder kein lokales Extremum handelt.
3. Gegeben sei die Funktion f : IR2 → IR, f (x, y) := sin(xy).

a. Skizzieren Sie die Niveaumengen von f .
b. Bestimmen Sie die Hessematrix von f und untersuchen Sie diese an den
kritischen Stellen auf Definitheit.
4. Gegeben sei die Funktion

f : IR2 → IR , f (x, y) := x2 + y2 .
Zeigen Sie:
a. Die Funktion f ist in IR2 \{(0, 0)} differenzierbar; bestimmen Sie D f (x, y).
b. Im Nullpunkt existieren keine Richtungsableitungen von f ; somit ist f dort
auch nicht differenzierbar.
5. Bestimmen Sie alle lokalen Extrema der Funktion
f : IR2 → IR , f (x, y) := (x2 − 1) sin y
und untersuchen Sie jeweils, ob ein Maximum oder ein Minimum vorliegt.
6. Zeigen Sie: Es gibt keine differenzierbare Funktion f : IR3 → IR mit
grad f (x, y, z) = (yz, xz, xy2 ) .
Hinweis: Die Annahme, es gäbe eine derartige Funktion, können Sie mit Hilfe
des Satzes von Schwarz (Satz 14.11) zum Widerspruch führen.
7. Seien U ⊆ IRn offen und f ∈ C2 (U). Wir definieren den so genannten Laplace-
Operator  mittels
n
 f (x) :=  Dk Dk f (x) .
k=1
Eine Funktion f mit  f = 0 nennt man eine harmonische Funktion.

a. Zeigen Sie, dass die Funktionen
1
g : IR2 \ (0, 0) → IR , g(x1 , x2 ) := ln(x21 + x22 ) ,
2
x2
und h : ]0, [ ×IR → IR , h(x1 , x2 ) := arctan ,
x1
harmonisch sind.
b. Zeigen Sie: Das Paar g, h erfüllt die Cauchy-Riemannschen Differential-
gleichungen
g h g h
= und =− .
x y y x
c. Bestimmen Sie die Jacobimatrix von

2 g(x1 , x2 )
F : ]0, [ ×IR → IR , F(x1 , x2 ) := .
h(x1 , x2 )
14.5 Aufgaben 211
8. Seien g : ]0, [ → IR zwei Mal stetig differenzierbar und f : IRn \ {0} → IR,
f (x) := g(x2 ). Zeigen Sie
n−1
 f (x) = g (x2 ) + g (x2 ) ;
x2
dabei bezeichnet  den Laplace-Operator, siehe Aufgabe 7.

n
9. Seien n ∈ IN, a0 , . . . , an ∈ C, an = 0, und p : C → C, p(z) :=  ak zk .
k=0
Fassen Sie p als Funktion IR2 → IR2 auf: Setzen Sie u(x, y) := Re (p(x + iy) ),
v(x, y) := Im (p(x + iy) ) und

2 2 u(x, y)
f : IR → IR , f (x, y) := .
v(x, y)
Zeigen Sie, dass f die Cauchy-Riemannschen Differentialgleichungen
   
u(x, y) = v(x, y) und u(x, y) = − v(x, y)
x y y x
erfüllt.
Hinweis: Zeigen Sie zunächst mittels vollständiger Induktion, dass die Behaup-
tung für pn (z) := zn , n ∈ IN0 , gilt. Wenn Sie un , vn sinngemäß definieren, dann
gilt un+1 = x un − y vn und vn+1 = y un + x vn .
Kapitel 15
Umkehrsatz und implizite Funktionen
In diesem Kapitel werden wir uns unter anderem mit der Frage nach Existenz und
Differenzierbarkeit der Umkehrfunktion f −1 zu einer gegebenen differenzierbaren
Funktion f in normierten Vektorräumen auseinandersetzen. An die Stelle der Be-
dingung f (x) = 0 im eindimensionalen Fall (vgl. Satz 7.17) tritt hier die Invertier-
barkeit von D f (x).
Die Invertierbarkeit von linearen Abbildungen spielt in diesem Zusammenhang
also eine wichtige Rolle. Ist V ein normierter IR-Vektorraum, so ist auch L (V ) mit
der Operatornorm ein normierter Raum, wie wir aus Satz 13.3 wissen. Viele der fol-
genden Resultate bleiben auch für unendlich-dimensionale Banachräume gültig; für
unsere Zwecke reicht es aus, V als endlich-dimensional vorauszusetzen. Dann ist
auch L (V ) endlich-dimensional und nach Satz 13.7 vollständig, also ein Banach-
raum.
Lineare Abbildungen in unendlich-dimensionalen Räumen spielen in der Funk-
tionalanalysis eine zentrale Rolle. Zu diesem Gebiet existiert eine große Menge an
weiterführender Literatur, wie z.B. von H.W. Alt [1] oder D. Werner [22].
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen
Satz 15.1. Sei V ein endlich-dimensionaler normierter Raum.

(a) Ist A ∈ L (V ) mit A − idV < 1, so ist A invertierbar in L (V ) und es gilt

A−1 =  (idV − A)n
n=0
(Konvergenz der Reihe in L (V ), wobei B0 := idV für B ∈ L (V ) sei).

(b) Die Menge G := {A ∈ L (V ) : A invertierbar} ist offen und A → A−1 ist eine
stetige Abbildung G → G.

214 15 Umkehrsatz und implizite Funktionen
Beweis. (a) Auf Grund der Submultiplikativität der Operatornorm, siehe Bemer-
kung (2) in Kapitel 13.1, gilt (A − idV )n ≤ A − idV n für alle n. Die Konvergenz
der Reihe in L (V ) folgt mit Hilfe von Satz 5.1 wegen A − idV < 1 (Geometrische
Reihe).
m
Für m ∈ IN bezeichne Sm :=  (idV − A)n . Wir erhalten
n=0
m m+1
ASm = Sm A = Sm (idV − (idV − A) ) =  (idV − A)n −  (idV − A)n
n=0 n=1
m+1
= idV − (idV − A) .
Mit m →  gilt (idV − A)m+1 → 0 und damit folgt schließlich die Behauptung.
1
(b) Für beliebiges A0 ∈ G und alle A ∈ L (V ) mit A − A0 < gilt
A−1
0
idV − A−1 −1 −1
0 A = A0 (A0 − A) ≤ A0 A0 − A < 1
und daher A−1

0 A ∈ G.
  n
Es folgt (A−1
0 A)
−1 =
 (id − A−1 n −1
0 A) =  A0 (A0 − A) und damit
n=0 n=0

 −1 n
A −1
=  A0 (A0 − A) A−1 0 .
n=0
Insbesondere ist A invertierbar.

Damit ist gezeigt, dass G offen ist.

 n
Aus A − A0 =  A0 (A0 − A)
−1 −1 −1
A−1
0 erhalten wir weiter
n=1

 −1 n A−1
0 A0 − A
A −1
− A−1
0 ≤  A0 A0 − A A−1 −1
0 = A0
1 − A−1
.
n=1 0 A0 − A
Zu  > 0 können wir also ein  > 0 finden derart, dass aus A0 − A <  stets
A−1 − A−1
0 <  folgt. Daher ist die Inversenbildung stetig.

Den eben bewiesenen Satz werden wir speziell in Situationen benutzen, wenn die
betrachteten linearen Abbildungen als Ableitung differenzierbarer Funktionen auf-
treten. Wir beginnen mit einem einfachen Beispiel.
Die so genannten Polarkoordinaten im IR2 erhält man durch die Abbildung
 : ]0, [ × ]0, 2 [ → IR2 ,
 (r,  ) := (r cos  , r sin  ) .

cos  −r sin 
Diese ist differenzierbar mit D (r,  ) = .
sin  r cos 
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen 215
Weiter ist D (r,  ) invertierbar als Element von L (IR2 , IR2 ).

Mit (x, y) := (r cos  , r sin  ) gilt

cos  sin  x/r y/r
−1
(D (r,  )) = = , r= x2 + y2 .
1 1
− r sin  r cos  −y/r2 x/r2
Wir erwarten, dass (D (r,  ))−1 die Ableitung der Abbildung  −1 : S → U ist,
wobei S :=  (U) = IR2 \ {(t, 0) : t ≥ 0} die an der positiven x-Achse geschlitzte
Ebene bezeichne,

 −1 (x, y) = (r , sign (y) arccos(x/r) ), r = x2 + y2 .
Falls  −1 differenzierbar ist, braucht man nur die Kettenregel auf  ◦  −1 = idS
oder  −1 ◦  = idU anzuwenden.
Dies war ein Spezialfall folgender allgemeiner Situation.
Definition 15.2. Seien V und W endlich-dimensionale, normierte IR-Vektorräume.

Eine bijektive Abbildung  : U1 → U2 , wobei U1 ⊆ V und U2 ⊆ W offene Mengen
seien, heißt Diffeomorphismus, falls sowohl  als auch  −1 stetig differenzierbar
sind.
Beispiel: Sei f : IRn \ {0} → IRn \ {0},
1
f (x) := x.
x2
Wir bezeichnen die Komponentenfunktionen von f wie üblich mit f j ,

xj
f j (x1 , . . . , xn ) = 2
( j = 1, . . . , n) .
x1 + · · · + x2n
Für i = j gilt
 fj −2xi 2xi x j
(x1 , . . . , xn ) = x j 2 =−
 xi 2
(x1 + · · · + xn )2 x4
und für i = j erhalten wir
 fi (x2 + · · · + x2n ) − 2x2i 1 2x2i

(x1 , . . . , xn ) = 1 2 = − .
 xi (x1 + · · · + x2n )2 x2 x4
Insbesondere existieren alle partiellen Ableitungen und sind stetig; nach Satz 14.10
ist f stetig differenzierbar.
Weiter gilt f (x) = 1/x und damit f ( f (x) ) = x, also existiert die Umkehr-
abbildung f −1 ; hier ist f = f −1 . Diese ist stetig differenzierbar; folglich ist f ein
Diffeomorphismus.
Bemerkungen: Ist  : U1 → U2 ein Diffeomorphismus von U1 ⊆ V auf U2 ⊆ W ,

dann gilt:
(1) dimV = dimW ,
(2) Für jedes a ∈ U1 und b =  (a) ist D −1 (b) = (D (a))−1 .
Dies folgt mit der Kettenregel aus  −1 ◦  = idU1 und  ◦  −1 = idU2 , denn damit
haben wir D −1 (b) D (a) = idV und D (a) D −1 (b) = idW .
Insbesondere ist für einen Diffeomorphismus  : U1 → U2 jede Ableitung D (a)
invertierbar in L (V,W ).
Satz 15.3. Seien V,W endlich-dimensionale, normierte IR-Vektorräume, U1 ⊆ V und

U2 ⊆ W offen sowie  : U1 → U2 eine bijektive Abbildung. Ferner seien  stetig
differenzierbar und  −1 : U2 → U1 stetig.
Wenn die Ableitungen D (a) für jedes a ∈ U1 invertierbar in L (V,W ) sind,
dann ist auch  −1 stetig differenzierbar, d.h.  ist ein Diffeomorphismus.
Beweis. Für den Nachweis der Differenzierbarkeit in b =  (a) dürfen wir a = 0 und
b =  (a) = 0 annehmen, denn sonst betrachte man an Stelle von  die Abbildung
x →  (x + a) −  (a).
Eine weitere Reduktion des Problems erhalten wir durch folgende Überlegung.
Die Abbildung  := (D (0) )−1 ◦  ist stetig differenzierbar, injektiv und  −1
ist stetig. Sie bildet U1 auf eine offene (das Urbild der offenen Menge U1 unter
der stetigen Abbildung  −1 ) Teilmenge von V ab. Mit der Kettenregel erhalten wir
D (0) = idV . Die Ableitungen D (a) sind invertierbar, da nach Voraussetzung alle
D (a) invertierbar sind. Hat man gezeigt, dass  −1 in 0 differenzierbar ist, so ist
auch  −1 in 0 differenzierbar wegen  −1 =  −1 ◦ (D (0) )−1 .
Wir können also annehmen, dass  (0) = 0 und D (0) = idV gilt. Dies bedeutet
R(h)
 (h) − idV h = R(h) , wobei lim =0. (15.1)
h→0 h
Sei k ∈ V . Wir setzen h =  −1 (k) ein und erhalten
 −1 (k) − k = −( (h) − h) = −R( −1 (k)) . (15.2)
Wir zeigen, dass

−R( −1 (k))
lim =0 (15.3)
k→0 k
gilt, was äquivalent zur Differenzierbarkeit von  −1 in 0 mit D −1 (0) = idV ist.
Da  −1 stetig ist, gibt es wegen (15.1) positive Zahlen
" r,−1 mit R(h) ≤ 12 h
"
für h ≤ r und  (k) ≤ r für k <  . Damit gilt R  (k) " ≤ 12  −1 (k)
−1 "
für k <  und mit (15.2) erhalten wir
1
 −1 (k) − k ≤  −1 (k) für k <  .
2
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen 217
Folglich haben wir  −1 (k) ≤ 2k für k <  und deshalb
R( −1 (k)) 2R( −1 (k))

≤ −→ 0
k  −1 (k)
mit k → 0, da hiermit auch h =  −1 (k) → 0 gilt. Daraus folgt (15.3).

Zu zeigen bleibt die stetige Differenzierbarkeit, dass D −1 : U2 → L (W,V ) eine
stetige Abbildung ist.
Wie eben können wir V = W annehmen. Sei b ∈ U2 , b =  (a). Aus der Ketten-
regel erhalten wir D −1 (b) = (D (a) )−1 .
Wir betrachten eine Folge (bn )n∈IN in U2 mit bn → b. Für an :=  −1 (bn ) gilt
dann an → a in U1 und, da  stetig differenzierbar ist, folgt D (an ) → D (a) in
L (V ). Mit der Stetigkeit der Inversenbildung in L (V ), Satz 15.1, folgt schließlich
(D (an ) )−1 → (D (a) )−1 , also D −1 (bn ) → D −1 (b).
Damit ist die Stetigkeit von b → D −1 (b) gezeigt.

Beispiel: Sei f : IR3 → IR3 , ⎛ ⎞
x1 + ex2
f (x) := ⎝ x2 + ex3 ⎠ .
x3 + ex1
Die Jacobimatrix von f lautet

⎛ ⎞
1 ex2 0
D f (x) = ⎝ 0 1 ex2 ⎠ ;
ex1 0 1
ihre Determinante hat den Wert 1 + ex1 ex2 ex3 , ist also stets = 0. Daher ist D f (x) für
alle x ∈ IR3 invertierbar.
Seien x, y ∈ IR3 mit f (x) = f (y). Dann gilt
x1 − y1 = ey2 − ex2 ,
x2 − y2 = ey3 − ex3 ,
x3 − y3 = ey1 − ex1 .
Nehmen wir einmal an, es sei x1 > y1 . Dann folgt aus der dritten Gleichung x3 < y3 ;
daraus folgt mit der zweiten Gleichung nun x2 > y2 und, wenn wir nun die erste
Gleichung heranziehen, folgt x1 < y1 im Widerspruch zur Annahme.
Mit der selben Argumentation, jeweils auch für das umgekehrte Vorzeichen, für
alle drei Komponenten bleibt schließlich nur x1 = y1 , x2 = y2 und auch x3 = y3 .
Folglich ist f injektiv.
Bezeichnet U1 := IR3 und U2 := f (IR3 ), so ist f : U1 → U2 bijektiv. Um nun
mit Satz 15.3 zu folgern, dass f ein Diffeomorphismus ist, ist es nicht nötig, die
Bildmenge U2 oder die Umkehrabbildung f −1 explizit zu bestimmen. Es genügt zu
wissen, dass f −1 stetig und U2 offen ist. Dies ist in der Tat der Fall, wie wir noch
sehen werden, vgl. die Bemerkung im Anschluss an Satz 15.5 und Aufgabe 6.
15.2 Lokale Invertierbarkeit
Zu Beginn dieses Abschnitts notieren wir einen wichtigen Fixpunktsatz. Dieser hat
vielfältige Anwendungen; wir werden ihn benutzen als Hilfsmittel zum Beweis der
Existenz von Umkehrabbildungen.
Seien (M, d) ein metrischer Raum und  : M → M eine Abbildung. Man sagt, 
ist kontrahierend, wenn eine Zahl q < 1 existiert derart, dass
d( (x),  (y) ) ≤ q d(x, y)
für alle x, y ∈ M gilt.
Satz 15.4 (Fixpunktsatz von Banach). Seien (M, d) ein vollständiger metrischer
Raum und  : M → M eine kontrahierende Abbildung.
Dann besitzt  genau einen Fixpunkt, d.h. es existiert genau ein Punkt x∗ ∈ M
mit  (x∗ ) = x∗ .
Beweis. Wir beginnen mit einem beliebigen y0 ∈ M und setzen yn :=  (yn−1 ) für
n ∈ IN. Es gilt d(y1 , y2 ) = d( (y0 ),  (y1 ) ) ≤ q d(y0 , y1 ) = q d(y0 ,  (y0 ) ) und mit
Induktion folgt d(yn , yn+1 ) ≤ qn d(y0 ,  (y0 ) ) für alle n ∈ IN. Für n, k ∈ IN erhalten
wir damit
n+k−1
d(yn , yn+k ) ≤  d(y j , y j+1 ) ≤ (qn + qn+1 + . . . + qn+k−1) d(y0 ,  (y0 ) )
j=n
qn
≤ d(y0 ,  (y0 ) )
1−q
(Abschätzung durch die Geometrische Reihe). Wegen q < 1 folgt daraus weiter, dass
(yn )n∈IN eine Cauchyfolge ist. Da (M, d) vollständig ist, ist diese Folge konvergent,
also existiert x∗ := lim yn . Wir erhalten
n→
x∗ = lim yn = lim yn+1 = lim  (yn ) =  (x∗ ) ,

n→ n→ n→
wobei wir benutzt haben, dass  stetig ist ( ist sogar Lipschitz-stetig).
Demnach ist x∗ ein Fixpunkt.
Zu zeigen bleibt noch die Eindeutigkeit. Seien x∗ , y∗ ∈ M mit  (x∗ ) = x∗ und
 (y∗ ) = y∗ . Dann folgt d(x∗ , y∗ ) = d( (x∗ ),  (y∗ ) ) ≤ q d(x∗ , y∗ ). Wegen q < 1 ist
dies nur möglich, wenn d(x∗ , y∗ ) = 0, also x∗ = y∗ , gilt.

Satz 15.5 (Satz von der lokalen Umkehrbarkeit). Seien V und W endlich-dimen-
sionale normierte IR-Vektorräume, U ⊆ V offen, f : U → W stetig differenzierbar
und D f (a) ∈ L (V,W ) invertierbar für ein a ∈ U. Bezeichne b := f (a).
(a) Es existieren offene Mengen Ua in V und Wb in W mit a ∈ Ua , b ∈ Wb derart,
dass f die Menge Ua bijektiv auf die Menge Wb abbildet.
(b) Ist g : Wb → Ua die inverse Abbildung von f |Ua , so ist g stetig differenzierbar.
15.2 Lokale Invertierbarkeit 219
Beweis. Da D f (a) invertierbar vorausgesetzt ist, gilt dimV = dimW . Daher können
wir V = W = IRn annehmen und dort die Norm · 2 zu Grunde legen.
1
Wir schreiben A := D f (a) und setzen  := 2A−1
> 0.
Da D f (a) als lineare Abbildung stetig ist, existiert eine offene Kugel Ua um a mit
D f (x) − A <  für alle x ∈ Ua . Zu festem y ∈ IRn definieren wir
y : U → IRn , y (x) := x + A−1(y − f (x) ) .
Damit ist x ein Fixpunkt von y genau dann, wenn f (x) = y ist.
Nun gilt Dy (x) = id − A−1 D f (x) = A−1 (A − D f (x) ), also
1
Dy (x) ≤ A−1 A − D f (x) < für alle x ∈ Ua
2
und mit dem Schrankensatz (Korollar 13.14) erhalten wir
1
y (x1 ) − y (x2 )2 ≤ x1 − x22 für alle x1 , x2 ∈ Ua . (15.4)
2
Folglich hat y |Ua höchstens einen Fixpunkt x ∈ Ua , denn aus y (x1 ) = x1 und
y (x2 ) = x2 folgt x1 − x2 2 ≤ 12 x1 − x2 2 . Somit existiert höchstens ein x ∈ Ua
mit f (x) = y. Insbesondere ist f |Ua injektiv.
Setzt man Wb := f (Ua ), so ist f |Ua : Ua → Wb bijektiv.
Zu zeigen bleibt, dass Wb offen ist. Dazu halten wir y0 ∈ Wb fest. Es gibt genau ein
x0 ∈ Ua mit f (x0 ) = y0 . Weiter finden wir r > 0 mit Kr (x0 ) ⊆ Ua . Wir wollen sehen,
dass für y − y0 <  r stets y ∈ Wb gilt. Daraus folgt dann, dass Wb offen ist.
Sei also y ∈ U r (y0 ). Mit entsprechendem y erhalten wir
1 r
y (x0 ) − x0 2 ≤ A−1 (y − f (x0 ) )2 ≤ A−1 y − y02 < r = .
2 2
Für x ∈ Kr (x0 ) gilt mit (15.4) weiter
y (x) − x0 2 ≤ y (x) − y (x0 )2 + y (x0 ) − x02

1 r r r
≤ x − x02 + ≤ + = r ,
2 2 2 2
also y (x) ∈ Kr (x0 ). Demnach ist y |Kr (x0 ) eine Abbildung von Kr (x0 ) in Kr (x0 )
und wegen (15.4) ist y kontrahierend. Als abgeschlossene Teilmenge eines Ba-
nachraumes ist Kr (x0 ) ein vollständiger metrischer Raum (siehe auch Kapitel 12.3,
Aufgabe 9). Mit dem Fixpunktsatz von Banach (Satz 15.4) folgt schließlich, dass
y |Kr (x0 ) genau einen Fixpunkt x ∈ Kr (x0 ) hat. Für dieses x gilt f (x) = y, also
y ∈ Wb wie gewünscht.
Damit ist die Aussage (a) bewiesen.
Wir müssen noch nachweisen, dass g := ( f |Ua )−1 stetig differenzierbar ist. Um
Satz 15.3 anzuwenden, haben wir zu zeigen, dass g : Wb → Ua stetig und D f (x) für
alle x ∈ Ua invertierbar ist.
Dazu seien y1 , y2 ∈ Wb und x1 := g(y1 ) sowie x2 := g(y2 ). Wir betrachten nun 0
zu 0 ∈ IRn und erhalten
0 (x2 ) − 0(x1 ) = x2 − x1 − A−1( f (x2 ) − f (x1 ) ) = x2 − x1 − A−1(y2 − y1) .
Mit (15.4) folgt
x2 − x1 2 ≤ 0 (x2 ) − 0 (x1 )2 + A−1(y2 − y1 )2

1
≤ x2 − x1 2 + A−1 y2 − y1 2 .
2
Somit gilt g(y2 ) − g(y1)2 x2 − x1 2 ≤ 2A−1 y2 − y1 2 .
Demnach ist g stetig.
Schließlich zeigen wir noch die Invertierbarkeit von D f (x) für alle x ∈ Ua . Es ist
D f (x) − A <  für alle x ∈ Ua ; damit erhalten wir
D f (x) v − Av2 ≤  v2 für alle x ∈ Ua , v ∈ IRn .

1
Wenn D f (x)v = 0 für ein x ∈ Ua und v ∈ IRn gilt, ergibt sich Av2 ≤ 2A−1
v2 .
Es folgt v2 = A−1Av 2 ≤ A−1 Av2 ≤ 1
2 v2 und damit dann v = 0.
Folglich ist D f (x) invertierbar.

Wir wollen die Aussage des Satzes 15.5 einer komponentenweisen Interpretation
unterziehen. Hat man das System von n Gleichungen
y1 = f (x1 , . . . , xn )
.. ..
. .
yn = f (x1 , . . . , xn )
mit f ∈ C1 (U) und D f (a) invertierbar, so existieren Umgebungen Ua von a und Wb

von b = f (a), sodass man dieses Gleichungssystem nach x1 , . . . , xn auflösen kann,
wenn x = (x1 , . . . , xn ) ∈ Ua und y = (y1 , . . . , yn ) ∈ Wb gewählt werden. Man spricht
von lokaler Invertierbarkeit.
Beispiel: Seien V = W = IR3 und f : IR3 → IR3 ,
f1 (x1 , x2 , x3 ) := x1 + x2 + x3 ,
f2 (x1 , x2 , x3 ) := x2 x3 + x3 x1 + x1 x2 ,
f3 (x1 , x2 , x3 ) := x1 x2 x3 .
Damit ist
15.2 Lokale Invertierbarkeit 221
⎛ ⎞
1 1 1
D f (x) = ⎝ x3 + x2 x3 + x1 x2 + x1 ⎠ .
x2 x3 x1 x3 x1 x2
Man kann direkt nachrechnen, dass
det D f (x) = (x1 − x2 )(x1 − x3 )(x2 − x3)
gilt. Somit ist D f (a) invertierbar, falls a = (a1 , a2 , a3 ) paarweise verschiedene Kom-
ponenten besitzt. Also gibt es für solche a eine offene Umgebung Ua von a sowie
eine offene Umgebung Wb von b = f (a) derart, dass f |Ua : Ua → Wb invertierbar ist.
Bemerkung: Ist f : U → W stetig differenzierbar, U ⊆ V offen, mit D f (x) inver-

: offen für alle offenen Teilmengen U
tierbar für alle x ∈ U, so ist f (U) : ⊆ U.
Man erhält dies direkt aus Satz 15.5, denn für jedes x ∈ U : existieren offene Men-
gen Ux ⊆ U : und W f (x) , sodass f |Ux : Ux → W f (x) bijektiv ist.
+
Insbesondere ist f (U) : = W f (x) offen.
:
x∈U
Außerdem ist f lokal injektiv, d.h. f |Ux ist injektiv für alle x ∈ U. Das bedeutet
allerdings nicht zwingend, dass auch f injektiv ist.
x
2 2 e cosy
Beispiel: Wir betrachten die Funktion f : IR → IR , f (x, y) := .
ex sin y
Für alle (x, y) ∈ IR2 ist die Jacobimatrix
x
e cos y −ex sin y
D f (x, y) =
ex sin y ex cos y
invertierbar, da ihre Determinante den Wert e2x (cos2 y + sin2 y) = e2x = 0 hat.
Weiter gilt f (x, y + 2 ) = f (x, y) für alle (x, y) ∈ IR2 , daher ist f nicht injektiv.
Wir merken noch an, dass f nichts anderes als die komplexe Exponentialfunktion
ist, wenn man IR2 mit C identifiziert.
Da f nicht injektiv ist, existiert zwar keine
& globale
' Umkehrabbildung, aber bei-
spielsweise bildet f die Menge U := IR × − 2 , 2 bijektiv auf W := ]0, [ ×IR ab.
Hier können wir eine lokale Umkehrabbildung leicht angeben. Aus
x
e cos y u
x = ∈W
e sin y v
√
folgt einerseits u2 + v2 = e2x (cos2 y + sin2 y) = ex , also x = 12 ln(u2 + v2 ) und
andererseits
v sin y
= = tan y .
u cos y
Es
& gibt zwar viele y ∈ IR mit tany = uv , allerdings liegt nur eines davon im Intervall
'
− 2 , 2 , nämlich y = arctan uv .
Die gesuchte Umkehrabbildung ( f |U)−1 : W → U ist folglich gegeben durch

1 2 2
2 ln(u + v )
(u, v) → ,
arctan uv
vgl. auch Kapitel 14.5, Aufgabe 7. Insbesondere ist f |U ein Diffeomorphismus.

Entsprechend kann man zu jedem a ∈ IR2 eine offene Umgebung Ua finden, so-
dass f |Ua ein Diffeomorphismus ist. Im vorliegenden Fall haben wir, wenn wir hier
wieder IR2 mit C identifizieren, lokale Umkehrungen der komplexen Exponenti-
alfunktion gefunden. Man bezeichnet diese auch als die Zweige des (komplexen)
Logarithmus.
15.3 Implizit definierte Funktionen
Wir beginnen mit einem einfachen Beispiel. Gegeben sei die Funktion f : IR2 → IR,
f (x, y) := x2 (1 − x2 ) − y2 . Weiter sei M := {(x, y) ∈ IR2 : f (x, y) = 0} die Menge
der Nullstellen von f .
1
2 Die Abbildung zeigt die
Nullstellenmenge M der
Funktion f . Diese Menge
1 ist nicht der Graph einer
Funktion IR → IR.
Schränken wir uns auf die Menge U := ]0, [ × ]0, [ ein, so können wir die Glei-
chung f (x, y) = 0 nach y auflösen. Für (x, y) ∈ U gilt

x2 (1 − x2) − y2 = 0 ⇐⇒ y2 = x2 (1 − x2 ) ⇐⇒ y = x2 (1 − x2 ) .

Setzen wir g : ]0, 1[ → IR, g(x) := x2 (1 − x2), so erhalten wir
M ∩U = {(x, y) : y = g(x)} .

In V := (x, y) ∈ IR2 : x > 12 können wir nach x auflösen. Für (x, y) ∈ V gilt

2 2 2 1 1
x (1 − x ) − y = 0 ⇐⇒ x = + 1 − 4y2 .
2 2
& '
Mit h : − 12 , 12 → IR, h(y) := 12 + 12 1 − 4y2, gilt M ∩V = {(x, y) : x = h(y)}.
15.3 Implizit definierte Funktionen 223
In U kann man die Gleichung In V kann man die Gleichung

f (x, y) = 0 nach y auflösen. f (x, y) = 0 nach x auflösen.
Wir halten noch fest, dass hier sowohl f als auch g und h stetig differenzierbar sind
und, dass für (x, y) ∈ U ∩ M stets  yf (x, y) = 0, für (x, y) ∈ V ∩ M stets  xf (x, y) = 0
gilt. Es wird sich zeigen, dass diese Bedingungen an die partiellen Ableitungen eine
wichtige Rolle hinsichtlich der Auflösbarkeit von Gleichungen spielen.
Bevor wir den Satz über implizite Funktionen allgemein formulieren, werden wir
den linearen Fall untersuchen.
Sind x = (x1 , . . . , xn ) ∈ IRn und y = (y1 , . . . , ym ) ∈ IRm , so schreiben wir nun
(x, y) = (x1 , . . . , xn , y1 , . . . , ym ) ∈ IRn+m und mit (x, y) ∈ IRn+m meinen wir stets
x ∈ IRn und y ∈ IRm .
Eine lineare Abbildung A ∈ L (IRn+m , IRn ) können wir in zwei Abbildungen
Ax ∈ L (IRn , IRn ) und Ay ∈ L (IRm , IRn ) zerlegen durch
Ax h := A(h, 0) mit h ∈ IRn , 0 ∈ IRm ,

Ay k := A(0, k) mit 0 ∈ IRn , k ∈ IRm .
Damit gilt A(h, k) = Ax h + Ayk.

Mit diesen Bezeichnungen ist die folgende lineare Version des Satzes über im-
plizite Funktionen offensichtlich.
Satz 15.6. Sei A ∈ L (IRn+m , IRn ). Weiter sei Ax invertierbar.

Dann gibt es zu jedem k ∈ IRm ein eindeutig bestimmtes h ∈ IRn derart, dass
A(h, k) = 0 gilt. Man erhält dieses als
h = −(Ax )−1 Ay k .
Bemerkungen:
(1) Satz 15.6 besagt, das die Gleichung A(h, k) = 0 bei vorgegebenem k auf ein-
deutige Weise nach h aufgelöst werden kann, falls Ax invertierbar ist. Weiter
ist h ist eine lineare Funktion von k.
(2) Selbstverständlich können IRn durch einen n-dimensionalen normierten Vek-
torraum V und IRm durch einen m-dimensionalen normierten Raum W sowie
dann IRn+m durch V × W ersetzt werden.
Satz 15.7 (Satz über implizite Funktionen). Seien V ein n-dimensionaler und W
ein m-dimensionaler normierter Raum. Weiter seien U ⊆ V × W offen, f : U → V
stetig differenzierbar und (a, b) ∈ U ein Punkt, für den f (a, b) = 0 gilt. Bezeichne
A := D f (a, b) ∈ L (V × W,V ). Schließlich sei noch vorausgesetzt, dass die durch
die Zerlegung A(h, k) = Ax h + Ayk erklärte Abbildung Ax ∈ L (V ) invertierbar ist.
Dann gibt es eine offene Umgebung U(a,b) von (a, b) in V × W und eine offene
Umgebung Wb von b in W mit den folgenden Eigenschaften:
Jedem y ∈ Wb ist genau ein x ∈ V zugeordnet, sodass (x, y) ∈ U(a,b) und f (x, y) = 0
gilt. Wird dieses x als g(y) definiert, so ist g : Wb → V stetig differenzierbar mit
g(b) = a sowie
f (g(y), y) = 0 für alle y ∈ Wb
und es gilt Dg(b) = −(Ax )−1 Ay .
Beweis. Wie in Satz 15.5 können wir wieder V = IRn und W = IRm mit der jeweili-
gen · 2-Norm annehmen. Wir werden den Satz über die lokale Umkehrbarkeit auf
folgende Funktion anwenden:
F : U → IRn+m , F(x, y) := ( f (x, y), y) .
Diese ist stetig differenzierbar. Um zu sehen, dass DF(a, b) ∈ L (IRn+m ) invertier-

bar ist, müssen wir zeigen, dass DF(a, b) injektiv ist. Mit f (a, b) = 0 erhalten wir
f (a + h, b + k) = A(h, k) + R(h, k) ,
wobei R(h, k) das Restglied gemäß Definition 14.1 zu D f (a, b) ist. Nun gilt
F(a + h, b + k) − F(a, b) = ( f (a + h, b + k), b + k) − ( f (a, b), b)

= ( f (a + h, b + k), k) = (A(h, k), k) + (R(h, k), 0) .
Mit h → 0, k → 0 sieht man, dass DF(a, b) ∈ L (IRn+m ) nichts anderes als die
lineare Abbildung (h, k) → (A(h, k), k) ist.
Wäre nun DF(a, b) nicht injektiv, so gäbe es (h, k) = (0, 0) mit (A(h, k), k) =
(0, 0). Daraus folgt aber A(h, k) = 0 und k = 0, also Ax h = A(h, 0) = 0 und, da Ax
invertierbar ist, müsste auch h = 0 sein. Folglich ist DF(a, b) injektiv.
Nun ist der Satz von der lokalen Umkehrbarkeit (Satz 15.5) auf F anwendbar. Wir
erhalten damit offene Mengen U(a,b) ⊆ IRn+m mit (a, b) ∈ U(a,b) und W(0,b) mit
(0, b) ∈ W(0,b) , sodass F : U(a,b) → W(0,b) bijektiv ist.
Weiter setzen wir Wb := {y ∈ IRm : (0, y) ∈ W(0,b) }. Die Menge Wb ist offen, da
W(0,b) offen ist. Ist y ∈ Wb , so existiert genau ein (x, y) ∈ U(a,b) mit F(x, y) = (0, y).
Laut der Definition von F bedeutet dies, dass f (x, y) = 0 gilt.
Ist für das selbe y auch f (:x, y) = 0, so gilt F(: x, y) = ( f (:
x, y), y) = (0, y) =
( f (x, y), y) = F(x, y) und mit der Injektivität von F|U(a,b) folgt x = x:. Somit ist auch
die Eindeutigkeit des zugeordneten x bewiesen.
15.3 Implizit definierte Funktionen 225
Bezeichne g(y) = x. Hiermit ist eine Funktion g : Wb → IRn erklärt und es gilt
(g(y), y) ∈ U(a,b) sowie f (g(y), y) = 0, also F(g(y), y) = (0, y).
−1
Mit G := F|U(a,b) erhält man daraus (g(y), y) = G(0, y) und, da G stetig
differenzierbar ist, ist auch g stetig differenzierbar. Um schließlich Dg(b) zu be-
rechnen, betrachten wir  : Wb → U(a,b) ,  (y) := (g(y), y). Es gilt
D (y) k = (Dg(y)k, k) für alle y ∈ Wb , k ∈ IRm (15.5)
und wegen f ◦  (y) = 0 folgt mit der Kettenregel
D f ( (y)) D (y) = 0 . (15.6)
Aus der Zerlegung A(h, k) = Ax h + Ay k und den Gleichungen (15.5) sowie (15.6)
folgt nun Ax Dg(b) k + Ay k = A(Dg(b)k, k) = A D (b) k = 0 für alle k ∈ IRm . Dies
bedeutet Ax Dg(b) = −Ay .

Beispiel: Sei f : IR2+3 → IR2 , f = ( f1 , f2 ), mit
f1 (x1 , x2 , y1 , y2 , y3 ) := 2ex1 + x2 y1 − 4y2 + 3 ,

f2 (x1 , x2 , y1 , y2 , y3 ) := x2 cos x1 − 6x1 + 2y1 − y3 .
Für a := (0, 1) und b := (3, 2, 7) haben wir f (a, b) = 0. Die Ableitung hat bezüglich
der Standardbasis die Darstellung

2ex1 y1 x2 −4 0
D f (x1 , x2 , y1 , y2 , y3 ) = .
−x2 sin x1 − 6 cosx1 2 0 −1
Wir zerlegen A := D f (a, b) in

2 3 1 −4 0
Ax = und Ay =
−6 1 2 0 −1
und erkennen, dass Ax invertierbar ist. Laut Satz 15.7 existieren eine offene Umge-
bung Wb von b = (3, 2, 7) und eine stetig differenzierbare Abbildung g : Wb → IR2
mit f (g(y), y) = 0 für alle y ∈ Wb . Um Dg(3, 2, 7) zu bestimmen, benötigen wir A−1
x .
Es gilt
−1 1 1 −3
Ax = ,
20 6 2
also
1 1 3

1 1 −3 1 −4 0 4 5 − 20
Dg(3, 2, 7) = − = .
20 6 2 2 0 −1 − 12 6 1
5 10
15.4 Extrema unter Nebenbedingungen
Wir untersuchen Extremwertaufgaben für Funktionen f : U → IR, wobei aber die

Punkte a ∈ U, die für die Extremwertsuche zugelassen sind, die Nebenbedingung
g(a) = 0 mit einer gegebenen Funktion g : U → IR erfüllen müssen (U ⊆ IRn offen).
Mit anderen Worten: Wir betrachten die Einschränkung von f auf die Nullstel-
lenmenge S := {x ∈ U : g(x) = 0} von g.
Ist a ∈ U ein Punkt, an welchem die Nullstellenmenge S

eine Niveaulinie von f schneidet, so gibt es in jeder Um-
gebung von a sowohl Punkte x+ mit f (x+ ) > f (a) als auch
S x− mit f (x− ) < f (a).
Ein Extremum kann nur dort vorliegen, wo sich S und eine
Niveaulinie von f tangential berühren.
x0
Falls f und g stetig differenzierbar sind, bedeutet dies, dass
a an einer solchen Stelle x0 dann grad f (x0 ) und grad g(x0 )
die gleiche Richtung haben.
Satz 15.8 (Multiplikatorregel von Lagrange). Seien U ⊆ IRn offen, f , g : U → IR

stetig differenzierbar und a ∈ U mit g(a) = 0, grad g(a) = 0. Weiter sei
S := {x ∈ U : g(x) = 0} .
Hat f |S im Punkt a ein lokales Extremum, dann gibt es eine reelle Zahl  mit
grad f (a) =  grad g(a) .
Beweis. Nach eventueller Umnummerierung können wir wegen grad g(a) = 0 an-
nehmen, dass xgn (a) = 0 ist.
Laut dem Satz über implizite Funktionen (Satz 15.7) ist in einer Umgebung von a
eine Funktion h in n − 1 Variablen (x1 , . . . , xn−1 ) erklärt, sodass xn = h(x1 , . . . , xn−1 )
die Bedingung g(x1 , . . . , xn ) = 0 erfüllt, und es gilt
h g ; g
(a1 , . . . , an−1 ) = − (a) (a) für i = 1, . . . , n − 1 .
 xi  xi  xn
Die Voraussetzung, dass f |S im Punkt a ein lokales Extremum hat, können wir wie
folgt formulieren: Die Abbildung (x1 , . . . , xn−1 ) → f (x1 , . . . , xn−1 , h(x1 , ..., xn−1 ) )
besitzt in (a1 , . . . , an−1 ) ein lokales Extremum. Damit gilt notwendigerweise
f f h
0= (a) + (a) (a1 , . . . , an−1 )
 xi  xn  xi
f f g ; g
= (a) − (a) (a) (a)
 xi  xn  xi  xn
f g
für i = 1, . . . , n − 1. Mit  :=  xn (a) /  xn (a) ist die Behauptung gezeigt.

15.4 Extrema unter Nebenbedingungen 227
Beispiel: Wir betrachten die Funktion f : IR2 → IR, f (x, y) := x3 − 3xy2 . Seien r > 0
und Mr := {(x, y) ∈ IR2 : x2 + y2 = r2 }. Mit Hilfe von Satz 15.8 wollen wir die
Extrema von f auf Mr bestimmen.
Dazu setzen wir g : IR2 → IR, g(x, y) := x2 + y2 − r2 . Damit ist Mr genau
die Menge der Nullstellen von g. Es gilt grad g(x, y) = (2x, 2y) und insbesondere
grad g(x, y) = (0, 0) für alle (x, y) ∈ Mr . Mögliche Extrema finden wir daher, in-
dem wir Lösungen der Gleichung grad f (x, y) =  grad g(x, y) suchen. Weiter ist
grad f (x, y) = (3x2 − 3y2, −6xy). Wir suchen also Lösungen des Gleichungssystems
3x2 − 3y2 = 2 x ,
−6xy = 2 y ,
x2 + y2 = r 2 .
Aus der zweiten Gleichung folgt y = 0 oder  = −3x.

Im Fall y = 0 erhalten wir aus der dritten Gleichung dann x = ±r und auch die
erste Gleichung ist erfüllbar mit einem geeigneten  . Der genaue Wert von  spielt
hier gar keine Rolle mehr; wichtig ist nur, dass es ein solches gibt.
Im Fall y = 0 folgt wie gesagt  = −3x. Setzen wir dies in die erste Gleichung
ein, so erhalten wir 3x2 = y2 und mit der dritten
√
Gleichung folgt 4x2 = r2 , also
x = ± 2r . Damit ergibt sich schließlich y = ± r 2 3 .
Wenn f also auf der Menge Mr ein Extremum annimmt, dann kommen nur die
folgenden Stellen in Frage:
√ √
r r 3 r r 3
a1 = , , a2 = − , , a3 = (−r, 0) ,
2 2 2 2
√ √
r r 3 r r 3
a4 = − ,− , a5 = ,− , a6 = (r, 0) .
2 2 2 2
Nun müssen wir noch überprüfen, ob es sich auch wirklich um Extrema handelt.
Dazu stellen wir fest, dass die stetige Funktion f auf der kompakten Menge Mr
Maximum und Minimum annimmt (vgl. Korollar 12.9), d.h. mindestens einer der
eben bestimmten Punkte muss ein Maximum sein und mindestens einer muss ein
Minimum sein.
Vergleichen wir die Funktionswerte an diesen Punkten, so erhalten wir
f (a2 ) = f (a4 ) = f (a6 ) = r3 und f (a1 ) = f (a3 ) = f (a5 ) = −r3 ,
also handelt es sich bei ersteren um Maxima, bei den anderen um Minima.
15.5 Aufgaben
1. Seien U := ]0, [ × ]0, 2 [ und f : U → IR2 , f (u, v) := (u2 cos v, u2 sin v).
a. Zeigen Sie, dass D f (u, v) invertierbar ist für alle (u, v) ∈ U.
b. Weiter sei S := f (U). Zeigen Sie, dass f : U → S ein Diffeomorphismus
ist und bestimmen Sie D( f −1 ).
2. Sei f : IR2 → IR2 , f (x, y) := (ex+y cos(x − y), ex+y sin(x − y) ).

Zeigen Sie, dass f in allen Punkten (x, y) ∈ IR2 eine lokale Umkehrfunktion
besitzt.
3. Sei f : IR2 → IR, f (x, y) := 3x2 + xy4 − yey .

Zeigen Sie, dass ein Intervall I mit 0 ∈ I sowie eine differenzierbare Funktion
g : I → IR existieren mit
f (x, g(x) ) = 0 für alle x ∈ I
und bestimmen Sie g .
4. Zeigen Sie, dass das Gleichungssystem
2ex1 + x2 x3 − 4x4 = 3
x2 cos x1 − 6x1 + 2x3 − x5 = 0
in einer Umgebung des Punktes (0, 1, 1, 0, 3) nach den Variablen x1 und x2 auf-
gelöst werden kann.
Weiter seien b := (1, 0, 3) und g : Wb → IR2 die durch obiges Gleichungssystem
implizit erklärte Funktion (mit geeignetem Wb ⊆ IR3 ). Begründen Sie, warum
g stetig differenzierbar ist und bestimmen Sie Dg(b).
5. Gegeben ist das Gleichungssystem
x2 + sin(xy2 − 2z) = 0 ,
x2 + sin(y + xz2 ) = 0 .
Zeigen Sie: Zu beliebigem  > 0 existieren unendlich viele Lösungen (x, y, z)

des Systems mit (x, y, z) <  .
Hinweis: Zeigen Sie, dass die Menge der Lösungen in einer offenen Umgebung
des Nullpunkts der Graph einer Funktion ist (man kann nach x auflösen).
6. Seien V,W zwei endlich-dimensionale normierte IR-Vektorräume. Weiter seien

U ⊆ V offen und f : U → W stetig differenzierbar derart, dass D f (a) für jedes
a ∈ U invertierbar ist. Zeigen Sie: Die Bildmenge f (U) ist offen in W .
15.5 Aufgaben 229
7. Seien U := ]0, [ × ]0, [ und f : U → IR, f (x, y) := x + y.

Bestimmen Sie alle lokalen Extrema von f auf der Menge

1 1
M := (x, y) ∈ U : 2 + 2 = 1 .
x y
x+y
8. Seien K := {(x, y) ∈ IR2 : x2 + y2 = 1} und f : K → IR, f (x, y) := .
1 − xy
Bestimmen Sie alle lokalen Extrema von f .
Kapitel 16
Elementar lösbare Differentialgleichungen
Zahlreiche Phänomene werden mit gewöhnlichen Differentialgleichungen beschrie-

ben. Differentialgleichungen sind daher Gegenstand vieler weiterführender Vorle-
sungen. Zu diesem Thema existiert auch ein umfangreiches Angebot an Literatur,
wie z.B. Forst/Hoffmann [6]. Wir wollen hier lediglich einige elementare Beispiele
betrachten und Aussagen zur Existenz und Eindeutigkeit von Lösungen herleiten.
Bevor wir uns Lösungsmethoden und Existenzaussagen zuwenden, wollen wir
einige Situationen beschreiben, in denen Differentialgleichungen eine Rolle spielen.
(1) Zerfalls- und Wachstumsprozesse
x =  x ,  ∈ IR (Wachstumsrate proportional zur Größe).
Dabei ist x : I → IR eine differenzierbare Funktion auf einem Intervall I. Der

Wert x(t) beschreibt dabei z.B. die Anzahl der zur Zeit t vorhandenen Atome
(radioaktiver Zerfall), oder die Populationsgröße, etwa von Bakterien, zur
Zeit t. Eine Lösung lautet
x(t) = x0 e t , t ∈ IR , mit x0 = x(0) .
Ist  > 0 so gilt lim x(t) =  (unrealistisch für Populationen).

t→
(2) Logistisches Wachstum (Verhulst-Pearl-Gleichung)
x = (a − bx)x , a, b > 0 .
Wieder interpretiert man x(t) als Populationsgröße zum Zeitpunkt t. Hier

hängt die Rate a − bx von der derzeitigen Größe der Population ab. Dabei be-
schreibt a die Wachstumsrate (bei unbegrenzten Ressourcen) und −bx(t) die
Wirkung begrenzter Ressourcen oder einer Überbevölkerung“. Eine Lösung
”
lautet
a 1
x(t) = mit x0 = x(0) .
b 1 + e−at a − 1
bx0

232 16 Elementar lösbare Differentialgleichungen
Man kann dies durch Einsetzen leicht nachprüfen, siehe auch Kapitel 16.4,
Aufgabe 2.
Allerdings ist hier anzumerken, dass x(t) nicht für alle t ∈ IR definiert ist.
Neben dem Problem, eine Lösung zu finden, stellt sich bei vielen Differen-
tialgleichungen die Frage, ob überhaupt und auf welchem Definitionsbereich
Lösungen existieren.
Das logistische Modell findet zahlreiche Anwendungen in der theoretischen
Biologie, Demographie etc.
(3) Newtons Gesetz
mx (t) = f (t, x(t), x (t) ) .
Hier beschreibt x(t) die Position eines Teilchens, auf das eine Kraft f wirkt.
Dabei ist f eine Funktion der Zeit t, der Lage x(t) und der Geschwindigkeit
x (t); m bezeichnet die Masse. Ist z.B. die Kraft die Gravitation, so gilt
mx (t) = −mg
mit der Gravitationskonstanten g. Eine Lösung der letzteren Differentialglei-

chung lautet
1
x(t) = − gt 2 + c1t + c2 mit c1 , c2 ∈ IR .
2
Um c1 und c2 zu bestimmen, muss man x(t0 ) und x (t0 ) zu einem Zeitpunkt
t0 kennen. Ist speziell x (t) = −x(t) die (normierte) Gleichung des harmoni-
schen Oszillators, so hat man Lösungen
x(t) = c1 sin t + c2 cost , c1 , c2 ∈ IR .
(4) Räuber-Beute-Modell (Lotka-Volterra).

In diesem Modell hat man eine Beute-Population x(t) und eine Räuber-
Population y(t). Die Beute-Population hat unbegrenzte Ressourcen, wird
aber durch die Räuber-Population in Abhängigkeit von Begegnungen mit y(t)
dezimiert:
x (t) = ( −  y(t) ) x(t) =  x(t) −  y(t) x(t) ( > 0,  > 0) .
Die Räuber-Population wächst mit Anwesenheit von Beute und Begegnung

mit ihr, und wird durch eine Sterberate dezimiert:
y (t) = ( x(t) −  ) y(t) =  x(t) y(t) −  y(t) ( > 0,  > 0) .
Damit hat man eine 2-dimensionale Differentialgleichung
x = ( −  y) x ,
y = ( x −  ) y .
16.1 Der Satz von Picard-Lindelöf 233
Lösungen sind unter

anderem
die konstanten Funktionen (x(t), y(t) ) = (0, 0)
 
und (x(t), y(t) ) = , .
Zwei weitere Lösungen sind leicht zu finden, etwa (x(t), y(t) ) = (0, e− t ) und
(x(t), y(t) ) = (e t , 0). Letztere ist wegen lim e t =  unrealistisch.
t→
16.1 Der Satz von Picard-Lindelöf
Wir betrachten eine allgemeine Differentialgleichung, ein so genanntes Anfangs-

wertproblem (kurz AWP), der Form
x (t) = f (t, x(t) ) , x(t0 ) = x0 ,
wobei f : D → IRd mit D ⊆ IRd+1 und (t0 , x0 ) ∈ D sind. Wir beschränken uns auf
D = Za,b mit
Za,b := [t0 − a,t0 + a] × Kb(x0 )
und Kb (x0 ) := {x ∈ IRd : x − x02 ≤ b}.
Zunächst erweitern wir den Fixpunktsatz von Banach (Satz 15.4) ein wenig.
Satz 16.1 (Fixpunktsatz von Banach, Weissinger). Sei (M, d) ein vollständiger

metrischer Raum. Weiter seien  ak eine konvergente Reihe mit ak > 0 für alle k
k=1
und  : M → M eine Abbildung mit
d( k (x),  k (y) ) ≤ ak d(x, y) (16.1)
für alle x, y ∈ M und k ∈ IN. Dabei bezeichne  k =  ◦  k−1 und  1 =  .

Die Abbildung  besitzt genau einen Fixpunkt, d.h. es gibt genau ein x∗ ∈ M
mit  (x∗ ) = x∗ . Dieser Fixpunkt ist Grenzwert der Iterationsfolge ( k (x0 ) )k∈IN bei
beliebigem Startwert x0 ∈ M und es gilt die Fehlerabschätzung


d(x∗ ,  n (x0 ) ) ≤  ak d( (x0 ), x0 ) . (16.2)
k=n
Beweis. Aus (16.1) erhalten wir d( n+1 (x0 ),  n (x0 ) ) = d( n ( (x0 ) ),  n (x0 ) ) ≤
an d( (x0 ), x0 ) für n ∈ IN. Damit folgt
d( n+k (x0 ),  n (x0 ) ) ≤ d( n+k (x0 ),  n+k−1 (x0 ) ) + . . . + d( n+1 (x0 ),  n (x0 ) )
≤ (an+k−1 + . . . + an ) d( (x0 ), x0 ) . (16.3)
Daher ist ( n (x0 ))n∈IN eine Cauchyfolge in (M, d) und wegen der Vollständigkeit
existiert x∗ := lim  n (x0 ). Weiter gilt auch  (x∗ ) = lim  n+1 (x0 ) = x∗ .
n→ n→
Ist y ein weiterer Fixpunkt, so gilt d(x∗ , y) = d( n (x∗ ),  n (y) ) ≤ an d(x∗ , y). für alle
n ∈ IN. Wegen an → 0 mit n →  folgt schließlich x∗ = y.
Die Fehlerabschätzung (16.2) folgt aus (16.3) mit k → .

Wir werden diesen Satz anwenden auf Anfangswertprobleme, bei denen f die fol-
gende Bedingung erfüllt.
Definition 16.2. Seien a, b > 0 und f : Za,b → IRd stetig. Man sagt, dass f eine
Lipschitzbedingung bezüglich x erfüllt, falls L ≥ 0 existiert mit
f (t, x) − f (t, y)2 ≤ L x − y2
für alle (t, x), (t, y) ∈ Za,b , und bezeichnet L dann als Lipschitz-Konstante.
Ist J ein Intervall, so bezeichnet man mit C(J, IRd ) den Vektorraum aller stetigen
Funktionen  : J → IRd .
Wenn J kompakt ist, so liefert Korollar 9.3 angewendet auf jede Komponenten-
funktion, dass C(J, IRd ) mit   := sup  (t)2 ein Banachraum ist.
t∈J
Satz 16.3 (Picard-Lindelöf). Erfüllt die Funktion f : Za,b → IRd eine Lipschitz-
bedingung bzgl. x mit der Lipschitz-Konstanten L, so hat das Anfangswertproblem
x = f (t, x) , x(t0 ) = x0
genau eine Lösung auf dem Intervall J = [t0 −  ,t0 +  ], wobei  := min{a, b/m}
mit m = f  = sup f (t, x)2 ist.
(t,x)∈Za,b
Die Lösung  erhält man, indem man eine beliebige Funktion
0 ∈ M := { ∈ C(J, IRd ) :  (t) − x02 ≤ b für alle t ∈ J}
wählt und ( t
n (t) := x0 + f (s, n−1 (s) ) ds
t0
für n ∈ IN, t ∈ J setzt.

Mit n →  konvergiert n gleichmäßig auf J gegen die Lösung und für alle t ∈ J
gilt die Fehlerabschätzung


( L)k
 (t) − n(t)2 ≤  max 1 (t) − 0(t)2
k=n k!
t∈J
oder gröber
( L)n  L
 (t) − n(t)2 ≤ e max 1 (t) − 0(t)2 .
n! t∈J
Beweis. Nach Konstruktion ist M eine abgeschlossene Teilmenge von C(J, IRd ) und
folglich mit der von der Norm erzeugten Metrik,
d(1 , 2 ) = sup 1 (t) − 2(t)2 ,

t∈J
ein vollständiger metrischer Raum (vgl. auch Kapitel 12.3, Aufgabe 9).
Nun definieren wir  : M → M mittels
( t
 ( )(t) = x0 + f (s,  (s) ) ds für t ∈ J .
t0
Wir müssen noch verifizieren, dass  ( ) ∈ M für alle  ∈ M gilt. Wegen

"( t "
" "
 ( )(t) − x02 = "
" f (s,  (s) ) ds" ≤ m |t − t0| ≤ m  ≤ b
"
t0 2
für alle t ∈ J ist dies der Fall.

Für alle t ∈ J gilt weiter
"( t "
" "
 ( )(t) −  ( )(t)2 = " ( f (s,  (s) ) − f (s,  (s) )) ds"
"
"
t 0 2
≤ L |t − t0 | sup  (s) −  (s)2 ≤  L −   .

s∈J
n
Induktiv erhalten wir  n ( )(t) −  n ( )(t)2 ≤ (n!L)  −   für alle t ∈ J und
n ∈ IN, also
( L)n
 n ( ) −  n ( ) ≤  −   .
n!
Mit Satz 16.1 folgt die Existenz und Eindeutigkeit einer Funktion  ∗ : J → IRd mit
 ( ∗ ) =  ∗ , d.h. ( t
 ∗ (t) = x0 + f (s,  ∗ (s) ) ds .
t0
Durch Einsetzen erkennt man, dass  ∗ eine Lösung des Anfangswertproblems ist.
Satz 16.1 liefert auch die behauptete Fehlerabschätzung, welche insbesondere
die gleichmäßige Konvergenz n →  ∗ zur Folge hat.

Beispiel: Wir suchen eine Lösung des Anfangswertproblems
x = −2tx , x(0) = 1 .
Dazu setzen wir f (t, x) := −2xt und beginnen etwa mit der konstanten Funktion
0 (t) := 1. ( t
Wir berechnen 1 (t) = 1 − 2s ds = 1 − t 2 und weiter
0
(t (t
1
2 (x) = 1 − 2s 1 (s) ds = 1 − (2s − 2s3) ds = 1 − t 2 + t 4 ,
0 0 2
(t (t
1 1
3 (x) = 1 − 2s 2 (s) ds = 1 − (2s − 2s3 + s5 ) ds = 1 − t 2 + t 4 − t 6 .
0 0 2 6
n
(−1)k 2k
Dies gibt Anlass zur Vermutung, dass n (t) =  k! t für alle n ∈ IN gilt.
k=0

(−1)k 2k
Damit wäre dann  ∗ (t) =  k! t = exp(−t 2 ).
k=0
In der Tat kann man durch Einsetzen sofort nachprüfen, dass x(t) = exp(−t 2 ) die
gesuchte Lösung ist.
Die gefundene Lösung ist hier sogar auf ganz IR definiert.
Es stellt sich die Frage, ob man allgemein für die gefundene Lösung das vorliegende
Lösungsintervall vergrößern kann. Mit dem Satz von Picard-Lindelöf erhalten wir
für das Anfangswertproblem x = f (t, x), x(t0 ) = x0 eine Lösung  , die zunächst auf
einem Intervall [t0 −  ,t0 +  ] definiert ist.
Wir können nun zwei weitere Anfangswertprobleme betrachten mit Anfangsbe-
dingungen an den Stellen t = t0 −  oder t = t0 +  . Man betrachtet also x = f (t, x),
x(t0 +  ) =  (t0 +  ) und wendet Satz 16.3 erneut an, falls f in einem geeigneten
Intervall um t0 +  ebenfalls eine Lipschitzbedingung erfüllt. Auf diese Weise erhält
man eine Lösungsfortsetzung von  .
Hat man eine Lösung im
Intervall [t0 −  ,t0 +  ] ge-
funden, so kann man, falls
f auch in einer Umgebung
von t0 +  eine Lipschitz-
bedingung erfüllt, erneut
das Verfahren von Picard-
Lindelöf anwenden, um ei-
ne Fortsetzung der Lösung
t0 −  t0 t0 +  (t0 +  ) + 
: auf ein größeres Intervall
zu erhalten.
Folgendes Beispiel zeigt, dass man allgemein jedoch nicht erwarten kann, eine
Lösung zu finden, die auf ganz IR erklärt ist:
2
Die Differentialgleichung x = x2t besitzt die Lösungen  (t) = 2− t 2
mit  ∈ IR.
Betrachtet man das Anfangswertproblem x = x2t, x(0) = 1, so erhält man als ein-
deutige Lösung
2
1 (t) =
2 − t2
√
zunächst auf einem Intervall [− ,  ]. Da 1 in den Punkten t = ± 2 gar nicht de-
finiert
√ ist,
√ wird auch die durch obiges Vorgehen konstruierte Fortsetzung innerhalb
] − 2, 2[ bleiben.
In Definition 16.2 haben wir eine Lipschitzbedingung auf Mengen Za,b erklärt. Wir
erweitern diesen Begriff noch ein wenig.
Definition 16.4. Seien D ⊆ IRd+1 und f : D → IRd eine stetige Funktion. Wenn wir
(t, x) ∈ D schreiben, ist stets t ∈ IR, x ∈ IRd gemeint.
Falls eine Konstante L ≥ 0 existiert mit
f (t, x) − f (t, y)2 ≤ L x − y2 für alle (t, x), (t, y) ∈ D ,
so sagt man, dass f auf D eine globale Lipschitzbedingung bezüglich x erfüllt mit
der Lipschitz-Konstanten L.
Gibt es zu jedem Punkt in D eine Umgebung U, sodass f |U ∩ D einer Lipschitz-
Bedingung bzgl. x genügt, so heißt f Lipschitz-stetig bezüglich x in D.
Korollar 16.5. Seien D ⊆ IRd+1 offen und f : D → IRd stetig. Weiter sei f Lipschitz-
stetig bezüglich x.
Dann besitzt das Anfangswertproblem
x = f (t, x) , x(t0 ) = x0 , (t0 , x0 ) ∈ D ,
eine eindeutig bestimmte Lösung  , definiert auf einem Intervall [t0 −  ,t0 +  ] mit
einem (von (t0 , x0 ) abhängigen)  > 0.
Beweis. Zu (t0 , x0 ) ∈ D gibt es eine Umgebung U derart, dass f |U ∩ D einer

Lipschitz-Bedingung genügt. Da D offen ist, können wir U ⊆ D annehmen. Wei-
ter gibt es eine Menge der Form Za,b mit (t0 , x0 ) ∈ Za,b ⊆ U und Satz 16.3 liefert die
Behauptung.

Korollar 16.6. Seien D ⊆ IRd+1 offen und f : D → IRd stetig. Weiter seien f
Lipschitz-stetig bezüglich x und I1 , I2 zwei Intervalle derart, dass 1 : I1 → IRd
sowie 2 : I2 → IRd Lösungen von x = f (t, x) sind.
Wenn ein t∗ ∈ I1 ∩ I2 existiert mit 1 (t∗ ) = 2 (t∗ ), dann folgt 1 (t) = 2 (t) für
alle t ∈ I1 ∩ I2 .
Beweis. Da 1 und 2 stetig sind, ist auch s : I1 ∩ I2 → IR, s(t) := 1 (t) − 2 (t)2 ,
eine stetige Funktion.
Wir nehmen an, es gibt t1 ∈ I1 ∩ I2 mit 1 (t1 ) = 2 (t1 ), also s(t1 ) > 0. Dabei
können wir t1 < t∗ voraussetzen (den Fall t1 > t∗ behandelt man ganz analog). Als
Urbild einer abgeschlossenen Menge unter einer stetigen Abbildung ist s−1 ({0})
abgeschlossen (vgl. Satz 12.4). Daher existiert t0 := min{t ∈ [t1 ,t∗ ] : s(t) = 0}. Das
Anfangswertproblem
x = f (t, x) , x(t0 ) = 1 (t0 ) = 2 (t0 )
hat laut Korollar 16.5 eine eindeutige Lösung auf einem Intervall [t0 −  ,t0 +  ].
Dies steht im Widerspruch dazu, dass 1 und 2 verschiedene Lösungen sind.

In anderen Worten lässt sich die Aussage von Korollar 16.6 wie folgt formulieren:
Unter den gegebenen Voraussetzungen können sich verschiedene Lösungskurven
von x = f (t, x) niemals schneiden.
Satz 16.7 (Globaler Existenz- und Eindeutigkeitssatz). Seien D ⊆ IRd+1 offen

und f : D → IRd stetig. Weiter sei f Lipschitz-stetig bezüglich x.
Zu jedem (t0 , x0 ) ∈ D gibt es dann ein eindeutig bestimmtes offenes Intervall I
mit t0 ∈ I, sodass gilt:
(i) Das Anfangswertproblem x = f (t, x), x(t0 ) = x0 , besitzt genau eine Lösung
 : I → IRd .
(ii) Sind J ein Intervall und  : J → IRd eine weitere Lösung dieses Anfangswert-
problems, so folgt J ⊆ I und  |J =  .
Beweis. Bezeichne
t + := sup{ ∈ IR : AWP besitzt Lösung auf [t0 ,  ]} und

−
t := inf{ ∈ IR : AWP besitzt Lösung auf [ ,t0 ]} ,
wobei auch t + =  und t − = − möglich sind (die Mengen, deren Supremum

bzw. Infimum hier betrachtet wird, sind nicht leer laut Korollar 16.5).
Wir setzen I := ]t −,t + [ und

t − + 1n , falls t − = − ,
tn− :=
−n , falls t − = − ,

t + − 1n , falls t + =  ,
tn+ :=
n , falls t + =  ,
für n ∈ IN. Ohne Einschränkung können wir annehmen, dass n groß genug ist, sodass
tn− ≤ tn+ gilt. Schließlich sei In := [tn− ,tn+ ].
Auf jedem In existiert eine Lösung n des Anfangwertproblems. Für t ∈ I setzen
wir nun  (t) := n (t), wobei n so gewählt ist, dass t ∈ In gilt. Wegen Korollar 16.6
ist  (t) wohldefiniert und  die einzige auf ganz I definierte Lösung.
Für jede auf einem Intervall J definierte Lösung  des Anfangswertproblems gilt
nach Konstruktion J ⊆ I sowie, wiederum laut Korollar 16.6,  =  |J.

Bemerkung: Das maximale Intervall I, auf welchem die Lösung des Anfangswert-
problems definiert ist, hängt von den gegebenen Anfangswerten (t0 , x0 ) ab. Es ist
möglich, dass man für gewisse Anfangswerte eine Lösung erhält, die auf ganz IR
definiert ist, wahrend man bei der Wahl anderer Anfangswerte in der selben Dif-
ferentialgleichung ein beschränktes Intervall als maximalen Definitionsbereich der
Lösung bekommt. Wir werden am Ende des nächsten Abschnitts noch ein Beispiel
diskutieren.
16.2 Differentialgleichungen mit getrennten Variablen 239
16.2 Differentialgleichungen mit getrennten Variablen
Wir wollen Anfangswertprobleme der Form
x (t) = f (t)g(x(t) ) , x(t0 ) = x0
betrachten, wobei f : I → IR und g : J → IR stetige Funktionen auf Intervallen I

bzw. J sind und (t0 , x0 ) ∈ I × J gilt. Für die Vorgehensweise zum Bestimmen einer
Lösung kann folgende Merkregel dienen: Wir schreiben
”
dx 1
= f (t)g(x) ⇒ dx = f (t) dt
dt g(x)
und integrieren.“
Wir wollen hier nicht weiter darauf eingehen, inwiefern obige Schreibweise sinn-
voll ist. Allerdings gilt der folgende Satz.
Satz 16.8. Seien I, J zwei offene Intervalle, f : I → IR und g : J → IR stetige Funk-
tionen mit g(x) = 0 für alle x ∈ J. Weiter seien t0 ∈ I und x0 ∈ J.
Dann existiert ein offenes Intervall I0 mit t0 ∈ I0 derart, dass das Anfangswert-
problem
x = f (t) g(x) , x(t0 ) = x0
eine Lösung x : I0 → J besitzt.
Man erhält eine Lösung, indem man die Gleichung
( x ( t
1
d = f (s) ds
x0 g( ) t0
nach x auflöst.
Beweis. Da g stetig und nullstellenfrei ist, gilt entweder g( ) > 0 für alle  ∈ J oder
g( ) < 0 für alle  ∈ J. Weiter ist 1g auf [x0 , x] integrierbar. Damit ist
( x
1
G : J → IR , G(x) := d
x0 g( )
streng monoton und laut dem Hauptsatz der Differential- und Integralrechnung
(Satz 8.7) differenzierbar mit G (x) = g(x)
1
.
Die Funktion G bildet J bijektiv auf ein Intervall J ab; nach Satz 7.17 ist die
Umkehrfunktion H := G−1 differenzierbar mit H (x) = G (H(x))
1
= g(H(x) ).
Wegen G(x0 ) = 0 ist 0 ∈ J . Als Urbild des offenen Intervalls J unter der stetigen
Abbildung H ist auch J offen, vgl. Satz 12.4. Daher gibt es ein  > 0 derart, dass
] −  ,  [ ⊆ J gilt. Da
( t
F : I → IR , F(t) := f (s) ds
t0
als Stammfunktion einer stetigen Funktion ebenfalls stetig ist, gibt es ein  > 0,
sodass |F(t)| = |F(t) − F(t0 )| <  für alle t ∈ I mit |t − t0 | <  gilt. Das Intervall
I0 := ]t0 −  ,t0 +  [ ∩ I ist offen und nach Konstruktion gilt F(t) ∈ ] −  ,  [ ⊆ J für
alle t ∈ I0 .
Demnach ist die Funktion  : I0 → IR,  (t) := H(F(t) ), wohldefiniert und diffe-
renzierbar. Mit der Kettenregel erhalten wir
1
 (t) = H (F(t)) F (t) = f (t) = f (t) g( (t)) ,
G (H(F(t)))
also löst  das Anfangswertproblem. Für x ∈ I0 gilt mit H = G−1 schließlich
x = H(F(t)) ⇐⇒ G(x) = F(t) ;
folglich erhält man diese Lösung, indem man die Gleichung G(x) = F(t) nach x
auflöst.

Beispiel: Wir wollen das Anfangswertproblem
x = x2 t , x(t0 ) = x0
mit (t0 , x0 ) ∈ IR2 lösen.

Dazu halten wir zunächst fest, dass im Fall x0 = 0 die Konstante  (t) = 0 ∀ t ∈ IR
das Anfangswertproblem löst.
Ist x0 = 0, so gibt es ein Intervall J mit g(x) := x2 = 0 für x ∈ J und es gilt
( x ( x
1 1 1 1
d = d = − .
x0 g( ) x0 2 x0 x
( t
1
Mit f (t) := t haben wir f (s) ds = (t 2 − t02 ). Wir müssen also die Gleichung
t0 2
1 1 1 2 2
− = (t − t0 )
x0 x 2
2x0
nach x auflösen und erhalten x = .
2 + x0(t02 − t 2 )
Als Lösung des Anfangswertproblems haben wir also
2x0 2
 (t) = = ,
2 + x0(t02 − t 2) 2
x0 + t02 − t 2
zunächst auf einem Intervall I0 mit t0 ∈ I0 .

Wir wollen noch anmerken, dass die Funktion (t, x) → x2t Lipschitz-stetig im
Sinne von Definition 16.4 ist. Daher ist die gefundene Lösung des Anfangswert-
problems eindeutig. Ihr maximales Definitionsintervall Imax (t0 , x0 ) = ]t − ,t + [, siehe
16.3 Lineare Systeme von Differentialgleichungen 241
Satz 16.7, hängt von der Lage der Anfangswerte ab. Entscheidend ist, wo die Null-
stellen des Nenners in obiger Darstellung von  liegen.
Für x0 < 0 und t02 < − x20 ist  (t) für alle t ∈ IR erklärt, also ist Imax = IR.
Ebenso haben wir Imax = IR auch im Fall x0 = 0, da hier die Nullfunktion die
Lösung des Anfangswertproblems ist.
Zu Anfangswerten t02 > − x20 erhalten wir schließlich
, -
Imax = t02 + x20 ,  für t0 > 0 und x0 < 0 ,
, -
Imax = − , − t02 + x20 für t0 < 0 und x0 < 0 ,
, -
Imax = − t02 + x20 , t02 + x20 für t0 > 0 und x0 > 0 .
16.3 Lineare Systeme von Differentialgleichungen
In diesem Abschnitt wollen wir zunächst Anfangswertprobleme der Form
x = Ax , x(t0 ) = x0 ∈ IRd
betrachten, wobei A eine (d × d)-Matrix ist.

Für x, y ∈ IRd gilt Ax − Ay2 = A(x − y)2 ≤ A x − y2 mit der zur Eukli-
dischen Norm gehörenden Operatornorm. Demnach ist die Abbildung (t, x) → Ax
Lipschitz-stetig bezüglich x im Sinne von Definition 16.4. Folglich besitzt obiges
Anfangswertproblem laut Korollar 16.5 für jedes (t0 , x0 ) ∈ IRd+1 eine eindeutig be-
stimmte Lösung.
Eine Methode, diese Lösung zu bestimmen, führt über die Exponentialfunktion.
Sei A eine (d × d)-Matrix. Wegen
n n 
Ak Ak Ak
 ≤ ≤ = exp(A)
k=0 k! k=0 k! k=0 k!
folgt mit dem Majorantenkriterium (Satz 5.6) die Existenz von


Ak
exp(A) :=  ,
k=0 k!
wobei die Konvergenz der Reihe hier im Banachraum L (IRd ), ausgestattet mit der
Operatornorm, zu verstehen ist.
Gelegentlich schreibt man auch eA an Stelle von exp(A).
Wir beginnen mit einigen Beispielen im Fall d = 2.
Beispiele:

 0 k 0
(1) Sei A = mit  ,  ∈ IR. Für k ∈ IN0 ist dann Ak = , also
0  0 k

e 0
exp(A) = .
0 e

0 
(2) Sei nun A = mit  ∈ IR.
− 0
0 1
Hier haben wir A0 = id, A2 = − 2 id, A3 = − 3 , A4 =  4 id,
−1 0

5 5 0 1
A =
−1 0
usw. Damit erhalten wir

⎛   ⎞
 2k  2k+1
⎜ k=0 (−1)k (2k)!  (−1)k (2k+1)! ⎟
⎜ k=0 ⎟ cos  sin 
exp(A) = ⎜ ⎟= .
⎝   2k+1

 2k ⎠ − sin  cos 
−  (−1)k (2k+1)!  (−1)k (2k)!
k=0 k=0

 1
(3) Zu A = mit  = 0 wollen wir exp(tA), t ∈ IR, bestimmen.
0 

(t  )k kt k  k−1
Eine einfache Rechnung liefert (tA)k = für k ∈ IN und
0 (t  )k
⎛   ⎞
(t  )k (t  )k
 t 
⎜ k=0 k!
k=0
k! ⎟ et  tet 
⎜ ⎟
exp(tA) = ⎜ ⎟= .
⎝ 
(t  )k ⎠ 0 et 
0  k!
k=0
Um einige wichtige Eigenschaften der matrix-wertigen Exponentialfunktion zeigen

zu können, notieren wir folgende Hilfsaussage.
Lemma 16.9. Seien A und B zwei (d × d)-Matrizen. Es gilt

   n
An Bn Ak Bn−k
 n!  n! =   k! (n − k)! .
n=0 n=0 n=0 k=0
Beweis. Man kann den Beweis von Satz 5.17 wörtlich übernehmen. An die Stelle
des Absolutbetrags tritt hier die Operatornorm.

16.3 Lineare Systeme von Differentialgleichungen 243
Satz 16.10. Seien A und B zwei beliebige (d × d)-Matrizen sowie T eine weitere
invertierbare (d × d)-Matrix.
(a) Ist B = T −1 AT , so gilt exp(B) = T −1 exp(A) T .
(b) Wenn AB = BA gilt, dann ist exp(A + B) = exp(A) exp(B).
(c) Es gilt exp(−A) = (exp(A) )−1 ; insbesondere ist also exp(A) invertierbar.
Beweis. (a) Aus (T −1 AT )k = T −1 Ak T erhalten wir

n
Ak n
(T −1 AT )k
T −1
 k! T =  k! für alle n ∈ IN
k=0 k=0
und mit n →  dann die Behauptung.

(b) Wegen AB = BA ergibt sich mit der Binomialformel
n n
n n n−k An Bn−k
(A + B) = 
n
A B = n!  .
k=0 k k=0 k! (n − k)!
Nun folgt mit Lemma 16.9 die Behauptung.

(c) Die Aussage folgt nun unmittelbar, wenn wir B = −A einsetzen.

Bemerkungen:
(1) Die Gleichung exp(A + B) = exp(A) exp(B) gilt im Allgemeinen nicht!

0 1 0 0
Ein Gegenbeispiel erhalten wir mit A = ,B= . Hier ist
0 0 1 0

0 0
A2 = = B2 ,
0 0

2 1
also exp(A) = id + A, exp(B) = id + B und weiter exp(A) exp(B) = .
1 1
Andererseits ist (A+B)2 = id. Für alle k ∈ IN0 haben wir damit (A+B)2k = id
sowie (A + B)2k+1 = A + B. Daher gilt
⎛   ⎞
1 1
 (2k)!  (2k+1)!
⎜ k=0 k=0 ⎟ 2 1
exp(A + B) = ⎜
⎝
⎟ =
⎠ .

1

1
1 1
 (2k+1)!  (2k)!
k=0 k=0
(2) Wenn v ∈ IRd ein Eigenvektor von A zum Eigenwert  ist, dann folgt

n n
Ak v k
exp(A) v = lim  = lim  v = e v .
k=0 k! k=0 k!
n→ n→
Also ist v ein Eigenvektor auch von exp(A), ebenfalls zum Eigenwert  .
Satz 16.11. Sei A eine (d × d)-Matrix.

Die Funktion t → exp(tA) ist differenzierbar, d.h. der Grenzwert
exp( (t + h)A) − exp(tA) d

lim = exp(tA)
h→0 h dt
existiert (im Banachraum L (IRd ) mit der Operatornorm). Weiter gilt
d
exp(tA) = A exp(tA) = exp(tA) A .
dt
Beweis. Mit Satz 16.10(b) erhalten wir
exp(hA) − id exp( (t + h)A) − exp(tA) exp(hA) − id

exp(tA) = = exp(tA)
h h h
und wegen
" " " " "  k−1 k " " "
" exp(hA) − id " " exp(hA) − id − hA " " " h A " "  hk Ak+1 "
" " "
" − A" " " = " " = "
" h "= " h " " k! " " (k + 1)!
"
"
k=2 k=1

hAk
≤ A  = A ehA − 1 → 0 mit h → 0
k=1 k!
exp(hA) − id
gilt lim = A.

h→0 h
Satz 16.12. Sei A eine (d × d)-Matrix. Das Anfangswertproblem
x = Ax , x(t0 ) = x0
besitzt eine eindeutige Lösung y : IR → IRd . Diese ist gegeben durch
y(t) = exp( (t − t0 )A) x0 .
Beweis. Mit Hilfe von Satz 16.10 und Satz 16.11 erhalten wir

d d
y (t) = (exp(−t0 A) exp(tA) x0 ) = exp(−t0 A) exp(tA) x0
dt dt
= exp(−t0 A) A exp(tA) x0 = A exp( (t − t0 )A) x0 = Ay(t) .
Die Anfangsbedingung y(t0 ) = x0 ist offensichtlich.

Die Eindeutigkeit der Lösung folgt mit Korollar 16.5, da die Abbildung (t, x) → Ax
Lipschitz-stetig bezüglich x ist mit Lipschitz-Konstante L = A, wie wir ganz zu
Beginn dieses Abschnitts schon festgestellt haben.

Um die Lösung des Anfangswertproblems zu finden, muss man exp(tA) gar nicht
explizit bestimmen, wenn man weitere Kenntnisse aus der Linearen Algebra hinzu-
16.4 Aufgaben 245
zieht. Ist etwa J eine Jordan-Normalform von A, so gibt es eine invertierbare Ma-
trix S mit A = S−1 JS, also tA = S−1 (tJ)S, und laut Satz 16.10(a) brauchen wir nur
exp(tJ) zu bestimmen. Wenn A diagonalisierbar ist, d.h. wenn J Diagonalgestalt hat,
dann fällt dies besonders leicht:
Sei A eine (d × d)-Matrix, die d linear unabhängige Eigenvektoren v1 , . . . , vd
besitzt. Bezeichne 1 , . . . , d die zugehörigen Eigenwerte. Dann kann man
⎛ ⎞
1
⎜ ⎟
J = ⎝ ... ⎠ und S−1 = (v1 , . . . , vd )
d

wählen, also S−1 exp(tJ) = e1t v1 , . . . , ed t vt und mit S exp(−t0 A)x0 =: c ∈ IRd
erhalten wir
y(t) = exp( (t − t0 )A) x0 = exp(tA) exp(−t0 A) x0 = S−1 exp(tJ) S exp(−t0 A) x0

d
=  ck e k t vk
k=1
als Lösung des Anfangswertproblems. ⎛ ⎞ ⎛ ⎞

1 0 0 1
Beispiel: Das Anfangswertproblem x = Ax, x(0) = ⎝ 2 ⎠ mit A = ⎝ 0 −2 0 ⎠.
3 1 0 0
Wegen det(A −  id) =  2 (−2 −  ) − (−2 −  ) = −( 2 − 1)( + 2) hat A die
Eigenwerte 1 = 1, 2 = −1 und 3 = −2. Zugehörige Eigenvektoren können wir
auch leicht bestimmen, etwa
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 1 0
v1 = ⎝ 0 ⎠ , v2 = ⎝ 0 ⎠ und v3 = ⎝ 1 ⎠ .
1 −1 0
Damit hat die Lösung y die Form y(t) = c1 et v1 + c2 e−t v2 + c3 e−2t v3 und mit der
Anfangsbedingung erhalten wir c1 = 2, c2 = −1 sowie c3 = 2.
16.4 Aufgaben
1. Sei f : [0, [ → IR stetig. Wir betrachten das Anfangswertproblem
x = f (t) , x(0) = x0
mit x0 ∈ IR, d.h. die rechte Seite der Differentialgleichung hängt nur von t ab.
Zeigen Sie, dass das Verfahren von Picard-Lindelöf (Satz 16.3) in diesem Fall
bereits im ersten Schritt die Lösung liefert.
2. Bestimmen Sie die Lösungen folgender Anfangswertprobleme mit dem Verfah-

ren aus Satz 16.8.
a. x = (a − bx)x , x(0) = x0 > 0 (a, b > 0)
b. x = ax + b , x(0) = x0 (a, b ∈ IR)
c. x = cos2 x , x(0) = x0
d. x = x2 − 1 , x(0) = x0
2t
e. x = x, x(0) = x0
t2 + 1
3. Lösen Sie das Anfangswertproblem


x = (t + x)2 , x(0) = .
4
Hinweis: Betrachten Sie z(t) := x(t) + t.
4. Gegeben ist das Anfangswertproblem
t x (t) = 2x(t) , x(t0 ) = x0 .
a. Bestimmen Sie im Fall t0 = 0 eine Lösung mit dem Verfahren aus Satz 16.8.
b. Zeigen Sie, dass das Anfangswertproblem auch für t0 = 0 und x0 = 0
Lösungen besitzt.
c. Was können Sie über die lokale Eindeutigkeit der Lösungen aussagen ?
5. Bestimmen Sie die Lösung des Anfangswertproblems
x = ex sint , x(t0 ) = x0
in Abhängigkeit der Anfangswerte (x0 ,t0 ) ∈ IR2 sowie jeweils das zugehörige
maximale Definitionsintervall.
6. Bestimmen Sie die Lösungen der Anfangswertprobleme x = Ax, x(0) = x0 mit

1 2 3
a. A = , x0 =
2 1 0

0  1
b. A = , x0 = ,  ∈ IR, vgl. Kapitel 16.3, Beispiel (2)
− 0 0

 1 1
c. A= , x0 = ,  = 0, vgl. Kapitel 16.3, Beispiel (3)
0  1
16.4 Aufgaben 247
7. Bestimmen Sie Lösungen der Differentialgleichung
m x + d x + k x = 0 (16.4)
mit m > 0, d 2 − 4mk = 0. Gehen Sie dabei wie folgt vor.

a. Nehmen Sie an, es existieren zwei Lösungen x1 und x2 . Setzen Sie
W := x1 x2 − x1 x2
und zeigen Sie W = − md W .

d
b. Sei  := − 2m . Folgern Sie, dass W (t) = ce2 t gilt mit einem c ∈ IR.
c. Verifizieren Sie, dass x1 (t) := e t eine Lösung von (16.4) ist.
d. Setzen Sie y(t) := e− t x2 (t). Zeigen Sie, dass y (t) = c gilt und bestimmen
Sie damit x2 .
8. Allgemeine Differentialgleichung höherer Ordnung.

Gegeben ist die Differentialgleichung
y(d) + ad−1y(d−1) + . . . + a1y + a0 y = 0 (16.5)
mit a0 , . . . , ad−1 ∈ IR.

a. Schreiben Sie die Gleichung (16.5) als eine Differentialgleichung der Form
x = A x mit einer reellen (d × d)-Matrix A und
⎛ ⎞
y
⎜ y ⎟
⎜ ⎟
⎜ y ⎟
x := ⎜ ⎟.
⎜ .. ⎟
⎝ . ⎠
y(d−1)
b. Zeigen Sie, dass eine Zahl  ∈ C genau dann Eigenwert von A ist, wenn 
eine Lösung der so genannten charakteristischen Gleichung
 d + ad−1 d−1 + . . . + a0 = 0
zu (16.5) ist.
Hinweis: Entwickeln Sie det(A −  id) nach der letzten Zeile.
c. Bestimmen Sie für jeden Eigenwert  von A einen zugehörigen Eigenvek-
tor von A.
Literaturverzeichnis
[1] H.W. Alt, Lineare Funktionalanalysis, 5. Auflage (Springer, Berlin Heidelberg, 2006)
[2] R. Beals, Analysis, An Introduction (Cambridge University Press, 2004)
[3] O. Deiser, Reelle Zahlen, 2. Auflage (Springer, Berlin Heidelberg, 2008)
[4] J. Dieudonné, Foundations of Modern Analysis (Academinc Press, New York, 1960)
[5] G. Fischer, Lineare Algebra, 17. Auflage (Vieweg+Teubner, Wiesbaden, 2010)
[6] W. Forst, D. Hoffmann, Gewöhnliche Differentialgleichungen, Theorie und Praxis
(Springer, Berlin Heidelberg, 2005)
[7] O. Forster, Analysis 1, 10. Auflage (Vieweg+Teubner, Wiesbaden, 2011)
[8] O. Forster, Analysis 2, 9. Auflage (Vieweg+Teubner, Wiesbaden, 2011)
[9] H. Heuser, Lehrbuch der Analysis, Band 1 (Teubner, Stuttgart, 1980)
[10] K. Jänich, Topologie, 8. Auflage (Springer, Berlin Heidelberg, 2005)
[11] C. Karpfinger, K. Meyberg, Algebra (Spektrum Akademischer Verlag, Heidelberg, 2009)
[12] H. Koch, Einführung in die Mathematik (Springer, Berlin Heidelberg, 2002)
[13] K. Königsberger, Analysis 1, 6. Auflage (Springer, Berlin Heidelberg, 2003)
[14] K. Königsberger, Analysis 2, 5. Auflage (Springer, Berlin Heidelberg, 2003)
[15] J. Matoušek, J. Nešetřil, Diskrete Mathematik, 2. Auflage
[16] A.M. Ostrowski, Vorlesungen über Differential- und Integralrechnung, Band 1
(Birkhäuser, Basel, 1945)
[17] R. Remmert, G. Schumacher, Funktionentheorie 1, 5. Auflage
[18] B. von Querenburg, Mengentheoretische Topologie, 3. Auflage
[19] W. Rudin, Principles of Mathemtical Analysis, 3rd edition
(McGraw Hill, London et.al., 1976)
[20] A. Taraz, Diskrete Mathematik (Birkhäuser, Basel, 2010)
[21] D. Werner, Einführung in die höhere Analysis (Springer, Berlin Heidelberg, 2006)
[22] D. Werner, Funktionalanalysis, 5. Auflage (Springer, Berlin Heidelberg, 2005)

DOI 10.1007/978-3-642-28644-5, © Springer-Verlag Berlin Heidelberg 2012
Sachverzeichnis
A Banachscher Fixpunktsatz 218, 233

Bernoulli-Ungleichung 7
Abelsche partielle Summation 64 Bernsteinpolynom 136
Abelscher Grenzwertsatz 148 Berührpunkt 173
abgeschlossen 10, 166, 173 beschränkt 12, 19, 45, 48
abgeschlossene Hülle 173 nach oben 12
Ableitung 97, 182 nach unten 12
partielle 193, 195 Besselsche Ungleichung 46
totale 192 Betrag 8, 17
zweite 101, 203 Binomialformel 8, 15
Abschluss 173 Binomialkoeffizient 8, 69
absolut konvergent 58 Binomialreihe 70
Absolutbetrag 8, 17 Bolzano-Weierstraß 49
Abstand 37
Additionstheoreme C
für Sinus und Cosinus 72
Alternierende Harmonische Reihe 149
Cauchyfolge 42
alternierende Reihe 65
Cauchy-Produkt 67
Anfangswertproblem 233
Cauchy-Riemannsche
Approximation
Differentialgleichungen 210, 211
durch Polynome 137
Cauchy-Schwarz-Ungleichung 40, 46, 73
durch Treppenfunktionen 115
durch trigonometrische Polynome 157 Cosinus Hyperbolicus 112
Äquivalenz Cosinusreihe 69
von Normen 54, 179
Archimedisches Axiom 7 D
Arcus-Sinus 109
Arcus-Tangens 110 Diffeomorphismus 215
Potenzreihendarstellung 135 Differentialquotient 97
Arithmetisch-geometrisches Mittel 36 differenzierbar 97, 191
Arithmetrisches Mittel 16 differenzierbare Kurve 182
Astroide 189 Dirichlet-Kern 154
asymptotisch gleich 30 Dirichletsche Reihe 77
diskrete Metrik 37, 95
B divergent gegen  50
Dreiecksungleichung 8, 18, 37, 38
Banachraum 42 dritte Einheitswurzeln 19
251
252 Sachverzeichnis
E konvergent 130
stetig 92
Einheitskugel 41 globale Lipschitzbedingung 237
Endomorphismus 178 globaler Existenz- und Eindeutigkeitssatz
 -Netz 166 238
Entwicklungspunkt 68, 142, 147 Gradient 193
Euklidischer Raum 41 Grenzwert 24
Eulersche Formel 71 rechts-/linksseitiger 88
Eulersche Zahl 10, 56 größte untere Schranke 12
Irrationalität 143
 -Umgebung 166 H
Existenz- und Eindeutigkeitssatz 238
Exponentialfunktion 71 halboffen 10
Exponentialreihe 69, 71 Hamming-Abstand 38
für Matrizen 241 harmonische Funktion 210
Extremum Harmonische Reihe 56
isoliertes 207 Harmonisches Mittel 16
lokales 102 Häufungswert 49
Hauptsatz der Differential- und
F Integralrechnung 119
Hessematrix 207
Fakultät 8 Hilbertraum 46
Feinheit 113
I
Fejér-Kern 154
Fibonacci-Zahlen 76
Identitätssatz für Potenzreihen 147
Fixpunktsatz
imaginäre Einheit 17
für stetige reellwertige Funktionen 86
Imaginärteil 17
von Banach 218, 233
indefinit 207
Folge 23
Induktion 5
beschränkte 41
Infimum 12
rekursiv definierte 31
Integral 113, 115
folgenkompakt 165
unbestimmtes 121
Folgenkriterium 81
uneigentliches 124
Fourierkoeffizient 152
von Treppenfunktionen 113
Fourierreihe 152
Integralsinus 140
Fundamentalsatz der Algebra 19
integrierbar 115
Funktionalgleichung
Intervall 10
der Exponentialfunktion 71
Intervallschachtelung 10
des Logarithmus 34
Funktionalmatrix 196 J
G Jacobimatrix 196
Gammafunktion 127 K
Gaußklammer 15
Geometrische Reihe 25, 55, 58 Kardioide 189
Geometrisches Mittel 16 Kettenregel 99, 194
gerade Funktion 149 kleinste obere Schranke 12
geschlossener Weg 182 kompakt 167
gleichmäßig in IKd 173
approximierbar komplexe Zahlen 17
durch Polynome 137 komplexer Logarithmus 222
durch Treppenfunktionen 115 konjugiert komplexe Zahl 18
durch trigonometrische Polynome 157 kontrahierend 218
Sachverzeichnis 253
konvergent 24, 42 Minkowski-Ungleichung 40

absolut 58 Minorantenkriterium 59
gleichmäßig 130 Mittelwertsatz 104
im quadratischen Mittel 139, 160 monoton fallend 26, 87
uneigentlich 50 monoton wachsend 26, 87
Konvergenzradius 68, 147 Multiplikatorregel von Lagrange 226
konvexe Funktion 111
konvexe Menge 200 N
Körper
archimedisch angeordneter 7 Nabla 193
kommutativer 6 natürliche Metrik 37
kritischer Punkt 207 natürlicher Logarithmus 34, 89
negativ definit 207
L Neilsche Parabel 183, 189
Newtons Gesetz 232
Lagrange-Multiplikator 226 Niveaumenge 198
Lagrange-Restglied 142 Norm 38
Länge auf IKd 39
der Zykloide 187 normierter Raum 38
einer Kurve 184 Nullfolge 24
eines Funktionsgraphen 187 Nullstellensatz 84
eines Intervalls 10
O
Laplace-Operator 210
Leibniz-Kriterium 65 obere Schranke 12
L’Hospitalsche Regeln 106, 107 offen 10, 166, 175
Limes 24 offene Überdeckung 167
Limes inferior 50 Operatornorm 178
Limes superior 50 orientierungstreu 187
lineare Abbildung 177 orthogonal 45
lineare Approximation 98, 191 orthonormal 45
linksseitiger Grenzwert 88
Lipschitzbedingung 234 P
globale 237
Lipschitz-Konstante 234, 237 Parametertransformation 187
Lipschitz-stetig 94 parametrisiert nach der Länge 188
bezüglich x 237 Parsevalsche Gleichung 161
logarithmische Spirale 190 Partialsumme 25, 55
Logarithmus 34, 89 partielle Ableitung 193, 195
komplexer 222 partielle Integration 121
Potenzreihendarstellung 148 Partition 113
Logistische Gleichung 231 periodische Funktion 151
lokal injektiv 221 Polarkoordinaten 214
lokales Extremum 102, 207 positiv definit 207
Lotka-Volterra-Gleichung 232 Potenzfunktion 91
Potenzreihe 68
M Ableitung 134, 147
absolute Konvergenz 134
Majorantenkriterium 59 Entwicklungspunkt 147
Maximum 12 gleichmäßige Konvergenz 134
lokales 102 Identitätssatz 147
Metrik 37 Stammfunktion 135, 148
metrischer Raum 37 Stetigkeit 83, 147
Minimum 12 Prähilbertraum 45
lokales 102 Produktregel 98
254 Sachverzeichnis
Q Supremum 12
Supremumseigenschaft 12
Quotientenkriterium 60
für Potenzreihen 68 T
Quotientenregel 98
Tangens 110
R Tangente 182
Taylorentwicklung in IRn 206
rationale Funktion 82
Taylorpolynom 142
rationale Zahlen 5
Taylorreihe 142
Räuber-Beute-Modell 232
Teilfolge 48
Realteil 17
Teilung 113
rechtsseitiger Grenzwert 88
Topologie 175
reelle Zahlen 10
total beschränkt 166
Regelfunktion 115
totale Ableitung 192
reguläre Kurve 182
Treppenfunktion 113
Reihe 25, 55
trigonometrisches Polynom 151
absolut konvergente 58
alternierende 65 U
Geometrische 25, 55, 58
Harmonische 56 Überdeckung 167
rekursiv definierte Folge 31 Umgebung 166
Richtungsableitung 197 Umordnung 66
Riemann-Lebesgue-Lemma 158 Umparametrisierung 187
unbestimmtes Integral 121
S
uneigentlich
Satz integrierbar 124
über implizite Funktionen 224 konvergent 50
linearer Fall 223 ungerade Funktion 149
von Bolzano-Weierstraß 49 untere Schranke 12
von Darboux 105
von der lokalen Umkehrbarkeit 218 V
von Fejér 157
Verdichtungskriterium 62
von Picard-Lindelöf 234
Verhulst-Pearl-Gleichung 231
von Pythagoras 46
vollständig 10, 42
von Rolle 103
vollständige Induktion 5
von Schwarz 204
Volterra-Lotka-Gleichung 232
von Taylor 141
Schrankensatz 186 W
singulärer Punkt einer Kurve 182
Sinus Hyperbolicus 112 Wallissches Produkt 31, 122
Sinus Integralis 140 Weg 182
Sinusreihe 69 Weierstraßscher Approximationssatz 137
Skalarprodukt 45 für periodische Funktionen 157
Stammfunktion 105 Wurzel 10
stationärer Punkt 207 Wurzelkriterium 61
stetig 79 für Potenzreihen 68
gleichmäßig 92
stetig differenzierbar 101, 201, 205 Z
streng konvex 111
streng monoton fallend 87 Zerfallsprozess 231
streng monoton wachsend 87 Zweig des komplexen Logarithmus 222
stückweise stetig differenzierbare Kurve 182 zweite Ableitung 101, 203
Submultiplikativität der Operatornorm 178 Zwischenwertsatz 85
Substitutionsregel 123 Zykloide 187
Bezeichnungen und Symbole
· 38 Dk f 195
·  39, 41 Du f 197
· 1 , · 2 39, 73, 160 df
97
dt
· M 82 f
·, · 45, 74, 160 x 193, 195
b
f (x) dx 113, 115 ∃ 2
a
f (x) dx 121 e 10, 56
 193 exp 69, 71, 241
 210 f)(k) 152
∀ 2 f 97, 192
A 173 f (n) 101
[a, b], ]a, b[, ]a, b], [a, b[ 9 f −1 87, 108
(an )n∈IN 23 f ◦g 81
(ank )k∈IN 48 f |J 117
an → a 24 F(x)|ba 121
arcosh 112 grad f 193
arcsin 109 Hf 207
arsinh 112 i 17
arctan 110 Im z 17
B(M) 45 inf 12
C 17 IK 37
cos 69 Kr (a) 18, 41
√
cos2 x 85 k
x 10
cosh 112  41
C(X), C(X,Y ) 79 1 , 2 73
C1 (U, IRm ), C1 (U) 201 l( ) 184
Ck (U, IRm ), Ck (U) 205 lim an 24
n→
Cn (I), C (I) 101 lim sup an , lim inf an 50
Cp 160 n→ n→
Df 192, 196 lim f (x) 81

x→p
255
256 Bezeichnungen und Symbole

lim f (x), lim f (x) 88  ck zk 68
x→p+0 x↓0 k=0
ln 34, 90 Si 140
L (V ), L (V,W ) 178 sin 69
(M, d) 37 sin2 x 85
IN 5 sinh 112
IN0 5 Sn ( f ), n ( f ) 155
n! 8 Sr (a) 41
n
k 8, 69 sup 12
 85 T ([a, b]) 114
n
 ak 31 tan 110
k=1 T f (t) 142
Q 5 Tn (t; f ) 141
IR 10 Ur (a) 18, 41
R([a, b]) 115 [x] 15
Rp 152 xz 91
Re z 17 ZZ 5
n
 ak 8 z 18
k=1

 an 25
n=1

10.1007 - 978 3 642 28644 5 PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

10.1007 - 978 3 642 28644 5 PDF

Hochgeladen von

Copyright:

Verfügbare Formate

Springer-Lehrbuch

Rupert Lasser Frank Hofmaier

Ein Wegweiser zum Studienbeginn

ISBN 978-3-642-28643-8 ISBN 978-3-642-28644-5 (eBook)

Mathematics Subject Classification (2010): 97I10, 97I30, 97I40

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist eine Marke von Springer DE.

Garching b. München, Rupert Lasser

1 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3 Folgen reller und komplexer Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4 Metrische Räume und Cauchyfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

5.6 Die Räume 1 , 2 und  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

9 Funktionenfolgen und gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . 129

13 Normierte Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

14 Totale Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

15 Umkehrsatz und implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

16 Elementar lösbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 231

Bezeichnungen und Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255

Der Gegenstand der Mathematik ist schwer zu umgrenzen, jedenfalls schwieriger

Insofern ließe sich als Gegenstand der Mathematik

Der mathematische Formalismus ist kein überflüssiges Glasperlenspiel“. Die kom-

Newton hingegen entwickelte die Differential- und Integralrechnung innerhalb der

Die Fluxion“ bezeichnet dann ẋ, die Ableitung nach t.

1.1 Archimedisch angeordnete Körper

Die Rechenoperationen (Addition, Multiplikation) führen uns von den natürlichen

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 5

Die Menge Q genügt der folgenden Definition.

Folgerungen: Sei K ein kommutativer Körper. Für a, b ∈ K gilt dann

Definition 1.2. Ein kommutativer Körper K heißt angeordneter Körper, falls in

Schreibweisen: Ist −a > 0, so heißt a negativ und man schreibt a < 0.

Einfache Folgerungen aus (A1) und (A2):

Satz 1.3 (Bernoulli-Ungleichung). Sei K ein angeordneter Körper. Für jedes x ∈ K

Beweis. Wir beweisen die Ungleichung mittels vollständiger Induktion.

und die Ungleichung ist auch für n + 1 erfüllt. 

Mit dem archimedischen Axiom folgt:

(2) |a + b| ≤ |a| + |b| und

(2) Wir setzen 0! := 1 sowie (n + 1)! := (n + 1) (n!) für n ∈ IN0 , also 1! = 1,

Seien K ein kommutativer Körper, a, b ∈ K und n ∈ IN. Wenn wir (a + b)n

1.2 Intervallschachtelung und Vollständigkeit

wobei wir im vorletzten Schritt die Bernoulli-Ungleichung verwendet haben. Eben-

In einem angeordneten kommutativen Körper K bezeichnen wir (a, b ∈ K, a ≤ b)

[a, b] := {x ∈ K : a ≤ x ≤ b} [a, b[ := {x ∈ K : a ≤ x < b}

Definition 1.6. Sei K ein archimedisch angeordneter kommutativer Körper. Ei-

Es gibt weitere äquivalente Charakterisierungen der Vollständigkeit, siehe Kapi-

Eine Näherung (im Dezimalsystem) für e ist

Beweis. Sei zunächst x ≥ 1. Wir konstruieren eine Intervallschachtelung In = [an , bn ]

|Ink | = bkn − akn = (bn − an)(bk−1

Wir zeigen s = sup A. Dazu ist nachzuweisen:

sup(A + B) = sup A + supB ,

Beweis. Seien  := sup A,  := sup B.

(b) Aus a ≤  ∀a ∈ A und b ≤  ∀b ∈ B folgt a + b ≤  +  ∀a ∈ A, b ∈ B, also

Satz 1.13. Sei A ⊆ IN ⊆ IR eine nicht-leere Menge natürlicher Zahlen. Es gilt:

Satz 1.14. (a) Zu jedem x ∈ IR existiert genau ein k ∈ ZZ mit k ≤ x < k + 1.

1. Beweisen Sie die im Anschluss an Definition 1.1 angegebenen Folgerungen.

3. Beweisen Sie die nach Definition 1.2 genannten Folgerungen.

4. Zeigen Sie, dass IF2 := {⊥, } mit den durch

erklärten Operationen ein kommutativer Körper ist.

5. Seien K ein kommutativer Körper, a, b ∈ K und n ∈ IN.

mittels vollständiger Induktion nach.

6. Zeigen Sie: Zu jedem  > 0 gibt es ein N ∈ IN mit

7. Besitzen die folgenden Mengen ein Minimum, Maximum, Infimum, Supre-

und die Ungleichung ist auch für n + 1 erfüllt.

4. Zeigen Sie, dass IF2 := {⊥, } mit den durch

für alle n ≥ N. Es ist also lim cn = a wie behauptet.