Sie sind auf Seite 1von 254

Springer-Lehrbuch

Rupert Lasser  Frank Hofmaier

Analysis 1 C 2

Ein Wegweiser zum Studienbeginn


Rupert Lasser Frank Hofmaier
Technische Universität München, Technische Universität München,
Deutschland Deutschland

ISBN 978-3-642-28643-8 ISBN 978-3-642-28644-5 (eBook)


DOI 10.1007/978-3-642-28644-5

Mathematics Subject Classification (2010): 97I10, 97I30, 97I40

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;


detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

Springer Spektrum
© Springer-Verlag Berlin Heidelberg 2012

Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht
ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags.
Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und
die Einspeicherung und Verarbeitung in elektronischen Systemen.

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk be-
rechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der
Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann
benutzt werden dürften.

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer Spektrum ist eine Marke von Springer DE.


Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media
www.springer-spektrum.de
Vorwort

Das vorliegende Buch beruht auf den Vorlesungen Analysis 1 und Analysis 2 im
Bachelor-Studium der Mathematik an der Technischen Universität München.
Die Analysis ist sicherlich eine der ältesten und anwendungsreichsten Theori-
en und somit ein klassisches Fach der Mathematik. Insofern kann dieses Buch nur
Ergebnisse enthalten, die wohlbekannt und auch in zahlreichen weiteren Büchern
zur Analysis zu finden sind. Unsere Referenzliste enthält nur einen kleinen Teil der
Gesamtheit von Lehrbüchern zu diesem Thema.
Über das gesamte Lehrbuch hinweg legen wir Wert auf die mathematische Präzi-
sion. Durch zahlreiche motivierende Beispiele werden die mathematischen Sach-
verhalte beleuchtet, der Idee folgend Abstraktes mit Konkretem zu verknüpfen.
Das Buch ist in 16 Kapitel unterteilt. Die ersten beiden Abschnitte geben die not-
wendigen Grundlagen zu reellen und komplexen Zahlen. Der zentrale Begriff der
Konvergenz steht im Mittelpunkt der drei folgenden Kapitel. Konvergenz wird nicht
nur im Bereich der reellen oder komplexen Zahlen sondern allgemein in metrischen
Räumen studiert. Es folgen Abschnitte über Stetigkeit, Differentiation und Integra-
tion. Die Kapitel 9 bis 11 befassen sich mit Konvergenz von Funktionsfolgen, insbe-
sondere Taylorreihen und Fourierreihen. Die wichtige Eigenschaft der Kompaktheit
bildet den Inhalt von Kapitel 12. Als vorbereitender Teil werden dann Grundlagen
zu normierten Vektorräumen präsentiert. Differenzierbarkeit im Mehrdimensiona-
len, Umkehrsatz und implizite Funktionen bilden die Basis der mehrdimensionalen
Analysis und sind Inhalt der Kapitel 14 und 15. Im letzten Kapitel werden elemen-
tare Lösungsmethoden von gewöhnlichen Differentialgleichungen vorgestellt.
Das vorliegende Buch umfasst somit die Analysis der ersten beiden Semester
des Bachelor-Studiums Mathematik und gibt an vielen Stellen Einblick in darüber-
hinaus gehende mathematische Sachverhalte. Eine Reihe von Übungsaufgaben am
Ende jedes Kapitels runden das Werk ab.

Garching b. München, Rupert Lasser


Februar 2012 Frank Hofmaier

v
Inhaltsverzeichnis

Einleitende Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5


1.1 Archimedisch angeordnete Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Intervallschachtelung und Vollständigkeit . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Supremumseigenschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17


2.1 Konstruktion der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3 Folgen reller und komplexer Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23


3.1 Folgen und Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Rechnen mit Grenzwerten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3 Asymptotische Gleichheit und rekursiv definierte Folgen . . . . . . . . . 30
3.4 Eine Intervallschachtelung für den Logarithmus . . . . . . . . . . . . . . . . . 32
3.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Metrische Räume und Cauchyfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37


4.1 Metrische und normierte Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Cauchyfolgen und Vollständigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3 Skalarprodukt und Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4 Teilfolgen und Häufungswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.1 Konvergenz und absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3 Umordnungssatz und Cauchy-Produkt . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.4 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.5 Exponentialreihe und Eulersche Formel . . . . . . . . . . . . . . . . . . . . . . . . 71

vii
viii Inhaltsverzeichnis

5.6 Die Räume 1 , 2 und  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73


5.7 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.1 Stetige Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.2 Eigenschaften stetiger reellwertiger Funktionen . . . . . . . . . . . . . . . . . 84
6.3 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.4 Stetige Funktionen auf [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

7 Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.1 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.2 Mittelwertsatz und lokale Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.3 Ableitung der Umkehrfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

8 Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.1 Regelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.2 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 119
8.3 Methoden zur Berechnung von Integralen . . . . . . . . . . . . . . . . . . . . . . 121
8.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

9 Funktionenfolgen und gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . 129


9.1 Gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
9.2 Differentiation und Integration von Potenzreihen . . . . . . . . . . . . . . . . 133
9.3 Der Approximationssatz von Weierstraß . . . . . . . . . . . . . . . . . . . . . . . 136
9.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

10 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
10.1 Der Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt . . . . . . . . . . . . . . . 145
10.3 Der Abelsche Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
10.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

11 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
11.1 Trigonometrische Polynome und Fourierkoeffizienten . . . . . . . . . . . . 151
11.2 Konvergenz nach Dirichlet und Fejér . . . . . . . . . . . . . . . . . . . . . . . . . . 154
11.3 Konvergenz im quadratischen Mittel . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
11.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

12 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
12.1 Kompakte metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
12.2 Charakterisierung kompakter Mengen . . . . . . . . . . . . . . . . . . . . . . . . . 171
12.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Inhaltsverzeichnis ix

13 Normierte Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177


13.1 Stetige lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
13.2 Kurven in Vektorräumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
13.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

14 Totale Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191


14.1 Totale und partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
14.2 Richtungsableitungen und Niveaumengen . . . . . . . . . . . . . . . . . . . . . . 196
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen . . . . . . . . . . . 199
14.4 Ableitungen höherer Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
14.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

15 Umkehrsatz und implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213


15.1 Invertierbare lineare Abbildungen und Diffeomorphismen . . . . . . . . . 213
15.2 Lokale Invertierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
15.3 Implizit definierte Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
15.4 Extrema unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
15.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

16 Elementar lösbare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 231


16.1 Der Satz von Picard-Lindelöf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
16.2 Differentialgleichungen mit getrennten Variablen . . . . . . . . . . . . . . . . 239
16.3 Lineare Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . . . . 241
16.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251

Bezeichnungen und Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255


Einleitende Anmerkungen

Wesen

Der Gegenstand der Mathematik ist schwer zu umgrenzen, jedenfalls schwieriger


als der von Physik, Chemie oder Brauwissenschaft etc. Für Mathematik ist nicht ihr
Gegenstand charakterisierend als vielmehr die Art des Schließens. Von Alexander
Markowitsch Ostrowski (1893-1986, Basel) [16] stammt folgendes Zitat:
Jedesmal, wenn man aus einem endlichen, übersichtlich dargestellten System von scharf

formulierten Prämissen logisch einwandfreie Schlüsse zieht, treibt man Mathematik.“

Insofern ließe sich als Gegenstand der Mathematik


alles beschreiben, was sich auf endlich viele scharf formulierte Grundtatsachen (Axiome)

zurückführen lässt.“

Auf diesem Hintergrund erklären sich zumindest die Wesenszüge, die die Mathe-
matik auszeichnen,
• die Schärfe der Begriffsbildung,
• die pedantische Sorgfalt im Umgang mit Definitionen,
• die Strenge der Beweise,
• die abstrakte Natur der mathematischen Objekte.

Mathematische Symbole

Um der lückenlosen Exaktheit und Klarheit zu genügen, hat sich eine Darstellung
mathematischer Überlegungen entwickelt (math. Symbolik), die für Nichtspezialis-
ten (bzw. nicht präzise und klar formulierende Personenkreise) schwer zugänglich
ist. Hermann Weyl (1885-1955, Princeton) sagt:
Ein auffälliger Zug aller Mathematik, der den Zugang zu ihr dem Laien so sehr erschwert,

ist der reichliche Gebrauch von Symbolen.“

1
2 Einleitende Anmerkungen

Der mathematische Formalismus ist kein überflüssiges Glasperlenspiel“. Die kom-



plexen Zusammenhänge, die höchsten Grad präziser Beschreibung bedürfen, lassen
sich verbal und romanhaft nicht mehr darstellen. (Ein schönes Beispiel findet man
in der Einleitung im Buch von H.Heuser: Lehrbuch der Analysis [9]).
Wir werden uns weitgehend an übliche Notation und Konventionen halten. Sym-
bole wie z.B. ∀ ( für alle“) oder ∃ ( es existiert...“) und Begriffe wie etwa Menge
” ”
oder Abbildung, die nicht nur in der Analysis sondern in allen Zweigen der Mathe-
matik von grundlegender Bedeutung sind, wollen wir als bekannt voraussetzen. Wir
verweisen hierzu auch auf die Bücher von O. Deiser [3] und H. Koch [12].

Historische Entwicklung

Betrachtet man die Erfolge der großen Mathematiker der Vergangenheit und die
heutigen Anforderungen an die Mathematik, so lassen sich orientiert um die eigent-
liche mathematische Methodik folgende weitere Aufgaben erkennen:
• präzise Abstraktion naturwissenschaftlicher, ingenieurwissenschaftlicher, lebens-
wissenschaftlicher oder ökonomischer Abläufe in klar definierte mathematische
Begriffe (mathematische Modellbildung),
• begleitende höchst-rechnerintensive Untersuchungen (numerische Simulation).
Letzteres ist eine Entwicklung der letzten Jahre, ermöglicht durch die Verfügbar-
keit leistungsfähiger Computer. In diesem Zusammenhang sollten die numerischen
Künste der großen Mathematiker (insbesondere Carl Friedrich Gauß, 1777-1855)
der Vergangenheit besonders erwähnt werden. Da wir uns hier mit Analysis, d.h. im
wesentlichen mit Infinitesimalrechnung befassen, wollen wir noch einen sehr kur-
zen Blick in deren Historie wagen. Die zentralen ersten Entwicklungspunkte wer-
den Newton (Isaac Newton, 1643-1727, London) und Leibniz (Gottfried Wilhelm
Leibniz, 1646-1716, Hannover, Berlin) zugeschrieben. Natürlich findet man bereits
bei Archimedes, Kepler, Cavalieri, Fermat, Pascal, Wallis, Huygens, Toricelli, Des-
cartes Vorläufer analytischer
 Methodik. Folgendes scheint klar zu sein: Die beiden
Symbole d“ und “ wurden am 29. Oktober 1675 von Leibniz zum erstenmal ver-
” ”
wendet. Der Blick von Leibniz galt grob gesprochen dem Tangentenproblem und
der Quadratur (Berechnung von Flächeninhalten), symbolisch

dv = v dx .

Newton hingegen entwickelte die Differential- und Integralrechnung innerhalb der


so genannten Fluxionsrechnung. Dabei sind alle Größen zeitabhängig,

x = x(t) .

Die Fluxion“ bezeichnet dann ẋ, die Ableitung nach t.



Im Jahr 1699 entstand der Prioritätsstreit zwischen Newton und Leibniz. Dabei
wurde Leibniz vorgeworfen, die Differentialrechnung nicht selbständig erfunden,
sondern von Newton entlehnt zu haben. Bis 1710 wurden Argumente ausgetauscht,
Einleitende Anmerkungen 3

schließlich sprach sich eine eigens eingesetzte Kommission dahingehend aus, dass
Newton der erste Erfinder der Infinitesimalrechnung ist. Leibniz und Newton blie-
ben auch aus politischen Gründen zerstritten. Erst im 19. Jahrhundert setzte sich
durch, dass Leibniz und Newton unabhängig voneinander den Grundstock zur Ana-
lysis gelegt haben.
Seither haben sich Generationen von Mathematikern mit der Analysis beschäftigt,
die wir unmöglich alle hier erwähnen können. Zu den bekanntesten Lehrbüchern
zählen etwa die Werke von J. Dieudonné [4] oder W. Rudin [19]. Als deutsch-
sprachige Bücher auf diesem Gebiet seien unter anderen K. Königsberger [13], [14]
und H. Heuser [9] sowie O. Forster [7], [8] genannt.
Kapitel 1
Die reellen Zahlen

Die Menge IN := {1, 2, . . .} der natürlichen Zahlen wollen wir hier als bekannt vor-
aussetzen, ebenso wie die Menge ZZ := {0, ±1, ±2, . . .} der ganzen Zahlen. Weiter
schreiben wir IN0 := IN ∪ {0} = {0, 1, 2, . . .}. Diese Mengen sind allesamt diskret,
d.h. zwischen zwei aufeinander folgenden natürlichen (oder ganzen) Zahlen liegt
keine weitere natürliche (oder ganze) Zahl.
Eine wichtige Beweismethode, die auf den Grundeigenschaften von IN beruht,
ist das Induktionsprinzip: Ist M eine Menge mit den Eigenschaften
(i) 1 ∈ M (Die Zahl 1 ist ein Element von M),
(ii) n ∈ M ⇒ n + 1 ∈ M (Ist n ∈ M, dann folgt n + 1 ∈ M),
so gilt IN ⊆ M.
Aus dem Induktionsprinzip leitet sich die Beweismethode der vollständigen In-
duktion ab: Jeder natürlichen Zahl n ∈ IN sei eine Aussage A(n) zugeordnet (die
richtig oder falsch sein kann). Gelten
(i) A(1) ist richtig“ (Induktionsanfang),

(ii) A(n) ist richtig“ ⇒ A(n + 1) ist richtig“ (Induktionsschritt),
” ”
so gilt A(n) ist richtig“ für alle n ∈ IN.

Wir wollen dies hier nicht weiter vertiefen, sondern verweisen auf Lehrbücher
zur diskreten Mathematik, wie etwa Matoušek/Nešetřil [15] oder Taraz [20].

1.1 Archimedisch angeordnete Körper

Die Rechenoperationen (Addition, Multiplikation) führen uns von den natürlichen


und ganzen Zahlen zunächst zur Menge Q der rationalen Zahlen,
m 
Q := : m ∈ ZZ, n ∈ IN .
n

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 5


DOI 10.1007/978-3-642-28644-5_1, © Springer-Verlag Berlin Heidelberg 2012
6 1 Die reellen Zahlen

Die Menge Q genügt der folgenden Definition.

Definition 1.1. Sei K eine Menge (mit mindestens 2 Elementen), auf der zwei Ver-
knüpfungen + ( Addition“) und • ( Multiplikation“) gegeben sind, sodass gilt:
” ”
(K1) Assoziativität der Addition: a + (b + c) = (a + b) + c ∀a, b, c ∈ K.
(K2) Neutrales Element der Addition: Es gibt 0 ∈ K mit der Eigenschaft
0 + a = a + 0 = a ∀a ∈ K.
(K3) Inverses bezüglich Addition: Zu jedem a ∈ K gibt es −a ∈ K, sodass
a + (−a) = 0.
(K4) Kommutativität der Addition: a + b = b + a ∀a, b ∈ K.
(K5) Assoziativität der Multiplikation: a • (b • c) = (a • b) • c ∀a, b, c ∈ K.
(K6) Neutrales Element der Multiplikation: Es gibt 1 ∈ K mit der Eigen-
schaft 1 • a = a • 1 = a ∀a ∈ K.
(K7) Inverses bezüglich Multiplikation: Zu jedem a ∈ K, a = 0, gibt es
a−1 ∈ K, sodass a • a−1 = 1.
(K8) Kommutativität der Multiplikation: a • b = b • a ∀a, b ∈ K.
(K9) Distributivität: a • (b + c) = a • b + a • c ∀a, b, c ∈ K.
Dann heißt K ein kommutativer Körper.
An Stelle von a • b schreibt man auch kurz ab, statt a−1 gelegentlich auch 1a . Weiter
schreibt man a − b für a + (−b) und an := a • a •. . .• a.
n−mal

Folgerungen: Sei K ein kommutativer Körper. Für a, b ∈ K gilt dann


(i) −(−a) = a , (a−1 )−1 = a,
(ii) a • 0 = 0,
(iii) ab = 0 =⇒ a = 0 oder b = 0,
(iv) a(−b) = −(ab) , insbesondere a(−1) = −a,
(v) (−a)(−b) = ab.
Diese Eigenschaften kann man leicht aus den Axiomen (K1)-(K9) folgern. Man
fordert sie also nicht in der Definition, dennoch gelten sie in jedem kommutativen
Körper.

Wenn in obiger Definition alles außer (K8) erfüllt ist, spricht man von einem
(nicht-kommutativen) Körper; in der Algebra werden Körper genauer untersucht.
Wir wollen hier nur festhalten, dass Q mit der gewöhnlichen Addition und Multi-
plikation ein kommutativer Körper ist, IN und ZZ hingegen nicht. Wir werden bald
noch weitere Beispiele für kommutative Körper kennen lernen: die Menge IR der
reellen Zahlen sowie die Menge C der komplexen Zahlen.
Eine weitere Eigenschaft, die Q (und auch IR aber nicht C, wie wir noch sehen
werden) zu eigen ist, ist die Möglichkeit einer Anordnung.
1.1 Archimedisch angeordnete Körper 7

Definition 1.2. Ein kommutativer Körper K heißt angeordneter Körper, falls in


K eine Teilmenge der positiven Elemente (Schreibweise: a > 0 steht für a ist

positiv“) ausgezeichnet ist, die die folgenden Eigenschaften besitzt:
(A1) Für jedes a ∈ K gilt genau eine der drei Bedingungen
a > 0 oder a = 0 oder −a > 0.
(A2) Aus a > 0 und b > 0 folgen a + b > 0 sowie ab > 0.
Ein angeordneter Körper heißt archimedisch angeordneter Körper, wenn er zu-
sätzlich die folgende Eigenschaft hat:
(A3) Zu a > 0, b > 0 existiert ein n ∈ IN, sodass
na := a + a + . . .+ a > b gilt. (Archimedisches Axiom)
  
n−mal

Schreibweisen: Ist −a > 0, so heißt a negativ und man schreibt a < 0.


Ist a − b > 0, so heißt a größer als b und man schreibt a > b.
a ≥ b bezeichnet a > b oder a = b.
a < b bezeichnet b > a.
a ≤ b bezeichnet a < b oder a = b.

Einfache Folgerungen aus (A1) und (A2):


(i) a < b, b < c =⇒ a < c (Transitivität)
(ii) a < b ⇐⇒ a + c < b + c für alle c ∈ K
(iii) a < b, c > 0 =⇒ ca < cb
(iv) a > b > 0 =⇒ 1a < 1b
(v) 0 ≤ a < b =⇒ a2 < b2
(vi) Für a = 0 gilt a2 > 0. (insbesondere 1 = 12 > 0)
In jedem angeordneten Körper gilt die folgende Ungleichung, die nach Jakob Ber-
noulli I (1654-1705, Basel) benannt ist. (Es gab noch einige weitere bekannte Ma-
thematiker namens Bernoulli.)

Satz 1.3 (Bernoulli-Ungleichung). Sei K ein angeordneter Körper. Für jedes x ∈ K


mit x ≥ −1 und alle n ∈ IN gilt

(1 + x)n ≥ 1 + nx . (1.1)

Beweis. Wir beweisen die Ungleichung mittels vollständiger Induktion.


Für n = 1 hat man sogar Gleichheit. Gelte nun (1.1) für ein n ∈ IN. Dann folgt
(iii) (vi)
(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x

und die Ungleichung ist auch für n + 1 erfüllt. 



8 1 Die reellen Zahlen

Mit dem archimedischen Axiom folgt:


Satz 1.4. Sei K ein archimedisch angeordneter Körper. Dann gelten:
(a) Ist b > 1, so gibt es zu jedem M > 0 ein n ∈ IN derart, dass bn > M.
(b) Ist 0 < q < 1, so gibt es zu jedem  > 0 ein n ∈ IN derart, dass qn <  .
Beweis. (a) Setze x := b − 1 > 0. Mit Satz 1.3 gilt bn = (x + 1)n ≥ 1 + nx. Mit (A3)
gibt es zu M > 0 ein n ∈ IN, sodass nx > M. Zusammengefasst gilt

bn ≥ 1 + nx > 1 + M > M .

Die Aussage (b) folgt aus (a), indem man b := q−1 und M :=  −1 setzt. 

In jedem angeordneten Körper K kann man einen Absolutbetrag einführen. Für
a ∈ K definiert man
a falls a ≥ 0 ,
|a| :=
−a falls a < 0 .
Es gelten folgende Regeln:
(1) |ab| = |a| |b|

(2) |a + b| ≤ |a| + |b| und


|a| − |b|
≤ |a − b| (Dreiecksungleichung)
Beweis. Regel (1) erhält man mit den Folgerungen (iv) und (v) von Definition 1.1.
Wir kommen zum Nachweis von (2). Es gelten ±a ≤ |a|, ±b ≤ |b|, und damit
a + b ≤ |a| + |b| sowie −(a + b) ≤ |a| + |b|. Daraus folgt |a + b| ≤ |a| + |b|.
Die zweite Ungleichung erhält man aus |a| = |a − b + b| ≤ |a − b| + |b| und aus
|b| = |b − a + a| ≤ |b − a| + |a| = |a − b| + |a|; damit gilt ±(|a| − |b|) ≤ |a − b|.

Schreibweisen:
(1) Sind K ein kommutativer Körper und a1 , a2 , . . . , an ∈ K, so schreiben wir
abkürzend
n
 ak := a1 + a2 + . . . + an .
k=1

(2) Wir setzen 0! := 1 sowie (n + 1)! := (n + 1) (n!) für n ∈ IN0 , also 1! = 1,


2! = 2 , 3! = 6 , 4! = 24 usw. (n! spricht man als n Fakultät “).

(3) Für n, k ∈ IN0 , n ≥ k, erklären wir die Binomialkoeffizienten

n n!
:= .
k k! (n − k)!

Seien K ein kommutativer Körper, a, b ∈ K und n ∈ IN. Wenn wir (a + b)n


ausrechnen und dann zusammenfassen (vgl. Kapitel 1.4, Aufgabe 5), erhalten
wir die so genannte Binomialformel,
n
n k n−k
(a + b) = 
n
a b .
k=0 k
1.2 Intervallschachtelung und Vollständigkeit 9

1.2 Intervallschachtelung und Vollständigkeit

Die Menge Q der rationalen Zahlen ist uns noch nicht umfassend genug; beispiels-
weise gibt es keine rationale Zahl x derart, dass x2 = 2 gilt. Angenommen, es wäre
x ∈ Q, x2 = 2, so schreibe x = qp als gekürzten Bruch mit p, q ∈ ZZ. Dann gilt
2q2 = p2 . Dann enthält auch p die Zahl 2 als Faktor, d.h. p = 2r mit r ∈ ZZ. Folg-
lich ist 2q2 = p2 = 4r2 und dann q2 = 2r2 . Somit enthält q auch 2 als Faktor – im
Widerspruch dazu, dass qp gekürzt ist.
Mehr dazu findet man u.a. in [3, Kap. 1.1]. Wir wollen nun diese Lücken

auffüllen“.
n n+1
Beispiel 1.5. Für n ∈ IN seien an := n+1
n und bn := n+1n .
n+1
Für alle n ∈ IN gilt n > 1, also auch 0 < an < bn . Weiter gilt
2 n+1
an+1 (n + 2)n+1nn n + 1 (n2 + 2n)n+1 n + 1 n + 2n
= = =
an (n + 1)2n+1 n (n + 1)2n+2 n n2 + 2n + 1
n+1
n+1 1 n+1 1
= 1− ≥ 1− =1,
n (n + 1)2 n n+1

wobei wir im vorletzten Schritt die Bernoulli-Ungleichung verwendet haben. Eben-


so erhalten wir
2 n+2 n+2
bn (n + 1)2n+3 n n + 2n + 1 n 1
= = = 1+ 2
bn+1 (n + 2)n+2nn+1 n+1 n2 + 2n n+1 n + 2n

n n+2 n n+1
≥ 1+ 2 = =1.
n+1 n + 2n n+1 n

Damit gilt 0 < an ≤ an+1 < bn+1 ≤ bn für alle n ∈ IN und es folgt schließlich an < bk
für alle n, k ∈ IN.
6
Aus b5 = 65 = 46 656
15 625 < 3 erhalten wir an < 3 und damit

1 an 3
bn − an = an 1 + − an = < für alle n ∈ IN .
n n n

Hier stellt sich nun die Frage, ob es eine Zahl c gibt, sodass an ≤ c ≤ bn für alle
n ∈ IN gilt. In Kapitel 5.7, Aufgabe 8 werden wir zeigen, dass c ∈ / Q ist. Dies war
bereits ein erstes Beispiel für eine Intervallschachtelung; wir werden diesen Begriff
im Folgenden noch allgemein definieren.

In einem angeordneten kommutativen Körper K bezeichnen wir (a, b ∈ K, a ≤ b)


die Mengen

[a, b] := {x ∈ K : a ≤ x ≤ b} [a, b[ := {x ∈ K : a ≤ x < b}


]a, b] := {x ∈ K : a < x ≤ b} ]a, b[ := {x ∈ K : a < x < b}
10 1 Die reellen Zahlen

als Intervalle. Erstere heißen abgeschlossen, letztere offen, die anderen bezeichnen
wir als halboffen. Ist I eines dieser Intervalle, so bezeichnet |I| := b − a die Länge
von I.

Definition 1.6. Sei K ein archimedisch angeordneter kommutativer Körper. Ei-


ne Intervallschachtelung ist eine Folge (In )n∈IN von abgeschlossenen Intervallen
In = [an , bn ] mit
(i) In+1 ⊆ In für alle n ∈ IN
(d.h. a1 ≤ . . . ≤ an ≤ an+1 ≤ . . . ≤ bn+1 ≤ bn ≤ . . . ≤ b1 ).
(ii) Zu jedem  > 0 existiert ein n ∈ IN mit |In | = bn − an <  .
Der Körper K heißt vollständig, falls zu jeder Intervallschachtelung (In )n∈IN genau
ein x ∈ K existiert mit x ∈ In für alle n ∈ IN.

Es gibt weitere äquivalente Charakterisierungen der Vollständigkeit, siehe Kapi-


tel 4.2 und auch [3]. Obige geht auf Karl Weierstraß (1815-1897, Berlin) zurück.

Die Menge IR der reellen Zahlen ist ein vollständiger archimedisch angeordneter
Körper. Wir werden uns künftig, wenn Aussagen über IR hergeleitet werden, letzt-
endlich nur auf die genannten Gesetze (Axiome) stützen. Diese Eigenschaften, d.h.
(K1),...,(K9), (A1), (A2), (A3) und die Vollständigkeit legen IR fest.
Der Körper Q ist nicht vollständig. Wir werden gleich feststellen, daß in IR stets
Wurzeln existieren, in Q nicht. Auch die im folgenden Beispiel konstruierte Zahl e
ist nicht rational (siehe auch Kapitel 5.7, Aufgabe 8).
n n+1
Beispiel 1.7 (Eulersche Zahl). Seien an := n+1 n , bn := n+1
n , In := [an , bn ],
so ist (In )n∈IN eine Intervallschachtelung, siehe Beispiel 1.5. Man bezeichnet

In = {e} .
n∈IN

Eine Näherung (im Dezimalsystem) für e ist

e ≈ 2.71828182845904523536...

Satz 1.8 (Existenz von Wurzeln). Zu jedem x ∈ IR, √x > 0, und k ∈ IN existiert genau
eine reelle Zahl y > 0 mit yk = x. Man schreibt y = k x oder y = x1/k .

Beweis. Sei zunächst x ≥ 1. Wir konstruieren eine Intervallschachtelung In = [an , bn ]


mit n−1
akn ≤ x ≤ bkn und |In | = 12 |I1 | für n ∈ IN . (1.2)
Dazu starten wir mit a1 := 1, b1 := x + 1, also

I1 = [a1 , b1 ] = [1, x + 1] .

Wegen x ≥ 1 gilt bk1 = (x + 1)k ≥ xk ≥ x ≥ 1k = ak1 , also ist (1.2) für n = 1 erfüllt.
1.2 Intervallschachtelung und Vollständigkeit 11

Ist In = [an , bn ] mit (1.2) gegeben, so sei m := 12 (an + bn ) = an + 12 (bn − an). Wir
setzen 
[an , m] , falls mk ≥ x ,
In+1 = [an+1 , bn+1 ] :=
[m, bn ] , falls mk < x .
x
an m bn akn mk bkn

an+1 bn+1

Mit dieser Konstruktion ist (1.2) auch für In+1 erfüllt. Es ist In+1 ⊆ In ; ferner gibt es
n−1 
mit Satz 1.4 zu jedem  > 0 ein n ∈ IN mit 12 < x , also |In | <  .

Da IR vollständig ist, existiert y ∈ IR mit In = {y}.
n∈IN
Wir zeigen nun yk = x. Dazu beachte man, dass Ink := [akn , bkn ] ebenfalls eine Inter-
k
vallschachtelung ist. Es gilt In+1 ⊆ Ink , da In+1 ⊆ In , und

|Ink | = bkn − akn = (bn − an)(bk−1


n + bk−2 k−1 k−1
n an + . . . + an ) ≤ |In | k b1 .

Ist nun  > 0, so existiert ein n ∈ IN mit |In | < , also |Ink | <  .
kbk−1
1
Für alle n ∈ IN folgt x ∈ Ink mit (1.2) und wegen y ∈ In gilt yk ∈ Ink . Es gibt genau
 k
ein Element in In und damit ist yk = x.
n∈IN

Zum Beweis der Eindeutigkeit nehmen wir an, es sei x = yk = zk mit y, z > 0. Aus
y < z folgt x = yk < zk = x, ein Widerspruch (ebenso bei y > z). Also gilt hier y = z.
Schließlich bleibt der Fall 0 < x < 1.  k
1
Für x gibt es wie eben gezeigt ein y > 0 mit yk = 1x , also x = 1
yk
=
. 1
y 


In Q kann man nicht Wurzeln jeder Zahl ziehen. Wie schon erwähnt ist 2 nicht
rational. Zur Bestimmung von Quadratwurzeln mittels Intervallschachtelung siehe
auch Kapitel 1.4, Aufgabe 8.
Zum Schluss dieses Abschnitts zeigen wir ein einfaches Lemma, das uns später
noch von Nutzen sein wird.
√ √ √
Lemma 1.9. Für 0 ≤ b < c und k ∈ IN gilt 0 < k c − k b ≤ k c − b.
√ √
Beweis. Aus k c ≤ k b folgt c ≤ b unmittelbar√aus den √ Anordnungsaxiomen, im
Widerspruch zur Voraussetzung. Also muss 0 < k c − k b sein.
√ √ √
Angenommen, es gilt k c − k b > k c − b, so folgt
√ √
k
√ √
k

k
√ √
c = ( k c)k > ( b + k c − b)k = ( b)k + k · ( b)k−1 · k c − b + · · · + ( k c − b)k
≥ b + (c − b) = c

(alle Summanden sind nicht-negativ). Dies ist ein Widerspruch; damit ist die rechte
Ungleichung ebenfalls bewiesen. 

12 1 Die reellen Zahlen

1.3 Supremumseigenschaft

Ist A ⊆ IR eine beliebige Menge reeller Zahlen, so heißt b ∈ IR eine obere Schranke
(bzw. untere Schranke) von A, falls a ≤ b (bzw. a ≥ b) für alle a ∈ A gilt. Besitzt
A eine obere Schranke, so heißt A nach oben beschränkt. Entsprechend definiert
man nach unten beschränkt. Gilt beides, so nennt man A beschränkt.
Liegt eine obere (bzw. untere) Schranke b von A sogar in A selbst, so heißt
diese Maximum (bzw. Minimum) von A; wir schreiben dann b = max A (bzw.
b = min A). Beachte, dass max A und min A wegen (A1) eindeutig bestimmt sind,
wenn sie existieren.

Definition 1.10. Eine Zahl s ∈ IR heißt Supremum einer Menge A ⊆ IR, falls gilt:
(i) s ist obere Schranke von A und
(ii) für jede obere Schranke t von A ist t ≥ s.
Das heißt, s ist die kleinste obere Schranke von A. Man schreibt s = sup A.
Entsprechend definiert man s als das Infimum von A ⊆ IR, falls gilt:
(i) s ist untere Schranke von A und
(ii) für jede untere Schranke t von A ist t ≤ s.
Das heißt, s ist die größte untere Schranke von A. Man schreibt s = inf A.

Bemerkung: Sei etwa A = [a, b] mit a, b ∈ IR, a < b, so ist b = max A = sup A. Das
Intervall à = [a, b[ hingegen besitzt ein Supremum b = sup Ã, aber kein Maximum.
Auch Supremum und Infimum brauchen nicht immer zu existieren. Beispiels-
weise besitzen die nach oben unbeschränkten Intervalle [a, [= {x ∈ IR : x ≥ a}
kein Supremum. Zur Frage der Existenz sei auf den nachfolgenden Satz verwiesen.
Existiert sup A (oder infA), so ist es eindeutig bestimmt: Sind s und s̃ zwei Suprema
von A, so muss s ≤ s̃ und s̃ ≤ s gelten, also s = s̃.

Satz 1.11 (Supremumseigenschaft). Jede nach oben (bzw. nach unten) beschränk-
te nicht-leere Menge A ⊆ IR besitzt ein Supremum (bzw. Infimum).

Beweis. Wir studieren hier nur den Fall, dass A nach oben beschränkt ist. Dazu
konstruieren wir eine Intervallschachtelung (In )n∈IN , In = [an , bn ], mit den Eigen-
schaften
n−1
(i) bn+1 − an+1 = 12 (bn − an) (daraus folgt |In | = 12 |I1 | für alle n),
(ii) bn ist obere Schranke von A,
(iii) an ist keine obere Schranke von A.
Wir beginnen mit I1 = [a1 , b1 ], wobei b1 eine beliebige obere Schranke von A und
a1 ∈ IR keine obere Schranke ist. Sind I1 , . . . , In bereits gefunden, sodass (i), (ii) und
(iii) gelten, dann sei mn := 12 (an + bn). Offensichtlich ist an ≤ mn ≤ bn . Nun setze

[an , mn ] , falls mn obere Schranke von A ist,
In+1 = [an+1 , bn+1 ] :=
[mn , bn ] , falls mn keine obere Schranke von A ist.
1.3 Supremumseigenschaft 13

Damit gilt In+1 ⊆ In und bn+1 − an+1 = 12 (bn − an ). Ferner ist bn+1 eine obere
Schranke von A und an+1 ist keine obere Schranke von A.
n−1 
Ist nun  > 0, so existiert laut Satz 1.4 ein n ∈ IN mit 12 < b1 −a 1
. Folglich gilt
|In | <  ; damit ist (In )n∈IN eine Intervallschachtelung.
Wegen der Vollständigkeit gibt es eine Zahl s ∈ IR mit

{s} = In .
n∈IN

Wir zeigen s = sup A. Dazu ist nachzuweisen:


(a) s ist eine obere Schranke von A und
(b) s ist kleinste obere Schranke von A.
Zu (a): Angenommen, es gibt x ∈ A mit s < x. Dann existiert zu  := x − s ein n ∈ IN
mit bn − an <  = x − s. Wegen s ∈ [an , bn ] gilt bn − s ≤ bn − an < x − s und damit
bn < x im Widerspruch dazu, dass bn obere Schranke von A ist.
Zu (b): Angenommen, es gibt eine obere Schranke s̃ von A mit s̃ < s. Dann existiert
zu  := s − s̃ ein n ∈ IN mit bn − an <  = s − s̃. Weiter folgt wegen s ∈ [an , bn ] nun
s − an ≤ bn − an < s − s̃, also an > s̃. Damit gilt aber an > s̃ ≥ x für alle x ∈ A, d.h. an
ist obere Schranke von A, ein Widerspruch.
Damit ist s = sup A gezeigt. 

Man kann zeigen, dass ein archimedisch angeordneter Körper, der die Supremums-
eigenschaft erfüllt, stets vollständig ist. Daher kann man die Vollständigkeit auch
mittels Supremumseigenschaft definieren (das wird auch gelegentlich so gemacht).
Eine weitere Charakterisierung der Vollständigkeit erfolgt über so genannte Cauchy-
folgen, siehe Kapitel 4.2.

Lemma 1.12. Seien A, B nicht-leere nach oben beschränkte Teilmengen von IR.
(a) Ist A ⊆ B, so gilt sup A ≤ sup B.
(b) Bezeichnen A + B := {a + b : a ∈ A, b ∈ B}, rA := {ra : a ∈ A} für r ∈ IR und
A · B := {ab : a ∈ A, b ∈ B}, so hat man

sup(A + B) = sup A + supB ,


sup(rA) = r sup A , falls r ≥ 0 ,
sup(A · B) = sup A sup B , falls A, B ⊆ [0, [ .

Entsprechende Aussagen gelten für das Infimum, falls A und B nach unten be-
schränkt sind.

Beweis. Seien  := sup A,  := sup B.


(a) Es ist  eine obere Schranke von A, denn aus  ≥ x ∀x ∈ B folgt  ≥ x ∀x ∈ A.
Da  die kleinste obere Schranke von A und  eine obere Schranke von A ist, folgt
 ≤ .
14 1 Die reellen Zahlen

(b) Aus a ≤  ∀a ∈ A und b ≤  ∀b ∈ B folgt a + b ≤  +  ∀a ∈ A, b ∈ B, also


sup(A + B) ≤  +  . Mit der Definition des Supremums als kleinste obere Schranke
existieren zu jedem  > 0 ein a0 ∈ A und ein b0 ∈ B mit a0 >  − 2 und b0 >  − 2 .
Damit ist a0 + b0 > ( +  ) −  . Da  > 0 beliebig klein gewählt werden darf, ist
 +  die kleinste obere Schranke von A + B.
Aus  ≥ x ∀x ∈ A folgt r ≥ rx ∀x ∈ A und weiter r ≥ y ∀y ∈ rA. Also ist r
eine obere Schranke von rA. Sei nun a < r . Dann ist ar <  , d.h. ar ist keine obere
Schranke von A; folglich gibt es ein x ∈ A mit ar < x. Damit ist rx ∈ rA und a < rx;
also ist a keine obere Schranke von rA. Damit folgt: r ist kleinste obere Schranke
von rA.
Im Fall A, B ⊆ [0, [ gilt  ,  ≥ 0. Für  = 0 oder  = 0 gilt A · B = {0} und
die Behauptung ist offensichtlich wahr. Wir können also  ,  > 0 annehmen. Aus
x ≤  ∀x ∈ A und y ≤  ∀y ∈ B folgt dann xy ≤  ∀x ∈ A, y ∈ B. Also ist 
eine obere Schranke von A · B. Wir nehmen nun an, dass  nicht die kleinste obere
Schranke von A · B ist. Dann gibt es ein c ∈ IR mit c <  und c ≥ x ∀x ∈ A · B. Wir
setzen  :=  −c
 + . Es gilt  > 0 und nach Definition des Supremums gibt es a ∈ A
mit a >  −  sowie b ∈ B mit b >  −  . Daraus folgt

ab > ( −  )( −  ) =  −  ( +  ) +  2 ≥  −  ( +  ) = c

im Widerspruch dazu, dass c obere Schranke von A · B ist. Damit ist  tatsächlich
die kleinste obere Schranke von A · B.
Die entsprechenden Aussagen für das Infimum zeigt man ganz analog. 

Wir schließen diesen Abschnitt mit einigen Resultaten zur Lage von IN, ZZ und
Q innerhalb IR. Vorweg zeigen wir ein Resultat über IN, das auf den ersten Blick
selbstverständlich erscheint. Man bedenke aber, dass wir IR abstrakt nur als einen
vollständigen archimedisch angeordneten Körper erklärt haben; Begriffe wie Supre-
mum oder Maximum haben wir definiert völlig unabhängig davon, ob oder wie wir
IN in IR wiederfinden.

Satz 1.13. Sei A ⊆ IN ⊆ IR eine nicht-leere Menge natürlicher Zahlen. Es gilt:


(a) A besitzt ein Minimum.
(b) Ist A beschränkt, so hat A ein Maximum.

Beweis. (a) Sei U := {n ∈ IN : n ist untere Schranke von A}. Dann gilt offensicht-
lich 1 ∈ U. Außerdem ist U eine echte Teilmenge von IN, denn ist k ∈ A, so ist
k+1 ∈ / U. Mit dem Induktionsprinzip finden wir ein n0 ∈ U mit n0 + 1 ∈/ U, sonst
wäre U = IN.
Wir zeigen n0 = min A. Es gilt n0 ≤ n ∀n ∈ A. Zu zeigen bleibt n0 ∈ A. Wäre
n0 ∈
/ A, so wäre n0 < m ∀m ∈ A und damit m − n0 ≥ 1. Das heißt m ≥ n0 + 1 ∀m ∈ A,
woraus n0 + 1 ∈ U folgt – im Widerspruch zu oben.
(b) Sei s := sup A. Nach (A3) existiert ein n1 ∈ IN mit s < n1 . Damit gilt k ≤ s < n1
für alle k ∈ A, also n1 − k ∈ IN ∀k ∈ A. Laut (a) existiert m := min{n1 − k : k ∈ A}.
Dann ist n1 − m = max A. 

1.4 Aufgaben 15

Satz 1.14. (a) Zu jedem x ∈ IR existiert genau ein k ∈ ZZ mit k ≤ x < k + 1.


(b) Zu je zwei reellen Zahlen a, b mit a < b gibt es eine Zahl r ∈ Q mit a < r < b.

Die Zahl k gemäß Aussage (a) wird mit [x] bezeichnet. Demnach ist [x] die größte
ganze Zahl, die kleiner oder gleich x ist. Man nennt [ ] auch Gaußklammer.

Beweis. (a) Nach (A3) existiert ein n ∈ IN mit 1 − x < n, also 1 < n + x. Laut
Satz 1.13 existiert eine größte Zahl m ∈ IN mit m ≤ n + x. Damit ist k := m − n
die größte ganze Zahl, die kleiner oder gleich x ist.
(b) Wähle n ∈ IN mit 1n < b − a und setze k := [na]. Für r := k+1
n ∈ Q gilt dann
r > na 1 1+an 1+k
n = a und b > n + a = n ≥ n = r. 

1.4 Aufgaben

1. Beweisen Sie die im Anschluss an Definition 1.1 angegebenen Folgerungen.


Geben Sie in jedem Schritt an, welches Axiom Sie dabei benützen.
a
2. a. Seien a, b, c, d positive reelle Zahlen mit b < dc .
a a+c c
Folgern Sie aus den Axiomen: Es gilt stets b < b+d < d.
b. Gibt es positive reelle Zahlen a, b, c, d derart, dass ab + c a+c
d = b+d gilt?

3. Beweisen Sie die nach Definition 1.2 genannten Folgerungen.

4. Zeigen Sie, dass IF2 := {⊥, } mit den durch

⊥ + ⊥ := ⊥ , ⊥ +  :=  ,  + ⊥ :=  ,  +  := ⊥ ,
⊥ • ⊥ := ⊥ , ⊥ •  := ⊥ ,  • ⊥ := ⊥ ,  •  :=  ,

erklärten Operationen ein kommutativer Körper ist.

5. Seien K ein kommutativer Körper, a, b ∈ K und n ∈ IN.


Weisen Sie die Binomialformel
n
n k n−k
(a + b) = 
n
a b
k=0 k

mittels vollständiger Induktion nach.

6. Zeigen Sie: Zu jedem  > 0 gibt es ein N ∈ IN mit


1
√ < für alle n ≥ N .
n
16 1 Die reellen Zahlen

7. Besitzen die folgenden Mengen ein Minimum, Maximum, Infimum, Supre-


mum ?
M1 := {x ∈ IR : x2 > 7}
 
n 1 1 1
M2 := (−1) 1 − : n ∈ IN M3 := + : m, n ∈ IN
n n m
Bestimmen Sie diese gegebenenfalls.

8. Arithmetrisches, Geometrisches und Harmonisches Mittel;


eine Intervallschachtelung für die Quadratwurzel.
Seien a, b positive reelle Zahlen. Wir setzen
a+b √ 1 2ab
A(a, b) := , G(a, b) := ab , H(a, b) := = .
2 A( 1a , 1b ) a+b

a. Zeigen Sie: Es gilt min{a, b} ≤ H(a, b) ≤ G(a, b) ≤ A(a, b) ≤ max{a, b},


wobei Gleichheit nur im Fall a = b auftritt.
Nun sei 0 < a < b. Wir setzen a1 := a, b1 := b und

an+1 := H(an , bn ) , bn+1 := A(an , bn ) für n ∈ IN .

b. Zeigen Sie: Für alle n ∈ IN gilt an < bn .


c. Zeigen√Sie: Die Intervalle In := [an , bn ] bilden eine Intervallschachtelung;
es gilt ab ∈ In ∀n ∈ IN.
1
d. Zeigen Sie: Für alle n ∈ IN gilt bn+1 − an+1 ≤ 4a (bn − an)2 .


1
e. Berechnen Sie eine Näherung c für 2 mit
c − 2
≤ 10000 .

9. Seien x ∈ IR \ Q und r ∈ Q. Zeigen Sie:


a. Es gilt x + r ∈ IR \ Q.
b. Im Fall r = 0 gilt auch rx ∈ IR \ Q.
Kapitel 2
Die komplexen Zahlen

In IR können wir zwar aus jeder positiven Zahl die Wurzel ziehen, aber es gibt
z.B. keine reelle Zahl x mit x2 = −1. Wir wollen nun einen kommutativen Körper
C, die Menge der komplexen Zahlen, konstruieren, in dem es eine Zahl i gibt mit
i2 = −1 und der die reellen Zahlen enthält. Dabei müssen wir allerdings auf die
archimedische Anordnung verzichten.

2.1 Konstruktion der komplexen Zahlen

Wir definieren die Menge der komplexen Zahlen als Menge von Paaren reeller
Zahlen, C := IR × IR = {(x, y) : x, y ∈ IR}. Eine komplexe Zahl z = (x, y) schreiben
wir auch in der Form
z = x + iy .
Dabei entspricht i = 0 + 1 i = (0, 1). Ferner heißen Re z := x der Realteil von z und
Im z := y der Imaginärteil von z. Wir fassen IR künftig als Teilmenge von C auf:
IR = {x + 0i : x ∈ IR} = {z ∈ C : Im z = 0} ⊂ C. Die Menge C ist mit

(x + iy) + (u + iv) := (x + u) + i(y + v) als Addition


und (x + iy)(u + iv) := (xu − yv) + i(xv + yu) als Multiplikation

ein kommutativer Körper; man kann leicht nachprüfen, dass (K1),. . . ,(K9) hier
erfüllt sind. Die imaginäre Einheit i ist dabei besonders ausgezeichnet. Es gilt
i2 = −1. Insbesondere gibt es keine Anordnung auf C, die (A1) und (A2) erfüllt,
denn dann müsste i2 > 0 gelten!
Für z ∈ C \ IR sind daher Aussagen wie z > 0 “ nicht sinnvoll. Man kann aber

einen Absolutbetrag in C einführen. Für z = x + iy ∈ C setzt man

|z| := x2 + y2 .

Dies ist im Fall x2 + y2 > 0 laut Satz 1.8 wohldefiniert; sonst setze 0 := 0.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 17


DOI 10.1007/978-3-642-28644-5_2, © Springer-Verlag Berlin Heidelberg 2012
18 2 Die komplexen Zahlen

Grafisch stellt man C üblicherweise i IR


als Ebene dar. Im kartesischen (x, y)-
Koordinatensystem ist |z| dann der Ab- i
z = (x, y) = x + iy
stand des Punktes z vom Nullpunkt. iy
|z|
Für z = x + iy nennt man z := x − iy die 0
zu z konjugiert komplexe Zahl. x IR
1
Es gelten die folgenden Rechenregeln,
−iy
die man leicht herleiten kann. z

Satz 2.1. Seien z, w ∈ C. Dann gelten:


(1) z + w = z + w , zw = z w
(2) z=z
(3) Re z = 12 (z + z) , Im z = 2i1 (z − z)
(4) |Re z| ≤ |z| , |Im z| ≤ |z|
(5) |z| ≤ |Re z| + |Im z|

(6) |z| = z z
(7) |z| = |z| = | − z|
(8) |zw| = |z| |w|
(9) Stets ist |z| ≥ 0 ; |z| = 0 ist äquivalent zu z = 0.

Gesondert wollen wir die Dreiecksungleichung aufführen.


Satz 2.2. Seien z, w ∈ C. Es gelten
(a) |z + w| ≤ |z| + |w| ,
(b) | |z| − |w| | ≤ |z − w| .

Beweis. Es ist

|z + w|2 = (z + w) (z + w) = z z + z w + z, w + w w
= |z|2 + 2Re (z w) + |w|2 ≤ |z|2 + 2 |Re (z w)| + |w|2
≤ |z|2 + 2 |z w| + |w|2 = (|z| + |w|)2 .

Daraus folgt (a). Die Aussage (b) zeigt man nun wie im Reellen. 

Zur Veranschaulichung sei erwähnt, dass für a ∈ C und r > 0 durch

Ur (a) := {z ∈ C : |z − a| < r} und


Kr (a) := {z ∈ C : |z − a| ≤ r}

eine offene (bzw. abgeschlossene) Kreisscheibe um a mit Radius r bestimmt ist.


(Die Begriffe offen und abgeschlossen werden wir in Kapitel 12 noch allgemein
definieren.)
2.1 Konstruktion der komplexen Zahlen 19

Beispiel: Für festes w ∈ C umfasst die Menge


{z ∈ C : |z − w| = 2} genau diejenigen kom-
plexen Zahlen, die von w den Abstand 2 ha-
ben. Es handelt sich also um einen Kreis mit
Mittelpunkt w und Radius 2. √
i 2(1 + i)
Die Abbildung
√ √ w=1
rechts zeigt diese für
und w = 2(1 + i). Im Fall w = 2(1 + i) 0
liegt der Nullpunkt auf diesem Kreis, denn für 1
z = 0 gilt hier

√ 2 √ 2
|z − w| = |w| = 2 + 2 =2.

Wir nennen eine Teilmenge A ⊆ C beschränkt, falls es ein M ≥ 0 gibt, sodass


|z| ≤ M für alle z ∈ A gilt. Beachte aber, dass man Begriffe wie Supremum und
Maximum für Teilmengen von C nicht einführen kann.
Die folgende wichtige algebraische Eigenschaft des Körpers C sollte nicht un-
erwähnt bleiben.

Satz 2.3 (Fundamentalsatz der Algebra). Seien a0 , . . . , an−1 ∈ C. Die Gleichung

zn + an−1zn−1 + . . . + a1z + a0 = 0

hat in C mindestens eine Lösung.

Bemerkung: Im Reellen stimmt diese Aussage nicht, z.B. gibt es keine reelle Zahl
x, die die Gleichung x2 + 1 = 0 erfüllt.
Der Fundamentalsatz der Algebra wurde erstmals von Carl Friedrich Gauß be-
wiesen, inzwischen ist eine Vielzahl ganz unterschiedlicher Beweise bekannt. Mit
den uns bis hier zur Verfügung stehenden Mitteln können wir diesen Satz allerdings
noch nicht beweisen; wir werden dieses Resultat für unsere Zwecke auch nicht wei-
ter benötigen. Mit Mitteln der Funktionentheorie kann man den Fundamentalsatz
der Algebra recht leicht zeigen, bei Remmert/Schumacher [17] etwa findet man vier
verschiedene Beweise. Für weitere Beweise dieses Satzes, die nur auf Resultaten
der Analysis basieren, sei u.a. auf Königsberger [13] oder Beals [2] verwiesen. Für
einen rein algebraischen Beweis siehe z.B. Karpfinger/Meyberg [11].

Beispiel: Die dritten Einheitswurzeln.


Wir wollen alle komplexen Zahlen bestimmen, die die Gleichung

z3 = 1

erfüllen. Wie üblich schreiben wir z = x + iy. Dann ist

(x + iy)3 = x3 + 3x2 iy + 3x(iy)2 + (iy)3 = x3 − 3xy2 + i(3x2 y − y3) .


20 2 Die komplexen Zahlen

Es gilt also z3 = 1 + 0i genau dann, wenn

x3 − 3xy2 = 1 und 3x2 y − y3 = 0 (2.1)

erfüllt ist. √
Für y = 0 lautet die zweite Gleichung 3x2 = y2 ; es folgt y = ± 3 x. Setzen√wir
dies in die erste Gleichung ein, ergibt sich −8x3 = 1, also x = − 12 und y = ± 12 3.
Für y = 0 ist die zweite Gleichung in (2.1) erfüllt und die erste Gleichung liefert
x3 = 1, also x = 1.
Die Gleichungen (2.1) sind daher genau dann erfüllt, wenn x und y einer der
Bedingungen
1 1√
(1) x=− , y= 3,
2 2
1 1√
(2) x=− , y=− 3,
2 2
(3) x = 1, y=0,

genügen.

Insgesamt haben wir also drei z1 = − 12 + 12 3 i
Lösungen von z3 = 1 gefunden.
Es gilt |z1 | = |z2 | = |z3 | = 1 und z3 = 1
z1 + z2 + z3 = 0. Diese Punkte
bilden die Ecken eines gleich-
seitigen Dreiecks, siehe auch
Aufgabe 5. √
z2 = − 12 − 12 3 i

2.2 Aufgaben

1. Stellen Sie die folgenden komplexen Zahlen in der Form x + iy dar:


a. 2i + 2i1
1+3i
b. 1−2i

c. (1 + i)43

2. Skizzieren Sie die folgenden Punktmengen in C:


a. {z ∈ C : |z| = c} für c = 12 , c = 1 und c = 2
b. {z ∈ C : Re z > 0}
 
c. z ∈ C : z = 1z
2.2 Aufgaben 21

3. Geben Sie für


a. z = i ,
b. z = 1 + i ,
c. z = 2 − 3i ,
d. z = − √12 − √12 i ,

jeweils z2 , i z und 1z in der Form x + iy an und skizzieren Sie alle diese Punkte
in der komplexen Ebene.

4. Gegeben Sei eine komplexe Zahl w. Bestimmen Sie alle z ∈ C mit z2 = w.

5. Es seien z1 , z2 , z3 ∈ C mit z1 + z2 + z3 = 0 und |z1 | = |z2 | = |z3 | = c > 0. Zeigen


Sie: z1 , z2 , z3 sind die Eckpunkte eines gleichseitigen Dreiecks.
Tipp: Schreiben Sie die Ausdrücke |z1 − z2 |2 + |z2 − z3 |2 , |z2 − z3 |2 + |z3 − z1 |2
und |z3 − z1 |2 + |z1 − z2 |2 mit Hilfe von |z|2 = z z als Summe und benutzen Sie
die Voraussetzungen um zu folgern, dass |z1 − z2 | = |z2 − z3 | = |z3 − z1 | gilt.

6. Zeigen Sie: Für alle z, w ∈ C gilt



|z + w|2 + |z − w|2 = 2 |z|2 + |w|2 .

Interpretieren Sie diese Gleichung geometrisch.

7. Für z, w ∈ C sei

z ≺ w : ⇐⇒ Re z < Re w oder
Re z = Re w und Im z < Im w .

Zeigen Sie: ≺ erfüllt (A1). Insbesondere gilt für beliebige z, w ∈ C genau eine
der drei Bedingungen z ≺ w, z = w oder w ≺ z.
Zeigen Sie weiter, dass (A2) hier nicht gilt.
Kapitel 3
Folgen reller und komplexer Zahlen

Wir haben in Kapitel 1 gesehen, dass man mit Folgen von Intervallen
reelle
n Zahlen
definiert. Dort haben wir schon beobachten können, dass an = 1 + 1n der Euler-
Zahl e mit wachsendem n immer näher kommt.
Auf Fourier (Jean-Baptiste Joseph Fourier, 1768-1830, Paris) geht etwa die nähe-
rungsweise Bestimmung von 4 durch Folgen sn , die sich als Summen schreiben,
zurück:
1 1 1 1
sn = 1 − + − + . . . ± (−1)n ,
3 5 7 2n + 1
siehe auch Kapitel 11.2, Beispiel (1).
Was passiert, wenn man Summen
1 1 1
rn = 1 + + + ... +
2 3 n
betrachtet, nähern sie sich einer Zahl an (und was genau ist darunter überhaupt zu
verstehen?); wenn ja, welcher? Darüber hinaus stellen sich Fragen nach möglichst
schneller Näherung an bestimmte Zahlen, z.B. e oder  .
Obige Annäherung an 4 ist sehr langsam. Beispielsweise wird heutzutage

8 n (4k)! 1103 + 26390k 1
sn = 
9801 k=0 (k!)4 396 4k
−→

zur Berechnung von etwa 2 Milliarden Stellen von  benutzt. Letzteres stammt von
Srinivasa Ramanujan (1887-1920, Madras, Cambridge).

3.1 Folgen und Grenzwerte

Eine Folge (an )n∈IN reeller Zahlen an ∈ IR (oder komplexer Zahlen an ∈ C) ist eine
Abbildung von der Menge der natürlichen Zahlen in die Menge der reellen (oder
komplexen) Zahlen, d.h. jedem n ∈ IN wird eine Zahl an zugeordnet. Zunächst sei

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 23


DOI 10.1007/978-3-642-28644-5_3, © Springer-Verlag Berlin Heidelberg 2012
24 3 Folgen reller und komplexer Zahlen

erwähnt, dass eine Folge (an )n∈IN etwas anderes ist als die Menge {an : n ∈ IN}.
Bei der Folge
 kommt es auf die Reihenfolge an. So sind etwa ((−1)n )n∈IN und
n+1
(−1) n∈IN
zwei verschiedene Folgen, während die Menge der Folgenglieder in
beiden Fällen {−1, 1} ist.
Analog kann man auch Folgen der Form (an )n∈IN0 oder gar (an )n∈ZZ erklären.

Definition 3.1. Sei (an )n∈IN eine Folge reeller (oder komplexer) Zahlen. Man sagt,
die Folge konvergiert gegen a ∈ IR (bzw. a ∈ C), falls gilt:
Zu jedem  > 0 existiert ein N ∈ IN mit

|an − a| <  für alle n ≥ N .

Die Zahl a heißt dann Grenzwert (auch: Limes) der Folge.

 C
 
IR
a

Alle an mit n ≥ N Alle an mit n ≥ N


liegen in ]a −  , a +  [. liegen in U (a).

Bemerkung: Grenzwerte sind eindeutig bestimmt.

Beweis. Seien a, b Grenzwerte der Folge (an )n∈IN . Dann gibt es zu jedem  > 0
natürliche Zahlen N, M mit

|an − a| <  für alle n ≥ N und |an − b| <  für alle n ≥ M .

Daraus folgt |b − a| = |(ak − a) − (ak − b)| ≤ |ak − a| + |ak − b| < 2 , wobei etwa
k := max{N, M} sei.
Für jedes  > 0 gilt also |b − a| < 2 ; es bleibt nur |b − a| = 0. 

Schreibweise: Konvergiert die Folge (an )n∈IN gegen a, so schreibt man

a = lim an oder an → a mit n →  .


n→

Gilt speziell lim an = 0, so bezeichnet man (an )n∈IN auch als Nullfolge.
n→
Beispiele:
(1) Sei an := a für alle n ∈ IN. Dann gilt lim an = a, denn |an − a| = 0 ∀n ∈ IN.
n→
1
(2) Sei an := n für n ∈ IN. Hier gilt lim an = 0.
n→
1

Begründung:

Zu  > 0 existiert N ∈ IN mit  < N, vgl. (A3); folglich gilt

1 − 0
= 1 ≤ 1 <  für alle n ≥ N.
n n N


1
(3) Sei an := n+1
n = 1 + 1n für n ∈ IN. Es gilt lim an = 1, denn
1 − n+1
n

= .
n
n→
3.1 Folgen und Grenzwerte 25
n
(4) Sei an := 1 + 1n für n ∈ IN. Es gilt lim an = e (Beispiel 1.7, Korollar 3.4).
n→
(5) Seien q ∈ C mit |q| < 1, an := qn
für n ∈ IN.
Es ist lim an = 0 wegen |qn − 0| = |q|n und Satz 1.4(b).
n→
n
1
(6) Seien q ∈ C mit |q| < 1, sn :=  qk für n ∈ IN. Es gilt lim sn = 1−q .
k=0 n→

Begründung: Für q = 0 ist (1 − q)sn = 1 − qn+1 und folglich










n+1 1

qn+1


sn − 1
=
1 − q − = =
1 (5)
|q|n+1 −→ 0 .

1 − q

1 − q 1 − q

1 − q
|1 − q|
n
Sei (an )n∈IN eine Folge und sn :=  ak wie im vorangehenden Beispiel.
k=1
Falls (sn )n∈IN konvergiert, so schreibt man

 ak := n→
lim sn .
k=1

Man bezeichnet dies als Reihe und (sn )n∈IN als Folge ihrer Partialsummen.
Man kann (und das wird tatsächlich gemacht) den Ausdruck

 ak
k=1

auch als einfache Abkürzung für die Folge der Partialsummen (sn )n∈IN verwenden.
Dieses Symbol hat also, je nach Zusammenhang, zwei verschiedene Bedeutungen:
Es bezeichnet entweder die Reihe an sich oder aber deren Grenzwert.

Beispielsweise nennt man  qk die Geometrische Reihe.
k=0
Wir werden in Kapitel 5 noch in einer allgemeineren Situation auf Reihen zu spre-
chen kommen.

Satz 3.2. Ist (an )n∈IN eine konvergente Folge, so ist die Menge {an : n ∈ IN} be-
schränkt.

Beweis. Sei a := lim an . Dann existiert ein N ∈ IN mit |an − a| < 1 ∀n ≥ N, also
n→

|an | ≤ |an − a| + |a| < 1 + |a| ∀n ≥ N .

Mit M := max {|a1 |, |a2 |, . . . , |aN−1 |, 1 + |a|} gilt nun |an | ≤ M für alle n ∈ IN. 

Wir haben mit Satz 3.2 eine notwendige Bedingung für die Konvergenz einer
Folge, nämlich die Beschränktheit von {an : n ∈ IN}, gefunden. Zum Beispiel kann
(qn )n∈IN nicht konvergieren, falls |q| > 1 ist, da dann {qn : n ∈ IN} unbeschränkt ist,
siehe Satz 1.4(a).
26 3 Folgen reller und komplexer Zahlen

Der folgende Satz enthält ein hinreichendes Kriterium für Konvergenz. Eine Fol-
ge (an )n∈IN reeller Zahlen heißt monoton wachsend (bzw. monoton fallend), falls
an+1 ≥ an (bzw. an+1 ≤ an ) für alle n ∈ IN gilt.

Satz 3.3. (a) Jede monoton wachsende und nach oben beschränkte Folge (an )n∈IN
reeller Zahlen konvergiert gegen das Supremum von {an : n ∈ IN}, d.h.

lim an = sup{an : n ∈ IN} .


n→

(b) Jede monoton fallende und nach unten beschränkte Folge (an )n∈IN reeller Zah-
len konvergiert gegen das Infimum von {an : n ∈ IN}, d.h. lim an = inf{an : n ∈ IN}.
n→

Beweis. Wir führen den Nachweis hier nur für den Fall einer monoton wachsenden
und nach oben beschränkten Folge.
Laut Satz 1.11 existiert s := sup{an : n ∈ IN}. Sei nun  > 0. Dann gibt es ein
N ∈ IN mit aN > s −  , denn sonst wäre s nicht die kleinste obere Schranke. Mit
aN ≤ an ≤ s folgt |an − s| ≤ s − aN <  für alle n ≥ N. 

Man schreibt auch sup an := sup{an : n ∈ IN}, inf an := inf{an : n ∈ IN}.


n∈IN n∈IN

Wir notieren noch eine einfache Folgerung.

Korollar 3.4. Sei (In )n∈IN eine Intervallschachtelung, In = [an , bn ], so gilt



lim an = sup an = a = inf bn = lim bn mit In = {a} .
n→ n∈IN n∈IN n→
n∈IN

3.2 Rechnen mit Grenzwerten

Die folgenden Rechenregeln erleichtern die Bestimmung von Grenzwerten.

Satz 3.5. Seien (an )n∈IN , (bn )n∈IN zwei Folgen mit a = lim an und b = lim bn .
n→ n→
Es gelten:
(1) lim |an | = |a|
n→

(2) lim ( an ) =  a ( ∈ C)
n→

(3) lim (an + bn ) = a + b


n→

(4) lim (an bn ) = ab


n→

(5) Ist b = 0, so existiert ein n0 ∈ IN mit bn = 0 für alle n ≥ n0 , und die Folge
(an /bn )n≥n0 konvergiert gegen ab .
√ √
(6) Ist an ≥ 0 für alle n, so gilt lim k an = k a (k ∈ IN).
n→
3.2 Rechnen mit Grenzwerten 27

Beweis. (1) Seien  > 0 und N ∈ IN mit |an − a| <  ∀n ≥ N. Dann gilt auch
| |an | − |a| | ≤ |an − a| <  ∀n ≥ N.
(2) Der Fall  = 0 ist trivial. Andernfalls findet man zu  > 0 nun ein N ∈ IN mit
|an − a| < | | ∀n ≥ N. Damit gilt | an −  a| <  ∀n ≥ N.
(3) Zu  > 0 wähle N ∈ IN mit |an − a| <  /2 und |bn − b| <  /2 für alle n ≥ N. Es
folgt
 
|(an + bn) − (a + b)| ≤ |an − a| + |bn − b| < + = für alle n ≥ N .
2 2
(4) Nach Satz 3.3 existiert ein M > 0 mit |an | ≤ M für alle n ∈ IN.
Setze K := max{|b|, M}. Zu  > 0 existiert ein N ∈ IN mit |an − a| <  /2K und
|bn − b| <  /2K für alle n ≥ N. Damit gilt
 
|an bn −ab| = |an(bn −b)+(an −a)b| ≤ |an||bn −b|+|b||an −a| < K +K =
2K 2K
für alle n ≥ N.
(5) Mit dem vorangehenden Ergebnis genügt es, den Fall an = 1 zu betrachten.
Es existiert ein n0 ∈ IN mit |b| − |bn| ≤ |b − bn | < |b| 2 für alle n ≥ n0 . Folglich gilt
|b|
2 ≤ |b n | für alle n ≥ n 0 . Insbesondere gilt b n =
0 für alle n ≥ n0 .
1 1
Es bleibt noch zu zeigen, dass n→
lim bn = b gilt.
n≥n0

Zu  > 0 existiert ein N ∈ IN, N ≥ n0 mit |bn − b| < 2 |b|2 ∀n ≥ N. Damit gilt




1 1

bn − b
2


=

= 1 |bn − b| ≤ 2 |bn − b| < 2  |b| = 

bn b

bn b
|bn | |b| |b|2 |b|2 2

für alle n ≥ N. 

Zum Nachweis von (6) benötigen wir noch folgendes Resultat.
Satz 3.6. Seien (an )n∈IN eine konvergente Folge mit a = lim an und c ∈ IR.
n→

(a) Ist an ∈ IR mit an ≤ c (bzw. an ≥ c) für alle n ∈ IN, so gilt a ≤ c (bzw. a ≥ c).
(b) Ist |an | ≤ c (bzw. |an | ≥ c) für alle n ∈ IN, so gilt |a| ≤ c (bzw. |a| ≥ c).
Beweis. (a) Seien zunächst an ≤ c für alle n ∈ IN. Ist a > c, so findet man zu  :=
a − c ein m ∈ IN mit |am − a| <  . Daraus folgt am = am − a + a ≥ a − |am − a| >
a −  = c, ein Widerspruch. Es gilt also a ≤ c.
Im Fall an ≥ c gilt −an ≤ −c und wir erhalten analog −a ≤ −c, also a ≥ c.
(b) Aus an → a folgt |an | → |a| laut Rechenregel (1) aus Satz 3.5. Mit dem eben
Bewiesenen folgt die Behauptung. 

Zu Satz 3.6 sei noch erwähnt, dass aus an > c für alle n nicht notwendigerweise
auch a > c folgt. Als Gegenbeispiel dient etwa an := 1n .
28 3 Folgen reller und komplexer Zahlen

Beweis (von Satz√ 3.5(6)). Wegen an ≥ 0 für alle n ist laut Satz 3.6 auch a ≥ 0. Daher
existiert die Zahl k a.
Sei nun  > 0. Dann ist  k > 0 und es gibt ein N ∈ IN derart, dass |an − a| <  k
gilt für alle n ≥ N. Mit Lemma 1.9 folgt

√ √


k an − k a
≤ k |an − a| ≤ 
√ √
für alle n ≥ N. Also ist lim k an = k a. 

n→

Beispiel: lim n2 + n − n = 12 .
n→

Beweis. Es ist
√ √
 ( n2 + n − n)( n2 + n + n) n 1
2
n +n −n = √ =√ =
2
n +n +n 2
n +n +n 1 + 1n + 1

1
und mit lim = 0 sowie den Rechenregeln aus Satz 3.5 folgt
n→ n

 1 1 1
lim n2 + n − n = lim  =√ =
n→ n→
1 + 1n + 1 1 + 0+ 1 2

wie behauptet. 

Wir notieren noch eine weitere Folgerung.

Satz 3.7. Seien (an )n∈IN , (bn )n∈IN und (cn )n∈IN Folgen reller Zahlen mit an ≤ cn ≤ bn
für alle n ∈ IN.
Falls (an )n∈IN und (bn )n∈IN konvergent sind mit dem selben Grenzwert a, so gilt
auch lim cn = a.
n→


Beweis. Sei  > 0. Dann gibt es N1 , N2 ∈ IN mit |an − a| < 3 für alle n ≥ N1 und
|bn − a| < 3 für alle n ≥ N2 .
Aus an ≤ bn folgt mit der Dreiecksungleichung

bn − an = |bn − an| = |bn − a − (an − a)| ≤ |bn − a| + |an − a| ,

folglich gilt bn − an < 23  für alle n ≥ N := max{N1 , N2 }.


Außerdem gilt wegen an ≤ cn ≤ bn auch cn − an ≤ bn − an . Insgesamt erhalten
wir damit

|cn − a| = |cn − an + an − a|
≤ |cn − an| + |an − a| = cn − an + |an − a| ≤ bn − an + |an − a| <  .

für alle n ≥ N. Es ist also lim cn = a wie behauptet. 



n→
3.2 Rechnen mit Grenzwerten 29

Beispiel: Es gilt ⎧
⎨1
⎪ für 0 ≤ x < 1 ,
1
lim = 12 für x = 1 ,
n→ 1 + xn ⎪

0 für x ≥ 1 .
1 1
Beweis. Wir beginnen mit dem einfachsten Fall x = 1. Hier ist 1+xn = 2 für alle
1 1
n ∈ IN, also auch lim 1+xn = 2.
n→

Im Fall 0 ≤ x < 1 gilt lim xn = 0; mit den Rechenregeln aus Satz 3.5 erhalten wir
n→

1 1
lim n
= =1.
n→ 1+x 1+0
1 1 1 1
Für x > 1 gilt 0 < 1+xn < xn und lim n = 0; mit Satz 3.7 folgt lim n = 0. 

n→ x n→ 1+x

1
n=8
n=4
n=2 Die Abbildung zeigt das
1 1
2
Verhalten von 1+x n für
0 ≤ x ≤ 2 und n = 2, 4, 8.

x
1 2

Weitere wichtige Grenzwerte:



(1) lim n a = 1 für jedes a > 0 ,
n→

(2) lim n n = 1 ,
n→
nk
(3) lim n = 0 für jedes k ∈ IN und z ∈ C mit |z| > 1 .
n→ z

Beweis. (1) Wir betrachten zunächst den Fall a ≥ 1.



Für n ∈ IN setzen wir an := n a − 1. Mit der Bernoulli-Ungleichung (Satz 1.3)
erhalten wir a = (1 + an)n ≥ 1 + nan, also an ≤ a−1
n .
Wegen a ≥ 1 gilt weiter an ≥ 0 für alle n√und laut Satz 3.7 erhalten wir mit
lim a−1
n = 0 schließlich lim an = 0, also lim
n
a = 1.
n→ n→ n→

Es bleibt noch zu zeigen, dass die Behauptung auch für 0 < a < 1 gilt. In diesem
Fall ist 1a > 1 und wir können das bereits Bewiesene mit 1a an Stelle von a benützen:
Es gilt
√ 1 1
lim n a = lim  =  =1.
n→ n→ n 1
a lim n 1a
n→
30 3 Folgen reller und komplexer Zahlen

(2) Für n ∈ IN setzen wir an := n
n − 1, dann gilt an ≥ 0 und weiter

n(n − 1) 2 n(n − 1) 2
n = (1 + an)n = 1 + n an + an + · · · + ann ≥ 1 + an
2 2
für n ≥ 2, da alle Summanden auf der rechten Seite positiv sind. Nun folgt

n(n − 1) 2 n 2 2
n−1 ≥ an ⇒ 1 ≥ an ⇒ an ≤
2 2 n

für alle n ≥ 2. Mit lim 2n = 0 und Satz 3.7 erhalten wir lim an = 0, also
n→ n→

lim n
n=1.
n→

n+1
(3) Sei x := |z| − 1 > 0. Für jedes n ∈ IN mit n > 2k + 1, also 2 > k + 1, ist

n n n n(n − 1) · · ·(n − k) k+1  n k+1 xk+1
|z| = (1 + x) > xk+1 = x > ;
k+1 (k + 1)! 2 (k + 1)!

daraus folgt

k


n
k+1


< nk 1 (k + 1)! = 2 (k + 1)! n→
−→ 0

zn
n k+1 xk+1 xk+1 n
2

nk
und mit Satz 3.7 erhalten wir lim n = 0. 

n→ z

3.3 Asymptotische Gleichheit und rekursiv definierte Folgen

Für p, q ∈ IN, 0 , . . . , a p ; 0 , . . . , q ∈ C,  p = 0, q = 0, gilt



 / , falls p = q ,
p
 p n +  p−1 n p−1 + · · · + 0 ⎨ p q
lim = 0 , falls p<q,
n→ q nq + q−1 nq−1 + · · · + 0 ⎩
konvergiert nicht, falls p > q .

Der Grenzwert hängt also nur vom jeweils ersten Term in Zähler und Nenner ab.
Dies gibt Anlass zu folgender Definition.
Definition 3.8. Zwei Folgen (an )n∈IN , (bn )n∈IN heißen asymptotisch gleich, falls
lim bann = 1 gilt. Man schreibt: an ∼
= bn für n → .
n→

Hierbei wird nicht verlangt, dass die Folgen (an )n∈IN oder (bn )n∈IN selbst konvergent
sind. Insbesondere gilt

 p n p +  p−1 n p−1 + · · · + 0 ∼
= p np (0 , . . . ,  p ∈ C) .
3.3 Asymptotische Gleichheit und rekursiv definierte Folgen 31

Beispiel 3.9 (Wallissches Produkt). Für n ∈ IN sei


n
2 4 6 2n 2k
pn := · · ··· = .
1 3 5 2n − 1 k=1 2k − 1
√ √
Es gilt pn ∼
=  n, wobei  ∈ IR ist mit 2 ≤  ≤ 2.
pn
Beweis. Einerseits ist √
n
monoton fallend, denn
 p 2
√n+1
n+1 n (2n + 2)2 4n(n + 1) 4n2 + 4n
pn = = = <1;

n
n + 1 (2n + 1)2 (2n + 1)2 4n2 + 4n + 1

andererseits ist √ pn monoton wachsend, denn


n+1

 p 2
√n+1
n+2 n + 1 (2n + 2)2 4(n + 1)3
= = >1.
√ pn n + 2 (2n + 1)2 4n3 + 12n2 + 9n + 2
n+1

Daraus folgt
√ p1 pn pn
2 = √ ≤ ··· ≤ √ ≤ √ ≤ · · · ≤ p1 = 2 .
2 n+1 n

Also ergibt sich mit Satz 3.3 nun


pn pn √
lim √ = inf √ =:  ≥ 2 (3.1)
n→ n n∈IN n

pn pn
und lim √ = sup √ =:  ≤ 2 . (3.2)
n + 1 n∈IN n + 1
n→


Insbesondere ist mit (3.1) gezeigt, dass pn ∼
=  n gilt.
Weiter gilt auch  =  wegen
√pn √
n n+1
= √ →1.
√ pn n
n+1

Insbesondere erhält man durch


!
pn pn
In := √ ,√
n+1 n

eine Intervallschachtelung mit In = { }. 

n∈IN

Tatsächlich gilt  =  ; zum Beweis siehe Kapitel 8.3.

Es ist oft sinnvoll oder sogar nötig, eine Folge rekursiv zu definieren, d.h. mittels
einer Vorschrift, die angibt, wie man an+1 aus a1 , . . . , an berechnet.
32 3 Folgen reller und komplexer Zahlen

Beispiel 3.10 (Algorithmus zur Bestimmung der Quadratwurzel). Sei x > 0.


Dann ist durch

1 x
a1 := x , an+1 := an + für n ∈ IN ,
2 an

eine Folge (an )n∈IN erklärt.


Wir wollen uns überlegen, ob diese Folge konvergent ist. Falls an > 0 ist, so folgt
auch an+1 > 0. Zusammen mit a1 = x > 0 erhalten wir induktiv an > 0 für alle
n ∈ IN, insbesondere ist der Bruch axn überhaupt erklärt.
Wenn wir annehmen, dass lim an =:  existiert, so gilt auch lim an+1 =  und
n→ n→

1 x 1 x
 = lim an+1 = lim an + = + ,
n→ n→ 2 an 2 

falls  = 0.

Wegen  = 12 ( + x√) ⇒ 2 2 =  2 + x ⇒  = ± x kommen als Grenzwert
nur die Werte 0 und ± x in Frage. Wir haben allerdings noch nicht gezeigt, dass
die Folge konvergent ist!

Behauptung: Es gilt lim an = x.
n→

Beweis. Für jedes n ∈ IN gilt



√ 1 √ x 1 2 √  (an − x)2
an+1 − x = an − 2 x + = an − 2 x an + x = ≥0.
2 an 2an 2an

Weiter ist

√ 1 √  an − x 1 √ 
0 ≤ an+1 − x = an − x ≤ an − x
2 an 2
  
≤1

1 √  1 1 √ 1 √
≤ ··· ≤ a2 − x = (x + 1) − x = n ( x − 1)2 .
2n−1 2n−1 2 2
1 √ 2 √
Mit lim n ( x − 1) = 0 erhalten wir nun lim an − x = 0 wie gewünscht. 

n→ 2 n→

3.4 Eine Intervallschachtelung für den Logarithmus

Folgendes Konzept stammt von Adolf Hurwitz (1859-1919, Königsberg; Studium in


München). Wir werden in Kapitel 6.3 sehen, dass es sich bei dem hier konstruierten
so genannten Logarithmus in der Tat um die Umkehrung der Exponentialfunktion
handelt.
3.4 Eine Intervallschachtelung für den Logarithmus 33

Wir betrachten für beliebiges x > 0 eine rekursiv definierte Folge (xn )n∈IN0 . Es seien

x0 := x , xn+1 := xn (n ∈ IN0 ) . (3.3)

Wir zeigen, dass unabhängig vom Startwert x immer lim xn = 1 gilt.


n→

Beweis. Ist x0 = x ≥ 1, so ist auch xn ≥ 1 ∀n ∈ IN und daher xn+1 ≤ x2n+1 = xn ,


d.h. (xn )n∈IN0 ist monoton fallend und nach unten beschränkt. Laut Satz 3.3 existiert
 := lim xn ≥ 1. Da aber auch  = lim xn+1 ist, gilt
n→ n→

 2 = lim x2n+1 = lim xn =  .


n→ n→

Daraus folgt  = 0 oder  = 1. Schließlich ist  = 0 aber nicht möglich wegen


xn ≥ 1 ∀n ∈ IN. 
Ist 0 < x < 1, so betrachte 1x als Startwert. Mit √1x = 1x folgt dann analog zu
obiger Berechnung ebenfalls die Behauptung. 

Lemma 3.11. Sei x > 0. Mit der in (3.3) erklärten Folge (xn )n∈IN0 setze

n 1
an := 2 1 − , bn := 2n (xn − 1) . (3.4)
xn

Dann ist (In )n∈IN0 mit In := [an , bn ] eine Intervallschachtelung.

Beweis. Wir zeigen zunächst bn+1 ≤ bn und an ≤ an+1 sowie an ≤ bn für alle n ∈ IN.
Dazu benutzen wir die Ungleichungen
1
(i) 2(y − 1) ≤ y2 − 1 und (ii) y+ ≥2
y

für beliebiges y > 0, die man leicht aus y2 − 2y + 1 = (y − 1)2 ≥ 0 folgern kann.
Mit (i) erhalten wir

bn+1 = 2n+1(xn+1 − 1) ≤ 2n (x2n+1 − 1) = 2n (xn − 1) = bn sowie


 
1 1 1
an+1 = −2n+1 − 1 ≥ −2n − 1 = 2 n
1 − = an
xn+1 x2n+1 xn
 
und mit (ii) schließlich an = 2n 1 − x1n ≤ 2n (xn − 1) = bn .
Also sind (an )n∈IN0 und (bn )n∈IN0 konvergente Folgen, siehe Satz 3.3, denn
(an )n∈IN0 ist monoton steigend, beschränkt nach oben durch b0 und (bn )n∈IN0 ist
monoton fallend, beschränkt nach unten durch a0 .
 
Wegen an xn = 2n 1 − x1n xn = 2n (xn − 1) = bn und lim xn = 1 gilt lim an = lim bn .
n→ n→ n→

Damit ist gezeigt, dass (In )n∈IN0 eine Intervallschachtelung ist. 



34 3 Folgen reller und komplexer Zahlen

Ausgehend von x > 0 haben wir über (3.3) und (3.4) eine Intervallschachtelung
(In )n∈IN0 mit In = [an , bn ] definiert. Bezeichne ln(x) := lim an = lim bn , also
n→ n→

{ln(x)} = In .
n∈IN0

Wir nennen diese Zahl den (natürlichen) Logarithmus von x.

Satz 3.12. Für alle x, y > 0 gelten


(a) ln(1) = 0 ,
  √
(b) 1 − 1x ≤ ln(x) ≤ x − 1 und 2 1 − √1x ≤ ln(x) ≤ 2( x − 1) ,
(c) ln(xy) = ln(x) + ln(y) . (Funktionalgleichung des Logarithmus)

Beweis. (a) Für x = 1 gilt xn = 1, also an = bn = 0 für alle n ∈ IN, und somit
ln(1) = 0.
(b) Wie in Lemma 3.11 gezeigt, gilt an ≤ ln(x) ≤ bn ∀n ∈ IN0 (wobei an , bn von
x > 0 abhängen). Für n = 0 erhält man
1
1−
≤ ln(x) ≤ x − 1 .
x
√   √
Für n = 1 gilt x1 = x, also hat man 2 1 − √1x ≤ ln(x) ≤ 2( x − 1).

(c) Es sei z := xy > 0. Wir betrachten nun x0 = x, y0 = y, z0 = z und xn+1 = xn ,
√ √
yn+1 = yn , zn+1 = zn gemäß (3.3).
Unter Benutzung der bn zu x bzw. y bzw. z erhält man

ln(z) = lim 2n (zn − 1) = lim 2n (xn yn − 1) = lim (2n xn (yn − 1) + 2n(xn − 1))
n→ n→ n→
 
= lim xn lim 2n (yn − 1) + lim 2n (xn − 1) = ln(y) + ln(x)
n→ n→ n→

wie behauptet. 

Korollar 3.13. Es gelten



(a) ln 1x = − ln(x) für alle x > 0,
(b) 0 < x < y ⇒ ln(x) < ln(y).

Beweis. (a) Mit der Funktionalgleichung erhalten wir



1 1
ln + ln(x) = ln x = ln(1) = 0 .
x x

(b) Setze c := yx . Mit c > 1 folgt aus Satz 3.12(b) zunächst ln(c) ≥ 1 − 1c > 0; mit
der Funktionalgleichung folgt nun ln(y) = ln(cx) = ln(c) + ln(x) > ln(x). 

3.5 Aufgaben 35

ln(x)
Der Logarithmus wird
zwar beliebig groß, aber
äußerst langsam. Um im
Maßstab der Abbildung
30 cm auf der y-Achse
an Höhe zu gewinnen x
(A4-Blatt), braucht man
auf der x-Achse 100 Mil-
lionen Kilometer (≈ 23 ×
Abstand Erde – Sonne).

3.5 Aufgaben

1. Welche der Folgen


1 1 − 2n
an := √ , bn := , cn := (−1)n
n+1 5 + 3n

sind konvergent ? Bestimmen Sie gegebenenfalls den Grenzwert. Benutzen Sie


dabei direkt die Definition 3.1 und keine weiteren Resultate aus Kapitel 3.

2. Berechnen Sie die Grenzwerte der durch


n2 + 3n + 2 5n8 − 7n − 1
an := und bn :=
n3 + 1 n8 + n4 + n2 + 1
erklärten Folgen.

3. Ist die durch


1 n
an := 1 − 2
n
erklärte Folge (an )n∈IN konvergent ? Bestimmen Sie ggf. den Grenzwert.

4. Zeigen Sie mit Hilfe von Satz 3.3, dass die durch
1 1 1
an := + + ···+
1+n 2+n n+n
erklärte Folge (an )n∈IN konvergiert.

5. Es sei (an )n∈IN eine Folge komplexer Zahlen. Zeigen Sie:


Die Folge (an )n∈IN ist konvergent genau dann, wenn (Re an )n∈IN und (Im an )n∈IN
beide konvergent sind.
36 3 Folgen reller und komplexer Zahlen

6. Untersuchen Sie die Folgen auf Konvergenz und bestimmen Sie gegebenenfalls
den Grenzwert.
√ √
a. an := n + t − n mit t > 0
 √
b. bn := n + nt − n mit t > 0

c. c1 := 1 , cn+1 := 2 + cn für n ∈ IN

d. dn := n an + bn mit 0 ≤ a ≤ b (Hinweis: bn ≤ an + bn ≤ 2bn )

7. Es seien (an )n∈IN eine Folge komplexer Zahlen und a ∈ C.


Zeigen Sie, dass die folgenden drei Aussagen äquivalent sind.
(i) Zu jedem  > 0 gibt es ein N ∈ IN mit |an − a| <  für alle n ≥ N.
(ii) Zu jedem  > 0 gibt es ein N ∈ IN mit |an − a| ≤  für alle n ≥ N.

(iii) Zu jedem  > 0 gibt es ein N ∈ IN mit |an − a| < 2 für alle n ≥ N.

8. Das Arithmetisch-geometrische Mittel.


Es seien a, b ∈ IR mit 0 < a < b. Wir setzen a0 := a, b0 := b und

an+1 := G(an , bn ) , bn+1 := A(an , bn ) für n ∈ IN0 ,

wobei A und G wie in 1.4, Aufgabe 8, erklärt sind. Zeigen Sie:


a. Für alle n ∈ IN0 gilt an < bn .
b. Die Intervalle In := [an , bn ] bilden eine Intervallschachtelung.
1
c. Für alle n ∈ IN0 gilt bn+1 − an+1 ≤ 8a (bn − an)2 .
Kapitel 4
Metrische Räume und Cauchyfolgen

Wir haben den Begriff der Konvergenz sowohl für reelle als auch für komplexe
Folgen erklärt. Dabei haben wir nur den Begriff des Abstandes“ zwischen x und y

benützt, nämlich |x − y|.
Hat man einen sinnvollen Abstandsbegriff in anderen Räumen als IR oder C, so
kann man dort auch Konvergenz erklären.

4.1 Metrische und normierte Räume

Wir führen nun einen allgemeinen Abstandsbegriff auf beliebigen Mengen ein.

Definition 4.1. Sei M eine Menge. Eine Abbildung d : M × M → IR heißt Metrik,


wenn
(M1) d(a, b) ≥ 0 und d(a, b) = 0 ⇐⇒ a = b,
(M2) d(a, b) = d(b, a),
(M3) d(a, c) ≤ d(a, b) + d(b, c), (Dreiecksungleichung)
für alle a, b, c ∈ M gilt. Man sagt dann, (M, d) ist ein metrischer Raum, und nennt
d(a, b) den Abstand von a und b.

Beispiele:
(1) Auf IR oder C haben wir eine natürliche“ Metrik, d(x, y) := |x − y|.

Wir schreiben künftig IK für IR oder C.
(2) Auf jeder Menge M = ∅ ist durch

0 , für a = b ,
d(a, b) :=
1 , für a = b ,

eine Metrik gegeben, die diskrete Metrik.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 37


DOI 10.1007/978-3-642-28644-5_4, © Springer-Verlag Berlin Heidelberg 2012
38 4 Metrische Räume und Cauchyfolgen

(3) Sei M := {0, 1}n := {x = (x1 , . . . , xn ) : x1 , . . . , xn ∈ {0, 1} }. Durch

d(x, y) := |x1 − y1 | + . . . + |xn − yn |

(die Anzahl der Stellen, an denen x und y verschiedene Einträge haben) ist
eine Metrik definiert. Sie heißt Hamming-Abstand.
(4) Auf IK haben wir bereits zwei Metriken, die natürliche und die diskrete Me-
trik. Eine weitere ist durch
|x − y|
d(x, y) :=
1 + |x − y|

definiert. (M1), (M2) sind offensichtlich erfüllt.


Um (M3) zu zeigen, verwenden wir folgende Hilfsaussage: Für 0 ≤ s ≤ t gilt
s t
s(1 + t) = s + st ≤ t + st = t(1 + s) und daraus folgt 1+s ≤ 1+t .
Mit s = |x − z| und t = |x − y| + |y − z| gilt

|x − z| (|x − y| + |y − z|)
d(x, z) = ≤
1 + |x − z| 1 + (|x − y| + |y − z|)
|x − y| |y − z|
= +
1 + (|x − y| + |y − z|) 1 + (|x − y| + |y − z|)
|x − y| |y − z|
≤ + = d(x, y) + d(y, z) ,
1 + |x − y| 1 + |y − z|

also ist (M3) ebenfalls erfüllt.


Man beachte, dass in einem metrischen Raum (M, d) jede Teilmenge L ⊆ M mit
d|L, der Einschränkung von d auf L, ein metrischer Raum ist.
Ist die zu Grunde liegende Menge sogar ein IK-Vektorraum (IK = IR oder C), so
erhält man Metriken u.a. über so genannte Normen.

Definition 4.2. Sei X ein IK-Vektorraum. Eine Abbildung  ·  : X → IR heißt


Norm, wenn
(N1) x ≥ 0 und x = 0 ⇐⇒ x = 0,
(N2)  x = | |x,
(N3) x + y ≤ x + y, (Dreiecksungleichung)
für alle x, y ∈ X und alle  ∈ IK gilt. Weiter heißt (X,  · ) dann normierter Raum.

Man sieht sofort, daß bei gegebener Norm  ·  durch

d(x, y) := x − y (4.1)

eine Metrik auf X definiert wird.


Die Metriken auf einem IK-Vektorraum, die durch Normen gemäß (4.1) bestimmt
sind, kann man einfach charakterisieren.
4.1 Metrische und normierte Räume 39

Satz 4.3. Sei X ein IK-Vektorraum. Eine Metrik d auf X wird gemäß (4.1) von einer
Norm definiert genau dann, wenn
(a) d(x + a, y + a) = d(x, y) und
(b) d( x,  y) = | | d(x, y),
für alle x, y ∈ X,  ∈ IK gilt.

Beweis. Bei gegebener Norm  ·  setzen wir d(x, y) := x − y für x, y ∈ X. Dann


gelten

d(x + a, y + a) = (x + a) − (y + a) = d(x, y) und


d( x,  y) = ( x) − ( y) = | | d(x, y) .

Sei umgekehrt d mit (a) und (b) gegeben. Wir setzen nun x := d(x, 0) für x ∈ X.
Dann gilt x = 0 ⇐⇒ d(x, 0) = 0 ⇐⇒ x = 0. Ferner ist
(b)
 x = d( x,  0) = | | d(x, 0) = | |x .

Schließlich gilt auch


(a)
x + y = d(x + y, 0) = d(x, −y) ≤ d(x, 0) + d(0, −y)
(b)
= d(x, 0) + d(−y, 0) = x + y .

Es bleibt zu prüfen, dass zwischen der so definierten Norm und d die Beziehung
(4.1) gilt. In der Tat ist
(a)
x − y = d(x − y, 0) = d(x, y)

wie behauptet. 

Beispiel: Normen auf IKd . Für x = (x1 , . . . , xd ) seien


d
x1 :=  |xk | ,
k=1
 1/2
d
x2 :=  |xk | 2
,
k=1

x := max |xk | .


k=1,...,d

Die Eigenschaften (N1) und (N2) gelten offensichtlich in allen drei Fällen. Die
Dreiecksungleichung (N3) ist für  · 1 und  ·  ebenfalls einfach zu sehen.
Die Dreiecksungleichung für  · 2 heißt auch Minkowski-Ungleichung (Hermann
Minkowski, 1864-1909, Zürich, Göttingen). Zu deren Nachweis benötigen wir die
40 4 Metrische Räume und Cauchyfolgen

Cauchy-Ungleichung; auch Cauchy-Schwarz-Ungleichung oder Cauchy-Schwarz-


Bunjakowski-Ungleichung genannt (Augustin Louis Cauchy, 1789-1857, Paris;
Viktor Jakowlewitsch Bunjakowski, 1804-1889, Petersburg; Hermann Amandus
Schwarz, 1843-1921, Berlin).
Satz 4.4 (Cauchy-Ungleichung). Seien (a1 , . . . , ad ) , (b1 , . . . , bd ) ∈ IRd . Dann gilt


 1/2  1/2

d
d d


 ak bk
≤  a2k  b2k .

k=1
k=1 k=1

Beweis. Es ist
    2
d d d d d d d
 a2k  b2k −  ak bk =   a2k b2i −   ak bk ai bi .
k=1 k=1 k=1 k=1 i=1 k=1 i=1

Auf der rechten Seite fallen die Summanden für k = i jeweils weg; wir erhalten
d d d d d d 2 2 
  a2k b2i −   ak bk aibi =   ak bi − ak bk ai bi
k=1 i=1 k=1 i=1 k=1 i = 1
i = k
d d 2 2 
=   ak bi − 2ak bk ai bi + a2i b2k
k=1 i=k+1
d d
=   (ak bi − ai bk )2 ≥ 0
k=1 i=k+1

und weiter  2   
d d d
 ak bk ≤  a2k  b2k .
k=1 k=1 k=1

Da die Summen auf der rechten Seite nicht negativ sind, ist


 1/2  1/2

d
d d


 ak bk
≤  a2k  b2k

k=1
k=1 k=1

wie gewünscht. 

Satz 4.5 (Minkowski-Ungleichung). Seien x = (x1 , . . . , xd ) , y = (y1 , . . . , yd ) ∈ IKd .
Dann gilt x + y2 ≤ x2 + y2.
Beweis. Es ist
d d
x + y22 =  |xk + yk |2 ≤  |xk + yk | (|xk | + |yk |)
k=1 k=1

und mit Hilfe der Cauchy-Ungleichung erhalten wir


4.1 Metrische und normierte Räume 41

d d
 |xk + yk | |xk | +  |xk + yk | |yk |
k=1 k=1
 1/2  1/2  1/2  1/2
d d d d
≤  |xk + yk | 2
 |xk |
2
+  |xk + yk |
2
 |yk |2
k=1 k=1 k=1 k=1

= x + y2 (x2 + y2) .

Daraus folgt x + y2 ≤ x2 + y2. 


Damit ist gezeigt, dass auch  · 2 eine Norm auf IKd ist. Man nennt sie die Eukli-
dische Norm. Der normierte Raum (IRd ,  · 2) heißt Euklidischer Raum.
Die folgende Abbildung zeigt für jede der Normen  · 1 ,  · 2 und  ·  in IR2
die so genannte Einheitskugel K1 (0) := {x ∈ IR2 : x ≤ 1}.

(0, 1) (0, 1) (1, 1)

(1, 0)
(1, 0) (1, 0)

Für x = (x1 , x2 ) mit x1 ≤ 1 Die Einheitskugel bezüglich Die Einheitskugel bzgl.
gilt x1 ∈ [−1, 1] und  · 2 ist genau die Kreisscheibe  ·  ist das Quadrat
x2 ∈ [−1 + |x1 |, 1 − |x1 |]. {(x1 , x2 ) ∈ IR2 : x21 + x22 ≤ 1}. [−1, 1]2 .

Beispiel: Der Raum  .


Wir bezeichnen den Raum aller beschränkten Folgen reeller (oder komplexer)
Zahlen mit  . Mit den für x = (xn )n∈IN , y = (yn )n∈IN und  ∈ IK definierten Ope-
rationen (x + y)n := xn + yn und ( x)n :=  xn ist dies ein IK-Vektorraum.
Wir wollen sehen, dass durch x := sup |xn | eine Norm auf  erklärt ist.
n∈IN
Die Eigenschaften (N1) und (N2) sind leicht ersichtlich. Zum Nachweis der
Dreiecksungleichung seien x, y ∈  . Für jedes k ∈ IN gilt |xk + yk | ≤ |xk | + |yk | ≤
sup{|xn | : n ∈ IN} + sup{|yn | : n ∈ IN}, also auch

x + y = sup{|xk + yk | : k ∈ IN}


≤ sup{|xn | : n ∈ IN} + sup{|yn | : n ∈ IN} = x + y .

Bezeichnungen: Ist (M, d) ein metrischer Raum, so definieren wir

Ur (a) := {b ∈ M : d(b, a) < r} und Kr (a) := {b ∈ M : d(b, a) ≤ r}


sowie Sr (a) := {b ∈ M : d(b, a) = r}

für feste a ∈ M, r > 0.


42 4 Metrische Räume und Cauchyfolgen

4.2 Cauchyfolgen und Vollständigkeit

Für Folgen (an )n∈IN , an ∈ M, liegt es nun auf der Hand, einen Konvergenzbegriff
einzuführen.

Definition 4.6. Seien (M, d) ein metrischer Raum und (an )n∈IN eine Folge in M.
(i) Die Folge (an )n∈IN heißt konvergent gegen a ∈ M, falls zu jedem  > 0 ein
N ∈ IN existiert mit

d(an , a) <  für alle n ≥ N .


d
Man schreibt lim an = a oder an −→ a.
n→
(ii) Die Folge (an )n∈IN heißt Cauchyfolge, falls zu jedem  > 0 ein N ∈ IN exis-
tiert mit
d(an , am ) <  für alle n, m ≥ N .
(iii) Der Raum (M, d) heißt vollständig, falls jede Cauchyfolge in M konver-
giert. Ein vollständiger normierter Raum heißt Banachraum (Stefan Ba-
nach, 1892-1945, Lemberg).
x
Beispiel: Für x ∈ IR setze  (x) := 1+|x| . Dann ist durch

d(x, y) := | (x) −  (y)|

eine Metrik d auf IR erklärt, sodass (IR, d) nicht vollständig ist.

Beweis. Aus der Definition folgt unmittelbar, dass d(z, y) ≥ 0 ist für alle x, y ∈ IR;
im Fall x = y gilt offensichtlich d(x, y) = 0.
Sei nun d(x, y) = 0, so folgt
x y
= ⇒ x(1 + |y|) = y(1 + |x|) ⇒ x + x |y| = y + y |x| .
1 + |x| 1 + |y|

In den Fällen x, y ≥ 0 oder x, y ≤ 0 erhalten wir x |y| = y |x| und damit x = y. An-
dernfalls können wir ohne Einschränkung annehmen, dass x > 0 und y ≤ 0 gilt. Wir
erhalten −x |y| = y |x| und weiter x + x |y| = y − x |y| ⇒ 2x |y| = y − x. Wegen x > 0
und y ≤ 0 ist dies ein Widerspruch.
Es gilt also d(x, y) = 0 ⇐⇒ x = y. Damit ist (M1) gezeigt; (M2) ist offenbar
auch erfüllt. Seien x, y, z ∈ IR, dann gilt




x z

x y y z

d(x, z) =

− = − + −
1 + |x| 1 + |z|

1 + |x| 1 + |y| 1 + |y| 1 + |z|


x y

y z



− + − = d(x, y) + d(y, z) ,
1 + |x| 1 + |y|

1 + |y| 1 + |z|

womit (M3) auch gezeigt ist. Folglich ist d eine Metrik.


4.2 Cauchyfolgen und Vollständigkeit 43

Es sei an := n für a ∈ IN.


Für beliebiges N ∈ IN und N ≤ m ≤ n gilt dann




n m

n(1 + m) − m(1 + n)

n−m
d(an , am ) =

− = =
1 + n 1 + m

(1 + n)(1 + m)
(1 + n)(1 + m)
n 1 1
≤ = ≤ .
n(m + 1) m + 1 N
1
Wenn wir zu  > 0 also N ∈ IN so wählen, dass N <  ist, erhalten wir

d(an , am ) <  für alle n, m ≥ N ,

d.h. (an )n∈IN ist eine Cauchyfolge in (IR, d).


d
Angenommen, es gibt a ∈ IR mit an → a. Offensichtlich ist dann a > 0.
Für n ∈ IN, n > 2a, folgt


n

n a

|n − a| 1

d(an , a) =
− = > 2
= .
1 + n 1 + |a|
(1 + n)(1 + |a|) 2n(1 + |a|) 4(1 + |a|)
1
Zu  = 4(1+|a|) gibt es demnach kein N ∈ IN derart, dass gilt

d(an , a) <  für alle n ≥ N


d
im Widerspruch zu an → a. Die Folge konvergiert also nicht.
Wir haben hiermit eine Cauchyfolge in (IR, d) gefunden, die nicht konvergiert. Folg-
lich ist (IR, d) nicht vollständig. 

Bemerkungen:
(1) Eine Folge in (M, d) kann gegen höchstens einen Grenzwert konvergieren.
Man kann den Beweis aus Abschnitt 3.1 fast wörtlich kopieren.
(2) Auch nach Definition√ 4.6
√ ist Q mit der natürlichen Metrik nicht vollständig:
In jedem Intervall [ 2, 2 + 1n ] finden wir ein an ∈ Q. Damit ist (an )n∈IN eine
Cauchyfolge in Q, konvergiert aber nicht (in Q).
(3) Jede konvergente Folge (an )n∈IN in (M, d) ist eine Cauchyfolge, denn seien
a = lim an und  > 0, so gibt es ein N ∈ IN mit d(an , a) < 2 für alle n ≥ N,
n→
und damit gilt
 
d(an , am ) ≤ d(an , a) + d(a, am) < + = falls n, m ≥ N .
2 2
Wenn wir im Folgenden von Konvergenz in IR oder C (ohne zusätzliche Angabe)
sprechen, meinen wir stets Konvergenz in der natürlichen (Betrags-)Metrik.

Satz 4.7. Jede Cauchyfolge (an )n∈IN in IR ist konvergent.


44 4 Metrische Räume und Cauchyfolgen

1
Beweis. Zu k ∈ IN gibt es nk ∈ IN mit |an − am | 2k+1 für alle n, m ≥ nk . Wir können
diese so wählen, dass nk+1 ≥ nk gilt. Definiert man Intervalle mittels

1
Ik := x ∈ IR : |x − ank | ≤ k ,
2

dann ist an ∈ Ik für alle n ≥ nk . Weiter gilt Ik+1 ⊆ Ik : Ist nämlich x ∈ Ik+1 , so gilt
1 1
|x − ank+1 | ≤ 2k+1 . Da mit nk+1 ≥ nk auch |ank+1 − ank | < 2k+1 ist, folgt

1
|x − ank | ≤ |x − ank+1 | + |ank+1 − ank | < , also x ∈ Ik .
2k
1
Die Länge der Ik ist 2k−1
. Somit ist (Ik )k∈IN eine Intervallschachtelung.


Gemäß der Vollständigkeit von IR nach Definition 1.6 sei nun Ik = {a}.
k=1
Wir zeigen, dass lim an = a gilt.
n→
Ist  > 0, so wähle k ∈ IN mit 1
2k
< 2 . Für n ≥ N := nk gilt dann

1 1  
|an − a| ≤ |an − ank | + |ank − a| < + < + = .
2k+1 2k 2 2
Folglich konvergiert die Folge (an )n∈IN gegen a. 

Bemerkung: Im Beweis von Satz 4.7 haben wir die Vollständigkeit von IR bezüglich
Intervallschachtelungen benutzt um Vollständigkeit bzgl. Cauchyfolgen zu zeigen.
Fordert man in der Konstruktion der Menge IR als vollständigen archimedisch
angeordneten Körper die Vollständigkeit mittels Cauchyfolgen, so kann man daraus
wiederum die Vollständigkeit bezüglich Intervallschachtelungen zeigen.
Darüberhinaus ist auch die Supremumseigenschaft (vgl. Satz 1.11) eine äquiva-
lente Charakterisierung der Vollständigkeit von IR.
Weitere Details zur Menge der reellen Zahlen findet man u.a. in [3].

Konvergenz im Euklidischen Raum:


Es sei (xn )n∈IN eine Folge in IKd , xn = (xn,1 , ..., xn,d ). Wegen

d
 |xn,k − xk |2 → 0 ⇐⇒ xn,k → xk für alle k ∈ {1, . . . , d}
k=1

konvergiert (xn )n∈IN gegen x ∈ IKd bzgl.  · 2 genau dann, wenn alle Komponen-
tenfolgen (xn,k )n∈IN gegen xk konvergieren.
Ebenso sieht man, dass (xn )n∈IN Cauchyfolge in (IKd ,  · 2 ) ist, genau dann,
wenn alle Komponentenfolgen (xn,k )n∈IN , k = 1, . . . , d, Cauchyfolgen in IK sind.
Damit folgt:

Korollar 4.8. Der Euklidische Raum (IRd ,  · 2 ) ist vollständig. Insbesondere ist
auch C (mit der natürlichen Metrik) vollständig.
4.3 Skalarprodukt und Orthogonalität 45

Wir wollen noch ein Beispiel für einen weiteren Banachraum angeben.
Sei M eine beliebige Menge, und bezeichne B(M) den Raum aller beschränkten
Funktionen f : M → IK, d.h. B(M) enthält genau diejenigen Abbildungen f , für
die { f (x) : x ∈ M} eine beschränkte Teilmenge von IK ist. Mit f , g ∈ B(M) und
 ∈ IK gilt offensichtlich auch f + g ∈ B(M) und  f ∈ B(M), daher ist B(M) ein
IK-Vektorraum. Weiter sei
 f  := sup | f (x)| .
x∈M

Man kann direkt nachrechnen, dass  ·  eine Norm auf B(M) ist.
Gelegentlich schreibt man auch  · M an Stelle von  ·  .
Satz 4.9. Der normierte Raum (B(M),  ·  ) ist ein Banachraum.
Beweis. Zu zeigen bleibt, dass jede Cauchyfolge in (B(M),  ·  ) konvergiert.
Sei ( fn )n∈IN eine Cauchyfolge in (B(M),  ·  ). Zu jedem  > 0 gibt es demnach
ein N ∈ IN mit  fn − fm  <  für alle m, n ≥ N.
Für beliebiges x ∈ M folgt daraus | fn (x) − fm (x)| <  ∀ m, n ≥ N, wobei N un-
abhängig von x ist. Folglich ist ( fn (x))n∈IN eine Cauchyfolge in IK. Diese ist kon-
vergent, da IK vollständig ist. Also existiert der Grenzwert lim fn (x) =: f (x).
n→
Sei n ≥ N zunächst fest gewählt.
Es ist lim | fn (x) − fm (x)| = | fn (x) − f (x)| und damit | fn (x) − f (x)| ≤  ∀x ∈ M.
m→
Da fn beschränkt ist, ist somit auch f beschränkt. Weiter gilt

 fn − f  = sup | fn (x) − f (x)| ≤  für alle n ≥ N ,


x∈M

also konvergiert die Folge ( fn )n∈IN im Raum (B(M),  ·  ) gegen f ∈ B(M). 


4.3 Skalarprodukt und Orthogonalität

Definition 4.10. Sei X ein IK-Vektorraum. Eine Abbildung ·, · : X × X → IK heißt


Skalarprodukt, wenn
(S1) x, x ≥ 0 und x, x = 0 ⇐⇒ x = 0,
(S2)  x, y =  x, y,
(S3) x, y = y, x,
(S4) x + y, z = x, z + y, z,
für alle x, y, z ∈ X und alle  ∈ IK gilt. Einen Vektorraum mit Skalarprodukt bezeich-
net man auch als Prähilbertraum.
Weiter sagt man, x und y sind orthogonal, falls x, y = 0 ist.
Sei I eine beliebige Indexmenge. Eine Menge {xi : i ∈ I} ⊆ X heißt orthonormal,
falls xi , x j  = 0 für i = j und xi , xi  = 1 für alle i ∈ I gilt.
46 4 Metrische Räume und Cauchyfolgen

Wit werden sehen, dass in einem Prähilbertraum X durch x := x, x eine Norm
erklärt ist. Die Eigenschaften (N1) und (N2) sind offensichtlich. Zum Nachweis der
Dreiecksungleichung (N3) sind noch einige Überlegungen nötig.

Satz 4.11 (Pythagoras). Sei {x1 , . . . , xn } eine endliche orthonormale Menge in


einem Prähilbertraum X.
Dann gilt " "2
n " n "
" "
x =  |x, xk | + "x −  x, xk  xk " .
2 2
k=1
" k=1
"

n
Beweis. Mit s :=  x, xk  xk und der Orthonormalität erhalten wir
k=1
# $
n n n n n
s2 =  x, xk  xk ,  x, x j  x j =   x, xk x, x j  xk , x j  =  |x, xk |2
k=1 j=1 k=1 j=1 k=1

n
sowie s, x =  |xk , x|2 = x, s. Insgesamt gilt also
k=1

n
x − s2 = x − s, x − s = x, x − x, s − s, x + s, s = x2 −  |x, xk |2
k=1

wie behauptet. 

Eine unmittelbare Konsequenz ist die Besselsche Ungleichung (Friedrich Wilhelm


Bessel, 1784-1846, Königsberg): Ist {x1 , . . . , xn } eine endliche orthonormale Menge
in einem Prähilbertraum X, so gilt
n
x2 ≥  |x, xk |2 für alle x ∈ X . (4.2)
k=1

Korollar 4.12 (Cauchy-Schwarz-Ungleichung). Sei X ein Prähilbertraum.


Für alle x, y ∈ X gilt |x, y| ≤ x y.

Beweis. Im Fall y = 0 ist die Behauptung klar. Andernfalls betrachte die orthonor-
1
male Menge {x1 } mit x1 = y y und benutze (4.2). 

Aus der Cauchy-Schwarz-Ungleichung erhält man weiter

x + y2 = x + y, x + y = x2 + 2Rex, y + y2


≤ x2 + 2 |x, y| + y2 ≤ x2 + 2 x y + y2 = (x + y)2

und damit die Dreiecksunleichung für  · . Damit ist nun auch bewiesen, dass es
sich hierbei tatsächlich um eine Norm handelt. Ist X mit dieser Norm vollständig,
so bezeichnet man X als einen Hilbertraum (David Hilbert, 1862-1943, Göttingen).
4.3 Skalarprodukt und Orthogonalität 47

Beispiel: Das gewöhnliche Skalarprodukt in IKd : Durch


d
x, y :=  xk yk für x = (x1 , . . . , xd ) , y = (y1 , . . . , yd ) ∈ IKd
k=1

wird ein Skalarprodukt erklärt, wie man leicht nachrechnen kann.


Als zugehörige Norm ergibt sich
 1/2
 d
x = x, x =  |xk |2
k=1

die Euklidische Norm. Laut Korollar 4.8 ist IKd mit dieser Norm vollständig, also
ein Hilbertraum.

Satz 4.13. Seien {x1 , . . . , xn } eine endliche orthonormale Menge in einem Prä-
hilbertraum X und x ∈ X. Bezeichne
n n
s :=  x, xk  xk und t :=   k xk mit 1 , . . . , n ∈ IK .
k=1 k=1

Es gilt x −t ≥ x − s, wobei Gleichheit genau dann gilt, falls k = x, xk  für alle
k = 1, . . . , n ist.
Damit ist s also dasjenige Element aus dem von {x1 , . . . , xn } aufgespannten Un-
terraum von X, welches den kleinsten Abstand von x hat.

Beweis. Es gilt
n n n
x − t2 = x, x −  k xk , x −  k x, xk  −  k k
k=1 k=1 k=1
n n
= x, x −  x, xk  x, xk  +  (k − x, xk ) (k − x, xk )
k=1 k=1
n n
= x2 −  |x, xk |2 +  |k − x, xk |2
k=1 k=1
n
≥ x2 −  |x, xk |2 = x − s2 ,
k=1

wobei die letzte Gleichung exakt der Satz von Pythagoras ist. Gleichheit gilt offen-
sichtlich genau im Fall k = x, xk  für alle k = 1, . . . , n. 

Beispiel: Wir bestimmen im Euklidischen IR3 den Punkt s in der von x1 := (1, 0, 0)
und x2 := (0, 1, 1) aufgespannten Ebene, welcher von x := (2, 3, 4) den geringsten
Abstand hat.
Es gilt s = x, x1  x1 + x, x2  x2 = 2x1 + 7x2 = (2, 7, 7).
48 4 Metrische Räume und Cauchyfolgen

4.4 Teilfolgen und Häufungswerte

Eine notwendige Eigenschaft für die Konvergenz einer Folge (an )n∈IN in einem me-
trischen Raum ist deren Beschränktheit.
Dabei heißt eine Teilmenge A in einem metrischen Raum (M, d) beschränkt,
falls ein K ≥ 0 und ein Punkt b ∈ M existieren mit d(a, b) ≤ K für alle a ∈ A.

Satz 4.14. Ist (an )n∈IN eine Cauchyfolge in einem metrischen Raum (M, d), so ist
{an : n ∈ IN} beschränkt.

Den Nachweis führt man wie den von Satz 3.2. Man beachte, dass jede konvergente
Folge eine Cauchyfolge ist.
Eine analoge Aussage zu Satz 3.3 existiert deshalb nicht, da Monotonie in metri-
schen Räumen nicht sinnvoll erklärt werden kann. Folgende Überlegungen umge-
hen dieses Problem, und gelten natürlich auch für IR. Streicht man aus einer Folge
(an )n∈IN einige Glieder, so erhält man eine neue Folge. Formal kann man dies wie
folgt beschreiben.

Definition 4.15. Ist n1 < n2 < . . . < nk < . . . eine Folge natürlicher Zahlen, so heißt
(ank )k∈IN eine Teilfolge von (an )n∈IN. .

Ist z.B. an = (−1)n , so sind sowohl (bk )k∈IN mit bk = 1 als auch (ck )k∈IN mit ck = −1
Teilfolgen von (an )n∈IN . Selbstverständlich hat (an )n∈IN noch weitere Teilfolgen.

Satz 4.16. Ist (an )n∈IN eine Folge in einem metrischen Raum (M, d), die gegen
a ∈ M konvergiert, so konvergiert auch jede Teilfolge (ank )k∈IN gegen a.

Beweis. Ist n1 < n2 < . . ., so gilt nk ≥ k für alle k ∈ IN. Zu  > 0 existiert ein N ∈ IN
mit d(ak , a) <  für alle k ≥ N.
d
Folglich gilt auch d(ank , a) <  für alle k ≥ N, also ank −→ a mit k → . 

Lemma 4.17. Es seien (an )n∈IN eine Folge in einem metrischen Raum (M, d) und
a ∈ M. Folgende drei Aussagen sind äquivalent:
(i) Zu jedem  > 0 und jedem N ∈ IN gibt es ein n ≥ N mit d(an , a) <  .
(ii) Für jedes  > 0 ist die Menge {n ∈ IN : d(an , a) <  } unendlich.
(iii) Es gibt eine Teilfolge (ank )k∈IN von (an )n∈IN , die gegen a konvergiert.

Beweis. Wir zeigen (i)⇒(iii)⇒(ii)⇒(i).


Gilt (i), so existiert zu  = 1 und N = 1 ein n1 ≥ 1 mit d(an1 , a) < 1. Betrachte
nun  = 12 und N = n1 + 1. Dazu existiert n2 ≥ N > n1 mit d(an2 , a) < 12 . Rekursiv
erhält man n1 < n2 < . . . mit d(ank , a) < 1k für alle k ∈ IN, also lim ank = a.
k→
Gilt (iii), so existiert zu beliebigem  > 0 ein N ∈ IN mit d(ank , a) <  für alle
k ≥ N, d.h. {nk ∈ IN : k ≥ N} ⊆ {m ∈ IN : d(am , a) <  }, womit letztere Menge
unendlich ist.
4.4 Teilfolgen und Häufungswerte 49

Schließlich gelte (ii). Seien  > 0 und N ∈ IN vorgegeben. Dann muss es einen
Index n geben mit n ≥ N und d(an , a) <  , denn sonst wäre {n ∈ IN : d(an , a) <  }
endlich. 

Definition 4.18. Sei (an )n∈IN eine Folge in einem metrischen Raum (M, d). Ein Ele-
ment a ∈ M heißt Häufungswert von (an )n∈IN , falls für jedes  > 0 die Menge
{n ∈ IN : d(an , a) <  } unendlich ist.
Lemma 4.17 liefert demnach drei gleichwertige Charakterisierungen der Aussage
a ist Häufungswert von (an )n∈IN “.

Satz 4.19 (Bolzano-Weierstraß). Jede beschränkte Folge (an )n∈IN reeller Zahlen
besitzt einen Häufungswert.

Beweis. Da {an : n ∈ IN} beschränkt ist, existieren A1 , B1 ∈ IR mit {an : n ∈ IN} ⊆


[A1 , B1 ] =: I1 . Wir konstruieren rekursiv Ik = [Ak , Bk ] mit
(i) [Ak , Bk ] enthält unendlich viele Glieder von (an )n∈IN ,
(ii) [Ak+1 , Bk+1 ] ⊆ [Ak , Bk ] ,
1
(iii) Bk − Ak = 2k−1
(B1 − A1 ) .

Dazu gehen wir wie folgt vor: Ist [Ak , Bk ] gegeben, so setze M := 12 (Ak + Bk ). Da
[Ak , Bk ] unendlich viele Glieder von (an )n∈IN enthält, sind mindestens in einem der
beiden Intervalle [Ak , M] und [M, Bk ] unendlich viele an . Wir setzen

[Ak , M] , falls in [Ak , M] unendlich viele an liegen,
[Ak+1 , Bk+1 ] :=
[M, Bk ] , sonst.


Damit ist (Ik )k∈IN eine Intervallschachtelung. Sei Ik = {a}.
k=1
Nun ist a Häufungswert von (an )n∈IN , denn zu  > 0 existiert ein k ∈ IN mit
[Ak , Bk ] ⊆ U (a) =]a −  , a +  [, also enthält ]a −  , a +  [ unendlich viele an . 

Korollar 4.20. Jede beschränkte Folge (an )n∈IN in (IRd ,  · 2 ) besitzt einen Häu-
fungswert. (Insbesondere hat jede beschränkte Folge in C einen Häufungswert.)

Beweis. Sei etwa an = (an,1 , . . . , an,d ) ∈ IRd . Wir betrachten die beschränkte Folge
(an,1 )n∈IN in IR. Laut Satz 4.19 und Lemma 4.17 existiert eine konvergente Teilfolge
(ank ,1 )k∈IN von (an,1 )n∈IN .
Betrachte nun (ank ,2 )k∈IN . Wir setzen bk,2 := ank ,2 . Wieder existiert eine konver-
gente Teilfolge (bk ,2 )∈IN .
Geht man weiter so vor bis zur d-ten Komponente, erhält man eine Teilfolge
(anm )m∈IN von (an )n∈IN , die in (IRd ,  · 2 ) konvergiert, da jede der Komponenten-
folgen (anm , j )m∈IN , j = 1, . . . , d, in IR konvergiert. 

50 4 Metrische Räume und Cauchyfolgen

Definition 4.21. Man sagt, eine Folge (an )n∈IN reeller Zahlen divergiert gegen 
(oder konvergiert uneigentlich gegen ), wenn es zu jedem C > 0 ein N ∈ IN gibt,
sodass an > C für alle n ≥ N gilt.
Divergiert (−an )n∈IN gegen , so sagt man, dass (an )n∈IN gegen − divergiert.
Beispiel: (qn )n∈IN divergiert gegen , falls q > 1 ist.

Es sei (an )n∈IN eine nach oben beschränkte Folge reeller Zahlen. Für jedes n ∈ IN
existiert bn := sup{ak : k ≥ n} und (bn )n∈IN ist eine monoton fallende Folge. Wir
unterscheiden zwei Fälle:
• Ist {bn : n ∈ IN} nach unten beschränkt, dann existiert nach Satz 3.3
 
lim sup an := lim bn = inf bn = inf sup ak .
n→ n→ n∈IN n∈IN k≥n

• Ist {bn : n ∈ IN} nicht nach unten beschränkt, so divergiert (bn )n∈IN gegen −,
und wir schreiben
lim sup an := − .
n→

Falls (an )n∈IN nicht nach oben beschränkt ist, so setzen wir lim sup an := .
n→
Man bezeichnet lim sup an als Limes superior der Folge (an )n∈IN .
n→
Analog führen wir den Limes inferior von (an )n∈IN ein. Falls die Folge (an )n∈IN
nach unten beschränkt ist, betrachten wir cn := inf{ak : k ≥ n}. Dann ist (cn )n∈IN
eine monoton wachsende Folge.
• Ist {cn : n ∈ IN} nach oben beschränkt, so setzen wir

lim inf an := lim cn = sup cn = sup inf ak .
n→ n→ n∈IN n∈IN k≥n

• Ist {cn : n ∈ IN} nicht nach oben beschränkt, so schreiben wir

lim inf an :=  .
n→

Ist schließlich (an )n∈IN nicht nach unten beschränkt, so setzen wir lim inf an := −.
n→

Beispiele:
(1) Sei an := n.
Hier gilt lim sup an = , da {an : n ∈ IN} nicht nach oben beschränkt ist.
n→
Für den Limes inferior gilt cn = inf{ak : k ≥ n} = n. Da (cn )n∈IN nicht nach
oben beschränkt ist, folgt lim inf an = .
n→
Achtung: Es ist lim inf an = inf an !
n→ n∈IN
4.4 Teilfolgen und Häufungswerte 51

(2) Sei an := (−1)n n. Es gilt

lim sup an =  und lim inf an = − ,


n→ n→

da (an )n∈IN weder nach oben noch nach unten beschränkt ist.
(3) Seien a < b und
a für n ungerade ,
an :=
b für n gerade .
Dann gilt lim sup an = b und lim inf an = a, denn bn = b, cn = a ∀n ∈ IN.
n→ n→
 
(4) Sei an := (−1)n1 + 1n , d.h. (an )n∈IN = −2, 32 , − 43 , 54 , − 65 , . . . .Es gilt

1 + 1n für n gerade ,
bn = sup{ak : k ≥ n} = 1
1 + n+1 für n ungerade .

Folglich ist lim sup an = lim bn = 1. Ferner haben wir


n→ n→
 
− 1 + 1n für n ungerade ,
cn = inf{ak : k ≥ n} = 1

− 1 + n+1 für n gerade ,

also lim inf an = lim cn = −1.


n→ n→

Bemerkung: Da, falls (an )n∈IN nach oben und unten beschränkt ist, offensichtlich
cn = inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} = bn gilt, folgt stets

lim inf an ≤ lim sup an .


n→ n→

Dies ist auch richtig für eine unbeschränkte Folge (an )n∈IN , wenn wir − < a < 
für a ∈ IR vereinbaren.

Satz 4.22. Eine Folge (an )n∈IN reeller Zahlen ist genau dann konvergent, wenn

− < lim inf an = lim sup an < 


n→ n→

gilt. Wir haben dann Gleichheit der drei Grenzwerte, lim inf an = lim an = lim sup an .
n→ n→ n→

Beweis. Sei (an )n∈IN konvergent gegen a. Zu  > 0 existiert also ein N ∈ IN mit
a −  < an < a +  für alle n ≥ N. Es folgt

a −  ≤ inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} ≤ a + 

für n ≥ N und damit a −  ≤ lim inf an ≤ lim sup an ≤ a +  .


n→ n→
Da  > 0 beliebig war, folgt lim inf an = lim an = lim sup an .
n→ n→ n→
52 4 Metrische Räume und Cauchyfolgen

Gelte nun a = lim inf an = lim sup an für ein a ∈ IR.


n→ n→
Zu  > 0 existiert also ein N ∈ IN mit

a −  < inf{ak : k ≥ n} ≤ sup{ak : k ≥ n} < a + 

für alle n ≥ N. Es ist dann a −  < an < a +  für n ≥ N, also lim an = a. 



n→

Bemerkung: Man kann sich leicht überlegen, dass für uneigentliche Konvergenz
folgendes gilt: Eine Folge (an )n∈IN reeller Zahlen ist genau dann uneigentlich kon-
vergent gegen  (bzw. −), falls

lim inf an = lim sup an =  (bzw. −) .


n→ n→

Wir wollen nun noch die Beziehung zu Häufungswerten aufzeigen.

Satz 4.23. (a) Eine nach oben beschränkte Folge (an )n∈IN reeller Zahlen hat genau
dann mindestens einen Häufungswert, wenn a∗ := lim sup an endlich ist.
n→
In diesem Fall ist a∗ der größte Häufungswert von (an )n∈IN .
(b) Eine nach unten beschränkte Folge (an )n∈IN reeller Zahlen hat genau dann min-
destens einen Häufungswert, wenn a∗ := lim inf an endlich ist.
n→
In diesem Fall ist a∗ der kleinste Häufungswert von (an )n∈IN .

Beweis. Wir zeigen nur (a); der Beweis von (b) geht ganz analog.
Sei s ein Häufungswert von (an )n∈IN . Dann gilt bn := sup{ak : k ≥ n} ≥ s, also
ist (bn )n∈IN konvergent mit a∗ = lim bn ≥ s.
n→

Ist umgekehrt a∗ := lim sup an ∈ IR, so gibt es zu  > 0 ein N ∈ IN mit bn − a∗ < 2
n→
für alle n ≥ N, denn (bn )n∈IN konvergiert monoton fallend gegen a∗ . Weiter gibt es zu
jedem n0 ∈ IN ein n ≥ n0 mit |an − a∗ | <  ; laut Lemma 4.17 ist a∗ ein Häufungswert
von (an )n∈IN . 

Bemerkung: Unbeschränkte Folgen können durchaus Häufungswerte haben. Zum


Beispiel hat (an )n∈IN mit

1
für n ungerade ,
an = n
(−1)n/2 n für n gerade .

einen Häufungswert 0, ist aber nach oben und unten unbeschränkt.

Korollar 4.24. Sei (an )n∈IN eine nach oben und unten beschränkte reelle Folge.
Dann ist lim inf an der kleinste und lim sup an der größte Häufungswert von (an )n∈IN .
n→ n→

Beweis. Die beidseitige Beschränktheit liefert, dass lim bn und lim cn existieren.
n→ n→
Nun wende Satz 4.23 an. 

4.5 Aufgaben 53

Nützlich ist folgende Ungleichung. Seien (an )n∈IN und (dn )n∈IN zwei Folgen reeller
Zahlen mit an ≤ dn für alle n ≥ N, wobei N eine feste natürliche Zahl ist. Es gilt

lim inf an ≤ lim inf dn , (4.3)


n→ n→

lim sup an ≤ lim sup dn . (4.4)


n→ n→

Zum Schluss halten wir noch eine charakteristische Eigenschaft von Limes superior
und Limes inferior fest.

Satz 4.25. (a) Seien (an )n∈IN eine nach oben beschränkte Folge reeller Zahlen und
x ∈ IR mit x > lim sup an . Dann existiert N ∈ IN mit an < x für alle n ≥ N.
n→
(b) Seien (an )n∈IN eine nach unten beschränkte Folge reeller Zahlen und x ∈ IR mit
x < lim inf an . Dann existiert N ∈ IN mit an > x für alle n ≥ N.
n→

Beweis. Wir zeigen nur die Aussage (a).


Angenommen, die Behauptung gilt nicht. Dann gibt es also zu jedem N ∈ IN ein
n ≥ N mit an ≥ x. Damit existiert eine Teilfolge (ank )k∈IN mit ank ≥ x für alle k ∈ IN.
Satz 4.19 liefert nun eine konvergente Teilfolge mit Limes größer oder gleich x im
Widerspruch zur Voraussetzung. 

4.5 Aufgaben

1. Seien (an )n∈IN eine Folge in einem metrischen Raum (M, d) und a ∈ M. Zeigen
Sie, dass die folgenden drei Aussagen äquivalent sind.
(i) Zu jedem  > 0 gibt es ein N ∈ IN mit d(an , a) <  für alle n ≥ N.
(ii) Zu jedem  > 0 gibt es ein N ∈ IN mit d(an , a) ≤  für alle n ≥ N.

(iii) Zu jedem  > 0 gibt es ein N ∈ IN mit d(an , a) < 2 für alle n ≥ N.

2. Es sei d : C × C → IR gegeben durch



|z − w| , falls  ≥ 0 existiert mit z =  w ,
d(z, w) :=
|z| + |w| , sonst.

Zeigen Sie, dass d eine Metrik ist.

3. Sei d die Metrik aus dem Beispiel zu Definition 4.6. Gibt es eine Norm  ·  in
IR derart, dass d(x, y) = x − y für alle x, y ∈ IR gilt ?

4. Zeigen Sie: Jede Folge reeller Zahlen besitzt eine monotone Teilfolge.
54 4 Metrische Räume und Cauchyfolgen

5. Geben Sie jeweils Folgen (an )n∈IN , (bn )n∈IN mit lim an =  und lim bn = 
n→ n→
an, sodass gilt:

a. lim (an − bn ) = 0 b. lim (an − bn) =  c. lim (an − bn) = −


n→ n→ n→

d. lim an =1 e. lim an =0 f. lim an =


n→ bn n→ bn n→ bn

6. Zwei Normen  · a und  · b auf X heißen äquivalent, wenn c,C > 0 existieren
derart, dass
c · xa ≤ xb ≤ C · xa
gilt für alle x ∈ X.
Zeigen Sie, dass die Normen  · 1,  · 2 und  ·  auf IRd äquivalent sind.

7. Bestimmen Sie alle Häufungswerte der Folgen (an )n∈IN mit


n
a. an := 1 + 1n ,
b. an := 2n + 1,
c. an := in ,
d. an := 1n in .

8. Geben Sie jeweils eine Folge (an )n∈IN reeller Zahlen an derart, dass die Menge
der Häufungswerte von (an )n∈IN
a. leer,
b. die Menge {0, 1},
c. die Menge ZZ,
ist.

9. Bestimmen Sie Limes Inferior und Limes Superior der Folgen (an )n∈IN mit
1−2n
a. an := (−1)n 5+3n ,
b. an := i + (−i)n ,
n

n n
c. an := a + bn (a, b ≥ 0).
Kapitel 5
Reihen

Wir haben in Kapitel 3.1 bereits definiert, was Konvergenz einer Reihe

 ak
k=1

im Fall ak ∈ IK bedeutet. Wir wollen diesen Begriff auf beliebige normierte Räume
ausdehnen. Seien die ak nun Elemente eines normierten Raumes (X,  · ). Wie in
IK betrachten wir die Partialsummen
n
sn :=  ak ∈ X .
k=1

Wenn die Folge (sn )n∈IN der Partialsummen gegen ein s ∈ X konvergiert, so sagen
wir, dass die Reihe in X gegen s konvergiert und schreiben

s=  ak .
k=1

5.1 Konvergenz und absolute Konvergenz

Zunächst füllen wir unseren Vorrat an Beispielen auf.


(1) Die Geometrische Reihe: Sei q ∈ C. Es gilt

1
1 + q + q2 + ... =  qk = 1 − q für |q| < 1 ,
k=0

siehe Beispiel (6) in Kapitel 3.1. Wir werden sehen (als Anwendung von
Korollar 5.2), dass die Reihe für |q| ≥ 1 nicht konvergiert.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 55


DOI 10.1007/978-3-642-28644-5_5, © Springer-Verlag Berlin Heidelberg 2012
56 5 Reihen

1
(2) Die Harmonische Reihe  k konvergiert nicht.
k=1
n
1
Mehr noch, die Folge ihrer Partialsummen sn :=  k divergiert gegen .
k=1

Beweis. Für k ∈ IN und n ≥ 2k gilt


1 1 1
sn = 1 + + + ···+
2 3 n
1 1 1 1 1 1 1
≥ 1+ + + + + ···+ + · · · + k−1 + ···+ k
2 3 4 5 8 2 +1 2
1 1 1 1 1
≥ 1 + + 2 + 4 + · · · + 2k−1 k = 1 + k .
2 4 8 2 2
Daher divergiert sn gegen . Es ist sogar lim inf sn =  = lim sup sn . 

n→ n→

1 1
(3) Die Eulersche Zahl. Es gilt lim 1 + =: e =  .
n→ n k=0 k!
Wir haben die Zahl e in Beispiel 1.7 durch eine Intervallschachtelung erklärt.
Zu zeigen bleibt das zweite Gleichheitszeichen.
n n
Beweis. Bezeichne sn :=  k!1 und tn := 1 + 1n . Es gilt
k=0

n 1 n 1 n 1
tn = 1 + + + ···+
1 n 2 n2 n nn

1 n(n − 1) 1 n(n − 1)(n − 2)


= 1+1+ + + ···
2! n2 3! n3
1 n(n − 1) · · ·(n − (n − 1))
+
n! nn

1 1 1 1 2
= 1+1+ 1− + 1− 1− + ···
2! n 3! n n

1 1 2 n−1
+ 1− 1− ··· 1 − .
n! n n n

Folglich haben wir tn ≤ sn und mit (4.3) folgt e = lim tn ≤ lim inf sn .
n→ n→
Für n ≥ m gilt ferner

1 1 1 1 m−1
tn ≥ 1 + 1 + 1− + ···+ 1− ··· 1 − .
2! n m! n n

Hält man m fest, so folgt mit n →  nun


1 1
e = lim tn ≥ 1 + 1 + + ···+ = sm
n→ 2! m!
5.1 Konvergenz und absolute Konvergenz 57

und mit m →  erhalten wir schließlich

lim sup sm ≤ e ≤ lim inf sn ,


m→ n→

also lim sn = e. 

n→

1
(4) Die Reihe  k(k + 1) .
k=1
1
Hier können wir die Partialsummen direkt ausrechnen. Mit k(k+1) = 1k − k+1
1

erhalten wir
n
1 1 1 1 1 1 1
sn =  = 1− + − + · · ·+ − = 1− .
k=1 k(k + 1) 2 2 3 n n+1 n+1

Die Folge (sn )n∈IN ist konvergent; es gilt



1
 k(k + 1) = n→
lim sn = 1 .
k=1

Wir kommen zu einigen elementaren Eigenschaften konvergenter Reihen.


Satz 5.1. Sei (ak )k∈IN eine Folge in einem normierten Raum (X,  · ).

Falls die Reihe  ak in (X,  · ) konvergiert, so gilt:
k=1
Zu jedem  > 0 existiert ein N ∈ IN mit
" "
" n "
" "
"  ak " <  für alle n > m ≥ N . (5.1)
"k=m+1 "

Ist (X,  · ) ein Banachraum (also vollständig), so folgt aus (5.1) die Konvergenz
der Reihe in (X,  · ).
Insbesondere ist in (IRd ,  · 2 ) die Bedingung (5.1) äquivalent zur Konvergenz
der Reihe.
Beweis. Wegen
n m n
sn − sm =  ak −  ak =  ak
k=1 k=1 k=m+1

ist die Bedingung (5.1) äquivalent dazu, dass die Folge der Partialsummen eine
Cauchyfolge bildet.
Die erste Aussage gilt, da jede konvergente Folge eine Cauchyfolge ist, vgl. Be-
merkung (3) in Kapitel 4.2. In einem Banachraum gilt nach Definition 4.6 auch die
Umkehrung; insbesondere ist (IRd ,  · 2) ein Banachraum, siehe Satz 4.8. 

Korollar 5.2. Sei (ak )k∈IN eine Folge in einem normierten Raum (X,  · ).

Konvergiert die Reihe  ak , so gilt ak → 0 in (X,  · ) mit k → .
k=1
58 5 Reihen

Beweis. Man muss nur in Satz 5.1 speziell n = m + 1 wählen. 


Die Umkehrung gilt jedoch nicht! Ein prominentes Gegenbeispiel ist die Harmo-
nische Reihe. Hier gilt ak = 1k → 0; wie wir bereits festgestellt haben, ist die Reihe

1
 k divergent.
k=1

Anwendung: Die Geometrische Reihe



 qn
n=0

ist im Fall |q| ≥ 1 divergent, denn für n →  gilt hier qn → 0.


 
Zu jeder Reihe  ak mit ak ∈ (X,  · ) können wir eine Reihe  ak  bilden,
k=1 k=1
deren Summanden nicht-negative reelle Zahlen sind.

Korollar 5.3. Sei (ak )k∈IN eine Folge in einem Banachraum (X,  · ).
 
Konvergiert die Reihe  ak  in IR, so konvergiert die Reihe  ak in X.
k=1 k=1

Beweis. Es ist " "


" n " n
" "
"  ak " ≤  ak  .
"k=m+1 " k=m+1
 
Erfüllt  ak  die Bedingung (5.1) in IR, so gilt diese also auch für  ak in X. 

k=1 k=1

Definition 5.4. Sei (ak )k∈IN eine Folge in einem normierten Raum.
 
Die Reihe  ak heißt absolut konvergent, falls  ak  konvergiert.
k=1 k=1

Korollar 5.3 besagt also, dass jede absolut konvergente Reihe konvergent ist.
Weiter ist folgende hinreichende Bedingung für Konvergenz von Reihen mit nicht-
negativen Gliedern sehr nützlich.

Satz 5.5. Sei (ak )k∈IN eine Folge reeller Zahlen mit ak ≥ 0 für alle k ∈ IN. Die Reihe

 ak konvergiert genau dann, wenn die Menge Ihrer Partialsummen beschränkt ist.
k=1

Beweis. Die Folge (sn )n∈IN der Partialsummen ist hier offensichtlich monoton
wachsend.
Mit Satz 3.3 folgt aus der Beschränktheit von {sn : n ∈ IN} die Konvergenz (der
Folge der Partialsummen), also ist die Reihe in diesem Fall konvergent.
Ist {sn : n ∈ IN} hingegen unbeschränkt, so divergiert (sn )n∈IN gegen . 

5.2 Konvergenzkriterien 59

5.2 Konvergenzkriterien

Oft kann man Konvergenz durch Vergleich mit bekannten Reihen zeigen.

Satz 5.6 (Majorantenkriterium). Seien  ck eine konvergente Reihe mit ck ≥ 0
k=1
für alle k, sowie (ak )k∈IN eine Folge in einem Banachraum (X,  · ) und k0 ∈ IN mit

ak  ≤ ck für alle k ≥ k0 . Dann konvergiert die Reihe  ak absolut.
k=1
 
Die Reihe  ck bezeichnet man dann als (konvergente) Majorante für  ak .
k=1 k=1
n
Beweis. Sei  > 0. Laut Satz 5.1 existiert N ≥ k0 mit  ck <  für n > m ≥ N.
k=m+1
Da
n n
 ak  ≤  ck
k=m+1 k=m+1

gilt, folgt wiederum mit Satz 5.1 die absolute Konvergenz von  ak . 

k=1

1
Anwendung: Die Reihe  k2 .
k=1
1 1
Für k ≥ 2 gilt k2
≤ (k−1)k . Da die Reihe


1
 (k − 1)k ,
k=2

wie in Beispiel (4) gezeigt, konvergent ist, folgt mit dem Majorantenkriterium die

1
Konvergenz der Reihe  k2
.
k=1
Den Grenzwert dieser Reihe können wir hier allerdings nicht bestimmen. Wir
werden dies in Kapitel 11.2, Beispiel (2) mit Hilfe von Fourierreihen tun; es gilt

1 2
 k2
= 6 .
k=1

Bemerkung: Das Majorantenkriterium beinhaltet das so genannte Minoranten-



kriterium. Sei  ck divergent mit ck ≥ 0 für alle k.
k=1
Ist (ak )k∈IN eine Folge in (X,  · ) mit ak  ≥ ck für alle k ≥ k0 , so kann die

Reihe  ak jedenfalls nicht absolut konvergieren, denn sonst wäre (ak )k∈IN eine
k=1
konvergente Majorante für (ck )k∈IN .

Die folgenden Konsequenzen aus dem Majorantenkriterium werden meistens für


Reihen in IK formuliert. Die Verallgemeinerung für Reihen in einem Banachraum
kann man sich einfach überlegen.
60 5 Reihen

Satz 5.7 (Quotientenkriterium). Sei (ak )k∈IN eine Folge in IK. Wenn ein Index k0 ∈
IN und eine reelle Zahl q mit 0 ≤ q < 1 existieren, sodass

|ak+1 | ≤ q |ak | für alle k ≥ k0



gilt, dann ist die Reihe  ak absolut konvergent.
k=1

Beweis. Für k > k0 gilt

|ak | ≤ qk−k0 |ak0 | = (|ak0 |q−k0 ) qk .



Da  qk konvergiert (Geometrische Reihe), können wir das Majorantenkriterium
k=k0

anwenden und erhalten die absolute Konvergenz von  ak . 

k=1

Bemerkung: Hat man nur |ak+1 | < |ak | für alle k ≥ k0 , so lässt sich daraus nicht die

Konvergenz der Reihe  |ak | herleiten.
k=1
 
1 1
Zum Beispiel erfüllen die Harmonische Reihe  k und auch die Reihe  k2
die
k=1 k=1
Beziehung |ak+1 | < |ak |. Während die Harmonische Reihe divergiert, konvergiert
die zweite Reihe.

Satz 5.8 (Quotientenkriterium). Sei (ak )k∈IN eine Folge in IK mit ak = 0 ∀ k ∈ IN.




a

ak
< 1 gilt, dann konvergiert  ak absolut.
Wenn lim sup
k+1
k→ k=1




ak+1

Wenn k0 ∈ IN existiert mit


a
≥ 1 für alle k ≥ k0 , dann ist  ak divergent.
k
k=1

Beweis. Sei a∗ := lim sup


k+1 ∗
ak
< 1. Dann existiert q mit a < q < 1 und aus
k→

ak
< q für alle k ≥ k0 . Laut Satz 5.7 folgt
Satz 4.25 erhalten wir k0 ∈ IN mit
k+1
nun die erste Behauptung.
Die zweite Aussage impliziert |an | ≥ |ak0 | > 0 für alle n ≥ k0 . Also ist die Bedin-
gung an → 0 hier nicht erfüllt und mit Satz 5.1 folgt die Divergenz der Reihe. 


k 3 3k
Beispiel: Die Reihe  .
k=1 k!
Hier gilt




ak+1
(k + 1)3 3k+1 k!


= 3 1 3

a
= 1 + ,
k (k + 1)! k3 3k k+1 k

k→ a
= 0 < 1. Die Reihe ist daher laut Quotientenkriterium konvergent.
also lim
k+1
k
5.2 Konvergenzkriterien 61

Satz 5.9 (Wurzelkriterium). Sei (ak )k∈IN eine Folge in IK. Wenn es c, q ∈ IR mit
0 ≤ q < 1 und c ≥ 0 gibt derart, dass

|ak | ≤ c qk für alle k ∈ IN



gilt, so ist  ak absolut konvergent.
k=1

Beweis. Man kann direkt das Majorantenkriterium anwenden mit



c  qk
k=1

als konvergente Majorante. 



Das Wurzelkriterium wird oft in folgender Form geschrieben.
Satz 5.10 (Wurzelkriterium). Sei (ak )k∈IN eine Folge in IK. Bezeichne

a∗ := lim sup k |ak | .
k→

Es gilt:

(a) Ist a∗ < 1, dann konvergiert die Reihe  ak absolut.
k=1

(b) Ist 1 < a∗ ≤ , dann divergiert  ak .
k=1

Beweis. (a) Sei q mit a∗ < q < 1. Laut Satz 4.25 existiert ein N ∈ IN mit k
|ak | < q
für alle k ≥ N. Damit gilt |ak | < qk für alle k ≥ N und mit

|a j |
c := max : j = 1, . . . , N
qj

erhalten wir schließlich |ak | ≤ c qk für alle k ∈ IN. Die absolute Konvergenz der
Reihe folgt nun aus Satz 5.9.

(b) Ist 1 < a∗ ≤ , so existiert eine Teilfolge mit nm |anm | → a∗ für m → . Damit
ist |an | > 1 für unendlich viele n ∈ IN; insbesondere gilt also an → 0 und mit Korollar
5.2 folgt die Divergenz. 

Bemerkung: Im Fall a∗ = 1 erlaubt Satz 5.10 keine Aussage zu Konvergenz oder
 
1 1
Divergenz. Betrachte z.B. wieder die Reihen  k und  k2
.
k=1 k=1
 √ k

k
Beispiel: Die Reihe k−1 .
k=1
 √ 
Mit k |ak | = k k − 1 und lim k |ak | = 0 haben wir hier insbesondere a∗ < 1; das
k→
Wurzelkriterium liefert Konvergenz der Reihe.
62 5 Reihen

Das Wurzelkriterium (Satz 5.10) hat einen größeren Anwendungsbereich als das
Quotientenkriterium (Satz 5.8); es gilt folgendes.

Lemma 5.11. Sei (cn )n∈IN eine Folge positiver Zahlen.


√ c
Dann gilt lim sup n cn ≤ lim sup n+1
cn .
n→ n→

Beweis. Mit der Konvention r <  für alle r ∈ IR gilt die Behauptung im Fall
c
cn =  offensichtlich.
lim sup n+1
n→
cn+1
Im Fall a := lim sup cn ∈ IR gibt es zu beliebigem  > 0 ein m ∈ IN mit
n→

cn+1
≤ a+ für alle n ≥ m ;
cn

es folgt cn+1 ≤ (a +  ) cn für alle n ≥ m. Wir erhalten induktiv

cm+p ≤ (a +  ) p cm für alle p ∈ IN


√ 
und weiter m+p cm+p ≤ (a +  ) m+p (a+cm )m für alle p ∈ IN. Damit ergibt sich

√ √ cm
lim sup n cn = lim sup cm+p ≤ (a +  ) lim sup
m+p m+p
n→ p→ p→ (a +  )m

cm
= (a +  ) lim sup n = (a +  ) ,
n→ (a +  )m

wobei wir zwei Mal Satz 4.23(a) benutzt haben. Dies gilt für jedes  > 0; es folgt
√ c
lim sup n cn ≤ a = lim sup n+1
cn wie behauptet. 

n→ n→

Man findet leicht Reihen, deren Konvergenz man mittels Wurzelkriterium, nicht
aber mit dem Quotientenkriterium


feststellen kann. Sei etwa a2 j = a2 j+1 = 0 für

ak+1

alle j ∈ IN, so gilt lim sup
a
≥ 1; dennoch ist lim sup k |ak | < 1 möglich.
k
k→ k→

Der folgende Satz verallgemeinert die Beweisidee, die beim Nachweis der Di-
vergenz der Harmonischen Reihe benutzt wurde.

Satz 5.12 (Verdichtungskriterium). Sei (ak )k∈IN eine Folge reeller Zahlen mit
a1 ≥ a2 ≥ a3 ≥ · · · ≥ 0.

Die Reihe  ak konvergiert genau dann, wenn
k=1


 2n a2n = a1 + 2a2 + 4a4 + 8a8 + · · ·
n=0

konvergiert.
5.2 Konvergenzkriterien 63

Beweis. Wir verwenden Satz 5.5 und zeigen die Beschränktheit der jeweiligen Par-
tialsummen. Dazu seien sn := a1 + a2 + · · · + an und tm := a1 + 2a2 + · · · + 2m a2m .
Für n ≤ 2m gilt

sn ≤ a1 + (a2 + a3) + · · · + (a2m + · · · + a2m+1−1 )


≤ a1 + 2a2 + · · · + 2m a2m = tm .

Für n ≥ 2m gilt andererseits

sn ≥ a1 + a2 + (a3 + a4) + · · · + (a2m−1+1 + · · · + a2m )


1 1 1 1 1
≥ a1 + 2a2 + 4a4 + · · · + 2m a2m = tm .
2 2 2 2 2
Daher sind die Folgen (sn )n∈IN und (tm )m∈IN entweder beide beschränkt oder beide
unbeschränkt. 

Beispiele:

1
(1) Die Reihe  ns mit s ∈ Q.
n=1
Sie konvergiert für s > 1 und divergiert für s ≤ 1.
1
Beweis. Sei zunächst s ≤ 0. Dann gilt ns → 0 und mit Korollar 5.2 folgt
Divergenz.

Im Fall s > 0 betrachten wir die verdichtete“ Reihe  2n a2n . Es ist
” n=0

 
1
 2n 2ns =  2(1−s)n .
n=0 n=0

Weiter gilt 2(1−s) < 1 genau dann, wenn 1 − s < 0, also s > 1 ist und mit der
Konvergenz bzw. Divergenz der Geometrischen Reihe folgt schließlich die
Behauptung. 


1
(2) Die Reihe  n (ln n)s .
n=2
Diese konvergiert für s > 1 und divergiert für s ≤ 1.

Beweis. Für s ≤ 0 ist die Harmonische Reihe eine Minorante und es folgt
die Divergenz. Sei nun s > 0. Da ln n monoton wächst, können wir Satz 5.12
anwenden. Hier gilt
  
1 1 1 1
 2n 2n (ln 2n )s =  (n ln 2)s = (ln 2)s  ns
n=1 n=1 n=1

und mit (1) folgt die Behauptung. 



64 5 Reihen

Seien (ak )k∈IN0 und (bk )k∈IN0 zwei Folgen in IK. Weiter sei A−1 := 0 und bezeichne
n 
An :=  ak die n-te Partialsumme der Reihe  ak .
k=0 k=0
Für alle m, n ∈ IN0 , m < n, gilt
n n n n−1
 ak bk =  (Ak − Ak−1) bk =  Ak bk −  Ak bk+1
k=m k=m k=m k=m−1
n−1
=  Ak (bk − bk+1) + An bn − Am−1 bm . (5.2)
k=m

Die Gleichung (5.2) ist auch unter dem Namen Abelsche partielle Summation
bekannt (Niels Henrik Abel, 1802-1829, Norwegen). Mit ihrer Hilfe wenden wir
uns Reihen zu, deren Glieder Produkte sind. Folgendes Kriterium ist benannt nach
Johann Peter Gustav Lejeune Dirichlet (1805-1859, Berlin, Göttingen).
Satz 5.13 (Dirichlet). Seien (ak )k∈IN0 und (bk )k∈IN0 zwei Folgen in IK mit folgenden
Eigenschaften:
n
(i) Die Partialsummen An =  ak bilden eine beschränkte Folge.
k=0
(ii) Es gilt b0 ≥ b1 ≥ b2 ≥ · · · ≥ 0 und
(iii) lim bk = 0.
k→

Dann konvergiert die Reihe  ak bk .
k=0

Beweis. Nach (i) gilt M := sup |An | < .


n∈IN0

Sei  > 0. Wegen (iii) existiert N ∈ IN mit bN < 2M . Für n ≥ m ≥ N erhalten wir
mit (ii) und (5.2) nun




n

n−1


 ak bk
=
 Ak (bk − bk+1 ) + An bn − Am−1 bm


k=m

k=m

 
n−1
≤M  (bk − bk+1) + bn + bm = 2M bm ≤ 2M bN <  .
k=m

Mit Satz 5.1 folgt die Konvergenz. 



Korollar 5.14. Sei (ck )k∈IN eine Folge reeller Zahlen mit
(i) |c1 | ≥ |c2 | ≥ |c3 | ≥ · · · ,
(ii) c2k−1 ≥ 0 und c2k ≤ 0 für alle k ∈ IN,
(iii) lim ck = 0.
k→

Dann konvergiert die Reihe  ck .
k=1
5.3 Umordnungssatz und Cauchy-Produkt 65

Beweis. Man hat nur Satz 5.13 anzuwenden mit ak = (−1)k+1 und bk = |ck |. 

In Korollar 5.14 handelt es sich um eine alternierende Reihe, d.h. ihre Glieder
sind abwechselnd positiv und negativ. Dieses Resultat wird oft wie folgt formuliert.

Korollar 5.15 (Leibniz-Kriterium). Ist (bk )k∈IN eine monoton fallende Nullfolge,

so konvergiert die Reihe  (−1)k+1 bk .
k=1

Das folgende Beispiel zeigt, dass auf die Monotonie im Leibniz-Kriterium nicht
verzichtet werden kann. Seien etwa
2 1
a2n−1 := und a2n := für n ∈ IN .
n n
4
Es gilt 0 < ak ≤ k für alle k ∈ IN und daher lim ak = 0. Allerdings ist die Reihe
 k→
 (−1)k+1 a k nicht konvergent:
k=1
Betrachten wir dazu die Folge (sn )n∈IN der Partialsummen. Für gerades n, also für
n = 2m mit m ∈ IN, gilt
m
1
sn =  .
k=1 k

Die Folge der Partialsummen ist daher divergent.

5.3 Umordnungssatz und Cauchy-Produkt



Die Reihe  (−1)k+1 1k ist laut Leibniz-Kriterium konvergent. Einerseits ist
k=1

1 1 1 1 1 1 5
1+ − + + − + + − + +··· < .
2 3 4 5 6 7 6
     
<0 <0

Wenn wir die gleichen Summanden aber in einer anderen Reihenfolge aufaddieren,
etwa immer zwei positive und dann einen negativen, erhalten wir

1 1 1 1 1 1 1 1 5
1+ − + + − + + − +··· > .
3 2 5 7 4 9 11 6 6
     
>0 >0

Die Reihenfolge der einzelnen Summanden in einer Reihe spielt also eine wichtige
Rolle. Wir wollen nun zeigen, dass man im Fall einer absolut konvergenten Rei-
he die Summanden beliebig umordnen kann, und der Grenzwert sich dabei nicht
ändert. Die obige Reihe ist nicht absolut konvergent. Den Wert der Reihe können
66 5 Reihen

wir an dieser Stelle noch nicht berechnen; dazu verweisen wir auf Kapitel 10.3,
Gleichung (10.2).
 
Ist  : IN → IN bijektiv, so bezeichnen wir  a (k) als Umordnung der Reihe  ak .
k=1 k=1

Satz 5.16 (Umordnungssatz). Ist eine Reihe in einem normierten Raum absolut
konvergent, dann konvergiert auch jede Umordnung dieser Reihe und alle Umord-
nungen haben den selben Grenzwert.

Beweis. Sei  ak absolut konvergent. Weiter seien  : IN → IN bijektiv und
k=1

n n
sn :=  ak , rn :=  a (k)
k=1 k=1

die Partialsummen der ursprünglichen bzw. der umgeordneten Reihe. Nach Voraus-
setzung ist (sn )n∈IN konvergent. Wir müssen zeigen, dass lim (sn − rn ) = 0 gilt.
n→
Dazu betrachten wir für n ∈ IN die Menge Mn := IN \ { (1),  (2), . . . ,  (n)}; ihr
kleinstes Element bezeichnen wir mit mn . Wir erhalten
" "
" "
" "
sn − rn  = " 
"k∈{1,...,n}∩M
a k −  a k "
"
n k∈{ (1),..., (n)}∩{n+1,n+2,...}

≤  ak  +  ak 
k∈{1,...,n}∩Mn k∈{ (1),..., (n)}∩{n+1,n+2,...}

 
≤  ak  +  ak  ,
k=mn k=n+1

wobei wir die absolute Konvergenz der Reihe benutzt haben, da letztere Ausdrücke
sonst gar nicht existieren.
Wegen Mn ⊇ Mn+1 ist die Folge (mn )n∈IN monoton wachsend.
Außerdem gibt es zu jedem j ∈ IN ein k j mit j =  (k j ); dann ist j ∈ / Mk j und
/ Mn für alle n ≥ k j . Die Folge (mn )n∈IN ist deshalb nicht beschränkt.
weiter j ∈

Sei nun  > 0. Laut Satz 5.1 gibt es ein N ∈ IN mit  ak  < 2 .
k=N
Für alle n mit n ≥ N und mn ≥ N gilt folglich sn − rn  <  . Daher haben wir
lim (sn − rn ) = 0, was äquivalent zu
n→

 
 ak =  a (k)
k=1 k=1

ist. Die umgeordnete Reihe konvergiert also gegen den selben Grenzwert wie die
ursprüngliche.

5.3 Umordnungssatz und Cauchy-Produkt 67
 
Satz 5.17 (Cauchy-Produkt). Seien  an und  bn konvergente Reihen in IK.
n=0 n=0
n
Für n ∈ IN0 setze cn :=  ak bn−k .
k=0
 
Wenn  an absolut konvergent ist, dann ist die Reihe  cn konvergent mit
n=0 n=0
  
  
 cn =  a n  bn .
n=0 n=0 n=0

Beweis. Nach Voraussetzung existieren die Grenzwerte


  
 ak =:  ,  bk =:  und  |ak | =: x .
k=0 k=0 k=0

Wir bezeichnen die Partialsummen der Reihen mit


n n n
n :=  ak , n :=  bk , n :=  ck ,
k=0 k=0 k=0

und setzen n := n −  für n ∈ IN0 . Damit gilt

n = a0 b0 + (a0 b1 + a1 b0 ) + · · · + (a0 bn + a1 bn−1 + · · · + an b0 )


= a0 n + a1 n−1 + · · · + an 0
= a0 ( + n ) + a1( + n−1) + · · · + an( + 0 )
= n  + a0 n + a1 n−1 + · · · + an 0 .
  
=:rn

Wir müssen zeigen, dass lim n =  gilt.


n→
Wegen lim n =  bleibt lediglich lim rn = 0 zu zeigen.
n→ n→
Sei  > 0. Wegen lim n = 0 gibt es N ∈ IN mit |n | <  für alle n ≥ N. Es folgt
n→

|rn | ≤ |an 0 + · · · + an−N N | + |an−N−1 N+1 + · · · + a0 n |


≤ |an 0 + · · · + an−N N | +  (|an−N−1 | + · · · + |a0|)
≤ |an 0 + · · · + an−N N | +  x

für n ≥ N. Aus lim an = 0 erhalten wir lim |an 0 + · · · + an−N N | = 0. Daher gilt
n→ n→
lim sup |rn | ≤  x. Da  beliebig gewählt werden kann, bleibt nur lim |rn | = 0. 

n→ n→

  
Die Reihe  cn bezeichnet man als Cauchy-Produkt der Reihen  an und  bn .
n=0 n=0 n=0
Wenn letztere beide nicht absolut konvergent sind, so ist deren Cauchy-Produkt
möglicherweise nicht konvergent, vgl. Aufgabe 7a.
68 5 Reihen

5.4 Potenzreihen

Definition 5.18. Ist (ck )k∈IN0 eine Folge komplexer Zahlen, so heißt der Ausdruck

 ck zk
k=0

eine Potenzreihe. Die ck nennt man die Koeffizienten der Reihe.


Wir wollen untersuchen, für welche Werte von z ∈ C eine Potenzreihe konver-
giert, und werden gleich sehen, dass jede Potenzreihe für alle z im Inneren eines
gewissen Kreises konvergiert und für z aus dem Äußeren divergiert.

Gelegentlich werden auch Reihen der Form  ck (z − z0 )k betrachtet. Man be-
k=0
zeichnet z0 dann als Entwicklungspunkt.

Satz 5.19. Sei  ck zk eine Potenzreihe. Setze
k=0

 1
 := lim sup k
|ck | und R :=
k→ 

(dabei ist R = , falls  = 0 und R = 0, falls  = ). Damit gilt:


(a) Ist |z| < R, so ist die Reihe absolut konvergent.
(b) Ist |z| > R, so ist die Reihe divergent.
Beweis. Setze ak := ck zk .

Laut dem Wurzelkriterium (Satz 5.10) konvergiert die Reihe  ak absolut, falls
  k=0 
lim sup k |ak | = |z| lim sup k |ck | < 1 ist, und divergiert im Fall |z| lim sup k |ck | > 1.
k→ k→ k→
Das ist exakt die Behauptung. 

Die Zahl R heißt Konvergenzradius der Potenzreihe. Offensichtlich gilt
 %

R = sup r ≥ 0 :  ck rk konvergiert absolut ,
k=0

wobei R =  zu setzen ist, falls diese Menge nicht beschränkt ist.


Man kann den Konvergenzradius in vielen Fällen auch mit Hilfe des Quotienten-
kriteriums bestimmen.

Satz 5.20. Sei  ck zk eine Potenzreihe.
k=0


c
1
Wenn  := lim
k+1ck
existiert, so ist R =  ihr Konvergenzradius.
k→
(wiederum mit R = , falls  = 0 und R = 0, falls  = )
5.4 Potenzreihen 69

Beweis. Es gilt




ck+1 zk+1

ck+1





<1.
lim
k→
ck zk
< 1 ⇐⇒ |z| k→
lim

ck

  
=

Im Fall  = 0 erhalten wir mit dem Quotientenkriterium (Satz 5.8):


1
Die Reihe konvergiert


für |z| <  = R absolut. Ist hingegen |z| > R, so gibt es ein

ck+1
1
N ∈ IN derart, dass
ck
> |z| gilt für alle k ≥ N, und es folgt


ck+1 zk+1


c zk
≥ 1 für alle k ≥ N ;
k

die Reihe divergiert.


Im Fall  = 0 gilt |z| < 1 für alle z ∈ C. Die Reihe konvergiert dann absolut für
alle z ∈ C, d.h. R = ; die Aussage gilt also auch in diesem Fall. 

Beispiele:

zk
(1) Die Exponentialreihe exp(z) :=  k! .
k=0
|zk +1| k! |z|
Ihr Konvergenzradius ist R = , denn mit (k+1)! |zk |
= k+1 → 0 und Satz 5.8
folgt absolute Konvergenz für alle z ∈ C.

z2k+1 z3 z5 z7
(2) Die Sinusreihe sin(z) :=  (−1)k (2k + 1)! = z − 3! + 5! − 7! ± · · · und
k=0

z2k z2 z4 z6
die Cosinusreihe cos(z) :=  (−1)k (2k)! = 1 − 2! + 4! − 6! ± · · ·
k=0
Sie konvergieren beide für jedes z ∈ C, denn die Exponentialreihe ist jeweils
konvergente Majorante. Also haben diese Reihen ebenfalls den Konvergenz-
radius R = .
 k
z
(3) Die Reihe  hat den Konvergenzradius R = 1.
k=1 k

(4) Die Reihe  kk zk hat den Konvergenzradius R = 0.
k=1

(5) Die Geometrische Reihe  zk hat den Konvergenzradius R = 1.
k=0
(6) Für s ∈ C und k ∈ ZZ verallgemeinern wir die Binomialkoeffizienten,

⎪ s(s − 1) · · · (s − k + 1)

⎨ für k ∈ IN ,
s k!
:= 1 für k = 0 ,
k ⎪


0 für k < 0 .
70 5 Reihen

Die Binomialreihe zum Exponenten s ∈ C ist definiert durch



s k s(s − 1) 2
Bs (z) :=  z = 1 + sz + z + ···
k=0 k 2!

s
Im Fall s ∈ IN0 gilt = 0 für k > s. Insbesondere für s = n ist damit
k
n
n n
Bn (z) =  z = (1 + z)n .
k=0 k

/ IN0 , so hat die Potenzreihe Bs (z) den Konvergenzradius R = 1. Es gilt


Ist s ∈
nämlich

s  k+1


z
|s − k|
s k

k+1

s
= |z|

= |z|
− → |z| mit k →  ,

zk

k
k+1 k + 1 k + 1

also haben wir absolute Konvergenz für |z| < 1 und Divergenz für |z| > 1.
Wurzel- und auch Quotientenkriterium liefern keine Aussage über das Konvergenz-
verhalten auf dem Rand des Konvergenzkreises, also für diejenigen z mit |z| = R. In
der Tat gibt es Potenzreihen, die für manche z mit |z| = R konvergieren, für andere
jedoch nicht.
Die Geometrische Reihe hat den Konvergenzradius R = 1 und konvergiert für
kein z mit |z| = 1.

Satz 5.21. Sei  ck zk eine Potenzreihe mit Konvergenzradius R = 1 und es gelte
k=0
c0 ≥ c1 ≥ c2 ≥ · · · ≥ 0 sowie lim ck = 0.
k→
Dann konvergiert die Potenzreihe für alle z ∈ C mit |z| = 1, z = 1.
n
Beweis. Wir setzen an := zn , bn := cn und An :=  zk .
k=0
Es gilt (1 − z)An = 1 − zn+1. Ist nun |z| = 1, z = 1, so erhalten wir

1 − zn+1

|An | =
 zk
=


≤ 2

k=0
1 − z
|1 − z|

für alle n ∈ IN0 und mit Satz 5.13 folgt nun die Behauptung. 

  k
zk z
Anwendung: Die Reihen  k
und  2 .
k
k=1 k=1
Sie erfüllen beide die Voraussetzungen von Satz 5.21 (die Tatsache, dass es hier
keinen 0-ten“ Koeffizienten gibt, spielt keine Rolle, wie man sich leicht überlegen

kann), sind also konvergent für alle z mit |z| = 1, z = 1.
Allerdings konvergiert erstere nicht für z = 1 (Harmonische Reihe), während die
zweite für z = 1 konvergent ist (siehe auch die Anwendung nach Satz 5.6).
5.5 Exponentialreihe und Eulersche Formel 71

5.5 Exponentialreihe und Eulersche Formel

Die Exponentialreihe ist uns im vorigen Abschnitt bereits begegnet. Sie hat den
Konvergenzradius R = , ist also für alle z ∈ C konvergent. Daher ist durch

zk
exp(z) :=  k!
k=0

eine Abbildung exp : C → C erklärt. Man bezeichnet sie als Exponentialfunktion.


Sie spielt eine herausragende Rolle in der Analysis ( natürliches“ Wachstum) und

steht in engem Zusammenhang mit den trigonometrischen Funktionen Sinus und
Cosinus (die wir bisher nur über Potenzreihen definiert haben!). Aus der absoluten
Konvergenz der Reihe erhalten wir für z, w ∈ C mit dem Cauchy-Produkt (Satz 5.17)
    
 n   n k
z wn z wn−k
  =  
n=0 n! n=0 n! n=0 k=0 k! (n − k)!
 
 
1 n n! (z + w)n
=   k! (n − k)! zk wn−k
n! k=0
=  n!
.
n=0 n=0

Es gilt also die Funktionalgleichung der Exponentialfunktion,

exp(z + w) = exp(z) exp(w) (5.3)

für alle z, w ∈ C. Weiter betrachten wir die Reihen


 
(−1)k 2k (−1)k
cos(z) :=  z und sin(z) :=  (2k + 1)! z2k+1 .
k=0 (2k)! k=0

Beide werden durch die Exponentialreihe majorisiert und sind deshalb für alle z ∈ C
absolut konvergent. Für n ∈ IN erhalten wir
4n+1
(iz) j 1 1 1 1 4n
 j!
= 1 − z2 + z4 − z6 ± · · · +
2 4! 6! (4n)!
z
j=0

1 3 1 5 1 4n+1
+i z − z + z ∓ · · · + z
3! 5! (4n + 1)!
2n 2n
(−1)k 2k (−1)k 2k+1
=  z +i  z .
k=0 (2k)! k=0 (2k + 1)!

Grenzwertbildung n →  liefert nun die als Eulersche Formel bekannte Gleichung

exp(iz) = cos(z) + i sin(z) . (5.4)

Mit cos(z) = cos(−z) und sin(z) = − sin(−z) folgt exp(−iz) = cos(z) − i sin(z).
72 5 Reihen

Weitere Eigenschaften der Exponentialfunktion:



1 1
(1) Es gilt exp(1) =  = e = lim 1 + , vgl. Kapitel 5.1, Beispiel(3).
k=0 k! n
n→

1
(2) Für alle z ∈ C gilt exp(−z) = exp(z) und insbesondere exp(z) = 0, denn die
Funktionalgleichung (5.3) liefert exp(z) exp(−z) = exp(z − z) = exp(0) = 1.
(3) Es ist exp(x) > 0 für alle x ∈ IR; genauer gilt sogar exp(x) > 1 für x > 0 und
0 < exp(x) < 1 für x < 0.
Beweis. Die Aussage für x > 0 ist klar, da in der Reihe dann alle Glieder
positiv sind; die Aussage für x < 0 folgt nun mit (2). 

(4) Für x, y ∈ IR mit x < y gilt exp(x) < exp(y).
Beweis. Laut (3) gilt exp(y − x) > 1; Funktionalgleichung und (2) liefern

exp(y)
exp(y − x) = exp(y) exp(−x) =
exp(x)

und insgesamt folgt exp(x) < exp(y). 



(5) Für alle t ∈ IR gilt | exp(it)| = 1.
Beweis. Aus der Eulerschen Formel (5.4) erhalten wir cos(t) = Re (exp(it))
sowie sin(t) = Im (exp(it)) und damit exp(−it) = exp(it) für t ∈ IR. Ande-
1
rerseits gilt auch exp(it) = exp(−it) ; es bleibt also nur | exp(it)| = 1. 

exp(it)
i sin(t) Fasst man C als Euklidischen Raum auf,
so liegen die Punkte z = exp(it) auf dem
1 Kreis um den Nullpunkt mit Radius 1. Es gilt
cos(t) cos(t) = Re (exp(it)), sin(t) = Im (exp(it))
sowie

1 = | exp(it)|2 = (cos(t))2 + (sin(t))2 .

Satz 5.22 (Additionstheoreme für Sinus und Cosinus). Für z, w ∈ C gilt

cos(z + w) = cos z cos w − sin z sin w und


sin(z + w) = sin z cos w + cosz sin w .

Beweis. Mit Hilfe von Eulerscher Formel und Funktionalgleichung erhalten wir

cos(z + w) + i sin(z + w) = exp(i(z + w)) = exp(iz) exp(iw)


= (cos z + i sin z)(cos w + i sin w)
= cos z cos w − sin z sin w + i(sin z cos w + cosz sin w)
5.6 Die Räume 1 , 2 und  73

und

cos(z + w) − i sin(z + w) = exp(−i(z + w)) = exp(−iz) exp(−iw)


= (cos z − i sin z)(cos w − i sin w)
= cos z cos w − sin z sin w − i(sin z cosw + cosz sin w) .

Addieren bzw. subtrahieren wir die Gleichungen, so folgt die Behauptung. 


5.6 Die Räume 1 , 2 und 

Den normierten Raum  = {a = (an )n∈IN : an ∈ IK , {an : n ∈ IN} beschränkt} mit


der Norm a = sup |an | kennen wir bereits aus Kapitel 4.1. Wir definieren nun
n∈IN

 
1 := {a = (an )n∈IN : an ∈ IK ,  |an| < } , a1 :=  |an| , und
n=1 n=1
 1/2
 
2
 := {a = (an )n∈IN : an ∈ IK ,  |an| 2
< } , a2 :=  |an| 2
.
n=1 n=1

Es ist nicht schwer einzusehen, dass 1 mit  · 1 ein normierter Raum ist. Dies kann
einfach auf direktem Wege gezeigt werden.
Für 2 sind hierzu einige weitere Überlegungen nötig.
Aus a = (an )n∈IN ∈ 2 und b = (bn )n∈IN ∈ 2 folgt a + b = (an + bn )n∈IN ∈ 2 ,
denn es ist |an + bn |2 ≤ |an |2 + 2|an| |bn | + |bn|2 ≤ 2(|an |2 + |bn |2 ).
Auch in 2 gilt eine Cauchy-Ungleichung (vgl. Satz 4.4).
Satz 5.23 (Cauchy-Ungleichung). Seien a = (an )n∈IN ∈ 2 und b = (bn )n∈IN ∈ 2 .
Dann gilt ab = (an bn )n∈IN ∈ 1 und
 1/2  1/2
  
ab1 =  |an bn| ≤  |an | 2
 |bn| 2
= a2 b2 .
n=1 n=1 n=1

Beweis. Aus Satz 4.4 erhalten wir


 1/2  1/2
d d d
 |anbn | ≤  |an | 2
 |bn| 2
n=1 n=1 n=1
 1/2  1/2
 
≤  |an |2  |bn|2 = a2 b2 < 
n=1 n=1

für jedes d ∈ IN. Damit folgt (an bn )n∈IN ∈ 1 und die Ungleichung ist erfüllt. 

74 5 Reihen

Analog zum Beweis von Satz 4.5 folgt nun die Minkowski-Ungleichung in 2 . Für
alle a, b ∈ 2 gilt
a + b2 ≤ a2 b2 .
Damit ist nun leicht ersichtlich, dass auch 2 mit  · 2 ein normierter Raum ist.

Zum Schluss zeigen wir noch, dass die hier betrachteten Räume vollständig sind.

Satz 5.24. Die normierten Räume ( p ,  ·  p), p ∈ {1, 2, }, sind Banachräume.

Beweis. Wir müssen nur noch die Vollständigkeit zeigen.


Sei (an )n∈IN eine Cauchyfolge in  p . Man beachte, dass hier an ∈  p ist, also etwa
an = (an,1 , an,2 , an,3 , . . .). Zu  > 0 gibt es dann N ∈ IN mit
 1/p

an − am  p =  |an,k − am,k | p
< (p = 1, 2)
k=1

bzw. an − am  = sup |an,k − am,k | <  (p = )


k∈IN

für m, n ≥ N. Damit ist für jedes k ∈ IN die Folge (an,k )n∈IN eine Cauchyfolge in IK.
Also existiert der Grenzwert k := lim an,k .
n→
· p
Zu zeigen bleibt  = (k )k∈IN ∈  p und an −→  .
Mit m →  erhalten wir für alle n ≥ N und l ∈ IN nun
 1/p
l
 |an,k − k | p
≤ bzw. sup |an,k − k | ≤  .
k=1,...,l
k=1

Damit gilt auch


 1/p

 |an,k − k | p
≤ bzw. sup |an,k − k | ≤ 
k∈IN
k=1

für alle n ≥ N und es folgt die Behauptung. 


Satz 5.25. In 2 ist durch



a, b :=  ak bk
k=1

ein Skalarprodukt erklärt. Mit diesem ist 2 ein Hilbertraum.

Beweis. Mit Satz 5.23 sehen wir, dass die Reihe a, b in der Tat für alle a, b ∈ 2
konvergiert. Die geforderten Eigenschaften eines Skalarproduktes kann man nun
mit Hilfe der Rechenregeln für Grenzwerte einfach nachprüfen.

Weiter gilt nach Konstruktion a, a = a2 und mit dieser Norm ist 2 laut
Satz 5.24 vollständig. Also ist 2 ein Hilbertraum. 

5.7 Aufgaben 75

5.7 Aufgaben

1. Welche der folgenden Reihen sind konvergent ?


  
nn n2 + 3n n2
a.  n! + nn b.  n3 − 3n c.  n!
n=1 n=1 n=1
 
n! an
d.  nn e.  n
(a > 0)
n=1 n=1 1 + a

2. Zeigen Sie: 
 |an | 
Wenn die Reihe  an absolut konvergent ist, dann ist  konvergent.
n=1 n=1 n

3. Zeigen Sie, dass die folgenden Reihen konvergieren und bestimmen Sie ihren
Grenzwert.

n−1
a. 
n=1 n!

1
b.  n(n + 2)
n=1

an
c.  n+1
(a ∈ C , a = −1)
n=0 (a + 1)

d.  (−1)n a2n (a ∈ C)
n=0

4. Bestimmen Sie die Konvergenzradien der folgenden Potenzreihen.


  
nn zn
 (n + 1)! zn  (n + (−1)n)!  2nzn
2
a. b. c.
n=0 n=0 n=1
 
2n n
d.  n
z e.  (an + bn)zn (a, b > 0)
n=0 n=1

5. Finden Sie ein Beispiel einer Reihe, deren Konvergenz man mit dem Wurzelkri-
terium (Satz 5.10), nicht aber mit dem Quotientenkriterium (Satz 5.8) folgern
kann.

6. Sei (bk )k∈IN eine monoton fallende Nullfolge. Laut Leibniz-Kriterium existiert
der Grenzwert

s :=  (−1)k+1bk .
k=1

Zeigen Sie: Für die Partialsummen sn dieser Reihe gilt |sn − s| ≤ bn+1 ∀n ∈ IN.
76 5 Reihen

(−1)n
7. a. Die Reihe  √
n+1
ist laut Leibniz-Kriterium konvergent.
n=0

Zeigen Sie, dass das Cauchy-Produkt dieser Reihe mit sich selbst divergent
ist. Betrachten Sie also
n
(−1)n
an := bn := √
n+1
und cn :=  ak bn−k für n ∈ IN
k=0


und zeigen Sie, dass die Reihe  cn nicht konvergiert.
n=0

b. Folgern Sie, dass die Reihe  √1 nicht konvergiert.
n
n=1


1
8. Zeigen Sie, dass e = exp(1) =  n! irrational ist.
n=0

Gehen Sie dabei wie folgt vor:


N
1 2
Zeigen Sie Sie zunächst 0 < e −  n! ≤ (N+1)! für n ∈ IN.
n=0
p
Nehmen Sie nun an, es sei e ∈ Q, d.h. es gebe p ∈ ZZ, N ∈ IN mit e = N und
folgern Sie daraus  
N
1
N! e −  ∈ IN.
n=0 n!

Leiten Sie hieraus unter Benutzung obiger Abschätzung einen Widerspruch her.

9. a. Zeigen Sie: Für z ∈ C und n ∈ IN gilt

(cos z + i sin z)n = cos(nz) + i sin(nz) .

b. Geben Sie sin(3z) mit Hilfe von cosz und sin z an.

10. Die Folge der Fibonacci-Zahlen wird definiert durch

a0 := 0 , a1 := 1 , an+1 := an + an−1 für n ∈ IN .

a. Zeigen Sie: Für alle n ∈ IN gilt an+1 an−1 − a2n = (−1)n .


an+1
Für n ∈ IN betrachten wir qn := .
an
b. Zeigen Sie, dass die Folge (qn )n∈IN konvergent ist.
n
Hinweis: Es gilt qn+1 − 1 =  (qk+1 − qk ).
k=1

c. Bestimmen Sie den Grenzwert lim qn .


n→
1
Tipp: Es gilt qn+1 = 1 +
qn
5.7 Aufgaben 77
 
11. Seien  an zn und  bn zn Potenzreihen mit Konvergenzradien Ra bzw. Rb .
n=0 n=0
n
Weiter sei cn :=  ak bn−k für n ∈ IN0 .
k=0

Zeigen Sie: Für z ∈ C mit |z| < min{Ra , Rb } gilt


  
  
 anzn  bnzn =  cn zn .
n=0 n=0 n=0

12. Eine Reihe der Form



ak
 ks
k=1

(hier zunächst für s ∈ Q) heißt Dirichletsche Reihe.


Zeigen Sie:
 
ak ak
a. Konvergiert  k s0 für ein s0 , so konvergiert  ks für jedes s > s0 .
k=1 k=1

b. Es gibt  ∈ IR, sodass die Reihe konvergiert für s >  und divergiert für
s < .

13. Zeigen Sie: Es gilt 1  2   .


Kapitel 6
Stetigkeit

Wir werden den Begriff der Stetigkeit hier für Abbildungen zwischen metrischen
Räumen einführen. In Kapitel 12 werden wir diesen Begriff weiter ausbauen.
Die Stetigkeit kann noch allgemeiner in beliebigen so genannten topologischen
Räumen, die nicht notwendigerweise eine Metrik tragen müssen, erklärt werden.
Wir werden dies am Ende von Kapitel 12.2 kurz aufgreifen; mehr dazu findet man
in Lehrbüchern zur Topologie, wie etwa [10] oder [18].

6.1 Stetige Abbildungen

Definition 6.1. Seien (X, dX ) und (Y, dY ) metrische Räume.


Eine Abbildung f : X → Y heißt stetig in p ∈ X, falls für jedes  > 0 eine Zahl
 > 0 existiert, sodass gilt:

dY ( f (x), f (p)) <  für alle x ∈ X mit dX (x, p) <  .

Ist f stetig in allen Punkten p ∈ X, so heißt f stetig (oder stetig auf X).
Den Raum der stetigen Funktionen X → Y bezeichnen wir mit C(X,Y ). Im Fall
Y = IK mit der natürlichen Metrik schreiben wir C(X) an Stelle von C(X, IK).


f (p) f (p)

 
p p
Zu jedem  > 0 gibt es ein  > 0 derart, dass dY ( f (x), f (p)) <  für alle
x ∈ X mit dX (x, p) <  gilt. Man beachte, dass  von  und auch von p
abhängen kann.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 79


DOI 10.1007/978-3-642-28644-5_6, © Springer-Verlag Berlin Heidelberg 2012
80 6 Stetigkeit

Mit der Bezeichnung UrdX (x) := {y ∈ X : dX (y, x) < r}, vgl. Kapitel 4.1, kann man
die Stetigkeit wie folgt ausdrücken:
Die Abbildung f ist stetig in p genau dann, wenn es zu jedem  > 0 ein  > 0
gibt mit  
f UdX (p) ⊆ UdY ( f (p)) .

Sind z.B. X = M ⊆ IR und Y = IR (jeweils mit der gewöhnlichen Metrik), so heißt


Stetigkeit in p ∈ M, dass zu jedem  > 0 ein  > 0 existiert mit

f ( ]p −  , p +  [ ) ⊆ ] f (p) −  , f (p) +  [ .

Beispiele:
(1) Die konstante Funktion f : IR → IR, f (x) = c, ist stetig, denn es gilt stets
| f (x) − f (p)| = 0 <  .
(2) Die Funktion f : IR → IR, f (x) = x2 ist stetig.
 

Beweis. Zu p ∈ IR,  > 0 wähle  = min 1, 2|p|+1 .
Ist dann nämlich |x − p| <  , so gilt

| f (x) − f (p)| = |x2 − p2| = |x + p| |x − p| ≤ (|x| + |p|) |x − p|

und mit |x| ≤ |x − p| + |p| erhalten wir weiter

(|x| + |p|) |x − p| ≤ (|x − p| + 2|p|) |x − p| ≤ (1 + 2|p|) |x − p| <  .

Es gilt also | f (x) − f (p)| <  für alle x ∈ IR mit |x − p| <  . 



(3) Die Funktion f : IR → IR,

⎨ 1 für x > 0 ,
f (x) = sgn (x) := 0 für x = 0 ,

−1 für x < 0 ,

ist nicht stetig in p = 0, denn für  ≤ 1 gibt es kein passendes“  > 0, sodass

sgn ( ] −  ,  [ ) ⊆ ] −  ,  [ gilt, weil stets sgn ( ] −  ,  [ ) = {−1, 0, 1} ist.
(4) Sei (M, d) ein metrischer Raum. Die Identität f : M → M, f (x) = x ist stetig,
denn zu  > 0 kann man  =  wählen. Aus |x − p| <  folgt dann immer
| f (x) − f (p)| <  .
(5) Seien (M, d) ein metrischer Raum, b ∈ M ein fester Punkt. Die Funktion
f : M → IR, f (x) = d(x, b) ist stetig.
Beweis. Zu  > 0 wähle  =  . Aus d(x, p) <  folgt dann mit der Drei-
ecksungleichung | f (x) − f (p)| = |d(x, b) − d(p, b)| ≤ d(x, p) <  =  . 

(5) Sei (IRd ,  · 2 ) der d-dimensionale Euklidische Raum. Für j ∈ {1, . . . , d}
bezeichnen wir mit  j : IRd → IR,  j (x) = x j , die Projektion auf die j-te Ko-
6.1 Stetige Abbildungen 81

ordinate (Koordinatenfunktion). Die Funktionen  j sind stetig, denn wegen


| j (x) −  j (p)| ≤ x − p2 können wir  =  wählen.
(6) Sei  j : 2 → IK,  j (a) = a j , für a = (a1 , a2 , . . .) ∈ 2 , j ∈ IN. Analog zu
vorigem Beispiel zeigt man, dass auch diese Koordinatenfunktionen stetig
sind.
Der folgende Satz liefert eine Charakterisierung der Stetigkeit mittels Folgen.
Satz 6.2 (Folgenkriterium). Seien (X, dX ), (Y, dY ) metrische Räume, f : X → Y
eine Abbildung und p ∈ X.
Die Abbildung f ist genau dann in p stetig, wenn gilt: Für jede gegen p konver-
gente Folge (xn )n∈IN in X konvergiert die Bildfolge ( f (xn ))n∈IN in Y gegen f (p).
Beweis. Seien f stetig in p ∈ X und (xn )n∈IN eine Folge in X mit p = lim xn .
n→
Zu  > 0 gibt es dann ein  > 0, sodass dY ( f (x), f (p)) <  für alle x ∈ X mit
dX (x, p) <  gilt. Weiter existiert zu  ein N ∈ IN mit dX (xn , p) <  für alle n ≥ N.
Damit folgt dY (( f (xn ), f (p)) <  für alle n ≥ N, d.h. lim f (xn ) = f (p).
n→
Für die umgekehrte Implikation sei nun vorausgesetzt, dass f nicht stetig in p ist.
Das heißt: Es gibt ein  > 0, sodass für jedes  > 0 ein Punkt x ∈ X existiert mit
sowohl dX (x, p) <  als auch dY ( f (x), f (p)) ≥  .
Insbesondere gibt es dann zu jedem n ∈ IN einen Punkt xn ∈ X mit dX (xn , p) < 1n
und dY ( f (xn ), f (p)) ≥  .
Damit ist (xn )n∈IN konvergent gegen p in X, aber ( f (xn ))n∈IN konvergiert nicht
gegen f (p) in Y . 

Schreibweise: Seien X,Y metrische Räume, D ⊆ X und f : D → Y eine Abbildung.
Falls f (xn ) → c ∈ Y gilt für jede Folge (xn )n∈IN in D, die gegen p ∈ X konvergiert,
so schreibt man lim f (x) = c. Falls f in p stetig ist, haben wir damit also c = f (p).
x→p

Zu f : X → Y und g : Y → Z bezeichnen wir die durch g ◦ f (x) := g( f (x)) erklärte


Abbildung g ◦ f : X → Z als Komposition von f und g. Wir wollen zeigen, dass die
Komposition zweier stetiger Funktionen auch wieder stetig ist.
Satz 6.3. Seien (X, dX ), (Y, dY ) und (Z, dZ ) drei metrische Räume sowie p ∈ X.
Wenn die Abbildungen f : X → Y stetig in p und g : Y → Z stetig in f (p) ∈ Y
sind, dann ist g ◦ f : X → Z stetig in p.
Beweis. Sei  > 0.  
Da g stetig in f (p) ist, gibt es  > 0 mit g UdY ( f (p)) ⊆ UdZ (g( f (p))).
 
Zu  > 0 gibt es nun  > 0 mit f UdX (p) ⊆ UdY ( f (p)), weil f stetig in p ist.
Zusammen haben wir
   
g ◦ f UdX (p) ⊆ g UdY ( f (p)) ⊆ UdZ (g ◦ f (p)) ,

also ist g ◦ f stetig in p. 



82 6 Stetigkeit

Sind X ein metrischer Raum, f : X → IK, g : X → IK Abbildungen und  ∈ IK, so


sind durch

( f + g)(x) := f (x) + g(x) , ( f )(x) :=  f (x) , ( f g)(x) := f (x) g(x)

weitere Abbildungen f + g,  f , f g : X → IK erklärt.


1 1 1
Ist f (x) = 0 für alle x ∈ X, so ist f : X → IK definiert durch f (x) := f (x) .

Satz 6.4. Seien (X, d) ein metrischer Raum, f : X → IK und g : X → IK stetig in


p ∈ X sowie  ∈ IK. Dann sind auch f + g,  f und f g stetig in p. Ist f stets = 0, so
ist auch 1f stetig in p.

Beweis. Wir verwenden das Folgenkriterium (Satz 6.2).


Ist (xn )n∈IN konvergent gegen p, so konvergieren auch f (xn ) gegen f (p) und
g(xn ) gegen g(p).
Laut den Rechenregeln für Grenzwerte (Satz 3.5) konvergieren ( f + g)(xn ) ge-
gen ( f + g)(p) und  f (xn ) gegen  f (p) sowie f g(xn ) gegen f g(p) und, unter der
gegebenen Voraussetzung, 1f (xn ) gegen 1f (p). 

Beispiele:
(1) Mit Satz 6.4 sind Polynome P : IK → IK, P(x) = an xn + an−1xn−1 + · · · + a0 ,
mit n ∈ IN, a0 , . . . , an ∈ IK, stetige Funktionen.
(2) Seien P und Q zwei Polynome. Setzt man M := {x ∈ IK : Q(x) = 0}, so ist
P
Q : M → IK stetig. Funktionen dieser Bauart heißen rationale Funktionen.
Es liegt nun auf der Hand zu fragen, ob auch durch (konvergente) Potenzreihen
erklärte Funktionen stetig sind.
Sei M eine beliebige Menge und bezeichne B(M) den Raum aller beschränkten
Funktionen f : M → IK. Weiter sei

 f M := sup | f (x)| .
x∈M

Man kann direkt nachrechnen, dass  · M eine Norm auf B(M) ist. (Aus Satz 4.9
wissen wir bereits, dass B(M) mit dieser Norm sogar vollständig, also ein Banach-
raum, ist.)

Satz 6.5. Seien (X, d) ein metrischer Raum und p ∈ X. Ferner seien fn : X → IK
(n ∈ IN) beschränkte Funktionen, die in p stetig sind.

Wenn die Reihe   fn X konvergent ist, dann ist durch
n=1


f (x) :=  fn (x) für x ∈ X
n=1

eine in p stetige Funktion f : X → IK definiert.


6.1 Stetige Abbildungen 83
 
Beweis. Für jedes x ∈ X ist   fn X eine konvergente Majorante von  fn (x).
n=1 n=1
Daher ist f : X → IK überhaupt erklärt (wohldefiniert). Zu zeigen bleibt noch die
Stetigkeit in p.
Für jedes x ∈ X und (zunächst beliebiges) N ∈ IN gilt


N N
 

| f (x) − f (p)| ≤
 fn (x) −  fn (p)
+  | fn (x)| +  | fn (p)| .

n=1 n=1

n=N+1 n=N+1

 
Sei  > 0. Da   fn X konvergiert, gibt es ein N ∈ IN mit   fn X < 3 .
n=1 n=N+1


Damit ist  | fn (x)| < 3 für alle x ∈ X. Somit haben wir
n=N+1


N N
2

| f (x) − f (p)| ≤
 fn (x) −  fn (p)
+  .

n=1 n=1

3


N N

Wähle nun  > 0, sodass


 fn (x) −  fn (p)

<


3 für alle x mit d(x, p) <  ist.
n=1 n=1
Dann gilt | f (x) − f (p)| <  für alle x ∈ X mit d(x, p) <  .
Folglich ist f stetig in p. 

Mit Hilfe von Satz 6.5 können wir zeigen, dass jede Potenzreihe im Inneren ihres
Konvergenzkreises eine stetige Funktion darstellt. Genauer gilt folgendes:

Korollar 6.6. Sei  ck zk eine Potenzreihe mit Konvergenzradius R. Dann ist durch
k=0


f (z) :=  ck zk
k=0

eine in UR (0) stetige (falls 0 < R < ) bzw. in ganz C stetige (falls R = ) Funktion
f erklärt.
Beweis. Sei z ∈ UR (0). Dann gibt es r mit |z| < r < R. Die durch fk (z) := ck zk ,
k ∈ IN, erklärten Funktionen sind auf X := Ur (0) beschränkt und stetig. Ferner gilt
 fk X ≤ |ck | rk , also ist
 
  fk X ≤  |ck | rk <  ,
k=0 k=0

da die Potenzreihe in UR (0) absolut konvergiert. Nun folgt mit Satz 6.5 die Stetigkeit
im Punkt z.
Da dies für jedes z ∈ UR (0) gilt, haben wir die Stetigkeit auf ganz UR (0).
Die Aussage im Fall R =  folgt ganz analog, wenn man C an Stelle von UR (0)
betrachtet. 

84 6 Stetigkeit

Laut Korollar 6.6 sind u.a. die folgenden Funktionen stetig.


(1) Die Exponentialfunktion ist stetig auf ganz C.
(2) Sinus und Cosinus sind stetig auf ganz C.
(3) Die Binomialreihe zum Exponenten s,

s k
Bs (z) =  z ,
k=0 k

vgl. Kapitel 5.4, Beispiel (6), ist stetig auf U1 (0).


(4) Die Potenzfunktion z → az := exp(z ln a) ist stetig auf ganz C. Diese allge-
meinen Potenzen für beliebiges z ∈ C werden wir in Kapitel 6.3 noch genauer
untersuchen.
Bemerkung: Die im Beweis zu Korollar 6.6 benutzte Einschränkung auf Ur (0) mit

r < R ist notwendig, da   fk UR (0) möglicherweise divergiert, wie z.B. bei der
 k=0
Potenzreihe  zk .
k=0

 
sin x 1 (−1)k 2k+1
(−1)k 2k
Anwendung: Für x = 0 gilt x = x  (2k+1)!
x = 
(2k+1)!
x , insbesondere
k=0 k=0

(−1)k 2k
ist die Reihe auf der rechten Seite konvergent. Die Potenzreihe f (z) :=  (2k+1)! z
k=0
stellt daher eine auf ganz C stetige Funktion dar und mit dem Folgenkriterium er-
halten wir
sin x
lim = lim f (x) = f (0) = 1 .
x→0 x x→0

6.2 Eigenschaften stetiger reellwertiger Funktionen

Wir wenden uns nun stetigen Funktionen zu, die auf Teilmengen von IR definiert
und reellwertig sind.

Satz 6.7 (Nullstellensatz). Sei f : [a, b] → IR stetig mit f (a) < 0 und f (b) > 0 oder
f (a) > 0, f (b) < 0.
Dann existiert mindestens ein x0 ∈ ]a, b[ mit f (x0 ) = 0.
Beweis. Im Fall f (a) < 0, f (b) > 0 konstruieren wir rekursiv eine Intervallschach-
telung (In )n∈IN0 mit In = [an , bn ], f (an ) < 0, f (bn ) ≥ 0 und |In | = 21n |I0 |.
Dazu beginnen wir mit I0 := [a, b]. Sei In mit den angegebenen Eigenschaften
bereits gefunden. Dann betrachten wir m := 12 (an + bn ) und definieren

[an , m] , falls f (m) ≥ 0 ,
[an+1 , bn+1 ] :=
[m, bn ] , falls f (m) < 0 .
6.2 Eigenschaften stetiger reellwertiger Funktionen 85

Damit haben wir eine Intervallschachtelung und es gibt x0 mit {x0 } = In .
n∈IN0
Nun gilt lim an = x0 = lim bn und, da f stetig ist, erhalten wir mit Satz 6.2
n→ n→

0 ≥ lim f (an ) = f (x0 ) = lim f (bn ) ≥ 0 ,


n→ n→

also f (x0 ) = 0.
Der Beweis im Fall f (a) > 0 und f (b) < 0 geht ganz analog. 

Korollar 6.8 (Zwischenwertsatz). Sei f : [a, b] → IR stetig.
Zu jedem c ∈ ] f (a), f (b)[ (falls f (a) < f (b) gilt) bzw. c ∈ ] f (b), f (a)[ (falls
f (b) < f (a) ist), existiert ein x0 ∈ ]a, b[ mit f (x0 ) = c.
Beweis. Betrachte g : [a, b] → IR, g(x) := f (x) − c, und wende Satz 6.7 auf g an. 

Anschaulich besagt der Zwischenwertsatz, dass f jeden Wert zwischen f (a) und
f (b) annimmt:
Im Fall f (a) < f (b) ist [ f (a), f (b)] ⊆ f ([a, b]).
Gilt f (a) > f (b), so ist [ f (b), f (a)] ⊆ f ([a, b]).

Anwendung: Es gibt eine kleinste positive Zahl x0 ∈ ]0, 2[ mit cos(x0 ) = 0.


Beweis. Es gilt cos(0) = 1 und

(−1)k 2k 4 42 4 42
cos(2) =  2 = 1− + 1− + ∓ ···
k=0 (2k)! 2! 4! 5·6 5·6·7·8
n
2  4 2 1 3
< −1 +  = −1 + 4
=− ,
3 n=0 30 3 1 − 30 13

also cos(0) > 0 und cos(2) < 0. Mit der Stetigkeit des Cosinus folgt zunächst, dass
es mindestens eine Zahl c ∈]0, 2[ gibt mit cos(c) = 0.
Wir betrachten M := {c > 0 : cos(c) = 0} und setzen x0 := inf M. Dann gibt es
eine Folge (xn )n∈IN in M mit xn → x0 für n → . Mit dem Folgenkriterium erhalten
wir cos(x0 ) = lim cos(xn ) = 0 und wegen cos(0) = 1 gilt x0 = 0, also x0 ∈ M.
n→
Folglich ist x0 die kleinste positive Nullstelle des Cosinus. 

Wir sind jetzt in der Lage, weitere wichtige Eigenschaften von Sinus und Cosinus
herzuleiten. Aus Kapitel 5.5 wissen wir bereits, dass

sin2 x + cos2 x = 1

für alle x ∈ IR gilt. Dabei sind sin2 x und cos2 x abkürzende Schreibweisen für
(sin x)2 bzw. (cos x)2 .  
Üblicherweise
  setzt man  := 2x0 . Es gilt also cos 2 = 0 und daher sin 2 = 1
oder sin 2 = −1.

Behauptung: Für x ∈ ]0, 2[ gilt sin x > 0.


86 6 Stetigkeit

Beweis. Für x ∈ ]0, 2[ ist

sin(x) 1  (−1)k 2k+1 x2 x4 x6


=  x = 1 − + − ± ···
x x k=0 (2k + 1)! 3! 5! 7!

x2 x2 x4
> 1− 1+ + + ···
3! 4·5 4·5·6·7
n
4  4 4 1 1
> 1−  = 1− 4
= > 0,
3! n=0 20 3! 1 − 20 6

also auch sin(x) > 0. 



 
Folglich bleibt nur sin 2 = 1. Weiter erhalten wir für alle z ∈ C mit den Additions-
theoremen (Satz 5.22)
  
• cos z + 2 = cos(z) cos 2 − sin(z) sin 2 = − sin(z),
  
• sin z + 2 = sin(z) cos 2 + cos(z) sin 2 = cos(z),
 
• cos( ) = cos 2 + 2 = − sin 2 = −1 und damit sin( ) = 0,
• cos(z +  ) = cos(z) cos( ) − sin(z) sin( ) = − cos(z),
• sin(z +  ) = sin(z) cos( ) + cos(z) sin( ) = − sin(z),
• cos(z + 2 ) = cos(z +  ) cos( ) − sin(z +  ) sin( ) = cos(z),
• sin(z + 2 ) = sin(z +  ) cos( ) + cos(z +  ) sin( ) = sin(z).
Mit der Eulerschen Formel (5.4) folgt exp(i ) = cos( ) + i sin( ) = −1 und mit
Hilfe der Funktionalgleichung (5.3) erhalten wir schließlich

exp(z + 2 i) = exp(z) exp(2 i) = exp(z) (cos(2 ) + i sin(2 )) = exp(z)

für alle z ∈ C.

Als weitere Folgerung aus Satz 6.7 wollen wir noch einen Fixpunktsatz notieren.
Fixpunktsätze sind wichtige mathematische Instrumente. So wird uns etwa der so
genannte Fixpunktsatz von Banach (Satz 15.4) später noch von großem Nutzen sein.

Korollar 6.9 (Fixpunktsatz). Sei f : [a, b] → [a, b] stetig.


Dann existiert ein x0 ∈ [a, b] mit f (x0 ) = x0 .

Beweis. Nach Voraussetzung gilt a ≤ f (x) ≤ b für alle x ∈ [a, b]. Ist f (a) = a oder
f (b) = b, so bleibt nichts zu zeigen.
Seien also a < f (a) und f (b) < b. Die Funktion g : [a, b] → IR, g(x) := f (x) − x,
ist stetig mit g(a) > 0 und g(b) < 0. Laut Satz 6.7 existiert x0 ∈ ]a, b[ mit g(x0 ) = 0.
Damit gilt f (x0 ) = x0 . 

6.2 Eigenschaften stetiger reellwertiger Funktionen 87

b
Die stetige Funktion f : [a, b] → [a, b] besitzt
mindestens einen Fixpunkt x0 ∈ [a, b], d.h. es
gilt x0 = f (x0 ).
Anschaulich bedeutet dies, dass der Graph von
f die Winkelhalbierende in mindestens einem
a Punkt schneidet.

a b

Analog wie bei Folgen heißt eine Funktion f : [a, b] → IR monoton wachsend, wenn
aus y > x stets f (y) ≥ f (x) folgt. Falls aus y > x sogar immer f (y) > f (x) folgt,
so heißt die Funktion streng monoton wachsend. Entsprechend definiert man die
Eigenschaften (streng) monoton fallend.

Satz 6.10. Seien I ⊆ IR ein Intervall, f : I → IR streng monoton wachsend oder


streng monoton fallend und M := f (I).
Dann ist f : I → M bijektiv und die Umkehrfunktion f −1 : M → I ist stetig.

Beweis. Die Injektivität folgt direkt aus der strengen Monotonie. Zu zeigen bleibt
die Stetigkeit von f −1 .
Sei f streng monoton wachsend. Zu festem p ∈ M betrachte a ∈ I mit f (a) = p.
Wir müssen zeigen: Zu jedem  > 0 gibt es ein  > 0 derart, dass

|x − a| <  für alle x ∈ I mit | f (x) − p| < 

gilt. Dies ist genau dann der Fall, wenn die folgenden Bedingungen beide erfüllt
sind.
(i) Zu jedem  > 0 gibt es ein 1 > 0, sodass gilt:

a−x <  für alle x ∈ I , x < a , mit p − f (x) < 1 .

(ii) Zu jedem  > 0 gibt es ein 2 > 0, sodass gilt:

x−a <  für alle x ∈ I , x > a , mit f (x) − p < 2 .

Wir wollen nun sehen, dass (i) erfüllt ist.


Ist a ∈ I linker Randpunkt von I, so ist nichts zu zeigen. Sei also a ∈ I nicht
linker Randpunkt von I. Dann gibt es b ∈ I, b < a, mit a − b <  und wir setzen
1 := p − f (b).
Ist nun x ∈ I, x < a mit p − f (x) < 1 , so folgt f (b) < f (x) und damit b < x
wegen der Monotonie. Weiter folgt a − x < a − b <  , also ist (i) nachgewiesen.
Ganz analog zeigt man auch (ii).
Ebenso analog führt man auch den Beweis im Fall einer streng monoton fallenden
Funktion. 

88 6 Stetigkeit

Bemerkung: Es wird bei Satz 6.10 nicht gefordert, dass f selbst stetig ist. Auch
braucht f (I) = M kein Intervall zu sein.
Unter der zusätzlichen Voraussetzung, dass f stetig ist, folgt mit dem Zwischen-
wertsatz allerdings, dass M ein Intervall ist.

Beispiel: Sei n ∈ IN. Die Funktion f : [0, [ → [0, [, f (x) := xn , ist streng monoton
wachsend.√Die Umkehrfunktion ist die n−te Wurzelfunktion f −1 : [0, [ → [0, [,
f −1 (x) = n x. Nach Satz 6.10 ist diese stetig.

Wir führen noch einen weiteren Begriff ein.


Seien D ⊆ IR, Y ein metrischer Raum und f : D → Y eine Abbildung. Wenn
für jede Folge (xn )n∈IN in D, die gegen p ∈ IR konvergiert und xn > p ∀n erfüllt,
f (xn ) → c gilt, so bezeichnet man c als rechtsseitigen Grenzwert und schreibt
c = lim f (x). Gebräuchlich sind auch die Schreibweisen lim f (x) und f (p + 0).
x→p+0 x↓p

Entsprechend erklärt man ggf. auch einen linksseitigen Grenzwert und schreibt
dann lim f (x) oder lim f (x) bzw. f (p − 0).
x→p−0 x↑p

Wenn D ein Intervall und p ∈ D kein Randpunkt von D ist, so ist f offensichtlich
stetig in p genau dann, wenn rechts- und linksseitiger Grenzwert existieren und
übereinstimmen.

Satz 6.11. Sei f : [a, b] → IR monoton wachsend.


Für jedes p ∈ ]a, b[ existieren f (p + 0) sowie f (p − 0) und es gilt

f (p − 0) ≤ f (p) ≤ f (p + 0) .

Die Grenzwerte f (a + 0) und f (b − 0) existieren; es gelten f (a) ≤ f (a + 0) sowie


f (b − 0) ≤ f (b).
Entsprechende Aussagen gelten für monoton fallende Funktionen.

Beweis. Sei p ∈ ]a, b[. Da f monoton wachsend ist, existiert das Supremum c :=
sup{ f (x) : x ∈ [a, p[ } und es gilt c ≤ f (p).
Zu  > 0 existiert x ∈ [a, p[ mit c −  ≤ f (x ) ≤ c. Auf Grund der Monotonie
gilt deshalb
c −  ≤ f (x) ≤ c für alle x ∈ [x , p[ .
Ist nun (xn )n∈IN eine Folge in [a, p[ mit xn → p, so findet man ein N ∈ IN derart, dass
xn ∈ [x , p[ für alle n ≥ N gilt. Damit ist c − f (xn ) <  für alle n ≥ N.
Folglich gilt lim f (xn ) = c und damit c = f (p − 0).
n→

Die anderen Nachweise laufen analog. 


Wir erwähnen noch, dass sich die Rechenregeln für Grenzwerte mit Hilfe von
Satz 6.4 auf lim f (x), lim f (x) und lim f (x) übertragen lassen.
x→p x→p±0 x→±
6.3 Exponentialfunktion und Logarithmus 89

Seien etwa lim f (x) = c und lim g(x) = b, so gelten


x→p x→p

lim ( f + g)(x) = c + b , lim ( f g)(x) = cb ,


x→p x→p

f c
und, falls b = 0 ist, haben wir lim (x) = .
x→p g b

6.3 Exponentialfunktion und Logarithmus

Die Exponentialfunktion ist eine auf ganz C stetige Funktion.


Schränken wir uns auf die reellen Zahlen ein, so erhalten wir eine streng monoton
wachsende Funktion exp : IR → ]0, [, wie wir aus Kapitel 5.5 bereits wissen.
An Hand der Reihendarstellung sieht man weiter, dass exp(x) > x für alle
x > 0 gilt. Daher ist die Bildmenge exp(IR) nach oben unbeschränkt. Weiter gilt
1
exp(−x) = exp(x) < 1x für x > 0. Zu jedem y ∈ ]0, [ gibt es deshalb ein x ∈ IR
mit exp(−x) < y < exp(x). Folglich existiert laut Zwischenwertsatz ein x0 ∈ IR mit
exp(x0 ) = y; also ist exp(IR) = ]0, [.
Nun können wir mit Satz 6.10 folgern, dass die reelle Exponentialfunktion eine
stetige Umkehrfunktion g : ]0, [→ IR besitzt; d.h. wir haben

g ◦ exp : IR → IR , g ◦ exp(x) = x

und exp ◦ g : ]0, [ → ]0, [ , exp ◦ g(y) = y .

1
Die Exponentialfunktion bildet IR
bijektiv auf das Intervall ]0, [ ab.
1

Wir werden sehen, dass g mit dem Logarithmus aus Kapitel 3.4 übereinstimmt.
Dazu sind jedoch noch einige Vorüberlegungen nötig.
Zunächst wollen wir eine weitere Charakterisierung der Exponentialfunktion
herleiten. Diese wird motiviert durch das Problem der stetigen Verzinsung“. Wächst

etwa ein Kapital K durch Zinsen in einem Jahr auf K(1 + x), so hat man nach dem
90 6 Stetigkeit

Teilneines Jahres, z.B. n = 12 bei monatlicher Verzinsung, einen Zuwachs auf


n-ten
K 1 + nx . Man fragt sich nun, ob ein Grenzwert für n →  existiert.
 z n
Satz 6.12. Für alle z ∈ C gilt lim 1 + = exp(z).
n→ n
Für z = 1 kennen wir dies schon, vgl. Beispiel (3) in Kapitel 5.1.
Beweis. Wegen
 n k
z n 
zk n z
exp(z) − 1 +
n
=  k! −  k nk
k=0 k=0

n 
n(n − 1) · · ·(n − k + 1) zk zk
=  1−
nk
+ 
k! k=n+1 k!
k=0   
=: cnk
 n
zk zk
und lim  = 0 bleibt zu zeigen, dass  cnk = 0 gilt.
k=n+1 k! k!
n→
k=0

Dazu halten wir fest, dass 0 < cnk < 1 für alle k, n ∈ IN und lim cnk = 0 ist.
n→
Zu  > 0 finden wir (vgl. Satz 5.1) ein N ∈ IN derart, dass
n
|z|k
 < für alle m, n mit N < m < n
k=m k!

gilt. Damit erhalten wir




n zk

N
|z|k n
|z|k N
|z|k


 cnk
≤  cnk +  cnk <  cnk + .

k=0 k!
k=0 k! k=N+1 k! k=0 k!

Ganz rechts können wir nun den Grenzwert für n →  bilden; die Anzahl der Sum-
manden hängt hier nicht mehr von n ab. Damit folgt


n zk

N
|z|k

lim sup
 cnk
≤ lim  cnk + = 
n→
k=0 k!
n→
k=0 k!

und weiter, da dies für jedes  > 0 gilt, die Behauptung. 



Nun wenden wir uns dem Logarithmus zu. Für x > 0 haben wir den Wert ln(x)
mittels einer Intervallschachtelung definiert.
Lemma 6.13. Für 0 < a < b gilt 1 − ab ≤ ln(b) − ln(a) ≤ ba − 1.

Beweis. Aus Satz 3.12 folgt zunächst 1 − ab ≤ ln 1a + ln(b) ≤ b
− 1 und mit
 a
ln 1a = − ln(a), siehe Korollar 3.13, erhalten wir die Behauptung. 

Satz 6.14. Die Funktion ln : ]0, [ → IR, definiert wie in Kapitel 3.4, ist stetig.
6.3 Exponentialfunktion und Logarithmus 91

Beweis. Seien p ∈ ]0, [ und (xn )n∈IN eine Folge in ]0, [, die gegen p konvergiert.



Zu  > 0 gibt es dann ein N ∈ IN mit


xpn − 1
<  und
xpn − 1
<  für alle n ≥ N.

Außerdem haben wir aus Lemma 6.13



xn
0 ≤ ln(xn ) − ln(p) ≤ −1 falls xn > p ,
p

p
0 ≤ ln(p) − ln(xn ) ≤ −1 falls xn < p .
xn

Daher ist | ln(xn ) − ln(p)| <  für alle n ≥ N.


Also gilt lim ln(xn ) = ln(p). Mit Satz 6.2 folgt die Stetigkeit. 

n→

Satz 6.15. Für alle x ∈ IR gilt ln(exp(x)) = x.

Beweis. Wegen exp(x) > 0 für alle x ∈ IR ist der Ausdruck ln(exp(x)) für alle reellen
Zahlen x erklärt.
Seien zunächst x > 0 und n ∈ IN. Setzt man a = n und b = x + n in die Unglei-
x
chung aus Lemma 6.13 ein, so ergibt sich n+x ≤ ln(n + x) − ln(n) ≤ nx .
 n 
Mit n(ln(n + x) − ln(n)) = n ln n+x
n = ln n+xn , vgl. Korollar 3.13, folgt
nx  x n 
≤ ln 1 + ≤x
n+x n
n 
und Satz 3.7 liefert lim ln 1 + nx = x.
n→
Wegen der Stetigkeit des Logarithmus folgt mit Hilfe von Satz 6.12 nun
 x n    x n 
x = lim ln 1 + = ln lim 1 + = ln(exp(x)) .
n→ n n→ n
 
1
Sei nun x < 0. Dann ist −x = ln(exp(−x)) = ln exp(x) = − ln(exp(x)).
Die Behauptung gilt also auch in diesem Fall; für x = 0 gilt sie offensichtlich.


Umgekehrt gilt dann für jedes x ∈ ]0, [ auch exp(ln(x)) = x.


Mit Hilfe von Exponentialfunktion und Logarithmus können wir nun allgemeine
Potenzfunktionen erklären. Für x > 0 und z ∈ C setzt man

xz := exp(z ln x) .

Ist speziell x = e, so hat man ez = exp(z), da ln(e) = 1 ist.


Für x, y > 0 und z, w ∈ C ergibt sich damit unmittelbar
1
x1 = x , x0 = 1 , xz xw = xz+w , x−z = , (xy)z = xz yz
xz
92 6 Stetigkeit

und für x > 0, y ∈ IR, z ∈ C gilt

(xy )z = (exp(y ln x))z = exp(z ln(exp(y ln x))) = exp(zy ln x) = xyz .

Die Wurzelfunktion ist ein Spezialfall der Potenzfunktionen. Ist z =  > 0, so ist
x → x eine streng monoton wachsende, stetige, bijektive Abbildung ]0, [ → ]0, [.
Die zugehörige Umkehrfunktion ist x → x1/ , denn (x )1/ = x (1/ ) = x1 = x.
Wir wollen noch verifizieren, daß für n ∈ IN die beiden Definitionen xn := x · · · x und
xn := exp(n ln x) übereinstimmen. Dies ist der Fall, denn es gilt

exp(n ln x) = exp (ln x + · · · + ln x) = exp(ln x) · · · exp(ln x) = x · · · x = xn .


     
n Summanden n Faktoren

Damit stimmt die Umkehrfunktion x → x1/n auch mit x → n
x überein.

6.4 Stetige Funktionen auf [a, b]

Wir leiten noch einige Eigenschaften für stetige Funktionen her, die auf Intervallen
der Form [a, b] definiert sind. Wir werden diese in Kapitel 12 noch verallgemeinern,
wenn wir stetige Funktionen auf so genannten kompakten Mengen untersuchen.

Satz 6.16. Sei f : [a, b] → IR stetig.


Dann ist f ([a, b]) eine beschränkte Teilmenge von IR und f nimmt Maximum und
Minimum an. Das heißt, es existieren ein p ∈ [a, b] mit f (p) = sup{ f (x) : x ∈ [a, b]}
und ein q ∈ [a, b] mit f (q) = inf{ f (x) : x ∈ [a, b]}.

Beweis. Wir führen den Nachweis nur für das Maximum. Sei

sup{ f (x) : x ∈ [a, b]} , falls f ([a, b]) nach oben beschränkt ist,
M :=
, falls nicht.

Dann existiert eine Folge (xn )n∈IN in [a, b] mit lim f (xn ) = M.
n→
Da (xn )n∈IN beschränkt ist, existiert nach Satz 4.19 eine Teilfolge
 (xnk )k∈IN mit
lim xnk = p ∈ [a, b]. Mit der Stetigkeit von f folgt f (p) = lim f xnk = M. 

k→ k→

Definition 6.17. Seien (X, dX ) und (Y, dY ) zwei metrische Räume. Eine Funktion
f : X → Y heißt gleichmäßig stetig auf X, falls zu jedem  > 0 ein  > 0 existiert,
sodass gilt:

dY ( f (x), f (x )) <  für alle x, x ∈ X mit dX (x, x ) <  .

Ist f : X → Y gleichmäßig stetig, so ist f offensichtlich in jedem Punkt p ∈ X stetig.


6.5 Aufgaben 93

Satz 6.18. Seien (Y, dY ) ein metrischer Raum und f : [a, b] → Y stetig.
Dann ist f auch gleichmäßig stetig.

Beweis. Angenommen, f ist nicht gleichmäßig stetig. Dann gibt es ein  > 0 derart,
dass für jedes n ∈ IN zwei Punkte xn , xn ∈ [a, b] existieren mit

1
|xn − xn | < und dY ( f (xn ), f (xn )) ≥  .
n
Laut Satz 4.19 existiert nun eine konvergente Teilfolge (xnk )k∈IN von (xn )n∈IN mit
lim xnk = p ∈ [a, b]. Mit |xnk − xnk | < n1k gilt auch lim xnk = p. Da f stetig ist, folgt
k→ k→

lim dY ( f (xnk ), f (xnk )) = dY ( f (p), f (p)) = 0


k→

im Widerspruch zu dY ( f (xnk ), f (xnk )) ≥  für alle k ∈ IN. Die Annahme ist demnach
nicht erfüllbar. 

Beispiel: Die Funktion f : ]0, [→ IR, f (x) := 1x , ist auf jedem Intervall [c, 1] mit
0 < c < 1 gleichmäßig stetig, aber sie ist nicht gleichmäßig stetig auf ]0, 1].

Beweis. Für festes c mit 0 < c < 1 ist f nach Satz 6.18 gleichmäßig stetig auf [c, 1].
Um zu zeigen, dass f im Intervall ]0, 1] nicht gleichmäßig stetig ist, betrachte etwa
 = 1. Wir nehmen an, es gibt ein  > 0 mit


f (x) − f (y)
< 1 für alle x, y ∈ ]0, 1] mit |x − y| <  .
& '
Nun wählen wir a ∈ 0, 12 mit a <  .
Mit x := a und y := 2a gilt dann x, y ∈ ]0, 1] sowie |y − x| <  und weiter

1 1 1
| f (x) − f (y)| = − = >1=
a 2a 2a
im Widerspruch zur Annahme; es gibt also kein solches  .
Folglich ist f nicht gleichmäßig stetig auf ]0, 1]. 

6.5 Aufgaben

1. Zeigen Sie, dass

z → Re (z) , z → Im (z) , z → z und z → |z|

in ganz C stetig sind. Folgern Sie

exp(z) = exp(z) für alle z ∈ C .


94 6 Stetigkeit

2. Begründen Sie, dass lim cos(x)−1


x existiert, und berechnen Sie diesen Grenzwert.
x→0

3. Zeigen Sie, dass die Funktion f : IR → IR,


 1
sin x für x = 0 ,
f (x) :=
0 für x = 0 ,

im Punkt x = 0 nicht stetig ist:


a. direkt an Hand der Definition; zeigen Sie, dass man beispielsweise zu  = 12
kein passendes“  finden kann;

b. mit dem Folgenkriterium (Satz 6.2).

4. Zeigen Sie, dass die Funktion f : IR → IR,


 
x sin 1x für x = 0 ,
f (x) :=
0 für x = 0 ,

auf ganz IR stetig ist.


Hinweis: Um die Stetigkeit im Nullpunkt zu zeigen, können Sie z.B. das Fol-
genkriterium und die Abschätzung | f (x) − f (0)| ≤ |x − 0| verwenden.

5. Seien f , g : IR → IR stetige Funktionen mit f (x) = g(x) für alle x ∈ Q.


Zeigen Sie, dass f (x) = g(x) für alle x ∈ IR gilt.

6. Seien (X, dX ) und (Y, dY ) metrische Räume.


Eine Funktion f : X → Y heißt Lipschitz-stetig, wenn es ein L > 0 gibt mit

dY ( f (x), f (y)) ≤ L dX (x, y) für alle x, y ∈ X .

a. Zeigen Sie: Jede Lipschitz-stetige Funktion ist gleichmäßig stetig.


b. Geben Sie eine Funktion f : IR → IR an, die in ganz IR stetig, aber nicht
Lipschitz-stetig ist.

7. Seien p ∈ IR und f : IR → IR eine stetige Funktion derart, dass f (x + p) = f (x)


für alle x ∈ IR gilt.
Zeigen Sie, dass f gleichmäßig stetig ist.

8. Zeigen Sie, dass die Funktion f : IR → IR, f (x) := cos(x2 ), nicht gleichmäßig
stetig ist.

Hinweis: Betrachten Sie f ( k ) für k ∈ IN.
6.5 Aufgaben 95

9. Zeigen Sie, dass es genau eine reelle Zahl x gibt, die die Gleichung x = e−x löst.

10. Seien M eine nicht-leere Menge und d : M × M → IR definiert durch



0 falls x = y ,
d(x, y) :=
1 sonst .

a. Zeigen Sie, dass (M, d) ein metrischer Raum ist.


b. Bestimmen Sie alle stetigen Abbildungen f : (M, d) → (M, d).

11. Sei f : IR → C eine im Punkt x = 0 stetige Funktion derart, dass

f (x + y) = f (x) + f (y) für alle x, y ∈ IR

gilt. Zeigen Sie, dass eine Zahl c ∈ C existiert mit

f (x) = cx für alle x ∈ IR .


Kapitel 7
Differentiation

Die Differentiation, mit der wir uns in diesem Kapitel beschäftigen werden, stellt
ein weiteres wichtiges Werkzeug der Analysis dar. Sie wird unter anderem durch
folgende Problemstellungen motiviert:
• Konstruktion einer Tangente an den Graphen einer Funktion in einem vorgege-
benen Punkt
• Lokale Approximation einer Funktion durch eine möglichst einfache Funktion,
nämlich ein Polynom ersten Grades
• Bestimmung der Momentangeschwindigkeit eines Teilchens
• als Gegenspieler der Integration“ (vgl. Kapitel 8)

Trotz der vielen Gesichter finden wir einen einfachen Zugang mittels Grenzwerten.

7.1 Differenzierbarkeit

Definition 7.1. Seien I ⊆ IR ein Intervall und x ∈ I. Eine Funktion f : I → IK nennt


man differenzierbar in x, falls der Grenzwert
f (t) − f (x)
lim
t →x t −x
t ∈ I , t = x

df
existiert. Wir bezeichnen diesen Grenzwert dann mit f  (x) oder (x).
dt

Weiter heißt f (x) die Ableitung (oder Differentialquotient) von f in x.
Ist die Funktion f in jedem x ∈ I differenzierbar, so heißt f differenzierbar.
Falls x ein Randpunkt von I ist, wollen wir den Limes als rechts- bzw. linksseitigen
Grenzwert verstehen. Die Angabe t ∈ I, t = x werden wir künftig nicht mehr explizit
ausschreiben. Man sollte aber im Kopf behalten, welche t für die Grenzwertbildung
zugelassen sind.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 97


DOI 10.1007/978-3-642-28644-5_7, © Springer-Verlag Berlin Heidelberg 2012
98 7 Differentiation

Bemerkung: Man kann Differenzierbarkeit analog auch für Funktionen f : I → X


definieren, wobei X ein beliebiger normierter Raum ist, und zwar als Grenzwert in
X. Wir verzichten darauf an dieser Stelle, merken aber an, dass wir komplexwertige
Funktionen zulassen.

Satz 7.2. Sei f : I → IK im Punkt x ∈ I differenzierbar. Dann ist f stetig in x.

Beweis. Für t ∈ I, t = x haben wir

f (t) − f (x)
f (t) − f (x) = (t − x) → f  (x) · 0 = 0 mit t → x .
t −x
Demnach ist f laut Folgenkriterium (Satz 6.2) stetig in x. 

Die Umkehrung von Satz 7.2 gilt nicht; siehe etwa Beispiel (6).
Schreibt man die Gleichung des Beweises etwas um, erhält man folgendes. Mit
P(t) := f (x) + f  (x) (t − x) gilt

f (t) − P(t)
lim =0,
t→x t −x
d.h. die lokale Approximation von f (t) durch P(t) ist schneller“ als die, mit der t

gegen x strebt. Man bezeichnet P(t) auch als lineare Approximation von f in x.

P
Die Abbildung zeigt die Graphen einer
f (x) f differenzierbaren Funktion f sowie der
durch P(t) := f (x)+ f  (x)(t − x) erklärten
linearen Approximation.
Die durch die Abbildung P beschriebene
Gerade trifft den Graph von f an der Stelle
(x, f (x)) tangential.
x

Bevor wir einige Ableitungen berechnen, zeigen wir grundlegende Rechenregeln.

Satz 7.3. Seien f : I → IK und g : I → IK im Punkt x ∈ I differenzierbar und c ∈ IK.


Dann sind c f , f + g und f g in x differenzierbar. Ist g(x) = 0, so ist auch gf in x
differenzierbar. Dabei gelten:
• (c f ) (x) = c f  (x)
• ( f + g) (x) = f  (x) + g(x)
• ( f g) (x) = f  (x) g(x) + f (x) g (x) (Produktregel)

f g(x) f  (x) − g(x) f (x)
• (x) = (Quotientenregel)
g g(x)2
7.1 Differenzierbarkeit 99

Beweis. Die ersten beiden Aussagen folgen direkt aus den Rechenregeln für Grenz-
werte. Zur Produktregel betrachten wir

f (t) g(t) − f (x) g(x) g(t) − g(x) f (t) − f (x)


= f (t) + g(x) .
t −x t −x t −x
Grenzwertbildung t → x liefert nun ( f g) (x) = f  (x) g(x) + f (x) g (x).
Zu zeigen bleibt die Quotientenregel. Dazu sei h := gf . Wir haben dann

h(t) − h(x) 1 f (t) − f (x) g(t) − g(x)
= g(x) − f (x) .
t −x g(t)g(x) t −x t −x

Mit g(t) → g(x) für t → x erhalten wir im Grenzwert

g(x) f  (x) − f (x) g (x)


h (x) = .
g(x)2

Die Behauptungen zur Differenzierbarkeit sind mit der Bestimmung der Formeln
auch bewiesen. 

Beispiele:
ct − cx
(1) Sei f : IR → IK, f (x) := cx mit c ∈ IK, so gilt f  (x) = lim = c.
t→x t −x
(2) Seien n ∈ IN0 und f : IR → IR, f (x) := xn . Es gilt f  (x) = nxn−1 .
Beweis. Für n = 0 gilt die Aussage offensichtlich. Gilt sie für ein n, so
setze h : IR → IR, h(x) := xn+1 = x f (x). Mit Induktionsvoraussetzung und
Produktregel folgt h (x) = 1 · f (x) + x f  (x) = xn + xnxn−1 = (n + 1)xn. 

Damit sind auch alle Polynome differenzierbar und alle rationalen Funktionen sind
differenzierbar, außer an den Punkten, an welchen der Nenner = 0 ist. Die Ablei-
tungen bestimmt man gemäß Satz 7.3.
Insbesondere erhalten wir nun mit der Quotientenregel für f : IR \ {0} → IR,
n−1
f (x) := x1n , dass die Ableitung f  (x) = 0−nx
x2n
= x−n
n+1 ist. Also haben wir insgesamt

(xn ) = nxn−1 für alle n ∈ ZZ .

Es folgt eine weitere wichtige Regel, die wir oft nutzen werden. Sie betrifft die
Komposition von differenzierbaren Funktionen.
Satz 7.4 (Kettenregel). Seien I und J zwei Intervalle.
Wenn die Funktionen f : I → J im Punkt x ∈ I sowie g : J → IK in y = f (x) ∈ J
differenzierbar sind, so ist g ◦ f : I → IK in x differenzierbar und es gilt

(g ◦ f ) (x) = g (y) f  (x) .


100 7 Differentiation

Beweis. Da g in y differenzierbar ist, ist die Funktion G : J → IK,



⎨ g(s) − g(y) für s = y ,

G(s) := s−y


g (y) für s = y ,

stetig im Punkt y und es gilt g(s) − g(y) = (s − y) G(s).


Man erhält weiter, da f stetig in x ist,

g( f (t)) − g( f (x)) ( f (t) − f (x)) G( f (t))


lim = lim = f  (x) G( f (x)) = f  (x) g (y)
t→x t −x t→x t −x
wie behauptet. 

Weitere Beispiele:
(3) Sei f : IR → IK, f (x) := exp(cx), mit c ∈ IK. Aus der Funktionalgleichung
der Exponentialfunktion erhalten wir

exp(ct) − exp(cx) exp(c(x + h)) − exp(cx)


f  (x) = lim = lim
t→x t −x h→0 h
exp(ch) − 1 exp(ch) − 1
= exp(cx) lim = c exp(cx) lim = c exp(cx) .
h→0 h h→0 ch
(4) Ist f : I → C in x ∈ I differenzierbar, so sind Re f : I → IR und Im f : I → IR
in x differenzierbar und es gilt

(Re f ) (x) = Re f  (x) , (Im f ) (x) = Im f  (x) .

Dies folgt direkt aus f = Re f + i Im f und der Tatsache, dass eine Folge
komplexer Zahlen genau dann konvergent ist, wenn die Folgen der Real- und
der Imaginärteile beide konvergent sind.
Betrachten wir nun f : IR → C, f (t) := exp(it) = cost + i sint, so erhalten wir
aus (1) als Ableitung f  (t) = i exp(it) = i(cost + i sint) = − sint + i cost.
Somit haben wir

cos (t) = − sint und sin (t) = cost .

1 ln(t) − ln(x) 1
(5) Aus Lemma 6.13 erhalten wir ≤ ≤ für 0 < x < t.
t t −x x
Vertauscht man die Rollen von t und x, so ergibt sich

1 ln(t) − ln(x) 1
≤ ≤ für 0 < t < x .
x t −x t
Insgesamt erhalten wir daraus mit t → x die Ableitung des Logarithmus,
1
ln (x) = .
x
7.1 Differenzierbarkeit 101

(6) Die Funktion f : IR → IR,


 1
x sin x für x = 0 ,
f (x) :=
0 für x = 0 ,

ist auf ganz IR stetig, vgl. Kapitel 6.5, Aufgabe 4. Für x = 0 erhalten wir mit
Produkt- und Kettenregel

 1 1 1
f (x) = sin − cos .
x x x

Im Fall x = 0 sind beide Sätze nicht anwendbar. Wir betrachten



f (t) − f (0) 1
= sin .
t −0 t

Ein Grenzwert für t → 0 existiert nicht. Daher ist f in x = 0 nicht differen-


zierbar. Wir haben hier also ein Beispiel einer Funktion, die im Nullpunkt
stetig aber nicht differenzierbar ist.
(7) Die Funktion f : [0, [ → [0, [, f (x) := x2 , ist bijektiv und differenzierbar.

Ihre Umkehrabbildung f −1 : [0, [ → [0, [, f −1 (x) = x, ist im Nullpunkt
nicht differenzierbar, denn sonst müsste laut Kettenregel
 
1 = f −1 ◦ f (0) = f −1 ( f (0)) f  (0)

gelten, was wegen f  (0) = 0 nicht möglich ist.


Die Überlegung in Beispiel (7) kann man für jede bijektive differenzierbare Funk-
tion f durchführen. Sie belegt, dass für die Differenzierbarkeit von f −1 in y = f (x)
die Ableitung f  (x) notwendigerweise ungleich Null sein muss. In Kapitel 7.3 wer-
den wir sehen, dass diese Bedingung auch hinreichend für die Differenzierbarkeit
der Umkehrfunktion ist.

Wenn die Ableitung f  einer differenzierbaren Funktion selbst wieder differenzier-


bar ist, so bezeichnet man f  := ( f  ) als die zweite Ableitung von f . Entsprechend
erklärt man gegebenenfalls auch eine dritte Ableitung usw.
Statt f  , f  , . . . schreibt man auch f (2) , f (3) , . . .
Definition 7.5. Eine differenzierbare Funktion f : I → IK heißt stetig differenzier-
bar, wenn f  : I → IK stetig ist.
Falls die Ableitungen f (1) , . . . , f (n) existieren und stetig sind, so sagt man, f ist
n-mal stetig differenzierbar.
Man beachte, dass jede differenzierbare Funktion stetig ist; daher folgt aus der
Existenz von f (k) bereits die Stetigkeit von f (k−1) .
Den Raum der n-mal stetig differenzierbaren Funktionen f : I → IK bezeichnen
wir mit Cn (I). Weiter schreiben wir C (I) für den Raum der beliebig oft (stetig)
differenzierbaren Funktionen.
102 7 Differentiation

Beispielsweise sind die Exponentialfunktion, Sinus und Cosinus sowie auch alle
Polynomfunktionen beliebig oft stetig differenzierbar.

Wir wollen ein Beispiel einer differenzierbaren, aber nicht stetig differenzierbaren,
Funktion angeben. Die Funktion f : IR → IR,
 
x2 sin 1x für x = 0 ,
f (x) :=
0 für x = 0 ,

ist in allen Punkten x = 0 differenzierbar. Die Ableitung erhalten wir mittels


Produkt- und Kettenregel; dort gilt

 1 2 1 1 1 1
f (x) = 2x sin + x − 2 cos = 2x sin − cos .
x x x x x

Wir zeigen nun, dass f auch in x = 0 differenzierbar ist. Dazu betrachten wir

f (t) − f (0) 1
= t sin .
t −0 t

Da die Abbildung t → t sin 1t an der Stelle t = 0 stetig ist, erhalten wir mit dem
Folgenkriterium
f (t) − f (0) 1
lim = lim t sin =0,
t→0 t −0 t→0 t
also ist f im Nullpunkt differenzierbar mit f  (0) = 0.
Allerdings kann man (etwa wiederum mit dem Folgenkriterium) leicht sehen,
dass f  am Punkt x = 0 nicht stetig ist. Daher ist f  dort auch nicht differenzierbar,
eine zweite Ableitung existiert hier also nicht.

7.2 Mittelwertsatz und lokale Extrema

Definition 7.6. Sei f : X → IR eine Funktion auf einem metrischen Raum X. Man
sagt, dass f ein lokales Maximum (bzw. lokales Minimum) im Punkt p ∈ X
besitzt, wenn ein r > 0 existiert derart, dass f (x) ≤ f (p) für alle x ∈ Ur (p) gilt
(bzw. f (x) ≥ f (p) für alle x ∈ Ur (p) gilt).
Lokale Maxima oder Minima nennen wir lokale Extrema.

Satz 7.7. Sei f : [a, b] → IR eine Funktion, die im Punkt x ∈ ]a, b[ ein lokales Extre-
mum besitzt.
Wenn f  (x) existiert, dann gilt f  (x) = 0.

Beweis. Wir betrachten nur den Fall eines lokalen Maximums; die Aussage für das
Minimum beweist man ganz analog.
7.2 Mittelwertsatz und lokale Extrema 103

Sei r > 0 gemäß Definition 7.6. Ohne Einschränkung können wir annehmen, dass
Ur (x) = ]x − r, x + r[ ⊆ ]a, b[ gilt.
f (t) − f (x)
Für x − r < t < x gilt ≥ 0 und mit t → x folgt f  (x) ≥ 0.
t −x
f (t) − f (x)
Für x < t < x + r gilt ≤ 0 und mit t → x gilt nun f  (x) ≤ 0.
t −x
Es bleibt also nur f  (x) = 0. 

Die Umkehrung von Satz 7.7 gilt nicht. Beispielsweise hat die Funktion x → x3 an
der Stelle x = 0 kein lokales Extremum, obwohl ihre Ableitung dort den Wert 0 hat.
Man beachte auch, dass Satz 7.7 nur eine Aussage über Extrema im Inneren des
Intervalls, also in ]a, b[, ermöglicht und auch nur an Punkten, wo f differenzierbar
ist. So hat etwa die Funktion f : [−1, 1] → IR, f (x) := |x|, ein Minimum im Punkt
x = 0, ist dort aber nicht differenzierbar, und sie hat Maxima jeweils bei x = 1 und
bei x = −1.

Als eine erste Folgerung erhalten wir ein Resultat, welches nach Michel Rolle
(1652-1719, Paris) benannt ist.
Satz 7.8 (Rolle). Sei f : [a, b] → IR eine stetige Funktion mit f (a) = f (b), die auf
]a, b[ differenzierbar ist.
Dann gibt es ein x ∈ ]a, b[ mit f  (x) = 0.
Beweis. Ist f konstant, so ist nichts zu zeigen. Sei also f eine nicht-konstante
Funktion. Laut Satz 6.16 gibt es nun c, d ∈ [a, b] mit f (c) = max f ([a, b]) und
f (d) = min f ([a, b]).
Wegen f (a) = f (b) und da f nicht-konstant ist, muss mindestens einer der beiden
Punkte c oder d in ]a, b[ liegen, d.h. es gibt x ∈ ]a, b[ derart, dass f in x ein lokales
Extremum hat. Nach Satz 7.7 gilt f  (x) = 0. 

Man beachte, dass Differenzierbarkeit in den Randpunkten nicht erforderlich ist.
Nun können wir den so genannten Mittelwertsatz einfach herleiten. Wir formu-
lieren gleich eine leicht verallgemeinerte Version.
Satz 7.9. Seien f : [a, b] → IR und g : [a, b] → IR stetige Funktionen, die auf ]a, b[
differenzierbar sind. Dann gibt es ein x ∈ ]a, b[ mit

( f (b) − f (a)) g (x) = (g(b) − g(a)) f (x) .

Beweis. Die Funktion h : [a, b] → IR, h(x) := ( f (b)− f (a))g(x)−(g(b)−g(a)) f (x),


ist stetig, auf ]a, b[ differenzierbar, und es gilt

h(a) = f (b) g(a) − f (a) g(b) = h(b) .

Nach Satz 7.8 existiert ein x ∈ ]a, b[ mit h (x) = 0, woraus direkt die Behauptung
folgt. 

104 7 Differentiation

Der Sonderfall g(x) = x wird Mittelwertsatz (der Differentialrechnung) genannt:


Satz 7.10 (Mittelwertsatz). Ist f : [a, b] → IR eine stetige Funktion, die auf ]a, b[
differenzierbar ist, so gibt es ein x ∈ ]a, b[ mit

f (b) − f (a)
f  (x) = .
b−a
Eine physikalische Interpretation lautet wie folgt. Läuft man etwa 100 Meter in
10 Sekunden, so beträgt die Durchschnittsgeschwindigkeit 36 km/h. Laut dem
Mittelwertsatz gibt es dabei mindestens einen Zeitpunkt, an dem die Momentan-
geschwindigkeit (aufgefasst als Ableitung, also der Grenzwert der durchschnittli-

chen Geschwindigkeit, wenn die zurückgelegte Wegstrecke gegen 0 geht“) genau
36 km/h ist.
Aus dem Mittelwertsatz erhalten wir eine Reihe interessanter Ergebnisse zum
Verhalten von differenzierbaren Funktionen.
Korollar 7.11. Sei f : [a, b] → IR stetig und auf ]a, b[ differenzierbar. Dann gelten:
(i) Ist f  (x) ≥ 0 für alle x ∈ ]a, b[, so ist f monoton wachsend.
(ii) Ist f  (x) = 0 für alle x ∈ ]a, b[, so ist f konstant.
(iii) Ist f  (x) ≤ 0 für alle x ∈ ]a, b[, so ist f monoton fallend.
Beweis. Für alle drei Aussagen ziehen wir die Gleichung

f (x2 ) − f (x1 ) = f  (x) (x2 − x1 )

heran, die laut dem Mittelwertsatz für beliebige x1 , x2 ∈ [a, b], x1 < x2 , mit einem
geeigneten x ∈ ]x1 , x2 [ gilt.
Ist nun f  (x) ≥ 0 für alle x ∈ ]a, b[, so folgt f (x1 ) ≤ f (x2 ), d.h. f wächst monoton.
Entsprechend geht man auch für die anderen beiden Aussagen vor. 

Bemerkungen:
(1) In Korollar 7.11 gelten jeweils auch die Umgekehrten Implikationen. Ist etwa
f monoton wachsend, so gilt f (t)−t−x
f (x)
≥ 0 für alle x,t ∈ ]a, b[ und damit auch

f (x) ≥ 0, falls f in x differenzierbar ist.
(2) Gilt sogar f  (x) > 0 für alle x ∈ ]a, b[ (oder f  (x) < 0), so ist f streng monoton
wachsend (bzw. streng monoton fallend), wie sofort aus dem Nachweis von
Korollar 7.11 folgt.
Hier gilt die Umkehrung allerdings nicht! Die durch f (x) := x3 erklärte Funk-
tion ist zwar auf ganz IR streng monoton wachsend, aber ihre Ableitung nicht
überall positiv: Es gilt f  (0) = 0.
(3) Mit Korollar 7.11(ii) gilt auch folgendes. Seien f , g : [a, b] → IK stetig und
auf ]a, b[ differenzierbar mit f  (x) = g (x) für alle x ∈ ]a, b[. Dann existiert
eine Konstante c ∈ IK mit f (x) = g(x) + c für alle x ∈ [a, b]. Zum Nachweis
braucht man nur h := f − g zu betrachten.
7.2 Mittelwertsatz und lokale Extrema 105

Definition 7.12. Sei f : I → IK gegeben. Eine differenzierbare Funktion F : I → IK


heißt Stammfunktion von f , falls F  = f gilt.
Laut Bemerkung (3) ist F bis auf eine additive Konstante durch f eindeutig be-
stimmt.

Korollar 7.13. Seien  ∈ IK sowie f : [a, b] → IK stetig und in ]a, b[ differenzierbar


derart, dass f  (x) =  f (x) für alle x ∈ ]a, b[ ist.
Dann gilt
f (x) = c exp( x) für alle x ∈ [a, b] ,
wobei c ∈ IK eine Konstante ist.

Beweis. Setze g(x) := f (x) exp(− x). Für alle x ∈ ]a, b[ gilt damit

g (x) = f  (x) exp(− x) −  f (x) exp(− x) = 0 .

Folglich ist g eine Konstante, also gilt f (x) = c exp( x) mit einem c ∈ IK zunächst
für alle x ∈ ]a, b[ und wegen der Stetigkeit dann auch für alle x ∈ [a, b]. 

Die Exponentialfunktion ist also die einzige differenzierbare Funktion f : IR → IR,


die den Bedingungen
• f = f
• f (0) = 1
genügt.

Wir geben noch weitere Ergänzungen zum Mittelwertsatz an. Das nächste Resul-
tat ist benannt nach Jean Gaston Darboux (1842-1917, Paris).

Korollar 7.14 (Darboux). Seien f : [a, b] → IR differenzierbar und c ∈ ] f  (a), f  (b)[,


falls f  (a) < f  (b) gilt (bzw. c ∈ ] f  (b), f  (a)[, falls f  (b) < f  (a) gilt).
Dann existiert x0 ∈ ]a, b[ mit f  (x0 ) = c.

Beweis. Sei f  (a) < c < f  (b). Mit g(x) := f (x) − cx gilt g (a) < 0 und g (b) > 0.
Wegen
g(t) − g(a)
0 > g (a) = lim
t→a+ t −a
gibt es ein t1 ∈ ]a, b[ mit g(t1 ) < g(a). Ebenso folgt, dass ein t2 ∈ ]a, b[ existiert mit
g(t2 ) < g(b).
Laut Satz 6.16 nimmt g auf [a, b] sein Minimum an, und wegen der vorangehen-
den Überlegungen nimmt g dieses Minimum an einer Stelle in x0 ∈ ]a, b[ an. Mit
Satz 7.7 folgt g (x0 ) = 0. Daher gilt f  (x0 ) = c. 

Unter Verwendung des verallgemeinerten Mittelwertsatzes können einige Grenz-


werte recht einfach bestimmt werden. Wir leiten die so genannte L’Hospitalsche Re-
gel her (L’Hospital, Marquis de Sainte-Mesme, 1661-1704, Paris; die L’Hospitalsche
Regel stammt von Johann Bernoulli I, 1667-1748, Basel).
106 7 Differentiation

Satz 7.15. Seien f , g : ]a, b[ → IR differenzierbare Funktionen. Weiter sei g (x) = 0


für alle x ∈ ]a, b[ und es gelte lim f (x) = 0 = lim g(x).
x→b x→b
f  (x)
Dann ist g(x) = 0 für alle x ∈ ]a, b[. Wenn lim =:  existiert, so gilt
x→b g (x)

f  (x) f (x)
lim 
=  = lim .
x→b g (x) x→b g(x)

Eine entsprechende Aussage gilt für x → a.


Dies gilt auch im Fall eines uneigentlichen Grenzwertes  = ± und auch bei
a = − oder b = .

Beweis. Sei zunächst b ∈ IR. Nach Voraussetzung kann man f und g fortsetzen zu
stetigen Funktionen auf ]a, b] und es gilt f (b) = 0 = g(b). Zu c ∈ ]a, b[ gibt es nach
dem Mittelwertsatz ein x ∈ ]c, b[ mit g(c) = g(c) − g(b) = g (x) (c − b). Dann ist
auch g(c) = 0 für alle c ∈ ]a, b[.
Laut Satz 7.9 existiert zu jedem c ∈ ]a, b[ ein x = x(c) ∈ ]c, b[ mit

f (c) f (c) − f (b) f  (x)


= =  .
g(c) g(c) − g(b) g (x)

Mit c → b gilt auch x(c) → b und es folgt die Behauptung.


Die Aussage für x → a beweist man ganz analog (zunächst für a ∈ IR).
Nun betrachten wir den ' b = . Ohne Einschränkung
& Fall  & können
' wir a > 0 anneh-

men. Wir setzen  : 0, 1a → IR,  (t) := f 1t und  : 0, 1a → IR,  (t) := g 1t .
Die Funktion  ist differenzierbar mit

 −g 1t
 (t) = = 0
t2
& '
für alle t ∈ 0, 1a und es gilt lim  (t) = 0 = lim  (t). Schließlich haben wir
t→0 t→0

 1

  (t) t2 f t f  1t f  (x)
lim  = lim 2  1  = lim  1  = lim  =
t→0  (t) t→0 t g t→0 g x→ g (x)
t t

und mit dem bereits Bewiesenen folgt



 (t) f 1t f (x)
 = lim = lim 1  = lim
t→0  (t) t→0 g x→ g(x)
t

wie behauptet. 

Beispiele:
sin x cos x
(1) Es gilt lim = lim = 1.
x→0 x x→0 1
7.2 Mittelwertsatz und lokale Extrema 107

1 1 x − sinx
(2) Wir bestimmen lim − = lim .
x→0 sin x x x→0 x sin x
Mit f (x) := x − sin x und g(x) := x sin x sind die Voraussetzungen von
Satz 7.15 erfüllt; man beachte, dass g (x) = 0 in einem Intervall ]0, b[ mit
einem geeigneten b gilt. Wir erhalten
x − sin x 1 − cosx sin x
lim = lim = lim =0,
x→0 x sin x x→0 x cos x + sinx x→0 −x sin x + 2 cosx

wobei wir ein zweites Mal Satz 7.15 angewendet haben (nachdem wir uns
überzeugt haben, dass die Voraussetzungen wiederum erfüllt sind).
Eine zweite Regel von L’Hospital befasst sich mit dem Fall lim g(t) = ±.
t→b

Satz 7.16. Seien f , g : ]a, b[ → IR differenzierbare Funktionen. Weiter sei g (x) = 0


für alle x ∈ ]a, b[ und es gelte lim g(x) = .
x→b
f  (x)
Wenn lim  =:  existiert, so gilt
x→b g (x)

f  (x) f (x)
lim 
=  = lim .
x→b g (x) x→b g(x)

Eine entsprechende Aussage gilt für x → a.


Dies gilt auch im Fall eines uneigentlichen Grenzwertes  = ± und auch bei
a = − oder b = .

Beweis. Sei zunächst  ∈ IR. Zu  > 0 gibt es s ∈ ]a, b[ mit






f (x)


g (x) − 
<  und g(x) > 0 für alle x ∈ [s, b[ .

| f (s)| |g(s)|
Nun wähle t ∈ ]s, b[, sodass |g(x)| >  und |g(x)| >  für alle x ∈ [t, b[ gilt.
Für beliebiges x ∈ ]t, b[ gibt es laut Satz 7.9 ein  ∈ ]s, x[ mit

g ( ) ( f (x) − f (s)) = f  ( ) (g(x) − g(s)) .

Dies können wir umformen zu



f (x) f  ( ) g(s) f (s)
=  1− + .
g(x) g ( ) g(x) g(x)

Man erhält daraus










f (x)

f ( )

f ( ) g(s)

f (s)


g(x) − 

g ( ) − 
+
g ( ) g(x)
+
g(x)
<  + (| | +  )  +  .

f (x)
Damit gilt lim = .
x→b g(x)
108 7 Differentiation

(x) 
Nun sei  = . Zu M > 0 gibt es dann s ∈ ]a, b[ mit gf  (x) ≥ M und g(x) > 0 für alle
x ∈ [s, b[. Wähle t ∈ ]s, b[ mit g(x) > − f (s) und g(x) > 2g(s) für alle x ∈ [t, b[.
Für beliebiges x ∈ ]t, b[ erhält man wiederum mit Hilfe von Satz 7.9 ein  ∈ ]s, x[,
sodass
f (x) f  ( ) g(s) f (s) 1
=  1− + > M−1
g(x) g ( ) g(x) g(x) 2
f (x)
gilt. Damit folgt lim = . 

x→b g(x)
Beispiele:
1
ln x x
(1) Es gilt lim x ln x = lim = lim = 0.
x→0 x→0 1 x→0 − x12
x
(2) Dieses Beispiel soll zeigen, dass man bei den L’Hospitalschen Regeln auf
die Voraussetzung g (x) = 0 nicht verzichten kann. Es stammt von O. Stolz
(1842-1905, Innsbruck).
Seien f (x) := x + sin x cos x und g(x) := f (x) exp(sin x). Ein Grenzwert

f (x)
lim = lim exp(− sin x) existiert nicht!
x→ g(x) x→

Hingegen ist

f  (x) 2 cos2 x
lim 
= lim
x→ g (x) x→ cos x exp(sin x) (2 cos x + f (x))

2 cos x exp(− sin x)


= lim =0,
x→ f (x) + 2 cosx

da der Zähler beschränkt bleibt und f (x) →  mit x →  gilt.


Von den Voraussetzungen ist zwar lim g(x) =  erfüllt, aber g (x) = 0 ist
x→
nicht möglich, auch nicht nach eventueller Einschränkung des Definitionsbe-
reichs, wegen

g (x) = cos x exp(sin x) (2 cos x + f (x)) = 0 für alle x = + k , k ∈ ZZ .
2

7.3 Ableitung der Umkehrfunktion

Satz 7.17. Sei f : I → IR streng monoton und differenzierbar in x ∈ I mit f  (x) = 0.


Setze J := f (I).
−1  1
Dann ist f −1 : J → I in y = f (x) differenzierbar und es gilt f (y) =  .
f (x)
7.3 Ableitung der Umkehrfunktion 109

Beweis. Sei (sn )n∈IN eine Folge in J mit sn → y = f (x) und sn = y ∀n. Bezeichnet
tn := f −1 (sn ), so ist tn = x und es gilt tn → x, da f −1 laut Satz 6.10 stetig ist. Folglich
haben wir
f −1 (sn ) − f −1 (y) tn − x 1
lim = lim = 
n→ sn − y n→ f (tn ) − f (x) f (x)
wie behauptet. 

Grafisch erhält man die Umkehr-


abbildung durch Spiegelung an
der Winkelhalbierenden.
Die Steigung der Tangente an
den Graph von f −1 im Punkt
tn = f −1 (sn ) f −1 (y, f −1 (y)) ist gleich dem Kehr-
wert der Steigung der Tangente
an den Graph von f im Punkt
x = f −1 (y) (x, f (x)) = ( f −1(y), y).
y sn

Beispiele:
' &
(1) Die Funktion f : − 2 , 2 → [−1, 1], f (x) := sin x, ist differenzierbar mit
f  (x) = cos x.
& '
Wir wissen bereits, dass cos im Intervall − 2 , 2 positiv ist, also ist sin laut
Korollar 7.11
' dort & streng monoton wachsend. Man sieht unmittelbar, & dass f'
auch auf − 2 , 2 streng monoton
 wachsend
 ist, denn für alle x ∈ − 2 , 2
gilt schließlich −1 = f − 2 < f (x) < f 2 = 1.
' &
Die Umkehrfunktion f −1 : [−1, 1] → − 2 , 2 heißt Arcus-Sinus und wird
mit arcsin bezeichnet. Diese ist für alle y ∈ ] − 1, 1[ differenzierbar, und mit
y = sin x gilt
1 1 1 1
arcsin (y) = = = = .
cos x cos(arcsin y) 1 − y2
1 − sin2 (arcsin y)


2

−1
1
Die Abbildung zeigt den Graphen
' der
&
Funktion arcsin : [−1, 1] → − 2 , 2 .
− 2
110 7 Differentiation
  sin(x)
(2) Die Funktion tan : IR \ (2k + 1) 2 : k ∈ ZZ → IR, tan(x) := cos(x)
, ist diffe-
renzierbar mit
cos2 (x) + sin2 (x) 1
tan (x) = 2
= = 1 + tan2 (x) .
cos (x) cos2 (x)
& '
Insbesondere ist f : − 2 , 2 → IR, f (x) := tan(x), streng
& monoton
' wachsend
und mit lim tan(x) = , lim tan(x) = − folgt f − 2 , 2 = IR.
x→ 2 x→− 2
& '
Nach Satz 7.17 existiert eine Umkehrfunktion f −1 : IR → − 2 , 2 ; wir be-
zeichnen diese mit arctan. Für die Ableitung gilt
1
arctan (tan(x)) = .
tan (x)

Mit y = tan(x) erhalten wir schließlich

1 1 1
arctan (y) = = = .
tan (arctan(y)) 1 + (tan(arctan(y))2 1 + y2

7.4 Aufgaben

1. Ist die Funktion f : IR → IR,


 
x2 cos ln(x2 ) für x = 0 ,
f (x) :=
0 für x = 0 ,

differenzierbar ? Bestimmen Sie gegebenenfalls die Ableitung f  und untersu-


chen Sie diese ebenfalls auf Stetigkeit.

2. Zeigen Sie, dass die Funktion f : IR → IR, f (x) := |x|3 , zwei Mal differenzierbar
ist. Bestimmen Sie f  und f  . Zeigen Sie weiter, dass f  an der Stelle x = 0
nicht differenzierbar ist.

3. Seien I ⊆ IR ein Intervall und f : I → IR differenzierbar derart, dass f  be-


schränkt ist. Zeigen Sie, dass f Lipschitz-stetig ist.

4. Seien I ein offenes Intervall und f : I → IR eine zwei Mal differenzierbare Funk-
tion. Zeigen Sie:
a. Ist x0 ∈ I mit f  (x0 ) = 0 und f  (x0 ) < 0, so hat f in x0 ein lokales Maximum.
b. Ist x0 ∈ I mit f  (x0 ) = 0 und f  (x0 ) > 0, so hat f in x0 ein lokales Minimum.
Hinweis: Wenden Sie Korollar 7.11 zunächst auf f  an Stelle von f an.
7.4 Aufgaben 111

5. Seien I ein Intervall und f : I → IR eine monoton wachsende differenzierbare


Funktion.
Zeigen Sie, dass f genau dann streng monoton wachsend ist, wenn es kein
Intervall J ⊆ I positiver Länge gibt mit f  (x) = 0 ∀x ∈ J.

6. Bestimmen Sie alle lokalen Extrema von f : IR → IR, f (x) := x3 + ax2 + bx,
in Abhängigkeit von a, b ∈ IR und entscheiden Sie jeweils, ob es sich um ein
Maximum oder Minimum handelt.

7. Bestimmen Sie alle lokalen Extrema der Funktion f : IR → IR,



|x| ln(|x|) für x = 0 ,
f (x) :=
0 für x = 0 ,

und entscheiden Sie jeweils, ob es sich um ein Maximum oder Minimum han-
delt.

8. Bestimmen Sie die folgenden Grenzwerte.



1 1
a. lim −
x→0 x ln(x + 1)

ln(x) − x + 1
b. lim
x→1 (x − 1)2

ln(cos(ax))
c. lim (a, b ∈ IR, b = 0)
x→0 ln(cos(bx))

cos(x) − 1
d. lim exp
x→0 x2

9. Sei I ein Intervall. Eine Funktion f : I → IR heißt konvex, wenn

f ( x1 + (1 −  )x2) ≤  f (x1 ) + (1 −  ) f (x2)

für alle x1 , x2 ∈ I und für alle  ∈ [0, 1] gilt. Eine konvexe Funktion f heißt
streng konvex, wenn in obiger Ungleichung Gleichheit nur in den Trivialfällen
x1 = x2 oder  ∈ {0, 1} gilt.
a. Sei f : I → IR differenzierbar. Zeigen Sie: Die Funktion f ist genau dann
(streng) konvex, wenn f  (streng) monoton wachsend ist.
b. Sei nun f : I → IR zwei Mal differenzierbar. Zeigen Sie: Die Funktion f ist
genau dann konvex, wenn f  (x) ≥ 0 für alle x ∈ I ist.
c. Zeigen Sie weiter, dass für eine zwei Mal differenzierbare, streng konvexe
Funktion f nicht notwendigerweise f  (x) > 0 für alle x ∈ I folgt.
112 7 Differentiation
 
2x
10. Gegeben sei die Funktion f : IR → IR, f (x) := arcsin 1+x2
.

a. Bestimmen Sie alle lokalen Extrema von f und entscheiden Sie jeweils, ob
es sich um ein Maximum oder Minimum handelt.
b. Zeigen Sie: Für −1 < x < 1 gilt f (x) = 2 arctan(x). Gilt eine ähnliche Iden-
tität auch für |x| > 1 ?

11. Die Funktionen Sinus Hyperbolicus und Cosinus Hyperbolicus sind wie folgt
definiert:
1 x 
sinh : IR → IR , sinh(x) := e − e−x ,
2 cosh
1 x 
cosh : IR → IR , cosh(x) := e + e−x .
2

Zeigen Sie:
a. Für alle x, y ∈ IR gilt
sinh
sinh(x + y) = cosh(x) sinh(y) + sinh(x) cosh(y) ,
cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y) .
b. Für alle x ∈ IR gilt cosh2 (x) − sinh2 (x) = 1.
c. Die Funktionen sinh und cosh sind differenzierbar mit

sinh (x) = cosh(x) und cosh (x) = sinh(x) .

d. Die Funktion sinh besitzt eine differenzierbare Umkehrabbildung arsinh :


IR → IR mit
1
arsinh (x) = √ .
2
x +1
e. Die Einschränkung von cosh auf das Intervall [0, [ besitzt eine in ]0, [
differenzierbare Umkehrabbildung arcosh : [1, [ → [0, [ mit

1
arcosh (x) = √ .
2
x −1
f. Es gilt
  
arsinh(x) = ln x + x2 + 1 für alle x ∈ IR ,
  
arcosh(x) = ln x + x2 − 1 für alle x ∈ [1, [ .
Kapitel 8
Integration

Die Grundidee der Integration ist es, den Inhalt der Fläche, die zwischen Graph
einer Funktion f : [a, b] → IR und x-Achse innerhalb der Intervallgrenzen liegt, zu
berechnen. Für so genannte Treppenfunktionen bereitet uns dies keine Probleme.
Mittels eines Grenzübergangs werden wir das Integral auf allgemeinere Funktionen
erweitern. Die anschauliche Vorstellung als Flächeninhalt gilt zwar für reellwertige
Funktionen, wir werden dennoch auch C-wertige Funktionen zulassen.
Neben dem Regel-Integral, welches wir in diesem Kapitel einführen, existie-
ren einige weitere Arten von Integralen, wie etwa das Riemann-Integral oder das
Lebesgue-Integral.

8.1 Regelfunktionen

Definition 8.1. Eine Funktion f : [a, b] → IK heißt Treppenfunktion, wenn es


a0 , . . . , an ∈ [a, b] mit a = a0 < a1 < . . . < an = b und c1 , . . . , cn ∈ IK gibt, sodass

f (x) = ck für alle x ∈ ]ak−1 , ak [ (k = 1, . . . , n)

gilt. Für die Werte f (a0 ), . . . , f (an ) wird nichts weiter vorausgesetzt.
Wir nennen a = a0 < a1 < . . . < an = b eine Teilung (oder Partition) von [a, b]
und bezeichnen ( b n

a
f (x) dx :=  ck (ak − ak−1) ∈ IK
k=1

als das Integral von f .


Man beachte, dass an jeder Sprungstelle“ von f ein Teilungspunkt liegt, aber

nicht jeder Teilungspunkt eine Sprungstelle zu sein braucht. Als Feinheit der Tei-
lung bezeichnet man das Maximum max{ak −ak−1 : k = 1, . . . , n}. Ist a j−1 < a < a j
für ein j = 1, . . . , n, so heißt die Teilung a = a0 < . . . < a j−1 < a < a j < . . . < an = b
feiner als a = a0 < . . . < an = b.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 113


DOI 10.1007/978-3-642-28644-5_8, © Springer-Verlag Berlin Heidelberg 2012
114 8 Integration

Anschaulich liefert das Integral einer nicht-


negativen Treppenfunktion den Inhalt der
Fläche zwischen Graph und x-Achse.
Der Wert des Integrals ändert sich nicht
bei verschiedenen Teilungen, die durch Hin-
zufügen oder Fortnehmen von passenden
Punkten auseinander hervorgehen.
a = a0 a1 an = b

Mit T ([a, b]) bezeichnen wir die Menge aller Treppenfunktionen f : [a, b] → IK.. Mit
zwei Treppenfunktionen f und g ist auch deren Summe eine Treppenfunktion; durch
Verfeinerung einer Teilung zu f und einer Teilung zu g erhält man eine gemeinsame
Teilung zu f und g. Offensichtlich ist auch  f ∈ T ([a, b]), falls f ∈ T ([a, b]) und
 ∈ IK. Daher ist T ([a, b]) ein IK-Vektorraum.
Weiter ist der Raum der Treppenfunktionen ein Untervektorraum von B([a, b]),
dem Raum der beschränkten Funktionen [a, b] → IK. Dieser ist laut Satz 4.9 mit der
so genannten Supremumsnorm  ·  ein Banachraum.
Wir halten einige Eigenschaften des Integrals von Treppenfunktionen fest:
( b ( b ( b
(1) Für f , g ∈ T ([a, b]) gilt ( f (x) + g(x)) dx = f (x) dx + g(x) dx.
a a a
( b ( b
(2) Für f ∈ T ([a, b]) und  ∈ IK gilt  f (x) dx =  f (x) dx.
a a
(3) Sind f , g ∈ T ([a, b]) reellwertig und ist f (x) ≤ g(x) für alle x ∈ [a, b], so gilt
( b ( b
f (x) dx ≤ g(x) dx .
a a

( b
(b

(4) Für f ∈ T ([a, b]) gilt

f (x) dx

≤ | f (x)| dx ≤  f  (b − a).
a a

Beweis. Für (1) brauchen wir nur eine gemeinsame Teilung zu f und g zu wählen
und (2) folgt direkt aus der Definition. Zum  Nachweis von (3) sei zunächst f ∈
T ([a, b]) mit f (x) ≥ 0 ∀x ∈ [a, b]. Hier gilt ab f (x) dx ≥ 0 und der allgemeine Fall
folgt mit Hilfe von (1), wenn wir f − g betrachten.
Aus einer Teilung a = a0 < . . . < an = b zu f erhalten wir schließlich noch


n
n


 ck (xk − xk−1 )
≤  |ck | (xk − xk−1 ) ≤ max |ck | (b − a) ≤  f  (b − a) ,

k=1
k=1 k=1,...,n

womit auch (4) gezeigt ist. 



Wir merken noch an, dass der Wert des Integrals nicht von den Funktionswerten
f (a j ) an den Sprungstellen abhängt, die Norm  f  hingegen schon.

Bei der Erweiterung des Integrals auf größere Funktionsklassen als die der Treppen-
funktionen ist die Vorgehensweise nicht mehr ganz so offensichtlich. Der einfachste
8.1 Regelfunktionen 115

Weg ist der, den Cauchy (1823) gewählt hat. Er lässt sich kurz wie folgt beschrei-
ben: Man dehne das Integral, das eine lineare (1), (2) und stetige (4) Abbildung
T ([a, b]) → IK darstellt, aus auf den Abschluss (vgl. Kapitel 12) des Raumes der
Treppenfunktionen im Banachraum (B([a, b]),  · ).
Definition 8.2. Eine Funktion f : [a, b] → IK heißt Regelfunktion (oder integrier-
bar im Cauchyschen Sinn), wenn eine Folge ( fn )n∈IN in T ([a, b]) existiert, die im
Raum (B([a, b]),  · ) gegen f konvergiert (d.h. lim  fn − f  = 0).
n→
Man sagt dann, dass man f gleichmäßig durch Treppenfunktionen approximie-
ren kann. Den Raum der Regelfunktionen bezeichnen wir mit R([a, b]).
Wir haben R([a, b]) so gewählt, damit wir das Integral, das bisher für f ∈ T ([a, b])
erklärt ist, auch für f ∈ R([a, b]) einfach definieren können.
Seien f ∈ R([a, b]) eine Regelfunktion, und fn ∈ T ([a, b]) mit lim  fn − f  = 0.
n→
Dann heißt ( (
b b
f (x) dx := lim fn (x) dx
a n→ a

das Regel-Integral von f .


Wir müssen uns noch klar machen, dass dieser Grenzwert überhaupt existiert und
unabhängig von der gewählten Folge ( fn )n∈IN ist.
Laut den Eigenschaften (1) und (4) des Integrals für Treppenfunktionen gilt

( b ( b


fn (x) dx − fm (x) dx

≤  fn − fm  (b − a)

a a

≤ ( fn − f  +  f − fm  ) (b − a)
( b
und mit  fn − f  → 0 folgt, dass fn (x) dx eine Cauchyfolge in IK ist.
a n∈IN
Damit ist die Existenz des Grenzwertes gesichert.
Ist (gn )n∈IN eine weitere Folge in T ([a, b]) mit lim gn − f  = 0, so gilt
n→

( b ( b


f (x) dx − g (x) dx
≤  fn − gn  (b − a)

a n a
n

≤ ( fn − f  +  f − gn ) (b − a)
( b ( b
und es folgt lim gn (x) dx = lim fn (x) dx.
n→ a n→ a
Nun haben wir belegt, dass die Definition widerspruchsfrei ist.

Bemerkungen:
(1) Wir werden in Kürze eine Charakterisierung der Regelfunktionen geben, aus
der unmittelbar folgt, dass jede stetige Funktion f : [a, b] → IK eine Regel-
funktion ist. Also existiert für jede stetige Funktion das Regel-Integral.
116 8 Integration

(2) Wenn eine Folge ( fn )n∈IN von Regelfunktionen eine Cauchyfolge bezüglich
 ·  ist, dann konvergiert diese im Banachraum (B([a, b]),  ·  ) gegen eine
Funktion f , vgl. Satz 4.9. Man kann leicht einsehen, dass dann auch f wieder
durch Treppenfunktionen approximiert werden kann, also eine Regelfunktion
ist. Folglich ist (R([a, b]),  · ) ein Banachraum.
(3) Auf Konvergenz von Funktionsfolgen bezüglich  ·  (gleichmäßige Kon-
vergenz) werden wir in Kapitel 9 noch ausführlicher zu sprechen kommen.

Beispiel: Sei f : [0, 1] → IR, f (x) := x.


( 1
Wir zeigen, dass f ∈ R([0, 1]) gilt und berechnen f (x) dx.
0
Zu n ∈ IN betrachten wir fn : [0, 1] → IR mit fn (0) = 0 und
! !
k k−1 k
fn (x) := für x ∈ , (k = 1, . . . , n) .
n n n
& &
Für x ∈ k−1 k k k−1 1 1
n , n gilt damit | f n (x) − f (x)| < n − n = n , also  f n − f  ≤ n .
Somit ist f ∈ R([0, 1]) und
( 1 ( 1 n n
k 1 1 n(n + 1) 1
0
f (x) dx = lim
n→ 0
fn (x) dx = lim
n→
 n n = n→
lim 2  k = lim
n n→ 2n2
= .
2
k=1 k=1

Satz 8.3. Seien f , g ∈ R([a, b]) und  ∈ IK. Dann gelten:


( b ( b ( b
(1) ( f (x) + g(x)) dx = f (x) dx + g(x) dx.
a a a
( b ( b
(2)  f (x) dx =  f (x) dx.
a a
( b ( b
(3) Sind f , g reellwertig und f ≤ g, so gilt f (x) dx ≤ g(x) dx.
a a
(4) Auch | f | ist eine Regelfunktion und

( b
(b


f (x) dx

≤ | f (x)| dx ≤  f  (b − a) .

a a

Beweis. Die Behauptungen (1) und (2) folgen mit den Rechenregeln für Grenzwerte
direkt aus den entsprechenden Eigenschaften des Integrals für Treppenfunktionen.
Zum Nachweis von (3) genügt es wiederum zu zeigen, dass aus f ≥ 0 stets
b
a f (x) dx ≥ 0 folgt.
Sei also f ∈ R([a, b]) mit f (x) ≥ 0 für alle x ∈ [a, b]. Dann gibt es eine Folge
( fn )n∈IN von Treppenfunktionen mit  f − fn  → 0. Mit fn+ (x) := max{ fn (x), 0}
ist auch fn+ ∈ T ([a, b]) und es gilt  fn+ − f  → 0.
b + b
Nun ist a f n (x) dx ≥ 0 für alle n ∈ IN und damit auch a f (x) dx ≥ 0.
8.1 Regelfunktionen 117

Im Hinblick auf (4) halten wir fest, dass | | f (x)| − | fn (x)| | ≤ | f (x) − fn (x)| für alle
x ∈ [a, b] ist. Also gilt  | f | − | fn |  ≤  f − fn  .
Da mit fn ∈ T ([a, b]) auch | fn | ∈ T ([a, b]) ist, folgt | f | ∈ R([a, b]). Für die Trep-
penfunktionen fn wissen wir

( b
( b


f (x) dx
≤ | fn (x)| dx ≤  fn  (b − a)

n
a

a

und lim  f − fn  = 0. Mit


n→

(

(
( b ( b

b

b

lim

fn (x) dx

f (x) dx

, lim | fn (x)| dx = | f (x)| dx


n→ a a n→ a a

und lim  fn  =  f  folgen die Ungleichungen auch für f . 



n→

Bemerkung: Für f : [a, b] → C, f ∈ R([a, b]) gilt stets auch Re f , Im f ∈ R([a, b]).
Außerdem ist
( b ( b ( b ( b
Re f (x) dx = Re f (x) dx und Im f (x) dx = Im f (x) dx .
a a a a

Schreibweise: Seien I, X zwei Mengen und f : I → X eine Abbildung. Ist weiter


J ⊆ I, so bezeichnen wir mit f |J die Einschränkung von f auf J, d.h. f |J ist diejenige
Funktion J → X, die mit f auf J übereinstimmt.

Satz 8.4. Seien a < b < c reelle Zahlen und f : [a, c] → IK eine Abbildung.
Es gilt f ∈ R([a, c]) genau dann, wenn f |[a, b] ∈ R([a, b]) und f |[b, c] ∈ R([b, c])
ist. Gegebenenfalls ist dann
( c ( b ( c
f (x) dx = f (x) dx + f (x) dx .
a a b

Beweis. Man braucht nur f |[a, b] und f |[b, c] mit Treppenfunktionen zu approxi-
mieren und nehme diese Treppenfunktionen zur Approximation von f .
Umgekehrt liefert jede Approximation von f mit Treppenfunktionen, eventuell
nach Hinzunahme von b als weiteren Teilungspunkt, Approximationen von f |[a, b]
und f |[b, c]. 

Vereinbarungsgemäß setzt man


( b ( a ( a
f (x) dx := − f (x) dx für a > b und f (x) dx := 0 .
a b a

Satz 8.5. Sei f : [a, b] → IK eine Abbildung.


Es gilt f ∈ R([a, b]) genau dann, wenn für jedes x ∈ ]a, b[ sowohl der linksseitige
Grenzwert f (x−) als auch der rechtsseitige Grenzwert f (x+), für x = a der rechts-
seitige Grenzwert f (a+) und für x = b der linksseitige Grenzwert f (b−) existieren.
118 8 Integration

Beweis. Sei f ∈ R([a, b]). Zu x0 ∈ [a, b[ und  > 0 finden wir eine Treppenfunktion
g ∈ T ([a, b]) mit  f − g < 2 .
Dann existiert ein Intervall ]x0 , a j [, sodass g| ]x0 , a j [ konstant ist, wobei a j aus
einer Teilung von g ist. Für beliebige x, y ∈ ]x0 , a j [ gilt damit

| f (x) − f (y)| ≤ | f (x) − g(x)| + |g(y) − f (y)| <  .

Ist nun (xn )n∈IN eine gegen x0 konvergente Folge mit xn > x0 ∀n, so gibt es ein N ∈ IN
mit xn ∈ ]x0 , a j [ für alle n ≥ N. Mit obiger Abschätzung folgt, dass ( f (xn ))n∈IN eine
Cauchyfolge ist. Daher existiert der Grenzwert f (x0 +).
Analog argumentiert man für x0 ∈ ]a, b], um Existenz von f (x0 −) zu begründen.

Für die umgekehrte Beweisrichtung sei vorausgesetzt, dass f (x0 +) für x0 ∈ [a, b[
und f (x0 −) für x0 ∈ ]a, b] existieren. Wir nehmen an, dass f nicht durch Treppen-
funktionen approximiert werden kann.
Dann gibt es also ein  > 0, sodass  f − g ≥  für alle g ∈ T ([a, b]) gilt. Wir
konstruieren daraus induktiv eine Intervallschachtelung ([an , bn ])n∈IN0 mit

sup | f (x) − g(x)| ≥  für alle g ∈ T ([an , bn ]) .


x∈[an ,bn ]

Dazu beginnen wir mit [a0 , b0 ] := [a, b]. Sind [a0 , b0 ], [a1 , b1 ], . . . , [an , bn ] bereits er-
klärt, so setzen wir M := 12 (an + bn ). Dann müssen auch auf mindestens einer der
Hälften [an , M] oder [M, bn ] alle Treppenfunktionen einen  ·  -Abstand von f ha-
ben, der größer

oder gleich  ist. Wir können nun [an+1 , bn+1 ] entsprechend wählen.
Sei x0 = [an , bn ].
n∈IN0
Wir betrachten den Fall, dass x0 ∈ ]a, b[ ist (für die Fälle x0 = a oder x0 = b kann
man die Argumentation leicht anpassen). Da f (x0 +) und f (x0 −) existieren, gibt es
zu beliebigem  > 0 eine Zahl  > 0 mit

| f (x) − f (x0 +)| <  für alle x ∈ ]x0 , x0 +  [


und | f (x) − f (x0 −)| <  für alle x ∈ ]x0 −  , x0 [ .

Schließlich gibt es n ∈ IN mit [an , bn ] ⊆ ]x0 −  , x0 +  [. Definiert man die Treppen-


funktion g : [an , bn ] → IK durch

⎨ f (x0 −) für x ∈ [an , x0 [ ,

g(x) := f (x0 ) für x = x0 ,


f (x0 +) für x ∈ ]x0 , bn ] ,

so gilt sup | f (x) − g(x)| <  im Widerspruch zu oben.


x∈[an ,bn ]

Damit ist gezeigt, dass f ∈ R([a, b]) ist. 



8.2 Der Hauptsatz der Differential- und Integralrechnung 119

Korollar 8.6. Es gilt C([a, b]) ⊆ R([a, b]), d.h. jede stetige Funktion ist eine Regel-
funktion. Auch jede monotone Funktion ist Regelfunktion.

Beweis. Ist f ∈ C([a, b]), so gilt f (x+) = f (x) = f (x−) für jedes x ∈ ]a, b[ sowie
f (a+) = f (a) und f (b−) = f (b). Mit Satz 8.5 folgt f ∈ R([a, b]).
Ist f monoton, so benutze Satz 6.11. 

8.2 Der Hauptsatz der Differential- und Integralrechnung


( x
Satz 8.7. Sei f ∈ R([a, b]). Für x ∈ [a, b] setze F(x) := f (t) dt.
a
Dann ist F : [a, b] → IK gleichmäßig stetig. Ist f stetig in x0 ∈ [a, b], so ist F im
Punkt x0 differenzierbar, und es gilt

F  (x0 ) = f (x0 ) .

Beweis. Falls f die Nullfunktion ist, ist nichts zu zeigen. Andernfalls ist  f  > 0
und für a ≤ x < y ≤ b folgt mit Satz 8.3(4) sowie Satz 8.4

( y

|F(y) − F(x)| =

f (t) dt

≤  f  (y − x) .
x


Zu  > 0 wählt man  =  f  und sieht, dass F gleichmäßig stetig ist.
Sei nun f stetig in x0 . Zu beliebigem  > 0 gibt es  > 0 mit | f (t) − f (x0 )| < 
für alle t ∈ ]x0 −  , x0 +  [ ∩ [a, b]. Für solche t mit t = x0 gilt dann




F(t) − F(x0 )

1 (t 1
( t

− f (x0 )
=

f (s) ds − f (x0 ) ds


t − x0 t − x0 x0 t − x0 x0

(


1 t

( f (s) − f (x0 )) ds

<  .
t − x0 x0

Daraus folgt F  (x0 ) = f (x0 ). 


Der folgende Satz zeigt uns, wie die meisten Integrale zu lösen sind, nämlich über
Stammfunktionen, vgl. Definition 7.12. Man nennt diesen zusammen mit Satz 8.7
auch Hauptsatz der Differential- und Integralrechnung, da Differenzieren und
Integrieren in Beziehung gesetzt werden.

Satz 8.8. Ist f ∈ R([a, b]) und existiert eine differenzierbare Funktion F : [a, b] → IK
mit F  (x) = f (x) für alle x ∈ [a, b], so gilt
( b
f (x) dx = F(b) − F(a) .
a
120 8 Integration

1
Beweis. Sei m ∈ IN. Es gibt gm ∈ T ([a, b]) mit  f − gm  < m(b−a) und dazu eine
Teilung a = a0 < a1 < . . . < anm = b, sodass gm | ]ak−1 , ak [= ck für k = 1, . . . , nm .
Da F differenzierbar ist, gibt es laut dem Mittelwertsatz (Satz 7.10) nun Punkte
k ∈ ]ak−1 , ak [ mit F(ak ) − F(ak−1 ) = f (k ) (ak − ak−1). Damit haben wir


nm nm
nm


 f (k ) (ak − ak−1 ) −  ck (ak − ak−1)
≤  | f (k ) − ck | (ak − ak−1)

k=1 k=1

k=1
nm
1 1
< 
m(b − a) k=1
(ak − ak−1) =
m
nm nm
und andererseits  f (k ) (ak − ak−1) =  (F(ak ) − F(ak−1 )) = F(b) − F(a).
k=1 k=1
Daraus folgt


nm
1


(F(b) − F(a)) −  ck (ak − ak−1)
< .

k=1

m
Mit m →  erhalten wir schließlich die Behauptung, da
nm ( b ( b
lim
m→
 ck (ak − ak−1) = lim m→ a
gm (x)dx =
a
f (x)dx
k=1

(laut Definition des Integrals) ist. 


Bemerkung: Wenn eine solche Stammfunktion F existiert, so ist sie bis auf eine
additive Konstante eindeutig, siehe auch Bemerkung (3) zu Korollar 7.11.
Setzt man in Satz 8.8 sogar f ∈ C([a, b]) voraus, so folgt die Behauptung sofort aus
Satz 8.7, denn mit G(x) := ax f (t) dt gilt dann G (x) = f (x).
Damit haben wir F  (x) = G (x) für alle x ∈ [a, b] und folglich ist G − F eine
Konstante. Wegen G(a) = 0 hat diese Konstante nun den Wert −F(a). Somit gilt

G(x) = F(x) − F(a) und ab f (t) dt = G(b) = F(b) − F(a).

Mit Satz 8.8 hat man nun eine sehr praktische Methode, das Integral ab f (x) dx zu
berechnen, vorausgesetzt man kennt eine Stammfunktion von f . Satz 8.7 sagt uns
weiter, dass zumindest jedes stetige f eine Stammfunktion besitzt.
Wir wollen noch einige Beispiele von Funktionen f angeben, für die wir bereits
eine Stammfunktion F kennen.
xn+1
(1) f : IR → IR, f (x) := xn (n ∈ IN) , F(x) = .
n+1
xa+1
(2) f : ]0, [ → IR, f (x) := xa (a ∈ IR, a = −1) , F(x) = .
a+1
1
(3) f : ]0, [ → IR, f (x) := , F(x) = ln x.
x
8.3 Methoden zur Berechnung von Integralen 121

(4) f : IR → IR, f (x) := ex , F(x) = ex .


(5) f : IR → IR, f (x) := sin x , F(x) = − cosx.
(6) f : IR → IR, f (x) := cos x , F(x) = sin x.
1
(7) f : IR → IR, f (x) := , F(x) = arctan x.
1 + x2
Schreibweise: Oft schreibt man für die Stammfunktionen von f einfach das Symbol
(
f (x) dx .

Man nennt dies das unbestimmte Integral von f . Natürlich ist dieses auch nur bis
auf eine additive Konstante festgelegt.
Weiter schreibt man auch F(x)|x=b b
x=a oder F(x)|a an Stelle von F(b) − F(a).

8.3 Methoden zur Berechnung von Integralen

Satz 8.9 (Partielle Integration). Seien f , g ∈ R([a, b]), zu denen differenzierbare


Funktionen F und G existieren mit F  (x) = f (x) und G (x) = g(x) für alle x ∈ [a, b].
Dann gilt
( b ( b
F(x)g(x) dx = F(b)G(b) − F(a)G(a) − f (x)G(x) dx .
a a

Beweis. Durch H(x) := F(x)G(x) ist eine differenzierbare Funktion erklärt und die
Produktregel liefert H  (x) = f (x)G(x) + F(x)g(x). Man beachte weiter, dass H  eine
Regelfunktion ist (dies folgt etwa mit Satz 8.5). Mit Satz 8.8 erhalten wir nun
( b
F(b)G(b) − F(a)G(a) = H(b) − H(a) = H  (x) dx
a
( b ( b
= f (x)G(x) dx + F(x)g(x) dx
a a

wie behauptet. 

( b
Beispiel: Seien 0 < a < b. Wir berechnen das Integral ln x dx.
a

Dazu setzen wir F(x) = ln x und g(x) = 1. Dann gilt f (x) = 1x und als Stammfunk-
tion zu g wählen wir G(x) = x. Mittels partieller Integration erhalten wir
( b ( b
ln x dx = b ln b − a ln a − 1 dx = b ln b − b − (a ln a − a) .
a a
122 8 Integration

Damit haben wir auch gleich eine Stammfunktion des Logarithmus gefunden: Die
Funktion L : ]0, [ → IR, L(x) := x ln x − x, ist differenzierbar mit L (x) = ln x, oder,
als unbestimmtes Integral geschrieben,
(
ln x dx = x ln x − x .

Als weitere Anwendung der partiellen Integration leiten wir eine Rekursionsformel
zur Berechnung von
( (
cosn x dx und sinn x dx

her. (Hier steht wie üblich cosn x als Abkürzung für (cos x)n , entsprechend bei sin.)
Mit F(x) = cosn−1 x und G(x) = sin x in Satz 8.9 erhalten wir
( (
cosn x dx = cosn−1 x sin x + (n − 1) cosn−2 x sin2 x dx
(
= cosn−1 x sin x + (n − 1) cosn−2 x (1 − cos2 x) dx
( (
und daraus n cosn x dx = cosn−1 x sin x + (n − 1) cosn−2 x dx.
( (
Analog zeigt man auch n sinn x dx = − sinn−1 x cos x+ (n − 1) sinn−2 x dx.
  /2
Mit den Grenzen a = 0 und b = 2 ergibt sich nun für die durch cn := 0 cosn dx
erklärte Folge (cn )n∈IN die folgende Rekursionsformel:
(  /2 (  /2
2n c2n = 2n cos2n x dx = (2n − 1) cos2n−2 x dx = (2n − 1)c2n−2 .
0 0

Also haben wir


(  /2
2n − 1 2n − 1 2n − 3 1 2n − 1 2n − 3 1 
c2n = c2n−2 = ··· 1 dx = ··· .
2n 2n 2n − 2 2 0 2n 2n − 2 2 2
Ebenso gilt auch (2n + 1)c2n+1 = 2n c2n−1 und folglich
(  /2
2n 2n − 2 2 2n 2n − 2 2
c2n+1 = ··· cos x dx = ··· .
2n + 1 2n − 1 3 0 2n + 1 2n − 1 3
Dies wollen wir nun noch benutzen, um das Wallissche Produkt zu berechnen. In
Beispiel 3.9 haben wir die Folge (pn )n∈IN mit
n
2k
pn = 
k=1 2k −1
pn √
untersucht. Wir zeigen noch, dass lim √ =  gilt.
n→ n
8.3 Methoden zur Berechnung von Integralen 123
' &
Zunächst erhalten wir aus cos2n x ≥ cos2n+1 x ≥ cos2n+2 x für x ∈ 0, 2 , dass
(cn )n∈IN monoton fallend ist, und weiter

c2n+1 c2n+2 2n + 1
1≥ ≥ = →1 mit n →  ,
c2n c2n 2n + 2
c2n+1
also gilt lim = 1.
n→ c2n
Andererseits folgt aus den Gleichungen (3.1) und (3.2), dass

p2n 2
lim =
n→ 2n + 1 2
√ p2n  c2n+1
mit einer Zahl 2 ≤  ≤ 2 ist. Wegen = ergibt sich  2 =  , also
2n + 1 2 c2n

1 n
2k √
lim √
n→ n  2k − 1 = .
k=1

Der nächste Satz liefert uns noch ein weiteres nützliches Hilfsmittel zu Berechnung
von Integralen.
Satz 8.10 (Substitutionsregel). Seien f : [A, B] → IK stetig und  : [a, b] → [A, B]
stetig differenzierbar.
Dann gilt
( b (  (b)
f ( (y))   (y) dy = f (x) dx .
a  (a)

Beweis. Die stetige Funktion f besitzt laut Satz 8.7 eine Stammfunktion F. Nun ist
F ◦  differenzierbar; die Kettenregel (Satz 7.4) liefert (F ◦  ) (y) = f ( (y))   (y).
Nach Voraussetzung ist   stetig. Damit ist y → f ( (y))   (y) insbesondere eine
Regelfunktion und mit Satz 8.8 ergibt sich
( b (  (b)
f ( (y))   (y) dy = F( (b)) − F( (a)) = f (x) dx
a  (a)

wie behauptet. 

Beispiele:
(1) Die Funktion  : IR → IR, ' (y)& := sin(y), ist stetig differenzierbar mit
  (y) = cos(y) und es gilt  0, 2 = [0, 1]. Damit ist
( 1 (  ( /2)  (  /2 
1 − x2 dx = 1 − x2 dx = 1 − sin2 y cosy dy
0  (0) 0
(  /2

= cos2 y dy = c2 = .
0 4
124 8 Integration
( 2 √ 
(2) Das Integral sin x dx.
0
Wir setzen  : IR → IR,  (y) := y2 . Die Abbildung  ist stetig differenzierbar
und bildet das Intervall [0,  ] auf [0,  2 ] ab. Weiter gilt   (y) = 2y und damit
( 2 √  (  ( ) √  (   
sin x dx = sin x dx = sin  (y)   (y) dy
0  (0) 0
( 
= 2y sin y dy .
0

Mit Hilfe partieller Integration erhalten wir schließlich


( 
 ( 

2y sin y dy = 2y(− cosy)


− 2(− cosy) dy
0 0 0

= −2 cos  + 0 cos 0 + 2 sin  − 2 sin 0 = 2 .

8.4 Uneigentliche Integrale

Definition 8.11. Eine Funktion f : ] ,  [ → IR, die auf jedem Intervall [a, b] ⊆ ] ,  [
integrierbar ist, heißt uneigentlich integrierbar, wenn für ein (und damit für jedes)
c ∈ ] ,  [ die Grenzwerte
( c ( b
lim f (x) dx und lim f (x) dx
a↓ a b↑ c

existieren. Man nennt dann


(  ( c ( b
f (x) dx := lim f (x) dx + lim f (x) dx
 a↓ a b↑ c

das uneigentliche Integral von f über ] ,  [.


Diese Definition gilt sinngemäß auch in den Fällen  = − und  = .
Ist f auch auf dem abgeschlossenen Intervall [ ,  ] integrierbar, so stimmt das un-
eigentliche Integral natürlich mit dem gewöhnlichen Integral überein. Dies folgt
direkt mit Satz 8.7.

Beispiele:
( 
1
(1) Das Integral 2
dx.
− 1 + x
1
Eine Stammfunktion zu x → 1+x2
kennen wir bereits. Es gilt
( 0 ( b
1 1
lim dx+ lim dx = lim (− arctan a)+ lim arctan b =  .
a→− a 1 + x2 b→ 0 1 + x2 a→− b→
8.5 Aufgaben 125
( 0
(2) Das Integral ex dx.
−
Hier genügt es, den Grenzwert für a → − zu betrachten, denn die Exponen-
tialfunktion ist auf jedem Intervall [a, 0] stetig und damit dort auch integrier-
bar. Wir erhalten
( 0 ( 0
ex dx = lim ex dx = lim (e0 − ea ) = 1 .
− a→− a a→−

( 1
1
(3) Das Integral dx (s > 0).
0 xs
Für a ∈]0, 1[ gilt

1
( 1
1
( 1 ⎨ −s+1
1
x−s+1
a , falls s = 1 ,
−s
dx = x dx =
1
xs ⎩
a a
ln(x)
a , falls s = 1 .

Im Fall s = 1 existiert das Integral nicht, denn es ist lim ln(a) = −.
a↓0
Im Fall s > 1 ist lim a−s+1 = , also existiert das Integral hier ebenfalls nicht.
a↓0

Gilt 0 < s < 1, so ist −s + 1 > 0 und wir haben lim a−s+1 = 0, also
a↓0

( 1 ( 1
1 1 1 −s+1  1
dx = lim dx = lim 1 − a−s+1 = .
0 xs a↓0 a xs a↓0 −s + 1 1−s

8.5 Aufgaben

1. Berechnen Sie die folgenden Integrale.


(  /4 ( 4 2 ( 3
x − 3x + 4 x2
a. cos(3x −  ) dx b. √ dx c. √ dx
0 1 x 0 1 + x2
( 2 ( 1 ( 1
x
d. ln x dx e. x ex dx f. dx
1 0 0 x+1

2. a. Sei g : [a, b] → IR differenzierbar mit g(x) = 0 ∀x ∈ [a, b]. Zeigen Sie: Es


gilt

( b 
g(b)

g (x)
dx = ln


.
a g(x) g(a)

(  /2
cosx − sin x
b. Berechnen Sie dx.
0 cosx + sin x
2x
c. Bestimmen Sie eine Stammfunktion von f : IR → IR, f (x) := x2 +1
.
126 8 Integration
( 2

2 für m = n ,
3. Seien m, n ∈ ZZ. Zeigen Sie: Es gilt einx e−imx dx =
0 0 für m = n .
( 
1 1
4. Zeigen Sie: Für s > 1 gilt dx = .
1 xs 1−s

5. Begründen Sie, warum der Grenzwert


( a
lim sin x dx
a→ −a

existiert, nicht aber das uneigentliche Integral


( 
sin x dx .
−

6. Prüfen Sie, ob die folgenden uneigentlichen Integrale existieren und berechnen


Sie gegebenenfalls deren Wert.
( 1 ( 1 ( 
1
a. √ dx b. ln x dx c. ln x dx
−1 1 − x2 0 0

7. a. Zeigen Sie, dass (R([a, b]),  · ) ein Banachraum ist.


b. Sei nun ( fn )n∈IN eine Folge, die in (R([a, b]),  · ) gegen f konvergiert.
Zeigen Sie: Es gilt
( b ( b
lim fn (x) dx = f (x) dx .
n→ a a

c. Konstruieren Sie eine Folge ( fn )n∈IN in R([0, 1]), welche punktweise gegen
f ∈ R([0, 1]) konvergiert, d.h. lim fn (x) = f (x) ∀x ∈ [0, 1], aber dass
n→
( 1 ( 1
lim fn (x) dx = f (x) dx
n→ 0 0

gilt.

8. Zeigen Sie, dass



1 für x ∈ Q ,
f : [0, 1] → IR , f (x) :=
/ Q,
0 für x ∈

keine Regelfunktion ist.


8.5 Aufgaben 127

9. Zeigen Sie: Ist f : [a, b] → C eine stetige Funktion mit


( b
| f (x)| dx = 0 ,
a

so gilt f (x) = 0 für alle x ∈ [a, b].

10. Die so genannte Gammafunktion wird wie folgt erklärt:


( 
 : ]0, [ → IR ,  (x) := t x−1 e−t dt .
0

a. Zeigen Sie, dass dieses uneigentliche Integral existiert.


Hinweis: Für 0 ≤ t < 1 gilt t x−1 e−t ≤ t x−1 . Weiter existiert eine positive
Zahl c mit t x−1 ≤ c e−t/2 für t ≥ 1.
b. Zeigen Sie
 (x + 1) = x  (x) für alle x ∈ ]0, [ .
c. Folgern Sie
 (n + 1) = n! für alle n ∈ IN .
Kapitel 9
Funktionenfolgen und gleichmäßige Konvergenz

Wir wollen eine Problemstellung bezüglich Folgen von Funktionen zunächst an


Hand von einigen Beispielen erörtern.
sin(nx)
(1) Für n ∈ IN sei fn : IR → IR, fn (x) := √ .
n
Offensichtlich existiert eine Grenzfunktion f (x) := lim fn (x) = 0.
n→

Weiter ist auch jedes fn differenzierbar mit fn (x) = n cos(nx). Andererseits
gilt f  (x) = 0. Somit konvergiert fn keinesfalls gegen f  .
(2) Sei fn : [0, 1] → IR, fn (x) := n2 x(1 − x2 )n . Hier haben wir fn (0) = 0 = fn (1)
für alle n ∈ IN und für x ∈ ]0, 1[ gilt lim fn (x) = 0. Hingegen gilt
n→

( 1 ( 1
1
1 1 yn+1

1
x(1 − x2)n dx = yn dy = =
0 2 0 2 n + 1
0 2n + 2
( 1
1
und folglich fn (x) dx = n2 → .
0 ( 1 2n + 2 ( 1
Somit konvergiert fn (x) dx nicht gegen lim fn (x) dx = 0.
0 0 n→

(3) Setzt man gn (x) := nx(1 − x2)n , so gilt


( 1 ( 1
1
lim gn (x) dx = = lim gn (x) dx = 0 .
n→ 0 2 0 n→

(4) Für n ∈ IN sei


k
1 , falls x = für ein k ∈ ZZ ,
fn (x) := n!
0 , sonst.

Damit ist fn | [0, 1] laut Definition 8.1 eine Treppenfunktion und folglich auch
integrierbar.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 129


DOI 10.1007/978-3-642-28644-5_9, © Springer-Verlag Berlin Heidelberg 2012
130 9 Funktionenfolgen und gleichmäßige Konvergenz

Als Grenzfunktion f (x) := lim fn (x) ergibt sich


n→

1 , falls x ∈ Q ,
f (x) =
0 , falls x ∈ IR \ Q ,

denn für x ∈ IR \ Q gilt fn (x) = 0 für alle n ∈ IN; ist x ∈ Q, etwa x = qp mit
p ∈ ZZ, q ∈ IN, so haben wir für n ≥ q auch n! x ∈ ZZ, also fn (x) = 1 ∀n ≥ q.
Damit ist f | [0, 1] ∈
/ R([0, 1]).
An diesen Beispielen sehen wir, dass bei (punktweiser) Konvergenz von Folgen
( fn (x))n∈IN die Differentiation oder Integration mit der Limesbildung nicht ver-
tauscht werden dürfen. Das letzte Beispiel zeigt sogar, dass für die Grenzfunktion
das Integral gar nicht gebildet werden kann. Mit anderen Worten: R([a, b]) ist nicht
abgeschlossen unter punktweiser Konvergenz.

9.1 Gleichmäßige Konvergenz

Wir kennen inzwischen einen Konvergenzbegriff für beschränkte Funktionen. Ist M


eine Menge, so ist der Raum (B(M),  ·  ) der beschränkten Funktionen mit der
durch  f  = sup | f (x)| erklärten Norm ein Banachraum und es gilt
x∈M

·
fn −→ f ⇐⇒ sup | fn (x) − f (x)| → 0 ,
x∈M

vgl. auch Satz 4.9. Störend ist hierbei noch, dass wir prinzipiell nur beschränkte
Funktionen betrachten können.
Definition 9.1. Sei M eine Menge. Eine Folge ( fn )n∈IN von Funktionen fn : M → IK
heißt gleichmäßig konvergent gegen f : M → IK, falls gilt:
Zu jedem  > 0 existiert ein N ∈ IN mit

| fn (x) − f (x)| <  für alle n ≥ N und alle x ∈ M .

Letzteres ist äquivalent zu sup | fn (x) − f (x)| → 0 mit n → .


x∈M
Wir schreiben: fn → f gleichmäßig auf M.
Sind f und alle fn beschränkt, so gilt fn → f gleichmäßig auf M genau dann, wenn
fn → f bezüglich  ·  gilt.

Der folgende Satz behandelt gleichmäßige Konvergenz und Stetigkeit.


Satz 9.2. Seien (M, d) ein metrischer Raum und ( fn )n∈IN eine Folge von Funktionen
fn : M → IK, die gleichmäßig auf M gegen f : M → IK konvergiert.
Sind alle fn in einem Punkt a ∈ M stetig, so ist auch f stetig in a.
9.1 Gleichmäßige Konvergenz 131

Beweis. Sei  > 0. Auf Grund der gleichmäßigen Konvergenz gibt es ein N ∈ IN
mit | fn (x) − f (x)| < 3 für alle x ∈ M und alle n ≥ N.
Wegen der Stetigkeit von fN in a gibt es  > 0 derart, dass | fN (x) − fN (a)| < 3
für alle x ∈ M mit d(x, a) <  gilt. Die Grenzfunktion f erfüllt dann

| f (x) − f (a)| ≤ | f (x) − fN (x)| + | fN (x) − fN (a)| + | fN (a) − f (a)| < 

für alle x ∈ M mit d(x, a) <  . Folglich ist f stetig in a. 


Bemerkung: Es muss nicht notwendigerweise gleichmäßige Konvergenz vorliegen,


damit eine punktweise Grenzfunktion stetiger Funktionen stetig ist. Die Folge von
Beispiel (2) konvergiert gegen die stetige Nullfunktion.
 Sie konvergiert aber nicht

1 n 1
n
gleichmäßig, denn wegen 1 − n → exp(−1) gilt fn √n = n 3/2 1 − 1n → .
Demnach haben wir hier sogar  fn − 0 → .

Der Raum C([a, b]) der stetigen Funktionen f : [a, b] → IK ist ein Untervektor-
raum des normierten Raumes (B([a, b]),  ·  ), da jede auf [a, b] stetige IK-wertige
Funktion beschränkt ist, vgl. Satz 6.16.

Korollar 9.3. Der Raum (C([a, b]),  · ) ist ein Banachraum.

Beweis. Zu zeigen bleibt nur die Vollständigkeit.


Sei ( fn )n∈IN eine Cauchyfolge bezüglich  ·  in C([a, b]). Dann ist diese auch
Cauchyfolge in B([a, b]) und konvergiert, da (B([a, b]),  ·  ) ein Banachraum ist
(siehe Satz 4.9), gegen eine Funktion f ∈ B([a, b]).
Weiter folgt nun mit Satz 9.2, dass f ∈ C([a, b]) ist. Also ist (C([a, b]),  · ) ein
Banachraum wie behauptet. 

Das nächste Resultat behandelt gleichmäßige Konvergenz und Integration.

Satz 9.4. Sei ( fn )n∈IN eine Folge in R([a, b]), die gleichmäßig gegen eine Funktion
f : [a, b] → IK konvergiert.
Dann ist f ∈ R([a, b]) und es gilt
( b ( b
f (x) dx = lim fn (x) dx .
a n→ a
( b

Insbesondere ist auch die Folge fn (x) dx konvergent.
a n∈IN

Beweis. Zu  > 0 gibt es nach Definition der Regelfunktionen für jedes n ∈ IN eine
Treppenfunktion gn : [a, b] → IK mit gn − fn  < 2 .
Nach Voraussetzung gibt es ein N ∈ IN mit  fn − f  < 2 für alle n ≥ N. Damit
haben wir
gn − f  ≤ gn − fn  +  fn − f  < 
für alle n ≥ N.
132 9 Funktionenfolgen und gleichmäßige Konvergenz

Folglich gilt gn → f bezüglich der  ·  -Norm, also gleichmäßig auf [a, b]. Mit
anderen Worten: Die Funktion f ist durch Treppenfunktionen approximierbar und
somit eine Regelfunktion. Für das Integral gilt mit Satz 8.3 (4) nun

( b ( b

( b


f (x) dx − fn (x) dx
=
( f (x) − fn (x)) dx

≤  f − fn  (b − a)


a a a

und mit n →  folgt die Behauptung. 


Die Aussage von Satz 9.4 beinhaltet auch, dass (R([a, b]),  ·  ) ein Banachraum
ist, vgl. auch Bemerkung (2) zu Definition 8.2. Wir notieren noch eine unmittelbare
Folgerung.

Korollar 9.5. Sei ( fn )n∈IN eine Folge in R([a, b]) derart, dass die Reihe

f (x) =  fn (x)
n=1

N N→
gleichmäßig auf [a, b] konvergiert, d.h.  fn (x) −→ f (x) gleichmäßig auf [a, b].
n=1
( b  ( b
Dann ist f ∈ R([a, b]) und es gilt
a
f (x) dx =  a
fn (x) dx.
n=1

Nun wenden wir uns den Beziehungen zwischen gleichmäßiger Konvergenz und
Differentiation zu. An Hand von Beispiel (1) sehen wir, dass gleichmäßige Konver-
genz es nicht immer ermöglicht, Differentiation und Grenzwert zu vertauschen.

Satz 9.6. Sei ( fn )n∈IN eine Folge stetig differenzierbarer Funktionen fn : [a, b] → IK,
die punktweise gegen eine Funktion f : [a, b] → IK konvergiert. Weiter konvergiere
die Folge ( fn )n∈IN der Ableitungen gleichmäßig auf [a, b].
Dann ist f differenzierbar und es gilt

f  (x) = lim fn (x) für alle x ∈ [a, b] .


n→

Beweis. Setze g(x) := lim fn (x). Nach Satz 9.2 ist g : [a, b] → IK stetig.
n→
Laut dem Hauptsatz der Differential- und Integralrechnung gilt
( x
fn (x) = fn (a) + fn (t) dt für alle x ∈ [a, b] und alle n ∈ IN .
a
( x ( x ( x
n→
Satz 9.4 liefert fn (t) dt −→ g(t) dt; damit ist f (x) = f (a) + g(t) dt.
a a a

Durch Differentiation erhalten wir schließlich f  (x) = g(x). 



9.2 Differentiation und Integration von Potenzreihen 133

9.2 Differentiation und Integration von Potenzreihen

In Kapitel 5.4 haben wir Potenzreihen eingeführt und untersucht; in Korollar 6.6
haben wir die Stetigkeit einer Potenzreihe im Inneren des Konvergenzkreises herge-
leitet, und zwar mittels eines Satzes über Majoranten (Satz 6.5). Zur Differentiation
von Potenzreihen benötigen wir ein Resultat zur gleichmäßigen Konvergenz, um
Satz 9.6 anwenden zu können.
Satz 9.7. Seien M eine Menge und fk : M → IK beschränkte Funktionen (k ∈ IN) mit

 fk M := sup | fk (x)|. Weiter gelte   fk M < .
x∈M k=1

Dann konvergiert die Reihe  fk absolut und gleichmäßig auf M gegen eine
k=1

beschränkte Funktion f : M → IK mit  f M ≤   fk M .
k=1

Beweis. Wie im Beweis von Satz 6.5 gilt, dass f (x) :=  fk (x) wohldefiniert ist;
k=1
die Reihe konvergiert absolut in jedem x ∈ M mit
 
| f (x)| ≤  | fk (x)| ≤   fk M .
k=1 k=1


Also ist  f M ≤   fk M . Zu zeigen bleibt die gleichmäßige Konvergenz.
k=1
n
Dazu betrachten wir die Partialsummen sn (x) :=  fk (x).
k=1

Zu  > 0 existiert N ∈ IN, sodass   fk M <  für alle n ≥ N gilt.
k=n+1
Für alle x ∈ M und n ≥ N ist dann



 

|sn (x) − f (x)| =


 fk (x)
≤  | fk (x)| ≤   fk M <  .

k=n+1
k=n+1 k=n+1

Daher konvergiert (sn )n∈IN gleichmäßig gegen f . 




1
Anwendung: Durch f (x) :=  n2 + x2 ist eine stetige Funktion f : IR → IR erklärt.
n=1
1 1
Beweis. Für n ∈ IN betrachte fn : IR → IR, fn (x) := n2 +x2
. Es gilt sup | fn (x)| = n2
.
x∈IR
 
1
Da  n2
konvergent ist, folgt mit Satz 9.7 gleichmäßige Konvergenz von  fn (x).
n=1 n=1
Weiter ist jedes fn stetig; mit Satz 9.2 folgt jetzt die Stetigkeit von f . 

Wir wollen nun den vorangehenden Satz in Zusammenhang mit Potenzreihen
stellen. Für z0 ∈ C und  ≥ 0 bezeichne wie üblich K (z0 ) = {z ∈ C : |z − z0 | ≤  }
die abgeschlossene Kreisscheibe mit Mittelpunkt z0 und Radius  .
134 9 Funktionenfolgen und gleichmäßige Konvergenz

Satz 9.8. Sei  ck zk eine Potenzreihe mit Konvergenzradius R > 0.
k=0
Weiter sei 0 <  < R. Dann konvergiert die Potenzreihe absolut und gleichmäßig
auf K (0).

Die Reihe  k ck zk−1 konvergiert ebenfalls absolut und gleichmäßig auf K (0).
k=1

Insbesondere ist die Funktion f : ] − R, R[ → IK, f (x) :=  ck xk , differenzierbar mit
k=0


f  (x) =  k ck xk−1 .
k=1

Mehr noch, f ist beliebig oft differenzierbar mit



f (n) (x) =  k(k − 1) · · · (k − n + 1) ck xk−n .
k=n

Beweis. Betrachte fk (z) := ck zk . Für |z| ≤  gilt | fk (z)| ≤ |ck  k |. Damit erhalten
wir  fk K (0) ≤ |ck  k |. Wegen  < R ist die Reihe

 ck  k
k=0

absolut konvergent, siehe Satz 5.19.



Mit Satz 9.7 folgt die gleichmäßige Konvergenz von  ck zk auf K (0).
k=0
√  
Aus k
k → 1 folgt lim sup k k|ck | = lim sup k |ck | = R1 . Die Reihe
k→ k→


 k ck zk−1
k=1

hat also ebenfalls den Konvergenzradius R. Mit der gleichen Argumentation wie
eben erhält man, dass auch diese gleichmäßig auf K (0) konvergiert.
Für die Aussagen zu den Ableitungen wählen wir zu x ∈ ]− R, R[ eine Zahl  > 0
mit |x| <  < R. Fasst man die Partialsummen
n
sn (x) :=  ck xk
k=0

als Funktionen sn : [− ,  ] → IK auf, so erhält man die Behauptung zu f  nun mit
Satz 9.6. Durch Wiederholung dieser Beweisführung folgt schließlich auch die all-
gemeine Behauptung. 

9.2 Differentiation und Integration von Potenzreihen 135

Bemerkung: Eine Potenzreihe mit Konvergenzradius R konvergiert zwar gleich-


mäßig auf jeder abgeschlossenen Kreisscheibe K (0) mit 0 <  < R, aber eventuell
nicht gleichmäßig auf der offenen Kreisscheibe UR (0) = {z ∈ C : |z| < R}.
Auch ist mit Satz 9.8 keine allgemeine Aussage über Konvergenz oder Divergenz
auf dem Rand des Konvergenzkreises, also für diejenigen z mit |z| = R, möglich. Das
Konvergenzverhalten für |z| = R der ursprünglichen und der differenzierten Reihe
kann verschieden sein, wie etwa das Beispiel zu Beginn von Kapitel 10.3 zeigt.
Satz 9.8 beinhaltet speziell

f (n) (0) = n! cn ∀n ∈ IN0 (9.1)

(dabei sei f (0) := f ). Diese Formel ist bemerkenswert: Man erhält die Koeffizienten
der Potenzreihe von f durch Ableitungen f (n) an einer einzigen Stelle. Umgekehrt
lassen sich die Ableitungen an dieser Stelle direkt aus den Koeffizienten bestim-
men. Man beachte aber, dass es Funktionen f gibt, die beliebig oft differenzierbar

f (n) (0)
sind, bildet man jedoch die Potenzreihe  cn zn mit cn = n! gemäß (9.1), so
n=0
konvergiert diese Reihe für kein z = 0 gegen f (z).
Eine solche werden wir in Kapitel 10.1, Beispiel (2) finden.

Korollar 9.9. Sei  ck zk eine Potenzreihe mit Konvergenzradius R > 0.
k=0
Dann ist die Funktion

ck k+1
F : ] − R, R[ → IK , F(x) :=  k+1
x ,
k=0


differenzierbar mit F  (x) =  ck xk .
k=0



Beweis. Wegen lim sup k
k+1
ck

= lim sup k |ck | = 1


R hat auch die Reihe
k→ k→


ck k+1
 k+1
z
k=0

den Konvergenzradius R. Die Behauptung folgt direkt mit Satz 9.8. 



Beispiel: Die Potenzreihenentwicklung des Arcus-Tangens.
Wir wissen bereits aus Kapitel 7.3, Beispiel (2), dass arctan differenzierbar ist mit
arctan (x) = 1+x
1
2.
 
1
Für |x| < 1 gilt weiter 1+x2
=  (−x2 )k =  (−1)k x2k (Geometrische Reihe).
k=0 k=0
Eine Stammfunktion dieser Reihe erhalten wir laut Korollar 9.9 durch

(−1)k 2k+1
F : ] − 1, 1[ → IR , F(x) :=  2k + 1
x .
k=0
136 9 Funktionenfolgen und gleichmäßige Konvergenz

Folglich gilt F  (x) = arctan (x) für |x| < 1 und damit arctanx = F(x) + c mit einem
noch zu bestimmenden c. Einsetzen von etwa x = 0 liefert schließlich c = 0.
Also haben wir arctan x = F(x), zunächst für x ∈ ] − 1, 1[. Die Reihe F(x) kon-
vergiert laut Leibniz-Kriterium allerdings auch für x = ±1. Wir wollen noch zeigen,
dass ihr Wert auch dort mit dem Arcus-Tangens übereinstimmt.
Für x ∈ ] − 1, 1[ gilt (vgl. auch Kapitel 5.7, Aufgabe 6) die Abschätzung


n
(−1)k 2k+1

|x|2n+3


arctan(x) −  x
≤ .

k=0 2k + 1

2n + 3

Wegen der Stetigkeit aller beteiligten Ausdrücke gilt dies auch für x = ±1, also


n
(−1)k


arctan(1) − 
≤ .

k=0 2k + 1

2n + 3

Grenzwertbildung n →  liefert die Behauptung. Insgesamt haben wir damit



(−1)k 2k+1
arctan(x) =  2k + 1
x für x ∈ [−1, 1] .
k=0


 (−1)k 1 1 1
Insbesondere gilt = arctan(1) =  = 1 − + − ± ···
4 k=0 2k + 1 3 5 7

9.3 Der Approximationssatz von Weierstraß

Wie wir gezeigt haben, kann jede Potenzreihe mit Konvergenzradius R > 0 auf ab-
geschlossenen Intervallen [− ,  ] mit 0 <  < R gleichmäßig durch eine Folge von
Polynomen, nämlich den Partialsummen der Reihe, approximiert werden.
Wir wollen nun den Weierstraßschen Approximationssatz herleiten, der besagt,
dass sogar jede auf einem Intervall [a, b] stetige IK-wertige Funktion der Grenzwert
einer gleichmäßig konvergenten Folge von Polynomen ist. Dazu betrachten wir das
so genannte n-te Bernsteinpolynom zu einer Funktion f : [0, 1] → IK, welches wie
folgt definiert ist:
n
k n k
Bn (t; f ) :=  f t (1 − t)n−k .
k=0 n k

Unser Ziel ist, zu zeigen, dass für f ∈ C([0, 1]) stets

Bn (·; f ) − f  = sup |Bn (t; f ) − f (t)| → 0


t∈[0,1]

mit n →  gilt.
9.3 Der Approximationssatz von Weierstraß 137

Zunächst bestimmen wir Bn (t; f j ) für f j (t) := t j , j = 0, 1, 2.


Es gilt
n
n k
Bn (t; f0 ) =  t (1 − t)n−k = (t + (1 − t))n = 1 (9.2)
k=0 k
 
und für n ≥ 1 erhalten wir mit nk nk = n−1
k−1 nun

n n
k n k n−1 k
Bn (t; f1 ) =  n k
t (1 − t)n−k = 
k − 1
t (1 − t)n−k
k=0 k=1

n−1
n − 1 k+1
=  k
t (1 − t)n−(k+1) = t (t + (1 − t))n−1 = t . (9.3)
k=0

Für n ≥ 2 haben wir schließlich


n 2 n−1
k n k k + 1 n − 1 k+1
Bn (t; f2 ) =  t (1 − t)n−k =  t (1 − t)n−(k+1)
k=0 n k k=0 n k

n−1 n−1
1 n − 1 k+1 k n−1 k
=
n  k
t (1 − t)n−1−k
+ t
n k
t (1 − t)n−1−k
k=0 k=0

n−1
t t(n − 1) k n−1 k
=
n
+
n  n−1 k
t (1 − t)n−1−k
k=0

t t(n − 1) t(1 − t) 2
= + t= +t . (9.4)
n n n
Weiter gilt Bn (t; f + g) = Bn (t; f ) + Bn (t; g) sowie Bn (t;  f ) =  Bn (t; f ) für  ∈ IK
und f , g : [0, 1] → IK. Falls f und g reellwertige Funktionen sind mit f ≤ g, so ist
auch Bn (t; f ) ≤ Bn (t; g).

Satz 9.10 (Weierstraßscher Approximationssatz). Sei f ∈ C([a, b]).


Es existiert eine Folge von Polynomen (Pn )n∈IN derart, dass

lim Pn − f  = 0
n→

gilt. Ist f reellwertig, so können die Pn reell gewählt werden. Für a = 0 und b = 1
kann man Pn (t) = Bn (t; f ) wählen.

 [a, b] = [0, 1] annehmen. Die allgemeine Aussage folgt dann,


Beweis. Wir können
t−a
indem wir f b−a betrachten.
Sei also f ∈ C([0, 1]). Da f nach Satz 6.18 gleichmäßig stetig ist, gibt es zu
beliebigem√  > 0 ein  > 0 derart, dass | f (s) − f (t)| <  für alle s,t ∈ [0, 1] mit
|s − t| <  gilt.
138 9 Funktionenfolgen und gleichmäßige Konvergenz

2 f 
Sei  :=  . Als nächstes zeigen wir

| f (s) − f (t)| ≤  +  (s − t)2 für alle s,t ∈ [0, 1] . (9.5)

Im Fall |s − t| <  gilt dies wegen der speziellen Wahl von  ; andernfalls ist

 +  (s − t)2 ≥  +  =  + 2 f  > | f (s)| + | f (t)| ≥ | f (s) − f (t)| .

Damit ist (9.5) bewiesen.


Wir betrachten die Funktion gs : [0, 1] → IR, gs (t) := (s − t)2 . Aus (9.5) erhalten
wir − −  gs ≤ f (s) − f ≤  +  gs für alle s ∈ [0, 1]. Es folgt

−Bn (· ;  +  gs ) = Bn (· ; − −  gs ) ≤ Bn (· ; f (s) − f ) ≤ Bn (· ;  +  gs )

und weiter
(9.2)
| f (s) − Bn (t; f )| = |Bn (t; f (s) − f )| ≤ Bn (t;  +  gs )

(9.3),(9.4) 2 t(1 − t) 2
=  +  Bn (t; gs ) =  +  s − 2 st +  +t
n

für alle s,t ∈ [0, 1]. Setzt man s = t, so folgt

t(1 − t) 
| f (t) − Bn (t; f )| ≤  +  ≤+
n n
für alle t ∈ [0, 1]. Mit n →  folgt schließlich die Behauptung, da  > 0 beliebig
wählbar ist. 

9.4 Aufgaben

sin(nx)
1. Zeigen Sie, dass die mittels fn (x) := √
n
erklärte Funktionenfolge ( fn )n∈IN
gleichmäßig auf IR konvergiert.

2. Für x ∈ IR seien
nx4 2 nx
fn (x) := , gn (x) := e−nx und hn (x) := .
1 + nx2 1 + n 2 x2
Untersuchen Sie, ob die Funktionenfolgen ( fn )n∈IN , (gn )n∈IN bzw. (hn )n∈IN
gleichmäßig konvergent auf IR sind.

3. Seien I, J Intervalle und ( fn )n∈IN eine Folge von Funktionen fn : I → J, die


gleichmäßig gegen f : I → J konvergiert. Weiter sei g : J → IR gleichmäßig
stetig.
Zeigen Sie, dass die Folge (g ◦ fn )n∈IN ebenfalls gleichmäßig konvergent ist.
9.4 Aufgaben 139

4. Untersuchen Sie, ob die gegebenen Funktionenfolgen


(i) gleichmäßig konvergent sind,
(ii) einen stetigen Grenzwert haben.
a. fn : [0, 1] → IR, fn (x) := xn ,
' & 1
b. gn : 0, 12 → IR, gn (x) := xn ,
c. hn : [0, 1] → IR,
⎧ 1

⎪ 2nx , für 0 ≤ x ≤ 2n ,
⎨ 1 1
1 1
hn (x) := 2 − 2nx , für 2n < x ≤ n , n


⎩ Die Abbildung zeigt den
0, sonst . Graph der Funktion hn .

5. a. Zeigen Sie, dass durch



1
f (x) :=  (n + x)2 für x ≥ 0
n=1

eine stetige Funktion f : [0, [ → IR erklärt ist.


b. Begründen Sie, dass f differenzierbar ist.
( 1
c. Berechnen Sie f (x) dx.
0

6. Eine Folge ( fn )n∈IN von Funktionen fn ∈ R([a, b]) heißt konvergent im qua-
dratischen Mittel gegen f ∈ R([a, b]), falls
( b
lim | fn (x) − f (x)|2 dx = 0 .
n→ a

a. Zeigen Sie: Wenn eine Folge ( fn )n∈IN von Regelfunktionen gleichmäßig


auf [a, b] gegen f konvergiert, dann konvergiert die Folge auch im quadra-
tischen Mittel gegen f .
b. Geben Sie ein Beispiel einer Folge an, die im quadratischen Mittel aber
nicht gleichmäßig konvergent ist.
c. Zeigen Sie, dass mittels
( b
f (x) g(x) dx
a
ein Skalarprodukt auf C([a, b]) definiert ist. Warum ist dies kein Skalarpro-
dukt auf R([a, b]) ?
Zeigen Sie ferner, dass C([a, b]) mit der durch dieses Skalarprodukt er-
klärten Norm nicht vollständig ist.
140 9 Funktionenfolgen und gleichmäßige Konvergenz

7. Der Integralsinus (oder Sinus Integralis) ist definiert durch


( x
sint
Si : IR → IR , Si(x) := dt .
0 t

(−1)k
Zeigen Sie: Für x ∈ IR gilt Si(x) =  (2k + 1)! (2k + 1)
x2k+1 .
k=0
Kapitel 10
Taylorreihen

Aus der Gleichung (9.1) wissen wir, dass eine Funktion, die durch eine Potenzreihe
dargestellt wird, durch die Werte ihrer Ableitungen an einem einzigen Punkt ein-
deutig bestimmt ist. Wir wollen uns nun überlegen, inwiefern man allgemein eine
beliebig oft differenzierbare Funktion rekonstruieren kann, wenn man die Ableitun-
gen an einer bestimmten Stelle kennt. Ist eine Funktion nur n-mal differenzierbar, so
kann man sich immerhin fragen, ob man mit Kenntnis der Ableitungen an einer Stel-
le wenigstens in der Lage ist, diese Funktion näherungsweise zu bestimmen. Dies
führt uns zu den so genannten Taylorpolynomen und Taylorreihen (Brook Taylor,
1685-1731, Cambridge).

10.1 Der Satz von Taylor

Satz 10.1 (Taylor). Sei f : [a, b] → IK eine Funktion derart, dass f (n−1) stetig auf
[a, b] ist und f (n) (t) für alle t ∈ ]a, b[ existiert. Ferner seien c, x ∈ [a, b], c = x.
Dann existiert eine Zahl  zwischen x und c mit
n−1
f (k) (c) f (n) ( )
f (x) =  k!
(x − c)k +
n!
(x − c)n .
k=0

n−1
f (k) (c)
Beweis. Für t ∈ [a, b] bezeichne Tn−1 (t; f ) :=  k!
(t − c)k .
k=0
f (x) − Tn−1 (x; f )
Mit M := haben wir f (x) = Tn−1 (x; f ) + M (x − c)n .
(x − c)n
Es bleibt zu zeigen, dass n! M = f (n) ( ) für ein  ∈ ]c, x[ bzw.  ∈ ]x, c[ gilt.
Die Funktion g : [a, b] → IK, g(t) := f (t) − Tn−1 (t; f ) − M (t − c)n , ist in ]a, b[
n-mal differenzierbar mit

g(n) (t) = f (n) (t) − n! M .

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 141


DOI 10.1007/978-3-642-28644-5_10, © Springer-Verlag Berlin Heidelberg 2012
142 10 Taylorreihen

Somit ist nur noch zu zeigen, dass es  zwischen x und c gibt mit g(n) ( ) = 0.
(k)
Für k = 0, . . . , n − 1 gilt Tn−1 (c; f ) = f (k) (c) und damit g(k) (c) = 0.
Nach Wahl von M ist g(x) = 0; laut dem Mittelwertsatz gibt es ein x1 zwischen x
und c mit g (x1 ) = 0. Mit dem Paar c, x1 folgt analog, dass ein x2 zwischen x1 und
c existiert mit g (x2 ) = 0. Nach n Schritten kommt man zu einem xn zwischen xn−1
und c mit g(n) (xn ) = 0. Mit  := xn folgt nun die Behauptung. 

Bemerkung: Für n = 1 ist der Satz von Taylor genau der Mittelwertsatz.
f (n) ( )
Man bezeichnet den letzten Summanden Rn (x) := (x − c)n in Satz 10.1
n!
als Lagrange-Restglied (Joseph Louis Lagrange, 1736-1813, Berlin, Paris). Der
Satz zeigt, dass f durch ein Polynom vom Grad n − 1 näherungsweise beschrieben
werden kann; eine mögliche Fehlerabschätzung erhält man etwa, wenn man eine
Schranke für | f (n) | kennt. Die Polynome
n−1
f (k) (c)
Tn−1 (t; f ) :=  k!
(t − c)k
k=0

nennt man Taylorpolynome mit Entwicklungspunkt c. Ist f beliebig oft differen-


zierbar, so heißt

f (k) (c)
T f (t) :=  (t − c)k
k=0 k!
die Taylorreihe von f mit Entwicklungspunkt c. Ob die Taylorreihe von f mit f
übereinstimmt, kann nur über Abschätzung der Restglieder erfolgen. Verschärft man
die Voraussetzung an f , so erhält man ein Restglied in Integralform.
Satz 10.2. Sei f : [a, b] → IK eine n-mal stetig differenzierbare Funktion. Ferner
seien c, x ∈ [a, b].
Dann gilt
n−1 (k) ( x
f (c) 1
f (x) =  (x − c)k + (x − t)n−1 f (n) (t) dt .
k=0 k! (n − 1)! c

Beweis. Bezeichne Rn (t) := f (t) − Tn−1(t; f ).


(n)
Dann ist Rn : [a, b] → IK auch n-mal stetig differenzierbar und Rn (t) = f (n) (t).
(k) (k)
Wegen Tn−1 (c; f ) = f (k) (c) gilt weiter Rn (c) = 0 für k = 0, . . . , n − 1. Mit partieller
Integration erhalten wir
( x ( x
(n)
(x − t)n−1 f (n) (t) dt = (x − t)n−1Rn (t) dt
c c

t=x ( x
(n−1)
(n−1)
= (x − t)n−1 Rn (t)
+(n − 1) (x − t)n−2Rn (t) dt
t=c c
( x
(n−1)
= (n − 1) (x − t)n−2Rn (t) dt .
c
10.1 Der Satz von Taylor 143

Wiederholung der partiellen Integration führt schließlich zu


( x
(n − 1)(n − 2) · · · 1 (x − t)0 Rn (t) dt = (n − 1)! (Rn (x) − Rn (c)) = (n − 1)! Rn (x) ,
c

womit die Behauptung bewiesen ist. 



Beispiele:
(1) Sei f : IR → IR, f (x) := exp(x). Mit c = 0 erhalten wir für beliebiges x = 0,
da f (k) (0) = 1 ∀k ∈ IN ist,




n−1 k

f (n) ( ) n

e|x| |x|n


f (x) − 
=
x


k=0 k!


n!
n!

mit einem  zwischen 0 und x.


Damit kann man zeigen, dass e nicht rational ist:
Angenommen, es gelte e = qp mit p, q ∈ IN. Dann folgt q! e ∈ IN und auch
 := q! (e − 1 − 1!1 − 2!1 − · · · − q!1 ) ∈ IN. Mit obiger Restgliedabschätzung
e q! e
erhalten wir aber 0 <  = q! Rq+1 (1) ≤ (q+1)! = q+1 < 1. Daraus folgt ins-
besondere  ∈ / IN, ein Widerspruch!

T2

T1
Die Abbildung zeigt die Graphen der
Exponentialfunktion sowie der Taylor-
polynome T1 , T2 und T3 zum Entwick-
lungspunkt c = 0.
Man erkennt, dass das Restglied, also
die Differenz zwischen Taylorpolynom
und Funktionswert, in der Nähe des
Entwicklungspunktes klein ist, aber
rasch wächst, wenn man sich vom Ent- T3
wicklungspunkt entfernt.

(2) Sei f : IR → IR,



exp(−1/x2) für x = 0 ,
f (x) :=
0 für x = 0 .

Wir werden sehen, dass f beliebig oft differenzierbar ist und f (n) (0) = 0 gilt
für alle n ∈ IN0 . Damit ist die Taylorreihe von f mit Entwicklungspunkt c = 0
identisch 0, obwohl f nicht die Nullfunktion ist.
144 10 Taylorreihen

Es gilt sogar

(n)
pn (1/x) exp(−1/x2) für x = 0 ,
f (x) =
0 für x = 0 ,

wobei pn ein Polynom ist.


Beweis. Wir beweisen dies mit vollständiger Induktion. Für n = 0 ist die
Aussage offensichtlich erfüllt. Gilt die Behauptung für ein n, so erhalten wir
für x = 0 nun

d 1 1
f (n+1) (x) = pn exp − 2
dx x x

1 1 1 1 1
= exp − 2 −pn + 2p n .
x x x2 x x3

Setze pn+1 (t) := −t 2 pn (t) + 2t 3 pn (t). Da pn ein Polynom ist, ist auch pn+1
ein Polynom. Schließlich gilt

f (n) (t) − f (n) (0) pn (1/t) exp(−1/t 2)


f (n+1) (0) = lim = lim
t→0 t t→0 t
= lim s pn (s) exp(−s2 ) = 0 ,
s→

womit die Behauptung auch für n + 1 gezeigt ist. 



(3) Wir wollen mit √ Hilfe des Satzes von Taylor und Restgliedabschätzung eine
Näherung für 2 bestimmen.

Dazu betrachten wir die Funktion f : [0, [ → IR, f (x) := x. Diese ist im
Intervall ]0, [ beliebig oft differenzierbar.
1 √1 √3 .
Es gilt f  (x) = √
2 x
, f  (x) = − und f  (x) =
4 x3 8 x5
Das Taylorpolynom T3 zum Entwicklungspunkt c > 0 lautet demnach

√ t − c (t − c)2 (t − c)3
T3 (t; f ) = c+ √ − √ + √ .
2 c 8 c3 16 c5

Im Fall c = 1 und t = 2 erhalten wir T3 (2; f ) = 1 + 12 − 18 + 16


1
= 23
16 .

Um zu sehen, wie weit dieser Wert vom wahren“ Funktionswert 2 entfernt

ist, müssen wir die Differenz f (t) − T3 (t; f ) = R4 (t) abschätzen. Laut dem
Satz von Taylor gibt es ein  ∈ ]1, 2[ derart, dass

√ f (4) ( )
2 = f (2) = T3 (2; f ) + (2 − 1)4
4!
15
gilt, und mit f (4) (x) = − √ erhalten wir
16 x7
10.2 Potenzreihen mit allgemeinem Entwicklungspunkt 145






√ 23

1 15

5
5


2 −
= | f (2) − T3(2; f )| =





=

≤ .
16
24 16  7

128  7
128

Mit anderen Worten: Die Zahl 23


16 als Näherungswert unterscheidet sich vom
√ 5
wahren Wert von 2 um nicht mehr als 128 .

10.2 Potenzreihen mit allgemeinem Entwicklungspunkt

Häufig berechnet man Taylorreihen durch Umformung bekannter Reihen. Dazu


benötigen wir ein Ergebnis über Umstellungen in der Reihenfolge der Summation.

Lemma 10.3. Gegeben sei eine Doppelfolge (ai j )i∈IN , j∈IN von Zahlen ai j ∈ IK mit
folgenden Eigenschaften:

(i)  |ai j | = bi (absolute Konvergenz bei festem i),
j=1

(ii)  bi konvergiert.
i=1
   
Dann folgt   ai j =   ai j .
i=1 j=1 j=1 i=1

Beweis. Für n ∈ IN sei xn := 1n . Weiter sei x0 := lim xn = 0.


n→
Die Menge M := {x0 , x1 , x2 , . . .} ist mit der natürlichen Metrik ein metrischer
Raum. Zu jedem i ∈ IN definieren wir eine Funktion fi : M → IK mittels
 n
fi (x0 ) :=  ai j und fi (xn ) :=  ai j für n ∈ IN .
j=1 j=1

Es gilt lim fi (xn ) = fi (x0 ); laut Folgenkriterium (Satz 6.2) ist jedes fi stetig in x0 .
n→

Wegen | fi (xn )| ≤ bi für alle n ∈ IN0 folgt mit Satz 9.7, dass die Reihe  fi
i=1
gleichmäßig auf M gegen eine Grenzfunktion g : M → IK konvergiert und Satz 9.2
liefert dann die Stetigkeit von g im Punkt x0 .

Nach Konstruktion von g gilt weiter g(x1 ) =  ai1 sowie
i=1
 
   j j−1 
g(x j ) − g(x j−1) =  fi (x j ) − fi (x j−1 ) =   aik −  aik =  ai j
i=1 i=1 k=1 k=1 i=1
 
n  n 
für j ≥ 2. Damit haben wir g(xn ) = g(x1 ) +  g(x j ) − g(x j−1) =   ai j .
j=2 j=1 i=1
146 10 Taylorreihen

Schließlich erhalten wir, mit dem Folgenkriterium angewandt auf g,


 
  n    
  ai j = n→
lim   ai j = lim g(xn ) = g(x0 ) =  fi (x0 ) =   ai j
n→
j=1 i=1 j=1 i=1 i=1 i=1 j=1

wie behauptet. 

Bemerkung: Man beachte, dass die spezielle Wahl der Folge (xn )n∈IN im Beweis
von Lemma 10.3 keine Rolle spielt. Es kommt lediglich darauf an, dass der Grenz-
wert x0 = lim xn existiert und dass xn = xm für n = m gilt.
n→
Ein Beispiel für eine Doppelfolge, bei der die Reihenfolge der Summation nicht
vertauscht werden darf (und die folglich die Voraussetzungen von Lemma 10.3 nicht
erfüllt), bringen wir in Aufgabe 3 am Ende dieses Kapitels.
Satz 10.4. Sei f : ] − R, R[ → IK durch eine Potenzreihe mit Konvergenzradius R > 0
definiert, etwa

f (x) =  ck xk .
k=0

Weiter sei c ∈ ] − R, R[.


Für x ∈ UR−|c| (c) = ] c − (R − |c|) , c + (R − |c|) [ gilt dann


f (k) (c)
f (x) =  k!
(x − c)k .
k=0

Beweis. Für x ∈ UR−|c| (c) haben wir


  n
n
f (x) =  cn ((x − c) + c)n =  cn  k
(x − c)k cn−k .
n=0 n=0 k=0
n
Wir setzen ank := cn k (x − c)k cn−k für k = 0, . . . , n und ank := 0 für k > n. Da
 

  

n

n n−k
  |ank | =  
n k
c c (x − c)
=  |cn | ( |x − c| + |c| )
k
n
n=0 k=0 n=0 k=0 n=0

konvergiert, sind die Voraussetzungen von Lemma 10.3 erfüllt und wir erhalten
     
n
f (x) =   ank =   ank =   cn cn−k (x − c)k .
n=0 k=0 k=0 n=0 k=0 n=k k

Laut Satz 9.8 gilt



f (k) (c) 1  n
=  n(n − 1) · · ·(n − k + 1) cn cn−k =  cn cn−k
k! k! n=k n=k k

und die Behauptung ist bewiesen. 



10.2 Potenzreihen mit allgemeinem Entwicklungspunkt 147

Bemerkung: Satz 10.4 gilt entsprechend auch im Fall R = .


Betrachten wir Reihen der Form

 ck (z − c)k
k=0

für ein c ∈ IK, so gibt es laut Satz 5.19 genau ein R ≥ 0 (oder R = ) derart, dass die
Reihe absolut konvergiert für z ∈ UR (c) und divergiert für |z| > R. Man braucht nur
u := z − c zu betrachten. Diesen Wert R nennen wir ebenfalls Konvergenzradius,
der Punkt c heißt Entwicklungspunkt.
Beispiel: Die Geometrische Reihe hat den Konvergenzradius 1; für |x| < 1 ist

1
f (x) :=  xk = 1 − x .
k=0

 k+1
Sei c := − 12 . Aus 1
k! f (k) − 12 = 23 und mit Satz 10.4 ergibt sich

 k+1
1 2 1 k
= x+ (10.1)
1 − x k=0 3 2

zunächst für x ∈ ] − 1, 0[. Letztere Reihe hat allerdings den Konvergenzradius R = 32 .


Sie konvergiert daher sogar für x ∈ ] − 2, 1[.

Wir wollen noch einige wichtige Eigenschaften festhalten. Sei



f (z) =  ck (z − c)k
k=0

eine Potenzreihe mit Konvergenzradius R > 0 (oder R = ).


Die Funktion f ist in UR (c) = {z ∈ IK : |z − c| < R} stetig (vgl. Korollar 6.6).
Damit


folgt, dass (10.1) tatsächlich für alle x ∈ ] − 2, 1[ und sogar für alle x ∈ C mit

x + 1
< 3 gilt.
2 2
Im Folgenden sei c ∈ IR. Laut Satz 9.8 ist f in ]c − R, c + R[ beliebig oft differen-
zierbar und es gilt

f (n) (x) =  k(k − 1) · · · (k − n + 1) ck (x − c)k−n .
k=n

Die Taylor-Reihe von f mit Entwicklungspunkt c ist genau die Potenzreihe, denn es
ist f (n) (c) = n! cn . Insbesondere gilt also folgender Identitätssatz:
 
Korollar 10.5. Falls  ck (x − c)k =  dk (x − c)k für alle x ∈ ]c −  , c +  [ mit
k=0 k=0
einer Zahl  > 0 ist, so gilt ck = dk für alle k ∈ IN0 .
148 10 Taylorreihen

Analog zu Korollar 9.9 ergibt sich, dass durch



ck
F : ]c − R, c + R[ → IK , F(x) =  k + 1 (x − c)k+1
k=0

eine Stammfunktion von f gegeben ist.

10.3 Der Abelsche Grenzwertsatz

Wir beginnen mit einem Beispiel.


Die Funktion f : ]− 1, [ → IR, f (x) := ln(1 + x), ist differenzierbar mit f  (x) = 1+x
1
.

Für |x| < 1 können wir f  (x) als Potenzreihe schreiben: Es gilt f  (x) =  (−1)k xk .
k=0
Eine Stammfunktion dieser Reihe können wir leicht angeben. Damit erhalten wir

xk+1
 (−1)k k+1 = f (x) + c mit einer Konstante c ∈ IR.
k=0
Einsetzen von etwa x = 0 liefert c = 0. Somit haben wir

xk+1
ln(1 + x) =  (−1)k k + 1 für |x| < 1 .
k=0

Laut dem Leibniz-Kriterium (Korollar 5.15) konvergiert die Reihe rechts auch noch
für x = 1. Um zu zeigen, dass sie gegen ln(2) konvergiert, benutzen wir den folgen-
den Satz. Man beachte, dass die differenzierte Reihe für x = 1 nicht konvergiert.

Satz 10.6 (Abelscher Grenzwertsatz).



Es sei f (x) =  ck (x − c)k eine Potenzreihe mit Konvergenzradius R > 0, c ∈ IR.
k=0

Für den Randpunkt x = c + R sei die Reihe  ck Rk auch konvergent.
k=0
Dann gilt

lim
x→(c+R)−
f (x) =  ck R k .
k=0

Insbesondere ist f : ]c − R, c + R] → IK, f (x) =  ck (x − c)k , stetig.
k=0

Beweis. Ersetzt man x durch Ry + c, so ergibt sich eine Potenzreihe um Null mit
Konvergenzradius 1.
 
Es reicht also, f (x) =  ck xk mit R = 1 und konvergenter Reihe  ck anzunehmen.
k=0 k=0
n
Mit Sn :=  ck für n ∈ IN0 und S−1 := 0 gilt
k=0
10.4 Aufgaben 149

N N N−1
 ck xk =  (Sk − Sk−1) xk = (1 − x)  Sk xk + SN xN
k=0 k=0 k=0

und mit N →  folgt



f (x) = (1 − x)  Sk xk für |x| < 1 ;
k=0




diese Reihe ist konvergent, denn es gilt
 Sk x

≤ max |Sn |  xk .

k
k=0 n∈IN0 k=0

Betrachte S := lim Sn =  ck .
n→ k=0
Zu  > 0 existiert N ∈ IN mit |S − Sn| < 2 ∀n ≥ N. Wir erhalten

| f (x) − S| =
(1 − x)  (Sk − S) x


k=0

N 

≤ (1 − x)  |Sk − S| |xk | + (1 − x)  |x|k
k=0 2 k=0
  
=1
N

≤ (1 − x)  |Sk − S| + .
k=0 2

N

Nun gibt es eine Zahl  > 0 mit (1 − x)  |Sk − S| < 2 für alle x ∈ ]1 −  , 1].
k=0
Damit haben wir schließlich | f (x) − S| <  für alle x ∈ ]1 −  , 1[. Folglich gilt
lim f (x) = S wie gewünscht. 

x→1−

Kehren wir zurück zu unserem Beispiel. Mit Satz 10.6 erhalten wir nun

1 1 1 1
ln(2) =  (−1)k k + 1 = 1 − 2 + 3 − 4 ± · · · , (10.2)
k=0

den Wert der Alternierenden Harmonischen Reihe.

10.4 Aufgaben

1. Es sei I ein Intervall derart, dass für jedes x ∈ I auch −x ∈ I gilt.


Eine Funktion f : I → IK heißt gerade, wenn f (x) = f (−x) gilt für alle x ∈ I;
sie heißt ungerade, wenn f (x) = − f (−x) gilt für alle x ∈ I.
Zeigen Sie: Alle Taylorpolynome zum Entwicklungspunkt 0 (sofern sie existie-
ren) einer geraden/ungeraden Funktion sind ebenfalls gerade/ungerade.
150 10 Taylorreihen

2. Es sei f : IR → IR eine differenzierbare Funktion mit f  = f und f (0) = 1.


Bestimmen Sie die Taylorreihe T f (x) von f zum Entwicklungspunkt 0. Für
welche x konvergiert diese gegen f (x) ?

3. Ein Gegenbeispiel zur Vertauschung bei Doppelsummen.


Für i, j ∈ IN sei
⎧ −1 0 0 0 ···
⎨0
⎪ für i < j , 1
2 −1 0 0 ···
ai j := −1 für i = j , 1 1

⎩ j−i 4 2 −1 0 ···
2 für i > j . 1 1 1
8 4 2 −1 · · ·
    .. .. .. .. . .
Zeigen Sie, dass   ai j =   ai j . . . . .
i=1 j=1 j=1 i=1

gilt und geben Sie an, welche der Voraussetzungen von Lemma 10.3 im vorlie-
genden Fall nicht erfüllt ist.

4. Lösung der Schwingungsgleichung mittels Taylor-Entwicklung.


Es sei f : IR → IR eine zwei Mal differenzierbare Funktion mit der Eigenschaft

f  (x) + f (x) = 0 für alle x ∈ IR .

Zeigen Sie mit Hilfe der Talyor-Entwicklung von f , dass gilt:

f (x) = f (0) cos x + f  (0) sin x für alle x ∈ IR .

5. Es seien  ∈ IR und f : IR → IR eine differenzierbare Funktion mit f (0) = 0


derart, dass f  (x) = f ( x) gilt für alle x ∈ IR.
a. Zeigen Sie, dass f beliebig oft differenzierbar ist und berechnen Sie f (k)
für k ∈ IN.
b. Bestimmen Sie die Taylorreihe von f um den Nullpunkt und deren Kon-
vergenzradius.
c. Zeigen Sie mit Hilfe einer Abschätzung des Lagrangeschen Restglieds,
dass für | | ≤ 1 die Taylor-Reihe von f auf ganz IR gegen f konvergiert.

6. Sei z0 ∈ C. Die Potenzreihe  ck (z − z0 )k habe den Konvergenzradius R > 0.
k=0
Weiter sei z1 ∈ UR (z0 ). Zeigen Sie: Für alle z ∈ UR−|z1 −z0 | (z1 ) gilt
 
 ck (z − z0 )k =  b j (z − z1) j
k=0 j=0

 k
mit b j =  j ck (z1 − z0 )k− j .
k= j
Kapitel 11
Fourierreihen

Fourierreihen eignen sich zur Analyse von Funktionen, von denen man annimmt,
dass sie eine Überlagerung von Grundschwingungsfunktionen (mit bestimmten Fre-
quenzen) sind, d.h. von sin(kx), cos(kx) oder eikx . Dabei können diese Funktionen
Sprungstellen haben (so genannte Pulsfunktionen).
Zunächst ist eine Vorbemerkung zu periodischen Funktionen angebracht. Eine
Funktion f : IR → IK heißt periodisch mit der Periode  > 0, falls

f (x +  ) = f (x) für alle x ∈ IR

gilt. Es gilt dann auch f (x + k ) = f (x) für alle x ∈ IR und alle k ∈ ZZ.
Wir können immer davon ausgehen, dass eine Funktion mit  Periode  = 2
vorliegt, indem wir f durch eine Funktion g mit g(x) := f 2 x ersetzen.

11.1 Trigonometrische Polynome und Fourierkoeffizienten

Ein trigonometrisches Polynom ist eine Summe der Form


n
a0
f (x) = +  (ak coskx + bk sin kx) (x ∈ IR)
2 k=1

mit Koeffizienten a0 , . . . , an ; b1 , . . . , bn ∈ IK.


 
Wegen cos x = 12 eix + e−ix und sin x = 2i1 eix − e−ix kann man obige Darstel-
lung auch schreiben als
n
f (x) =  ck eikx .
k=−n
a0 1
Dabei ist c0 = und ck =
2 sowie c−k = 12 (ak + ibk ) für k ∈ IN. Umge-
2 (ak − ibk )
kehrt gilt dann natürlich a0 = 2c0 , ak = ck + c−k und bk = 1i (c−k − ck ) für k ∈ IN.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 151


DOI 10.1007/978-3-642-28644-5_11, © Springer-Verlag Berlin Heidelberg 2012
152 11 Fourierreihen

Wegen
( 2
1 inx

2
einx dx = e
=0 für n = 0
0 in 0

erfüllt die doppelseitige“ Folge (ek )k∈ZZ von Funktionen ek (x) := eikx die folgende

Orthogonalitätsrelation: Es gilt
( (

1 2 1 2 i(k−m)x 1 für k = m ,
ek (x) em (x) dx = e dx =
2 0 2 0 0 für k = m .
n
Ist nun f (x) =  ck eikx ein trigonometrisches Polynom, so haben wir
k=−n

( 2 ( 2 n n ( 2

0
f (x) e−imx dx =
0
 ck eikx e−imx dx =  ck
0
ei(k−m)x dx = 2 cm
k=−n k=−n

für m ∈ {−n, . . ., n}. Das Integral auf der linken Seite können wir nicht nur für
trigonometrische Polynome, sondern für beliebige integrierbare Funktionen bilden.

Definition 11.1. Sei R p := { f ∈ R([0, 2 ]) : f (0) = f (2 )}.


Für f ∈ R p heißen die Zahlen
( 2
1
f)(k) := f (x) e−ikx dx , k ∈ ZZ ,
2 0

die Fourierkoeffizienten von f . Die formale Reihe



 f)(k) eikx
k=−

heißt Fourierreihe von f .

Bemerkungen:
(1) Die Fourierreihe ist zunächst nur ein formales Gebilde. Es gibt zahlreiche
Fälle, bei denen sie für kein x ∈ IR konvergiert.
(2) Wir werden die Konvergenz einer Fourierreihe (wenn nicht anders angege-
ben) wie folgt verstehen:
 n
 f)(k) e−ikx := lim
n→
 f)(k) e−ikx .
k=− k=−n

(3) Bezüglich Fourierreihen können wir 2 -periodische Funktionen g : IR → IK


und Funktionen f : [0, 2 ] → IK mit f (0) = f (2 ) als gleichwertig sehen.
Man kann f zu einer 2 -periodischen Funktion g : IR → IK fortsetzen mittels
g(x + 2 n) := f (x) für x ∈ [0, 2 [ und n ∈ ZZ. Wir werden die 2 -periodische
Fortsetzung stets auch wieder mit f bezeichnen.
11.1 Trigonometrische Polynome und Fourierkoeffizienten 153

Damit ist auch klar, dass die Fourierkoeffizienten f)(k) durch


( 2 (  +2
1 1
f)(k) = f (x) e−ikx dx = f (x) e−ikx dx
2 0 2 

für beliebiges  ∈ IR gegeben sind.


Als erstes Beispiel sei f eine so genannte Pulsfunktion,

1 für x ∈ [0,  ] ∪ {2 } ,
f (x) :=
−1 für x ∈ ] , 2 [ .

Es gilt f)(0) = 0 und für k = 0 erhalten wir


(  ( 2
) 1 −ikx −ikx 1 e−ikx

 e−ikx

2
f (k) = e dx − e dx =

2 0  2 −ik 0 −ik 
i  −ik  i  −ik 
= (e − 1) − (1 − e−ik ) = 2e −2
2 k 2 k

0 , falls k gerade ,
=
− 2ik , falls k ungerade .

Die Fourierreihe von f lautet also

2i  1 4  1
− 
 k=− 2k + 1
e i(2k+1)x
= 
 k=0 2k + 1
sin(2k + 1)x .

2

−1

Es ist aufschlussreich, die Partialsummen


n
4 1
S2n+1 f (x) :=
  2k + 1
sin((2k + 1)x)
k=0

für verschiedene n zu berechnen, um so die


Approximation von f (x) zu veranschaulichen.
Die Abbildung zeigt S1 f (x) und S3 f (x).

Jean-Baptiste Joseph Fourier (1768-1830, Paris) behauptete, dass für jedes f ∈ R p


deren Fourierreihe gegen f strebt (er benutzte diese Reihen, um die Wärmeleitung
154 11 Fourierreihen

in einem Körper zu beschreiben). Dies ist falsch. Man erkennt an obigem Beispiel,
dass etwa an der Stelle x =  die Fourierreihe gegen 0 = f ( ) konvergiert.
Viele Mathematiker (u.a. Cauchy) haben Fouriers Behauptung mit falschem Be-
weis nachgewiesen“. Erst Dirichlet brachte Ordnung in die Untersuchungen. Paul

du Bois-Reymond (1831-1889, Tübingen, Berlin) konnte zeigen: Es gibt eine ste-
tige 2 -periodische Funktion f , deren Fourierreihe an der Stelle x = 0 gegen 
divergiert.
Ein wichtiges Resultat stammt von Lipót Fejér (1880-1959, Budapest; damals
19-jährig). Er bewies, dass
n
|k|
 1 −
n + 1
f)(k) eikt → f (t) für n → 
k=−n

gilt, falls die 2 -periodische Funktion f stetig ist (sogar mit gleichmäßiger Konver-
genz). Wir werden in Satz 11.5 und Satz 11.6 darauf zurückkommen.

11.2 Konvergenz nach Dirichlet und Fejér

Wir zeigen zunächst wichtige Gleichheiten für gewisse trigonometrische Polynome.


n n
Für n ∈ IN betrachten wir Dn (x) :=  eikx = 1 + 2  cos(kx) und
k=−n k=1

n
1 n 1 n
|k|
Fn (x) :=  Dk (x) = n + 1  ((n + 1) − |k|) e =  1 − n + 1 eikx .
n + 1 k=0
ikx
k=−n k=−n

Man bezeichnet (Dn )n∈IN als Dirichlet-Kern und (Fn )n∈IN heißt Fejér-Kern.

/ {2k : k ∈ ZZ} gilt


Lemma 11.2. Für x ∈
   2
sin (2n + 1) 2x 1 sin (n + 1) 2x
Dn (x) =  und Fn (x) =  .
sin 2x n+1 sin 2x

Weiter ist Dn (2k ) = 2n + 1 sowie Fn (2k ) = n + 1 für k ∈ ZZ.

Beweis. Die Behauptungen für x = 2k sind offensichtlich.


Andernfalls gilt

2n
ix 2n+1
e −1
Dn (x) = e−inx  (eix )k = e−inx
k=0 eix − 1

−inx ei(2n+1)x/2 ei(2n+1)x/2 − e−i(2n+1)x/2 sin (2n + 1) 2x
=e = 
eix/2 eix/2 − e−ix/2 sin 2x
11.2 Konvergenz nach Dirichlet und Fejér 155

und mit Hilfe von cos(z − w) − cos(z + w) = 2 sin z sin w (siehe Satz 5.22) erhalten
wir weiter
  x 2   x 2 n
sin
2
(n + 1) Fn (x) = sin
2  Dk (x)
k=0
n x  x
=  sin sin (2k + 1)
k=0 2 2
n
cos(kx) − cos((k + 1)x)
=  2
k=0
2
1 − cos((n + 1)x) (n + 1)x
= = sin ,
2 2

womit die Behauptung gezeigt ist. 



Zu f ∈ R p betrachten wir nun die folgenden trigonometrischen Polynome:
n n
|k|
Sn ( f )(x) :=  f (k) e
) ikx
und n ( f )(x) :=  1 − f)(k) eikx .
k=−n k=−n n+1

Das nächste Lemma gibt eine Integraldarstellung von Sn ( f ) und n ( f ) an.


Lemma 11.3. Sei f ∈ R p . Es gilt
( 2 ( 2
1 1
Sn ( f )(x) = f (y) Dn (x − y) dy = f (x − y) Dn (y) dy sowie
2 0 2 0
( 2 ( 2
1 1
n ( f )(x) = f (y) Fn (x − y) dy = f (x − y) Fn (y) dy
2 0 2 0

1 n
für alle x ∈ IR und es ist n ( f ) =  Sk ( f ).
n + 1 k=0
Beweis. Mit ( 2
n
|k| 1
n ( f )(x) =  1 −
n + 1 2  0
f (y) e −iky
dy eikx
k=−n
( n
1 2 |k|
= f (y)  1 − eik(x−y) dy
2 0 k=−n n + 1
( 2
1
= f (y) Fn (x − y) dy
2 0

ist die Gleichheit links in der zweiten Behauptung gezeigt. Die rechte Gleichung
erhält man durch Substitution mit t := x − y. Die entsprechenden Aussagen für Sn
beweist man ganz analog.
Daraus folgt die letzte Behauptung jetzt direkt mit der Definition von Fn . 

156 11 Fourierreihen

Wir wollen sehen, unter welchen Bedingungen die Fourierreihe einer Funktion
f ∈ R p gegen f konvergiert. Mit anderen Worten, uns interessiert das Verhalten
von Sn ( f ) für n → . Darüberhinaus wollen wir auch n ( f ) auf Konvergenz unter-
suchen. Es stellt sich heraus, dass n in gewissen Fällen besser zur Approximation
geeignet ist als Sn . Dies liegt u.a. an folgenden Eigenschaften.

Lemma 11.4. Es gelten


(i) Fn (x) ≥ 0 für alle x ∈ IR,
( 2
1
(ii) Fn (x) dx = 1,
2 0

(iii) für jedes 0 <  <  konvergiert Fn (x) → 0 gleichmäßig auf [ , 2 −  ]


mit n → .

Beweis. Die erste Behauptung erkennt man sofort an Hand der Darstellung aus
Lemma 11.2. Weiter ist
( ( 2
1 2 1 n |k|
2 0
Fn (x) dx =  1 − n + 1 0 eikx dx ,
2 k=−n

wobei das Integral nur für k = 0 einen von Null verschiedenen Wert, nämlich 2 ,
hat. Somit ist auch die zweite Aussage gezeigt. Ist nun 0 <  <  , so erhalten wir,
wieder mit Lemma 11.2, für alle x ∈ [ , 2 −  ] die Abschätzung
2 2
1 1 1 1 n→
Fn (x) ≤ ≤ −→ 0 .
n+1 sin(x/2) n+1 sin( /2)

Der Ausdruck rechts hängt nicht mehr von x ab; daher konvergiert Fn (x) gleichmäßig
auf [ , 2 −  ]. 

Satz 11.5. Sei f ∈ R p . Ist f im Punkt x stetig, so gilt lim n ( f )(x) = f (x).
n→

Beweis. Sei  > 0. Auf Grund der Stetigkeit gibt es eine Zahl  > 0 derart, dass
| f (y) − f (x)| ≤ 2 für alle y mit |y − x| <  gilt.
Ohne Einschränkung können wir M :=  f  > 0 annehmen. Laut Aussage (iii)
von Lemma 11.4 gibt es N ∈ IN mit

|Fn (y)| ≤ für alle y ∈ [ , 2 −  ] und alle n ∈ IN .
4M
Mit den Resultaten (i) und (ii) aus Lemma 11.4 gilt ferner
(  ( 2 ( 2 ( 2
|Fn (y)| dy + |Fn (y)| dy ≤ |Fn (y)| dy = Fn (y) dy = 2
0 2  − 0 0

und wir erhalten schließlich


11.2 Konvergenz nach Dirichlet und Fejér 157

( 2 (


1 1 2

|n ( f )(x) − f (x)| =


f (x − y) Fn (y) dy − f (x) Fn (y) dy

2 0 2 0

(

2

=
( f (x − y) − f (x) ) Fn (y) dy

2 0
( 
1
≤ | f (x − y) − f (x)| Fn (y) dy
2 0
( 0
1
+ | f (x − y) − f (x)| Fn (y) dy
2 −
( 2  −
1
+ | f (x − y) − f (x)| Fn (y) dy
2 
( 2  − ( 2  −
 2M  M 
≤ + Fn (y) dy ≤ + dy ≤ 
2 2  2   4M
für alle n ≥ N. 

Satz 11.6 (Fejér). Sei f ∈ R p stetig.


Dann gilt n ( f ) → f gleichmäßig auf [0, 2 ] mit n → .
Beweis. Da f laut Satz 6.18 gleichmäßig stetig ist, gibt es zu  > 0 ein  > 0 derart,
dass | f (y) − f (x)| < 2 für alle x, y mit |y − x| <  gilt, d.h.  hängt nicht von x ab.
Nun kann man exakt wie im Nachweis von Satz 11.5 vorgehen. 

Wir notieren noch einige wichtige Folgerungen.


Korollar 11.7 (Weierstraßscher Approximationssatz). Sei f ∈ R p stetig.
Dann existiert eine Folge trigonometrischer Polynome (Pn )n∈IN , die gleichmäßig
auf IR gegen f konvergiert, also lim Pn − f  = 0.
n→

Beweis. Wähle Pn = n ( f ). 

Korollar 11.8 (Eindeutigkeitssatz). Seien f , g ∈ R p stetig mit f)(k) = g)(k) ∀k ∈ ZZ.


Dann ist f = g.
Beweis. Aus der Voraussetzung folgt n ( f ) = n (g) für alle n ∈ IN0 . Mit Satz 11.6
erhalten wir f = g. 

In den Beweisen zu Satz 11.5 und Satz 11.6 werden von Fn nur die Eigenschaften
aus Lemma 11.4 benutzt. Man erhält die selben Resultate daher auch, wenn man an
Stelle von Fn andere Systeme von trigonometrischen Polynomen verwendet, sofern
diese ebenfalls die Aussagen von Lemma 11.4 erfüllen.
Für den Dirichlet-Kern, also die Dn , ist dies allerdings nicht der Fall. Dennoch
gilt in vielen Fällen auch Sn ( f ) → f mit n → .
158 11 Fourierreihen

Satz 11.9 (Riemann-Lebesgue-Lemma). Sei f ∈ R([a, b]).


( b ( b
Dann gilt lim f (x) sin(nx) dx = 0 = lim f (x) cos(nx) dx.
n→ a n→ a

Insbesondere gilt für f ∈ R p damit lim f)(n) = 0.


|n|→

Beweis. Seien zunächst g eine Treppenfunktion und a = a0 < a1 < · · · < am = b,


sodass g(x) = ck für x ∈ ]ak−1 , ak [ gilt. Für n ∈ IN ergibt sich

( b




m
1

g(x) sin(nx) dx
=
 ck (cos(nak−1 ) − cos(nak ))

≤ 2  |ck | n→ −→ 0 .

a


n k=1
k=1 n

Sei nun f ∈ R([a, b]). Zu jedem  > 0 gibt es dann eine Treppenfunktion g mit

 f − g < b−a und weiter

( b ( b
( b


a f (x) sin(nx) dx − a g(x) sin(nx) dx
≤ a | f (x) − g(x)| dx <  .
( b
Da  beliebig klein gewählt werden kann, bleibt nur lim f (x) sin(nx) dx = 0.
n→ a

Für cos zeigt man dies ganz analog. Die abschließende Behauptung ergibt sich
dann unmittelbar mit e−inx = cos(nx) − i sin(nx). 

Nun können wir ein wichtiges Resultat über punktweise Konvergenz von Fourier-
reihen beweisen.
Wir erinnern uns (Satz 8.5), dass für eine Regelfunktion f ∈ R([a, b]) an einer
Stelle x ∈ [a, b] stets die einseitigen Grenzwerte f (x+) und f (x−) existieren.
Satz 11.10. Sei f ∈ R p . Wenn an einer Stelle x ∈ IR die einseitigen Ableitungen

f (x + t) − f (x+) f (x + t) − f (x−)
f  (x+) := lim und f  (x−) := lim
t→0+ t t→0− t

existieren, so gilt lim Sn ( f )(x) = 12 ( f (x+) + f (x−)).


n→
Wenn f überdies an der Stelle x stetig ist, konvergiert die Fourierreihe an diesem
Punkt also gegen den Funktionswert.
Beweis. Wegen Dn (−x) = Dn (x) ergibt sich mittels Substitution
( 0 ( 
f (x − y) Dn (y) dy = f (x + s) Dn (s) ds
− 0

und auch (  ( 
1
Dn (y) dy = Dn (y) dy =  .
0 2 −
Wir setzen dies in die Darstellung aus Lemma 11.3 ein und schreiben schließlich Dn
wie in Lemma 11.2. Damit erhalten wir
11.2 Konvergenz nach Dirichlet und Fejér 159

1
Sn ( f )(x) − ( f (x+) + f (x−))
2
( 
1 1
= f (x − y) Dn (y) dy − ( f (x+) + f (x−))
2 − 2
(
1 
= ( f (x + y) + f (x − y) − f (x+) − f (x−) ) Dn (y) dy
2 0

( 
 
1 f (x + y) − f (x+) f (x − y) − f (x−)  y
=  +  sin (2n + 1) dy .
 0 2 sin 2y 2 sin 2y 2

Mit der Regel von L’Hospital (Satz 7.15) gilt weiter

f (x + y) − f (x+) f (x − y) − f (x−)
lim  = f  (x+) und lim  = f  (x−) .
y→0+ 2 sin 2y y→0+ 2 sin 2y

Daher ist g : [0,  ] → IK mit g(0) := f  (x+) − f  (x−) und

f (x + y) − f (x+) f (x − y) − f (x−)
g(y) :=  +  für y = 0
2 sin 2y 2 sin 2y

im Nullpunkt stetig. Insbesondere ist g eine Regelfunktion und mit Satz 11.9 folgt
( 
1 1  y
lim Sn ( f )(x) − ( f (x+) + f (x−)) = lim g(y) sin (2n + 1) dy = 0
n→ 2 n→  0 2

und damit die Behauptung. 


Beispiele:
(1) Fourierkoeffizienten und Fourierreihe der Pulsfunktion f ∈ R p ,

1 für x ∈ [0,  ] ∪ {2 } ,
f (x) :=
−1 für x ∈ ] , 2 [ .

haben wir bereits berechnet. Mit Satz 11.10 folgt nun



4 
1 ⎨ 1 für x ∈ ]0,  [ ,

 2k + 1 sin(2k + 1)x = ⎪ −1 für x ∈ ] , 2 [ ,
 k=0 ⎩ 0 für x ∈ {0,  , 2 } .



Speziell für x = 2 erhalten wir mit sin (2k + 1) 2 = (−1)k den Wert

4  (−1)k  1 1 1
 2k + 1 = 1 ,
 k=0
also
4
= 1 − + − ± ···
3 5 7
160 11 Fourierreihen

(2) Sei f ∈ R p definiert durch f (x) := x2 für x ∈ [− ,  ]. Laut Satz 11.10 kon-
vergiert deren Fourierreihe überall gegen den Funktionswert.
( 
2
Wir berechnen die Fourierkoeffizienten. Es gilt f)(0) = x2 dx = ; mit
− 3
(  ( 
1 2 −ikx

 1
x2 e−ikx dx = x e
− 2x e−ikx dx
− −ik − −ik −

 ( 
1 1
1 4
= 2x e−ikx
− 2e−ikx dx = (−1)k 2
ik −ik − −ik − k

ergibt sich f)(k) = (−1)k k22 für k = 0 und wir erhalten


n n  
Sn f (x) =  f)(k) eikx = f)(0) +  f)(k) eikx + f)(−k) e−ikx
k=−n k=1
n n
2 2 ikx 2 (−1)k
= +  (−1)k (e + e −ikx
) = + 4  cos(kx) .
3 k=1 k2 3 k=1 k
2

Setzen wir etwa x = 0 oder x =  ein, so haben wir


 
2 (−1)k (−1)k 2
0 = f (0) = +4  2
⇒  2
= und
3 k=1 k k=1 k 12
 
2 1 1 2
 2 = f ( ) = +4  2 ⇒  k2 = .
3 k=1 k k=1 6

11.3 Konvergenz im quadratischen Mittel

Man kann leicht nachprüfen, daß C p := { f ∈ R p : f stetig} mit


( 2
1
 f , g := f (x) g(x) dx
2 0

ein Prähilbertraum ist. Mit der durch  f 2 :=  f , f  erklärten Norm ist C p ein
normierter Raum. Wir wissen auch bereits, dass {en : n ∈ ZZ} mit en (x) := einx eine
orthonormale Familie in C p bildet.
Für die Fourierkoeffizienten von f ∈ C p gilt nach Definition f)(k) =  f , ek .
Die Besselsche Ungleichung (4.2) für C p liefert
( 2  
1
2 0
| f (x)|2 dx =  f 22 ≥  | f , ek |2 =  | f)(k)|2 ;
k=− k=−
11.3 Konvergenz im quadratischen Mittel 161

insbesondere ist die Reihe rechts konvergent. Wir werden in Kürze sehen, dass hier
sogar Gleichheit gilt.

Satz 11.11. Seien f , g ∈ C p . Es gelten


(a)  f − Sn( f )2 → 0 mit n → ,
( 2 
1
(b)
2 0
| f (x)|2 dx =  | f)(k)|2 , (Parsevalsche Gleichung)
k=−
( 2 
1
(c)
2 0
f (x) g(x) dx =  f)(k) g)(k).
k=−

Beweis. (a) Sei  > 0. Nach dem Satz von Fejér (Satz 11.6) gibt es N ∈ IN mit
| f (x) − n ( f )(x)| <  für alle x ∈ [0, 2 ] und alle n ≥ N. Damit gilt auch
( 2 1/2
1
 f − n ( f )2 = | f (x) − n ( f )(x)|2 dx < für alle n ≥ N .
2 0

Betrachte nun für jedes n ∈ IN die orthonormale Familie {ek : k = −n, . . . , n}.
Satz 4.13 liefert  f − Sn ( f )2 ≤  f − n ( f )2 . Damit gilt auch  f − Sn ( f )2 < 
für alle n ≥ N.
(b) Laut dem Satz von Pythagoras (Satz 4.11) gilt
n
 f − Sn( f )22 =  f 22 −  | f)(k)|2 ≥ 0 .
k=−n

n
Mit (a) folgt lim  | f)(k)|2 =  f 22 . Dies ist genau die Parsevalsche Gleichung.
n→ k=−n

(c) Mit der Cauchy-Schwarz-Ungleichung (Korollar 4.12) erhalten wir





# $


n

n


 f , g −  f)(k) g)(k)
=
 f , g −  f)(k) ek , g
= | f , g − Sn ( f ), g|

k=−n


k=−n

= | f − Sn( f ), g| ≤  f − Sn ( f )2 g2 .

Daraus folgt mit (a) die Behauptung. 


Beispiel: Die Fourierkoeffizienten der durch f (x) := x2 für x ∈ [− ,  ] definierten


2
Funktion f ∈ C p kennen wir schon. Es gilt f)(0) = 3 und f)(k) = (−1)k k22 für k = 0.
Andererseits gilt
( 
1 1 1 5 4
 f 22 = x4 dx = ( − (− )5 ) = .
2 − 2 5 5
 2   2
4 2 2
Die Parsevalsche Gleichung liefert 5 = 3 +2  k2
.
k=1
162 11 Fourierreihen

Damit haben wir



1 1 4 4 4
 k4 = 8 5

9
=
90
.
k=1

Bemerkung: Die Folgerungen in Satz 11.11 gelten nicht nur für stetige Funktionen.
Darüberhinaus kann man Fourierkoeffizienten und Fourierreihen für eine weitaus
größere Klasse von Funktionen definieren, wenn man z.B. auch uneigentliche Inte-
grale zulässt oder indem man einen umfassenderen Integralbegriff benutzt, wie etwa
das Lebesgue-Integral. Man kann zeigen, dass die Eigenschaften (a), (b) und (c) aus
dem Satz äquivalent und sogar für alle Regelfunktionen erfüllt sind.

11.4 Aufgaben

1. Bestimmen Sie die Fourierkoeffizienten der 2 -periodischen Fortsetzung der


Funktion 
0, x<0,
f : ] −  ,  ] → IR , f (x) :=
x, x≥0.
Für welche x konvergiert hier die Fourierreihe gegen den Funktionswert ?

2. Bestimmen Sie die Fourierreihe der durch f (x) := |x| für x ∈ [− ,  ] definierten
Funktion f ∈ R p und berechnen Sie damit den Wert der Reihe

1
 (2k + 1)2 .
k=0

3. Bestimmen Sie die Fourierreihe der durch f (x) := 2 − |x| für x ∈ [− ,  ] defi-
nierten Funktion f ∈ R p und berechnen Sie mit Hilfe der Parsevalschen Glei-
chung den Wert der Reihe

1
 (2k + 1)4 .
k=0

4. Seien f ∈ R p , y ∈ IR. Weiter sei Ty f : IR → IR, Ty f (x) := f (x − y).


Bestimmen Sie die Fourierkoeffizienten von Ty f .

5. Sei f ∈ R p eine reellwertige Funktion. Zeigen Sie: Es gilt


n
a0
Sn ( f )(x) = +  (ak cos(kx) + bk sin(kx) ) ,
2 k=1

wobei a0 , a1 , a2 , . . . und b1 , b2 , . . . reelle Zahlen sind.


11.4 Aufgaben 163

6. Sei f ∈ R p . Zeigen Sie: In der Darstellung


n
a0
Sn ( f )(x) = +  (ak cos(kx) + bk sin(kx) )
2 k=1

gilt:

f gerade =⇒ bk = 0 für alle k ∈ IN ,


f ungerade =⇒ ak = 0 für alle k ∈ IN0 .

7. Es sei f : IR → C eine stetig differenzierbare 2 -periodische Funktion.


a. Zeigen Sie: Es gilt )
f  (k) = ik f)(k) für alle k ∈ ZZ.
b. Zeigen Sie: Es gilt d
dx n ( f )(x) = n ( f  )(x) für alle n ∈ IN0 .
c. Folgern Sie, dass eine Folge (Pn )n∈IN trigonometrischer Polynome existiert
derart, dass (Pn ) gleichmäßig auf [0, 2 ] gegen f konvergiert und auch (Pn )
gleichmäßig auf [0, 2 ] gegen f  konvergiert.

8. Seien f , g ∈ C p mit f)(k) = g)(k) für alle k ∈ ZZ.


Zeigen Sie, dass f = g gilt.
Kapitel 12
Kompaktheit

Erinnern wir uns an Satz 6.18, wo wir gezeigt haben, dass jede auf einem Inter-
vall der Form [a, b] stetige Funktion dort auch gleichmäßig stetig ist. Zu gegebenem
 > 0 können wir ein  > 0 finden, das für alle Punkte p ∈ [a, b] gut genug“ ist.

Wir betrachten nun Funktionen, deren Definitionsbereiche diese und verwandte Ei-
genschaften von [a, b] erfüllen. Zur Motivation wollen wir noch kurz einiges über
[a, b] festhalten.
(1) Da [a, b] beschränkt ist, besitzt jede Folge (xn )n∈IN in diesem Intervall ei-
ne konvergente Teilfolge, deren Grenzwert ebenfalls in [a, b] liegt. Das liegt
u.a. daran, dass die Randpunkte zur Menge [a, b] gehören; für ]a, b[ gilt dies
nicht, obwohl ]a, b[ beschränkt ist.
(2) Ist  > 0 gegeben, so reichen endlich viele Punkte x1 , . . . , xn ∈ [a, b], sodass
n
*
[a, b] ⊆ ]xk −  , xk +  [ gilt.
k=1

(3) Ist (Ik )k∈J mit einer beliebigen Index-Menge J eine Familie offener Intervalle
*
derart, dass [a, b] ⊆ Ik gilt, so reichen bereits endlich viele k1 , . . . , kn ∈ J
k∈J
aus, um [a, b] zu überdecken. (Dies haben wir noch nicht bewiesen!)

12.1 Kompakte metrische Räume

Die oben genannten drei Eigenschaften wollen wir auf beliebige metrische Räume
verallgemeinern.

Definition 12.1. Sei (X, dX ) ein metrischer Raum.


(1) Man nennt (X, dX ) folgenkompakt, falls jede Folge (xn )n∈IN in X eine in
(X, dX ) konvergente Teilfolge besitzt.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 165


DOI 10.1007/978-3-642-28644-5_12, © Springer-Verlag Berlin Heidelberg 2012
166 12 Kompaktheit

(2) Man sagt, (X, dX ) ist total beschränkt, falls für jedes  > 0 eine endliche
n
*
Menge von Punkten {x1 , . . . , xn } ⊆ X existiert, sodass X ⊆ U (xk ) gilt.
k=1
Die endliche Menge {x1 , . . . , xn } heißt dann  -Netz.
Bevor wir die Eigenschaft (3) formulieren können, benötigen wir eine exakte
Formulierung der Begriffe offen“ und abgeschlossen“ in metrischen Räumen.
” ”
Definition 12.2. Sei (X, dX ) ein metrischer Raum. Eine Teilmenge U ⊆ X heißt
offen in X, wenn es zu jedem a ∈ U ein  > 0 gibt mit U (a) ⊆ U. (Die leere
Menge ist auch offen!)
Eine Teilmenge A ⊆ X heißt abgeschlossen in X, wenn X \ A offen in X ist.
Eine Menge U ⊆ X heißt Umgebung von a ∈ X, falls ein  > 0 existiert mit
U (a) ⊆ U. Insbesondere ist U (a) für jedes  > 0 eine Umgebung von a in X.
Diese Umgebungen heißen  -Umgebungen.
Beispiele:
(1) In IR sind die Intervalle ]a, b[ offen und [a, b] abgeschlossen.
(2) In jedem metrischen Raum (X, dX ) ist X offen.
(3) In jedem metrischen Raum (X, dX ) ist U (a) offen und K (a) abgeschlossen.
Man beachte, dass es stets Mengen gibt, die sowohl abgeschlossen als auch offen
in X sind (z.B. X selbst). Es kann auch Teilmengen geben, die weder offen noch
abgeschlossen sind (z.B. Q in IR).

Weitere Beispiele:
(4) Die Intervalle [a, [ und ] − , b] sind abgeschlossen in IR. Die Intervalle
]a, [ und ] − , b[ sind offen in IR.
 
(5) Die Mengen ZZ und 1n : n ∈ ZZ \ {0} ∪ {0} sind abgeschlossen in IR.
(6) Sei X eine Menge versehen mit der diskreten Metrik, vgl. Beispiel (2) in
Kapitel 4.1. Dann ist jede Teilmenge von X offen und auch abgeschlossen.
Satz 12.3. Sei (X, dX ) ein metrischer Raum; U,V und Ui (i ∈ I, I eine beliebige
Indexmenge) seien offene Mengen in X. Dann gelten:
(a) ∅ und X sind offen in X.
(b) U ∩V ist offen in X.
*
(c) W := Ui ist offen in X.
i∈I

Beweis. (a) wissen wir bereits.


Zum Nachweis von (b) sei x ∈ U ∩V . Dann gibt es  > 0 mit U (x) ⊆ U und  > 0
mit U (x) ⊆ V . Für  := min( ,  ) gilt dann U (x) ⊆ U ∩V . Also ist U ∩V offen.
Wir zeigen noch (c). Ist x ∈ W so gilt x ∈ Ui0 *für (mindestens) ein i0 ∈ I und damit
existiert  > 0 mit U (x) ⊆ Ui0 , also U (x) ⊆ Ui . 

i∈I
12.1 Kompakte metrische Räume 167

Satz 12.4. Seien (X, dX ) und (Y, dY ) metrische Räume, f : X → Y eine Abbildung.
Folgende Eigenschaften sind äquivalent:
(i) f ist stetig.
(ii) Für jede offene Teilmenge V ⊆ Y ist das Urbild f −1 (V ) offen in X.
(iii) Für jede abgeschlossene Teilmenge B ⊆ Y ist f −1 (B) abgeschlossen in X.
Beweis. (i)⇒(ii): Sei V offen in Y .
Zu a ∈ f −1 (V ) und b = f (a) ∈ V existiert ein  > 0 mit U (b) ⊆ V . Wegen der
Stetigkeit von f gibt es  > 0 mit f (U (a)) ⊆ U (b), also gilt U (a) ⊆ f −1 (V ).
Damit ist gezeigt, daß f −1 (V ) offen ist.
(ii)⇒(i): Seien a ∈ X,  > 0.
Da U ( f (a)) offen in Y ist, ist auch U := f −1 (U ( f (a))) offen in X. Daher gibt
es ein  > 0 mit U (a) ⊆ U.
Dies bedeutet f (U (a)) ⊆ U ( f (a)), d.h. f ist in a stetig.
(ii)⇒(iii): Sei B ⊆ Y abgeschlossen.
Dann ist Y \ B offen in Y und damit auch f −1 (Y \ B) = X \ f −1 (B) offen in X.
Somit ist f −1 (B) abgeschlossen.
Ganz analog zeigt man auch (iii)⇒(ii). 

Sei nun K ⊆ (X, dX ). Eine offene Überdeckung von K ist eine Familie {Ui : i ∈ I}
(I eine beliebige Indexmenge) von offenen Teilmengen von X, sodass
+
K ⊆ Ui .
i∈I

Definition 12.5. Eine Teilmenge K des metrischen Raumes (X, dX ) heißt kompakt,
falls jede offene Überdeckung von K eine endliche Teilüberdeckung von K enthält.
Mit anderen Worten: Zu jeder offenen Überdeckung {Ui : i ∈ I} von K existieren
endlich viele Indizes i1 . . . , in ∈ I, sodass
n
+
K ⊆ Ui j
j=1

gilt. (Selbstverständlich kann auch K = X sein.)


Zunächst wollen wir zwei Beispiele für nicht kompakte Mengen angeben.
(1) Sei X = IR (mit der natürlichen Metrik). Dann ist {Un : n ∈ IN} mit Un :=
] − n, n[ eine offene Überdeckung von IR. Mit endlich vielen dieser Un kann
man offensichtlich nicht ganz IR überdecken. Also ist IR nicht kompakt.
 & 1 1' 
(2) Sei wieder X = IR und K = ]0, 1[. Es ist 3n , n : n ∈ IN eine offene Über-
deckung von ]0, 1[. Es gibt daraus keine endliche Teilüberdeckung, denn zu
jeder solchen Teilüberdeckung gehören endlich viele Indizes n1 , . . . , nk . Aus
diesen wähle den größten Index n.
k ,
* -
1 1 1
Dann ist 4n ∈
/ 3n j n j . Also ist ]0, 1[ nicht kompakt.
,
j=1
168 12 Kompaktheit

Wir werden in Kürze sehen, dass [0, 1] kompakt ist. Wir werden sogar zeigen, dass
eine Teilmenge K ⊆ IR genau dann kompakt ist, wenn sie beschränkt und abge-
schlossen ist. Ein erster Schritt ist der folgende Sachverhalt, der für jeden metrischen
Raum gilt.
Satz 12.6. Sei K eine kompakte Teilmenge des metrischen Raumes (X, dX ).
Dann ist K abgeschlossen und beschränkt.
Beweis. Zur Beschränktheit wähle a ∈ K. (Im Fall K = ∅ ist die Behauptung klar.)
Dann ist {Un (a) : n ∈ IN} eine offene Überdeckung von K und es gibt endlich viele
n1 , . . . , nk , sodass
k
+
K ⊆ Unk (a)
j=1

gilt. Mit m := max(n1 , . . . , nk ) folgt dann K ⊆ Um (a), also ist K beschränkt.


Wir müssen noch zeigen, dass X \ K offen ist. Sei dazu a ∈ X \ K. (Für X \ K = ∅ gilt
die Behauptung offensichtlich.) Zu zeigen ist, dass es  > 0 gibt mit U (a) ⊆ X \ K.
Für x ∈ K setzen wir  (x) := 12 d(x, a) > 0. Nun ist {U (x) (x) : x ∈ K} eine offene
Überdeckung von K und, da K kompakt ist, gibt es endlich viele x1 , . . . , xn ∈ K mit
n
+
K ⊆ U (x j ) (x j ) .
j=1

Weiter sei  := min{ (x1 ), . . . ,  (xn )}. Es gilt  > 0. Wir wollen noch einsehen,
dass U (a) ⊆ X \ K ist.
Zu jedem x ∈ K gibt es ein j ∈ {1, . . . , n} mit x ∈ U (x j ) (x j ), also d(x, x j ) <  (x j ).
Folglich gilt mit der Dreiecksungleichung

d(x, a) ≥ d(x j , a) − d(x, x j ) > 2 (x j ) − d(x, x j ) >  (x j ) ≥  ,

also x ∈
/ U (a). Damit gilt U (a) ⊆ X \ K. 

Das nächste Resultat erleichtert den Nachweis der Kompaktheit einer Teilmenge
erheblich, falls man die Kompaktheit einer Obermenge weiß.
Satz 12.7. Sei K eine kompakte Teilmenge des metrischen Raumes (X, dX ).
Ist A ⊆ K abgeschlossen, so ist A kompakt.
Beweis. Sei {Ui : i ∈ I} eine offene Überdeckung von A.
Damit ist {Ui : i ∈ I} ∪ {X \ A} eine offene Überdeckung von K. Also existieren
endlich viele i1 , . . . , in ∈ I mit
n
+
K⊆ Ui j ∪ (X \ A)
j=1

n
*
(wobei man X \ A eventuell gar nicht braucht). Nun gilt A ⊆ Ui j . 

j=1
12.1 Kompakte metrische Räume 169

Von großer Bedeutung ist der Begriff Kompaktheit in Verbindung mit der Stetigkeit.
Satz 12.8. Seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y eine stetige
Abbildung. Weiter sei K ⊆ X kompakt.
Dann ist auch f (K) kompakt.
Beweis. Sei {Ui : i ∈ I} eine offene Überdeckung von f (K) in Y .
Mit Satz 12.4 ist dann { f −1 (Ui ) : i ∈ I} eine offene Überdeckung von K, denn
jedes x ∈ K erfüllt f (x) ∈ Ui für ein geeignetes i ∈ I.
n
* n
*
Daher existieren i1 , . . . , in ∈ I mit K ⊆ f −1 (Ui j ) und es folgt f (K) ⊆ Ui j .
j=1 j=1
Also ist f (K) kompakt. 

Korollar 12.9. Seien (X, dX ) ein kompakter metrischer Raum und f : X → IR eine
stetige Abbildung.
Dann nimmt f ihr Supremum und ihr Infimum an, d.h. es existieren a, b ∈ X mit

f (a) = sup{ f (x) : x ∈ X} = max{ f (x) : x ∈ X} ,


f (b) = inf{ f (x) : x ∈ X} = min{ f (x) : x ∈ X} .

Beweis. Laut Satz 12.8 ist f (X) kompakt, also auch abgeschlossen und beschränkt.
Folglich existieren M := sup{ f (x) : x ∈ X} und m := inf{ f (x) : x ∈ X} in IR.
Angenommen, es gilt M ∈ / f (X). Dann gäbe es, da IR \ f (X) offen ist, ein  > 0
mit ]M −  , M +  [ ⊆ IR \ f (X) und M −  wäre eine kleinere obere Schranke von
f (X) als M. Daher muss M ∈ f (X) und analog auch m ∈ f (X) sein. 

Bemerkung: Korollar 12.9 verallgemeinert die Aussage von Satz 6.16, in welchem
X = [a, b] vorausgesetzt wird.
Korollar 12.10. Seien (X, dX ) und (Y, dY ) zwei metrische Räume. Weiter seien
(X, dX ) kompakt und f : X → Y eine stetige bijektive Abbildung.
Dann ist die Umkehrabbildung f −1 : Y → X auch stetig.
Beweis. Wir verwenden die Stetigkeits-Charakterisierung (iii) aus Satz 12.4.
Sei B ⊆ X abgeschlossen. Laut Satz 12.7 ist B kompakt, und mit Satz 12.8 folgt,
dass f (B) kompakt in Y ist. Nach Satz 12.6 ist schließlich f (B) = ( f −1 )−1 (B) ab-
geschlossen in Y .
Somit ist f −1 stetig. 

Wir wollen uns kurz an einem Beispiel veranschaulichen, dass auf die Kompaktheit
von X nicht verzichtet werden kann.
Die Funktion f : [0, 2 [ → T := {z ∈ C : |z| = 1}, f (t) := eit = cost + i sint, ist
eine bijektive Abbildung von [0, 2 [ auf T. Sie ist bekanntermaßen stetig. Ihre Um-
kehrabbildung ist jedoch nicht stetig im Punkt 1 ∈ T, denn jede Umgebung dieses
Punktes wird durch f −1 abgebildet auf eine Menge, die auch Punkte in der Nähe
von 2 enthält.
170 12 Kompaktheit

Nach den gezeigten Ergebnissen ist es an der Zeit, kompakte Mengen näher zu
beschreiben. Notwendigerweise sind kompakte Mengen abgeschlossen und be-
schränkt. Für Teilmengen von IK (sogar IKn ) ist dies auch hinreichend für Kom-
paktheit, wie wir noch sehen werden.
Der nächste Satz und das folgende Korollar verallgemeinern eine Eigenschaft der
Intervallschachtelungen in IR.
Satz 12.11. Sei K = {Ki : i ∈ I} eine Familie von kompakten Teilmengen eines me-
trischen Raumes (X, d) derart, dass der Schnitt von endlich vielen Mengen aus K
stets nicht leer ist.

Dann gilt Ki = ∅.
i∈I

Beweis. Wir wählen ein festes K ∈ K und setzen Ui := X \ Ki . Angenommen, es gilt


   *
∅ = Ki = K ∩ ( Ki ). Dann ist K ⊆ X \ ( Ki ), also K ⊆ Ui .
i∈I i∈I i∈I i∈I
Demnach ist {Ui : i ∈ I} ist eine offene Überdeckung von K.
Da K kompakt ist, reichen endlich viele Ui1 , . . . ,Uin aus, um K zu überdecken, etwa
n
* n

K ⊆ Ui j . Nun folgt K ∩ ( Ki j ) = ∅, im Widerspruch zu Voraussetzung. 

j=1 j=1

Wir notieren noch einen Spezialfall.


Korollar 12.12. Ist {Kn : n ∈ IN} eine Folge kompakter (nicht leerer) Mengen eines


metrischen Raumes mit Kn ⊇ Kn+1 für alle n, so gilt Kn = ∅.
n=1

Wir erinnern an die Definition von folgenkompakt und total beschränkt. Der nächste
Satz sagt aus, dass ein kompakter metrischer Raum stets folgenkompakt ist.
Satz 12.13. In einem kompakten metrischen Raum (X, d) besitzt jede Folge (xn )n∈IN
eine konvergente Teilfolge.
Beweis. Wenn die Menge {xn : n ∈ IN} endlich ist, gibt es sogar eine konstante
Teilfolge und die Behauptung ist erfüllt.
Sei also {xn : n ∈ IN} unendlich. Wir benutzen Lemma 4.17 und nehmen an, dass
kein Punkt aus X Häufungswert von (xn )n∈IN ist. Dann gibt es zu jedem a ∈ X eine
offene Umgebung Va , die höchstens einen Punkt aus {xn : n ∈ IN} enthält (nämlich
xm , falls a = xm für ein m ∈ IN ist).
Andererseits ist {Va : a ∈ X} eine offene Überdeckung von X und, da X kompakt
ist, gibt es eine endliche Teilfamilie, die bereits ganz X überdeckt. Dies steht im
Widerspruch dazu, dass die Vereinigung endlich vieler der Va noch nicht einmal die
Menge {xn : n ∈ IN} ganz enthalten kann.
Daher ist die Annahme falsch. Die Folge besitzt demnach einen Häufungswert
und damit auch eine (vgl. Lemma 4.17) gegen diesen konvergente Teilfolge. 

Satz 12.14. Sei (X, d) ein metrischer Raum. Ist X folgenkompakt, so ist X auch total
beschränkt und vollständig.
12.2 Charakterisierung kompakter Mengen 171

Beweis. Zum Nachweis der Vollständigkeit sei (xn )n∈IN eine Cauchyfolge in X. Wir
müssen zeigen, dass diese einen Grenzwert in X besitzt.
Da X folgenkompakt ist, existiert wenigstens eine konvergente Teilfolge (xnk )k∈IN
mit lim xnk =: x ∈ X.
k→
Sei  > 0. Es gibt N1 ∈ IN mit d(xn , xm ) < 2 für alle n, m ≥ N1 . Ferner gibt es
N2 ∈ IN mit d(xnk , x) < 2 für alle k ≥ N2 . Setze N := max{N1 , N2 }. Zu n ≥ N wählen
wir ein k ≥ N2 mit nk ≥ N1 und erhalten

d(xn , x) ≤ d(xn , xnk ) + d(xnk , x) <  .

Daher konvergiert auch (xn )n∈IN gegen x und die Vollständigkeit ist bewiesen.
Wir nehmen nun an, dass X nicht total beschränkt ist. Dann existiert ein  > 0,
sodass es kein  -Netz für X gibt. Nun können wir rekursiv eine Folge (xn )n∈IN kon-
struieren mit d(xn , xm ) ≥  für alle n, m ∈ IN, n = m:
Sind x1 , . . . , xn bereits gefunden, so erhält man xn+1 durch Auswahl eines Ele-
n
*
mentes aus X \ U (xk ) = ∅.
k=1
Offensichtlich gilt d(xk , xn+1 ) ≥  für alle k = 1, . . . , n. Diese Folge kann aber
keine konvergente Teilfolge enthalten. Damit ist die Behauptung nachgewiesen. 

12.2 Charakterisierung kompakter Mengen

Betrachtet man Satz 12.13 und Satz 12.14 zusammen, so stellt sich die Frage, ob
aus totaler Beschränktheit plus Vollständigkeit die Kompaktheit folgt. In der Tat gilt
der folgende Satz.

Satz 12.15. Sei (X, d) ein metrischer Raum. Folgende Bedingungen sind äquivalent:
(i) X ist kompakt.
(ii) X ist folgenkompakt.
(iii) X ist total beschränkt und vollständig.

Beweis. Es bleibt nur noch die Implikation (iii)⇒(i) zu zeigen. Sei also X total
beschränkt und vollständig.
Wir nehmen an, dass X nicht kompakt ist, d.h. es existiere eine offene Überdeckung
{Ui : i ∈ I} von X, die keine endliche Teilüberdeckung von X enthält. Gestützt auf
diese Annahme konstruieren wir eine Folge (xn )n∈IN in X mit
1
(1) d(xn , xn+1 ) ≤ ,
2n−1
(2) U1/2n−1 (xn ) kann nicht durch eine endliche Teilüberdeckung von {Ui : i ∈ I}
überdeckt werden.
172 12 Kompaktheit
m
*
Wir starten mit n = 1. Sei {y1 , . . . , ym } ein 1-Netz. Dann ist X = U1 (yk ).
k=1
Nach Annahme existiert mindestens ein U1 (yk ), das nicht von endlich vielen Ui
überdeckt wird; wir setzen x1 := yk .
Seien x1 , . . . , xn bereits gefunden, sodass (1) und (2) gelten.
1
Da U1/2n−1 (xn ) offensichtlich total beschränkt ist, finden wir ein 2n -Netz für
U1/2n−1 (xn ), welches wir mit {y1 , . . . , ym } bezeichnen.
Wegen (2) kann U1/2n−1 (xn ) nicht durch endlich viele Ui überdeckt werden, also
existiert ein U1/2n (yk ) das auch nicht durch endlich viele Ui überdeckt wird. Setze
xn+1 := yk und die Folge (xn )n∈IN mit den geforderten Eigenschaften ist rekursiv
konstruiert.
Nun ist diese eine Cauchyfolge, denn für m > n gilt

d(xm , xn ) ≤ d(xm , xm−1 ) + d(xm−1 , xm−2 ) + . . . + d(xn+1, xn )


1 1 2 1
≤ + ...+ < = .
2m−2 2n−1 2n−1 2n−2
Da X vollständig ist, existiert x := lim xn ∈ X.
n→
Weiter gibt es j ∈ I mit x ∈ U j und  > 0 mit U (x) ⊆ U j . Dazu finden wir N ∈ IN
mit d(xn , x) < 2 und 2n−1
1
< 2 für alle n ≥ N. Für y ∈ U1/2N−1 (xN ) gilt nun

1 
d(y, x) ≤ d(y, xN ) + d(xN , x) < + < ,
2N−1 2
also U1/2N−1 (xN ) ⊆ U (x) ⊆ U j im Widerspruch zu (2). Damit war unsere Annahme
falsch und X ist kompakt. 

Dieser wichtige Satz liefert eine Charakterisierung kompakter Mengen. Speziell für
Teilmengen A ⊆ (IKd ,  · 2 ) reicht es nun zu zeigen, dass A folgenkompakt ist.
Ziehen wir den Satz von Bolzano-Weierstraß (genauer: Korollar 4.20) heran, so
sieht man, dass noch zu untersuchen ist, für welche Mengen A ⊆ IKd folgendes gilt:
Ist (an )n∈IN eine konvergente Folge in IKd mit an ∈ A für alle n ∈ IN, so ist auch
a = lim an ∈ A. Dazu machen wir folgende Beobachtung.
n→

Lemma 12.16. Seien A eine beliebige Teilmenge eines metrischen Raumes (X, d)
und a ∈ X.
Es gibt eine Folge (an )n∈IN mit an ∈ A für alle n und a = lim an genau dann,
n→
wenn für jedes  > 0 der Schnitt A ∩U (a) nicht leer ist.

Beweis. Existiert eine derartige Folge, so gilt bei beliebigem  > 0 stets d(an , a) < 
für alle bis auf höchstens endlich viele n, also an ∈ A ∩U (a) für alle diese n.
Ist umgekehrt A ∩ U (a) = ∅ für alle  > 0, so gibt es zu jedem n ∈ IN ein an ∈ A
mit d(an , a) < 1n . Damit gilt a = lim an . 

n→
12.2 Charakterisierung kompakter Mengen 173

Satz 12.17 (Charakterisierung abgeschlossener Teilmengen). Sei A eine Teil-


menge eines metrischen Raumes (X, d).
Die Menge A ist abgeschlossen in X genau dann, wenn für jede in X konvergente
Folge (an )n∈IN mit an ∈ A ∀n auch a := lim an ∈ A gilt.
n→

Beweis. Seien A abgeschlossen in X und (an )n∈IN eine Folge mit an ∈ A ∀n und
a = lim an .
n→
Wäre a ∈ X \ A, so gäbe es ein  > 0 mit U (a) ⊆ X \ A, da X \ A offen ist, und
damit U (a) ∩ A = ∅. Dies steht im Widerspruch dazu, dass U (a) sogar unendlich
viele an ∈ A enthalten muss.
Für die umgekehrte Implikation bezeichne

A := {a ∈ X : ∃ (an )n∈IN , an ∈ A ∀n ∈ IN , a = lim an } .


n→

Offensichtlich gilt immer A ⊆ A, denn zu a ∈ A kann man an = a ∀n wählen.


Nach Voraussetzung gilt nun A = A. Wir müssen zeigen, dass X \ A offen ist.
Sei dazu a ∈ X \ A = X \ A. Dann gibt es keine Folge (an )n∈IN mit an ∈ A ∀n und
a = lim an . Nach Lemma 12.16 existiert  > 0 mit U (a) ⊆ X \ A.
n→
Folglich ist X \ A offen, also A abgeschlossen in X. 

Die Menge A aus dem Beweis von Satz 12.17 nennt man den Abschluss (oder die
abgeschlossene Hülle) von A. Jeder Punkt a ∈ A heißt Berührpunkt von A.
In IR gilt beispielsweise ]a, b[ = [a, b] = ]a, b]. Allgemein gilt Ur (x) = Kr (x).
Nun können wir alle kompakten Teilmengen in (IKd ,  · 2 ) charakterisieren.

Korollar 12.18. Sei K eine Teilmenge des Euklidischen Raumes (IKd ,  · 2).
Folgende Eigenschaften sind äquivalent:
(i) K ist kompakt.
(ii) K ist abgeschlossen und beschränkt.

Beweis. Die Implikation (i)⇒(ii) gilt in jedem metrischen Raum (Satz 12.6).
Sei nun K abgeschlossen und beschränkt.
Laut Korollar 4.20 besitzt jede Folge in K eine konvergente Teilfolge. Da K ab-
geschlossen ist, liegt auch deren Grenzwert in K, siehe Satz 12.17.
Also ist K folgenkompakt; mit Satz 12.15 ist K dann auch kompakt. 

Insbesondere sind alle Kr (a) ⊆ IKd oder [a1 , b1 ] × . . . × [ad , bd ] ⊆ IRd kompakt.

Wir wollen noch ein Beispiel angeben für eine Teilmenge eines metrischen Raumes,
die zwar abgeschlossen und beschränkt, aber nicht kompakt ist.
174 12 Kompaktheit

In (2 ,  · 2), vgl. Kapitel 5.6, betrachten wir

em := (0, . . . , 0, 1, 0, 0, . . .)

m-te Stelle

für m ∈ IN und M := {em : m ∈ IN}.


Die Menge M ist beschränkt,
√ denn es gilt x2 = 1 für alle x ∈ M. Weiter gilt für
k = m stets em − ek 2 = 2; daher ist eine Folge in M nur dann konvergent, wenn
sie ab einem gewissen Index konstant ist, und ihr Grenzwert gehört dann offensicht-
lich wieder zu M. Folglich ist M auch abgeschlossen in (2 ,  · 2).
Allerdings ist M nicht kompakt, denn wir können leicht eine offene Überde-
ckung von M angeben, die keine endliche Teilüberdeckung besitzt: Wir setzen
Vm := U1 (em ). Dann ist {Vm : m ∈ IN} nach Konstruktion eine offene√Überdeckung
von M. Da zwei beliebige Elemente aus M aber stets den Abstand 2 haben, gilt
Vm ∩ M = {em } für alle m. Damit ist auch klar, dass endlich viele der Vm niemals
ausreichen können, um M zu überdecken.

Abschließend wenden wir uns wieder stetigen Funktionen zu und erinnern an den
Begriff der gleichmäßigen Stetigkeit, siehe Definition 6.17.
Man beachte die Unterschiede zwischen gleichmäßiger Stetigkeit und Stetig-
keit. Aus gleichmäßiger Stetigkeit folgt Stetigkeit. Aber: Gleichmäßige Stetigkeit
ist die Eigenschaft einer Funktion auf einer Menge, Stetigkeit wird für Punkte aus
der Menge erklärt.
In der  - -Definition der Stetigkeit in einem Punkt p ∈ X kann das zu findende
 von p ∈ X abhängen. Bei gleichmäßiger Stetigkeit hängt  nur von  ab und die
 - -Bedingung gilt auf ganz X.
Wir zeigen noch eine Verallgemeinerung von Satz 6.18.

Satz 12.19. Seien (X, dX ) und (Y, dY ) zwei metrische Räume, f : X → Y eine stetige
Abbildung.
Ist (X, dX ) kompakt, so ist f gleichmäßig stetig auf X.

Beweis. Wir nehmen an, dass f nicht gleichmäßig stetig auf X ist. Dann gibt es
 > 0, sodass zu beliebigem n ∈ IN Punkte xn , yn ∈ X mit dX (xn , yn ) < 1n aber
dY ( f (xn ), f (yn )) ≥  existieren.
Da (X, dX ) kompakt und damit auch folgenkompakt ist, existiert eine Teilfolge
(xnk )k∈IN , die gegen ein x ∈ X konvergiert. Wegen dX (xn , yn ) < 1n konvergiert auch
ynk → x und mit der Stetigkeit von f folgt f (xnk ) → f (x) sowie auch f (ynk ) → f (x)
für k → . Andererseits gilt
  
 ≤ dY f (xnk ), f (ynk ) ≤ dY f (xnk ), f (x) + dY f (ynk ), f (x)

für alle k und wir erhalten einen Widerspruch. 



12.3 Aufgaben 175

Bemerkung: Man kann den Begriff der Kompaktheit auch noch verallgemeinern,
ohne dabei auf einen metrischen Raum zurückgreifen zu müssen.
Seien M eine beliebige Menge und T ein System von Teilmengen von M mit den
folgenden Eigenschaften:
(i) ∅, M ∈ T
(ii) Der Schnitt zweier Mengen aus T gehört stets wieder zu T.
(iii) Die Vereinigung beliebig vieler Mengen aus T gehört stets wieder zu T.
Dann bezeichnet man T als eine Topologie auf M.
Satz 12.3 besagt also, dass die in einem metrischen Raum (X, d) offenen Men-
gen eine Topologie auf X bilden. In Anlehnung daran heißen die Elemente einer
Topologie offen, auch wenn kein metrischer Raum zu Grunde liegt. Nun kann man
auch abgeschlossene (als Komplemente von offenen) Mengen und mittels Überde-
ckungen auch kompakte Mengen erklären. Sogar Stetigkeit kann sinnvoll definiert
werden, wenn man hierzu die Charakterisierung analog zu Satz 12.4 verwendet. Ei-
ne Einführung in die Topologie findet man z.B. in Büchern von K. Jänich [10] oder
B. von Querenburg [18].

12.3 Aufgaben

1. Untersuchen Sie direkt an Hand der Definition (also ohne Hilfe von Korollar
12.18), welche der folgenden Mengen kompakt in IR sind:
 
A := ] − 1, 1[ B := 1n : n ∈ IN C := B ∪ {0}

2. Zeigen Sie: Jede endliche Teilmenge eines metrischen Raumes ist kompakt.

3. Seien K1 , . . . , Kn kompakte Mengen in einem metrischen Raum (X, d).


n
*
Zeigen Sie, dass auch K j kompakt ist.
j=1

4. Zeigen Sie, dass Q weder offen noch abgeschlossen in IR ist.

5. Zeigen Sie, dass ] − 1, 1[ weder offen noch abgeschlossen in C ist.

6. Seien X eine Menge, dX die diskrete Metrik auf X.


a. Zeigen Sie, dass jede Teilmenge M ⊆ X sowohl offen als auch abgeschlos-
sen in (X, dX ) ist.
b. Sei (Y, dY ) ein weiterer metrischer Raum. Bestimmen Sie alle stetigen Ab-
bildungen (X, dX ) → (Y, dY ).
176 12 Kompaktheit

7. Geben Sie jeweils ein Beispiel einer stetigen Funktion f : IR → IR an mit der
Eigenschaft:
a. Es gibt eine offene Menge U derart, dass f (U) nicht offen ist.
b. Es gibt eine abgeschlossene Menge A derart, dass f (A) nicht abgeschlossen
ist.

8. Gegeben seien die folgenden Mengen:


a. M ⊆ IRn endlich; X = IRn .
b. M = [0, 1]× ]0, 1[ ; X = IR2 .
c. M = {(x, y, z) ∈ IR3 : 0 < x2 + y2 + z2 < 1}; X = IR3 .
  
d. M = x, sin 1x ∈ IR2 : x = 0 ; X = IR2 .
Ist M offen in X ? Ist M abgeschlossen in X ? Bestimmen Sie jeweils den Ab-
schluss M von M in X.

9. a. Seien (M, d) ein vollständiger metrischer Raum und T ⊆ M.


Zeigen Sie: T ist abgeschlossen in M genau dann, wenn (T, d) vollständig
ist.
b. Folgern Sie: Ein abgeschlossener Unterraum eines Banachraumes ist selbst
auch ein Banachraum.
c. Bestimmen Sie den Abschluss des Raumes T ([a, b]) der Treppenfunktio-
nen in (B([a, b]),  · ).

10. Gegeben sei eine Funktion f : I → IR auf einem kompakten Intervall I.


Zeigen Sie, dass f genau dann stetig ist, wenn der Graph

G f := {(x, f (x) ) : x ∈ I}

kompakt im IR2 ist.


Kapitel 13
Normierte Vektorräume

Als Vektorraum wollen wir diesem Kapitel stets einen Vektorraum über dem Körper
IR verstehen. Bevor wir Abbildungen von Intervallen in normierte Vektorräume un-
tersuchen, werden wir die Stetigkeit von linearen Abbildungen zwischen normierten
Vektorräumen diskutieren.
Seien V und W Vektorräume. Eine Abbildung L : V → W heißt linear, wenn
L( x +  y) =  L(x) +  L(y) für alle x, y ∈ V und alle  ,  ∈ IR gilt. Üblicherweise
schreibt man oft kurz Lx an Stelle von L(x).
Wenn wir von normierten Vektorräumen V und W sprechen, so bezeichnen wir,
wenn nicht anders angegeben, die zugehörigen Normen mit  · V bzw.  · W .
Einige Grundlagen, wie etwa den Begriff Basis eines Vektorraumes oder die Dar-
stellung einer linearen Abbildung zwischen endlichdimensionalen Vektorräumen
mittels einer Matrix, setzen wir hier als bekannt voraus. Darüberhinaus sei auch
auf Lehrbücher zur linearen Algebra, wie etwa G. Fischer [5], verwiesen.

13.1 Stetige lineare Abbildungen

Satz 13.1. Seien V und W normierte Vektorräume sowie L : V → W linear.


Die folgenden Eigenschaften sind äquivalent:
(i) Die Abbildung L ist gleichmäßig stetig auf V .
(ii) Die Abbildung L ist stetig im Nullpunkt 0V von V .
(iii) Die Menge {LxW : x ∈ V, xV ≤ 1} ist beschränkt.
Beweis. Der Schluss (i)⇒(ii) ist selbstverständlich.
Die Implikation (ii)⇒(iii) zeigen wir indirekt.
Angenommen, die Menge in (iii) ist unbeschränkt. Dann existiert zu jedem n ∈ IN
ein xn ∈ V mit xn V ≤ 1 und Lxn W ≥ n. Für yn := 1n xn gilt dann yn V ≤ 1n und
Lyn W = 1n Lxn W ≥ 1. Da für eine lineare Abbildung L : V → W stets L 0V = 0W
gilt, folgt wegen lim yn = 0V , dass L in 0V nicht stetig ist.
n→

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 177


DOI 10.1007/978-3-642-28644-5_13, © Springer-Verlag Berlin Heidelberg 2012
178 13 Normierte Vektorräume

Zu zeigen bleibt (iii)⇒(i).


Nach Voraussetzung ist M := sup{LxW : x ∈ V, xV ≤ 1} < . Wir wollen
sehen, dass
Lx − LyW ≤ Mx − y für alle x, y ∈ V
gilt. Daraus folgt direkt die gleichmäßige Stetigkeit von L auf V .
Zum Nachweis braucht nur der Fall x = y betrachtet zu werden. Dann haben wir
1
x − yV > 0 und für z := x−y V
(x − y) gilt zV = 1.
1
Somit ist x−yV L(x − y)W = LzW ≤ M und wir sind am Ziel. 

Definition 13.2. Zu jeder stetigen linearen Abbildung L : V → W normierter Vek-
torräume wird die Operatornorm definiert durch

L := sup{LxW : x ∈ V, xV ≤ 1} .

Die Menge aller stetigen linearen Abbildungen V → W bezeichnen wir mit L (V,W ).
Satz 13.3. Mit der Operatornorm ist L (V,W ) ein normierter Vektorraum.
Beweis. Die Gesamtheit der linearen Abbildungen V → W bildet (unter punktwei-
ser Addition und Skalarmultiplikation) einen Vektorraum. Da Summen und reelle
Vielfache stetiger Abbildungen wiederum stetig sind, ist die Teilmenge L (V,W )
ein Untervektorraum. Es bleibt zu zeigen, dass die Operatornorm auch tatsächlich
eine Norm ist.
Nach Konstruktion ist stets L ≥ 0. Im Fall L = 0 gilt Lx = 0V für alle x ∈ V
mit xV ≤ 1. Daraus folgt Lx = 0V für alle x ∈ V , also L = 0. Dies beweist (N1).
Für nichtleere, beschränkte Mengen B ⊆ IR und r ≥ 0 gilt bekanntlich sup(rB) =
r sup B. Dies liefert für  ∈ IR und L ∈ L (V,W ) stets  L = | | L; somit ist
auch (N2) erfüllt.
Für L, L ∈ L (V,W ) und x ∈ V haben wir

(L + L )xW = Lx + L xW ≤ LxW + L xW .

Zunächst folgt (L + L )xW ≤ L + L  für x ∈ V mit xV ≤ 1 und daraus dann
(L + L ) ≤ L + L, die Dreiecksungleichung (N3). 

Bemerkungen:
(1) Mit der Operatornorm erhält man die Abschätzung LxW ≤ L xV für
alle L ∈ L (V,W ) und alle x ∈ V .
(2) Im Fall V = W schreibt man L (V ) := L (V,V ) und nennt L ∈ L (V ) einen
stetigen Endomorphismus von V .
Mit L, L ∈ L (V ) gilt auch LL := L ◦ L ∈ L (V ). Aus der Abschätzung
LL xV ≤ L L xV ≤ L L  xV ergibt sich schließlich noch die so
genannte Submultiplikativität der Operatornorm:

LL  ≤ L L  für alle L, L ∈ L (V ) .


13.1 Stetige lineare Abbildungen 179
x1 
Beispiel: Für x = (xn )n∈IN ∈ 2 sei Lx := 1 , x22 , x33 , . . . .
1
Mit yn := n ist y = (yn )n∈IN ∈ 2 und laut Satz 5.23 gilt Lx = xy ∈ 1 .
Damit ist eine (wie man leicht nachprüfen kann) lineare Abbildung L : 2 → 1
erklärt. Da nach Satz 5.23 auch Lx1 ≤ x2 y2 gilt, haben wir insbesondere
Lx1 ≤ y2 für alle x ∈ 2 mit x2 ≤ 1.
Daraus folgt die Stetigkeit von L und auch L ≤ y2 .
1
Betrachtet man speziell x = y2 y, so gilt x2 = 1 und Lx1 = y2 .
Insgesamt erhalten wir
 1
 2
1 
L = y2 =  n2 =√ .
6
n=1

Definition 13.4. Zwei Normen  ·  und  ·  auf einem Vektorraum V heißen äqui-
valent, wenn es Schranken M, M  > 0 gibt mit

x ≤ M x und x ≤ M  x für alle x ∈ V .

Satz 13.5. (a) Zwei Normen eines Vektorraums V sind genau dann äquivalent,
wenn sie die selben Cauchyfolgen besitzen.
(b) Äquivalente Normen haben die selben offenen Mengen.

Beweis. (a) Seien  ·  und  ·  äquivalente Normen und (xn )n∈IN eine Folge in V .
Dann gilt

xm − xn ≤ M xm − xn  und xm − xn  ≤ M  xm − xn 

für alle m, n ∈ IN. Daher ist eine Cauchyfolge in der einen Norm zugleich Cauchy-
folge in der anderen Norm.
Sind die Normen  ·  und  ·  nicht äquivalent, dann existiert wenigstens eine
der Schranken M, M  nicht. Wenn etwa kein M  im Sinne der Definition existiert,
dann gibt es zu jedem n ∈ IN ein xn ∈ V mit xn  ≤ 1 und xn  ≥ n2 .
Setzt man nun yn := 1n xn , so ist yn  ≤ 1n , also lim yn = 0V bezüglich  · .
n→
Wegen yn  ≥ n ist aber (yn )n∈IN bezüglich  ·  keine Cauchyfolge.
(b) Zu den auf V äquivalenten Normen  ·  und  ·  seien Schranken M, M  > 0


gemäß der Definition gewählt. Die jeweiligen  -Kugeln um Punkte a ∈ V erfüllen


dann
U /M (a) ⊆ U (a) und U /M (a) ⊆ U (a) .
Hieraus folgt, dass jede Umgebung von a in der einen Norm auch eine Umgebung
von a in der anderen Norm enthält. Also hat V in jeder der beiden Normen die selben
offenen Mengen. 

180 13 Normierte Vektorräume

Satz 13.6. Sei {a1 , a2 , . . . , ad } eine Basis des d-dimensionalen normierten Vektor-
raumes V . Weiter sei IRd versehen mit der Maximumsnorm x = max |xk |.
1≤k≤d
Dann ist die durch
d
Lx :=  xk a k
k=1

definierte bijektive lineare Abbildung L : IRd → V stetig und ihre Umkehrabbildung


ist ebenfalls stetig.
d
Beweis. Mit M := max ak V erhalten wir LxV ≤  |xk | ak V ≤ d M x .
1≤k≤d k=1
Daher ist {LxV : x ∈ IRd , x ≤ 1} beschränkt und L laut Satz 13.1 stetig.
Da L−1 : V → IRd ebenfalls eine lineare Abbildung ist, genügt es, die Stetigkeit im
Nullpunkt nachzuweisen. Dazu sei  > 0.
Die Menge C := {x ∈ IRd : x =  } ist kompakt; nach Korollar 12.9 nimmt
die stetige Funktion x → LxV auf C ein Minimum an. Da C den Nullpunkt nicht
enthält, gilt weiter 0 < min LxV =:  .
x∈C
Zu jedem y ∈ V mit yV <  gibt es x ∈ C und  ∈ IR mit y = L( x) =  Lx, da
L eine bijektive lineare Abbildung ist. Wegen | | LxV = yV <  ≤ LxV gilt
| | < 1. Aus yV <  folgt also stets

L−1 (y) =  x = | | x = | |  <  .

Folglich ist L−1 im Nullpunkt von V stetig. 


Satz 13.7 (Äquivalenz von Normen im endlichdimensionalem Raum). Sei V ein


d-dimensionaler Vektorraum. Es gilt:
(a) Je zwei Normen auf V sind äquivalent.
(b) Unter jeder Norm ist V vollständig und Grenzwerte in V sind unabhängig
von der Wahl der Norm.

Beweis. (a) Sind  · 1 und  · 2 zwei Normen auf V , so schreiben wir Vk (k = 1, 2)


für den mittels  · k normierten Raum V . Nach Satz 13.6 ist bei gegebener Basis
{a1 , a2 , . . . , ad } von V durch
d
Lk x :=  x ja j für x ∈ IRd
j=1

eine bijektive lineare und samt Umkehrabbildung stetige Abbildung L : IRd → Vk


erklärt (bzgl. Maximumsnorm auf IRd ).
Damit ist auch L := L2 L−1
1 : V1 → V2 eine bijektive lineare und stetige Abbildung,
deren Umkehrung L−1 = L1 L−1 2 ebenfalls stetig ist. (Rein algebraisch betrachtet ist
L die Identität auf V .)
13.1 Stetige lineare Abbildungen 181

Mit den Schranken

M1 := sup{L−1 z1 : z ∈ V2 , z2 ≤ 1} und


M2 := sup{Ly2 : y ∈ V1 , y1 ≤ 1}

erhalten wir für alle y ∈ V die Abschätzungen

y2 = L(L−1 y)2 ≤ M2 L−1 y1 = M2 y1 sowie


y1 = L−1 (Ly)1 ≤ M1 Ly2 = M1 y2 .

Die beiden Normen sind daher äquivalent.


(b) Mit Satz 13.5 und der eben bewiesenen Aussage genügt es, eine Norm anzuge-
ben, mit welcher V vollständig ist. Man erhält sie z.B. aus der Euklidischen Norm
des IRd mittels " "
" d "
" "
"  x j a j " := x2 .
" j=1 "
0
d
Laut Korollar 4.8 ist (IR ,  ·2 ) vollständig. Hat man eine Cauchyfolge in (V,  ·0 ),
so findet man deren Grenzwert nun über die entsprechende Folge in IRd . 

Insbesondere sind auf IRd die Normen
 1
d d 2

x1 =  |x j | , x2 =  x2j und x = max |x j |


j=1,...,d
j=1 j=1

äquivalent.
Korollar 13.8. Seien V und W normierte Vektorräume, V endlich-dimensional.
Dann ist jede lineare Abbildung L : V → W stetig.
Beweis. Seien {a1 , . . . , ad } eine Basis von V und  · 0 die durch
" "
" d "
" "
"  x j a j " := x für x = (x1 , . . . , xd ) ∈ IRd
" j=1 "
0

d
erklärte Norm auf V . Für x =  x j a j ∈ V gilt dann
j=1
" "
" d " d
" "
LxW = "  x j L(a j )" ≤  |x j | L(a j )W ≤ d M x0 ,
" j=1 " j=1
W

wobei M := max L(a j )W sei.


1≤ j≤d
Mit Satz 13.1 folgt die Stetigkeit von L zunächst bezüglich  · 0 und auf Grund
der Äquivalenz der Normen auch bezüglich aller anderer Normen auf V . 

182 13 Normierte Vektorräume

13.2 Kurven in Vektorräumen

Seien X ein metrischer Raum und I = [a, b] ein kompaktes Intervall. Eine stetige
Abbildung  : I → X bezeichnet man als Weg. Gilt  (a) =  (b), so heißt  ein
geschlossener Weg.

Beispiele
(1) In X = C mit der gewöhnlichen Metrik definiert  (t) := eit mit I = [0, 2 k]
für jedes k ∈ IN einen geschlossenen Weg.
(2) Gegeben seien ein Radius r > 0 und eine Ganghöhe“ 2 c > 0. Dann definiert

 (t) := (r cost, r sin t, ct) , t ∈ [0, 2 k] ,

einen Weg ( Schraubenlinie“) im IR3 . Ferner existiert der Grenzwert



 (t) −  (t0)
lim = (−r sin t0 , r cost0 , c) .
t → t0 t − t0
t = t0

Letzteres motiviert die folgende Definition.

Definition 13.9. Ein Weg  : [a, b] → V im endlich-dimensionalen normierten Vek-


torraum V heißt im Punkt t0 ∈ [a, b] differenzierbar, wenn der Grenzwert

 (t) −  (t0 )
lim =:   (t0 )
t → t0 t − t0
t = t0

existiert. Den Vektor   (t0 ) ∈ V bezeichnet man dann als Ableitung von  in t0 . Ist
 in jedem Punkt t ∈ [a, b] differenzierbar, so nennt man  eine differenzierbare
Kurve.
Wenn [a, b] eine Teilung t0 = a < t1 < . . . < tr = b besitzt derart, dass alle Re-
striktionen  |[tk−1 ,tk ] differenzierbar sind mit auf [tk−1 ,tk ] stetiger Ableitung, dann
heißt  eine stückweise stetig differenzierbare Kurve.
Ist  eine stetig differenzierbare Kurve, so bildet für jedes t0 ∈ I mit   (t0 ) = 0
die Menge { (t0 ) + s   (t0 ) : s ∈ IR} die Tangente an  im Punkt  (t0 ). Der Vektor
  (t0 ) heißt Tangentenvektor. Diejenigen Punkte t0 ∈ [a, b] mit Tangentenvektor
  (t0 ) = 0V werden singulär genannt. Besitzt  keine singulären Punkte, so heißt 
eine reguläre Kurve.

Bemerkung: Weder die Definition der Differenzierbarkeit noch der Wert der Ablei-
tung hängen von der Wahl der Norm in V ab (vgl. Satz13.7).
Zum Beispiel ist für jede stetig differenzierbare Funktion f : [a, b] → IR der
Graph  f von f , definiert durch  f : [a, b] → IR2 ,  f (t) := (t, f (t) ), eine reguläre
Kurve, da  f (t) = (1, f  (t) ) ist.
13.2 Kurven in Vektorräumen 183

Die Gerade durch die Punkte  (t0 ) und  (t) ist die
T (t0 ) S (t0 ,t) Menge S (t0 ,t) := { (t0 )+s( (t)−  (t0 )) : s ∈ IR}.
s=2 Sei t = t0 zunächst fest gewählt, so gilt

s=1 r
S (t0 ,t) =  (t0 ) + ( (t) −  (t0 )) : r ∈ IR .
 (t) t − t0
s=0
Ist  im Punkt t0 differenzierbar, so erhalten wir die
 (t0 ) Tangente als Grenzwert“ von S(t0 ,t) für t → t0 ,
s = −1 ”
T (t0 ) := { (t0 ) + r   (t0 ) : r ∈ IR} .

Beispiel: Durch  : [−1, 1] → IR2 ,  (t) := (t 2 ,t 3 ), wird die so genannte Neilsche


Parabel definiert.
Sie ist eine stetig differenzierbare Kurve mit der Ableitung   (t) = (2t, 3t 2 ) und
hat genau einen singulären Punkt, nämlich t0 = 0.
1

Die Abbildung zeigt die Neilsche Parabel. 1


Man erkennt, dass es nicht möglich ist, eine
Tangente im Nullpunkt sinnvoll zu erklären.
−1

Seien V ein d-dimensionaler Vektorraum und {e1 , . . . , ed } eine Basis von V . Das
System der Koordinaten bezüglich dieser Basis identifiziert V mit IRd . Jede Kurve
 : [a, b] → V wird so durch ihre Koordinatenfunktionen k : [a, b] → IR beschrieben:
d
 (t) =  e j  j (t) .
j=1

Satz 13.10. Seien V ein d-dimensionaler normierter Vektorraum und {e1 , . . . , ed }


eine Basis von V .
Eine Abbildung  : [a, b] → V ist im Punkt t ∈ [a, b] genau dann differenzierbar,
wenn jede Koordinatenfunktion k : [a, b] → IR (k = 1, . . . , d) dort differenzierbar ist.
In diesem Fall gilt
d
  (t) =  e j  j (t) .
j=1

Beweis. Wegen der Äquivalenz aller Normen auf V können wir dort die Maximums-
norm zu Grunde legen.
 (s) −  (t)
Damit bedeutet lim =   (t) das selbe wie
s→t s−t


k (s) − k (t)

lim

− k (t)

für alle k ∈ {1, . . . , d} ,


s→t s−t
184 13 Normierte Vektorräume

wobei k (t) die k-te Koordinate des Vektors   (t) bzgl. der Basis {e1 , . . . , ed } von V
bezeichne. Damit haben wir
d
  (t) =  ek k (t)
k=1

wie behauptet. 

Definition 13.11. Sei  : [a, b] → V eine stückweise stetig differenzierbare Kurve im


d-dimensionalen normierten Raum V . Als Länge von  definieren wir
( b
l( ) :=   (t) dt .
a

Bemerkung: Die Kurvenlänge hängt von der Wahl der Norm ab. So hat beispiels-
weise die Strecke
s(t) = (1 + i)t , t ∈ [0, 1] ,

in der Euklidischen Norm (die in C mit dem Betrag übereinstimmt) die Länge 2,
während ihre Länge in der Maximumsnorm des IR2 gleich 1 ist.
Im Vektorraum V = IRd wird die Länge von Kurven immer auf die Euklidische
Norm bezogen, falls nicht ausdrücklich etwas anderes gesagt wird.

Die Abbildung gibt eine Motivation für die Definition der Länge.
Die Länge einer Kurve ist stets größer oder gleich der Länge eines
Streckenzuges, der gewisse Punkte der Kurve verbindet. Je feiner
man die Kurve unterteilt, desto besser wird die Länge approximiert.
In Satz 13.12 wird diese Überlegung präzisiert.

Satz 13.12. Seien V ein d-dimensionaler normierter Vektorraum und  : [a, b] → V


eine stückweise stetig differenzierbare Kurve.
Dann gilt für jede Teilung a = t0 < t1 < . . . < tr = b die Ungleichung
r
  (t j ) −  (t j−1) ≤ l( ) .
j=1

Ferner gibt es zu jedem  > 0 eine Schranke  > 0 derart, dass


r
0 ≤ l( ) −   (t j ) −  (t j−1) ≤ 
j=1

für alle Teilungen der Feinheit max (t j − t j−1 ) ≤  gilt.


1≤ j≤r

Zum Beweis verwenden wir folgendes auch sonst nützliches Resultat.


13.2 Kurven in Vektorräumen 185

Lemma 13.13. Seien V ein d-dimensionaler normierter Vektorraum,  : [a, b] → V


eine stetig differenzierbare Kurve.
Zu jedem  > 0 gibt es eine Schranke  > 0 derart, dass
" "
"  (s) −  (t) "
" −  
(t)"≤
" s−t "

für alle s,t ∈ [a, b] mit 0 ≤ |s − t| ≤  gilt.

Beweis. Die Wahl von  hängt natürlich von der Norm auf V ab. Da aber je zwei
Normen äquivalent sind, genügt es, den Beweis für eine spezielle Norm zu führen.
d
Mit einer Basis {e1 , . . . , ed } von V beschreiben wir die Kurve  (t) =  ek k (t)
k=1
durch ihre stetig differenzierbaren Koordinaten-Funktionen k . Laut Mittelwertsatz
gibt es ein k zwischen s und t derart, dass


k (s) − k (t)


−  
(t)
= |  (k ) −   (t)|

s−t k
k k

gilt. Die Ableitung k ist auf dem kompakten Intervall [a, b] gleichmäßig stetig
(Satz 12.19). Daher gibt es ein k > 0, sodass |k ( ) − k (t)| ≤  für alle  ,t ∈ [a, b]
mit | − t| ≤ k ist. Wir wählen nun  := min k und erhalten
1≤k≤d


k (s) − k (t)

max
− k (t)

≤ 

für s,t ∈ [a, b] mit 0 < |s − t| ≤ 
1≤k≤d
s−t

wie behauptet. 

Beweis (von Satz 13.12). Wir beginnen mit einer Teilung a = a0 < a1 < . . . < aq = b,
auf deren Teilintervallen [ak−1 , ak ] die Restriktion von  stetig differenzierbar ist
(1 ≤ k ≤ q).
Sei  > 0. Wir verschaffen uns ein  > 0, das den folgenden vier Bedingungen
genügt.
(1) Zunächst wird  so klein gewählt, dass für Teilungen a = t0 < . . . < tr = b
der Feinheit max(t j − t j−1) ≤  stets
j


r



l( ) −   (t j )(t j − t j−1)
≤ .


j=1

4

gilt. Um Eindeutigkeit von   (t j ) zu erzielen, nehmen wir die linksseitige


Ableitung von  , falls t j einer der Teilungspunkte ak sein sollte. (Wir appro-
ximieren also mit einer speziellen Treppenfunktion.)
(2) Weiter wird  bzgl. der auf [a, b] gleichmäßig stetigen Abbildung  so klein

gewählt, dass  (s) −  (t) ≤ 4q für alle s,t ∈ [a, b] mit |s − t| ≤  gilt.
186 13 Normierte Vektorräume


(3) Wir verlangen qM  ≤ 4 für M := sup   (t).
t∈[a,b]

(4) Schließlich wird  auch noch so klein gewählt, dass die Abschätzung in Lem-

ma 13.13 für jedes Teilintervall [ak−1 , ak ] mit  := 4(b−a) gültig ist.
Zu dem nun fixierten  > 0 sei a = t0 < . . . < tr = b eine Teilung der Feinheit ≤  .
Mit A bezeichnen wir die Menge der Indizes j, für die es ein k gibt mit
ak ∈ ]t j−1 ,t j [. Dann enthält die Menge A höchstens q Elemente. Damit gelten die
Abschätzungen


l( ) −   (t j ) −  (t j−1)


j=1


r r

=
l( ) −   (t j )(t j − t j−1 ) +  (  (t j ) (t j − t j−1) −  (t j ) −  (t j−1 ) )

 

j=1 j=1

r

≤ +   (t j ) −  (t j−1) −   (t j ) (t j − t j−1)
4 j=1
r
 
≤ +   (t j ) −  (t j−1 ) −   (t j ) (t j − t j−1 ) + q + qM 
4 j=1 4q
j∈A
/

r
3 
≤ + (t j − t j−1) ≤  .
4 j=1 4(b − a)
j∈A
/

r
Es bleibt zu zeigen, dass stets   (t j ) −  (t j−1 ) ≤ l( ) gilt.
j=1
Angenommen, dies ist nicht der Fall. Dann gibt es eine Teilung mit
r
  (t j ) −  (t j−1) − l( ) ≥ 0
j=1

für eine gewisse Zahl 0 > 0. Da die Summe auf der linken Seite beim Übergang
zu einer feineren Teilung nicht kleiner wird, bleibt die Ungleichung für alle feine-
ren Teilungen gültig. Mit einem  < 0 erhalten wir nun einen Widerspruch zu der
bereits bewiesenen Teilaussage. 

Korollar 13.14 (Schrankensatz). Seien V ein d-dimensionaler normierter Vektor-


raum und  : [a, b] → V eine stetig differenzierbare Kurve mit beschränkter Ablei-
tung   (t) ≤ M für alle t ∈ [a, b].
Dann gilt  (b) −  (a) ≤ M(b − a).

Beweis. Dies ergibt sich aus dem ersten Teil von Satz 13.12 mit der gröbsten Tei-
lung t0 = a, t1 = b und der Standardabschätzung l( ) ≤ M(b − a), vgl. Satz 8.3(4).


13.2 Kurven in Vektorräumen 187

Beispiele
(1) Die k-fach durchlaufene Kreislinie vom Radius r > 0,

r (t) = r eit , t ∈ [0, 2 k] ,

hat die Ableitung r (t) = ir eit . Sie hat daher in der durch den Betrag auf IR
definierten Norm die Länge
( 2 k
l(r ) = r dt = 2 kr .
0

(2) Die durch den Graph einer stetig differenzierbaren Funktion f : [a, b] → IR
erklärte Kurve  f (t) = (t, f (t) ) hat die Ableitung  f (t) = (1, f  (t) ). Damit
ist Ihre Euklidische Länge
( b

l( f ) = 1 + f 2 (t) dt .
a

(3) Durch Abrollen eines Kreises vom Radius 1 auf der x-Achse des IR2 entsteht
als Bahnkurve eines Umfangspunktes die Zykloide  (t) = (1 (t), 2 (t) ) mit
1 (t) = t − sint und 2 (t) = 1 − cost.

2 (t)

1 (t) t 2

Ihre Euklidische Länge über einen Umlauf des Kreises ist


( 2 √ ( 2 
2
l( ) = 2 − 2 cost dt = 2 sin2 (t/2) dt = −4 cos(t/2)
0 = 8 .
0 0

Definition 13.15 (Parametertransformation). Sei  : [a, b] → V ein Weg im d-


dimensionalen normierten Raum V . Ist  : [c, d] → [a, b] eine bijektive stetige Ab-
bildung, dann heißt  :=  ◦  der aus  durch Umparametrisierung mittels der
Parametertransformation  entstandene Weg. Da  als injektive stetige Abbil-
dung streng monoton ist, tritt genau einer der folgenden Fälle ein:

( (c),  (d) ) = (a, b) ,  heißt dann orientierungstreu .


( (c),  (d) ) = (b, a) ,  heißt in diesem Fall orientierungsumkehrend .
188 13 Normierte Vektorräume

Sind  und die Umkehrabbildung  −1 stetig differenzierbar, so bezeichnet man


 als eine C1 -Parametertransformation. Insbesondere ist dann   nullstellenfrei,
also als stetige Funktion auf [c, d] von festem Vorzeichen, sign   = ±1, je nachdem,
ob  orientierungstreu oder orientierungsumkehrend ist.

Bemerkungen: Wenn auch  auf [a, b] stetig differenzierbar ist, so ist  :=  ◦ 


stetig differenzierbar mit Ableitung

  (t) =   ( (t)) ·   (t) .


     
∈V ∈IR

Dies ergibt sich mit Satz 13.10 aus der Kettenregel. Unter C1 -Parametertransforma-
tionen bleiben Kurvenlängen invariant, denn eine einfache Substitution ergibt
( d ( d
 
l( ) =  (t) dt = sign    ( (t) )   (t) dt
c c
(  (d) ( b
= sign     (s) ds =   (s) ds .
 (c) a

Betrachtet man speziell  =  −1 , wobei


( s
 (s) :=   ( ) d
s0

für ein festes s0 ∈ [a, b] sei, so ist  eine orientierungstreue C1 -Parametertransforma-


tion. Mittels Satz 7.17 erhalten wir
1 1
  (t) = =
  ( (t))   ( (t))

und damit   (t) = 1 für alle t ∈ [c, d]. Weiter gilt l( ) = d − c. Man sagt in diesem
Fall,  ist nach der Länge parametrisiert.

13.3 Aufgaben
x1 
1. Für x = (xn )n∈IN ∈  sei Ax := 1 , x22 , x33 , . . . .
a. Zeigen Sie, dass A :  →  eine stetige lineare Abbildung ist und bestim-
men Sie A.
b. Zeigen Sie, dass A injektiv ist.
c. Ist A surjektiv ?
d. Weiter sei X := A( ) das Bild von A. Zeigen Sie, dass die Umkehrabbil-
dung A−1 : X →  nicht stetig ist.
13.3 Aufgaben 189

2. Zeigen Sie, dass in C([0, 1]) die durch


( 1
1
2
2
 f  = max | f (x)| und  f 2 = | f (x)| dx
x∈[0,1] 0

erklärten Normen nicht äquivalent sind.

3. Berechnen Sie die Länge der Neilschen Parabel, gegeben durch

 : [−1, 1] → IR2 ,  (t) := (t 2 ,t 3 ) ,

bezüglich jeder der drei Normen  · 1,  · 2 und  · .

4. Die Astroide ist die durch

 : [0, 2 ] → IR2 ,  (t) := (cos3 t , sin3 t) ,

gegebene Kurve.
a. Begründen Sie, dass  stetig differenzierbar ist, und berechnen Sie   .
b. Berechnen Sie die Länge l( ).
c. Berechnen Sie alle Maximal- und Minimalstellen von  (t) .
d. Bestimmen Sie alle singulären Punkte von  .

1
1

1
1

Die Astroide aus Aufgabe 4 Die Kardioide aus Aufgabe 5

5. Die Kardioide ist die durch

 : [0, 2 ] → IR2 ,  (t) := ( (1 + cost) cost , (1 + cost) sint)

gegebene Kurve.
a. Bestimmen Sie alle singulären Punkte von  .
b. Bestimmen Sie alle Punkte von  mit horizontaler oder vertikaler Tangente.
c. Berechnen Sie die Länge l( ).
190 13 Normierte Vektorräume

6. Sei c > 0. Die Abbildung

 : IR → C ,  (t) := exp(ct + it) ,

beschreibt eine logarithmische Spirale.


Für a < b bezeichne La,b die Länge der Einschränkung von  auf das Intervall
[a, b]. Berechnen Sie La,b und zeigen Sie, dass lim La,0 existiert.
a→−

Im

Re

Obwohl die logarithmische Spirale den Null-


punkt unendlich oft umrundet“, hat ihre

Länge bei festgehaltenem Endpunkt einen
endlichen Grenzwert.
Kapitel 14
Totale Differenzierbarkeit

Wir wollen nun den Begriff der Differenzierbarkeit, den wir in Kapitel 7 für reell-
wertige Funktionen auf Intervallen und in Kapitel 13 für Funktionen von Intervallen
in beliebige normierte Räume erklärt haben, ausdehnen auf Funktionen f : U → W ,
U ⊆ V , wobei V und W endlich-dimensionale normierte Vektorräume sind.

14.1 Totale und partielle Ableitungen

Definition 14.1. Seien V und W endlich-dimensionale normierte IR-Vektorräume,


U ⊆ V eine offene Menge in V . Eine Abbildung f : U → W heißt im Punkt a ∈ U
differenzierbar, wenn eine lineare Abbildung A ∈ L (V,W ) existiert derart, dass
die durch
f (a + h) = f (a) + Ah + R(h)
in einer Umgebung U0 ⊆ V von 0 ∈ V definierte Restfunktion R : U0 → W folgendes
erfüllt:
R(h)
lim =0∈W . (14.1)
h→0 hV
h =0

Zunächst müssen wir uns davon überzeugen, dass eine derartige lineare Abbildung
A ∈ L (V,W ), falls sie existiert, auch eindeutig festgelegt ist. Dies ist tatsächlich der
Fall: Sei
f (a + h) = f (a) + A1 h + R1(h) = f (a) + A2h + R2(h)
mit A1 , A2 ∈ L (V,W ) derart, dass R1 und R2 die Bedingung (14.1) erfüllen. Für
B := A1 − A2 ∈ L (V,W ) erhalten wir mit beliebigem h ∈ V , hV = 1, t > 0 dann

t B(h)W B(th)W R2 (th) − R1(th)W


B(h)W = = =
t thV thV
R1 (th)W R2 (th)W t→0
≤ + −→ 0 .
thV thV

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 191


DOI 10.1007/978-3-642-28644-5_14, © Springer-Verlag Berlin Heidelberg 2012
192 14 Totale Differenzierbarkeit

Das heißt B(h) = 0 für alle h ∈ V mit hV = 1. Da B linear ist, folgt B(h) = 0 für
alle h ∈ V , also A1 = A2 .

Wenn die lineare Abbildung A gemäß Definition 14.1 existiert, so schreibt man auch
A = D f (a) oder A = f  (a) und bezeichnet sie als die totale Ableitung oder das
totale Differential von f in a.
Im eindimensionalen Fall V = W = IR ist die lineare Abbildung A nichts anderes
als die Multiplikation mit einer reellen Zahl, nämlich dem Wert f  (a).

Satz 14.2. Seien V und W endlich-dimensionale normierte Räume, U ⊆ V offen und


f : U → W eine Abbildung.
Ist f im Punkt a ∈ U differenzierbar, so ist f in a auch stetig.

Beweis. Wegen (14.1) existiert ein  > 0, sodass R(h)W ≤ hV für alle h ∈ V
mit hV ≤  gilt. Weiter können wir U (a) ⊆ U annehmen (sonst wähle man ein
entsprechend kleineres  ). Es gilt dann

 f (a + h) − f (a)W ≤ AhW + R(h)W ≤ (A + 1) hV

für hV <  .


Mit dem Folgenkriterium (Satz 6.2) folgt nun die Stetigkeit von f in a. 

Bemerkung: Wegen der Äquivalenz der Normen (Satz 13.7), spielt es hier keine
Rolle, welche Normen auf V und W gewählt wurden.

Beispiel: Sei f : IR2 → IR, f (x1 , x2 ) := (x1 − 1)(x2 − 1).


 
Für a = aa12 , h = hh12 ∈ IR2 gilt

f (a + h) − f (a) = (a1 + h1 − 1)(a2 + h2 − 1) − (a1 − 1)(a2 − 1)


= (a1 − 1)h2 + (a2 − 1)h1 + h1 h2
. /
a2 − 1 h1
= , + R(h) ,
a1 − 1 h2

wobei R(h) = h1 h2 ist.


Mit der Euklidischen Norm  · 2 im IR2 gilt
1 2
|R(h)| |h1 h2 | (h + h22) 1
= 2 2
≤ 2 2 1 2 1/2 = h2 → 0 für h → 0 .
h2 (h1 + h2) 1/2 (h1 + h2 ) 2

Die Ableitung A = D f (a) = f  (a) ∈ L (IR2 , IR) ist also gegeben durch
. /
a2 − 1 h1 h1
h → , = (a2 − 1, a1 − 1) .
a1 − 1 h2    h2
1×2−Matrix
14.1 Totale und partielle Ableitungen 193

Das vorangehende Beispiel gehört zu dem Fall, dass der Bildraum eindimensional
ist, d.h. f : U → IR mit U ⊆ IRn offen. Die Ableitung A von f in a ∈ U ist dann von
der Form
n
D f (a) h = Ah = c, h =  ck h k
k=1
n
mit c ∈ IR . Man hat also
n
R(h)
f (a + h) = f (a) +  ck hk + R(h) , lim =0.
k=1
h→0
h =0
h

Um die ck ∈ IR zu bestimmen, wählen wir h = tek , wobei ek den kanonischen k-ten


Einheitsvektor in IRn bezeichne (k = 1, . . . , n). Damit ist
1 1
( f (a + tek ) − f (a) ) = ck + R(ek t)
t t
und mit t → 0 folgt

f (ak + ekt) − f (a) f


ck = lim =: (a) .
t→0 t  xk
Man nennt dies die partielle Ableitung von f nach der k-ten Koordinate im Punkt
a. Die Ableitung von f an der Stelle a ∈ U hat also die Gestalt

D f (a) h = grad f (a) , h ,



f f
wobei grad f (a) := (a), . . . , (a) der Gradient von f im Punkt a heißt.
 x1  xn
Statt grad f (a) schreibt man gelegentlich auch  f (a). (Das Symbol  heißt Nabla).

Wir wenden uns nun dem Fall V = IR, W = IRm (mit kanonischer Basis) zu. Sei
f : U → IRm mit U ⊆ IR offen. Wir suchen A ∈ L (IR, IRm ) mit entsprechenden
Eigenschaften. Schreibt man
⎛ ⎞
f1 (x)
⎜ ⎟
f (x) = ⎝ ... ⎠ ,
fm (x)

so hat man das Problem der Differenzierbarkeit von f auf das Problem der Diffe-
renzierbarkeit der fk : U → IR (k = 1, . . . , m) zurückgeführt. Es gilt dann (beachte:
hier ist h ∈ IR) ⎛  ⎞
f1 (a)
⎜ ⎟
D f (a) h = ⎝ ... ⎠ h ,
fm (a)
vgl. auch Kapitel 13.2.
194 14 Totale Differenzierbarkeit

Wir kehren zurück zum allgemeinen Fall. Bevor wir uns überlegen, wie man die
lineare Abbildung D f (a) ∈ L (V,W ) als Matrix darstellen kann, werden wir noch
einige wichtige Eigenschaften differenzierbarer Abbildungen zusammenstellen. Die
folgenden sind unmittelbar ersichtlich.
(1) Ist f : V → W konstant, so ist D f (a) = 0.
(2) Ist f : V → W selbst linear, d.h. f ∈ L (V,W ), dann ist D f (a) = f . Mit der
Linearität von f gilt nämlich f (a + h) − f (a) = f (h), also ist in diesem Fall
R(h) = 0.
(3) Sind f , g : U → W in a ∈ U ⊆ V differenzierbar und  ∈ IR, so sind auch
f + g : U → W und  f : U → W in a differenzierbar mit

D( f + g)(a) = D f (a) + Dg(a) sowie D( f )(a) =  D f (a) .

Man kann auch die Kettenregel auf die vorliegende Situation verallgemeinern.

Satz 14.3 (Kettenregel). Seien V1 ,V2 ,V3 endlich-dimensionale normierte IR-Vektor-


räume, U1 ⊆ V1 , U2 ⊆ V2 offen und f : U1 → U2 , g : U2 → V3 Abbildungen.
Wenn f in a ∈ U1 differenzierbar und g in f (a) ∈ U2 differenzierbar ist, dann ist
die Abbildung g ◦ f : U1 → V3 in a differenzierbar und es gilt

D(g ◦ f )(a) = Dg( f (a)) D f (a) .

Beweis. Wir setzen R(h) := g ◦ f (a + h) − g ◦ f (a) − Dg( f (a)) D f (a) h. Es genügt


zu zeigen, dass zu jedem 0 <  < 1 ein  > 0 existiert mit

R(h)V3 ≤  hV1 für alle h ∈ V1 mit hV1 <  .

Denn daraus folgt, dass dieses R der Bedingung (14.1) genügt.


Sei also 0 <  < 1. Da D f (a) und Dg( f (a)) stetige lineare Abbildungen sind, gibt
es eine Schranke M ≥ 1 mit

D f (a) xV2 ≤ M xV1 für alle x ∈ V1 und


Dg( f (a)) yV3 ≤ M yV2 für alle y ∈ V2 .

Wegen der Differenzierbarkeit von g im Punkt f (a) existiert ferner ein  > 0 mit

g( f (a) + k) − g( f (a)) − Dg( f (a)) kV3 ≤ kV2
2M + 2
für alle k ∈ V2 mit kV2 <  .
Setzen wir speziell k := f (a + h) − f (a) ∈ V2 , so finden wir, da f in a differen-
zierbar ist, eine Zahl  > 0 mit

k − D f (a) hV2 ≤ hV1 für alle h ∈ V1 mit hV1 <  .
2M
14.1 Totale und partielle Ableitungen 195

Für hV1 <  gilt folglich


 
kV2 ≤ D f (a) hV2 + hV1 ≤ M hV1 + hV1 ≤ (M + 1) hV1 .
2M 2M
 
Sei nun  := min  , M+1 . Wir setzen alles zusammen und erhalten für hV1 < 
schließlich

g ◦ f (a + h) − g ◦ f (a) − Dg( f (a)) D f (a) hV3

≤ g( f (a) + k) − g( f (a)) − Dg( f (a)) kV3 + Dg( f (a)) (k − D f (a) h)V3
  
≤ kV2 + M k − D f (a) hV2 ≤ hV1 + hV1 .
2M + 2 2 2
(beachte: Hier gilt kV2 <  .) 

Seien U ⊆ IRn offen, f : U → IRm eine Abbildung und {e1 , . . . , en } bzw. {w1 , . . . , wm }
die kanonischen Basen des IRn und IRm .
Die Komponenten von f sind die Funktionen f1 , . . . , fm : U → IR mit
m
f (x) =  fi (x) wi .
i=1

Für a ∈ U, i ∈ {1, . . . , m} und k ∈ {1, . . . , n} definieren wir

 fi fi (a + tek ) − fi (a)
(a) := lim ,
 xk t→0 t
vorausgesetzt dieser Grenzwert existiert.
 fi
Man nennt (a) die partiellen Ableitungen von f in a.
 xk
 fi
Gelegentlich schreibt man auch Dk fi (a) statt (a).
 xk
Satz 14.4. Seien U ⊆ IRn offen und f : U → IRm im Punkt a ∈ U differenzierbar.
 fi
Dann existieren die partiellen Ableitungen  xk (a) für alle k ∈ {1, . . . , n} und alle
i ∈ {1, . . . , m}. Ferner gilt
m
 fi
D f (a) ek =  (a) wi (k = 1, . . . , n)

i=1 xk

oder, geschrieben als Matrix bezüglich der kanonischen Basen,


⎛ f  f1

 x1 (a) · · ·  xn (a)
1
⎜ . .. ⎟
D f (a) = ⎜
⎝ .. . ⎠.

 fm  fm
 x (a) · · ·  xn (a)
1
196 14 Totale Differenzierbarkeit

Beweis. Für festes k ∈ {1, . . ., n} gilt, da f in a differenzierbar ist,

R(tek )
f (a + tek ) − f (a) = D f (a)(tek ) + R(tek ) , wobei lim =0.
t→0 t
Damit erhalten wir
m
f (a + tek ) − f (a) fi (a + tek ) − fi (a)
D f (a) ek = lim
t→0 t
= lim
t→0
 t
wi .
i=1

Aus der Konvergenz in IRm folgt komponentenweise Konvergenz, also hat jeder
Quotient in der Summe einen Grenzwert für t → 0. Folglich existieren die partiellen
Ableitungen  xfi (a) für i = 1, . . . , m. 

k

Die (m × n)-Matrix
 fi
D f (a) = (a)
 xk i,k

heißt Jacobimatrix oder Funktionalmatrix von f in a. Um sie zu bestimmen,


braucht man nur die partiellen Ableitungen von f in a zu berechnen.

14.2 Richtungsableitungen und Niveaumengen

Seien U ⊆ IRn offen,  : ] ,  [ → U eine differenzierbare Kurve und f : U → IR


differenzierbar. Wir betrachten g : ] ,  [ → IR, g(t) := f ( (t)). Laut Kettenregel
(Satz 14.3) ist g differenzierbar und es gilt

Dg(t) = D f ( (t)) D (t) ,

wobei Dg(t) ∈ L (IR, IR), D f ( (t)) ∈ L (IRn , IR) und D (t) ∈ L (IR, IRn ) sind.
Nach Wahl der kanonischen Basis im IRn bekommt man

f f
D f ( (t)) = grad f ( (t)) = ( (t)), . . . , ( (t)) sowie
 x1  xn

D (t) = 1 (t), . . . , n (t) =   (t)
n
f 6 7
und damit dann g (t) = Dg(t) =  ( (t)) i (t) = grad f ( (t)) ,   (t) .
i=1  xi

Als spezielle Kurve betrachten wir noch den Fall  : IR → IRn ,  (t) = a + tu, mit
a, u ∈ IRn , u2 = 1; d.h.  beschreibt eine Gerade durch a in Richtung u.
Offensichtlich ist   (t) = u für alle t ∈ IR und insbesondere
6 7
Dg(0) = grad f (a) , u . (14.2)
14.2 Richtungsableitungen und Niveaumengen 197

Berechnet man g (0) = Dg(0) direkt als Differentialquotient, so gilt andererseits

g(t) − g(0) f (a + tu) − f (a)


Dg(0) = lim = lim .
t→0 t t→0 t
Letzteren Grenzwert nennt man die Richtungsableitung von f in Richtung u im
Punkt a. Man schreibt
f (a + tu) − f (a)
Du f (a) := lim .
t→0 t
Die Richtungsableitungen in Richtung der kanonischen Basisvektoren sind dann
nichts anderes als die partiellen Ableitungen Dek f (a) = xf (a).
k

Die folgenden Beispiele zeigen, dass alleine aus der Existenz der partiellen Ablei-
tungen jedoch nicht notwendigerweise die Differenzierbarkeit folgt.
(1) Sei f : IR2 → IR,

0 für (x, y) = (0, 0) ,
f (x, y) := xy
x2 +y2
für (x, y) = (0, 0) .

Da f längs der beiden Koordinatenachsen konstant ist, existieren im Null-


punkt die partiellen Ableitungen  xf (0, 0) = 0 und  yf (0, 0) = 0.
Wir betrachten nun die Einschränkung von f auf eine andere Gerade, gege-
ben etwa durch u = (cos  , sin  ) mit  = k2 , k ∈ ZZ. Es gilt
 t 2 cos  sin 
t 2 cos2  +t 2 sin2 
= cos  sin  = 0 für t = 0 ,
f (tu) =
0 für t = 0 .

Die Abbildung t → f (tu) ist nicht stetig an der Stelle t = 0 und daher auch
nicht differenzierbar, also existieren die Richtungsableitungen von f in Rich-
tung u nicht. Weiter ist f im Nullpunkt nicht einmal stetig und daher auch
nicht (total) differenzierbar.
(2) Sei g : IR2 → IR,

0 für (x, y) = (0, 0) ,
g(x, y) := xy2
x2 +y2
für (x, y) = (0, 0) .

Mit u = (cos  , sin  ) gilt

g(0 + tu) − g(0) 1 t 3 cos  sin2 


= = cos  sin2  für alle t = 0 ,
t t t 2 cos2  + t 2 sin2 

also existieren die Richtungsableitungen Du g(0, 0) = cos  sin2  . Dies bein-


haltet insbesondere die partiellen Ableitungen.
198 14 Totale Differenzierbarkeit

Angenommen, g ist im Nullpunkt differenzierbar. Dann wäre



g g
gradg(0, 0) = (0, 0) , (0, 0) = (0, 0)
x y
8 9
und nach (14.2) weiter Du g(0, 0) = grad g(0, 0) , u = 0 für alle u ∈ IR2 mit
u2 = 1 im Widerspruch zur vorangegangenen Rechnung.

Bemerkung: In (14.2) wird Dg(0) maximal genau dann, wenn u ein positives Viel-
faches von grad f (a) ist (außer im Fall grad f (a) = 0). Mit anderen Worten, die
Richtungsableitung wird maximal, wenn man in Richtung des Gradienten schaut“.

Eine weitere geometrische Deutung des Gradienten erhält man durch Betrach-
tung der Niveaumenge N(a) von f in a ∈ U,

N(a) := {x ∈ U : f (x) = f (a)} .

Sei  : ] ,  [ → N(a) eine differenzierbare Kurve. Da die Komposition g(t) :=


f ( (t)) = f (a) konstant ist, gilt
6 7
0 = g (t) = grad f ( (t)) ,   (t) .

Ist nun  (t0 ) = a für ein t0 ∈ ] ,  [, so gilt grad f (a) ,   (t0 ) = 0. Anschaulich
kann man sagen, dass der Gradient von f im Punkt a senkrecht auf allen in der
Niveaumenge N(a) verlaufenden Kurven ( Höhenlinien“) steht.

Oft schreibt man die Niveaumengen auch in der Form Nc = {x ∈ U : f (x) = c},
wobei sinngemäß Nc = ∅ gilt, falls c nicht im Bild der Funktion f liegt.

Beispiele:
1 1
(1) Wir betrachten f : IR2 \ {(0, 0)} → IR, f (x, y) :=  = .
2
x +y 2 (x, y)2
Da f nur positive Werte annimmt, gibt es keine Niveaumengen Nc zu c ≤ 0.
Die Niveaumengen von f sind genau die Kreise um den Nullpunkt in IR2 ,
denn es gilt f (x, y) = c ⇐⇒ (x, y)2 = 1c für c > 0. Wir berechnen

f 1 3 x
(x, y) = − (x2 + y2 )− 2 (2x) = − und
x 2 (x, y)32
f 1 3 y
(x, y) = − (x2 + y2 )− 2 (2y) = −
y 2 (x, y)32

1
und erhalten grad f (x, y) = (−x, −y).
(x, y)32
Der Gradient zeigt also zum Nullpunkt hin“; je näher wir uns beim Null-

punkt befinden, um so größer ist er.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen 199

(2) Sei f : IR2 → IR, f (x, y) := xy.


Wir setzen f (x, y) = xy = c. Für c = 0 erhalten wir x = 0 oder y = 0, d.h. die
beiden Koordinatenachsen bilden die Niveaumenge N0 von f .
Für c = 0 ist insbesondere x = 0 und weiter gilt xy = c ⇐⇒ y = cx ; die
Niveaumenge Nc besteht aus zwei Hyperbelästen.
Hier ist grad f (x, y) = (y, x) und damit insbesondere grad f (0, 0) = (0, 0).
(3) Nun sei f : IR2 → IR, f (x, y) := x2 + 4y2.
Es gibt hier keine Niveaumengen Nc für negatives c und die Niveaumenge
N0 = {(0, 0)} besteht nur aus einem einzigen Punkt.
Für c > 0 setzen wir f (x, y) = x2 + 4y2 = c2 . Damit ist

1 2
y=± c − x2
2
und wir erhalten als Niveaumenge eine Ellipse mit Radien c (in x-Richtung)
und 12 c (in y-Richtung).
Es ist grad f (x, y) = (2x, 8y); auch in diesem Beispiel verschwindet grad f im
Nullpunkt.
y
y

x x

Die Abbildungen zeigen Niveaumengen und Gradienten der Funk-


tionen aus den Beispielen (2) und (3).
In beiden Fällen verschwindet der Gradient im Nullpunkt. Während
sich im linken Bild dort zwei Höhenlinien schneiden“, besteht die

Niveaumenge N0 im rechten Bild nur aus einem einzigen Punkt.

14.3 Mittelwertsatz und stetig differenzierbare Abbildungen

Wir wollen uns überlegen, unter welchen Bedingungen an die partiellen Ableitun-
gen die Differenzierbarkeit folgt.
Zunächst zeigen wir eine Folgerung des Mittelwertsatzes (Satz 7.10) für Funk-
tionen mit Werten in IRn .
200 14 Totale Differenzierbarkeit

Lemma 14.5. Sei g : [a, b] → IRm stetig und in ]a, b[ differenzierbar.


Dann existiert ein x ∈ ]a, b[ mit g(b) − g(a)2 ≤ g (x)2 (b − a).

Beweis. Wir setzen z := g(b) − g(a) und betrachten  : [a, b] → IR,  (t) := z, g(t).
Die Funktion  ist stetig auf [a, b] und differenzierbar auf ]a, b[. Laut dem Mittel-
wertsatz existiert ein x ∈ ]a, b[ mit

 (b) −  (a) =   (x) (b − a) = z, g (x) (b − a) .

Andererseits gilt  (b)−  (a) = z, g(b)−z, g(a) = z, z = z22 . Mit der Cauchy-
Schwarz-Ungleichung im IRm erhalten wir

z22 = z, g (x) (b − a) ≤ z2 g (x)2 (b − a) ,

also g(b) − g(a)2 = z2 ≤ g (x)2 (b − a). 


Ein weiteres Lemma liefert nun eine analoge Aussage zum Schrankensatz (Korol-
lar 13.14). Dazu benötigen wir den folgenden Begriff. Eine Menge U ⊆ IRn heißt
konvex, falls für beliebige a, b ∈ U stets auch ta + (1 − t)b ∈ U ∀t ∈ [0, 1] gilt.
Anschaulich bedeutet dies, dass zu je zwei Punkten in U auch deren Verbindungs-
strecke ganz in U enthalten ist.

Lemma 14.6. Seien U ⊆ IRn offen und konvex sowie f : U → IRm differenzierbar.
Falls M ≥ 0 existiert mit D f (x) ≤ M für alle x ∈ U, so gilt

 f (b) − f (a)2 ≤ M b − a2 für alle a, b ∈ U .

Beweis. Zu a, b ∈ U bezeichne I := {t ∈ IR : ta + (1 − t)b ∈ U}. Wir betrachten


 : I → U,  (t) := ta + (1 − t)b, und schließlich g : I → IRm , g(t) := f ( (t)).
Mit der Kettenregel folgt g (t) = Dg(t) = D f ( (t))   (t) = D f ( (t)) (a − b) und
damit insbesondere

g (t)2 ≤ D f ( (t)) b − a2 ≤ M b − a2 für alle t ∈ [0, 1] .

Laut Lemma 14.5 existiert nun ein x ∈ ]0, 1[ derart, dass

 f (b) − f (a)2 = g(0) − g(1)2 ≤ g (x)2 ≤ M b − a2

gilt. 

Bemerkung: Lemma 14.6 kann ohne große Schwierigkeiten auch für beliebige
endlich-dimensionale normierte IR-Vektorräume formuliert werden.
Wir notieren noch eine unmittelbare Folgerung.

Korollar 14.7. Seien U ⊆ IRn offen und konvex sowie f : U → IRm differenzierbar.
Wenn D f (a) = 0 für alle a ∈ U gilt, dann ist f konstant.
14.3 Mittelwertsatz und stetig differenzierbare Abbildungen 201

Im Fall reellwertiger Funktionen, also m = 1, können wir ein analoges Resultat zu


Satz 7.7 bezüglich lokaler Extrema herleiten.

Satz 14.8. Seien U ⊆ IRn offen und f : U → IR differenzierbar.


Falls f an der Stelle a ∈ U ein lokales Extremum besitzt, so gilt Du f (a) = 0 für
alle Richtungsableitungen (u ∈ IRn , u = 1). Insbesondere ist grad f (a) = 0.

Beweis. Sei u ∈ IRn , u = 1. Wir wählen ein Intervall I derart, dass a + tu ∈ U gilt
für t ∈ I. Da
f (a + tu) − f (a)
lim = Du f (a)
t→0 t
existiert, ist die Funktion g : I → IR, g(t) := f (a + tu), an der Stelle t = 0 differen-
zierbar mit g (0) = Du f (a). Nach Voraussetzung besitzt g im Nullpunkt ein lokales
Extremum und die Behauptung folgt mit Satz 7.7. 

Die Umkehrung von Satz 14.8 gilt nicht, wie folgendes Beispiel zeigt.

Beispiel: Wir betrachten f : IR2 → IR, f (x, y) := sin(xy).


Die Funktion t → sin(t) besitzt Maxima genau an den Stellen t = (4k + 1) 2 und
Minima genau bei t = (4k + 3) 2 , k ∈ ZZ. Damit können wir auch die Maxima und
Minima von f angeben. Die Funktion f ist konstant auf den Mengen

At := {(x, y) ∈ IR2 : xy = t} .

Maxima sind A(4k+1)  ; Minima sind A(4k+3)  , k ∈ ZZ.


2 2
Wir berechnen grad f . Es gilt

grad f (x, y) = y cos(xy), x cos(xy) .

Man sieht, dass grad f (x, y) = 0 gilt für (x, y) ∈ A(2k+1)  , k ∈ ZZ, also an den Extre-
2
malstellen.
Doch es gibt noch einen weiteren Punkt, an welchem der Gradient verschwin-
det: Es ist grad f (0, 0) = 0. Am Nullpunkt besitzt f jedoch kein lokales Extremum;
in jeder Umgebung gibt es Punkte mit positivem und auch welche mit negativem
Funktionswert.

Definition 14.9. Sei U ⊆ IRn offen.


Eine differenzierbare Funktion f : U → IRm heißt stetig differenzierbar, wenn
a → D f (a) eine stetige Abbildung U → L (IRn , IRm ) ist, also wenn folgendes gilt:
Zu beliebigen a ∈ U und  > 0 gibt es  > 0 derart, dass

D f (b) − D f (a) <  für alle b ∈ U mit b − a < 

ist (wobei links die Operator-Norm in L (IRn , IRm ) zu betrachten ist).


Den Raum aller stetig differenzierbaren Funktionen f : U → IRm bezeichnen wir
mit C1 (U, IRm ). Im Fall m = 1 schreiben wir kurz C1 (U), vgl. Definition 7.5.
202 14 Totale Differenzierbarkeit

Satz 14.10. Sei U ⊆ IRn offen.


Eine Funktion f : U → IRm ist stetig differenzierbar genau dann, wenn sämtliche
partielle Ableitungen

 fi
: U → IR , i = 1, . . . , m , k = 1, . . . , n ,
 xk
existieren und stetig sind.
Beweis. Sei f ∈ C1 (U, IRm ). Wir wissen aus Satz 14.4, dass alle partiellen Ablei-
tungen existieren und dass

 fi
(a) = D f (a) ek , wi 
 xk
mit den kanonischen Basen {w1 , . . . , wn } von IRn sowie {e1 , . . . , em } von IRm gilt
(i = 1, . . . , n; k = 1, . . . , m). Mit der Cauchy-Schwarz-Ungleichung erhalten wir


 fi  fi


(a) − (b)
= |D f (a) ek , wi  − D f (b) ek , wi |

x  xk

k
≤ (D f (a) − D f (b)) ek 2 ≤ D f (a) − D f (b) ,

wobei wir ek 2 = 1 = wi 2 benutzt haben.


 fi
Somit sind die Funktionen  xk : U → IR stetig.
Für die Umkehrung können wir uns auf den Fall m = 1 beschränken, denn wir haben
zu zeigen, dass
f (a + h) − f (a) − J f (a) h
lim =0
h→0 h
gilt, wobei J f (a) die Jacobi-Matrix ist. Daher reicht es, jede Komponenten-Funktion
fi : U → IR zu untersuchen.
Zu a ∈ U und  > 0 wählen wir r > 0 mit


f f

Ur (a) ⊆ U

und
 x (x) −  x (a)
< n
k k

für alle x ∈ Ur (a) und k ∈ {1, . . . , n}. Sei nun h = (h1 , . . . , hn ) ∈ IRn mit h2 < r.
Setzt man v0 := 0 und vk := (h1 , . . . , hk , 0, . . . , 0) für k = 1, . . . , n, so gilt
n
f (a + h) − f (a) =  ( f (a + vk ) − f (a + vk−1) ) .
k=1

Wegen vk 2 < r gilt a + vk ∈ Ur (a) für alle k. Da Ur (a) konvex ist, sind die Ver-
bindungsstrecken zwischen a + vk−1 und a + vk ganz in Ur (a) enthalten. Ferner
ist a + vk = a + vk−1 + hk ek . Laut dem Mittelwertsatz, angewendet auf die stetig
differenzierbare Funktion k : [0, 1] → IR, k (t) := f (a + vk−1 + t hk ek ), existiert
k ∈ ]0, 1[ mit
14.4 Ableitungen höherer Ordnung 203

f
f (a + vk ) − f (a + vk−1) = hk (a + vk−1 + k hk ek ) .
 xk
Weiter gilt


f f


h k


 x (a + vk−1 + k hk ek ) − hk  x (a)
≤ |hk | n
k k

und wir erhalten




n
f


f (a + h) − f (a) −  (a) hk


k=1  x k


n n
f

=
 ( f (a + vk ) − f (a + vk−1) ) −  (a) hk


k=1 k=1  x k


n f f n



=
 (a + vk−1 − k hk ek ) − (a) hk
≤  |hk | ≤  h2

k=1  xk  xk
n k=1

für alle h ∈ IRn mit h2 < r. Daher ist f in a differenzierbar und D f (a) = grad f (a).
Da nach Voraussetzung jede Komponente von grad f stetig in a ist, folgt schließ-
lich die Stetigkeit von a → D f (a) = grad f (a). 

Bemerkung: Zusammenfassend wollen wir folgende Implikationen festhalten.


 fi
(1) U ⊆ IRn , f : U → IRm differenzierbar =⇒ existieren.
 xk
Die Umkehrung gilt jedoch nicht, wie wir schon an Hand von Beispielen in
Kapitel 14.2 gesehen haben.
 fi
(2) U ⊆ IRn , f : U → IRm stetig differenzierbar⇐⇒ existieren und sind stetig.
 xk

14.4 Ableitungen höherer Ordnung

Seien V und W endlich-dimensionale normierte IR-Vektorräume, U ⊆ V offen sowie


f : U → W eine differenzierbare Funktion. Ist die Ableitung D f : U → L (V,W )
wieder differenzierbar, so bezeichnet man

D(D f ) : U → L (V, L (V,W ) )

als zweite Ableitung. Falls existent können wir sukzessive höhere Ableitungen bil-
den. Dabei wächst die Dimension des Wertebereiches jeweils an. Beispielsweise ist
dim(L (V,W ) ) = dim(V ) dim(W ).
Wenn wir stetige Differenzierbarkeit ins Auge fassen, können wir wieder auf
skalarwertige Funktionen, nämlich die partiellen Ableitungen, zurückgreifen. Wir
204 14 Totale Differenzierbarkeit

betrachten deshalb eine Funktion f : U → IR mit U ⊆ IRn offen. Allerdings treffen


wir auf
2 f  f
D j (Di f ) = =
 x j  xi  x j  xi
einerseits und
2 f  f
Di (D j f ) = =
 xi  x j  xi xj
andererseits (falls diese Ableitungen existieren).

Beispiel: Sei f : IR2 → IR,


⎧ 2 2
⎨ xy x − y

für (x, y) = (0, 0) ,
f (x, y) := x2 + y2


0 für (x, y) = (0, 0) .

Die partiellen Ableitungen an einer Stelle (x, y) = (0, 0) können wir mit Produkt-
und Quotientenregel direkt bestimmen. Wir erhalten

x2 − y2 2x(x2 + y2 ) − 2x(x2 − y2) y(x2 − y2) 4x2 y3


D1 f (x, y) = y + xy = +
x2 + y2 (x2 + y2 )2 x2 + y2 (x2 + y2 )2

x(x2 − y2 ) 4x3 y2
und D2 f (x, y) = 2 2
− 2 .
x +y (x + y2 )2
Auch im Nullpunkt ist f partiell differenzierbar, denn die Grenzwerte

f (t, 0) − f (0, 0) f (0,t) − f (0, 0)


lim =0 und lim =0,
t→0 t t→0 t
existieren; also gilt D1 f (0, 0) = 0 sowie D2 f (0, 0) = 0.
Wir wollen nun noch sehen, dass auch die zweiten Ableitungen D1 (D2 f )(0, 0)
und D2 (D1 f )(0, 0) existieren, aber nicht den selben Wert haben.
Wegen
D2 f (t, 0) − D2 f (0, 0) t −0
lim = lim =1
t→0 t t→0 t

D1 f (0,t) − D1 f (0, 0) −t − 0
und lim = lim = −1
t→0 t t→0 t
haben wir hier D1 (D2 f )(0, 0) = 1 = −1 = D2 (D1 f )(0, 0).

Das folgende Resultat zeigt, unter welchen Umständen die Reihenfolge der Dif-
ferentiation vertauscht werden darf.
Satz 14.11 (Schwarz). Seien U ⊆ IRn offen und f : U → IR eine Funktion, deren
zweite Ableitungen D j (Di f ) existieren und in x ∈ U stetig sind (i, j = 1, . . . , n).
Dann gilt D j (Di f )(x) = Di (D j f )(x).
14.4 Ableitungen höherer Ordnung 205

Beweis. Man kann sich auf n = 2 einschränken. Seien x = (x1 , x2 ) und a = (a1 , a2 )
mit a1 = 0, a2 = 0. Wir betrachten

g(t) := f (t, x2 + a2) − f (t, x2 ) und h(t) := f (x1 + a1 ,t) − f (x1 ,t)

(für diejenigen t ∈ IR, sodass g und h definiert sind).


Aus dem Mittelwertsatz (Satz 7.10) erhalten wir 1 ∈ ]0, 1[ mit

f (x1 + a1 , x2 + a2 ) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 , x2 )


= g(x1 + a1) − g(x1 ) = a1 g (x1 + 1 a1 )
= a1 (D1 f (x1 + 1 a1 , x2 + a2) − D1 f (x1 + 1 a1 , x2 ) ) (14.3)

und analog 2 ∈ ]0, 1[ mit

f (x1 + a1 , x2 + a2 ) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 , x2 )


= a2 (D2 f (x1 + a1, x2 + 2 a2 ) − D2 f (x1 , x2 + 2 a2 ) ) . (14.4)

Nochmalige Anwendung des Mittelwertsatzes auf (14.3) bzgl. der zweiten Veränder-
lichen liefert 3 ∈ ]0, 1[ mit

1
( f (x1 + a1, x2 + a2) − f (x1 , x2 + a2 ) − f (x1 + a1 , x2 ) + f (x1 , x2 ) )
a1 a2
= D2 D1 f (x1 + 1 a1 , x2 + 3 a2 ) .

Ebenso erhalten wir aus (14.4), wenn wir den Mittelwertsatz auf die erste Variable
anwenden, 4 ∈ ]0, 1[ mit

1
( f (x1 + a1, x2 + a2) − f (x1 , x2 + a2 ) − f (x1 + a1, x2 ) + f (x1 x2 ) )
a1 a2
= D1 D2 f (x1 + 4 a1 , x2 + 2 a2 ) .

Mit a1 → 0, a2 → 0 sowie der Stetigkeit von D1 D2 f und D2 D1 f folgt schließlich


die Behauptung. 

Seien V,W endlich-dimensionale normierte IR-Vektorräume und U ⊆ V offen. Wir


nennen eine Funktion f : U → W zwei Mal stetig differenzierbar, wenn sämt-
liche zweite partielle Ableitungen aller Komponentenfunktionen von f existieren
und stetig sind.
Den Raum der zwei Mal stetig differenzierbaren Funktionen f : U → W bezeich-
nen wir mit C2 (U,W ). Wieder schreiben wir kurz C2 (U), falls W = IR ist. Entspre-
chend definiert man ggf. auch Ck (U,W ) für k > 2.
Wir sind nun in der Lage, Taylorpolynome (vgl. Kapitel 10.1) für f ∈ Ck (U) zu
erklären. Wir wollen uns hier auf den Fall k = 2 beschränken.
206 14 Totale Differenzierbarkeit

Satz 14.12 (Taylorentwicklung in IRn ). Seien U eine offene, konvexe Menge im IRn
und f : U → IR zwei Mal stetig differenzierbar.
Dann gilt

1 n
2 i,
f (x) = f (a) + grad f (a) , x − a + Di D j f (a) (xi − ai )(x j − a j ) + R2 (x − a) ,
j=1

2 (x−a)
für a, x ∈ U, wobei das Restglied R2 der Bedingung lim Rx−a 2 = 0 genügt.
x→a

Beweis. Wegen der Stetigkeit der zweiten partiellen Ableitungen im Punkt a gibt es
zu jedem  > 0 und 1 ≤ i, j ≤ n ein  > 0 derart, dass

|Di D j f (a + h) − DiD j f (a)| ≤ für h ≤  (14.5)
n2
gilt. Nun betrachten wir bei festem x ∈ U die Hilfsfunktion F : [0, 1] → IR,

F(t) := f (a + (x − a)t) .

Sie ist zweimal stetig differenzierbar. Deshalb gibt es laut dem Satz von Taylor
(Satz 10.1) ein  ∈ ]0, 1[ mit

1 1
F(1) = F(0) + F  (0) + F  (0) + (F  ( ) − F  (0) ) .
2 2
Dabei ist F(1) = f (x), F(0) = f (a) und
n
F  (t) = grad f (a + (x − a)t) , x − a =  D j f (a + (x − a)t) (x j − a j ) ,
j=1

n
siehe Formel (14.2), sowie F  (t) =  Di D j f (a + (x − a)t) (xi − ai )(x j − a j ).
i, j=1
Folglich gilt

1 n
2 i,
f (x) = f (a) + grad f (a) , x − a + Di D j f (a) (xi − ai )(x j − a j ) + R2 (x − a)
j=1

1 n
2 i,
mit R2 (x − a) = (Di D j f (a + (x − a) ) − DiD j f (a) ) (xi − ai )(x j − a j ).
j=1

Für x − a ≤  liefert (14.5) die Abschätzung

1  2
|R2 (x − a)| ≤ n x − a2 <  x − a2 ,
2 n2
woraus die behauptete Bedingung folgt. 

14.4 Ableitungen höherer Ordnung 207

Hat man eine Abbildung f : U → IR, für die alle zweiten partiellen Ableitungen in
x ∈ U existieren (U ⊆ IRn ), so kann man diese in Matrixform angeben. Die Matrix
⎛ ⎞
D1 D1 f (x) · · · D1 Dn f (x)
⎜ .. .. ⎟
H f (x) = ⎝ . . ⎠
Dn D1 f (x) · · · Dn Dn f (x)

heißt Hessematrix von f im Punkt x. Der Satz von Schwarz (Satz 14.11) besagt
also, dass H f (x) symmetrisch ist, falls die zweiten partiellen Ableitungen von f im
Punkt x stetig sind.
Definition 14.13. Eine reelle symmetrische (n × n)-Matrix A heißt positiv defi-
nit, falls Ah, h > 0 für alle h ∈ IRn \ {0} gilt. Sie heißt positiv semidefinit, falls
Ah, h ≥ 0 für alle h ∈ IRn \ {0} gilt.
Die Matrix A heißt negativ (semi-)definit, falls Ah, h < 0 (bzw. Ah, h ≤ 0)
für alle h ∈ IRn \ {0} gilt.
Falls Vektoren h+ , h− ∈ IRn existieren mit Ah+ , h+  > 0 und Ah− , h−  < 0, so
heißt A indefinit.
Aus der Linearen Algebra wissen wir, dass zu jeder reellen symmetrischen
(n × n)-Matrix eine Orthonormalbasis des IRn aus Eigenvektoren von A existiert.
Daraus ergibt sich folgendes: A ist positiv definit (bzw. positiv semidefinit) genau
dann, wenn alle ihre Eigenwerte positiv (bzw. ≥ 0) sind. A ist genau dann nega-
tiv definit (bzw. negativ semidefinit), wenn alle ihre Eigenwerte negativ (bzw. ≤ 0)
sind. Dagegen ist die Matrix indefinit genau dann, wenn sie Eigenwerte beiderlei
Vorzeichens besitzt.
ab
Im Fall reeller symmetrischer (2 × 2)-Matrizen A = gilt speziell:
bc

A indefinit ⇐⇒ det A = ac − b2 < 0 ,


A positiv definit ⇐⇒ det A > 0 und a > 0 ,
A negativ definit ⇐⇒ det A > 0 und a < 0 ,
A semidefinit, aber nicht definit ⇐⇒ det A = 0 .

Für den Beweis sei auf Lehrbücher zur Linearen Algebra verwiesen, z.B. [5].

Ist f : U → IR eine differenzierbare Funktion (U ⊆ IRn ), so bezeichnet man a ∈ U


als stationären oder kritischen Punkt, wenn grad f (a) = 0 gilt.
Satz 14.8 besagt, dass Extremalstellen notwendigerweise kritische Punkte sind.
Das Beispiel direkt im Anschluss an Satz 14.8 zeigt weiter, dass nicht jeder kritische
Punkt ein Extremum zu sein braucht, vgl. auch Aufgabe 3.
Der nachfolgende Satz liefert für zwei Mal stetig differenzierbare Funktionen
eine Charakterisierung gewisser kritischer Punkte mit Hilfe der Hessematrix.
In diesem Zusammenhang bezeichnen wir a ∈ U als ein isoliertes lokales Extre-
mum von f , wenn a ein lokales Extremum ist und ein  > 0 existiert derart, dass
U (a) kein weiteres lokales Extremum enthält.
208 14 Totale Differenzierbarkeit

Satz 14.14. Seien U ⊆ IRn offen und f : U → IR zwei Mal stetig differenzierbar.
Weiter seien a ∈ U ein kritischer Punkt von f und H f (a) die Hessematrix von f im
Punkt a. Es gilt:
(1) Ist H f (a) indefinit, so ist a kein lokales Extremum von f .
(2) Ist H f (a) positiv definit, so ist a ein isoliertes lokales Minimum von f .
(3) Ist H f (a) negativ definit, so ist a ein isoliertes lokales Maximum von f .

Beweis. Mit grad f (a) = 0 vereinfacht sich die Taylorformel (Satz 14.12) zu

1
f (a + h) − (a) = H f (a) h , h + R2(h)
2
R2 (h)
für h mit hinreichend kleiner Norm und es gilt lim 2 = 0.
h→0 h
(1) Es gibt zwei Vektoren h+ und h− (mit Norm 1) im IRn sowie Skalare a+ > 0,
a− < 0 mit H f (a) h± , h±  = a± . Für alle hinreichend kleinen t ∈ IR \ {0} gilt
deshalb
1
t −2 ( f (a + th±) − f (a) ) = a± + t −2R2 (th± ) ,
2
also nimmt die Differenz f (a + h) − f (a) in jeder Umgebung von a sowohl positive
als auch negative Werte an.
(2),(3) Ist auf der kompakten Sphäre Sn−1 := {h ∈ IRn : h = 1} der Wert
H f (a) h , h von festem Vorzeichen  = 1 oder  = −1, dann finden wir (siehe
Korollar 12.9) ein m > 0 mit

 H f (a) h , h ≥ m , falls h = 1 .

Daraus folgt für alle x ∈ IRn \ {0} von hinreichend kleiner Norm die Abschätzung
 m
 x−2 ( f (a + x) − f (a) ) = H f (a) x−1 x , x−1x +  x−2R2 (x) > .
2 4
Folglich ist a ein isoliertes Minimum oder Maximum von f , je nachdem, ob  = 1
oder  = −1 ist.


Beispiel: Wir suchen alle lokalen Extrema der Funktion f : IR2 → IR,

f (x, y) := 2x3 − 3x2 + 6xy2 + 4y3 .

Mit grad f (x, y) = 6(x2 − x + y2, 2y(x + y) ) gilt

grad f (x, y) = (0, 0) ⇐⇒ (y = 0 und x ∈ {0, 1}) oder


(y = −x und x(2x − 1) = 0) .

Es gibt also drei kritische Punkte a1 = (0, 0), a2 = (1, 0) und a3 = 12 , − 12 .
14.5 Aufgaben 209
 
12x − 6 12y
Nun bestimmen wir die Hessematrix. Wir haben H f (x, y) =
12y 12x + 24y
und damit
     
−6 0 6 0 0 −6
H f (a1 ) = , H f (a2 ) = , H f (a3 ) = .
0 0 0 12 −6 −6

Da H f (a2 ) positiv definit ist, handelt es sich bei a2 um ein lokales Minimum. Weiter
ist H f (a3 ) indefinit, folglich ist a3 kein Extremum. Schließlich ist H f (a1 ) negativ
semidefinit. In diesem Fall liefert Satz 14.14 keine Aussage. Wir müssen auf ande-
rem Wege feststellen, ob es sich hier um ein Extremum handelt. In der Tat nimmt
f wegen f (0, y) = 4y3 in jeder Umgebung des Nullpunkts sowohl positive als auch
negative Werte an. Demnach liegt hier kein Extremum vor.

14.5 Aufgaben

1. Zeigen Sie, dass die folgenden Funktionen differenzierbar sind und bestimmen
Sie deren Jacobimatrix.
⎛ ⎞
3x2
⎜ sin(3x) ⎟
a. f : IR → IR4 , f (x) := ⎜
⎝ 42 ⎠

cos(x2 )

4x2 y3
b. g : IR3 → IR2 , g(x, y, z) :=
xyez + exy

c. h : ]0, [ ×IR2 → IR , h(x, y, z) := sin(zx) ln(x + y2 )

2. Bestimmen Sie die kritischen Punkte der Funktionen

f : IR2 → IR , f (x, y) := 2x3 − 3x2 + 2y3 + 3y2 ,


1 3
g : IR2 → IR , g(x, y) := y2 ex + x −x+5,
3
und h : IR2 → IR , h(x, y) := x3 − 3xy2 .

Untersuchen Sie jeweils, ob es sich um ein lokales Maximum, ein lokales Mi-
nimum oder kein lokales Extremum handelt.

3. Gegeben sei die Funktion f : IR2 → IR, f (x, y) := sin(xy).


a. Skizzieren Sie die Niveaumengen von f .
b. Bestimmen Sie die Hessematrix von f und untersuchen Sie diese an den
kritischen Stellen auf Definitheit.
210 14 Totale Differenzierbarkeit

4. Gegeben sei die Funktion



f : IR2 → IR , f (x, y) := x2 + y2 .

Zeigen Sie:
a. Die Funktion f ist in IR2 \{(0, 0)} differenzierbar; bestimmen Sie D f (x, y).
b. Im Nullpunkt existieren keine Richtungsableitungen von f ; somit ist f dort
auch nicht differenzierbar.

5. Bestimmen Sie alle lokalen Extrema der Funktion

f : IR2 → IR , f (x, y) := (x2 − 1) sin y

und untersuchen Sie jeweils, ob ein Maximum oder ein Minimum vorliegt.

6. Zeigen Sie: Es gibt keine differenzierbare Funktion f : IR3 → IR mit

grad f (x, y, z) = (yz, xz, xy2 ) .

Hinweis: Die Annahme, es gäbe eine derartige Funktion, können Sie mit Hilfe
des Satzes von Schwarz (Satz 14.11) zum Widerspruch führen.

7. Seien U ⊆ IRn offen und f ∈ C2 (U). Wir definieren den so genannten Laplace-
Operator  mittels
n
 f (x) :=  Dk Dk f (x) .
k=1

Eine Funktion f mit  f = 0 nennt man eine harmonische Funktion.


a. Zeigen Sie, dass die Funktionen
1
g : IR2 \ (0, 0) → IR , g(x1 , x2 ) := ln(x21 + x22 ) ,
2
x2
und h : ]0, [ ×IR → IR , h(x1 , x2 ) := arctan ,
x1

harmonisch sind.
b. Zeigen Sie: Das Paar g, h erfüllt die Cauchy-Riemannschen Differential-
gleichungen
g h g h
= und =− .
x y y x
c. Bestimmen Sie die Jacobimatrix von

2 g(x1 , x2 )
F : ]0, [ ×IR → IR , F(x1 , x2 ) := .
h(x1 , x2 )
14.5 Aufgaben 211

8. Seien g : ]0, [ → IR zwei Mal stetig differenzierbar und f : IRn \ {0} → IR,
f (x) := g(x2 ). Zeigen Sie

n−1 
 f (x) = g (x2 ) + g (x2 ) ;
x2

dabei bezeichnet  den Laplace-Operator, siehe Aufgabe 7.


n
9. Seien n ∈ IN, a0 , . . . , an ∈ C, an = 0, und p : C → C, p(z) :=  ak zk .
k=0

Fassen Sie p als Funktion IR2 → IR2 auf: Setzen Sie u(x, y) := Re (p(x + iy) ),
v(x, y) := Im (p(x + iy) ) und

2 2 u(x, y)
f : IR → IR , f (x, y) := .
v(x, y)

Zeigen Sie, dass f die Cauchy-Riemannschen Differentialgleichungen

   
u(x, y) = v(x, y) und u(x, y) = − v(x, y)
x y y x
erfüllt.
Hinweis: Zeigen Sie zunächst mittels vollständiger Induktion, dass die Behaup-
tung für pn (z) := zn , n ∈ IN0 , gilt. Wenn Sie un , vn sinngemäß definieren, dann
gilt un+1 = x un − y vn und vn+1 = y un + x vn .
Kapitel 15
Umkehrsatz und implizite Funktionen

In diesem Kapitel werden wir uns unter anderem mit der Frage nach Existenz und
Differenzierbarkeit der Umkehrfunktion f −1 zu einer gegebenen differenzierbaren
Funktion f in normierten Vektorräumen auseinandersetzen. An die Stelle der Be-
dingung f  (x) = 0 im eindimensionalen Fall (vgl. Satz 7.17) tritt hier die Invertier-
barkeit von D f (x).
Die Invertierbarkeit von linearen Abbildungen spielt in diesem Zusammenhang
also eine wichtige Rolle. Ist V ein normierter IR-Vektorraum, so ist auch L (V ) mit
der Operatornorm ein normierter Raum, wie wir aus Satz 13.3 wissen. Viele der fol-
genden Resultate bleiben auch für unendlich-dimensionale Banachräume gültig; für
unsere Zwecke reicht es aus, V als endlich-dimensional vorauszusetzen. Dann ist
auch L (V ) endlich-dimensional und nach Satz 13.7 vollständig, also ein Banach-
raum.
Lineare Abbildungen in unendlich-dimensionalen Räumen spielen in der Funk-
tionalanalysis eine zentrale Rolle. Zu diesem Gebiet existiert eine große Menge an
weiterführender Literatur, wie z.B. von H.W. Alt [1] oder D. Werner [22].

15.1 Invertierbare lineare Abbildungen und Diffeomorphismen

Satz 15.1. Sei V ein endlich-dimensionaler normierter Raum.


(a) Ist A ∈ L (V ) mit A − idV  < 1, so ist A invertierbar in L (V ) und es gilt

A−1 =  (idV − A)n
n=0

(Konvergenz der Reihe in L (V ), wobei B0 := idV für B ∈ L (V ) sei).


(b) Die Menge G := {A ∈ L (V ) : A invertierbar} ist offen und A → A−1 ist eine
stetige Abbildung G → G.

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 213


DOI 10.1007/978-3-642-28644-5_15, © Springer-Verlag Berlin Heidelberg 2012
214 15 Umkehrsatz und implizite Funktionen

Beweis. (a) Auf Grund der Submultiplikativität der Operatornorm, siehe Bemer-
kung (2) in Kapitel 13.1, gilt (A − idV )n  ≤ A − idV n für alle n. Die Konvergenz
der Reihe in L (V ) folgt mit Hilfe von Satz 5.1 wegen A − idV  < 1 (Geometrische
Reihe).
m
Für m ∈ IN bezeichne Sm :=  (idV − A)n . Wir erhalten
n=0
m m+1
ASm = Sm A = Sm (idV − (idV − A) ) =  (idV − A)n −  (idV − A)n
n=0 n=1
m+1
= idV − (idV − A) .

Mit m →  gilt (idV − A)m+1 → 0 und damit folgt schließlich die Behauptung.
1
(b) Für beliebiges A0 ∈ G und alle A ∈ L (V ) mit A − A0 < gilt
A−1
0 

idV − A−1 −1 −1
0 A = A0 (A0 − A) ≤ A0  A0 − A < 1

und daher A−1


0 A ∈ G.
  n
Es folgt (A−1
0 A)
−1 =
 (id − A−1 n −1
0 A) =  A0 (A0 − A) und damit
n=0 n=0
 
 −1 n
A −1
=  A0 (A0 − A) A−1 0 .
n=0

Insbesondere ist A invertierbar.


Damit ist gezeigt, dass G offen ist.
 
 n
Aus A − A0 =  A0 (A0 − A)
−1 −1 −1
A−1
0 erhalten wir weiter
n=1
 
 −1 n A−1
0  A0 − A
A −1
− A−1
0  ≤  A0  A0 − A A−1 −1
0  = A0 
1 − A−1
.
n=1 0  A0 − A

Zu  > 0 können wir also ein  > 0 finden derart, dass aus A0 − A <  stets
A−1 − A−1
0  <  folgt. Daher ist die Inversenbildung stetig. 

Den eben bewiesenen Satz werden wir speziell in Situationen benutzen, wenn die
betrachteten linearen Abbildungen als Ableitung differenzierbarer Funktionen auf-
treten. Wir beginnen mit einem einfachen Beispiel.
Die so genannten Polarkoordinaten im IR2 erhält man durch die Abbildung
 : ]0, [ × ]0, 2 [ → IR2 ,

 (r,  ) := (r cos  , r sin  ) .


 
cos  −r sin 
Diese ist differenzierbar mit D (r,  ) = .
sin  r cos 
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen 215

Weiter ist D (r,  ) invertierbar als Element von L (IR2 , IR2 ).


Mit (x, y) := (r cos  , r sin  ) gilt
   
cos  sin  x/r y/r 
−1
(D (r,  )) = = , r= x2 + y2 .
1 1
− r sin  r cos  −y/r2 x/r2

Wir erwarten, dass (D (r,  ))−1 die Ableitung der Abbildung  −1 : S → U ist,
wobei S :=  (U) = IR2 \ {(t, 0) : t ≥ 0} die an der positiven x-Achse geschlitzte
Ebene bezeichne,

 −1 (x, y) = (r , sign (y) arccos(x/r) ), r = x2 + y2 .

Falls  −1 differenzierbar ist, braucht man nur die Kettenregel auf  ◦  −1 = idS
oder  −1 ◦  = idU anzuwenden.
Dies war ein Spezialfall folgender allgemeiner Situation.

Definition 15.2. Seien V und W endlich-dimensionale, normierte IR-Vektorräume.


Eine bijektive Abbildung  : U1 → U2 , wobei U1 ⊆ V und U2 ⊆ W offene Mengen
seien, heißt Diffeomorphismus, falls sowohl  als auch  −1 stetig differenzierbar
sind.

Beispiel: Sei f : IRn \ {0} → IRn \ {0},

1
f (x) := x.
x2

Wir bezeichnen die Komponentenfunktionen von f wie üblich mit f j ,


xj
f j (x1 , . . . , xn ) = 2
( j = 1, . . . , n) .
x1 + · · · + x2n

Für i = j gilt

 fj −2xi 2xi x j
(x1 , . . . , xn ) = x j 2 =−
 xi 2
(x1 + · · · + xn )2 x4

und für i = j erhalten wir

 fi (x2 + · · · + x2n ) − 2x2i 1 2x2i


(x1 , . . . , xn ) = 1 2 = − .
 xi (x1 + · · · + x2n )2 x2 x4

Insbesondere existieren alle partiellen Ableitungen und sind stetig; nach Satz 14.10
ist f stetig differenzierbar.
Weiter gilt  f (x) = 1/x und damit f ( f (x) ) = x, also existiert die Umkehr-
abbildung f −1 ; hier ist f = f −1 . Diese ist stetig differenzierbar; folglich ist f ein
Diffeomorphismus.
216 15 Umkehrsatz und implizite Funktionen

Bemerkungen: Ist  : U1 → U2 ein Diffeomorphismus von U1 ⊆ V auf U2 ⊆ W ,


dann gilt:
(1) dimV = dimW ,
(2) Für jedes a ∈ U1 und b =  (a) ist D −1 (b) = (D (a))−1 .
Dies folgt mit der Kettenregel aus  −1 ◦  = idU1 und  ◦  −1 = idU2 , denn damit
haben wir D −1 (b) D (a) = idV und D (a) D −1 (b) = idW .
Insbesondere ist für einen Diffeomorphismus  : U1 → U2 jede Ableitung D (a)
invertierbar in L (V,W ).

Satz 15.3. Seien V,W endlich-dimensionale, normierte IR-Vektorräume, U1 ⊆ V und


U2 ⊆ W offen sowie  : U1 → U2 eine bijektive Abbildung. Ferner seien  stetig
differenzierbar und  −1 : U2 → U1 stetig.
Wenn die Ableitungen D (a) für jedes a ∈ U1 invertierbar in L (V,W ) sind,
dann ist auch  −1 stetig differenzierbar, d.h.  ist ein Diffeomorphismus.

Beweis. Für den Nachweis der Differenzierbarkeit in b =  (a) dürfen wir a = 0 und
b =  (a) = 0 annehmen, denn sonst betrachte man an Stelle von  die Abbildung
x →  (x + a) −  (a).
Eine weitere Reduktion des Problems erhalten wir durch folgende Überlegung.
Die Abbildung  := (D (0) )−1 ◦  ist stetig differenzierbar, injektiv und  −1
ist stetig. Sie bildet U1 auf eine offene (das Urbild der offenen Menge U1 unter
der stetigen Abbildung  −1 ) Teilmenge von V ab. Mit der Kettenregel erhalten wir
D (0) = idV . Die Ableitungen D (a) sind invertierbar, da nach Voraussetzung alle
D (a) invertierbar sind. Hat man gezeigt, dass  −1 in 0 differenzierbar ist, so ist
auch  −1 in 0 differenzierbar wegen  −1 =  −1 ◦ (D (0) )−1 .
Wir können also annehmen, dass  (0) = 0 und D (0) = idV gilt. Dies bedeutet

R(h)
 (h) − idV h = R(h) , wobei lim =0. (15.1)
h→0 h

Sei k ∈ V . Wir setzen h =  −1 (k) ein und erhalten

 −1 (k) − k = −( (h) − h) = −R( −1 (k)) . (15.2)

Wir zeigen, dass


−R( −1 (k))
lim =0 (15.3)
k→0 k
gilt, was äquivalent zur Differenzierbarkeit von  −1 in 0 mit D −1 (0) = idV ist.
Da  −1 stetig ist, gibt es wegen (15.1) positive Zahlen
" r,−1 mit R(h) ≤ 12 h
"
für h ≤ r und  (k) ≤ r für k <  . Damit gilt R  (k) " ≤ 12  −1 (k)
−1 "
für k <  und mit (15.2) erhalten wir

1
 −1 (k) − k ≤  −1 (k) für k <  .
2
15.1 Invertierbare lineare Abbildungen und Diffeomorphismen 217

Folglich haben wir  −1 (k) ≤ 2k für k <  und deshalb

R( −1 (k)) 2R( −1 (k))


≤ −→ 0
k  −1 (k)

mit k → 0, da hiermit auch h =  −1 (k) → 0 gilt. Daraus folgt (15.3).


Zu zeigen bleibt die stetige Differenzierbarkeit, dass D −1 : U2 → L (W,V ) eine
stetige Abbildung ist.
Wie eben können wir V = W annehmen. Sei b ∈ U2 , b =  (a). Aus der Ketten-
regel erhalten wir D −1 (b) = (D (a) )−1 .
Wir betrachten eine Folge (bn )n∈IN in U2 mit bn → b. Für an :=  −1 (bn ) gilt
dann an → a in U1 und, da  stetig differenzierbar ist, folgt D (an ) → D (a) in
L (V ). Mit der Stetigkeit der Inversenbildung in L (V ), Satz 15.1, folgt schließlich
(D (an ) )−1 → (D (a) )−1 , also D −1 (bn ) → D −1 (b).
Damit ist die Stetigkeit von b → D −1 (b) gezeigt. 

Beispiel: Sei f : IR3 → IR3 , ⎛ ⎞
x1 + ex2
f (x) := ⎝ x2 + ex3 ⎠ .
x3 + ex1

Die Jacobimatrix von f lautet


⎛ ⎞
1 ex2 0
D f (x) = ⎝ 0 1 ex2 ⎠ ;
ex1 0 1

ihre Determinante hat den Wert 1 + ex1 ex2 ex3 , ist also stets = 0. Daher ist D f (x) für
alle x ∈ IR3 invertierbar.
Seien x, y ∈ IR3 mit f (x) = f (y). Dann gilt

x1 − y1 = ey2 − ex2 ,
x2 − y2 = ey3 − ex3 ,
x3 − y3 = ey1 − ex1 .

Nehmen wir einmal an, es sei x1 > y1 . Dann folgt aus der dritten Gleichung x3 < y3 ;
daraus folgt mit der zweiten Gleichung nun x2 > y2 und, wenn wir nun die erste
Gleichung heranziehen, folgt x1 < y1 im Widerspruch zur Annahme.
Mit der selben Argumentation, jeweils auch für das umgekehrte Vorzeichen, für
alle drei Komponenten bleibt schließlich nur x1 = y1 , x2 = y2 und auch x3 = y3 .
Folglich ist f injektiv.
Bezeichnet U1 := IR3 und U2 := f (IR3 ), so ist f : U1 → U2 bijektiv. Um nun
mit Satz 15.3 zu folgern, dass f ein Diffeomorphismus ist, ist es nicht nötig, die
Bildmenge U2 oder die Umkehrabbildung f −1 explizit zu bestimmen. Es genügt zu
wissen, dass f −1 stetig und U2 offen ist. Dies ist in der Tat der Fall, wie wir noch
sehen werden, vgl. die Bemerkung im Anschluss an Satz 15.5 und Aufgabe 6.
218 15 Umkehrsatz und implizite Funktionen

15.2 Lokale Invertierbarkeit

Zu Beginn dieses Abschnitts notieren wir einen wichtigen Fixpunktsatz. Dieser hat
vielfältige Anwendungen; wir werden ihn benutzen als Hilfsmittel zum Beweis der
Existenz von Umkehrabbildungen.
Seien (M, d) ein metrischer Raum und  : M → M eine Abbildung. Man sagt, 
ist kontrahierend, wenn eine Zahl q < 1 existiert derart, dass

d( (x),  (y) ) ≤ q d(x, y)

für alle x, y ∈ M gilt.

Satz 15.4 (Fixpunktsatz von Banach). Seien (M, d) ein vollständiger metrischer
Raum und  : M → M eine kontrahierende Abbildung.
Dann besitzt  genau einen Fixpunkt, d.h. es existiert genau ein Punkt x∗ ∈ M
mit  (x∗ ) = x∗ .

Beweis. Wir beginnen mit einem beliebigen y0 ∈ M und setzen yn :=  (yn−1 ) für
n ∈ IN. Es gilt d(y1 , y2 ) = d( (y0 ),  (y1 ) ) ≤ q d(y0 , y1 ) = q d(y0 ,  (y0 ) ) und mit
Induktion folgt d(yn , yn+1 ) ≤ qn d(y0 ,  (y0 ) ) für alle n ∈ IN. Für n, k ∈ IN erhalten
wir damit
n+k−1
d(yn , yn+k ) ≤  d(y j , y j+1 ) ≤ (qn + qn+1 + . . . + qn+k−1) d(y0 ,  (y0 ) )
j=n
qn
≤ d(y0 ,  (y0 ) )
1−q
(Abschätzung durch die Geometrische Reihe). Wegen q < 1 folgt daraus weiter, dass
(yn )n∈IN eine Cauchyfolge ist. Da (M, d) vollständig ist, ist diese Folge konvergent,
also existiert x∗ := lim yn . Wir erhalten
n→

x∗ = lim yn = lim yn+1 = lim  (yn ) =  (x∗ ) ,


n→ n→ n→

wobei wir benutzt haben, dass  stetig ist ( ist sogar Lipschitz-stetig).
Demnach ist x∗ ein Fixpunkt.
Zu zeigen bleibt noch die Eindeutigkeit. Seien x∗ , y∗ ∈ M mit  (x∗ ) = x∗ und
 (y∗ ) = y∗ . Dann folgt d(x∗ , y∗ ) = d( (x∗ ),  (y∗ ) ) ≤ q d(x∗ , y∗ ). Wegen q < 1 ist
dies nur möglich, wenn d(x∗ , y∗ ) = 0, also x∗ = y∗ , gilt. 

Satz 15.5 (Satz von der lokalen Umkehrbarkeit). Seien V und W endlich-dimen-
sionale normierte IR-Vektorräume, U ⊆ V offen, f : U → W stetig differenzierbar
und D f (a) ∈ L (V,W ) invertierbar für ein a ∈ U. Bezeichne b := f (a).
(a) Es existieren offene Mengen Ua in V und Wb in W mit a ∈ Ua , b ∈ Wb derart,
dass f die Menge Ua bijektiv auf die Menge Wb abbildet.
(b) Ist g : Wb → Ua die inverse Abbildung von f |Ua , so ist g stetig differenzierbar.
15.2 Lokale Invertierbarkeit 219

Beweis. Da D f (a) invertierbar vorausgesetzt ist, gilt dimV = dimW . Daher können
wir V = W = IRn annehmen und dort die Norm  · 2 zu Grunde legen.
1
Wir schreiben A := D f (a) und setzen  := 2A−1 
> 0.

Da D f (a) als lineare Abbildung stetig ist, existiert eine offene Kugel Ua um a mit
D f (x) − A <  für alle x ∈ Ua . Zu festem y ∈ IRn definieren wir

y : U → IRn , y (x) := x + A−1(y − f (x) ) .

Damit ist x ein Fixpunkt von y genau dann, wenn f (x) = y ist.
Nun gilt Dy (x) = id − A−1 D f (x) = A−1 (A − D f (x) ), also

1
Dy (x) ≤ A−1 A − D f (x) < für alle x ∈ Ua
2
und mit dem Schrankensatz (Korollar 13.14) erhalten wir
1
y (x1 ) − y (x2 )2 ≤ x1 − x22 für alle x1 , x2 ∈ Ua . (15.4)
2
Folglich hat y |Ua höchstens einen Fixpunkt x ∈ Ua , denn aus y (x1 ) = x1 und
y (x2 ) = x2 folgt x1 − x2 2 ≤ 12 x1 − x2 2 . Somit existiert höchstens ein x ∈ Ua
mit f (x) = y. Insbesondere ist f |Ua injektiv.
Setzt man Wb := f (Ua ), so ist f |Ua : Ua → Wb bijektiv.
Zu zeigen bleibt, dass Wb offen ist. Dazu halten wir y0 ∈ Wb fest. Es gibt genau ein
x0 ∈ Ua mit f (x0 ) = y0 . Weiter finden wir r > 0 mit Kr (x0 ) ⊆ Ua . Wir wollen sehen,
dass für y − y0 <  r stets y ∈ Wb gilt. Daraus folgt dann, dass Wb offen ist.
Sei also y ∈ U r (y0 ). Mit entsprechendem y erhalten wir

1 r
y (x0 ) − x0 2 ≤ A−1 (y − f (x0 ) )2 ≤ A−1  y − y02 < r = .
2 2
Für x ∈ Kr (x0 ) gilt mit (15.4) weiter

y (x) − x0 2 ≤ y (x) − y (x0 )2 + y (x0 ) − x02


1 r r r
≤ x − x02 + ≤ + = r ,
2 2 2 2
also y (x) ∈ Kr (x0 ). Demnach ist y |Kr (x0 ) eine Abbildung von Kr (x0 ) in Kr (x0 )
und wegen (15.4) ist y kontrahierend. Als abgeschlossene Teilmenge eines Ba-
nachraumes ist Kr (x0 ) ein vollständiger metrischer Raum (siehe auch Kapitel 12.3,
Aufgabe 9). Mit dem Fixpunktsatz von Banach (Satz 15.4) folgt schließlich, dass
y |Kr (x0 ) genau einen Fixpunkt x ∈ Kr (x0 ) hat. Für dieses x gilt f (x) = y, also
y ∈ Wb wie gewünscht.
Damit ist die Aussage (a) bewiesen.
220 15 Umkehrsatz und implizite Funktionen

Wir müssen noch nachweisen, dass g := ( f |Ua )−1 stetig differenzierbar ist. Um
Satz 15.3 anzuwenden, haben wir zu zeigen, dass g : Wb → Ua stetig und D f (x) für
alle x ∈ Ua invertierbar ist.
Dazu seien y1 , y2 ∈ Wb und x1 := g(y1 ) sowie x2 := g(y2 ). Wir betrachten nun 0
zu 0 ∈ IRn und erhalten

0 (x2 ) − 0(x1 ) = x2 − x1 − A−1( f (x2 ) − f (x1 ) ) = x2 − x1 − A−1(y2 − y1) .

Mit (15.4) folgt

x2 − x1 2 ≤ 0 (x2 ) − 0 (x1 )2 + A−1(y2 − y1 )2


1
≤ x2 − x1 2 + A−1 y2 − y1 2 .
2
Somit gilt g(y2 ) − g(y1)2 x2 − x1 2 ≤ 2A−1 y2 − y1 2 .
Demnach ist g stetig.
Schließlich zeigen wir noch die Invertierbarkeit von D f (x) für alle x ∈ Ua . Es ist
D f (x) − A <  für alle x ∈ Ua ; damit erhalten wir

D f (x) v − Av2 ≤  v2 für alle x ∈ Ua , v ∈ IRn .


1
Wenn D f (x)v = 0 für ein x ∈ Ua und v ∈ IRn gilt, ergibt sich Av2 ≤ 2A−1 
v2 .
Es folgt v2 = A−1Av 2 ≤ A−1  Av2 ≤ 1
2 v2 und damit dann v = 0.
Folglich ist D f (x) invertierbar. 

Wir wollen die Aussage des Satzes 15.5 einer komponentenweisen Interpretation
unterziehen. Hat man das System von n Gleichungen

y1 = f (x1 , . . . , xn )
.. ..
. .
yn = f (x1 , . . . , xn )

mit f ∈ C1 (U) und D f (a) invertierbar, so existieren Umgebungen Ua von a und Wb


von b = f (a), sodass man dieses Gleichungssystem nach x1 , . . . , xn auflösen kann,
wenn x = (x1 , . . . , xn ) ∈ Ua und y = (y1 , . . . , yn ) ∈ Wb gewählt werden. Man spricht
von lokaler Invertierbarkeit.

Beispiel: Seien V = W = IR3 und f : IR3 → IR3 ,

f1 (x1 , x2 , x3 ) := x1 + x2 + x3 ,
f2 (x1 , x2 , x3 ) := x2 x3 + x3 x1 + x1 x2 ,
f3 (x1 , x2 , x3 ) := x1 x2 x3 .

Damit ist
15.2 Lokale Invertierbarkeit 221
⎛ ⎞
1 1 1
D f (x) = ⎝ x3 + x2 x3 + x1 x2 + x1 ⎠ .
x2 x3 x1 x3 x1 x2
Man kann direkt nachrechnen, dass

det D f (x) = (x1 − x2 )(x1 − x3 )(x2 − x3)

gilt. Somit ist D f (a) invertierbar, falls a = (a1 , a2 , a3 ) paarweise verschiedene Kom-
ponenten besitzt. Also gibt es für solche a eine offene Umgebung Ua von a sowie
eine offene Umgebung Wb von b = f (a) derart, dass f |Ua : Ua → Wb invertierbar ist.

Bemerkung: Ist f : U → W stetig differenzierbar, U ⊆ V offen, mit D f (x) inver-


: offen für alle offenen Teilmengen U
tierbar für alle x ∈ U, so ist f (U) : ⊆ U.
Man erhält dies direkt aus Satz 15.5, denn für jedes x ∈ U : existieren offene Men-
gen Ux ⊆ U : und W f (x) , sodass f |Ux : Ux → W f (x) bijektiv ist.
+
Insbesondere ist f (U) : = W f (x) offen.
:
x∈U
Außerdem ist f lokal injektiv, d.h. f |Ux ist injektiv für alle x ∈ U. Das bedeutet
allerdings nicht zwingend, dass auch f injektiv ist.
x
2 2 e cosy
Beispiel: Wir betrachten die Funktion f : IR → IR , f (x, y) := .
ex sin y
Für alle (x, y) ∈ IR2 ist die Jacobimatrix
x
e cos y −ex sin y
D f (x, y) =
ex sin y ex cos y

invertierbar, da ihre Determinante den Wert e2x (cos2 y + sin2 y) = e2x = 0 hat.
Weiter gilt f (x, y + 2 ) = f (x, y) für alle (x, y) ∈ IR2 , daher ist f nicht injektiv.
Wir merken noch an, dass f nichts anderes als die komplexe Exponentialfunktion
ist, wenn man IR2 mit C identifiziert.
Da f nicht injektiv ist, existiert zwar keine
& globale
' Umkehrabbildung, aber bei-
spielsweise bildet f die Menge U := IR × − 2 , 2 bijektiv auf W := ]0, [ ×IR ab.
Hier können wir eine lokale Umkehrabbildung leicht angeben. Aus
x
e cos y u
x = ∈W
e sin y v
√ 
folgt einerseits u2 + v2 = e2x (cos2 y + sin2 y) = ex , also x = 12 ln(u2 + v2 ) und
andererseits
v sin y
= = tan y .
u cos y
Es
& gibt zwar viele y ∈ IR mit tany = uv , allerdings liegt nur eines davon im Intervall
'
− 2 , 2 , nämlich y = arctan uv .
222 15 Umkehrsatz und implizite Funktionen

Die gesuchte Umkehrabbildung ( f |U)−1 : W → U ist folglich gegeben durch


 
1 2 2
2 ln(u + v )
(u, v) →  ,
arctan uv

vgl. auch Kapitel 14.5, Aufgabe 7. Insbesondere ist f |U ein Diffeomorphismus.


Entsprechend kann man zu jedem a ∈ IR2 eine offene Umgebung Ua finden, so-
dass f |Ua ein Diffeomorphismus ist. Im vorliegenden Fall haben wir, wenn wir hier
wieder IR2 mit C identifizieren, lokale Umkehrungen der komplexen Exponenti-
alfunktion gefunden. Man bezeichnet diese auch als die Zweige des (komplexen)
Logarithmus.

15.3 Implizit definierte Funktionen

Wir beginnen mit einem einfachen Beispiel. Gegeben sei die Funktion f : IR2 → IR,
f (x, y) := x2 (1 − x2 ) − y2 . Weiter sei M := {(x, y) ∈ IR2 : f (x, y) = 0} die Menge
der Nullstellen von f .

1
2 Die Abbildung zeigt die
Nullstellenmenge M der
Funktion f . Diese Menge
1 ist nicht der Graph einer
Funktion IR → IR.

Schränken wir uns auf die Menge U := ]0, [ × ]0, [ ein, so können wir die Glei-
chung f (x, y) = 0 nach y auflösen. Für (x, y) ∈ U gilt

x2 (1 − x2) − y2 = 0 ⇐⇒ y2 = x2 (1 − x2 ) ⇐⇒ y = x2 (1 − x2 ) .

Setzen wir g : ]0, 1[ → IR, g(x) := x2 (1 − x2), so erhalten wir

M ∩U = {(x, y) : y = g(x)} .
 
In V := (x, y) ∈ IR2 : x > 12 können wir nach x auflösen. Für (x, y) ∈ V gilt


2 2 2 1 1
x (1 − x ) − y = 0 ⇐⇒ x = + 1 − 4y2 .
2 2
& '  
Mit h : − 12 , 12 → IR, h(y) := 12 + 12 1 − 4y2, gilt M ∩V = {(x, y) : x = h(y)}.
15.3 Implizit definierte Funktionen 223

In U kann man die Gleichung In V kann man die Gleichung


f (x, y) = 0 nach y auflösen. f (x, y) = 0 nach x auflösen.

Wir halten noch fest, dass hier sowohl f als auch g und h stetig differenzierbar sind
und, dass für (x, y) ∈ U ∩ M stets  yf (x, y) = 0, für (x, y) ∈ V ∩ M stets  xf (x, y) = 0
gilt. Es wird sich zeigen, dass diese Bedingungen an die partiellen Ableitungen eine
wichtige Rolle hinsichtlich der Auflösbarkeit von Gleichungen spielen.

Bevor wir den Satz über implizite Funktionen allgemein formulieren, werden wir
den linearen Fall untersuchen.
Sind x = (x1 , . . . , xn ) ∈ IRn und y = (y1 , . . . , ym ) ∈ IRm , so schreiben wir nun
(x, y) = (x1 , . . . , xn , y1 , . . . , ym ) ∈ IRn+m und mit (x, y) ∈ IRn+m meinen wir stets
x ∈ IRn und y ∈ IRm .
Eine lineare Abbildung A ∈ L (IRn+m , IRn ) können wir in zwei Abbildungen
Ax ∈ L (IRn , IRn ) und Ay ∈ L (IRm , IRn ) zerlegen durch

Ax h := A(h, 0) mit h ∈ IRn , 0 ∈ IRm ,


Ay k := A(0, k) mit 0 ∈ IRn , k ∈ IRm .

Damit gilt A(h, k) = Ax h + Ayk.


Mit diesen Bezeichnungen ist die folgende lineare Version des Satzes über im-
plizite Funktionen offensichtlich.

Satz 15.6. Sei A ∈ L (IRn+m , IRn ). Weiter sei Ax invertierbar.


Dann gibt es zu jedem k ∈ IRm ein eindeutig bestimmtes h ∈ IRn derart, dass
A(h, k) = 0 gilt. Man erhält dieses als

h = −(Ax )−1 Ay k .

Bemerkungen:
(1) Satz 15.6 besagt, das die Gleichung A(h, k) = 0 bei vorgegebenem k auf ein-
deutige Weise nach h aufgelöst werden kann, falls Ax invertierbar ist. Weiter
ist h ist eine lineare Funktion von k.
(2) Selbstverständlich können IRn durch einen n-dimensionalen normierten Vek-
torraum V und IRm durch einen m-dimensionalen normierten Raum W sowie
dann IRn+m durch V × W ersetzt werden.
224 15 Umkehrsatz und implizite Funktionen

Satz 15.7 (Satz über implizite Funktionen). Seien V ein n-dimensionaler und W
ein m-dimensionaler normierter Raum. Weiter seien U ⊆ V × W offen, f : U → V
stetig differenzierbar und (a, b) ∈ U ein Punkt, für den f (a, b) = 0 gilt. Bezeichne
A := D f (a, b) ∈ L (V × W,V ). Schließlich sei noch vorausgesetzt, dass die durch
die Zerlegung A(h, k) = Ax h + Ayk erklärte Abbildung Ax ∈ L (V ) invertierbar ist.
Dann gibt es eine offene Umgebung U(a,b) von (a, b) in V × W und eine offene
Umgebung Wb von b in W mit den folgenden Eigenschaften:
Jedem y ∈ Wb ist genau ein x ∈ V zugeordnet, sodass (x, y) ∈ U(a,b) und f (x, y) = 0
gilt. Wird dieses x als g(y) definiert, so ist g : Wb → V stetig differenzierbar mit
g(b) = a sowie
f (g(y), y) = 0 für alle y ∈ Wb
und es gilt Dg(b) = −(Ax )−1 Ay .

Beweis. Wie in Satz 15.5 können wir wieder V = IRn und W = IRm mit der jeweili-
gen  · 2-Norm annehmen. Wir werden den Satz über die lokale Umkehrbarkeit auf
folgende Funktion anwenden:

F : U → IRn+m , F(x, y) := ( f (x, y), y) .

Diese ist stetig differenzierbar. Um zu sehen, dass DF(a, b) ∈ L (IRn+m ) invertier-


bar ist, müssen wir zeigen, dass DF(a, b) injektiv ist. Mit f (a, b) = 0 erhalten wir

f (a + h, b + k) = A(h, k) + R(h, k) ,

wobei R(h, k) das Restglied gemäß Definition 14.1 zu D f (a, b) ist. Nun gilt

F(a + h, b + k) − F(a, b) = ( f (a + h, b + k), b + k) − ( f (a, b), b)


= ( f (a + h, b + k), k) = (A(h, k), k) + (R(h, k), 0) .

Mit h → 0, k → 0 sieht man, dass DF(a, b) ∈ L (IRn+m ) nichts anderes als die
lineare Abbildung (h, k) → (A(h, k), k) ist.
Wäre nun DF(a, b) nicht injektiv, so gäbe es (h, k) = (0, 0) mit (A(h, k), k) =
(0, 0). Daraus folgt aber A(h, k) = 0 und k = 0, also Ax h = A(h, 0) = 0 und, da Ax
invertierbar ist, müsste auch h = 0 sein. Folglich ist DF(a, b) injektiv.
Nun ist der Satz von der lokalen Umkehrbarkeit (Satz 15.5) auf F anwendbar. Wir
erhalten damit offene Mengen U(a,b) ⊆ IRn+m mit (a, b) ∈ U(a,b) und W(0,b) mit
(0, b) ∈ W(0,b) , sodass F : U(a,b) → W(0,b) bijektiv ist.
Weiter setzen wir Wb := {y ∈ IRm : (0, y) ∈ W(0,b) }. Die Menge Wb ist offen, da
W(0,b) offen ist. Ist y ∈ Wb , so existiert genau ein (x, y) ∈ U(a,b) mit F(x, y) = (0, y).
Laut der Definition von F bedeutet dies, dass f (x, y) = 0 gilt.
Ist für das selbe y auch f (:x, y) = 0, so gilt F(: x, y) = ( f (:
x, y), y) = (0, y) =
( f (x, y), y) = F(x, y) und mit der Injektivität von F|U(a,b) folgt x = x:. Somit ist auch
die Eindeutigkeit des zugeordneten x bewiesen.
15.3 Implizit definierte Funktionen 225

Bezeichne g(y) = x. Hiermit ist eine Funktion g : Wb → IRn erklärt und es gilt
(g(y), y) ∈ U(a,b) sowie f (g(y), y) = 0, also F(g(y), y) = (0, y).
−1
Mit G := F|U(a,b) erhält man daraus (g(y), y) = G(0, y) und, da G stetig
differenzierbar ist, ist auch g stetig differenzierbar. Um schließlich Dg(b) zu be-
rechnen, betrachten wir  : Wb → U(a,b) ,  (y) := (g(y), y). Es gilt

D (y) k = (Dg(y)k, k) für alle y ∈ Wb , k ∈ IRm (15.5)

und wegen f ◦  (y) = 0 folgt mit der Kettenregel

D f ( (y)) D (y) = 0 . (15.6)

Aus der Zerlegung A(h, k) = Ax h + Ay k und den Gleichungen (15.5) sowie (15.6)
folgt nun Ax Dg(b) k + Ay k = A(Dg(b)k, k) = A D (b) k = 0 für alle k ∈ IRm . Dies
bedeutet Ax Dg(b) = −Ay . 

Beispiel: Sei f : IR2+3 → IR2 , f = ( f1 , f2 ), mit

f1 (x1 , x2 , y1 , y2 , y3 ) := 2ex1 + x2 y1 − 4y2 + 3 ,


f2 (x1 , x2 , y1 , y2 , y3 ) := x2 cos x1 − 6x1 + 2y1 − y3 .

Für a := (0, 1) und b := (3, 2, 7) haben wir f (a, b) = 0. Die Ableitung hat bezüglich
der Standardbasis die Darstellung
 
2ex1 y1 x2 −4 0
D f (x1 , x2 , y1 , y2 , y3 ) = .
−x2 sin x1 − 6 cosx1 2 0 −1

Wir zerlegen A := D f (a, b) in


   
2 3 1 −4 0
Ax = und Ay =
−6 1 2 0 −1

und erkennen, dass Ax invertierbar ist. Laut Satz 15.7 existieren eine offene Umge-
bung Wb von b = (3, 2, 7) und eine stetig differenzierbare Abbildung g : Wb → IR2
mit f (g(y), y) = 0 für alle y ∈ Wb . Um Dg(3, 2, 7) zu bestimmen, benötigen wir A−1
x .
Es gilt  
−1 1 1 −3
Ax = ,
20 6 2
also
    1 1 3

1 1 −3 1 −4 0 4 5 − 20
Dg(3, 2, 7) = − = .
20 6 2 2 0 −1 − 12 6 1
5 10
226 15 Umkehrsatz und implizite Funktionen

15.4 Extrema unter Nebenbedingungen

Wir untersuchen Extremwertaufgaben für Funktionen f : U → IR, wobei aber die


Punkte a ∈ U, die für die Extremwertsuche zugelassen sind, die Nebenbedingung
g(a) = 0 mit einer gegebenen Funktion g : U → IR erfüllen müssen (U ⊆ IRn offen).
Mit anderen Worten: Wir betrachten die Einschränkung von f auf die Nullstel-
lenmenge S := {x ∈ U : g(x) = 0} von g.

Ist a ∈ U ein Punkt, an welchem die Nullstellenmenge S


eine Niveaulinie von f schneidet, so gibt es in jeder Um-
gebung von a sowohl Punkte x+ mit f (x+ ) > f (a) als auch
S x− mit f (x− ) < f (a).
Ein Extremum kann nur dort vorliegen, wo sich S und eine
Niveaulinie von f tangential berühren.
x0
Falls f und g stetig differenzierbar sind, bedeutet dies, dass
a an einer solchen Stelle x0 dann grad f (x0 ) und grad g(x0 )
die gleiche Richtung haben.

Satz 15.8 (Multiplikatorregel von Lagrange). Seien U ⊆ IRn offen, f , g : U → IR


stetig differenzierbar und a ∈ U mit g(a) = 0, grad g(a) = 0. Weiter sei

S := {x ∈ U : g(x) = 0} .

Hat f |S im Punkt a ein lokales Extremum, dann gibt es eine reelle Zahl  mit

grad f (a) =  grad g(a) .

Beweis. Nach eventueller Umnummerierung können wir wegen grad g(a) = 0 an-
nehmen, dass xgn (a) = 0 ist.
Laut dem Satz über implizite Funktionen (Satz 15.7) ist in einer Umgebung von a
eine Funktion h in n − 1 Variablen (x1 , . . . , xn−1 ) erklärt, sodass xn = h(x1 , . . . , xn−1 )
die Bedingung g(x1 , . . . , xn ) = 0 erfüllt, und es gilt

h g ; g
(a1 , . . . , an−1 ) = − (a) (a) für i = 1, . . . , n − 1 .
 xi  xi  xn
Die Voraussetzung, dass f |S im Punkt a ein lokales Extremum hat, können wir wie
folgt formulieren: Die Abbildung (x1 , . . . , xn−1 ) → f (x1 , . . . , xn−1 , h(x1 , ..., xn−1 ) )
besitzt in (a1 , . . . , an−1 ) ein lokales Extremum. Damit gilt notwendigerweise

f f h
0= (a) + (a) (a1 , . . . , an−1 )
 xi  xn  xi
f f g ; g
= (a) − (a) (a) (a)
 xi  xn  xi  xn
f g
für i = 1, . . . , n − 1. Mit  :=  xn (a) /  xn (a) ist die Behauptung gezeigt. 

15.4 Extrema unter Nebenbedingungen 227

Beispiel: Wir betrachten die Funktion f : IR2 → IR, f (x, y) := x3 − 3xy2 . Seien r > 0
und Mr := {(x, y) ∈ IR2 : x2 + y2 = r2 }. Mit Hilfe von Satz 15.8 wollen wir die
Extrema von f auf Mr bestimmen.
Dazu setzen wir g : IR2 → IR, g(x, y) := x2 + y2 − r2 . Damit ist Mr genau
die Menge der Nullstellen von g. Es gilt grad g(x, y) = (2x, 2y) und insbesondere
grad g(x, y) = (0, 0) für alle (x, y) ∈ Mr . Mögliche Extrema finden wir daher, in-
dem wir Lösungen der Gleichung grad f (x, y) =  grad g(x, y) suchen. Weiter ist
grad f (x, y) = (3x2 − 3y2, −6xy). Wir suchen also Lösungen des Gleichungssystems

3x2 − 3y2 = 2 x ,
−6xy = 2 y ,
x2 + y2 = r 2 .

Aus der zweiten Gleichung folgt y = 0 oder  = −3x.


Im Fall y = 0 erhalten wir aus der dritten Gleichung dann x = ±r und auch die
erste Gleichung ist erfüllbar mit einem geeigneten  . Der genaue Wert von  spielt
hier gar keine Rolle mehr; wichtig ist nur, dass es ein solches gibt.
Im Fall y = 0 folgt wie gesagt  = −3x. Setzen wir dies in die erste Gleichung
ein, so erhalten wir 3x2 = y2 und mit der dritten

Gleichung folgt 4x2 = r2 , also
x = ± 2r . Damit ergibt sich schließlich y = ± r 2 3 .
Wenn f also auf der Menge Mr ein Extremum annimmt, dann kommen nur die
folgenden Stellen in Frage:
 √   √ 
r r 3 r r 3
a1 = , , a2 = − , , a3 = (−r, 0) ,
2 2 2 2
 √   √ 
r r 3 r r 3
a4 = − ,− , a5 = ,− , a6 = (r, 0) .
2 2 2 2

Nun müssen wir noch überprüfen, ob es sich auch wirklich um Extrema handelt.
Dazu stellen wir fest, dass die stetige Funktion f auf der kompakten Menge Mr
Maximum und Minimum annimmt (vgl. Korollar 12.9), d.h. mindestens einer der
eben bestimmten Punkte muss ein Maximum sein und mindestens einer muss ein
Minimum sein.
Vergleichen wir die Funktionswerte an diesen Punkten, so erhalten wir

f (a2 ) = f (a4 ) = f (a6 ) = r3 und f (a1 ) = f (a3 ) = f (a5 ) = −r3 ,

also handelt es sich bei ersteren um Maxima, bei den anderen um Minima.
228 15 Umkehrsatz und implizite Funktionen

15.5 Aufgaben

1. Seien U := ]0, [ × ]0, 2 [ und f : U → IR2 , f (u, v) := (u2 cos v, u2 sin v).
a. Zeigen Sie, dass D f (u, v) invertierbar ist für alle (u, v) ∈ U.
b. Weiter sei S := f (U). Zeigen Sie, dass f : U → S ein Diffeomorphismus
ist und bestimmen Sie D( f −1 ).

2. Sei f : IR2 → IR2 , f (x, y) := (ex+y cos(x − y), ex+y sin(x − y) ).


Zeigen Sie, dass f in allen Punkten (x, y) ∈ IR2 eine lokale Umkehrfunktion
besitzt.

3. Sei f : IR2 → IR, f (x, y) := 3x2 + xy4 − yey .


Zeigen Sie, dass ein Intervall I mit 0 ∈ I sowie eine differenzierbare Funktion
g : I → IR existieren mit

f (x, g(x) ) = 0 für alle x ∈ I

und bestimmen Sie g .

4. Zeigen Sie, dass das Gleichungssystem

2ex1 + x2 x3 − 4x4 = 3
x2 cos x1 − 6x1 + 2x3 − x5 = 0

in einer Umgebung des Punktes (0, 1, 1, 0, 3) nach den Variablen x1 und x2 auf-
gelöst werden kann.
Weiter seien b := (1, 0, 3) und g : Wb → IR2 die durch obiges Gleichungssystem
implizit erklärte Funktion (mit geeignetem Wb ⊆ IR3 ). Begründen Sie, warum
g stetig differenzierbar ist und bestimmen Sie Dg(b).

5. Gegeben ist das Gleichungssystem

x2 + sin(xy2 − 2z) = 0 ,
x2 + sin(y + xz2 ) = 0 .

Zeigen Sie: Zu beliebigem  > 0 existieren unendlich viele Lösungen (x, y, z)


des Systems mit (x, y, z) <  .
Hinweis: Zeigen Sie, dass die Menge der Lösungen in einer offenen Umgebung
des Nullpunkts der Graph einer Funktion ist (man kann nach x auflösen).

6. Seien V,W zwei endlich-dimensionale normierte IR-Vektorräume. Weiter seien


U ⊆ V offen und f : U → W stetig differenzierbar derart, dass D f (a) für jedes
a ∈ U invertierbar ist. Zeigen Sie: Die Bildmenge f (U) ist offen in W .
15.5 Aufgaben 229

7. Seien U := ]0, [ × ]0, [ und f : U → IR, f (x, y) := x + y.


Bestimmen Sie alle lokalen Extrema von f auf der Menge

1 1
M := (x, y) ∈ U : 2 + 2 = 1 .
x y

x+y
8. Seien K := {(x, y) ∈ IR2 : x2 + y2 = 1} und f : K → IR, f (x, y) := .
1 − xy
Bestimmen Sie alle lokalen Extrema von f .
Kapitel 16
Elementar lösbare Differentialgleichungen

Zahlreiche Phänomene werden mit gewöhnlichen Differentialgleichungen beschrie-


ben. Differentialgleichungen sind daher Gegenstand vieler weiterführender Vorle-
sungen. Zu diesem Thema existiert auch ein umfangreiches Angebot an Literatur,
wie z.B. Forst/Hoffmann [6]. Wir wollen hier lediglich einige elementare Beispiele
betrachten und Aussagen zur Existenz und Eindeutigkeit von Lösungen herleiten.
Bevor wir uns Lösungsmethoden und Existenzaussagen zuwenden, wollen wir
einige Situationen beschreiben, in denen Differentialgleichungen eine Rolle spielen.
(1) Zerfalls- und Wachstumsprozesse

x =  x ,  ∈ IR (Wachstumsrate proportional zur Größe).

Dabei ist x : I → IR eine differenzierbare Funktion auf einem Intervall I. Der


Wert x(t) beschreibt dabei z.B. die Anzahl der zur Zeit t vorhandenen Atome
(radioaktiver Zerfall), oder die Populationsgröße, etwa von Bakterien, zur
Zeit t. Eine Lösung lautet

x(t) = x0 e t , t ∈ IR , mit x0 = x(0) .

Ist  > 0 so gilt lim x(t) =  (unrealistisch für Populationen).


t→
(2) Logistisches Wachstum (Verhulst-Pearl-Gleichung)

x = (a − bx)x , a, b > 0 .

Wieder interpretiert man x(t) als Populationsgröße zum Zeitpunkt t. Hier


hängt die Rate a − bx von der derzeitigen Größe der Population ab. Dabei be-
schreibt a die Wachstumsrate (bei unbegrenzten Ressourcen) und −bx(t) die
Wirkung begrenzter Ressourcen oder einer Überbevölkerung“. Eine Lösung

lautet
a 1
x(t) =   mit x0 = x(0) .
b 1 + e−at a − 1
bx0

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 231


DOI 10.1007/978-3-642-28644-5_16, © Springer-Verlag Berlin Heidelberg 2012
232 16 Elementar lösbare Differentialgleichungen

Man kann dies durch Einsetzen leicht nachprüfen, siehe auch Kapitel 16.4,
Aufgabe 2.
Allerdings ist hier anzumerken, dass x(t) nicht für alle t ∈ IR definiert ist.
Neben dem Problem, eine Lösung zu finden, stellt sich bei vielen Differen-
tialgleichungen die Frage, ob überhaupt und auf welchem Definitionsbereich
Lösungen existieren.
Das logistische Modell findet zahlreiche Anwendungen in der theoretischen
Biologie, Demographie etc.
(3) Newtons Gesetz
mx (t) = f (t, x(t), x (t) ) .
Hier beschreibt x(t) die Position eines Teilchens, auf das eine Kraft f wirkt.
Dabei ist f eine Funktion der Zeit t, der Lage x(t) und der Geschwindigkeit
x (t); m bezeichnet die Masse. Ist z.B. die Kraft die Gravitation, so gilt

mx (t) = −mg

mit der Gravitationskonstanten g. Eine Lösung der letzteren Differentialglei-


chung lautet
1
x(t) = − gt 2 + c1t + c2 mit c1 , c2 ∈ IR .
2
Um c1 und c2 zu bestimmen, muss man x(t0 ) und x (t0 ) zu einem Zeitpunkt
t0 kennen. Ist speziell x (t) = −x(t) die (normierte) Gleichung des harmoni-
schen Oszillators, so hat man Lösungen

x(t) = c1 sin t + c2 cost , c1 , c2 ∈ IR .

(4) Räuber-Beute-Modell (Lotka-Volterra).


In diesem Modell hat man eine Beute-Population x(t) und eine Räuber-
Population y(t). Die Beute-Population hat unbegrenzte Ressourcen, wird
aber durch die Räuber-Population in Abhängigkeit von Begegnungen mit y(t)
dezimiert:

x (t) = ( −  y(t) ) x(t) =  x(t) −  y(t) x(t) ( > 0,  > 0) .

Die Räuber-Population wächst mit Anwesenheit von Beute und Begegnung


mit ihr, und wird durch eine Sterberate dezimiert:

y (t) = ( x(t) −  ) y(t) =  x(t) y(t) −  y(t) ( > 0,  > 0) .

Damit hat man eine 2-dimensionale Differentialgleichung

x = ( −  y) x ,
y = ( x −  ) y .
16.1 Der Satz von Picard-Lindelöf 233

Lösungen sind unter


 anderem
 die konstanten Funktionen (x(t), y(t) ) = (0, 0)
 
und (x(t), y(t) ) = , .
Zwei weitere Lösungen sind leicht zu finden, etwa (x(t), y(t) ) = (0, e− t ) und
(x(t), y(t) ) = (e t , 0). Letztere ist wegen lim e t =  unrealistisch.
t→

16.1 Der Satz von Picard-Lindelöf

Wir betrachten eine allgemeine Differentialgleichung, ein so genanntes Anfangs-


wertproblem (kurz AWP), der Form

x (t) = f (t, x(t) ) , x(t0 ) = x0 ,

wobei f : D → IRd mit D ⊆ IRd+1 und (t0 , x0 ) ∈ D sind. Wir beschränken uns auf
D = Za,b mit
Za,b := [t0 − a,t0 + a] × Kb(x0 )
und Kb (x0 ) := {x ∈ IRd : x − x02 ≤ b}.

Zunächst erweitern wir den Fixpunktsatz von Banach (Satz 15.4) ein wenig.
Satz 16.1 (Fixpunktsatz von Banach, Weissinger). Sei (M, d) ein vollständiger

metrischer Raum. Weiter seien  ak eine konvergente Reihe mit ak > 0 für alle k
k=1
und  : M → M eine Abbildung mit

d( k (x),  k (y) ) ≤ ak d(x, y) (16.1)

für alle x, y ∈ M und k ∈ IN. Dabei bezeichne  k =  ◦  k−1 und  1 =  .


Die Abbildung  besitzt genau einen Fixpunkt, d.h. es gibt genau ein x∗ ∈ M
mit  (x∗ ) = x∗ . Dieser Fixpunkt ist Grenzwert der Iterationsfolge ( k (x0 ) )k∈IN bei
beliebigem Startwert x0 ∈ M und es gilt die Fehlerabschätzung
 

d(x∗ ,  n (x0 ) ) ≤  ak d( (x0 ), x0 ) . (16.2)
k=n

Beweis. Aus (16.1) erhalten wir d( n+1 (x0 ),  n (x0 ) ) = d( n ( (x0 ) ),  n (x0 ) ) ≤
an d( (x0 ), x0 ) für n ∈ IN. Damit folgt

d( n+k (x0 ),  n (x0 ) ) ≤ d( n+k (x0 ),  n+k−1 (x0 ) ) + . . . + d( n+1 (x0 ),  n (x0 ) )

≤ (an+k−1 + . . . + an ) d( (x0 ), x0 ) . (16.3)

Daher ist ( n (x0 ))n∈IN eine Cauchyfolge in (M, d) und wegen der Vollständigkeit
existiert x∗ := lim  n (x0 ). Weiter gilt auch  (x∗ ) = lim  n+1 (x0 ) = x∗ .
n→ n→
234 16 Elementar lösbare Differentialgleichungen

Ist y ein weiterer Fixpunkt, so gilt d(x∗ , y) = d( n (x∗ ),  n (y) ) ≤ an d(x∗ , y). für alle
n ∈ IN. Wegen an → 0 mit n →  folgt schließlich x∗ = y.
Die Fehlerabschätzung (16.2) folgt aus (16.3) mit k → . 

Wir werden diesen Satz anwenden auf Anfangswertprobleme, bei denen f die fol-
gende Bedingung erfüllt.

Definition 16.2. Seien a, b > 0 und f : Za,b → IRd stetig. Man sagt, dass f eine
Lipschitzbedingung bezüglich x erfüllt, falls L ≥ 0 existiert mit

 f (t, x) − f (t, y)2 ≤ L x − y2

für alle (t, x), (t, y) ∈ Za,b , und bezeichnet L dann als Lipschitz-Konstante.

Ist J ein Intervall, so bezeichnet man mit C(J, IRd ) den Vektorraum aller stetigen
Funktionen  : J → IRd .
Wenn J kompakt ist, so liefert Korollar 9.3 angewendet auf jede Komponenten-
funktion, dass C(J, IRd ) mit   := sup  (t)2 ein Banachraum ist.
t∈J

Satz 16.3 (Picard-Lindelöf). Erfüllt die Funktion f : Za,b → IRd eine Lipschitz-
bedingung bzgl. x mit der Lipschitz-Konstanten L, so hat das Anfangswertproblem

x = f (t, x) , x(t0 ) = x0

genau eine Lösung auf dem Intervall J = [t0 −  ,t0 +  ], wobei  := min{a, b/m}
mit m =  f  = sup  f (t, x)2 ist.
(t,x)∈Za,b

Die Lösung  erhält man, indem man eine beliebige Funktion

0 ∈ M := { ∈ C(J, IRd ) :  (t) − x02 ≤ b für alle t ∈ J}

wählt und ( t
n (t) := x0 + f (s, n−1 (s) ) ds
t0

für n ∈ IN, t ∈ J setzt.


Mit n →  konvergiert n gleichmäßig auf J gegen die Lösung und für alle t ∈ J
gilt die Fehlerabschätzung
 

( L)k
 (t) − n(t)2 ≤  max 1 (t) − 0(t)2
k=n k!
t∈J

oder gröber

( L)n  L
 (t) − n(t)2 ≤ e max 1 (t) − 0(t)2 .
n! t∈J
16.1 Der Satz von Picard-Lindelöf 235

Beweis. Nach Konstruktion ist M eine abgeschlossene Teilmenge von C(J, IRd ) und
folglich mit der von der Norm erzeugten Metrik,

d(1 , 2 ) = sup 1 (t) − 2(t)2 ,


t∈J

ein vollständiger metrischer Raum (vgl. auch Kapitel 12.3, Aufgabe 9).
Nun definieren wir  : M → M mittels
( t
 ( )(t) = x0 + f (s,  (s) ) ds für t ∈ J .
t0

Wir müssen noch verifizieren, dass  ( ) ∈ M für alle  ∈ M gilt. Wegen


"( t "
" "
 ( )(t) − x02 = "
" f (s,  (s) ) ds" ≤ m |t − t0| ≤ m  ≤ b
"
t0 2

für alle t ∈ J ist dies der Fall.


Für alle t ∈ J gilt weiter
"( t "
" "
 ( )(t) −  ( )(t)2 = " ( f (s,  (s) ) − f (s,  (s) )) ds"
"
"
t 0 2

≤ L |t − t0 | sup  (s) −  (s)2 ≤  L −   .


s∈J

n
Induktiv erhalten wir  n ( )(t) −  n ( )(t)2 ≤ (n!L)  −   für alle t ∈ J und
n ∈ IN, also
( L)n
 n ( ) −  n ( ) ≤  −   .
n!
Mit Satz 16.1 folgt die Existenz und Eindeutigkeit einer Funktion  ∗ : J → IRd mit
 ( ∗ ) =  ∗ , d.h. ( t
 ∗ (t) = x0 + f (s,  ∗ (s) ) ds .
t0

Durch Einsetzen erkennt man, dass  ∗ eine Lösung des Anfangswertproblems ist.
Satz 16.1 liefert auch die behauptete Fehlerabschätzung, welche insbesondere
die gleichmäßige Konvergenz n →  ∗ zur Folge hat. 

Beispiel: Wir suchen eine Lösung des Anfangswertproblems

x = −2tx , x(0) = 1 .

Dazu setzen wir f (t, x) := −2xt und beginnen etwa mit der konstanten Funktion
0 (t) := 1. ( t
Wir berechnen 1 (t) = 1 − 2s ds = 1 − t 2 und weiter
0
236 16 Elementar lösbare Differentialgleichungen
(t (t
1
2 (x) = 1 − 2s 1 (s) ds = 1 − (2s − 2s3) ds = 1 − t 2 + t 4 ,
0 0 2
(t (t
1 1
3 (x) = 1 − 2s 2 (s) ds = 1 − (2s − 2s3 + s5 ) ds = 1 − t 2 + t 4 − t 6 .
0 0 2 6
n
(−1)k 2k
Dies gibt Anlass zur Vermutung, dass n (t) =  k! t für alle n ∈ IN gilt.
k=0

(−1)k 2k
Damit wäre dann  ∗ (t) =  k! t = exp(−t 2 ).
k=0
In der Tat kann man durch Einsetzen sofort nachprüfen, dass x(t) = exp(−t 2 ) die
gesuchte Lösung ist.
Die gefundene Lösung ist hier sogar auf ganz IR definiert.

Es stellt sich die Frage, ob man allgemein für die gefundene Lösung das vorliegende
Lösungsintervall vergrößern kann. Mit dem Satz von Picard-Lindelöf erhalten wir
für das Anfangswertproblem x = f (t, x), x(t0 ) = x0 eine Lösung  , die zunächst auf
einem Intervall [t0 −  ,t0 +  ] definiert ist.
Wir können nun zwei weitere Anfangswertprobleme betrachten mit Anfangsbe-
dingungen an den Stellen t = t0 −  oder t = t0 +  . Man betrachtet also x = f (t, x),
x(t0 +  ) =  (t0 +  ) und wendet Satz 16.3 erneut an, falls f in einem geeigneten
Intervall um t0 +  ebenfalls eine Lipschitzbedingung erfüllt. Auf diese Weise erhält
man eine Lösungsfortsetzung von  .
Hat man eine Lösung im
Intervall [t0 −  ,t0 +  ] ge-
funden, so kann man, falls
f auch in einer Umgebung
von t0 +  eine Lipschitz-
bedingung erfüllt, erneut
das Verfahren von Picard-
Lindelöf anwenden, um ei-
ne Fortsetzung der Lösung
t0 −  t0 t0 +  (t0 +  ) + 
: auf ein größeres Intervall
zu erhalten.

Folgendes Beispiel zeigt, dass man allgemein jedoch nicht erwarten kann, eine
Lösung zu finden, die auf ganz IR erklärt ist:
2
Die Differentialgleichung x = x2t besitzt die Lösungen  (t) = 2− t 2
mit  ∈ IR.
Betrachtet man das Anfangswertproblem x = x2t, x(0) = 1, so erhält man als ein-
deutige Lösung
2
1 (t) =
2 − t2

zunächst auf einem Intervall [− ,  ]. Da 1 in den Punkten t = ± 2 gar nicht de-
finiert
√ ist,
√ wird auch die durch obiges Vorgehen konstruierte Fortsetzung innerhalb
] − 2, 2[ bleiben.
16.1 Der Satz von Picard-Lindelöf 237

In Definition 16.2 haben wir eine Lipschitzbedingung auf Mengen Za,b erklärt. Wir
erweitern diesen Begriff noch ein wenig.

Definition 16.4. Seien D ⊆ IRd+1 und f : D → IRd eine stetige Funktion. Wenn wir
(t, x) ∈ D schreiben, ist stets t ∈ IR, x ∈ IRd gemeint.
Falls eine Konstante L ≥ 0 existiert mit

 f (t, x) − f (t, y)2 ≤ L x − y2 für alle (t, x), (t, y) ∈ D ,

so sagt man, dass f auf D eine globale Lipschitzbedingung bezüglich x erfüllt mit
der Lipschitz-Konstanten L.
Gibt es zu jedem Punkt in D eine Umgebung U, sodass f |U ∩ D einer Lipschitz-
Bedingung bzgl. x genügt, so heißt f Lipschitz-stetig bezüglich x in D.

Korollar 16.5. Seien D ⊆ IRd+1 offen und f : D → IRd stetig. Weiter sei f Lipschitz-
stetig bezüglich x.
Dann besitzt das Anfangswertproblem

x = f (t, x) , x(t0 ) = x0 , (t0 , x0 ) ∈ D ,

eine eindeutig bestimmte Lösung  , definiert auf einem Intervall [t0 −  ,t0 +  ] mit
einem (von (t0 , x0 ) abhängigen)  > 0.

Beweis. Zu (t0 , x0 ) ∈ D gibt es eine Umgebung U derart, dass f |U ∩ D einer


Lipschitz-Bedingung genügt. Da D offen ist, können wir U ⊆ D annehmen. Wei-
ter gibt es eine Menge der Form Za,b mit (t0 , x0 ) ∈ Za,b ⊆ U und Satz 16.3 liefert die
Behauptung. 

Korollar 16.6. Seien D ⊆ IRd+1 offen und f : D → IRd stetig. Weiter seien f
Lipschitz-stetig bezüglich x und I1 , I2 zwei Intervalle derart, dass 1 : I1 → IRd
sowie 2 : I2 → IRd Lösungen von x = f (t, x) sind.
Wenn ein t∗ ∈ I1 ∩ I2 existiert mit 1 (t∗ ) = 2 (t∗ ), dann folgt 1 (t) = 2 (t) für
alle t ∈ I1 ∩ I2 .

Beweis. Da 1 und 2 stetig sind, ist auch s : I1 ∩ I2 → IR, s(t) := 1 (t) − 2 (t)2 ,
eine stetige Funktion.
Wir nehmen an, es gibt t1 ∈ I1 ∩ I2 mit 1 (t1 ) = 2 (t1 ), also s(t1 ) > 0. Dabei
können wir t1 < t∗ voraussetzen (den Fall t1 > t∗ behandelt man ganz analog). Als
Urbild einer abgeschlossenen Menge unter einer stetigen Abbildung ist s−1 ({0})
abgeschlossen (vgl. Satz 12.4). Daher existiert t0 := min{t ∈ [t1 ,t∗ ] : s(t) = 0}. Das
Anfangswertproblem

x = f (t, x) , x(t0 ) = 1 (t0 ) = 2 (t0 )

hat laut Korollar 16.5 eine eindeutige Lösung auf einem Intervall [t0 −  ,t0 +  ].
Dies steht im Widerspruch dazu, dass 1 und 2 verschiedene Lösungen sind. 

238 16 Elementar lösbare Differentialgleichungen

In anderen Worten lässt sich die Aussage von Korollar 16.6 wie folgt formulieren:
Unter den gegebenen Voraussetzungen können sich verschiedene Lösungskurven
von x = f (t, x) niemals schneiden.

Satz 16.7 (Globaler Existenz- und Eindeutigkeitssatz). Seien D ⊆ IRd+1 offen


und f : D → IRd stetig. Weiter sei f Lipschitz-stetig bezüglich x.
Zu jedem (t0 , x0 ) ∈ D gibt es dann ein eindeutig bestimmtes offenes Intervall I
mit t0 ∈ I, sodass gilt:
(i) Das Anfangswertproblem x = f (t, x), x(t0 ) = x0 , besitzt genau eine Lösung
 : I → IRd .
(ii) Sind J ein Intervall und  : J → IRd eine weitere Lösung dieses Anfangswert-
problems, so folgt J ⊆ I und  |J =  .

Beweis. Bezeichne

t + := sup{ ∈ IR : AWP besitzt Lösung auf [t0 ,  ]} und



t := inf{ ∈ IR : AWP besitzt Lösung auf [ ,t0 ]} ,

wobei auch t + =  und t − = − möglich sind (die Mengen, deren Supremum


bzw. Infimum hier betrachtet wird, sind nicht leer laut Korollar 16.5).
Wir setzen I := ]t −,t + [ und

t − + 1n , falls t − = − ,
tn− :=
−n , falls t − = − ,

t + − 1n , falls t + =  ,
tn+ :=
n , falls t + =  ,

für n ∈ IN. Ohne Einschränkung können wir annehmen, dass n groß genug ist, sodass
tn− ≤ tn+ gilt. Schließlich sei In := [tn− ,tn+ ].
Auf jedem In existiert eine Lösung n des Anfangwertproblems. Für t ∈ I setzen
wir nun  (t) := n (t), wobei n so gewählt ist, dass t ∈ In gilt. Wegen Korollar 16.6
ist  (t) wohldefiniert und  die einzige auf ganz I definierte Lösung.
Für jede auf einem Intervall J definierte Lösung  des Anfangswertproblems gilt
nach Konstruktion J ⊆ I sowie, wiederum laut Korollar 16.6,  =  |J. 

Bemerkung: Das maximale Intervall I, auf welchem die Lösung des Anfangswert-
problems definiert ist, hängt von den gegebenen Anfangswerten (t0 , x0 ) ab. Es ist
möglich, dass man für gewisse Anfangswerte eine Lösung erhält, die auf ganz IR
definiert ist, wahrend man bei der Wahl anderer Anfangswerte in der selben Dif-
ferentialgleichung ein beschränktes Intervall als maximalen Definitionsbereich der
Lösung bekommt. Wir werden am Ende des nächsten Abschnitts noch ein Beispiel
diskutieren.
16.2 Differentialgleichungen mit getrennten Variablen 239

16.2 Differentialgleichungen mit getrennten Variablen

Wir wollen Anfangswertprobleme der Form

x (t) = f (t)g(x(t) ) , x(t0 ) = x0

betrachten, wobei f : I → IR und g : J → IR stetige Funktionen auf Intervallen I


bzw. J sind und (t0 , x0 ) ∈ I × J gilt. Für die Vorgehensweise zum Bestimmen einer
Lösung kann folgende Merkregel dienen: Wir schreiben

dx 1
= f (t)g(x) ⇒ dx = f (t) dt
dt g(x)

und integrieren.“
Wir wollen hier nicht weiter darauf eingehen, inwiefern obige Schreibweise sinn-
voll ist. Allerdings gilt der folgende Satz.
Satz 16.8. Seien I, J zwei offene Intervalle, f : I → IR und g : J → IR stetige Funk-
tionen mit g(x) = 0 für alle x ∈ J. Weiter seien t0 ∈ I und x0 ∈ J.
Dann existiert ein offenes Intervall I0 mit t0 ∈ I0 derart, dass das Anfangswert-
problem
x = f (t) g(x) , x(t0 ) = x0
eine Lösung x : I0 → J besitzt.
Man erhält eine Lösung, indem man die Gleichung
( x ( t
1
d = f (s) ds
x0 g( ) t0

nach x auflöst.
Beweis. Da g stetig und nullstellenfrei ist, gilt entweder g( ) > 0 für alle  ∈ J oder
g( ) < 0 für alle  ∈ J. Weiter ist 1g auf [x0 , x] integrierbar. Damit ist
( x
1
G : J → IR , G(x) := d
x0 g( )

streng monoton und laut dem Hauptsatz der Differential- und Integralrechnung
(Satz 8.7) differenzierbar mit G (x) = g(x)
1
.
Die Funktion G bildet J bijektiv auf ein Intervall J  ab; nach Satz 7.17 ist die
Umkehrfunktion H := G−1 differenzierbar mit H  (x) = G (H(x))
1
= g(H(x) ).
Wegen G(x0 ) = 0 ist 0 ∈ J  . Als Urbild des offenen Intervalls J unter der stetigen
Abbildung H ist auch J  offen, vgl. Satz 12.4. Daher gibt es ein  > 0 derart, dass
] −  ,  [ ⊆ J  gilt. Da
( t
F : I → IR , F(t) := f (s) ds
t0
240 16 Elementar lösbare Differentialgleichungen

als Stammfunktion einer stetigen Funktion ebenfalls stetig ist, gibt es ein  > 0,
sodass |F(t)| = |F(t) − F(t0 )| <  für alle t ∈ I mit |t − t0 | <  gilt. Das Intervall
I0 := ]t0 −  ,t0 +  [ ∩ I ist offen und nach Konstruktion gilt F(t) ∈ ] −  ,  [ ⊆ J  für
alle t ∈ I0 .
Demnach ist die Funktion  : I0 → IR,  (t) := H(F(t) ), wohldefiniert und diffe-
renzierbar. Mit der Kettenregel erhalten wir
1
  (t) = H  (F(t)) F  (t) = f (t) = f (t) g( (t)) ,
G (H(F(t)))

also löst  das Anfangswertproblem. Für x ∈ I0 gilt mit H = G−1 schließlich

x = H(F(t)) ⇐⇒ G(x) = F(t) ;

folglich erhält man diese Lösung, indem man die Gleichung G(x) = F(t) nach x
auflöst.


Beispiel: Wir wollen das Anfangswertproblem

x = x2 t , x(t0 ) = x0

mit (t0 , x0 ) ∈ IR2 lösen.


Dazu halten wir zunächst fest, dass im Fall x0 = 0 die Konstante  (t) = 0 ∀ t ∈ IR
das Anfangswertproblem löst.
Ist x0 = 0, so gibt es ein Intervall J mit g(x) := x2 = 0 für x ∈ J und es gilt
( x ( x
1 1 1 1
d = d = − .
x0 g( ) x0 2 x0 x
( t
1
Mit f (t) := t haben wir f (s) ds = (t 2 − t02 ). Wir müssen also die Gleichung
t0 2

1 1 1 2 2
− = (t − t0 )
x0 x 2
2x0
nach x auflösen und erhalten x = .
2 + x0(t02 − t 2 )
Als Lösung des Anfangswertproblems haben wir also
2x0 2
 (t) = = ,
2 + x0(t02 − t 2) 2
x0 + t02 − t 2

zunächst auf einem Intervall I0 mit t0 ∈ I0 .


Wir wollen noch anmerken, dass die Funktion (t, x) → x2t Lipschitz-stetig im
Sinne von Definition 16.4 ist. Daher ist die gefundene Lösung des Anfangswert-
problems eindeutig. Ihr maximales Definitionsintervall Imax (t0 , x0 ) = ]t − ,t + [, siehe
16.3 Lineare Systeme von Differentialgleichungen 241

Satz 16.7, hängt von der Lage der Anfangswerte ab. Entscheidend ist, wo die Null-
stellen des Nenners in obiger Darstellung von  liegen.
Für x0 < 0 und t02 < − x20 ist  (t) für alle t ∈ IR erklärt, also ist Imax = IR.
Ebenso haben wir Imax = IR auch im Fall x0 = 0, da hier die Nullfunktion die
Lösung des Anfangswertproblems ist.
Zu Anfangswerten t02 > − x20 erhalten wir schließlich
, -
Imax = t02 + x20 ,  für t0 > 0 und x0 < 0 ,
,  -
Imax = − , − t02 + x20 für t0 < 0 und x0 < 0 ,
,   -
Imax = − t02 + x20 , t02 + x20 für t0 > 0 und x0 > 0 .

16.3 Lineare Systeme von Differentialgleichungen

In diesem Abschnitt wollen wir zunächst Anfangswertprobleme der Form

x = Ax , x(t0 ) = x0 ∈ IRd

betrachten, wobei A eine (d × d)-Matrix ist.


Für x, y ∈ IRd gilt Ax − Ay2 = A(x − y)2 ≤ A x − y2 mit der zur Eukli-
dischen Norm gehörenden Operatornorm. Demnach ist die Abbildung (t, x) → Ax
Lipschitz-stetig bezüglich x im Sinne von Definition 16.4. Folglich besitzt obiges
Anfangswertproblem laut Korollar 16.5 für jedes (t0 , x0 ) ∈ IRd+1 eine eindeutig be-
stimmte Lösung.
Eine Methode, diese Lösung zu bestimmen, führt über die Exponentialfunktion.
Sei A eine (d × d)-Matrix. Wegen
n n 
Ak  Ak Ak
 ≤ ≤ = exp(A)
k=0 k! k=0 k! k=0 k!

folgt mit dem Majorantenkriterium (Satz 5.6) die Existenz von



Ak
exp(A) :=  ,
k=0 k!

wobei die Konvergenz der Reihe hier im Banachraum L (IRd ), ausgestattet mit der
Operatornorm, zu verstehen ist.
Gelegentlich schreibt man auch eA an Stelle von exp(A).
Wir beginnen mit einigen Beispielen im Fall d = 2.
242 16 Elementar lösbare Differentialgleichungen

Beispiele:

 0 k 0
(1) Sei A = mit  ,  ∈ IR. Für k ∈ IN0 ist dann Ak = , also
0  0 k

e 0
exp(A) = .
0 e

0 
(2) Sei nun A = mit  ∈ IR.
− 0
0 1
Hier haben wir A0 = id, A2 = − 2 id, A3 = − 3 , A4 =  4 id,
−1 0

5 5 0 1
A =
−1 0

usw. Damit erhalten wir


⎛   ⎞
 2k  2k+1
⎜ k=0 (−1)k (2k)!  (−1)k (2k+1)! ⎟  
⎜ k=0 ⎟ cos  sin 
exp(A) = ⎜ ⎟= .
⎝   2k+1

 2k ⎠ − sin  cos 
−  (−1)k (2k+1)!  (−1)k (2k)!
k=0 k=0

 1
(3) Zu A = mit  = 0 wollen wir exp(tA), t ∈ IR, bestimmen.
0 
 
(t  )k kt k  k−1
Eine einfache Rechnung liefert (tA)k = für k ∈ IN und
0 (t  )k
⎛   ⎞
(t  )k (t  )k
 t   
⎜ k=0 k!
k=0
k! ⎟ et  tet 
⎜ ⎟
exp(tA) = ⎜ ⎟= .
⎝ 
(t  )k ⎠ 0 et 
0  k!
k=0

Um einige wichtige Eigenschaften der matrix-wertigen Exponentialfunktion zeigen


zu können, notieren wir folgende Hilfsaussage.
Lemma 16.9. Seien A und B zwei (d × d)-Matrizen. Es gilt
  
   n
An Bn Ak Bn−k
 n!  n! =   k! (n − k)! .
n=0 n=0 n=0 k=0

Beweis. Man kann den Beweis von Satz 5.17 wörtlich übernehmen. An die Stelle
des Absolutbetrags tritt hier die Operatornorm. 

16.3 Lineare Systeme von Differentialgleichungen 243

Satz 16.10. Seien A und B zwei beliebige (d × d)-Matrizen sowie T eine weitere
invertierbare (d × d)-Matrix.
(a) Ist B = T −1 AT , so gilt exp(B) = T −1 exp(A) T .
(b) Wenn AB = BA gilt, dann ist exp(A + B) = exp(A) exp(B).
(c) Es gilt exp(−A) = (exp(A) )−1 ; insbesondere ist also exp(A) invertierbar.
Beweis. (a) Aus (T −1 AT )k = T −1 Ak T erhalten wir
 
n
Ak n
(T −1 AT )k
T −1
 k! T =  k! für alle n ∈ IN
k=0 k=0

und mit n →  dann die Behauptung.


(b) Wegen AB = BA ergibt sich mit der Binomialformel
n n
n n n−k An Bn−k
(A + B) = 
n
A B = n!  .
k=0 k k=0 k! (n − k)!

Nun folgt mit Lemma 16.9 die Behauptung.


(c) Die Aussage folgt nun unmittelbar, wenn wir B = −A einsetzen. 

Bemerkungen:
(1) Die Gleichung exp(A + B) = exp(A) exp(B) gilt im Allgemeinen nicht!

0 1 0 0
Ein Gegenbeispiel erhalten wir mit A = ,B= . Hier ist
0 0 1 0

0 0
A2 = = B2 ,
0 0

2 1
also exp(A) = id + A, exp(B) = id + B und weiter exp(A) exp(B) = .
1 1
Andererseits ist (A+B)2 = id. Für alle k ∈ IN0 haben wir damit (A+B)2k = id
sowie (A + B)2k+1 = A + B. Daher gilt
⎛   ⎞
1 1
 (2k)!  (2k+1)!
⎜ k=0 k=0 ⎟ 2 1
exp(A + B) = ⎜

⎟ =
⎠ .

1

1
1 1
 (2k+1)!  (2k)!
k=0 k=0

(2) Wenn v ∈ IRd ein Eigenvektor von A zum Eigenwert  ist, dann folgt
 
n n
Ak v k
exp(A) v = lim  = lim  v = e v .
k=0 k! k=0 k!
n→ n→

Also ist v ein Eigenvektor auch von exp(A), ebenfalls zum Eigenwert  .
244 16 Elementar lösbare Differentialgleichungen

Satz 16.11. Sei A eine (d × d)-Matrix.


Die Funktion t → exp(tA) ist differenzierbar, d.h. der Grenzwert

exp( (t + h)A) − exp(tA) d


lim = exp(tA)
h→0 h dt

existiert (im Banachraum L (IRd ) mit der Operatornorm). Weiter gilt

d
exp(tA) = A exp(tA) = exp(tA) A .
dt
Beweis. Mit Satz 16.10(b) erhalten wir

exp(hA) − id exp( (t + h)A) − exp(tA) exp(hA) − id


exp(tA) = = exp(tA)
h h h
und wegen
" " " " "  k−1 k " " "
" exp(hA) − id " " exp(hA) − id − hA " " " h A " "  hk Ak+1 "
" " "
" − A" " " = " " = "
" h "= " h " " k! " " (k + 1)!
"
"
k=2 k=1


hAk  
≤ A  = A ehA − 1 → 0 mit h → 0
k=1 k!

exp(hA) − id
gilt lim = A. 

h→0 h
Satz 16.12. Sei A eine (d × d)-Matrix. Das Anfangswertproblem

x = Ax , x(t0 ) = x0

besitzt eine eindeutige Lösung y : IR → IRd . Diese ist gegeben durch

y(t) = exp( (t − t0 )A) x0 .

Beweis. Mit Hilfe von Satz 16.10 und Satz 16.11 erhalten wir

d d
y (t) = (exp(−t0 A) exp(tA) x0 ) = exp(−t0 A) exp(tA) x0
dt dt
= exp(−t0 A) A exp(tA) x0 = A exp( (t − t0 )A) x0 = Ay(t) .

Die Anfangsbedingung y(t0 ) = x0 ist offensichtlich.


Die Eindeutigkeit der Lösung folgt mit Korollar 16.5, da die Abbildung (t, x) → Ax
Lipschitz-stetig bezüglich x ist mit Lipschitz-Konstante L = A, wie wir ganz zu
Beginn dieses Abschnitts schon festgestellt haben. 

Um die Lösung des Anfangswertproblems zu finden, muss man exp(tA) gar nicht
explizit bestimmen, wenn man weitere Kenntnisse aus der Linearen Algebra hinzu-
16.4 Aufgaben 245

zieht. Ist etwa J eine Jordan-Normalform von A, so gibt es eine invertierbare Ma-
trix S mit A = S−1 JS, also tA = S−1 (tJ)S, und laut Satz 16.10(a) brauchen wir nur
exp(tJ) zu bestimmen. Wenn A diagonalisierbar ist, d.h. wenn J Diagonalgestalt hat,
dann fällt dies besonders leicht:
Sei A eine (d × d)-Matrix, die d linear unabhängige Eigenvektoren v1 , . . . , vd
besitzt. Bezeichne 1 , . . . , d die zugehörigen Eigenwerte. Dann kann man
⎛ ⎞
1
⎜ ⎟
J = ⎝ ... ⎠ und S−1 = (v1 , . . . , vd )
d

wählen, also S−1 exp(tJ) = e1t v1 , . . . , ed t vt und mit S exp(−t0 A)x0 =: c ∈ IRd
erhalten wir

y(t) = exp( (t − t0 )A) x0 = exp(tA) exp(−t0 A) x0 = S−1 exp(tJ) S exp(−t0 A) x0


d
=  ck e k t vk
k=1

als Lösung des Anfangswertproblems. ⎛ ⎞ ⎛ ⎞


1 0 0 1
Beispiel: Das Anfangswertproblem x = Ax, x(0) = ⎝ 2 ⎠ mit A = ⎝ 0 −2 0 ⎠.
3 1 0 0
Wegen det(A −  id) =  2 (−2 −  ) − (−2 −  ) = −( 2 − 1)( + 2) hat A die
Eigenwerte 1 = 1, 2 = −1 und 3 = −2. Zugehörige Eigenvektoren können wir
auch leicht bestimmen, etwa
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 1 0
v1 = ⎝ 0 ⎠ , v2 = ⎝ 0 ⎠ und v3 = ⎝ 1 ⎠ .
1 −1 0

Damit hat die Lösung y die Form y(t) = c1 et v1 + c2 e−t v2 + c3 e−2t v3 und mit der
Anfangsbedingung erhalten wir c1 = 2, c2 = −1 sowie c3 = 2.

16.4 Aufgaben

1. Sei f : [0, [ → IR stetig. Wir betrachten das Anfangswertproblem

x = f (t) , x(0) = x0

mit x0 ∈ IR, d.h. die rechte Seite der Differentialgleichung hängt nur von t ab.
Zeigen Sie, dass das Verfahren von Picard-Lindelöf (Satz 16.3) in diesem Fall
bereits im ersten Schritt die Lösung liefert.
246 16 Elementar lösbare Differentialgleichungen

2. Bestimmen Sie die Lösungen folgender Anfangswertprobleme mit dem Verfah-


ren aus Satz 16.8.
a. x = (a − bx)x , x(0) = x0 > 0 (a, b > 0)
b. x = ax + b , x(0) = x0 (a, b ∈ IR)
c. x = cos2 x , x(0) = x0
d. x = x2 − 1 , x(0) = x0
2t
e. x = x, x(0) = x0
t2 + 1

3. Lösen Sie das Anfangswertproblem



x = (t + x)2 , x(0) = .
4
Hinweis: Betrachten Sie z(t) := x(t) + t.

4. Gegeben ist das Anfangswertproblem

t x (t) = 2x(t) , x(t0 ) = x0 .

a. Bestimmen Sie im Fall t0 = 0 eine Lösung mit dem Verfahren aus Satz 16.8.
b. Zeigen Sie, dass das Anfangswertproblem auch für t0 = 0 und x0 = 0
Lösungen besitzt.
c. Was können Sie über die lokale Eindeutigkeit der Lösungen aussagen ?

5. Bestimmen Sie die Lösung des Anfangswertproblems

x = ex sint , x(t0 ) = x0

in Abhängigkeit der Anfangswerte (x0 ,t0 ) ∈ IR2 sowie jeweils das zugehörige
maximale Definitionsintervall.

6. Bestimmen Sie die Lösungen der Anfangswertprobleme x = Ax, x(0) = x0 mit



1 2 3
a. A = , x0 =
2 1 0

0  1
b. A = , x0 = ,  ∈ IR, vgl. Kapitel 16.3, Beispiel (2)
− 0 0

 1 1
c. A= , x0 = ,  = 0, vgl. Kapitel 16.3, Beispiel (3)
0  1
16.4 Aufgaben 247

7. Bestimmen Sie Lösungen der Differentialgleichung

m x + d x + k x = 0 (16.4)

mit m > 0, d 2 − 4mk = 0. Gehen Sie dabei wie folgt vor.


a. Nehmen Sie an, es existieren zwei Lösungen x1 und x2 . Setzen Sie

W := x1 x2 − x1 x2

und zeigen Sie W  = − md W .


d
b. Sei  := − 2m . Folgern Sie, dass W (t) = ce2 t gilt mit einem c ∈ IR.
c. Verifizieren Sie, dass x1 (t) := e t eine Lösung von (16.4) ist.
d. Setzen Sie y(t) := e− t x2 (t). Zeigen Sie, dass y (t) = c gilt und bestimmen
Sie damit x2 .

8. Allgemeine Differentialgleichung höherer Ordnung.


Gegeben ist die Differentialgleichung

y(d) + ad−1y(d−1) + . . . + a1y + a0 y = 0 (16.5)

mit a0 , . . . , ad−1 ∈ IR.


a. Schreiben Sie die Gleichung (16.5) als eine Differentialgleichung der Form
x = A x mit einer reellen (d × d)-Matrix A und
⎛ ⎞
y
⎜ y ⎟
⎜ ⎟
⎜ y ⎟
x := ⎜ ⎟.
⎜ .. ⎟
⎝ . ⎠
y(d−1)

b. Zeigen Sie, dass eine Zahl  ∈ C genau dann Eigenwert von A ist, wenn 
eine Lösung der so genannten charakteristischen Gleichung

 d + ad−1 d−1 + . . . + a0 = 0

zu (16.5) ist.
Hinweis: Entwickeln Sie det(A −  id) nach der letzten Zeile.
c. Bestimmen Sie für jeden Eigenwert  von A einen zugehörigen Eigenvek-
tor von A.
Literaturverzeichnis

[1] H.W. Alt, Lineare Funktionalanalysis, 5. Auflage (Springer, Berlin Heidelberg, 2006)
[2] R. Beals, Analysis, An Introduction (Cambridge University Press, 2004)
[3] O. Deiser, Reelle Zahlen, 2. Auflage (Springer, Berlin Heidelberg, 2008)
[4] J. Dieudonné, Foundations of Modern Analysis (Academinc Press, New York, 1960)
[5] G. Fischer, Lineare Algebra, 17. Auflage (Vieweg+Teubner, Wiesbaden, 2010)
[6] W. Forst, D. Hoffmann, Gewöhnliche Differentialgleichungen, Theorie und Praxis
(Springer, Berlin Heidelberg, 2005)
[7] O. Forster, Analysis 1, 10. Auflage (Vieweg+Teubner, Wiesbaden, 2011)
[8] O. Forster, Analysis 2, 9. Auflage (Vieweg+Teubner, Wiesbaden, 2011)
[9] H. Heuser, Lehrbuch der Analysis, Band 1 (Teubner, Stuttgart, 1980)
[10] K. Jänich, Topologie, 8. Auflage (Springer, Berlin Heidelberg, 2005)
[11] C. Karpfinger, K. Meyberg, Algebra (Spektrum Akademischer Verlag, Heidelberg, 2009)
[12] H. Koch, Einführung in die Mathematik (Springer, Berlin Heidelberg, 2002)
[13] K. Königsberger, Analysis 1, 6. Auflage (Springer, Berlin Heidelberg, 2003)
[14] K. Königsberger, Analysis 2, 5. Auflage (Springer, Berlin Heidelberg, 2003)
[15] J. Matoušek, J. Nešetřil, Diskrete Mathematik, 2. Auflage
(Springer, Berlin Heidelberg, 2007)
[16] A.M. Ostrowski, Vorlesungen über Differential- und Integralrechnung, Band 1
(Birkhäuser, Basel, 1945)
[17] R. Remmert, G. Schumacher, Funktionentheorie 1, 5. Auflage
(Springer, Berlin Heidelberg, 2002)
[18] B. von Querenburg, Mengentheoretische Topologie, 3. Auflage
(Springer, Berlin Heidelberg, 2001)
[19] W. Rudin, Principles of Mathemtical Analysis, 3rd edition
(McGraw Hill, London et.al., 1976)
[20] A. Taraz, Diskrete Mathematik (Birkhäuser, Basel, 2010)
[21] D. Werner, Einführung in die höhere Analysis (Springer, Berlin Heidelberg, 2006)
[22] D. Werner, Funktionalanalysis, 5. Auflage (Springer, Berlin Heidelberg, 2005)

R. Lasser, F. Hofmaier, Analysis 1 + 2, Springer-Lehrbuch, 249


DOI 10.1007/978-3-642-28644-5, © Springer-Verlag Berlin Heidelberg 2012
Sachverzeichnis

A Banachscher Fixpunktsatz 218, 233


Bernoulli-Ungleichung 7
Abelsche partielle Summation 64 Bernsteinpolynom 136
Abelscher Grenzwertsatz 148 Berührpunkt 173
abgeschlossen 10, 166, 173 beschränkt 12, 19, 45, 48
abgeschlossene Hülle 173 nach oben 12
Ableitung 97, 182 nach unten 12
partielle 193, 195 Besselsche Ungleichung 46
totale 192 Betrag 8, 17
zweite 101, 203 Binomialformel 8, 15
Abschluss 173 Binomialkoeffizient 8, 69
absolut konvergent 58 Binomialreihe 70
Absolutbetrag 8, 17 Bolzano-Weierstraß 49
Abstand 37
Additionstheoreme C
für Sinus und Cosinus 72
Alternierende Harmonische Reihe 149
Cauchyfolge 42
alternierende Reihe 65
Cauchy-Produkt 67
Anfangswertproblem 233
Cauchy-Riemannsche
Approximation
Differentialgleichungen 210, 211
durch Polynome 137
Cauchy-Schwarz-Ungleichung 40, 46, 73
durch Treppenfunktionen 115
durch trigonometrische Polynome 157 Cosinus Hyperbolicus 112
Äquivalenz Cosinusreihe 69
von Normen 54, 179
Archimedisches Axiom 7 D
Arcus-Sinus 109
Arcus-Tangens 110 Diffeomorphismus 215
Potenzreihendarstellung 135 Differentialquotient 97
Arithmetisch-geometrisches Mittel 36 differenzierbar 97, 191
Arithmetrisches Mittel 16 differenzierbare Kurve 182
Astroide 189 Dirichlet-Kern 154
asymptotisch gleich 30 Dirichletsche Reihe 77
diskrete Metrik 37, 95
B divergent gegen  50
Dreiecksungleichung 8, 18, 37, 38
Banachraum 42 dritte Einheitswurzeln 19

251
252 Sachverzeichnis

E konvergent 130
stetig 92
Einheitskugel 41 globale Lipschitzbedingung 237
Endomorphismus 178 globaler Existenz- und Eindeutigkeitssatz
 -Netz 166 238
Entwicklungspunkt 68, 142, 147 Gradient 193
Euklidischer Raum 41 Grenzwert 24
Eulersche Formel 71 rechts-/linksseitiger 88
Eulersche Zahl 10, 56 größte untere Schranke 12
Irrationalität 143
 -Umgebung 166 H
Existenz- und Eindeutigkeitssatz 238
Exponentialfunktion 71 halboffen 10
Exponentialreihe 69, 71 Hamming-Abstand 38
für Matrizen 241 harmonische Funktion 210
Extremum Harmonische Reihe 56
isoliertes 207 Harmonisches Mittel 16
lokales 102 Häufungswert 49
Hauptsatz der Differential- und
F Integralrechnung 119
Hessematrix 207
Fakultät 8 Hilbertraum 46
Feinheit 113
I
Fejér-Kern 154
Fibonacci-Zahlen 76
Identitätssatz für Potenzreihen 147
Fixpunktsatz
imaginäre Einheit 17
für stetige reellwertige Funktionen 86
Imaginärteil 17
von Banach 218, 233
indefinit 207
Folge 23
Induktion 5
beschränkte 41
Infimum 12
rekursiv definierte 31
Integral 113, 115
folgenkompakt 165
unbestimmtes 121
Folgenkriterium 81
uneigentliches 124
Fourierkoeffizient 152
von Treppenfunktionen 113
Fourierreihe 152
Integralsinus 140
Fundamentalsatz der Algebra 19
integrierbar 115
Funktionalgleichung
Intervall 10
der Exponentialfunktion 71
Intervallschachtelung 10
des Logarithmus 34
Funktionalmatrix 196 J
G Jacobimatrix 196

Gammafunktion 127 K
Gaußklammer 15
Geometrische Reihe 25, 55, 58 Kardioide 189
Geometrisches Mittel 16 Kettenregel 99, 194
gerade Funktion 149 kleinste obere Schranke 12
geschlossener Weg 182 kompakt 167
gleichmäßig in IKd 173
approximierbar komplexe Zahlen 17
durch Polynome 137 komplexer Logarithmus 222
durch Treppenfunktionen 115 konjugiert komplexe Zahl 18
durch trigonometrische Polynome 157 kontrahierend 218
Sachverzeichnis 253

konvergent 24, 42 Minkowski-Ungleichung 40


absolut 58 Minorantenkriterium 59
gleichmäßig 130 Mittelwertsatz 104
im quadratischen Mittel 139, 160 monoton fallend 26, 87
uneigentlich 50 monoton wachsend 26, 87
Konvergenzradius 68, 147 Multiplikatorregel von Lagrange 226
konvexe Funktion 111
konvexe Menge 200 N
Körper
archimedisch angeordneter 7 Nabla 193
kommutativer 6 natürliche Metrik 37
kritischer Punkt 207 natürlicher Logarithmus 34, 89
negativ definit 207
L Neilsche Parabel 183, 189
Newtons Gesetz 232
Lagrange-Multiplikator 226 Niveaumenge 198
Lagrange-Restglied 142 Norm 38
Länge auf IKd 39
der Zykloide 187 normierter Raum 38
einer Kurve 184 Nullfolge 24
eines Funktionsgraphen 187 Nullstellensatz 84
eines Intervalls 10
O
Laplace-Operator 210
Leibniz-Kriterium 65 obere Schranke 12
L’Hospitalsche Regeln 106, 107 offen 10, 166, 175
Limes 24 offene Überdeckung 167
Limes inferior 50 Operatornorm 178
Limes superior 50 orientierungstreu 187
lineare Abbildung 177 orthogonal 45
lineare Approximation 98, 191 orthonormal 45
linksseitiger Grenzwert 88
Lipschitzbedingung 234 P
globale 237
Lipschitz-Konstante 234, 237 Parametertransformation 187
Lipschitz-stetig 94 parametrisiert nach der Länge 188
bezüglich x 237 Parsevalsche Gleichung 161
logarithmische Spirale 190 Partialsumme 25, 55
Logarithmus 34, 89 partielle Ableitung 193, 195
komplexer 222 partielle Integration 121
Potenzreihendarstellung 148 Partition 113
Logistische Gleichung 231 periodische Funktion 151
lokal injektiv 221 Polarkoordinaten 214
lokales Extremum 102, 207 positiv definit 207
Lotka-Volterra-Gleichung 232 Potenzfunktion 91
Potenzreihe 68
M Ableitung 134, 147
absolute Konvergenz 134
Majorantenkriterium 59 Entwicklungspunkt 147
Maximum 12 gleichmäßige Konvergenz 134
lokales 102 Identitätssatz 147
Metrik 37 Stammfunktion 135, 148
metrischer Raum 37 Stetigkeit 83, 147
Minimum 12 Prähilbertraum 45
lokales 102 Produktregel 98
254 Sachverzeichnis

Q Supremum 12
Supremumseigenschaft 12
Quotientenkriterium 60
für Potenzreihen 68 T
Quotientenregel 98
Tangens 110
R Tangente 182
Taylorentwicklung in IRn 206
rationale Funktion 82
Taylorpolynom 142
rationale Zahlen 5
Taylorreihe 142
Räuber-Beute-Modell 232
Teilfolge 48
Realteil 17
Teilung 113
rechtsseitiger Grenzwert 88
Topologie 175
reelle Zahlen 10
total beschränkt 166
Regelfunktion 115
totale Ableitung 192
reguläre Kurve 182
Treppenfunktion 113
Reihe 25, 55
trigonometrisches Polynom 151
absolut konvergente 58
alternierende 65 U
Geometrische 25, 55, 58
Harmonische 56 Überdeckung 167
rekursiv definierte Folge 31 Umgebung 166
Richtungsableitung 197 Umordnung 66
Riemann-Lebesgue-Lemma 158 Umparametrisierung 187
unbestimmtes Integral 121
S
uneigentlich
Satz integrierbar 124
über implizite Funktionen 224 konvergent 50
linearer Fall 223 ungerade Funktion 149
von Bolzano-Weierstraß 49 untere Schranke 12
von Darboux 105
von der lokalen Umkehrbarkeit 218 V
von Fejér 157
Verdichtungskriterium 62
von Picard-Lindelöf 234
Verhulst-Pearl-Gleichung 231
von Pythagoras 46
vollständig 10, 42
von Rolle 103
vollständige Induktion 5
von Schwarz 204
Volterra-Lotka-Gleichung 232
von Taylor 141
Schrankensatz 186 W
singulärer Punkt einer Kurve 182
Sinus Hyperbolicus 112 Wallissches Produkt 31, 122
Sinus Integralis 140 Weg 182
Sinusreihe 69 Weierstraßscher Approximationssatz 137
Skalarprodukt 45 für periodische Funktionen 157
Stammfunktion 105 Wurzel 10
stationärer Punkt 207 Wurzelkriterium 61
stetig 79 für Potenzreihen 68
gleichmäßig 92
stetig differenzierbar 101, 201, 205 Z
streng konvex 111
streng monoton fallend 87 Zerfallsprozess 231
streng monoton wachsend 87 Zweig des komplexen Logarithmus 222
stückweise stetig differenzierbare Kurve 182 zweite Ableitung 101, 203
Submultiplikativität der Operatornorm 178 Zwischenwertsatz 85
Substitutionsregel 123 Zykloide 187
Bezeichnungen und Symbole

· 38 Dk f 195
 ·  39, 41 Du f 197
 · 1 ,  · 2 39, 73, 160 df
97
dt
 · M 82 f
·, · 45, 74, 160 x 193, 195
b
f (x) dx 113, 115 ∃ 2
a
f (x) dx 121 e 10, 56
 193 exp 69, 71, 241
 210 f)(k) 152
∀ 2 f 97, 192
A 173 f (n) 101
[a, b], ]a, b[, ]a, b], [a, b[ 9 f −1 87, 108
(an )n∈IN 23 f ◦g 81
(ank )k∈IN 48 f |J 117
an → a 24 F(x)|ba 121
arcosh 112 grad f 193
arcsin 109 Hf 207
arsinh 112 i 17
arctan 110 Im z 17
B(M) 45 inf 12
C 17 IK 37
cos 69 Kr (a) 18, 41

cos2 x 85 k
x 10
cosh 112  41
C(X), C(X,Y ) 79 1 , 2 73
C1 (U, IRm ), C1 (U) 201 l( ) 184
Ck (U, IRm ), Ck (U) 205 lim an 24
n→
Cn (I), C (I) 101 lim sup an , lim inf an 50
Cp 160 n→ n→

Df 192, 196 lim f (x) 81


x→p

255
256 Bezeichnungen und Symbole

lim f (x), lim f (x) 88  ck zk 68
x→p+0 x↓0 k=0
ln 34, 90 Si 140
L (V ), L (V,W ) 178 sin 69
(M, d) 37 sin2 x 85
IN 5 sinh 112
IN0 5 Sn ( f ), n ( f ) 155
n! 8 Sr (a) 41
n
k 8, 69 sup 12
 85 T ([a, b]) 114
n
 ak 31 tan 110
k=1 T f (t) 142
Q 5 Tn (t; f ) 141
IR 10 Ur (a) 18, 41
R([a, b]) 115 [x] 15
Rp 152 xz 91
Re z 17 ZZ 5
n
 ak 8 z 18
k=1

 an 25
n=1