Sie sind auf Seite 1von 171

inoffizielles Vorlesungsskript

Analysis I/II
Wintersemester 2009 / 2010
Sommersemester 2009
15. Juli 2010

Prof. Dr. Jürgen Prestin


Institut für Mathematik
Universität zu Lübeck

2
1
0
Inhaltsverzeichnis
2

Inhaltsverzeichnis

Verzeichnis der Sätze und Definitionen 4

1 Zahlenfolgen, Grenzwerte, Reihen 7


1.1 Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Was ist eine Folge . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.2 Konvergenz von Folgen . . . . . . . . . . . . . . . . . . . . . . 7
1.1.3 Beschränktheit von Folgen . . . . . . . . . . . . . . . . . . . . . 11
1.1.4 Monotonie von Folgen . . . . . . . . . . . . . . . . . . . . . . . 14
1.1.5 Rechnen mit konvergenten Folgen . . . . . . . . . . . . . . . . . 14
1.1.6 Konvergenz-Kriterien . . . . . . . . . . . . . . . . . . . . . . . . 20
1.1.7 Beispiele von Folgen-Konvergenz . . . . . . . . . . . . . . . . . 24
1.1.8 Mengen von Häufungswerten . . . . . . . . . . . . . . . . . . . 28
1.2 Undendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.2.2 Beispiele für unendliche Reihen . . . . . . . . . . . . . . . . . . 30
1.2.3 Eulersche Zahl . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.2.4 Konvergenz-Kriterien und absolute Konvergenz . . . . . . . . . . 36

2 Stetigkeit und Differenzierbarkeit 41


2.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2.1 Umkehrfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2.2 Beispiele für Umkehrfunktionen . . . . . . . . . . . . . . . . . . 42
2.2.3 schwierige Grenzwerte mit De L’Hospital . . . . . . . . . . . . . 47
2.2.4 Abschätzung von Funktionswachstum . . . . . . . . . . . . . . . 51
2.2.5 Approximation durch Polynome . . . . . . . . . . . . . . . . . . 52
2.3 Konvexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3 Differenzialrechnung in Rn 68
3.1 Funktionalanalytische Grundlagen . . . . . . . . . . . . . . . . . . . . . 68
3.1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.1.2 metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.1.3 normierte Räume . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.1.4 Konvergenz von Vektoren . . . . . . . . . . . . . . . . . . . . . 75
3.1.5 Stetigkeit von Funktionen . . . . . . . . . . . . . . . . . . . . . 76
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume . . . . . . . . . . 78
3.2.1 partielle Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . 83
Inhaltsverzeichnis
3

3.2.2 totale Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . 88


3.2.3 Übertragungen ins Multivariable . . . . . . . . . . . . . . . . . . 94
3.3 Extremwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4 Integralrechnung 108
4.1 Unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.1.1 Rechenregeln für unbestimmte Integrale . . . . . . . . . . . . . . 108
4.2 Integraion rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . 113
4.2.1 Integration weiterer Funktionenklassen . . . . . . . . . . . . . . 118
4.3 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.3.1 Eigenschaften des Riemann-Integrals . . . . . . . . . . . . . . . 123
4.4 Hauptsätze der Integralrechnung . . . . . . . . . . . . . . . . . . . . . . 125
4.4.1 Substitution und partielle Integration bei bestimmten Integralen . 128
4.5 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

5 Funktionenreihen, Funktionenfolgen 138


5.1 Gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.2 Beweistechnik für punktweise und gleichmäßige Konvergenz . . . . . . . 142
5.3 Differentiation und Integration . . . . . . . . . . . . . . . . . . . . . . . 143
5.4 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
5.4.1 Rechnen mit Potenzreihen . . . . . . . . . . . . . . . . . . . . . 150
5.5 Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.5.1 »Periodische Fortsetzung« . . . . . . . . . . . . . . . . . . . . . 160
5.5.2 Trigonometrische Polynome . . . . . . . . . . . . . . . . . . . . 160
5.5.3 Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
Verzeichnis der Sätze und Definitionen
Verzeichnis der Sätze und Definitionen 4

Verzeichnis der Sätze und Definitionen

Definition 1.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Definition 1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Definition 1.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Lemma 1.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Definition 1.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Korollar 1.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Definition 1.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Lemma 1.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Satz 1.9: »Rechenregeln« . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Satz 1.10: »Konvergenzkriterien« . . . . . . . . . . . . . . . . . . . . . . . . . 20
Definition 1.11: »Cauchy-Folge« . . . . . . . . . . . . . . . . . . . . . . . . . 21
Satz 1.12: »Konvergenzkriterium von Cauchy« . . . . . . . . . . . . . . . . . 21
Lemma 1.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Definition 1.14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Definition 1.15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Lemma 1.16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Lemma 1.17 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Lemma 1.18: »Fehlerabschätzung« . . . . . . . . . . . . . . . . . . . . . . . . 35
Lemma 1.19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Satz 1.20: »Cauchy-Kriterium für Reihen« . . . . . . . . . . . . . . . . . . . . 36
Lemma 1.21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Definition 1.22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Lemma 1.23 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Korollar 1.24: »Dreieicksungleichung für unendlich viele Summanden« . . . . 38
Satz 1.25: »Vergleichskriterium« . . . . . . . . . . . . . . . . . . . . . . . . . 38
Satz 1.26: »Quotientenkriterium« . . . . . . . . . . . . . . . . . . . . . . . . . 40

Satz 2.21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Satz 2.22: »Verallgemeinerung des Mittelwertsatzes« . . . . . . . . . . . . . . 47
Satz 2.23: »Regel von De L’Hospital (1661–1704)« . . . . . . . . . . . . . . . 48
Definition 2.24: »Landau-Symbole (1877–1938)« . . . . . . . . . . . . . . . . 51
Satz 2.25: »Satz von Taylor« . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Korollar 2.26 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Definition 2.27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Lemma 2.28 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Satz 2.29: »Konvexitätskriterium« . . . . . . . . . . . . . . . . . . . . . . . . 61
Korollar 2.30 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Verzeichnis der Sätze und Definitionen
Verzeichnis der Sätze und Definitionen 5

Korollar 2.31 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Definition 2.32 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Lemma 2.33 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Satz 2.34: »Ungleichung von Jensen (1859–1925)« . . . . . . . . . . . . . . . 65

Definition 3.1: »metrische Räume« . . . . . . . . . . . . . . . . . . . . . . . . 69


Lemma 3.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Definition 3.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Lemma 3.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Definition 3.5: »Konvergenz in einem metrischen Raum« . . . . . . . . . . . . 72
Definition 3.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Lemma 3.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Satz 3.8: »Komponentenweise Konvergenz« . . . . . . . . . . . . . . . . . . . 75
Definition 3.9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Satz 3.10: »ε-δ -Kriterium der Stetigkeit« . . . . . . . . . . . . . . . . . . . . 77
Definition 3.11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Satz 3.12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Definition 3.13: »Differenzierbarkeit« . . . . . . . . . . . . . . . . . . . . . . 83
Definition 3.14: »Richtungsableitung« . . . . . . . . . . . . . . . . . . . . . . 84
Lemma 3.15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Definition 3.16: »gradient« . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Satz 3.17: »Satz von Schwarz« . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Definition 3.18: »totale Ableitung« . . . . . . . . . . . . . . . . . . . . . . . . 89
Satz 3.19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Definition 3.20: »allgemeine Richtungsableitung« . . . . . . . . . . . . . . . . 90
Satz 3.21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Satz 3.22: »Kettenregel« . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Satz 3.23: »Mittelwertsatz für Funktion f : Rn ⊇ Ω → R« . . . . . . . . . . . . 97
Satz 3.24: »Taylor-Formel 2. Ordnung« . . . . . . . . . . . . . . . . . . . . . 98
Definition 3.25 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Lemma 3.26: »notwendiges Kriterium für Extremwerte« . . . . . . . . . . . . 101
Definition 3.27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Definition 3.28 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Lemma 3.29 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Satz 3.30: »Hinreichendes Kriterium für Extremwerte« . . . . . . . . . . . . . 104

Definition 4.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108


Satz 4.2: »Rechenregeln für unbestimmte Integrale« . . . . . . . . . . . . . . . 108
Satz 4.3: »Partialbruchzerlegung« . . . . . . . . . . . . . . . . . . . . . . . . 113
Definition 4.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Satz 4.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Satz 4.6: »Mittelwertsatz der Integralrechnung« . . . . . . . . . . . . . . . . . 124
Korollar 4.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Satz 4.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Korollar 4.9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
Verzeichnis der Sätze und Definitionen
6

Satz 4.10: »Substitution im bestimmten Integral« . . . . . . . . . . . . . . . . 128


Satz 4.11: »partielle Integration von bestimmten Integralen« . . . . . . . . . . 131
Definition 4.12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Definition 4.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

Definition 5.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139


Satz 5.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
Satz 5.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Satz 5.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Definition 5.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Satz 5.6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Satz 5.7: »Cauchy(1789–1857)-Hadamard(1865–1963)« . . . . . . . . . . . . 148
Lemma 5.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
Satz 5.9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
Satz 5.10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Satz 5.11: »Identitätssatz für Potenzreihen« . . . . . . . . . . . . . . . . . . . 156
Satz 5.12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
Satz 5.13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Satz 5.14 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Satz 5.15 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
1 Zahlenfolgen, Grenzwerte, Reihen
1 Zahlenfolgen, Grenzwerte, Reihen 7

1 Zahlenfolgen, Grenzwerte, Reihen

1.1 Zahlenfolgen

1.1.1 Was ist eine Folge

Vorlesung I

Definition 1.1
Jede Abbildung (Funktion) f : N → R (oder C) heißt Zahlenfolge oder kurz Folge.
Für n ∈ N heißt an = f (n) n-tes Glied der Folge.
Schreibweise: an statt f (n) für einzelne Folgenglieder und (an ), (an )n∈N , (an )∞
n=1 statt
f für die gesamte Folge.
Varianten: Die Abbildung muss aus N abbilden. Es genügt eine beliebige diskrete Menge.
Also zum Beispiel auch N0 .

Beispiel

1 1 1 1
an = ,n ∈ N, (en ) = 1, , , , . . .
n 2 3 4
bn = 1,n ∈ N, (en ) = 1, 1, 1, 1, . . .
cn = (−1)n ,n ∈ N, (en ) = −1, 1, −1, 1, . . .
dn = a + (n − 1)d,n ∈ N, (en ) = a, a + d, a + 2d, a + 3d, . . .
en = aqn ,n ∈ N0 , (en ) = a, aq, aq2 , aq3 , . . .

dn wird arithmetrische Reihe und en geometrische Reihe genannt. [Warum? Verweis auf
die Abschnitte]

1.1.2 Konvergenz von Folgen


(−1)n
Betrachten wir die Folge an = n .
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 8

Wir gehen im Folgenden immer von n ∈ N aus, wenn diese Angabe weggelassen wird.
[Der Hinweis muss in die Definition; Was ist, wenn ∞ weggelassen wird?]
Als Folgenglieder ergeben sich (an ) = 0, 23 , 23 , 54 , . . ., die sich auf dem Zahlenstrahl ein-
zeichnen lassen:
a0 a2 a4 a3 a1

0 1 2

Wir sehen, dass fast alle Folgenglieder »in unmittelbarer Nähe von 1 liegen«. Diese Aus-
sage ist leider etwas schwammig. Wir definieren also die Konvergenz als grundelegenden
Begriff der Analysis:

Definition 1.2
Eine Zahlenfolge (an ) konvergiert gegen den Grenzwert a ∈ R (oder C) genau dann
wenn
∀ε > 0∃N ∈ N∀n ≥ N|an − a| < ε

Bezeichnung: limn→∞ an = a oder kürzer an n → ∞ −→ a

Beispiel
n
Betrachten wir mit dieser Definition nun die Folge an = 1 + (−1)
n können wir beweisen,
dass
lim an = 1
n→∞
gilt. Für den Beweis benötigen wir die Dreiecksungleichung. Wir erinnern uns an die
Weisheit: »Ein Umweg verlängert stets die Reise«. Etwas mathematischer notiert gilt

∀a, b ∈ R : |a + b| ≤ |a| + |b|

Wir sagen auch |a + b| ist der Abstand von a und b.

Beweis Wir geben ε > 0 vor und wählen N = N(ε) > ε1 . Dann gilt
n (−1)n 1

(−1)
∀n ≥ N(ε) : |an − a| = 1 + − 1 = =
n n n

Wir wissen n > N und N > ε1 , also gilt 1


n < ε. 

Wir konnten in diesem Beweis also für ein beliebges ε ein N angeben, sodass

∀n ≥ N|a − an | < ε
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 9

gilt. Da N von ε abhängt – für jedes ε muss ein neues N her – schreibt man auch N(ε).
Wir haben jetzt also für jedes vorgegebene ε, dass man uns vorwirft, ein passendes N
zur Hand, sodass etwas für alle n > N gilt. Wir betrachten also alle Folgeglieder ab
dem Startglied aN . Und für alle diese Glieder, die nach einem bestimmten ersten Glied
kommen, ist der Abstand von a (also unserem Grenzwert) und an (also dem Wert der
Folge an der Stelle n) kleiner als ε.
In diesem Beispiel haben wir also gezeigt, dass für jedes gegebene Intervall auf dem
Zahlenstrahl um 1 sich immer ein Startindex finden lässt, sodass alle Folgenglieder sich
nur noch in diesem Intervall befinden. Insbesondere ist hier in »jedes Intervall« auch
enthalten, dass wir dieses Intervall beliebig klein wählen können. Und je kleiner wir das
Intervall wählen, desto mehr rücken wir der 1 auf die Pelle, ohne sie zu berühren.
1
Bekommen wir also zum Beispiel ε = 100 gegeben, berechnen wir wir ein N > ε1 = 1
1 =
100
100, also zum Beispiel 101. Denn ab n = 101 befinden sich alle Folgenglieder im offenen
99 101
Intervall ( 100 , 100 ).
1 1
100 100

0 1

Und was ist jetzt mit Zahlenfolgen, die nicht konvergent sind? Wir nennen sie divergent.
Allerdings gibt es zwei verschiedenen Arten der Divergenz: Entweder die Folge verhält
sich so wirr, dass wir auch nicht wissen, was los ist, oder sie wächst über alle Grenzen. Im
zweiten Fall nennen wir die Folge bestimmt divergent (denn wir sind nicht mehr völllig
desorientiert) und wir können nun analog zum ε von eben ein K finden, sodass jedes
Folgenglied ab einem Startindex N größer ist, als unser K. Die Folge wächst also über
jede Grenze K hinaus.

Definition 1.3

a) Zahlenfolgen, die nicht konvergieren, heißen divergent.


b) Divergente Zahlenfolgen heißen bestimmt divergent genau dann wenn

∀K > 0∃N∀n ≥ N : an > K(an < K)

Bezeichnung: limn→∞ an = ∞(−∞) oder an −→ ∞(−∞)


n→∞

c) Jede divergente, nicht bestimmt divergente Teilfolge heißt unbestimmt divergent.


d) Konvergente Teilfolgen mit Grenzwert 0 heißen Nullfolgen.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 10

e) Sei n1 < n2 < n3 < . . . eine aufsteigende Indexfolge mit nk ∈ N, dann heißt die Folge
(ank ) = an1 = an2 = an3 = . . . eine Teilfolge von (an ).
Keiner hat gesagt, dass die Folgenglieder der Indexfolge direkt aufeinander folgen
müssen. Jede Folge kann eine Indexfolge sein. Und somit müssen die Folgeglieder einer
Teilfolge auch nicht direkt aufeinander folgende Elemente einer Folge sein, sondern
können wild ausgewählt werden. Nur die Reihenfolge bleibt.
f) Sei ε > 0 und a ∈ R, dann heißt
Uε (a) = {x | |x − a| < ε}
eine Epsilonumgebung von a.
Damit haben wir jetzt allen Zahlen im offenen Interval (a − ε, a + ε) einen Namen
gegeben. Dass schafft keine neue Erkenntnis, sondern spart nur schwammiges Be-
schreiben. Benutzen wir diese tolle Neuerung in der Definition von konvergenten
Folgen, dann konvergergiert eine Folge genau dann wenn
∀ε > 0∃N∀n ≥ N : an ∈ Uε (a)
Immer noch das Gleiche – drückt nur besser aus, dass sich alle Folgenglieder ab dem
Startindex im durch ε vorgegebenen Intervall um a befinden sollen.
g) Sei (an ) eine Zahlenfolge und a ∈ R, dann heißt a ein Häufungswert von (an ) genau
dann wenn
∀ε > 0, N∃n ≥ n : |an − a| < ε

Vergleichen wir mit der Definition von Konvergenz, fällt auf, dass jetzt nicht mehr für
ein N alle n > N die Bedingung |an − a| < ε gelten soll, sondern es nur noch für alle N
ein einziges n geben muss (es drüfen natürlich auch mehr sein), für das die Bedingung
erfüllt ist. Es müssen nicht mehr ab einem Startindex alle weiteren Folgenglieder in
der ε-Umgebung liegeb, sondern es muss sich für jedes N ein n finden lassen, dass
in der Umgebung liegt. Allerdings kann das N beliebig groß gewählt werden und
auf diese Weise verlangt die Formel, dass sich unendlich viele Folgenglieder in der
Umgebung befinden. Denn für jedes beliebige N findet sich noch ein weiteres n. Und
danach auch noch für dieses n, u.s.w. Es kann also jetzt mehrere Häufungswerte
geben, denen sich die Folge annähert – diese heißen dann aber nicht mehr Grenzwert
der Folge, da nicht alle Glieder gegen einen Wert streben. [Gibt es einen Satz, dass
Häufungswerte und konvergente Teilfogen zusammen hängen?]
h) (an ) heißt nach oben (unten) beschränkt, genau dann wenn
∃C ∈ R∀n ∈ N : an ≤ C(≥ C)

(an ) heißt beschränkt, genau dann wenn


∃C1 ,C2 ∈ R∀n ∈ NC2 ≤ an ≤ C1
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 11

Also wenn (an ) nach oben und nach unten beschränkt ist.
analog dazu reicht es auch, wenn gilt

∃C ∈ R∀n ∈ N|an | ≤ C

Denn wir definieren hier nur beschränkt und es ist noch nirgendwo von der kleinsten
Schranke die Rede. Wenn es also eine obere und eine untere Schranke gibt, gibt es
auch einen Wert, denn der Betrag nie überschreitet.
C1 heißt obere Schranke, C2 heißt untere Schranke.

Beispiel

1) an = 1n ist Nullfolge mit oberen Schranken 1, Π, e, 12 und unteren Schranken −1, 0,


−π, −e, −12.
Nullfolge ist (an ) immer. Die Schranken gelten hingegen nur, weil wir von einem
Startindex n = 1 bzw. n ∈ N ausgehen. Bei anderen diskreten Mengen müssen die
Schranken evtl. anders gewählt werden, sie existieren aber auf jeden Fall.
2) Betrachten wir die Folge an = (−1)n + 1n , dann gibt es die Teilfolgen (a2n ) = 1 + 2n
1

1

und (a2n+1 ) = −1 + 2n+1 . Es gilt limn→∞ a2n = 1 und limn→∞ a2n+1 = −1. Die
Folge (an ) hat also die konvergenten Teilfogen (a2n ) und (a2n+1 ) und damit als
Häufunsgwerte die Grenzwerte der konvergenten Teilfolgen, also −1 und 1.

1.1.3 Beschränktheit von Folgen

Vorlesung II

Nachdem wir am Ende der letzten Gewalt-Definition noch eben schnell die Beschränktheit
von Folgen mit abgehandelt haben, gehen wir die Sache jetzt etwas genauer an. Denn
schnell stellen wir fest, dass irgendeine Schranke in der Praxis wenig hilfreich ist. Wenn
ich Π oder e oder 2 als obere Schranke nehmen kann, verwirrt das reichlich und ist auch
für Klausuren nicht zu gebrauchen...

Lemma 1.4

a) Jede nach oben beschränkte Zahlenfolge besitzt eine kleinste obere Schranke.
b) Jede nach unten beschränkte Zahlenfolge besitzt eine kleinste untere Schranke.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 12

Beweis ergibt sich unmittelbar aus der Definition von oberer und unterer Schranke. 

Mit dieser Erkenntnis können wir das Kind jetzt benennen. Außerdem lösen wir dabei
gleich das Problem, dass die kleinste Schranke nicht immer ein Element der Folge sein
muss, dies aber durchaus sein kann. Auf der anderen Seite kann es ein kleinste / größtes
Element der Folge geben, zum Beispiel für n = 1, wenn die Folge monoton fällt.

Definition 1.5

a) (an ) sei nach oben beschränkt. Die kleinste obere Schranke heißt Supremum von
(an ). Schreibweise: sup an
n∈N

Wollen wir nur eine Teilfolge von (an ) betrachten, nehmen wir uns eine Indexmenge
M ⊂ N her, die alle Indizes der Teilfolge enthält, und schreiben sup an
n∈M

b) (an ) sei nach oben beschränkt. Die größte obere Schranke heißt Infimum von (an ).
Schreibweise: inf an
n∈N

c) Falls ein n0 ∈ N existiert, sodass

∀n ∈ N : an ≤ an0

gilt, dann hat (an ) die Maximalstelle n0 mit dem Maximum an0 . Schreibweise: max an
n∈N

In der Bedingung muss unbedingt ≤ stehen, denn die Bedingung soll für alle n ∈ N
und somit insbesondere auch für n0 gelten. Und für n0 kann nur an0 ≤ an0 gelten.
n0 wird in der Mathematik gerne für eine bestimmte Stelle in der Folge (oder später
in der Funktion) verwendet. Der Index 0 gibt nur an, dass es sich um eine feste Stelle
mit einer besonderen Eigenschaft handelt, die man im Folgenden meistens näher
betrachten will. Nicht mit Nullstellen verwechseln!
[Wo wird eigentlich der Unterschied von (an ) und an explizit erklärt?]
d) Falles ein n0 ∈ N existiert, sodass

∀n ∈ N : an ≥ an0

gilt, dann hat (an ) die Maximalstelle n0 mit dem Maximum an0 . Schreibweise: min an
n∈N

Die Defintionen schließen alle den Fall ein, dass die beschriebene Eigenschaft nicht exis-
tiert. a) und b) lösen dass Problem durch die Einleitung »Sei (an ) beschränkt . . . «,
womit Supremum und Infimum nur für beschränkte Folgen definiert sind, und c) und)
schreiben explizit »Falls . . . «. Also auch Maximum und Maximalstelle und Minimum und
Minimalstelle sind nur definiert, falls sie exitsieren.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 13

Beispiel
1

Wir betrachten die Folge (an ) = n . Es gilt

sup an = max an = 1
n∈N n∈N

inf an = 0
n∈N

Die Folge kann im schlimmsten Fall den Wert 1 annehmen, wenn wir für n = 1 ein-
setzen. In allen anderen Fällen n > 1, sind die Werte der Folge kleiner als 1. Also ist
1 das Maximum der Folge. Damit ist 1 auch automatisch die kleinste obere Schranke,
denn kein Element der Folge kann größer sein als das Maximum. Wir betrachten diesen
Zusammenhang im Folgenden Korollar näher. Die Folge strebt gegen 0, ist dabei aber
immer positiv. Damit ist die kleinste untere Schranke 0. Diesmal wird die 0 selber aber
von der Folge nie erreicht, da 0 der Grenzwert der Folge ist. Aus diesem Grunde kann
kein Minimum existieren, da es für jedes Folgenglied an ein kleineres Folgenglied gibt,
zum Beispiel an+1 . Das Minimum der Folge (an ) ist also nicht definiert!

Korollar 1.6

a) Besitzt (an ) ein Maximum, so gilt

sup an = max an
n∈N n∈N

b) Besitzt (an ) ein Minimum, so gilt

inf an = min an
n∈N n∈N

Beweis Der Beweis folgt unmittelbar aus der Definition. Existiert ein Maximum bzw.
Minimum, so erfüllt dieses auch unmittelbar die Bedingungen für das Suppremum bzw.
Infimum. 

Wir sehen also, dass das Maximum, wenn es existiert, immer auch die kleinste obere
Schranke darstellt. Gleichzeitig ist das Minimum immer auch die größte untere Schranke.
Implizit steckt in dieser Folgerung auch die Erkenntnis, dass Infimum bzw. Supremum
immer existieren, wenn Minimum bzw. Maximum existieren.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 14

1.1.4 Monotonie von Folgen

Definition 1.7
Sei M = [m1 , m2 ] ein offenes Intervall und (an ) eine Folge.
a) (an ) heißt (streng) monoton wachsend auf M, falls

∀p, q ∈ M ∩ N : p < q ⇒ a p ≤ aq (a p < aq )

b) (an ) heißt (streng) monoton fallend auf M, falls

∀p, q ∈ M ∩ N : p < q ⇒ a p ≥ aq (q p > aq )

Die tolle Konstruktion M ∩ N verdanken wir der Tatsache, dass M ein Intervall ist und
Intervalle immer auf den reellen Zahlen [oder den komplexen?] definiert sind. Unsere
Folgen bilden aber immer von N auf eine Zhal ab. Daher müssen wir das Intervall mit
N schneiden, um nur die ganzen Zahlen aus dem Intervall zu fischen.
Eine Folge ist also genau dann Monoton, wenn ich mir zwei beliebige Zahlen aus der
Folge greifen kann, wobei beliebig an dieser Stelle insbesondere belibig dicht zusammen
heißt, und die Zahl, die in der Folge weiter hinten steht immer kleiner bzw. immer größer
ist. Die Zahlen werden also entsprechend ihrer Position entweder immer größer, oder
immer kleiner.
Sprechen wir von einer streng monotonen Folge, muss tatsächlich jedes Folgenglied
anders sein. In einer monotonen Folge dürfen aufeinader folgenden Glieder in der Folge
auch den gleichen Wert haben.

Beispiel

• 1n ist streng monoton fallend auf N




• − 1n ist streng monoton wachsend auf N




Wir sehen also, wenn (an ) monoton wächst, fällt (−an ) monoton.
• (1) ist monoton wachsend und monoton fallend.
Aber streng ist hier nichts! Schließlich sind die Werte aller Folgenglieder gleich.

1.1.5 Rechnen mit konvergenten Folgen

Nach diesem kurzen Abstecher in die Monotonie betrachten wir nun noch einmal kon-
vergente Folgen und halten einige einfache Erkenntnisse fest, die für alle konvergenten
Folgen gelten.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 15

Lemma 1.8
Gegeben sei eine konvergente Zahlenfolge (an ). Dann gilt
a) lim an = a ∧ lim an = b ⇒ a = b
n→∞ n→∞

Es kann nur einen geben I: Wenn (an ) eine konvergente Folge ist, dann gibt es nur
einen Grenzwert.
b) Es existiert ein C ∈ R, sodass

∀n ∈ N : |an | < C

Jede konvergente Zahlenfolge ist beschränkt.


c) lim an = a ⇒ ∀(nk ) : lim ank = 0
n→∞ n→∞
Es kann nur einen geben II: Wenn eine Folge konvergiert, dann konvergieren auch alle
Teilfolgen (hier realisiert durch die Indexfolge (nk )) dieser Folge gegen dengleichen
Grenzwert.
d) Wenn lim an = a gilt, dann ist a der einzige Häufungswert der Folge.
n→∞

Wenn lim an = a gilt, ist a der Grenzwert der Folge (an ).


n→∞
Es kann nur einen geben III: Wenn einen Folge konvergiert, dann hat sie nur einen
Häufungswert und dieser ist der Grenzwert.

Beweis a) Zwecke des indirekten Beweises nehmen wir a 6= b an. Wir wählen
Zum
b−a
nun ε = 2 . Entsprechend der Definition der Konvergenz (siehe Definition 1.2 auf

Seite 8) gilt dann
∃Na (ε) : ∀n ≥ Na (ε) : |an − a| < ε
∃Nb (ε) : ∀n ≥ Nb (ε) : |an − b| < ε
Für alle n ≥ max{Na (ε), Nb (ε)} gilt nun

b − a ∗
2ε = 2 = |b − a| = |b − an + an − a| ≤ |an − b| + |an − a| < 2ε
2 | {z } | {z }
<ε <ε

Wenn n größer ist als das Maximum von Na (ε) und Nb (ε) gelten beide obigen Aus-
sagen und können zu einer neuen zusammengesetz werden. Wir addieren quasi beide
Gleichungen.
Mit der Aussage 2ε < 2ε haben wir den gewünschten Widerspruch gefunden und
damit die Aussage gezeigt. Wie in jedem guten Beweis mit Beträgen wurde an der
Stelle ∗ die Dreiecksungleichung verwendet.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 16

b) Es sei ε = 1. Dann gibt es aufgrund der Konvergenz der Folge ein N(ε = 1), sodass für
alle n ≥ N(1) die Aussage |an − a| < 1 gilt. Mit der Dreiecksungleichung folgt daraus
∀n > N(1) : |an | ≤ |a| + 1 und damit ∀n ∈ N : |an | ≤ max{|a1 |, |a2 |, . . . , |aN(1)−1 |, |a| +
1} = C. Somit ist C die Schranke. [Was macht der hier? Was soll die Menge sein?]


Satz 1.9 Rechenregeln


Es seien (an ) und (bn ) zwei Folgen mit lim an = a und lim bn = b. Dann gilt
n→∞ n→∞

a) lim (an ± bn ) = a ± b
n→∞

Als Vorraussetzung müssen hier nur die Folgen (an ) und (bn ) konvergieren, also gegen
den Grenzwert a bzw. b streben. Dann ist auch die Folge (an ± bn ) konvergent. Wir
müssen also die Konvergenz der Folge (an ±bn ) nicht erst seperat nachweisen, sondern
sie ergibt sich ebenfalls aus diesem Satz.
b) lim |an | = |a|
n→∞
Auch hier erhalten wir die Aussage, dass eine Betragsfolge konvergiert, wenn die Folge
ohne Betragsstriche ebenfalls konvergiert. Umgekehrt gilt das auf keinen Fall. Man
betrachte die Folge (|(−1)n |) = (1) und ((−1)n ).
c) lim an bn = ab
n→∞
Im Spezialfall ∀n ∈ N : an = c gilt damit auch für ein festes c ∈ R und eine beliebige
Folge (xn )
lim cxn = c lim xn
n→∞ n→∞

d) Ist der Grenzwert von (an ) nicht 0, dann gilt

∃N ∈ N∀n ≥ N : an 6= 0

und
1 1
lim =
n→∞ an a

e) Gilt ∀n ∈ N : an ≥ 0, hat die Folge (an ) also keine negativen Glieder, dann gilt
√ √
lim an = a
n→∞

Ich mache noch einmal darauf aufmerksam: Auch hier erhalten wir die Aussage, dass
eine Wurzelfolge konvergiert, wenn alle Folgenglieder der Folge unter der Wurzel
positiv sind und die Folge unter der Wurzel konvergiert.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 17

Vorlesung III

Beweis a) Es sei ein ε > 0 gegeben. Wir definieren dann N1 durch


ε
∀n ≥ N1 : |an − a| <
2
N2 durch
ε
∀n ≥ N2 : |bn − b| <
2
und es sei schließlich N = max{N1 , N2 }.
N ist jetzt also so gewählt, dass sich ab Folgenindex N alle Folgenglieder von (an )
in einer ε-Umgebung von a befinden und alle Folgenglieder von (bn ) in einer ε-
Umgebung von b befinden. Nun addieren wir die Aussagen, die nach der Definition
der Konvergenzen beider Folgen gelten und erhalten für unsere neue Folge ebenfalls
eine Konvergenz.
Dann gilt
∀n ≥ N : |(an ± bn ) − (a ± b)| ≤ |an − a| + |bn − b| < ε
| {z } | {z }
< ε2 < ε2

b) Wir beweisen die Aussage mit der Dreiecksungleichung

0 ≤ ||an | − |a|| ≤ |an − a| < ε

Wenn der Abstand von an und ε kleiner ist als a (Teil der Bedingung für die Konver-
genz von (an ) gegen a), dann ist auch auf jeden Fall immer dann der Abstand von
|an | und |a| kleiner als ε.
c) Es sei ein ε > 0 gegeben. Dann sei N1 definiert durch
ε
∀n ≥ N1 : |an − a| <
2(|b| + 1)

und k definiert durch


∀n ∈ N : |an | < k

Diese Definition von k ist möglich denn jede konvergente Zahlenfolge beschränkt
(siehe Lemma 1.8 auf Seite 15). k stellt also gerade eine untere und obere Schranke
der Folge da.
Weiter sei N2 definiert durch
ε
∀n ≥ N2 : |bn − b| <
2k
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 18

und es sei schließlich N = max{N1 , N2 }.


Dann gilt

∀n ≥ N :|an ab − ab| = |an bn − an b + an b − ab| ≤ |an bn − an b| + |an b − ab|


† ε ε
≤ |an ||bn − b| + |b||an − a| < k + |b| ≤ε
2k
|{z} 2|b| + 1
ε
| {z }
=2 ≤ ε2

An der mit † gekennzeichneten Stelle wurden alle oben definierten Vorraussetzungen


verwendet. Die beiden Ungleichungen vorher ergeben sich nur aus der Dreiecksun-
gleichung und dienen hier nur der Vorbereitung.
Der eigentlich Trick dieses Beweises liegt – wie bereits im Beweis von a) – in der
cleveren Definition von N1 und N2 . Denn da sich nach der Definition für jedes ε eine
ε
N finden lässt, können wir auch ε = 2(|b|+1) setzen, wobei ε jetzt eine beliebige,
aber feste Zahl ist, die noch keine nähere Bedeutung hat, und dann N1 als das N
defininieren, was sich durch diese Wahl von ε ergibt. Setzen wir nun an der markierten
Stelle in den Ausdruck ein, für den wir eigentlich etwas zeigen wollen, dann fällt
alles das weg, was uns irgendwie behindern könnte, und wir erhalten die gewünschte
Aussage: Für ein beliebiges ε haben wir ein N gebastelt, sodass für alle n ≥ N die
Aussage |an ab − ab| < ε gilt.
d) Es sei N1 definiert durch
1 3
∀n ≥ N1 : |a| < |an | < |a|
2 2

Da die Folge (an ) gegen a konvergiert nähert sich an irgendwann soweit a an, dass
es sich in dieser Umgebung befinden muss.
a2
Für diese an gilt |aan | > 2
Weiter sei ein ε > 0 gegeben und N2 definiert durch

a2
∀n ≥ N2 : |an − a| < ε
2
und schließlich sei N = max{N1 , N2 }. Dann gilt
2

∀n ≥ N : 1 − 1 = a − an < a ε 2 = ε

an a aan 2 a2
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 19

e) Wenn für alle n an ≥ 0 gilt, dann muss auch a ≥ 0 gelten.


Betrachten wir den Fall a = 0. Es sei ein ε > 0 gegeben und N definiert durch
∀n ≥ N : an − 0 < ε 2
dann folgt daraus p √
∀n ≥ N : an − 0 < ε 2 = ε

Im zweiten Fall gelte a > 0 und sei auch hier ein ε > 0 gegeben und ein N definiert
durch √
∀n ≥ N : |an − a| < ε a
Dann gilt
√ √
√ √ √ √ an + a
∀n ≥ N :| an − a| = | an − a| √ √
an − a

|an − a| ε a
≤ √ < √ =ε
a a
[Ist der zweite Fall so ganz stimmig? Ich weiß nicht so recht. . . ]


Bemerkung 1. Umkehrungen zu a) und c) gelten nicht!


Zu b) übrigens auch nicht, aber das liegt daran, dass es keine Umkehrfunktion (sie-
he Bemerkung 4) zu f (x) = |x| gibt. Denn zum Beispiel |x| = 2 gilt für x = 2 oder
x = −2. d) enthält in sich selbst auch seine Umkehung
√ und auch e) funktioniert in
der Umkehrung, denn für √f (x) = 1x und f (x) = x lassen sich Umkehfunktionen
finden. (Man beachte für x die Beschränkung auf nichtnegative Zahlen!)
2. Aus a) und c) ergibt sich die Linearität der Grenzwertbildung, denn es gilt
∀α, β ∈ R : lim (αan + β bn ) = α lim an + β lim bn
n→∞ n→∞ n→∞

3. Analog zum Satz lassen sich für an −→ ∞, bn −→ ∞ und cn −→ c zum Beispiel


n→∞ n→∞ n→∞
beweisen
• an + bn −→ ∞
n→∞
• an + cn −→ ∞
n→∞
• an cn −→ ∞ für c > 0
n→∞

4. b) mit f (x) = |x|, d) mit f (x) = 1x und e) mit f (x) = x sind Spezialfälle der Aus-
sage [Wieso steht im Script »Frage«? Gilt das nicht?]
lim f (an ) = f ( lim an )
n→∞ n→∞

[Fass mal schlau zusammen, was man jetzt alles darf!]


1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 20

1.1.6 Konvergenz-Kriterien

Bisher haben wir die Konvergenz einer Folge immer direkt mit der Definition der Konver-
genz gezeigt. Und wir haben gesehen, dass das meistens ein sehr unhandlicher Beweis ist.
Daher werden wir uns im Folgenden einige Techniken aneignen, mit denen man einfacher
über die Konvergenz (allerdings nur ja oder nein – es ergibt sich nicht mehr direkt auch
der Grenzwert) entscheiden kann.

Satz 1.10 Konvergenzkriterien

a) Vergleichskriterium: Es seien drei Zahlenfolgen (an ), (bn ) und (cn ) gegeben, sodass
gelte
∃N ∈ N∀n ≥ N : bn ≤ an ≤ cn
und es gelte
lim bn = lim cn = a
n→∞ n→∞
dann gilt auch
lim an = a
n→∞

Sehr anschaulich ist hier das Bild des Einschnürens: Die Folgen (bn ) und (cn ) kommen
der Folge (an ) immer näher, sodass man sich am Ende nur beim gleichen Grenzwert
treffen muss. Allerdings gilt wie immer bei der Betrachtung von Grenzwerten von
Folgen: Was interessieren mich die ersten Folgenglieder – es muss nur irgendwann
klappen! Es kann also durchaus sein, dass das Einschnüren erst ab einem Startindex
funktioniert und die Folgenglieder vorher alle wiöld durcheinander tanzen.
b) Monotoniekriterium: Jede reele, monotone und beschränkte Zahlenfolge ist konver-
gent.
Das ist quasi die Umkehrung von »Jede konvergente Zahlenfolge ist beschränkt«
(siehe Lemma 1.8 auf Seite 15). Allerdings reicht es nicht aus, dass die Zahlenfolge
beschränkt ist. Sie muss auch noch monoton sein, denn sonst muss die Zahlenfolge
nicht auf einen Häufungswert zusammenlaufen. Man betrachte ((−1)n ) – die Zah-
lenfolge ist beschränkt, denn die Glieder werden nie größer als |1|.

Beweis a) Für ein beliebiges ε > 0 lässt sich ein N1 > N finden, sodass gilt

∀n ≥ N1 : a − ε < bn ≤ an ≤ cn < a + ε

Nach Vorraussetzung konvergieren die Folgen (bn ) und (cn ) gegen den Grenzwert
a. Also befinden sich ab einem Startindex N1 alle Folgenglieder von (bn ) und (cn )
innerhalb einer ε-Umgebung von a. Außerdem gilt nach Vorraussetzung, dass die
Folgen (bn ) und (cn ) die Folge (an ) ab dem Startindex N einschnüren – also auch
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 21

ab N1 > N. Damit muss sich also auch cn innerhalb der ε-Umgebung befinden. Und
wenn sich zu jedem ε ein N finden lässt, sodass sich cn ab Startindex N nur noch in
der ε-Umgebung befindet, dann ist die Definition von Konvergenz erfüllt.
b) Ohne Beschränkung der Allgemeinheit sei (an ) monoton wachsend.
Wir können also im Folgenden auch jeweils monoton fallend einsetzen, müssen den
Beweis dann nur entsprechend anpassen, kommen aber zum glichen Ziel. Daher die
tolle Formulierung »Ohne Beschränkung der Allgemeinheit. . . «.
Sei weiter a definiert durch a = supn∈N an und ein ε > 0 gegeben. Dann ist a − ε keine
obere Schranke von (an ), denn es existiert ein N, sodass gilt a − ε < aN ≤ a.
Da die Folge (an ) monoton wachsend ist, gilt

∀n ≥ N : a − ε < aN ≤ a

und damit gilt die Konvergenz gegen a.


Wir nehmen uns also die kleinste obere Schranke von (an ) her und nennen sie a.
Für jedes ε ist a − ε nun keine obere Schranke mehr, denn sonst wäre a nicht die
kleinste obere Schranke. Außerdem ist die Folge monoton wachsend, also sie muss sie
irgendwann auch über a − ε hinauzswachsen, denn a − ε ist ja keine obere Schranke.
Da diese Überlegung für jedes ε – also auch jedes noch so kleine ε – funktioniert
und die Folge trotzdem nie größer werden kann als a, denn a ist eine obere Schranke,
muss die Folge gegen a konvergieren.


Definition 1.11 Cauchy-Folge


Eine Zahlenfolge (an ) heißt Cauchy-Folge (CF), wenn für jedes ε > 0 ein N existiert,
sodass gilt
∀m, n ≥ N : |am − an | < ε

Satz 1.12 Konvergenzkriterium von Cauchy


Eine Zahlenfolge ist genau dann konvergent, wenn sie eine Cauchy-Folge ist.

Die eigentliche Macht dieses Konvergenz-Kriteriums verbirgt sich in der Definition der
Cauchy-Folge. Nimmt man Definition und Satz zusammen, kommt man zu der Aussage,
dass für Konvergenz »nur noch«

∀ε > 0∃N ∈ N∀m, n ≥ N : |am − an | < ε


1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 22

zu zeigen ist und nicht mehr

∀ε > 0∃N ∈ N∀n ≥ N : |an − a| < ε

Es reicht also für die Konvergenz aus, wenn sich alle Folgenglieder ab einem Startindex
gegenseitig immer weiter annähern. Es muss nicht mehr der Abstand zu einem festen
Grenzwert betrachtet werden. Besonders nützlich wird dieser Unterschied bei der Be-
trachtung von Reihen werden (siehe Satz 1.20 auf Seite 36).

Vorlesung IV

Beweis Wir zeigen zwei Richtungen und beginnen mit der Hinrichtung (Jede konver-
gente Zahlenfolge ist eine Cauchy-Folge). Da die Folge (an ) konvergent ist, gibt es zu
jedem ε > 0 ein N, sodass gilt
ε ε
∀n, m ≥ N : |an − a| < ∧ |am − a| <
2 2
Daraus folgt
∀m, n > N : |am − an | ≤ |am − a| + |an − a| < ε
und damit ist (an ) eine Cauchy-Folge.
Für die Rückrichting (Jede Cauchy-Folge ist konvergent) sind zunächst einige Vorüberle-
gungen nötig.
1. Jede Cauchy-Folge ist beschränkt.
Sei dazu ε > 0 gegeben und N definiert durch

∀n, m ≥ N : |an − am | < ε

Es bleibt zu zeigen, dass eine beschränkte Cauchy-Folge konvergiert.


2. Satz von Bolzano-Weierstrauß
Jede beschränkte Folge (allgemeiner jede unendliche beschränkte Menge M ⊂ R)
besitzt einen Häufungspunkt.
Beweis Wir verwenden die Methode der Intervallschachtelung.
Betrachten wir die folgende Intervallkonstruktion

I1 ⊃ I2 ⊃ I3 ⊃ I4 ⊃ . . .

Eine unendliche Menge von abgeschlossenen Intervallen jeweils mit der halben
Länge vom vorigen Intervall. Jedes Intervall besitzt unendlich viele Glieder a j ∈ In .
Genau ein a ∈ R liegt in allen Intervallen (Axiom!) 
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 23

Da wir eine unendliche Abfolge von Intervallen betrachten, deren Länge sich jeweils
halbiert, befindet sich am Grenzwert zum unendlichsten Intervall nur noch der
Wert a im Intervall. Aus dieser axiomatischen Aussage – es ist eine Annahme auf
der unsere Mathematik basiert – folgt, dass jede unendliche Zahlenmenge, die
beschränkt ist, mindestens einen Häufungspunkt besitzen muss. [Sinn?]
Es bleibt zu zeigen, dass eine Cauchy-Folge mit einem Häufungspunkt konvergiert.
3. Eine Zahlenfolge mit einem Häufungspunkt a besitzt einen gegen a konvergierende
Teilfolge. [Steht das nicht so schon in der Definition von Häufungspunkt?]
Es existiert eine Indexfolge (n1 ), sodass gilt
|an1 − a| < 1
Entsprechend existiert auch eine Indexfolge (n2 ), sodass gilt
1
|an2 − a| <
2
Setzt man das entsprechend fort, dann gilt allgemein für eine Teilfolge (an j )

|an j − a| < 2− j
anders ausgedrückt konvergiert die Folge (an j ) j gegen a.
Es bleibt zu zeigen, dass eine Cauchy-Folge mit einer konvergenten Teilfolge kon-
vergiert.
4. Besitzt eine Cauchy-Folge eine konvergente Teilfolge mit einem Grenzwert a, er-
wzingt das die Konvergenz der Cauchy-Folge. Denn sei ein eε > 0 gegeben, dann
gilt
ε
∃N ∈ N∀n, m ≥ N : |an − am | <
2
Wählen wir m = n j , dann ergibt sich
‡ § ε
∃N ∈ N∀n, n j ≥ N : |an − a| ≤ |an −an j |+|an j −a| < + |an j − a|
| {z } 2 | {z }
unabhängig von j wird für n → ∞ kleiner als ε
2

An der Stelle ‡ addieren und subtrahieren wir an j , was erstmal nichts verändert,
und wenden dann die Dreiecksungleichung an. Also der gleiche Trick wie jedes
mal. . .
An der Stelle § schätzen wir |an − an j | mit ε2 ab – was erlaubt ist, da wir es mit
einer Cauchy-Folge zu tun haben und die entsprechende Ungleichung aus der Zeile
darüber übernehmen können. |an j − a| kann stehen bleiben, denn für j gegen ∞
strebt der Ausdruck gegen 0 – denn nach 3. besitzt unsere Cauchy-Folge die gegen
a konvergierende Teilfolge (an j ) j .

1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 24

1.1.7 Beispiele von Folgen-Konvergenz

Beispiel
q
n2 +1
1. Betrachten wir die Folge 2n2 −1
und wenden die Rechenregeln an:
v

s v u lim  
u 1 1
r
2
n +1 ¶ u 1 + n2
u n→∞ 1+
n 2 1 2
lim = lim t =t = =
u
2 1

n→∞ 2n − 1 n→∞ 2 − n2 limn→∞ 2 − 12 2 2
n

An der Stelle ¶ haben wir den Bruch mit n12 erweitert. Diese Methode den Bruch
durch das n mit dem größten Exponenten zu teilen ist auch ohne Limes gültig und
hilft bei der Betrachtung von Grenzwerten oft weiter. Denn anschließend kennen
wir den Grenzwert von n12 , vorher kannten wir den Grenzwert von n2 nicht.
2. Wir betrachten die Folge (an )n∈N mit a ∈ R. Es gilt
- für a > 1: Die Folge ist bestimmt divergent gegen ∞.
Denn um von einem Folgenglied zum nächsten zu kommen, multiplizieren wir
den Wert der Folge an der alten Stelle mit a. Und da a > 1 gilt, sind alle Werte
der Folge positiv und der neuen Wert der Folge ist stets größer als der alte. Die
Folge ist also monoton steigend.
- für a ≤ −1: Die Folge ist unbestimmt divergent.
Die Argumentation ist hier sehr ähnlich. Allerdings wechselt die Folge dabei
jeweils das Vorzeichen, denn wegen a < 0 gilt an > 0 für gerade n und an < 0
für ungerade n. Man spricht dann von einer alternierenden Folge.
- für a = 1: Die Folge konvergiert gegen 1.
Wer hätte das erwartet.
∀n ∈ N : 1n = 1

- für |a| < 1: Die Folge ist eine Nullfolge.


Wir multiplizieren den Wert der Folge immer wieder mit einem a, für das |a < 1|
gilt. Also wird der Wert der Folge immer kleiner. Gilt a > 0 ist die Folge monoton
fallend. Gilt a < 0, dann wechselt die Folge immer das Vorzeichen. Wir nähern
uns der Null also von beiden Seiten.
3. Wir betrachten den Grenzwert

n
lim n=1
n→∞
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 25


Beweis Sei an = n
n − 1, dann gilt bn > 0, denn es gilt

∀a ∈ R : a > 1 ⇒ n a > 0.

Weiter gilt
√ n 
n n(n − 1)
n = ( n n − 1 + 1)n = (an + 1)n = ∑ k akn ≥ 11 + 2 a2n
k=0

womit folgt
n(n − 1) 2
n−1 ≥ an
2
2
worraus schließlich durch Multiplikation mit n(n−1) folgt

2
≥ a2n ≥ 0
n
und damit ist nach dem Vergleichskriterium (siehe Satz 1.10 auf Seite 20) (a2n )
eine Nullfolge, womit auch (an ) eine Nullfolge ist.
Das Vergleichskriterium können wir hier verwenden, da

0 −→ 0
n→∞

und
2
−→ 0
n n→∞
gelten.

√ 
Für die Folge n k können wir für ebenfalls mit dem Vergleichskriterium zeigen

n
lim k=1
n→∞

denn für alle n > k gilt √ √ √


n n
1< k< nn

Auch hier dürfen wir das Vergleichskriterium verwenden, da


√n
1 −→ 1
n→∞

und √
n
n −→ 1
n→∞
gelten.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 26

Beispiel rekursiv definierte Folgen


6(1+an )
4. Wir bertrachten die Folge (an ) gegeben durch a1 = 1 und an + 1 = 7+an für
n ≥ 1.
Hey, hier haben wir mal was ganz neues! Die Folge ist nicht durch eine Funktions-
vorschrift
an = f (n)
gegeben, sondern durch die rekursive Vorschrift
an+1 = f (an ).
Wie bei jeder rekursiven Vorschrift muss ein Anfang vorgegeben sein. Hier durch
a1 = 1.
a) Die Folge (an ) ist beschränkt, denn es gilt
∀n ∈ N : 0 < an < 2
Beweis Wir zeigen an > 0 durch vollständige Induktion.
Induktionsanfang:
a1 = 1 > 0

Induktionsvorraussetzung:
an > 0

Induktionsschritt:
6(1 + an )
an+1 = >0
7 + an
denn nach Induktionsvorraussetzung gilt an > 0.
Weiter zeigen wir an < 2 ebenfalls durch vollständige Induktion.
Induktionsanfang:
a1 = 1 < 2

Induktionsvorraussetzung:
an < 2

Induktionsschritt: Aus der Induktionsvorraussetzung folgt


4an < 8 ⇒ 6 + 6an < 14 + 2an = 2(7 + an )
| {z }
>0

und damit gilt


6(1 + an )
an+1 = <2
7 + an

1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 27

b) an ist monoton wachsend, denn es gilt

6 + 6an 6 + 6an − 7an − a2n 6 − an − a2n k


an+1 − an = − an = = >0
7 + an 7 + an 7 + an

An der Stelle k benutzen wir die Aussage an < 2 aus a), denn damit gilt ebenfalls
a2n < 4 und damit gilt an + a2n < 6.
c) Aus a) und b) folgt nach dem Monotoniekriterium (siehe Satz 1.10 auf Seite 20)
die Konvergenz der Folge.
Für den Grenzwert der Folge ergibt sich
6 + 6an ∗∗ 6 + 6a
a = lim an = lim an+1 = lim =
n→∞ n→∞ n→∞ 7 + an 7+a

An der Stelle ∗∗ wurde zunächst mit den Rechenregeln (siehe Satz 1.9 auf
Seite 16) die Grenzwertberechnung in den Bruch hineingezogen

6 + 6an limn→∞ 6 + limn→∞ an


lim =
n→∞ 7 + an limn→∞ 7 + limn→∞ an
und anschließend die Gleichheit

a = lim an
n→∞

angewendet.
Damit ist für den Grenzwert der Folge die Gleichung
6 + 6a
a=
7+a
zu lösen. Wir bestimmen also mit der p-q-Formel die Lösung der quadratischen
Gleichung
a2 + a − 6 = 0
und erhalten
a = 2 ∨ a = −3.
Da für alle Glieder der Folge an > 0 gilt, muss auch für den Grenzwert a > 0
gelten. Wir erhalten also
a = 2.
1 Zahlenfolgen, Grenzwerte, Reihen
1.1 Zahlenfolgen 28

Lemma 1.13
Seien (an ) und (bn ) reelle und konvergente Folgen für die gilt

∃N ∈ N∀n ≥ N : an ≤ bn

dann gilt
lim an ≤ lim bn
n→∞ n→∞

Beweis [Folgt vermutlich direkt aus dem Vergleichskriterium] 

Bemerkung In diesem Satz kann »≤« nicht durch »<« ersetzt werden, denn der
Grenzwert kann trotzdem gleich sein. Man betrachte (an ) monoton wachsend mit dem
Grenzwert 2 und (bn ) = (2). Dann gilt ∀n ∈ N : an < bn aber limn→∞ an = limn→∞ bn = 2.

Vorlesung V

1.1.8 Mengen von Häufungswerten

Existieren mehr als ein Häufungswert, so kann man immerhin noch den größten bzw.
den kleinsten Häufungswert betrachten und in vielen Fällen mit diesen Aussagen treffen.
Im Fall nur eines einzigen Häufungswertes, also eines existierenden Grenzwertes, fallen
Grenzwert, größter und kleinster Häufungswert natürlich wieder zusammen, sodass die
Folgenden Definition auch dann noch einen Limes definiert, wenn nicht nur ein Häufungs-
wert existiert, und somit eine Eriweiterung der Limes-Definition (siehe Definition 1.2 auf
Seite 8) darstellt.

Definition 1.14
Es sei eine Folge (an ) mit einer Menge M ⊆ R von Häufungswerten gegeben. Dann ist
der Limes Superior gegeben durch

∞

 falls nach oben unbeschränkt
lim sup an = sup M falls M nach oben beschränkt und M 6= 0/
n→∞
−∞ falls an −→ −∞


n→∞

Analog dazu ist der Limes Inferior gegeben durch



−∞ falls (an ) nach unten unbeschränkt


lim inf an = inf M falls M nach unten beschränkt und M 6= 0/
n→∞
falls an −→ ∞

∞

n→∞
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 29

1.2 Undendliche Reihen

1.2.1 Definition

Beispiel

1 + 1 − 1 + 1 − 1 + 1 − 1 + . . . =?
1 1 1 1 1
1 + + + + + + . . . =?
2 4 8 16 32
1 1 1 1 1 1
1 + + + + + + + . . . =?
2 3 4 5 6 7

Was ist das Spannende an diesen Ausdrücken? Sie sind regelmäßig aufgebaut, setzen sich
aber bis ins unendliche fort. Wir werden gleich sehen, dass man solche Summationsketten
auch als undendliche Summe von Folgengliedern auffassen kann, denn die einzelnen
Summanden einer solchen unendlichen Summationskette müssen systematisch aufgebaut
sein, damit man dem Summationsausdruck einen Sinn geben kann.
Wir wollen uns in diesem Kapitel damit beschäftigen, solchen Ausdrücken eine Bedeu-

tung zu geben. Oder etwas mathematischer ∑ ak = a1 + a2 + a3 + a4 + . . . sinnvoll zu
k=1
definieren.
Das Problem an solchen Ausdrücken liegt in der Unendlichkeit. Alle Rechenregeln, die
für endliche Summen gelten, können wir zunächst vergessen und drüfen sie alle einzeln
auf Tauglichkeit prüfen, denn wir werden sehen, dass es einzelne gibt, die nicht funk-
tionieren. So kann der Wert eines solchen Ausdruckes zum Beispiel bei alternierenden
Summationsfolgen von der Reihenfolge der Summanden abhängen. Das kennen wir von
endlichen Summen in der Form nicht!

Definition 1.15
Es sei (ak )∞
k=1 eine Zahlenfolge.
a) Die Folge (sn )∞
n=1 mit
n
sn ∑ ak
k=1
heißt Partialsummenfolge von (ak ) oder (unendliche) Reihe.
Bezeichnung:

∑ ak := ∑ ak := (sn)
k k=1
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 30


b) Die Reihe ∑ ak konvergiert genau dann gegen a, wenn die Folge (sn) gegen a kon-
k=1
vergiert.

Da wir vorher die Äquivalenz von der Reihe ∑ an und der Summe (sn ) definiert
k=1
haben, ergibt sich daraus eigentlich keine neue Erkenntnis.
Bezeichnung:

∑ ak := ∑ ak := n→∞
lim sn
k k=1


Achtung: Der Ausdruck ∑ bezeichnet also sowohl die Folge der Partialsummen (sn )
k=1
selber, als auch den Grenzwert der Folge (an ), falls diese konvergiert.
Wir sprechen vom Wert, dem Limes oder der Summe der Reihe.
Jede nicht konvergente Reihe heißt divrgent. Eine reelle divergente Reihe heißt be-
stimmt divergenz, falls sn −→ ∞ oder sn −→ −∞ gilt. Sonst heißt sie unbestimmt
n→∞ n→∞
divergent.
Die ak bezeichnen wir als Glieder der Reihe und nicht als Summanden.

1.2.2 Beispiele für unendliche Reihen

Beispiel

1. alternierende Reihe ∞
∑ (−1)k
k=1

Für die Partialsummenfolge (sn ) gilt damit


(
−1 für n ungerade
sn =
0 für n gerade

Damit ergibt sich: (sn ) ist unbestimmt divergent.


Die Partialsummenfolge (also die Summe für eine feste obere Grenze n und nicht
∞) wechselt also immer zwischen 0 und −1 hin und her. Untersuchen wir die Kon-
vergenz der Partualsummenfolge (sn ) (betrachten also jetzt die Summe tatsächlich
mit oberer Grenze ∞) ergeben sich zwei Häufungswerte bei −1 und 0 und damit
die unbestimmte Divergenz der Reihe. Die Reihe hat also keinen Wert.
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 31

2. geometrische Reihe

∑ mit q ∈ R und k ∈ N0
k=0
Damit ergibt sich für die Partialsummemfolge
( n+1
n q −1
falls q 6= 1
sn = ∑ qk = n+1
q−1
falls q = 1
k=0

Denn allgemein gilt für eine endliche Folge


n n n+1 n
(q − 1) ∑ qk = ∑ k = 0n qk+1 − ∑ qk = ∑ qk − ∑ qk = qn+1 − 1
k=0 k=0 k=1 k=0

Damit ergibt sich für die Konvergenz der Reihe: (sn ) konvergiert genau dann, wenn
|q| < 1 ist.
Im Falle der Konvergenz gilt für den Wert der Reihe

1
lim sn =
n→∞
∑ qk = 1 − q
k=0

Wenn man die geometrische Reihe noch etwas weiter verallgemeinert, kommt man
auf

a

 1−q für |q| < 1, also für −1 < q < 1

für q ≥ 1 und a > 0

∞



k
∑ aq = 0 für q ≥ 1 und a = 0
k=0
−∞ für q ≥ 1 und a < 0





nicht definiert für q ≤ 1, denn dann unbestimmt divergent

3. harmonische Reihe ∞
1
∑k
k=1
Betrachten wir zunächst einige Werte für diese Reihe
s103 ≈ 7 s106 ≈ 14 s109 ≈ 21
Diese Werte scheinen eine Konvergenz nahe zu legen, da für immer größere n die
Folge nur sehr langsam wächst. Betrachten wir aber
     
1 1 1 1 1 1 1 1 1
s2n+1 = 1 + + + + + + + + +...+ +...
2 3 4 5 6 7 8 9 16
 
1 1 1 1 1 1 1 n+3
+ n + . . . + n+1 < 1 + + 2 + 4 + 8 + . . . + 2n n+1 =
2 +1 2 2 |{z}4 |{z} 8 |{z} 16 | 2{z } 2
= 12 = 12 = 12 = 12
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 32

dann sehen wir, dass (s2n+1 ) keine Nullfolge bildet und damit auch (sn ) keine
Nullfolge bilden kann. [Ist das die Begründung?]
Weiter ist (sn ) streng monoton wachsend, denn es gilt

1
sn+1 − sn = >0
n+1

Damit ergibt sich



∑ ak = n→∞
lim sn = ∞
k=1

4. Betrachten wir die Fole



1
∑ k(k + 1)
k=1

dann ergibt sich für die Partialsummenfolge


n n  
1 1 1
sn = ∑ =∑ −
k=1 k(k + 1) k=1 k k+1
n n n n
1 1 1 1
=∑ −∑ = ∑ −∑
k=1 k k=1 k + 1 k=1 k k=2 k
1
=1 − −→ 1 − 0 = 1
n + 1 n→∞
Damit gilt also

1
∑ k(k + 1) = 1
k=1

Das eigentlich interessante an diesem Beispiel ergibt die Betrachtung folgender


Zerlegung
∞   ∞ ∞
1 1 1 1
− 6
∑ k k+1 ∑ k ∑ k+1 =
= − »∞ − ∞« 6= 1
| {z }
k=1 k=1 k=1 unbestimmter Ausdruck!

Wir können also eine unendliche Summe auf keinen Fall aufteilen in zwei Summen.
Nur weil diese Operation mit endlichen Summen problemlos möglich ist, ist sie mit
unendliche Summen (=Reihen) noch lange nicht erlaubt.
Weiter folgt
∞ ∞ ∞ ∞
1 1 1 1
1= ∑ k(k + 1) < ∑ k2 < 1 + ∑ k − 1 = 1 + ∑ k(k + 1) = 2
k=1 k=1 k=2 k=1
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 33


1
Wir verwenden als obere Einschnürgrenze 1 + ∑ , da k(k − 1) für k = 1
k=2 k(k − 1)
undefiniert ist, sodass das erste Folgenglied ausgelagert werden muss. Entspre-
chend können wir dann die Ungleichung verwenden
1 1 1
< <
k(k + 1) kk k(k − 1)

In Analsysis II werden wir dann auch den Wert dieser Reihe bestimmen können
und kommen dann zu

1 Π2
∑ 2 6 ≈ 1.644
=
k=1 k

5. Die Folge

1
∑ kα
k=1
konvergiert genau dann, wenn α < 1. [Gibt es da nicht einen Beweis in einer
Übungsaufgabe?]

Lemma 1.16
Es sei (ak ) eine Folge für die ak ≥ 0 für alle k ∈ N gilt. Dann gilt

sn = ∑ ak ist konvergent ⇐⇒ (sn ) ist beschränkt
k=1

Eine Reihe mit nur positiven Gliedern ist genau dann konvergent, wenn sie beschränkt
ist. Denn wenn wir nur positive Glieder in einer Summation haben, dann bedeutet eine
Beschränkung automatisch auch eine obere Schranke und die obere Schranke muss dann
auch der Grenzwert der Reihe sein.

Beweis Die Hinrichtung (Jede konvergente Folge ist beschränkt) folgt direkt aus Lem-
ma 1.8 auf Seite 15. Für die Rückrichtung (Ist die Reihe beschränkt und die Glieder nur
positiv, dann ist sie konvergent) betrachten wir die Differenz der Reihenglieder

sn+1 ≥ sn ⇒ sn+1 − sn ≥ 0

Die Reihe hat nach Vorraussetzung nur positive Glieder und wir summieren diese Glieder
in der Partualsummenfolge auf. Also kann ein Folgenglied nur größer oder zumindestens
genausogroß wie sein Vorgänger sein, denn sie unterschieden sich nur durch die Addition
eines nichtnegativen ak .
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 34

Also ist die Reihe monoton wachsend und mit dem Monotoniekriterium (siehe Satz 1.10
auf Seite 20) ist die Reihe auch konvergent. 

Vorlesung VI

1.2.3 Eulersche Zahl

Lemma 1.17

1
∑ k! konvergiert.
k=0
Man beachte an dieser Stelle die Definition der Fakultät:

0! := 1 n! := n(n − 1)!

Die Summe dieser Reihe wird mit e bezeichnet und Eulersche Zahl genannt. Es gilt

e ≈ 2.7182818284590

Beweis Die Partialsummenfolge


n
1
sn = ∑ k!
k=0

ist monoton wachsend und beschränkt.


1 1
Denn k ist positiv und es gilt k! < (k + 1)!, denn k! := k(k − 1)!. Damit gilt k! > (k+1)!
und damit die Monotonie.
Damit haben wir gezeigt, dass die Folge streng monoton wächst und hauen jetzt noch
schnell einen Beleg für die Beschränkung der Folge nach oben raus.
Für alle n ∈ N gilt
n n n
1 1 1
sn =∑ k! = 2 + ∑ k! = 2 + ∑ 2·3·4·...·k
k=0 k=2 k=2
n ∞ ∞  k
1 1 1
≤ 2 + ∑ k−1 ≤ 2 ∑ k−1 = 2 + ∑ =3
k=2 2 k=2 2 k=1 2

Mit Lemma 1.16 auf der vorherigen Seite folgt die Konvergenz der Reihe und damit die
Existenz von e.
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 35

Wir haben in diesem Beweis zum einen die Abschätzung 2k−1 = |2 · 2 {z


· . . . · 2} ≤ 2·3·4·. . .·k
k−1 mal
und zum anderen die geometrische Reihe benutzt um die Reihe nach oben abzuschät-
zen bzw. zu begrenzen. Denn für geometrische Reihen (siehe Abschnitt »geometrische
Reihen« in Kapitel 1.2.2 auf Seite 30) gilt
 k ∞  k+1
1 ∞ 1 k 1 1
∞  
1 1 1
∑ 2 =∑ 2 = ∑
2 k=0 2
= 1
2 1− 2
= 2=1
2
k=1 k=0

Lemma 1.18 Fehlerabschätzung


Es sei
n
1
sn = ∑ k!
k=0
dann gilt für alle n ∈ N

1
0 < e − sn = ∑ <
k=n+1 nn!

Beweis
∞  
1 1 1 1
∑ = (n + 1)! 1 + n + 2 + (n + 2)(n + 3) + . . .
k=n+1 k!
k
1 2
  ∞ 
1 1 1 1
< 1+ + +... = ∑ n+2
(n + 1)! n+2 n+2 (n + 1)! k=0
†† 1 1 1 n+2 1 n+1 1
= 1
= < =
(n + 1)! 1 − n+2 (n + 1)! n + 1 (n + 1)! n nn!

Für alle die es noch nicht gemerkt haben: An der Stelle †† rechnen wir den Wert einer
geometrischen Reihe aus (siehe Abschnitt »geometrische Reihen« in Kapitel 1.2.2 auf
Seite 30).


Lemma 1.19
e ist irrational.
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 36

p
Beweis Wir nehmen zum Zecke eines Widerspruches an, es gibt eine Zerlegung e = q
mit p, q ∈ N. Nun verwenden wir die Fehlerabschätzung mit n = q und erhaltem

1 1
0 < e − sQ = ∑ <
k=q+1 k! qq!

Durch Multiplikatio mit q! erhalten wir


 
1 1 1 1 1
0 < q!e − q!sn = q!e − q! 1 + + + + . . . + <
|{z} 1! 2! 3! q! q
∈N | {z }
∈N

q!e = q! qp = (q − 1)!p ist eine natürliche Zahl, da die Multiplikation zweier natürlicher
Zahlen einen natürliche Zahl ergibt.
 
q! 1 + 1! + 2! + . . . + q! = q!1 + 1!
1 1 1 q!
+ q! q!
2! +. . .+ q! ist eine natürliche Zahl, da die Addition
von natürlichen Zahlen eine natürliche Zahl ergibt.
Subtrahiert man eine natürliche Zahl von einer natürlichen Zahl erhält man – so das
Ergebnis wie in diesem Fall positiv ist – wieder einer natürliche Zahl.
Es ergibt sich also
1
0<x< ≤ 1∧x ∈ N
q


1.2.4 Konvergenz-Kriterien und absolute Konvergenz

Satz 1.20 Cauchy-Kriterium für Reihen



Die Reihe ∑ konvergiert genau dann, wenn
k=1

m
∃ε > 0∃N ∈ N∀m ≥ n ≥ N : ∑ ak < ε

k=n

gilt.

Dieser Satz ist sehr mächtig, denn durch das Cauchy-Kriterium können wir nun eine
unendliche Reihe mit unseren Mitteln für endliche Summen untersuchen.
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 37

Beweis Die Behauptung ist äquivalent zum Cauchy-Kriterium für die Folge der Par-
tialsummen (siehe Satz 1.12 auf Seite 21).

m
‡‡
∀ε > 0∃N ∈ N∀m, n ≥ N : |sn − sn−1 | = ∑ ak < ε

k=n

Der eigentliche Beweis steckt nur in der Umformung an der Stelle ‡‡. Der Rest ist die
Definition einer Cauchy-Folge.

Lemma 1.21

Ist ∑ ak konvergent, dann gilt
k=1
lim ak = 0
k→∞

Beweis Setze im Cauchy-Kriterium m = n. 

Notwendig (aber nicht hinreichend) für die Konvergenz einer Reihe ist, dass die Glieder
eine Nullfolge bilden.

Die Folge ∑ 1 konvergiert nicht, weil (1)n keine Nullfolge ist.
k=0

1
Die Folge ( 1k ) ist eine Nullfolge, aber ∑ k = ∞ konvergiert nicht.
k=1

Definition 1.22

∑ ak heißt absolut konvergent, falls ∑∞k=1 |ak | konvergent ist.


k=1

Lemma 1.23
∞ ∞
∑ ak ist konvergent, wenn ∑ ak absolut konvergent ist.
k=1 k=1

Absolut konvergent ist also eine stärkere Aussage als konvergent, da absolut konvergent
die Konvergent mit einschließt.
Dass die Konveregenz schwächer ist als die absolute Konvergenz können wir auch an der
Dreiecksungleichung an der Stelle ∗ im folgenden Beweis sehen.
1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 38


Beweis Nach dem Cauchy-Kriterium ergibt sich aus der Konvergenz der Reihe ∑ |ak |
k=1

n m

∀ε > 0∃N ∈ N∀m, n ≥ N : ε > ∑ |ak | ≥ ∑ ak .

k=n
k=n


Wieder mit dem Cauchy-Kriterium ergibt sich daraus die Konvergenz der Reihe ∑ ak . 
k=1

Die Dreiecksungleichung an der markierten Stelle kann nur verwendet werden, da wir
nach der Anwendung des Cauchy-Kriteriums nur noch eine endliche Summe betrachten
und keine unendliche Summation in Form einer Reihe. Auf eine Reihen dürften wir die
Dreieicksungleichung nicht anwenden.
OK, wir dürfen doch. Aber erst nach dem nächsten Korollar.

Korollar 1.24 Dreieicksungleichung für unendlich viele Summanden



Konvergiert die Reihe ∑ |ak |, dann gilt
k=1

∞ ∞
∑ ≤ ∑ |ak |

k=1 k=1

Beweis Nach der Dreiecksungleichung gilt



n n
sn := ∑ ak ≤ ∑ |ak | =: Sn .

k=1 k=1

Nach Vorraussetzung sind (sn ) und (Sn ) konvergent, sodass mit Lemma 1.13 auf Seite 28
gilt
lim sn ≤ lim Sn
n→∞ n→∞


Dieser Korollar ist keine direkte Folgerung aus dem vorhergehenden Satz, sondern hätte
auch schon deutlich eher im Skript gezeigt werden können. Schließlich verwendet der
Beweis nicht das Cauchy-Kriterium, was – wie wir im obigen Satz gesehen haben – auch
gegangen wäre, sondern beruft sich auf Lemma 1.13.

Satz 1.25 Vergleichskriterium


1 Zahlenfolgen, Grenzwerte, Reihen
1.2 Undendliche Reihen 39


a) Es gelte für alle k ≥ k0 , dass |ak | ≤ ck und die Konvergenz von ∑ ck , dann gilt
k=1


∑ ak ist absolut konvergennt.
k=1


Wir nennen ∑ ck konvergente Majorante.
k=1

b) Es gelte für alle k ≥ k0 , dass ak ≥ dk ≥ 0 und die Divergenz von ∑ dk , dann gilt
k=1


∑ ak ist divergent.
k=1


Wir nennen ∑ dk divergente Minorante.
k=1

Kennen wir eine konvergente Reihe, deren Glieder stets größer sind als die einer unbe-
kannten Reihe, dann konvergiert auch die unbekannte Reihe.
Kennen wir eine divergente Reihe, deren Glieder stets kleiner sind als die einer unbe-
kannten Reihe, dann divergiert auch die unbekannte Reihe.
Wobei »stets« jeweils erst ab einem Startindex k0 gelten muss. Also erst irgendwo kurz
vor der Unendlichkeit. Die endliche Menge der ersten Glieder ist egal.

Beweis a) Für ein gegebenes ε > 0 gilt nach dem Cauchy-Kriterium



m
∃N ∈ N∀m ≥ n ≥ N ≥ k0 : ∑ ck < ε

k=n

und daraus folgt mit der Vorraussetzung |ak | < ck



m m
∑ |ak | ≤ ∑ ck < ε.

k=n k=n

Wieder mit dem Cauchy-Kriterium folgt damit die Konvergenz von ∑ ak .
k=1

b) Wir nehmen zum Zecke des Widerspruches an, ∑ ak wäre konvergent. Dann gilt mit
k=1
der Aussage aus Teil a)

∑ dk ist konvergent zur Vorraussetzung
k=1
1 Zahlenfolgen, Grenzwerte, Reihen
40

Satz 1.26 Quotientenkriterium


[—]
2 Stetigkeit und Differenzierbarkeit
2 Stetigkeit und Differenzierbarkeit 41

2 Stetigkeit und Differenzierbarkeit

2.1 Stetigkeit

2.2 Differenzierbarkeit

2.2.1 Umkehrfunktionen

Vorlesung XVII

Eher so gegen Ende. . .


Jetzt wissen wir, was eine Umkehrfunktion ist, aber blicken wir zurück auf den Namen
dieses Kapitels, dann erkennen wir schnelle, dass wir doch eigentlich ableiten wollten.
Also werden wir jetzt versuchen, eine Umkehrfunktion abzuleiten.

Satz 2.21
Sei g : I → R in einer Umgebung von x0 ∈ I stetig und streng monoton und sei weiter g
in x0 differenzierbar, sowie g0 (x0 ) 6= 0. Dann ist g−1 in y = g(x0 ) differenzierbar und hat
den Wert
1
(g−1 )0 (y) = 0 −1 .
g (g (y))

Mit diesem Satz wissen wir jetzt, dass eine Umkehrfunktion in einer Stelle x0 genau dann
dieffenzierbar ist, wenn die eigentliche Funktion folgende Eigenschaften erfüllt:
– um x0 herum stetig
– streng monoton (hier ist entweder steigend oder fallend gemeint – hauptsache streng,
denn sonst wäre die Umkehrfunktion nicht mehr eindeutig, also keine Funktion)
– in x0 differenzierbar (wenig überraschend, denn warum soll es sonst besser werden,
nur weil man die Achsen vertauscht.)
– die Ableitung an der Stelle x0 nicht 0 ist (denn sonst ist die Steigung unendlich, wenn
man die Achsen vertauscht)
Und dankenswerter Weise kennnen wir auch noch den Wert. Aber wie immer fällt der
Wert eher so nebenbei vom Himmel, während die die Differenzierbarkeit an sich die
eigentlich tolle Erkenntnis ist.
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 42

Beweis
g−1 (y) − g−1 (y0 ) †
   
−1 0 x − x0
(g ) (y0 ) = lim = lim
y→y0 y − y0 x→x0 g(x) − g(x0 )
1 1 1
= lim g(x)−g(x ) = 0 = 0
x→x0 0 g (x) g (g(y0 ))
x−x0

An der Stelle † gilt mit der Stetigkeit von g

g(x) → g(x0 ) ⇐⇒ x → x0 .

1
Der Beweis funktioniert eigentlich genau umgekehrt, denn aus der Existenz von g0 (x)
leitet sich die Existenz von (g−1 )0 (y0 ) ab.
Wenn die Existenz der Ableitung der Umkehrfunktion bereits gesichert ist, kann man der
Wert auch mit der Kettenregel bestimmen:
d d
g(g−1 (y)) = g0 (g−1 (y)) · (g−1 )0 (y)

1= y=
dy dy
1
=⇒ (g−1 )0 (y) = 0 −1
g (g (y))

Geometrisch stellt die Umkehrfunktion eine Spiegelung an der Geraden x = y dar. Bei
dieser Betrachtung verwundert es auch nicht weiter, dass man eine Tangente an eine
bestimmte Stelle des gespiegelten Graphen legen kann, wenn dies mit dem Ausgangsgra-
phen gelingt. Und wenn man eine Tangente an den Graphen legen kann, ist die Ableitung
gerade die Steigung der Tangenten.

2.2.2 Beispiele für Umkehrfunktionen

die Exponentialfunktion

Die Exponentialfunktion ist definiert durch eine unendliche Reihe



xk
f (x) = ex = ∑ .
k=0 k!

Es gilt für alle x ∈ R : f (x) > 0, denn für positive x sieht man schnell ein, dass die Reihe
positiv ist und für negative x gilt nach weiter oben bewiesenen Gesetzen
1
ex =
e−x
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 43

was also gerade der Kehrwert aus der Reihe für ein positives x ist und damit auch posi-
tiv. Weiter ist f streng monoton wachsend, denn die Ableitung der Exponentialfunktion
ist die Exponentialfunktion selber und diese ist stets größer als Null. Also existiert die
Umkehrfunktion.
Geben wir ihr noch schnell einen Namen: logarithmus naturalis:

ln : {x ∈ R | x > 0} → R.

Für unsere neue Funktion gilt

∀x ∈ R : ln ex = x
∀x > 0 :eln x = x

Bei der Betrachtung obiger Identitätsfunktionen ist die Berücksichtigung der jeweiligen
Funktions- und Wertebereiche enorm wichtig. Die Logarithmus-Funktion bilden von po-
sitiven Zahlen auf alle Zahlen ab. Die Exponentialfunktion von allen Zahlen auf positive
Zahlen. Je nach dem, wie man diese Funktionen nun verkette, erhält man eine Identität
auf allen Zahlen, oder nur auf den positiven Zahlen.
Schließlich gilt für die Ableitung der Umkehrfunktion
d 1 1
∀x > 0 : ln x = ln x =
dx e x

die allgemeine Exponentialfunktion

Die allgemeine Exponentialfunktion kann nur definiert werden für a > 0 und a 6= 1.

f : R → {x ∈ R | x > 0} mit f (x) = ax := ex ln a .

Man beachte: Jetzt ist auch die allgemeine Exponentialfunktion über Exponentialfunktion
und damit über eine unendliche Reihe definiert.
Für die Ableitung gilt
(
>0 für a > 1
f 0 (x) = ex ln a · ln a = ax · ln a
<0 für a < 1.

Wir sehen also, dass f streng monoton ist. Also existiert eine Umkehrfunktion und auch
ihr geben wir einen Namen. Wir definieren die allgemeine Logarithmusfunktion

loga x := f −1 (x).

Vorlesung XVIII
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 44

Potenzfunktion

f : {x ∈ R | x > 0} → {x ∈ R | x > 0} mit f (x) = xα := eα ln x

Für die Ableitung gilt

d α ln x α xα
f 0 (x) = e = α 1 = αxα−1 .
dx x x

Für α ∈ N schafft das keine neue Erkenntnis, aber die Erweiterung vonα auf R ist an
dieser Stelle neu. Man beachte, dass diese Erweiterung nur für den Bereich der positiven
reellen Zahlen definiert ist!
Für α 6= 0 existiert die Umkehrfunktion
1
f −1 (x) = x α .

Achtung: Für α ∈ R ist die Beschränkung auf positive relle Zahlen zwingend notwendig,
denn sonst könnte zum Beispiel gelten
2  12 1 √
−1 = (−1) 2 = (−1)2 = 12 = 1=1

Für den Spezialfall α ∈ N0 ist x ∈ R möglich und für α ∈ Z ist x ∈ R\{0} erlaubt.
Weitere Probleme ergeben sich bei Wurzeln aus negativen Zahlen. Im Reellen gilt

x = −1 ⇔ x3 = −1 ⇔ x3 + 1 = 0 ⇔ (x + 1)(x2 − x + 1) = 0.

Ist also 3 −1 = 1? Ist möglich, aber nur, solange es sich um eine Spezial-Definition der
Wurzel-Funktion handelt. Denn sonst könnte auch hier gelten

3
1 2
x = x 3 = x 6 ⇒ −1 = 1.

Wir beschränken die Definition in dieser Vorlesung also auf x > 0.

Logarithmisches Differenzieren

Für die Ableitung der Logarithmus-Funktion von einer beliebigen Funktion f gilt mit der
Ketten-Regel
d f 0 (x)
ln f (x) = .
dx f (x)
Daraus folgt unmittelbar
d
f 0 (x) = f (x) · ln f (x).
dx
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 45

Die Ableitung einer Funktion lässt sich also bestimmen, indem lediglich der Logarihtmus
der Funktion abgelitten wird.
Betrachten wir zum Beispiel die Funktion f (x) = xx für x > 0, dann gilt ganz klassisch
berechnet für die Ableitung
d d
f (x) = ex ln x = ex ln x (ln x + 1) = xx (1 + ln x).
dx dx

Mit Hilfe des logarithmischen Differenzierens ergibt sich


d d 1
ln f (x) = x ln x = 1 ln x + x = 1 + ln x.
dx dx x
Damit gilt für die Ableitung also
d
f 0 (x) = f (x) ln f (x) = xx (1 + ln x).
dx

Zyklometrische oder Arcus-Funktionen


 
Die Funktion f (x) = sin(x) ist auf dem Intervall − Π2 , Π2 streng monoton wachsend und
besitzt daher eine Umkehrfunktion. Geben wir auch dieser Umkehrfunktion einen Namen
und definieren den arcus sinus
x = arcsin y :⇔ y = sin x.
 
−1 Π Π
f : [−1, 1] → − , , x 7→ arcsin x
2 2

Geometrisch handelt es sich bei der Umkehrfunktion noch immer um eine Spiegelung an
der y = x Achse.
f (x) sin x
arcsin x
Π
2

x
− Π2 −1 1 Π
2

−1

− Π2
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 46

Für die Ableitung ergibt sich


d 1 ‡ 1 1
arcsin x = =p =√ für x ∈ (−1, 1)
dx cos(arcsin(x)) 1 − (sin(arcsin x))2 1 − x2

An der Stelle
 Π ‡Πdürfen
 wir quadrieren und die Wurzel ziehen, denn arcsin bildet auf das
Intervall − 2 , 2 ab und der cos ist in diesem Intervall immer echt größer Null.
Der arccos wird völlig analog zum arcsin definiert. Allerdings natürlich über einem ent-
sprechenden Intervall auf dem arccos streng monoton wachsend ist.
Betrachten wir zum Abschluss die Tangens-Funktion. Die Funktion f (x) = tan x ist auf
dem Intervall (− Π2 , Π2 ) streng monoton wachsend. Es existiert also auch hier eine Um-
kehrfunktion, die wir analog arcus tangens nennen
Π Π
arctan : R → (− , ), x 7→ f −1 (x).
2 2

Geometrisch ergibt sich auch hier eine Spiegelung an der y = x Achse.


f (x) tan x
arctan x

Für die Ableitung gilt


d 1 1
arctan x = 2
= .
dx 1 + (tan(arctan x)) 1 + x2
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 47

2.2.3 schwierige Grenzwerte mit De L’Hospital

In diesem Abschnitt werden wir zunächst den Mittelwertsatz in eine etwas allgemeinere
Form bringen und den allgemeinen Mittelwertsatz dann für die Regel von De L’Hospital
verwenden. Diese vielen aus der Schule bekannte Regel hilft uns weiter, wenn bei der
Grenzwertbildung » 00 « oder » ∞
∞ « entsteht. Haben wir diese Probleme bisher immer gelöst,
indem die Funktion solange umgeformt wurde (zum Beispiel mit Polinomdivision) bis ein
»echter« Grenzwert entstand, werden wir jetzt sehen, wie uns die Ableitung der Funktion
schneller zum Ziel führen kann.

Satz 2.22 Verallgemeinerung des Mittelwertsatzes


Es seien f , g : [a, b] → R zwei auf dem Intervall (a, b) stetige und differenizierbare Funk-
tionen, wobei gelte
∀x ∈ (a, b) : g0 (x) 6= 0.
Dann gilt
f 0 (ξ ) f (b) − f (a)
∃ξ : = .
g0 (ξ ) g(b) − g(a)

Bemerkung 1. Die Nenner beider Brüche werden nicht 0. Links trivial, rechts gege-
ben durch Anwendung des Mittelwertsatzes auf g

g(b) − g(a)
∃ξ = g0 (ξ ) 6= 0.
b−a

2. Der Mittelwertsatz ist ein Spezialfall mit g(x) = x.


3. Die Verallgemeinerung ist nicht trivial durch Anwendung des Mittelwertsatzes auf f
unf g zu erhalten.
f (b)− f (a)
f 0 (ξ ) b−a f (b) − f (a)
∃ξ , ζ : 0 = = .
g (ζ ) g(b)−g(a) g(b) − g(a)
b−a

Die Verallgemeinerung besagt, dass ξ = ζ gilt.

Beweis Wir betrachten zunächst die Hildfunktion F : [a, b] → R mit

f (b) − f (a)
F(x) = f (x) − g(x).
g(b) − g(a)

Es gilt
f (b) − f (a)
F(b) − F(a) = f (b) − f (a) − (g(b) − g(a)) = 0.
g(b) − g(a)
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 48

Mit dem Satz von Rolle [verweis] (»Mittelwertsatz für gleiche Randwerte erzwingt Exis-
tenz einer Nullstelle«) folgt

f (b) − f (a) 0
∃ξ 0 = F(ξ ) = f 0 (ξ ) − g (ξ ).
g(b) − g(a)


Satz 2.23 Regel von De L’Hospital (1661–1704)


Es seien f , g : (a, b) → R zwei differenzierbare Funktionen und es gelte

∀x ∈ (a, b) : g0 (x) 6= 0

und
lim f (x) = lim g(x) = 0 (oder ∞).
x→b− x→b−

Dann gilt (wobei c ∈ R ∪ {∞, −∞})

f 0 (x) f (x)
lim = c =⇒ lim = c.
x→b− g0 (x) x→b− g(x)

Der Satz ist analog für x → a+ möglich.

Beweis Der Beweis wird hier nur für » 00 « durchgeführt. Der Beweis für » ∞

« verläuft
analog, ist nur technisch etwas aufwändiger.
Wir setzen zunächst f und g auf [a, b] stetig fort, indem wir definieren

f (b) := 0 und g(b) := 0.

Nun betrachten wir ein beliebiges x ∈ (a, b). Nach dem allgemeinen Mittelwertsatz exis-
tiert ein ξ ∈ (a, b) mit
f 0 (ξ ) f (x) − f (b) f (x)
0
= = .
g (ξ ) g(x) − g(b) g(x)
Bilden wir nun den Grenzwert x → b−, so erhalten wir die Behauptung

f 0 (ξ ) f (x) − f (b) f (x)


c = lim 0 = lim = lim .
x→b− g (ξ ) x→b− g(x) − g(b) x→b− g(x)

Am Ende des Beweises haben wir auf der linken Seite durch den allgemeinen Mittelwert-
satz die Existenz eines Wertes
f 0 (ξ )
c = lim 0
x→b− g (ξ )
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 49

gegeben, der auf rechten Seite durch unsere stetige Fortsetzung von f und g genau dem
Ziel der Berechnung
f (x)
lim
x→b− g(x)
entspricht.

Beispiel
x3 + x2 + x − 3 0
1. lim 2
= » « =?
x→1 3x + x − 4 0

3x2 + 2x + 1 6 x3 + x2 + x − 3 6
lim = ⇒ =
x→1 6x + 1 7 3x2 + x − 4 7

Diese Berechnung ist auch ohne die Regel von De L’Hospital sehr einfach durchzu-
führen. Durch Anwendung der Polinomdivision kann man den Bruch um x − 1 kürzen
und erhält
x3 + x2 + x − 3 x2 + 2x + 3 12 + 2 · 1 + 3 6
lim = lim = =
x→1 3x2 + x − 4 x→1 3x + 4 3·1+4 7

Die Regel von De L’Hospital darf nur verwendet werden, wenn die Vorraussetzungen
erfüllt sind. An diesem Beispiel sehen wir
6x + 2 8 4 6 4 0
lim = = 6= , denn 6= » «
x→1 6 6 3 7 3 0

sin x § cos x
2. lim = lim =1
x→0 x →0 1
Die Gleichheit an der Stelle § gilt nur, da der Grenzwert auf der rechten Seite tat-
sächlich existiert. Wenn der Grenzwert der Ableitungen nicht dfiniert ist, dann hat die
Regel von De L’Hospital keine Aussage. In diesem Fall kann der eigentliche Grenzwert
durchaus definiert sein.

Vorlesung XIX

Weitere Anwendungsmöglichkeiten der Regel von De L’Hospital


1. Typ »0 · ∞«: f (x) · g(x)
f (x) g(x)
f (x)g(x) = 1
= 1
g(x) f (x)

Damit ist der nicht direkt definierte Fall wieder auf die Fälle » 00 « bzw. » ∞
∞ « zu-
rückgeführt.
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 50

2. Typ »∞ − ∞«: f (x) − g(x)


 
1 1
f (x) − g(x) = f (x)g(x) −
g(x) f (x)
1 1
g(x) − f (x)
= 1
f (x)g(x)

3. Typ »1∞ «: f (x)g()x


g(x) )
f (x)g(x) = eln( f (x) = eg(x) ln( f (x))

Das ist jetzt wieder der Fall »0 · ∞«.


Die e-Funktion ist stetig!

Beispiel
1 x
 
lim 1 +
x→∞ x
Das Problem: Die Basis geht gegen 1 und der Exponent gegen ∞. Es kann also alles
mögliche passieren.

1 x
 
1
lim 1 + = lim ex ln(1+ x )
x→∞ x x→∞
¶ 1
= elimx→∞ x ln(1+ x )
x
limx→∞ 1 ln(1+ 1x )
limx→∞
ln(1+ 1x ) 1
=e =e x

An der Stelle ¶ haben wir die Stetigkeit der Exponentialfunktion verwendet! Denn nur
dann können wir den Limes in den Exponenten hineinziehen.
Wir haben jetzt beide Möglichkeiten aufgeschrieben, die nach obigen Umformungsregeln
mit De L’Hospital gelöst werden können. Wir entscheiden und für die zweite Variante, da
hier einfacher Zähler und Nenner getrennt voneinander abgelitten werden können. Wir
verwenden also den Fall, wo Zähler und Nenner gegen Null gehen.

− 12
limx→∞ x 
1
1+ 1x
( ) − 12 limx→∞
1+ 1x
=e x =e = e1 = e
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 51

Da am Ende der Grenzwert des Quotienten der Ableitungen von Zähler und Nenner
existiert, gilt die Gleichheit und wir erhalten einen Wert für den gesuchten Grenzwert.
Liefert Beweis von Satz 1.33
 
n 1
 
Yn limn→∞ Yn ln 1+ n
lim 1 + =e Yn
n→∞ n
n
= elimn→∞ Yn falls →∞
Yn

2.2.4 Abschätzung von Funktionswachstum

Definition 2.24 Landau-Symbole (1877–1938)


Sei a ∈ R ∪ {∞, −∞} und f und g Funktionen in Umgebung von a (ggf. einseitig).
Dann gilt f (x) = O(g(x)) für x → a per Definition genau dann, wenn

∀x aus der Umgebung von a ∃C > 0 : | f (x)| ≤ C|g(x)|.

Die schwächere Aussage


f (x)
lim ≤ C
x→a g(x)

ist oft anschaulicher, als obige Definition. In dieser Aussage muss aber ein Grenzwert
existieren. In der Definition muss die Funktion f nur immer nach oben beschränkt sein.
Weiter gilt f (x) = o(g(x)) für x → a per Definition genau dann, wenn

f (x)
lim =0
x→a g(x)

Beispiel
Sei n für die folgenden Beispiele fest, aber sehr groß.
1.
xn nxn−1 n!
lim x
= lim x
= lim = . . . = lim x = 0
x→∞ e x→∞ e x→∞ x→∞ e

De L’Hospital wurde n-mal angewendet, bis der Quotient aus einer Konstante und
∞ besteht. Dann darf De L’Hospital nicht nochmal verwendet werden. Aber dann
wissen wir, dass der Quotient gegen 0 strebt.
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 52

1
ln x x n
2. lim √n
= lim 1 = lim 1 = 0
x→∞ x x→∞ 1 x n −1 x→∞ x n
n
Dass heißt also
1
∀n ∈ N : xn = o(ex ) für x → ∞, ln x = o(x n ) für x → ∞.

2.2.5 Approximation durch Polynome

Funktionen lassen sich approximieren in Umgebung eines Punktes x0 durch eine konstante
Funktion (Polynom nullten Gerades).

f (x) ≈ p0 (x) := f (x0 )

Sehr schnell ist die Approximation ungenau. Man kann die Umgebung, in der die Ap-
proximation gut funktioniert erweitern, indem man die Tangente im Punkt x0 verwendet
(Polynom ersten Gerades).

f (x) ≈ p1 (x) := f (x0 ) + f 0 (x0 )(x − x0 )

Nun stimmen im Punkt x0 der Wert und die Ableitung von Funktion und Näherung
überein.
Das war jetzt alles noch nicht so spannend. Der geneigte Leser sollte was wiedererkannt
haben. Also versuchen wir nun, eine Näherung zu finden, die sich noch besser an unse-
re Funktion anschmiegt. Versuchen wir es mal mit einer Parabel, also einem Polynom
zweiten Gerades.
f (x) ≈ p2 (x)
Fesetzsetzung der Freiheistgerade des Polynoms zweiten Gerades.
– f (x0 ) = p2 (x0 )
– f 0 (x0 ) = p02 (x0 )
– f 00 (x0 ) = p002 (x0 )
Wir sehen also, je mehr Freiheitsgerade des Polynoms, desto besser wird die Approxi-
mation. Der Satz von Taylor hilft uns bei der Approximation durch ein Polybom n-ten
Gerades.

Satz 2.25 Satz von Taylor


Es sei eine Funktion f : I → R gegeben, die (n + 1)-mal differenzierbar in I sei. Weiter
sei ein Entwicklungspunkt xo ∈ I gegeben.
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 53

Dann gilt für alle x ∈ I

f 0 (x0 ) f 00 (x) f (n) (x0 )


f (x) = f (x0 ) + (x − x0 ) + (x − x0 )2 + . . . + (x − x0 )n + Rn (x)
1! 2! n!
n
f (k) (x0 )
= ∑ (x − x0 )k + Rn (x)
k=0 k!

Wir bezeichnen das Polynom als Taylor-Polynom n-ten Gerades Tn (x, x0 , f ) = Tn (x) und
Rn (x) als Restglied.
Dabei hat das (Lagrange’sche) Restglied mit einem von x abhängigen δ ∈ (0, 1) die
Form
f (n+1) (x0 + δ (x − x0 ))
Rn (x) = (x − x0 )n+1
(n + 1)!

Das Taylor-Polynom ist so gestylt, dass es im Punkt x0 mit der Funktion übereinstimmt.
Für das Restglied im Punkte x0 gilt also

Rn (x0 ) = 0.

Beispielhaft n = 0:

f (x) = T0 (x) + Rn (x)


f 0 (x0 + δ (x − x0 ))
= f (x0 ) + (x − x0 )
1!

x6=x0 f (x) − f (x0 )


⇔ = f 0 (x0 + δ (x − x0 )) = f 0 (ξ )
x − x0

Das ist genau der Mittelwertsatz!

x0 + δ (x − x0 )

x x0

x0 + δ (x − x0 )

x0 x

x0 + δ (x − x0 ) bezeichnet irgendeinen Punkt zwischen x und x0 . Dabei ist es gleich, ob


x links oder rechts von x0 liegt.
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 54

Andere Darstellung der Taylor-Formel


n
f (k) (x) k f ( n + 1)(ξ ) n+1
f (x + h) = ∑ h + h
h=0 k! (n + 1)!

Wobei ξ zwischen x und x + h. (Beide Fälle h positiv oder negativ.)

Vorlesung XX

Beweis Die Funktion f lebt auf dem Intervall I nach Definition im obigen Satz.
Wir bterachten in I die (n + 1)-mal differenzierbare Hilfsfunktion
f 0 (x0 )
ϕ(x) := f (x) − Tn (x) = f (x) − f (x0 ) − (x − x0 )
1!
f 00 (x0 ) f (n)
− (x − x0 )2 − . . . − (x − x0 )n .
2! n!
Es gilt 0 = ϕ(x0 ) = ϕ 0 (x0 ) = ϕ 00 (x0 ) = . . . = ϕ (n) (x0 ).
Das Taylor-Polynom stimmt also in allen ersten n Ableitungen mit der Funktion überein.

ϕ(x0 ) = f (x0 ) − Tn (x0 )


f 0 (x0 )
= f (x0 ) − f (x0 ) − (x0 − x0 )
1!
f 00 (x0 ) f (n) (x0 )
− (x0 − x0 )2 − . . . − (x0 − x0 )n = 0
2! n!
ϕ 0 (x0 ) = f 0 (x0 ) − Tn0 (x0 )
f 0 (x0 ) 2 f 00 (x0 ) n f (n) (x0 )
= f 0 (x0 ) − − (x0 − x0 ) − . . . − (x0 − x0 )n−1 = 0
1! 2! n!
ϕ 00 (x0 ) = f 00 (x0 ) − Tn00 (x0 )
00 2 f 00 (x0 ) 6 f (3) (x0 ) n(n − 1) f (n) (x0 )
= f (x0 ) − − (x0 − x0 ) − . . . − x0 − x0 )n−2 = 0
2! 6! (

Weiter gilt für die (n + 1)-te Ableitung ϕ (n+1) (x) = f (n+1) .


Für ψ(x) = (x − x0 )n+1 gilt

0 = ψ(x0 ) = ψ 0 (x0 ) = . . . = ψ (n) (x0 ), ψ (n+1) (x) = (n + 1)!

Jetzt wollen wir den verallgemeinerten Mittelwertsatz auf diese wunderschönen, gerade
vom Himmel gefallenen Funktionen loslassen.
f (a) − f (b) f 0 (ξ )
∃ξ : = 0
g(a) − g(b) g (ξ )
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 55

(n+1)-malige Anwendung des verallgemeinerten Mittelwersatzes. Es gelte 0 < δ1 , δ2 , . . . , δn <


1.
ϕ(x) ϕ(x) − ϕ(x0 ) ϕ 0 (x + δ1 (x − x0 )) − ϕ 0 (x)
= = 0
ψ(x) ψ(x) − ψ(x0 ) ψ (x0 + δ (x − x0 )) − ψ 0 (x0 )
ϕ 00 (x0 + δ 1δ 2(x − x0 )) − ϕ 00 (x)
= 00
ψ (x0 + δ1 δ2 (x − x0 )) − ψ 00 (x0 )
ϕ (n+1)(x0 +δ1 δ2 ...δn (x−x0 ))
= ... =
(n + 1)!

In jedem Schritt wird jeweils im Zähler und im Nenner −0 ergänzt. Denn wir haben ja
gesehen, dass die Werte der ersten n Ableitungen von ϕ und ψ von x0 genau 0 sind.
Wir lösen jetzt die Gleichung nach ϕ(x) auf.

f (n+1) (ξ )
ϕ(x) = ψ(x) = Rn (x)
(n + 1)!

Am Ende verkürzen wir einfach ein wenig und nennen die Stelle zwischen x und x0 einfach
mal anders.
ξ = x0 + δ1 δ2 . . . δn (x − x0 )

Nur zur Information: Das Restglied Rn (x) lässt sich auch in Integral-Form darstellen.
Z x
1
Rn (x) = (x − t)n f (n+1) (t)dt
n! x0

Beispiel

1. Schießen wir zunächst mit Kanonen auf Spatzen und bilden ein Taylor-Polynom
von einem Polynom.
f (x) = x3 + x2 mit x0 = 1
f (1) = 2, f 0 (1) = 5, f 00 (1) = 8, f 000 (1) = 6, ∀k ≥ 4 : f (k) (1) = 0

T0 (x) = 2
T1 (x) = 2 + 5(x − 1) = 5x − 3
T2 (x) = 2 + 5(x − 1) + 4(x − 1)2
T3 (x) = 2 + 5(x − 1) + 4(x − 1)2 + (x − 1)3
= T4 (x) = T5 (x) = . . . = Tn (x) = f (x)
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 56

Wenn ich also ein Taylorpolynom für ein Polynom entwickle, dann bricht die En-
wicklung gerade beim Polynom selber ab.
2. Betrachten wir nun eine interessantere Funktion: f (x) = ex , xx = 0, f (k) (x) = ex ⇒
f (k) (0) = 1(∀k ∈ N).

f (x) = Tn (x) +Rn (x)


n
1 eξ
= ∑ k! xk +
(n + 1)!
xn+1
k=0


xn+1 −→ ∞ (für festes x)
(n + 1)! n→∞

Korollar 2.26
Sei f : I → R beliebig oft diefferenzierbar und x0 ∈ I. Für x ∈ I gelte Rn (x) −→ 0. Dann
n→∞
gilt

f (k) (x0 )
f (x) = ∑ (x − x0 )k .
k=0 k!
Die Taylor-Reihe stellt also die Ausgangsfunktion selber dar.

Beispiel

3. f (x) = sin x, x0 = 0

d n+1 sin xn+1


Rn (x) = n+1
(ξ ) −→ 0
dx
| {z } (n + 1)! n→∞
| · |≤1


x2k+1 x3 x5
∀x ∈ R : sin x = ∑ (−1)k (2k + 1)!
= x− +
6 120
±...
k=0

An dieser Stelle sehen wir die exakte Definition der Sinus-Funktion über eine un-
endliche Reihe. In dieser Vorlesung wurde der Sinus aber etwas anschaulicher über
seine geometrische Funktion eingeführt.
4. Analog für den Kosinus.

x2k x2 x4
∀x ∈ R : cos x = ∑ (−1)k (2k)!
= 1− + ±...
2 24
k=0
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 57

f (x)
T1 (x) T5 (x) T9 (x) T13 (x)
sin x

T3 (x) T7 (x) T11 (x)

5. f (x) = ln(x + 1), x0 = 0


1
f 0 (x) =
x+1
(−1)k+1 (k − 1)!
f (k) (x) = für k ≥ 1
(x + 1)k

d n+1 ln(x + 1) xn+1


Rn (x) =
dxn+1 (n + 1)!
n+2
(−1) n! x n+1
=
(ξ + 1)n+1 (n + 1)!
(−1)n xn+1
= −→ 0 falls 0 ≤ x ≤ 1
(n + 1)(ξ + 1)n+1 n→∞

blöd toll

x0 = 0 ξ ξ +1 x ξ +1

Für positive x sehen wir direkt an der Skizze, dass wir für x ≤ 1 immer im tollen
Bereich landen. Wir lassen ähnliches für negative x einfach analog vom Himmel
fallsen und kommen zu folgender Aussage.
Für −1 ≤ x ≤ 1 gilt
x2 x3 x4 x5
ln(x + 1) = x − + − + ±...
2 3 4 5
1 1 1 1
ln 2 = 1 − + − + ± . . .
2 3 4 5

Bis jetzt galt immer Rn (x) −→ 0, sodass wir die Funktion durch die unendliche
n→∞
Taylor-Reihe ausdrücken konnten. Kommen wir jetzt zu einem Beispiel, bei dem das
nicht funktioniniert. Es handelt sich also wirklich um eine notwendige Bedingung.
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 58

( 1

e x2 für x 6= 0
6. f (x) =
0 für x = 0

Eigentlich ist diese Funktion langweilig, denn für Entwicklungen in allen Punkten
außer im Nullpunkt geht das Restglied gegen 0. Also betrachten wir die Entwick-
lung für x0 = 0.

Für alle x außer 0 gilt für die Ableitungen


1

0 2e x2
f (x) =
x3
1 1
− −
00 4e x2 6e x2
f (x) = − 4
x6 x
1 1 1
− − −
8e x2 36e x2 24e x2
f (3) (x) = − +
x9 x7 x5
1 1 1 1
− − − −
(4) 16e x2 144e x2 300e x2 120e x2
f (x) = − + −
x12 x10 x8 x6
1 1 1 1 1
− − − − −
(5) 32e x2 480e x2 2040e x2 2640e x2 720e x2
f (x) = − + − +
x15 x13 x11 x9 x7

f (x)
1

x
−3 −2 −1 0 1 2 3

In der Skizze können wir sehen, dass sich der Graph um 0 herum ganz wunderbar an
die X-Achse anschmiegt. (Achtung: Es handelt sich um eine Exponentialfunktion,
daher sind selbstverständlich alle Werte > 0!) Daher schmiegen sich auch alle
Ableitungen um 0 herum an die X-Achse an.

Vorlesung XXI
2 Stetigkeit und Differenzierbarkeit
2.2 Differenzierbarkeit 59

Allgemein gilt für die erste Ableitung


 1
e− x2 2 für x 6= 0
0 x3 
f (x) = 1 
limh→0 1 e− h2 − 0 = limy→∞ y
2 =0 für x = 0
h ey

Die Substitution von 1h durch y betrachtet nur den Fall, dass h von rechts gegen 0
geht. Für den anderen Fall müsste y → −∞ betrachtet werden, aber das Ergebnis
ist analog 0.

  1

 x46 − x64 e x2
 für x 6= 0
f 00 (x) =  −1
2

1 2e h
limh→0 h

h3
−0 = 0 für x = 0

Für einzelne Ableitungen könnte man das jetzt beliebig fortsetzen, aber um all-
gemeinere Aussagen zu treffen, braucht es einen allgemeinen Beweis, dass die
Ableitungen an der Stelle 0 immer 0 sind.
Allgemein zeigt man mit vollständiger Induktion:
−1
(
(k) x−3k e x2 ∑2k−2
j=0 a j x
2j für x 6= 0 und gewisse a j
f (x) =
0 für x = 0

Der Beweis ist eine langweilige vollständige Induktion. Mit sowas halten wir uns
hier jetzt nicht auf. . .
f ist beliebig oft differenzierbar und alle Ableitungen f (k) im Punkte 0 sind 0. Für
das Taylorpolynom Tn (x) folgert

∀x ∈ R∀n ∈ N0 : Tn (x) = 0.

Hier geht also alles schief. Die Taylor-Reihe ist immer 0 und die Funktion ist nur im
Punkt 0 genau 0. Woran liegts? Der Rest Rn (x) geht nicht gegen 0! Im Gegenteil,
er besteht aus der kompletten Funktion.
Die Funktion ist zwar beliebig oft differenzierbar, aber sie ist nicht analytisch (auch
polymorph genannt). Darauf gehen wir aber nicht näher ein. Wichtig ist nur, sie
macht alles kaputt, da der Rest nicht gegen 0 geht, da die Ableitungen sehr groß
werden.
2 Stetigkeit und Differenzierbarkeit
2.3 Konvexität 60

2.3 Konvexität

Definition 2.27
Sei I ein Intervall; die Funktion f : I → R heißt konvex auf I, falls ∀x, x1 , x2 ∈ I und
x1 < x < x2 gilt
x2 − x x − x1
f (x) ≤ f (x1 ) + f (x2 ). (∗)
x2 − x1 x2 − x1
– Gilt in (∗) »≤« heißt f konvex.
– Gilt in (∗) »<« heißt f streng konvex.
– Gilt in (∗) »≥« heißt f konkarv.
– Gilt in (∗) »>« heißt f streng konkarv.

Im Gegensatz zur punktwiesen Definition von Differenzierbarkeit und Stetigkeit ist die
Konvexität auf einem Intervall und nicht in einem Punkt definiert.

f (x)

f (x2 )

f (x1 )
f (x)
x
x1 x x2

In dem Bereich zwischen x1 und x2 muss der Funktionswert immer kleiner sein als der
Wert der Geradengleichung (∗) der Sekanten.
Für x1 < x2 gilt λ x1 + (1 − λ )x2 ist
– x1 für λ = 1
– x2 für λ = 0
– Punkt zwischen x1 und x2 für 0 < λ < 1
– Punkt rechts von x2 für λ < 0
– Punkt links von x1 für λ > 1
2 Stetigkeit und Differenzierbarkeit
2.3 Konvexität 61

Auch allgemein für Vektoren x1 , x2 und 0 < λ < 1 heißt λ x1 + (1 − λ )x2 konvexe Line-
arkombination von x1 und x2 . Dass heißt für die Ungleichung (∗)

(∗) ⇐⇒ ∀x1 , x2 ∈ I und ∀0 < λ < 1 : f (λ x1 + (1 − λ )x2 ) ≤ λ f (x1 ) + (1 − λ ) f (x2 )

Weitere Schreibweisen der gleichen Aussage:

∀x1 , x2 ∈ I und ∀0 < α, β < 1 und α + β = 1 : f (αx1 + β x2 ) ≤ α f (x1 ) + β f (x2 )


αx1 + β x2 α β
∀x1 , x2 ∈ I und ∀0 < α, β < 1 : f( )≤ f (x1 ) + f (x2 )
α +β α +β α +β

Lemma 2.28
f ist auf I konvex genau dann, wenn gilt

f (x) − f (x1 ) f (x2 ) − f (x)


∀x, x1 , x2 ∈ I mit x1 < x < x2 : ≤ (∗∗)
x − x1 x2 − x
genau dann, wenn gilt

f (x) − f (x1 ) f (x2 ) − f (x1 ) f (x2 ) − f (x)


∀x, x1 , x2 ∈ I mit x1 < x < x2 : ≤ ≤ . (∗ ∗ ∗)
x − x1 x2 − x1 x2 − x

Beweis Folgt jeweils sofort mit (∗), wenn man zusammenfasst zu f (x) ≤ . . . 

Satz 2.29 Konvexitätskriterium


Die Funktion f sei in dem abgeschlossenen Intervall [a, b] stetig und im offenen Intervall
(a, b) differenzierbar. Dann gilt f ist konvex in [a, b] genau dann, wenn f 0 monoton
wachsend in (a, b).

Beweis Wir zeigen zunächst die Hinrichtung (»Aus der Konvexität folgt die Mono-
tonie der Ableitung«). Seien dazu a < x1 < x2 < b. Für alle x mit x1 < x < x2 gilt dann
(∗ ∗ ∗), also auch

k f (x) − f (x1 ) f (x2 ) − f (x1 ) f (x2 ) − f (x) ∗∗ 0


f 0 (x1 ) = lim ≤ ≤ lim = f (x2 )
x→x1 + x − x1 x2 − x1 x→x2 − x2 − x

An den Stellen k und ∗∗ benutzen wir, dass die Ableitung f 0 für x1 und x2 existiert!
Auf der rechten Seite der Ungleichung existiert kein x. Daher ändert sich auf der Seite
nichrs, wenn x → x1 geht.
2 Stetigkeit und Differenzierbarkeit
2.3 Konvexität 62

Es gilt also f 0 (x1 ) ≤ f 0 (x2 ). Damit ist f 0 monoton wachsend.


Für die Rückrichtung (»Aus der Monotonie der Ableitung folgt die Konvexität«) seien
x1 < x < x2 beliebig in [a, b].
f (x)− f (x1 )
Nach dem Mittelwertsatz [Verweis] existiert ein ξ1 ∈ (x1 , x) mit x−x1 = f 0 (ξ1 ) und
ein ξ2 ∈ (x, x2 ) mit f (xx22)−
−x
f (x)
= f 0 (ξ2 ). Dass heißt ξ1 < ξ2 und daraus folgert auch f 0 (ξ1 ) ≤
f !(ξ2 ), denn die Ableitung ist monoton wachsend. Das ist direkt (∗∗) aus dem Lemma.


Auch wenn wir jetzt teilweise nur konvex betrachtet haben, geht das alles genau so durch
für streng konvex, konkarv und streng konkarv. Im folgenden Korollar taucht das wieder
auf.

Korollar 2.30
Sei f stetig in abgeschlossenen Intervall [a, b] und im offenen Intervall (a, b) zweimal
differenzierbar. Dann gilt
a) f ist konvex genau dann, wenn f 00 (x) ≥ 0∀x ∈ (a, b)
b) f ist streng konvex, wenn f 00 (x) > 0∀x ∈ (a, b)

Achtung: In b) gilt nur ein »wenn« und kein »genau dann, wenn«. Wir dürfen also nur
von der zweiten Ableitung auf die strenge Konvexität schließen.

Beweis a) folgt direkt aus Satz 2.29 auf der vorherigen Seite und Korollar 2.18 e)
[verweis]
b) nach a) ist f konvex.
Angenommen es gelte ∀x ∈ (a, b) : f 00 (x) > 0, aber f wäre nicht streng konvex, dann
existieren x, x1 , x2 mit Gleichheit in (∗). Nach Beweis von Satz 2.29 auf der vorherigen
Seite gilt f 0 (ξ1 ) = f 0 (ξ2 ). Mit dem Satz von Rolle (»Mittelwertsatz für gleiche Rand-
werte erzwingt Existenz einer Nullstelle«) [Verweis] folgt daraus, dass es ξ1 < η < ξ2
mit f 00 (η) = 0 gibt. Das ist ein Wiederspruch zur Annahme.


Wir wissen implizit, dass es umgekehrt auch mit der (strengen) Konkarvität funktio-
niert.

Beispiel

1. f (x) = ex ist streng konvex auf R, denn f 00 (x) = ex > 0.


2. f (x) = ln x für x > 0 ist streng konkarv für alle x, denn f 00 (x) = − x12 < 0.
2 Stetigkeit und Differenzierbarkeit
2.3 Konvexität 63

3. Betrachten wir die Ableitungen zu f (x) = xP .


Wir betrachten xP für ein reelles P, daher kann x nur positive Werte annehmen,
damit die Funktion definiert ist. Wir betrachten die Funktion also nur auf dem
Definitionsbereich [0, ∞).

(
PxP−1 für p 6= 0
f 0 (x) =
0 für p = 0
(
P(P − 1)xP−2 für P 6= 0 und P 6= 1
f 00 (x) =
0 sonst

Also ist f streng konkarv auf (0, ∞) für 0 < P < 1 und streng konvex für P < 0
oder P > 1. Im Fall P = 0 ( f (x) = 1) und P = 1 ( f (x) = x) betrachten wir eine
Gerade und die ist konvex und konkarv, aber nicht streng.
4. Die Betragsfunktion f (x) = |x| ist konvex, denn »nach oben offen«, aber nicht
streng, denn wenn x1 , x2 > 0 oder x1 , x2 < 0 liegt die Sekante genau auf dem
Graphen. Allerdings ist die Betragsfunktion nicht differenzierbar, also funktioniert
die Argumentation über die Ableitungen nicht.
f (x) f (x)

f (x2 ) f (x2 )
f (x1 ) f (x)
f (x) f (x1 )
x x
x1 x x2 x1 x x2

Vorlesung XXII

Korollar 2.31
Die Funktion f sei differenzierbar auf dem Intervall I. f ist konvex genau dann, wenn f
oberhalb jeder Tangente liegt. In Formeln heißt das

∀a, x ∈ I : f (x) ≥ f (a) + f 0 (a)(x − a)

Wir sehen auch hier wieder: Die Tangentengleichung der Funktion f im Punkt a ent-
spricht genau dem Taylor-Polynom erster Ordnung der Funktion f entwickelt im Punkt
a.
2 Stetigkeit und Differenzierbarkeit
2.3 Konvexität 64

Beweis Wir beginnen mit der Hinrichtung (»Wenn f konkarv ist, dann liegt f ober-
halb jeder Tangenten«): Für alle a, x ∈ I gilt nach dem Mittelwertsatz (bzw. der Taylor-
Formel für n = 0)

∃ξ zwischen a und x mit f (x) = f (a) + f 0 (ξ )(x − a).

Mit Satz 2.29 auf Seite 61 gilt

f 0 (ξ ) ≥ f 0 (a) falls x > a


f 0 (ξ ) ≤ f 0 (a) falls x < a

und damit folgt die Behauptung.


Für die Rückrichtung (»Wenn f oberhalb jeder Tangenten liegt, dann ist f konkarv.«)
seien x1 < a < x2 (x1 , x2 , a ∈ I), dann gilt nach der Tangentenbedingung

f (x1 ) − f (a) f (x1 ) − f (a)


≤ f 0 (a) ≤
x1 − a x1 − a
und das ist gerade (∗∗) aus Lemma 2.28 auf Seite 61 und damit folgt die Behauptung. 

Definition 2.32
Sei die Funktion f : (a, b) → R stetig. Ein Punkt (x0 , f (x0 )) heißt Wendepunkt von f ,
wenn Intervalle (α, x0 ), (x0 , β ) ⊂ (a, b) existieren, sodass
f konvex in (α, x0 ) und konkarv in (x0 , β )
oder
f konkarv in (α, x0 ) und konvex in (x0 , β ).

f (x)

x
α x0 β

Die Definition des Wendepunktes erfolgte nur über konvex und konkarv, aber nicht streng
konvex oder streng konkarv. Also ist auf einer Geraden jeder Punkt Wendepunkt. Das
ist eventuell manchmal etwas unpraktisch. Ersetzt man das »oder« durch ein »entweder
. . . oder«, dann ist der Fall ausgeschlossen.
2 Stetigkeit und Differenzierbarkeit
2.3 Konvexität 65

Lemma 2.33
Die Funktion f sei zweimal stetig differenzierbar in (a, b). Dann hat f in (x0 , f (x0 ))
einen Wendepunkt genau dann, wenn (entweder) i) oder ii) gilt.
i) f 00 (x) ≥ 0 in (α, x0 ),
f 00 (x) ≤ 0 in (x0 , β )
ii) f 00 (x) ≤ 0 in (α, x0 ),
f 00 (x) ≥ 0 in (x0 , β )
Hinreichende Bedingung: Wenn die Funktion f in der Umgebung von x0 dreimal stetif
differenzierbar ist und f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0 gilt, dann hat f einen Wendepunkt in
(x0 , f (x0 )).
Bei der hinreichenden Bedingung gilt nur die Implikation. Es gibt durchaus Wendepunkte,
bei denen die Bedingung nicht gilt, aber immer wenn die Bedingung gilt, dannn liegt ein
Wendepunkt vor.

Beweis Die Aussage folgt direkt aus Korollar 2.30 auf Seite 62. 

Satz 2.34 Ungleichung von Jensen (1859–1925)


Sei die Funktion f : I → R konvex und es seien λ1 , λ2 , . . . , λn > 0 mit
n
∑ λk = 1
k=1

dann gilt für alle x1 , x2 , . . . , xn ∈ I


!
n n
f ∑ λk xk ≤ ∑ λk f (xk ).
k=1 k=1

Ist f eine streng konvexe Funktion, dann gilt die Gleichheit nur, wenn x1 = x2 = . . . =
xn .
Der Satz gilt analog für »≥« und »konkarv«.

Ist f linear im Sinne von f (x) = ax, dann gilt als wichtigste Eigenschaft der linea-
ren Funktionen f (x + y) = f (x) + f (y). Für lineare Funktionen gilt im Satz immer die
Gleichheit.

Beweis Wir zeigen die Aussage durch vollständige Induktion.


Induktionsanfang Für n = 1 erhalten wir die Identität.
2 Stetigkeit und Differenzierbarkeit
2.3 Konvexität 66

Zur reinen Illustration betrachten wir n = 2. Wir erhalten genau die Definition der Kon-
vexität. Die Ungleichung von Jensen überträgt diese Ungleichung nun auf mehr als zwei
Punkte.
Induktionsvorraussetzung
!
n n
f ∑ λk xk ≤ ∑ λk f (xk )
k=1 k=1

Induktionsschritt
! !
n+1 n
λk
f ∑ λk xk ≤f λn+1 xn+1 + (1 − λn+1 ) ∑ xk
k=1 k=1 1 − λn+1
!
n
λ
≤ λn+1 f (xn+1 ) + (1 − λn+1 ) f ∑ 1 − λkn+1 xk
k=1
†† n
λk
≤ λn+1 f (xn+1 ) + (1 − λn+1 ) ∑ f (xk )
k=1 1 − λn+1


An der Stelle †† wurde die Induktionsvorraussetzung verwendet. Das ist erlaubt, denn
es gilt
n
λ 1
∑ 1 − λkn+1 = 1 − λn+1 (1 − λn+1) = 1
k=1

Beispiel
Als typisches Beispiel für die Anwendung der Jensen-Ungleichung betrachten wir die
Funktion f (x) = ln x für x > 0. Dann gilt für alle xk > 0 und λk > 0 mit
n
∑ λk = 1
k=1

gilt ! !
n ‡‡ n n

ln ∑ λk xk ≥ ∑ λk ln xk = ln ∏ xkλk .
k=1 k=1 k=1
Mit der Monotonie der Logarithmus-Funktion folgt
n n
∑ λk xk ≥ ∏ xkλk .
k=1 k=1

Betrachten wir nun den Spezialfall λ1 = λ2 = . . . = λn = 1n , dann gilt


1 n √
∑ xk ≥ n
x1 x2 . . . xn .
n k=1 | {z }
| {z } geometrisches Mittel
arithmetisches Mittel
2 Stetigkeit und Differenzierbarkeit
67

Die Gleichheit in obiger Ungleichung gilt genau dann, wenn x1 = x2 = . . . = xn .

An der Stelle ‡‡ wurde die Jensen-Ungleichung angewendet. An der Stelle ∗ hingegen


wurden spezielle Eigenschaften der Logarithmus-Funktion verwendet.
3 Differenzialrechnung in Rn
3 Differenzialrechnung in Rn 68

3 Differenzialrechnung in Rn

3.1 Funktionalanalytische Grundlagen

3.1.1 Motivation

Wir definieren zunächst Vektoren als Spaltenvektoren, einfach weil das in dieser Vorle-
sung praktischer ist.
x = (x1 , x2 , . . . , xn ) ∈ Rn
Und jetzt kommt das neue: Auch Funktionen können ein Vektor sein.

f : Ω → Rm mit Ω ⊆ Rm

Wie funktioniert das jetzt? Naja, wir haben sehr viele Funktionen in einer einzigen.

f(x) = f(x1 , x2 , . . . , xn ) = ( f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn ))

Spannender sind aber einige Spezialfälle von diesem allgemeinem Fall.


1. n = 1: f : Ω → Rm , Ω ⊆ R1 .
Beispiele:
f(t) = (cost, sint) (m = 2) 0 ≤ t < 2Π

Die Funktionen ist eine Kurve im R2


y
1

x
−1 1

−1
3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 69

f(t) = (cost, sint,t) (m = 3) t ∈ R

Diese Funktion ist ebenfalls eine Kurve, aber im R3 . Da zwei Teile der Funktion iden-
tisch mit obiger Funktion sind, sieht die Kurve ähnlich aus, steigt aber in der dritten
Dimension auf und es entsteht eine Spirale.
2. m = 1: f : Ω → R1 , Ω ⊆ Rn
Beispiele
f (x1 , x2 ) = x12 + x22 »Skalarenfeld«
Wir schreiben im dem Fall auch z = f (x, y). Dabei sind x und y beide aus dem Defini-
tionsbereich und z aus dem Wertebereich.

3.1.2 metrische Räume

Vorlesung XXIII

Wir betrachten jetzt Funktionen f : Ω → R1 , Ω ⊆ R2 mit zwei Parametern der Bauart


z = f (x, y).
Wir brauchen zunächst neue Definitionen für Konvergenz, Stetigkeit und Differenzier-
barkeit.

Definition 3.1 metrische Räume


Sei E 6= 0/ eine Menge. Eine Abbildung ρ : E × EρR heißt Metrik oder Abstand auf E,
falls für alle x, y, z ∈ E gilt
a) ρ(x, y) = 0 ⇐⇒ x = y
Der Abstand zu sich selbst ist Null.
b) ρ(x, y) = ρ(y, x)
Der Abstand ist symmetrisch.
c) ρ(x, y) ≤ ρ(x, z) + ρ(z, y)
Der Abstand erfüllt die Dreiecksungleichung.
Das Paar (E, ρ) heißt metrischer Raum.

Beispiel
3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 70

a) Es sei E die Menge der Bushaltestellen in Lübeck. Weiter sei ρ(x, y) die kürzeste
Fahrstrecke zwischen x und y.
Die Symmetrie ist nur erfüllt, wenn wir davon ausgehen, dass der Bus für den Rückweg
den gleichen Weg fährt, wie für den Hinweg. Einbahnstraßen machen diese Annahme
in der Regel kaputt.
b) E sei beleibig und ρ die »triviale« Metrik
(
1 für x 6= y
ρ(x, y) =
0 für x = y

Die triviale Metrik taugt natürlich für sehr wenige Anwendungen. Aber mit dieser
Metrik kann man jede Menge in einen metrischen Raum verwandeln.
c) Es sei E = R oder E = C und ρ(x, y) = |x − y|.
Für diese Metrik müssen jetzt tatsächlich Elemente der Menge E her, die man ad-
dieren kann. Für die bisherigen Beispiele waren die Elemente der Menge nicht mal
Zahlen. Wir werden sehen, dass man viele Dinge definieren kann nur mit Hilfe eines
metrischen Raumes. Wir befreien uns also von dem Ballast der ganzen Zahlentheorie
und bauen nur auf der Definition der Metrik auf.

Lemma 3.2
Es sei (E, ρ) ein metrischer Raum, dann gilt für alle x, y ∈ E

ρ(x, y) ≤ 0.

Beweis
a) c) b)
0 = ρ(x, y) ≤ ρ(x, y) + ρ(y, x) = 2ρ(x, y)

Definition 3.3
Es sei ein metrischer Raum (E, ρ) gegeben.
a) M ⊆ E heißt offen, falls

∀x ∈ M ∃ε > 0 : Uε (x) := {y ∈ E | ρ(y, x) < ε} ⊆ M


3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 71

Wir haben hier noch mal eben schnell die ε-Umgebung Uε (x) für allgemeine metri-
schen Räume übertragen. Das ist genauso, wie wir das mit Zahlen schon kennen,
aber jetzt braucht es nur noch einen metrischen Raum.
Die Definition der offenen Menge M funktioniert sehr analog zum offenen Intervall
auf einer Zahlengeraden. Ich finde zu jedem x – und liege es noch so Dicht an der
Grenze der Menge – noch eine Menge mit einem Abstand ξ drumherum, sodass die
ganze Menge noch in M liegt. Auf der Zahlengeraden finde ich zu jeder Zahl – und
liege sie noch so dicht an der Intervallgrenze – noch eine Zahl, die dichter an der
Kante liegt, also eine ε-Umgebung drumherum.
b) M ⊆ E heißt abgeschlossen, falls E\M offen ist.
c) Es sei eine Menge M ⊆ E gegeben. Dann heißt x ∈ M innerer Punkt von M, falls

∃ε > 0 : Uε (x) ⊆ M.

Offene Mengen bestehen nur aus inneren Punkten. Wir hätten die Definition also
anders herum aufeinander Aufbauen können.
d) Ein Punkt y ∈ M heißt Randpunkt von M ⊆ M, falls

∀ε > 0 ∃a ∈ M, b ∈ E\M : a, b ∈ Uε (y)

Ein Randpunkt hat also in seiner ε-Umgebung – und sei diese noch so klein – immer
Elemente aus der Menge und Elemente, die nicht in der Menge sind.
Die Menge aller Randpunkte ∂ M heißt Rand von M.
e) x ∈ M heißt isolierter Punkt von M, falls

∃ε > 0 : Uε (x) ∩ M = {x}.

f) y ∈ E heißt Berührungspunkt von M, dalls

∀ε > 0 ∃a ∈ M : a ∈ Uε (y).

Die Menge M selber besteht nur aus Berührungspunkten von M, denn alle Punkte in
der Menge berühren natürlich die Menge.
Die Menge aller Berührungspunkte M heißt abgeschlossene Hülle von M.
Die abgeschlossenen Hülle von M sind also alle Punkten aus M und alle Punkten, die
M berühren.
3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 72

g) Ein Punkt x ∈ E heißt Häufungspunkt von M, falls

∀ε > 0 ∃ unendlich viele y ∈ M ∩Uε (x).

Im Gegensatz zum Häufungspunkt einer Folge müssen es hier unendlich viele ver-
schiedene y ∈ M sein.

Lemma 3.4
Es sei ein metrischer Raum (E, ρ) gegeben. Dann gilt
a) E ist offen und abgeschlossen.
Es gibt nur Punkte aus E, also sind alle Punkte auch in E.
0/ ist offen und abgeschlossen.
Also ist die Gesamtemenge der reellen Zahlen eine offene und abgeschlossene Menge.
b) Der Durchschnitt endlich vieler offener Mengen ist offen. (Gilt im allgemeinen nicht
für unendlich viele Mengen.)
c) Die Vereinigung beliebig vieler offener Mengen ist offen.
d) offen ←→ abgeschlossen
Vereinigung ←→ Durchschnitt
Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen. (Gilt im
allgemeinen nicht für unendlich viele Mengen.)
Der Durchscnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen.

Beweis a) folgt sofort aus der Definition.


b) Übungsaufgabe
c) Übungsaufgabe
d) Übungsaufgabe
1 
Gegenbeispiel für d) n , 1 für n ∈ N, n ≥ 1

[
= (0, 1]
n=2


3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 73

Definition 3.5 Konvergenz in einem metrischen Raum


Es sei (E, ρ) ein metrischer Raum und die Folge (xk )k ⊂ E heißt konvergent gegen a ∈ E,
falls
∀ε > 0 ∃N = N(ε) ∀k ≥ N : ρ(xk , a) < ε.

Equivalent kann man natürlich auch sagen

∀ε > 0 ∃N = N(ε) ∀k ≥ N : xk ∈ Uε (a).

3.1.3 normierte Räume

Definition 3.6
Es sei E ein reeller oder komplexer Vektorraum.
k · k : E → R heißt Norm, falls für alle x, y ∈ E und alle λ ∈ R(λ ∈ C) gilt
a) kxk = 0 ⇒ x = 0 (Definitheit)
b) kλ xk = |λ |kxk
c) kx + yk ≤ kxk + kyk
Das Paar (E, k · k) heißt normierter Raum.

Lemma 3.7
Sei (E, k · k) ein normierter Raum. Dann gilt
1) x = 0 → kxk = 0
2) ∀x ∈ E : kxk ≥ 0
3) ∀x, y ∈ E : ρ(x, y) := kx − yk ist eine Metrik auf E.

Beweis 1) Setze in Definition 3.6 b) λ = 0.


2) 0 = kx − xk ≤ kxk + k − xk = 2kxk
3) a) kx − yk = 0 ⇔ x = y
b) kx − yk = ky − xk
c) kx − yk ≤ ky − zk + kz − yk

3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 74

Beispiel

1) E = Rn , Cn
n
kxk1 = ∑ |x j | (Manhatten-Norm)
j=1
s
n
kxk2 = ∑ |x j |2 (euklidische Norm)
j=1
!1
n p
p
∀1 ≤ p < ∞ : kxk p = ∑ |x j | (p-Norm)
j=1

kxk∞ = max |x j | ∞-Norm


j=1,...,n

Minkowski-Ungleichung für 1 ≤ p ≤ ∞:

kx + yk p ≤ kxk p + kyk p

2) C([a, b]) ist der Vektorraum der auf [a, b] stetigen Funktionen.

– Die Nullfunktion ist offensichtlich immer enthalten.


– Man kann Funktionen addieren und erhält neue Funktionen.
– Man kann Funktionen mit Skalaren multiplizieren und erhält neue Funktionen.

k f k = max | f (x)|
x∈[a,b]
k f + gk = max | f (x) + g(x)| ≤ max | f (x)| + max |g(x)|
x∈[a,b] x∈[a,b] x∈[a,b]

Vorlesung XXIV

Nochmal eben zur Erinnerung: Wie funktionieren Durchschnitt und Vereinigung?

[
x∈ M j ⇐⇒ ∃ j ∈ J mit x ∈ M j
j∈J
\
x∈ M j ⇐⇒ ∀ j ∈ J mit x ∈ M j
j∈J
3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 75

3.1.4 Konvergenz von Vektoren

Nachdem wir für metrische Räume die Konvergenz bereits definiert haben (s. Definiti-
on 3.5 auf Seite 73), bleibt die Frage, wie Konvergenzen von Vektoren (also im nor-
mierten Raum) funktionieren. Die Definition steht, aber es fehlt noch der Griff zum
Anfassen. . .

Satz 3.8 Komponentenweise Konvergenz


Die Folge (xk )k ⊂ Rn mit Normabstand kx − yk konvergiert gegen a ∈ Rn genau dann,
wenn
∀ j = 1, . . . , n : lim xkj = a j .
k→∞

xkj ist die j-te Komponente des k−ten Vektors der Folge. Hier steht keine Potenz!

Bemerkung Die Aussage des Satzes hängt von der Wahl der Norm ab.
Man kann aber zeigen, dass sie davon unabhängig ist: Denn für alle Normen k · kα , k · kβ
eines n-dimensionalen normierten Raumes E gilt

∃C1 ,C2 > 0 ∀x ∈ E : C1 kxkα ≤ kxkβ ≤ C2 kxkα .

In einem endlich dimensionalen Vektorraum sind alle Normen irgendwie gleich. Man
kann immer nur von der Norm abhängige Konstanten finden, sodass man die Normen
ineinander »umrechnen« kann.
Beispiel Die Maximum-Norm und die Summen-Norm (1-Norm, Manhatten-Norm),
denn
1kxk∞ ≤ kxk1 ≤ nkxk∞ .

Im dreidimensionalen Raum unterscheiden sich die 1-Norm und die ∞-Norm also nur
maximal um den Faktor 3. Aber wir sehen, dass der Faktor von n abhängt. Im unendlich
dimensionalen Vektorraum funktioniert diese Äquivalenz also nicht mehr.

Beweis Da wir gerade gesehen (wenn auch nicht bewiesen) haben, dass die Normen
alle äauivalent sind, zeigen wir den Satz nur mit der 1-Norm.
Für die Hinrichtung (»Wenn die Folge der Vektoren konvergiert, dann konvergieren auch
die Folgen der Komponenten.«) gilt zunächst

∀ε > 0 ∃N ∀k ≥ N : kxk − ak1 ≤ ε.


3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 76

Daraus folgt
∀ j = 1, . . . , n ∀k ≥ N : |xkj − a j | ≤ kxk − ak1 < ε
dass heißt ∀ j = 1, . . . , n : lim xkj = a j .
k→∞
Für die Rückrichtung (»Wenn die Folgen der Komponenten konvergieren, dann konver-
giert auch die Folge der Vektoren.«) gilt zunächst
∀ j : lim xkj = a j .
k→∞
Daraus folgt
ε
∀ε > 0 ∃N j ∀k ≥ N j |xkj − a j | <
n

Wir haben eine endliche Anzahl an N j . Genau genommen sind es genau n Stück, denn
wir betrachten n-dimensionale Vektorräume.
Mit N := max{N j | j = 1, . . . , n} gilt für alle k ≥ N:
n n
ε
kxk − ak1 = ∑ |xkj − a j | < ∑ n = ε.
j=1 j=1

3.1.5 Stetigkeit von Funktionen

Definition 3.9
Seien (D, d) und (E, ρ) metrische Räume. Weiter sei die Funktion f : D → E gegeben
und a ∈ D, sowie b ∈ E.

E
f
b
D
a

a) Wir sagen lim f (x) = b genau dann, wenn


x→a

∀(xk ) ⊂ D mit lim xk = a gilt lim lim f (xk ) = b.


x→∞ x→∞ k→∞

b) f heißt in a stetig, falls


lim f (x) = f (b).
x→a
3 Differenzialrechnung in Rn
3.1 Funktionalanalytische Grundlagen 77

Wir haben also jetzt Grenzwerte und Stetigkeit von Funktionen auf beliebigen metrischen
Räumen definiert. Die Funktion f kann also aus einer Menge Äpfel in eine Mengen Birnen
abbilden, solange zwischen den Äpfen und zwischen den Birnen ein Abstand definiert
ist.
Auch hier haben wir jetzt eine Definition, aber es fehlt irgendwie noch ein Satz, um das
ganze in den Griff zu bekommen. . .

Satz 3.10 ε-δ -Kriterium der Stetigkeit


Es seien (D, d) und (E, ρ) metrische Räume und f : D → E eine Funktion. Dann ist f
in a ∈ D stetig genau dann, wenn

∀ε > 0 ∃δ > 0 : (∀x ∈ D mit d(x, a) < δ ⇒ ρ( f (x), f (a)) < ε)

E
f
b
D
a
f

Für jede ε -Umgebung muss eine δ -Umgebung existieren, sodass alles aus der δ -
Umgebung nach transformation durch f in der ε-Umgebung liegt. Die Zeichnung im-
pliziert einen geometrischen Abstand. Der Satz isz natürlich nicht darauf beschränkt.
Es könnte sich auch um den Preisabstand von Birnen handeln. Das zeichnet sich nur
schlechter.

Beweis Wir beginnen mit der Hinrichtung (»Aus der Stetigkeit folgt das ε-δ -Kriterium.«).
Angenommen das ε-δ -Kriterium ist nicht erfüllt. Dass heißt
∃ε > 0∀δ > 0∃z ∈ D mit der Aussage

d(z, a) < δ und ρ( f (z), f (a)) ≥ ε.

Da dass für alle δ funktioniert, nehmen wir einfach mal δ = 1n .


Für δ := 1n ∃Zn ∈ D mit

1
d(zn , a) < und ρ( f (zn ), f (a)) ≥ ε.
n
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 78

Damit ergibt sich


lim zn = a und lim f (z) 6= f (a)
n→∞ n→∞

Damit haben wir ein Widerspruch erzeugt, denn wir gehen davon aus, dass f stetig ist.
Jetzt haben wir aber gezeigt, dass f nicht stetig ist.
Für die Rückrichtung (»Aus dem ε-δ -Kriterium folgt die Konvergenz«) sei die Folge
(xn ) ⊂ D so gewählt, dass
lim xn = a.
n→∞

Wir müssen jetzt zeigen, dass f (xn ) für n → ∞ gegen f (a) konvergiert.
Wegen xn → a existiert ein N mit

∀n ≥ N gilt d(xn , a) < δ .

Nach dem ε-δ -Kriterium gilt ρ( f (xn ), f (x)) < ε für alle n ≥ N. Damit gilt

lim f (xn ) = f (a).


n→∞

3.2 Reellwertige Funktionen mehrerer reeller


Vektorräume
Würden hier komplexe Funktionswerte stehen, würde das wenig ändern. Betrachtet man
aber komplexe Vektorräume, dann wird alles anders und vor allem komplizierter.

• Rn sei ein normierter Raum mit Norm k · k


• Ω ⊂ Rn heißt Gebiet, falls
– Ω ist eine offene Menge.
– Für alle x, y ∈ Ω existiert eine stetige Funktion g : [0, 1] → Ω mit g(0) = x und
g(1) = y
Für ein Gebiet müssen wir uns nur vorstellen, dass die Menge nur aus einem
»Klumpen« besteht und nicht aus mehreren nicht zusammenhängeneden Teilen.
• Sei f : Ω → R, wobei Ω meistens ein Gebiet.
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 79

Definition 3.11
Sei c ∈ R. Dann heißt
Nc = {x ∈ Ω | f (x) = c}
Niveau-Menge von f zum Niveau c.

Beispiel

a) z = f (x, y) = x2 + y2 mit Ω = R2
y

x
5 3
 
Niveau-Mengen auf den Niveaus 1, f 4 und f 2 .

b) Ebene z = f (x, y) = 2x + 3y mit Ω = R2


y

Niveau-Mengen auf den Niveaus −1, − 23 , − 13 , 0, 12 , 2


3 und 3
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 80

3y + 2x = c
2 c
y = − x+
3 3

Beispiele für stetige Funktionen

1. Projektionen ∀x ∈ Rn : p : Rn → R1 , p j (x) = x j sind stetig, denn

lim p j (x) = lim x j = a j = p j (a).


x→a x→a

2. Summen und Produkte stetiger Funktionen sind stetig. (Beweis wie im Eindimensio-
nalen)
Eigentlich soll da stehen: Wenn zwei Funktionen in einem Punkt stetig ist, dann ist
auch die Summe der Funktionen bzw. das Produkt der Funktionen in diesem Punkt
stetig.
Lineare Funktionen
n
l(x) = ∑ b j x j = x · bT = b · xT
j=1

sind stetig.
 
b1
b2 
x · bT = (x1 , x2 , . . . , xn ) ·  .. 
 
.
bn

3. Polynome in n Variablen vom Grad m


m m m
p(x) = p(x1 , x2 , . . . , xn ) = ∑ ∑ ... ∑ ad1,d2,...,dn x1d1 x2d2 . . . xndn
d1 =0 d2 =0 dn =0

sind stetige Funktionen.


Polynome sind Linearkombinationen der simpelsten Porjektionen und damit auch ste-
tig.

p(x) = ad xd mit kdk∞ ≤ m


3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 81

Erstmal ist ein Vektor hoch ein Vektor nicht erklärt und damit mathematischer Unsinn.
An dieser Stelle ist eine Abkürzung der obigen Schreibweise gemeit.
Falls kdk1 ≤ m, dann hat das Polynom nicht nur den Grad m, sondern auch den Total-
Grad m.

Beispiel Polynome mit n = 2


Das Polynom
p(x, y) = 5 + 7x1 + 3y1
hat den Grad und den Total-Grad 1.
Das Polynom
p(x, y) = 5 + 7x1 + 3y1 + 6x1 y1
hat den Grad 1, aber den Total-Grad 2.
Das Polynom
p(x, y) = 5 + 7x1 + 3y1 + 6x1 y1 + 4x2 + 3y2
hat den Grad 2 und den Total-Grad 2.
Das Polynom

p(x, y) = 5 + 7x1 + 3y1 + 6x1 y1 + 4x2 + 3y2 + 11x2 y − 3xy2

hat den Grad 2 und den Total-Grad 3.

Beispiel Stetigkeit eines multivariablen Polynoms


Betrachten wir die Funktion
f : R2 → R
mit
2xy2
(
x2 +y4
falls x2 + y2 > 0
f (x, y) =
0 falls x2 + y2 = 0

Die Stelle x2 + y2 = 0 ist der Gerade der Ursprung x = y = 0. An dieser Stelle passiert
irgendwie was spannendes. Wir werden also jetzt versuchen, was passiert, wenn x und y
gegen 0 gehen.
Wir betrachten zunächst g1 (x) = f (x, 0).
Wir setzen also einfach y = 0 und können dann eine Funktion in Abhängigkeit von einer
Variablen x betrachten.

∀x ∈ R : g1 (x) = 0
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 82

Betrachten wir nun g2 (y) = f (0, y).

∀y ∈ R : g2 (y) = 0

Man könnte jetzt meinen, damit sei der Grenzwert bestimmt.


Betrachten wir jetzt
∀t ∈ R : g3 (t) = f (t 2 ,t)
( 2
2t
= 1 falls t 6= 0
g3 (t) = 2t 4
0 falls t = 0

Der Graph einer multivariablen Funktion ist im Prinzip ein »fliegender Teppich«, der über
der x, y-Ebene schwebt. Je nach Funktionswert hat der Teppich einen anderen Abstand
zur Ebene.

z = f (x, y) y
g2 (y) = 0
g3 (t) = 1

g1 (x) = 0
x

Betrachten wir die Lage der Graphen von g1 , g2 und g3 auf dem Teppich, so sehen wir,
dass alle Graphen über dem Urpsrung der Ebene vorbeikommen, aber unterschiedliche
Funktionswerte haben.
Wir sehen also, dass der »fliegende Teppich« im Nullpuntk ein Loch hat, denn überall
auf der Parabel hat er die Höhe 1 und im Urpsrung die Höhe 0. Die Funktion f kann
daher nicht stetig sein.

Vorlesung XXV

Satz 3.12
Sei Ω ⊂ Rn beschränkt und abgeschlossen.
Also quasi die Entsprechung eines abgeschlossenen Intervalls im Eindimensionalen.
Weiter sei f : Ω → R stetig. Dann nimmt f auf Ω Minimum und Maximum an. In
Formeln heißt das
∃a, b ∈ Ω ∀x ∈ Ω : f (a) ≤ f (x) ≤ f (b).
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 83

Wir haben also ein Minimum (und nicht nur ein Infimum) und ein Maximum (und nicht
nur ein Supremum).

Betrachten wir zwei disjunkte Mengen A und A


B, sodass für alle x ∈ A stets f (x) = 1 und für f (x) = 1
alle x ∈ B stets f (x) = 2 gilt. Sei nun Ω = A ∪ B
die Vereinigung beider Mengen. f nimmt nun
tatsächlich das Minimum 1 und das Maximum
2 an. Allerdings werden keine Werte zwischen B
1 und 2 angenommen, denn die Vereinigung ist f (x) = 2
kein Gebiet, sondern besteht aus zwei disjunk-
ten Mengen A und B.
Falls f : Ω → R stetig ist auf einem Gebiet Ω und a, b ∈ Ω sind, dann gilt für alle c mit
f (a) ≤ c ≤ f (b) mit dem Ziwschenwertsatz die Aussage

∃x ∈ Ω : f (c) = c.

Das ist kein Satz und wird nicht bewiesen! Das steht hier einfach nur mal so.

3.2.1 partielle Ableitung

Jetzt kommen wir endlich zur Differenzierbarkeit von mutlivariablen Funktionen. Dabei
stellt sich als erstes mal, wie man denn nun eigentlich eine Tangente an einen »fliegenden
Teppich« legt. Solange man sich nicht auf eine eindimensionale Teilmenge des Teppichs
beschränkt, kann die Tangente in jede Richtung zeigen.

Definition 3.13 Differenzierbarkeit


Sei Ω ein Gebiet , f : Ω → R eine Funktion und a ∈ Ω fest. Dann heißt

x j 7→ f (a1 , a2 , . . . , a j−1 , x j , a j+1 , . . . , an )

partielle Funktion von f .


Diese Funktion ist eine gewöhnliche eindimensionale Funktion. Die können wir auch
ableiten.
Hat diese Funktion in x j = a j eine Ableitung, so nennen wir das die partielle Ableitung
von f nach x j in a.
Wir schreiben
∂ f (x) ∂f
= (a) = fx j (a) = ∂ j f (a).
∂ x j x=a ∂ x j

3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 84

Analog schreiben wir für höhere Ableitungen

∂2 f
fx1 ,x2 = = ∂1 ∂2 f .
∂ x1 ∂ x2

Äquivalente Definition:

∂f 1 
(a) = lim f (a1 , . . . , a j−1 , a j + h, a j+1 , . . . , an ) − f (a) .
∂xj h→0 h

Wir schreiben kürzer


1 
f (a + he j ) − f (a)
∂ j f (a) = lim
h→0 h
wobei e j der j-te Einheitsvektor mit 1 genau an der Stelle j und sonst 0 sei.
f heißt partiell differenzierbar, wenn alle n partiellen Ableitungen existieren.

Jetzt können wir zumindestens entlang der Achsen im Koordinaten-System Tangenten


anlegen und entsprechend nach den verschiedenen Variablen ableiten. Es bleibt aber die
Frage, was denn mit Tangenten ist, die nicht entlang der Achsen verlaufen.
Wir können also schon mal fragem wie schräg der »fliegende Teppich« entlang der
x- und y-Achsen steht, aber nicht, wie schräg der Teppich zum Beispiel entlang der
Winkelhalbierenden von x- und y-Achse steht.

Beispiel
Die Funktion
f (x, y) = xex+y
ist partiell differenzierbar.

fx (x, y) = ∂1 f (x, y) = (1 + x)ex+y


fy (x, y) = ∂2 f (x, y) = xex+y
fx,y (x, y) = ∂2 ∂1 f (x, y) = (1 + x)ex+y
fy,x (x, y) = ∂1 ∂2 f (x, y) = (1 + x)ex+y
fx,x (x, y) = (2 + x)ex+y
fy,y (x, y) = xex+y

Wir verallgemeinern das Konzept der partiellen Ableitungen nun zu einer Richtungs-
ableitung. Wir werden sehen, dass die partiellen Ableitungen Richtungsableitungen in
Richtung der Einheitsvektoren sind.
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 85

Definition 3.14 Richtungsableitung


Sei Ω ein Gebiet, f : Ω → Rm, a ∈ Ω fest und v 6= 0 beliebiger Vektor in Rn mit kvk2 = 1.
Existiert der Grenzwert
1
∂x f (a) = lim ( f (a + hv) − f (a))
h→0 h

so heißt er »Richtungsableitung« von f in a in Richtung v.


Wir sagen auch » f ist in a in Richtung v differenzierbar«.

Wichtig an dieser Definition ist die Normierung der Länge des Vektors auf die Länge 1.
Sonst erhält man für unterschiedlich lange Vektor natürlich ganz andere Differenzen.
Anschaulich: ϕ(t) := a + f v mit t ∈ R stellt geometrisch eine Gerade im Rn dar.
Die Funktion fa,v (t) = f ◦ ϕ(t) = f (a + tv) hat eine Veränderliche t ∈ R. Für die Rich-
tungsableitung ergibt sich
0
∂v f (a) = fa,v (0) (∗)

Lemma 3.15

a) f −→ ∂v f (a) ist linear in f .


b) Produktregel: ∂v ( f · g)(a) = f (a)∂v g(a) + g(a)∂v f (a)

Beweis a) Folgt sofort aus (∗).


b) ∂v ( f · g)(a) = ( f · g)0a,v (0) = ( fa,v · ga,v )0 (0) = fa,v (0)g0a,v (0) + fa,v
0 (0)g (0)
a,v

Wir wollen zwar verstehe, dass man die Ableitung in jede Richtung bestimmen kann.
Wichtig sind aber vor allem die partiellen Ableitungen. Die Richtungsableitungen werden
wir als Linearkombination der partuellen Ableitungen verstehen.

Definition 3.16 gradient


Sei Ω ⊂ Rn ein Gebiet, f : Ω → R partiell differenzierbar. Der Vektor
grad f (x) = (∂1 f (x), ∂2 f (x), . . . , ∂n f (x))
heißt Gradient von f im Punkt x ∈ Ω.

∇ := (∂1 , ∂2 , . . . , ∂n )
heißt Nabla-Operator. Dass heißt
∇ f := (∂1 f , ∂2 f , . . . , ∂n f ) .
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 86

Vorlesung XXVI

Beispiel

q
f (x1 , x2 ) = x12 + x22
xk
∀k ∈ {1, 2} : ∂k f (x1 , x2 ) = q
x12 + x22
 

grad f (x1 , x2 ) =  q
x1
,q
x2 = q 1 (x1 , x2 )
x12 + x22 x12 + x22 x12 + x22

Vektoriell aufgeschrieben gilt analog

x = (x1 , x2 )
f (x) = kxk2
1
∇ f (x) = x
kxk2

Der Gradient der 2-Norm im zweidimentionalen ist also der Vektor selber normiert auf
die Länge 1.

f (x1 , x2 )

x
x2

x1

Wir sehen die Niveau-Mengen p (»Höhenlinien«)


p auf den Niveaus 1/2, 3/4, 1, 5/4 und 3/2
und den Gradienten im Punkt ( 9/8, 9/8, 3/2) als Vektor der Länge 1 in Richtung des
steilsten Anstiegs1 , also genau konzentrisch von der Mitte weg.

Satz 3.17 Satz von Schwarz


Hermann Aramandus Schwarz, 1843–1921
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 87

Sei ein Gebiet Ω ⊆ Rn und eine Funktion f : Ω → R gegeben. Weiter sei f zweimal stetig
partiell differenzierbar, d. h. für alle 1 ≤ p, q ≤ n existiert eine partielle Ableitung ∂ p ∂q f
und sind stetig in x0 . Dann gilt

∂ p ∂q f (x0 ) = ∂q ∂ p f (x0 )

Beweis Um den Beweis technisch zu vereinfachen erfolgt der Beweis ohne Beinträch-
tigung der Allgemeinheit für n = 2.
Sei (x0 , y0 ) ∈ Ω und t so klein, dass das Quadrat Q mit den Ecken (x0 , y0 ), (x0 , y0 +t), (x0 +
t, y0 ) und (x0 + t, y0 + t) ganz in Ω liege.

(x0 , y0 + t) (x, y0 + t) (x0 + t, y0 + t)

(x0 , y0 ) (x, y0 ) (x0 + t, y0 )

Für den Beweis bilden wir jetzt zwei Hilfsfunktionen

g(x) = f (x, y0 + t) − f (x, y0 )


g0 (x) = fx (x, y0 + t) − fx (x, y0 ) (∗)
h(t) = f (x0 + t, y0 + t) − f (x0 + t, y0 ) − f (x0 , y0 + t) + f (x0 , y0 )
MWS
= g(x0 + t) − g(x0 ) = g0 (ξ1 )t

Denn nach dem Mittelwertsatz [Verweis] existiert ein ξ1 mit x0 < ξ1 < x0 + t.
Wir haben hier den Mittelwertsatz in X-Richtung angewandt.

(∗)
= ( fk (ξ1 , y0 + t) − fk (ξ1 , y0 ))t
MWS
= ( fx,y (ξ1 , η1 ))t 2

Denn nach Mittelwertsatz [Verweis] existiert ebenfalls ein η1 mit y0 < η1 < y0 + t.
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 88

Jetzt haben wir den Mittelwertsatz zum zweiten Mal, aber jetzt in Y -Richtung ange-
wandt.
Symmetrisch analog kann die Rolle von x und y vertauscht werden:

h(t) = fy,x (ξ2 , η2 )t 2 , (ξ2 , η2 ) ∈ Q

Wir betrachten jetzt den Grenzübergang t → 0.


Was apssiert, wenn dieses Quadrat nun auf einen einzigen Punkt zusammenschrumpft.
Dann müssen noch immer die Punkte (ξ1 , η1 ) und (ξ2 , η2 ) im Quadrat liegen, nur dass
das Quadrat jetzt ein Punkt ist.

lim h(t) = fx,y (x0 , y0 ) = fy,x (x0 , y0 )


t→0

In den meisten Fällen sind die zweiten partiellen Ableitungen auch stetig, sodass man
davon ausgehen kann, dass die Reihenfolge der Ableitungen egal ist. Man kann aber auch
recht einfach kompliziertere Funktionen aufstellen, bei denen das nicht funktioniert.

3.2.2 totale Ableitung

Mit den partiellen Ableitungen kann man die eindimensionale Ableitung nicht so richtig
ins multivariable Übertragen, da man immer nur die Ableitung in eine Richtung erhält.
Wir werden dieses Problem jetzt umgehen, indem wir sehr kanonisch die eindimensionale
Ableitung ins multivairable übetragen.
Zur Erinnerung: für Ω ⊆ R1 , f : Ω → R ist differenzierbar in x0 ∈ Ω, falls
1
lim ( f (x0 + h) − f (x0 ))
h→0 h

exsitiert.
Wir schreiben diese Definition jetzt ein wenig um, sodass eine Form entsteht, die sich
deutlich besser ins Multivariable überführen lässt.
Äquivalent ist die Aussage
1
( f (x0 + h) − f (x0 )) = a + r1 (x0 , h) mit r1 (x0 , h) = o(1) für h → 0
h

Wenn wir also so ein a finden, dass diese Aussage gilt, dann ist a = f 0 (x0 ). Wenn h
gegen 0 geht, soll der Rest möglichst klein werden, denn genau dass verlangt o(1).
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 89

Weiter umgebaut ist die Aussage äquivalent zu

f (x0 + h) = f (x0 ) + ha + r(x0 , h) mit r(x0 , h) = o(h) für h → 0

In dieser Form bedeutet die Aussage, f kann in Umgebung von x0 durch lineare Funktion
f (x0 ) + ha approximiert werden und es ist a = f 0 (x0 ). Diese Form ist in das Mehrdimen-
sionale übertragbar.

Definition 3.18 totale Ableitung


Es sei Ω ⊂ Rn und f : Ω → Rm und xo ∈ Ω sei ein innerer Punkt.
f heißt (total) differenzierbar in x0 ∈ Ω, falls eine m×n-Matrix A ∈ Rm×n existiert, sodass
in einer Umgebung von x0 gilt

f(x0 + h) = f(x0 ) + hAT + r(x0 , h) mit r(x0 , h) = o(khk) für khk → 0

Die Norm muss irgendeine Norm im Rn sein. Da in endlich dimensionalen Vektorräumen


eh alle äquivalent sind, ist die genaue Wahl einer Norm egal.
f0 (x0 ) = A heißt (totale) Ableitung.

Wir sehen also, es hat geklappt. Wir haben jetzt eine kanonische Verallgemeinerung der
Ableitung im Eindimensionalen für Mehrdimensionale Funktionen.

Bemerkung 1. Wenn f0 (x0 ) existiert, ist es eindeutig bestimmt.


Angemommen es existiert ein B, dann kann man die Eindeutigkeit zeigen über

0 = 0 + h(AT − BT ) + rA − rB

2. Abbildung f → f0 ist linear.


3. Aus der Existenz der partiellen Ableitung folgt nicht die Stetigkeit. Aus der totalen
Ableitung folgt die Stetigkeit.

Satz 3.19
Ist Ω ⊂ Rn und f : Ω → Rm in x0 ∈ Ω diferenzierbar, dann ist f in x0 stetig.

Beweis Vorbemerkung zu Normen in Rn und Rm und lineare Operatoren A : Rn → Rm


mit x 7→ xAT :
kxAT kRm
kAkRn →Rm := sup = sup kxAT kRm < ∞
x∈Rn ,x6=0 kxkR n
kxkRm =1
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 90

Daraus folgt
kxAT kRm ≤ kAkRn →Rm · kxkRn ∀x ∈ Rn

Denn kAkRn →Rm ist als das Supremum definiert!


Es sei x aus Umgebung von x0 . Dann gilt
f(x) − f(x0 ) = (x − x0 )(f0 (x0 ))T + r(x0 , h).

Die eindimensionale Überlegegung war


– x − x0 → 0
– r(x0 , h) → 0
– Also geht die Summe gegen 0 und damit auch die Differenz der Funktionswerte.
Also gilt
kf(x) − f(x0 )kRm ≤ k(x − x0 )(f0 (x0 ))kRm + kr(x0 , h)kRm
≤ kx − x0 kRn · kf0 (x0 )T kRn →Rm + kr(x0 , h)kRm


Jetzt haben wir eine Matrix, die wir Ableitung nennen. Allerdings brauchen wir jetzt noch
einige Rechenregeln, wie wir auf diese Matrix kommen, und was wir mit dieser Matrix
anfangen können.

Vorlesung XXVII

Die Richtungsableitung für den Fall m = 1 hat schon die Definition 3.14 auf Seite 85
behandelt. Aber auch das können wir weiter verallgemeinern.

Definition 3.20 allgemeine Richtungsableitung


Sei f : Rn ⊇ Ω → Rm und x0 ∈ Ω ein innerer Punkt. Ferner sei v ∈ Rn mit kvk = 1 eine
Richtung.
f besitzt eine Richtungsableitung in Richtung v im Punkt x0 , falls

∂ff 1
(x0 ) := lim (f(x0 + hv) − f(x0 ))
∂v h→0 h

∂f
existiert. heißt Richtungsableitung.
∂v

Zur Berechnung der Richtungsableitung und Ableitung kommen wir in folgendem Satz.
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 91

Satz 3.21
Sei f : Rn ⊇ Ω → Rm und x0 ∈ Ω ein innerer Punkt.
a) Ist f differenzierbar in x0 , so existiert die Richtungsableitung in jede Richtung v ∈ Rn .
Ferner ist
∂f
(x0 ) = vf0 (x0 )T .
∂v
b) Ist f in einer Umgebung von x0 stetig partiell differenzierbar, dann ist f in x0 auch
diferenzierbar und es gilt
f0 (x0 ) = Jf (x0 )
mit
 
∂ f1 ∂ f1
  ∂ x1 (x0 ) · · · ∂ xn (x0 ) 
∂ fi  .. ..  ∈ Rm×n .
Jf (x0 ) = (x0 ) = . . 
∂xj i=1,...,m; j=1,...,n

∂ fm ∂ fm
∂ x (x0 ) · · ·
1 ∂ xn (x0 )

Jf heißt Jacobi-Matrix oder Funktionalmatrix.


Carl Gustav Jacobi lebte von 1804–1851.
Das ist jetzt endlich eine Bildungsvorschrift für die Matrix A aus der Definition 3.18
auf Seite 89
Wir haben hier eine Verallgemeinerung des Gradienten auf mehrere Dimensionen.
Denn eine Zeile der Matrix entspricht immer genau einem Gradienten.
b) a)
Kurz: Stetig partiell differenzierbar ⇒ differenzierbar ⇒ partiell differenzierbar und
in alle Richtungen differenzierbar.

Beweis a) Für v ∈ Rn , kvk = 1 folgt


f(x0 + hv) − f(x0 ) = hvf0 (x0 )T + r(x0 , hv)
mit
1
lim r(x0 , hv) = 0
h→0 h
folgt die Behauptung.
b) Wir beweisen zunächst die Aussage für m = 1. Dass heißt die Funktion f liefert wieder
einen reellen Wert und keinen Vektor. Weiter schreiben wir a := x0 .
f (x) − f (a) = ( f (x1 , x2 , . . . xn ) − f (x1 , . . . , xn−1 , an ))
+ ( f (x1 , . . . , xn−1 , an ) − f (x1 , . . . , xn−2 , an−1 , an ))
+...
+ ( f (x1 , a2 , . . . , an ) − f (a1 , . . . , an ))
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 92

Jetzt sieht der Ausdruck nicht nur viel komplizierter aus, sondern wir können auch in
jeder Klammer den eindimensionalen Mittelwertsatz anwenden.

∂f ∂f ∂f
f (x) − f (a) = (ε n )(xn − an ) + (ε n−1 )(xn−1 − an−1 ) + . . . + (ε 1 )(x1 − a1 )
∂ xn ∂ xn−1 ∂ x1

wobei ε k = (x1 , . . . , xk−1 , ak + δk (xk − ak ), an+1 , . . . , an ) mit 0 < δk < 1.


Es folgt

f (x) − f (a) − (x − a)(grad f (a))T


kx − ak1
n  
1 ∂f ∂f
= ∑ ∂ xk (ε k ) − ∂ xk (a) (xk − ak )
kx − ak1 k=1

n  
1 ∂f ∂f
· ∑ ∂ xk (ε k ) − ∂ xk (a) (xk − ak )

kx − ak1 k=1
n

∂f ∂ f 1
≤ max (ε k ) − (a) · ∑ |xk − ak |
1≤k≤n ∂ xk ∂ xk kx − ak1 k=1
| {z } | {z }
→0 für x→a 1

Die 1-Norm wird hier nur verwendet, weil diese besonders einfach ist. Da aber eh alle
Normen gleich sind (im endlich dimensionalen Raum), können wir irgendeine Norm
verwenden.
Also ist f differenzierbar in a und f 0 (a) = grad f (a).
Für m ≥ 2 ist der Beweis die komponentenweise Betrachtung analog zum Fall m = 1.


Beispiel

1. f : R2 → R3 mit f (x, y) = cos(x + 2y), sin(x + 3y), x2 + y2 .




Diese Funktion ordnet jedem Punkt in der Eben – also zum Beispiel auf einer Land-
karte – einen dreidimensionalen Vektor zu – also zum Beispiel eine Blickrichtung.
 
∂ f1 ∂ f1  
 ∂∂ fx ∂y  − sin(x + 2y) −2 sin(x + 2y)
2 ∂ f2 
Jf = 
 ∂x ∂y  =
 cos(x + 3y) 3 cos(x + 3y) 
∂ f3 ∂ f3 2x 2y
∂x ∂y
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 93

2. a) Richtungsableitung von f (x) = kxk2 in Richtung v = √1 (1, . . . , 1)


n

Wir halten zunächst fest:


 
x1 xn
Jf (x) = grad f (x) = ∇ f (x) = ,...,
kxk2 kxk2
Diese umfassende Gleichheit von all diesen Dingen funktioniert nur, da diese Funk-
tion in den eindimensionalen Raum abbildet. Dann entspricht der Gradient gerade
der Jacobi-Matrix.

xn T
 
∂f T 1 x1
= v(Jf (x)) = √ (1, . . . , 1) ,...,
∂v n kxk2 kxk2
T n
1 x 1
= √ (1, . . . , 1) =√ ∑ xk
n kxk2 nkxk2 k=1

b) Richtungsableitung gleicher Funktion f in Richtung v = e j


∂f xj
= e j (Jf (x))T = e j (grad f (x))T =
∂v kxk2

An dieser Stelle dürfen wir uns schwer bestätigt fühlen, denn bereits im Beispiel
nach Definition 3.16 auf Seite 85 haben wir den Gradienten der 2-Norm als den
Vektor selber auf die Länge 1 normiert erkannt. Bei der parteillen Ableitung oder
wie hier analog bei der Richtungsableitung entlang der Koordinatenachsten (al-
so in Richtung eines Einheitsvektors, was eben gerade einer partiellen Ableitung
entspricht) entsteht also eine Komponente des auf die Länge 1 normierten Vektors.
c) Die Richtung des steilsten Anstiegs für f : Rn → R1 im Punkt x ist grad f (x).
Wir betrachten also zum Beispiel für n = 2 wieder den fliegenden Teppich über der
x, y-Ebene und fragen uns, in welche Richtung es an einem Punkt x am steilsten
nach oben geht.
Begründung:
∂f
(x) = v grad f (x)T = hv, grad f (x)i2
∂v
= kvk2 k grad f (x)k2 cos θ
= k grad f (x)k2 cos θ
≤ k grad f (x)k2

Denn die Ableitung von f in Richtung v ist ein Maß für den Anstieg des Funktions-
graphen in Richtung v. Der Wert dieser Ableitung ist nun genau dann am größten,
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 94

denn der Winkel θ zwischen dem Gradientenvektor und dem Richtungsvektor v 0


ist (also cos θ = 1). Die Richtungsableitung in einem bestimmen Punkt ist also in
Richtung des Gradienten maximal. Der Anstieg ist genau dann am größten, wenn
man in Richtung des Gradienten geht.

Vorlesung XXVIII

3.2.3 Übertragungen ins Multivariable

In diesem Abschnitt werden wir einige Konzepte aus dem Eindimensionalen ( f : R → R)


ins Mutltivariable (hier f : Rn → R) übertragen. Dies erleichtert uns die Handhabung
von multivariablen Funktionen.
Analog zur Tangenten bei einer Funktion R → R entsteht bei einer multivariablen Funk-
tion eine Tangentialebene. Dieser Ebene berührt den fliegenden Teppich in genau einem
Punkt und entspricht in diesem Punkt der »Steigung« (die es in der Form im multiva-
riablen natürlich nicht gibt) der Funktion.
Wir betrachten f : R2 ⊇ Ω → R, f sei differenzierbar in (x0 , y0 ). Dann gilt
 T
∂f ∂f
f (x, y) = f (x0 , y0 )+(x−x0 , y−y0 ) (x0 , y0 ), (x0 , y0 ) +r((x0 , y0 ), (x−x0 , y−y0 )).
∂x ∂y

Die Tangentialebene an f in (x0 , y0 )


 T
∂f ∂f
z = g(x, y) = f (x0 , y0 ) + (x − x0 , y − y0 ) (x0 , y0 ), (x0 , y0 )
∂x ∂y
= f (x0 , y0 ) + (x − x0 ) fx (x0 , y0 ) + (y − y0 ) fy (x0 , y0 )

Wir sehen uns also in einem Punkt (x0 , y0 ) an, wie stark der fliegende Teppich in die
verschiedenen Koordinatenrichtungen ansteigt. Wir berühren also einmal den Teppich
und schweben ansonsten darüber.
Alle Richtungsableitungen von f und g stimmen im Punkt (x0 , y0 ) überein.

E = (x, y, g(x, y)) | (x, y) ∈ R2




= (1, 0, fx (x0 , y0 ))(x − y0 ) + (0, 1, fy (x0 , y0 ))(y − y0 ) + (x0 , y0 , f (x0 , y0 )) | (x, y) ∈ R2




ist die Gleichung der Tangentialebene an f im Punkt (x0 , y0 ) ∈ R2 .


3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 95

Wir sehen in der Skizze in Blau den Graphen der Funktion als fliegenden Teppich über der
x, y-Ebene, sowie in Orange den Punkt (x0 , y0 , f (x0 , y0 )) und die partiellen Steigungen an
diesem Punkt in x- und y-Richtung. Mit dem Punkt und diesen beiden Richtungsvektoren
ist die orange Ebene vollständig definiert. Die Ebene berüht nur genau in dem orangen
Punkt den Graphen der Funktion.
Wie zu jeder Ebene im R2 kann man über das Kreuzprodukt der Richtungsvektoren den
Normalenvektor bestimmen.
Der Normalenvektor dieser Ebene lautet n = ( fx (x0 , y0 ), fy (x0 , y0 ), −1).

Satz 3.22 Kettenregel


Es seien f : Rn ⊇ Ω → Rm differenzierbar in x0 ∈ Ω und g : Rm ⊇ D → Rk . Es gelte
f (Ω) ⊆ D und g sei differenzierbar in y0 = f (x0 ) ∈ D.
Dann ist
h = g ◦ f : Ω → Rk ist differenzierbar in x0 ∈ Ω
und es gilt
(g ◦ f)0 (x0 ) = g0 (f(x0 )) · f0 (x0 ) .
| {z } | {z }
∈Rn×m ∈Rm×n

Beweis verläuft wie im Eindimensionalen.


Im Eindimensionalen wird ein Grenzwert betrachtet: Hier n-dimensioanler Vektor beste-
hend aus einzelnen Folgen. Dieser Vektor konvergiert gegen den Nullpunkt.
Mit dieser Mehrdimensionalen Folge kann dann die gleiche Argumentation wie im Eind-
mimensionalen ausgeführt werden.


Bemerkung g0 (f(x0 ))·f0 (x0 ) ist ein Matrixprodukt und daher nicht vertauschbar (kom-
mutativ).
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 96

Beispiel Umrechnen in Polarkoordinaten


Wir wollen also einen Punkt (x, y) umrechnen in einen Winkel und einen Abstand vom
Nullpunkt.
Sei g : R2 → R eine differenzierbare Abbildung, etwa g(x, y) = ex+y , und x = r cos ϕ und
y = r sin ϕ. Dass heißt

g(r cos ϕ, r sin ϕ) = er(cos ϕ+sin ϕ)

∂ ∂
Frage: =? =?
∂r ∂ϕ
Wir wollen jetzt nicht einfach die Funktion g nach r und ϕ partiell Ableiten. Denn
auch wenn wir das hier noch könnten, kann das schnell sehr unangenehm werden. Die
Kettenregel vereinfacht hier einiges.

f : R2 → R2 mit f (r, ϕ) = (r cos ϕ, r sin ϕ) = (x, y)

 
cos ϕ r sin ϕ
Jf = , Jg = grad g = (ex+y , ex+y )
sin ϕ r cos ϕ

Das ging also sehr einfach. Die gesamte Ableitung zu bilden wäre deutlich mehr ausge-
artet.

   
∂ ∂ cos ϕ r sin ϕ
Jg◦ f (r, ϕ) = g( f (r, ϕ)), g( f (r, ϕ)) ·
∂x ∂y sin ϕ r cos ϕ

∂ ∂
= g( f (r, ϕ)) cos ϕ + g( f (r, ϕ)) sin ϕ ,
∂x ∂y

∂ ∂
− g( f (r, ϕ))r sin ϕ + g( f (r, ϕ))r cos ϕ
∂x ∂y

Kurz:
∂ ∂ ∂
= cos ϕ + sin ϕ
∂r ∂x ∂y
∂ ∂ ∂
= −r sin ϕ + r cos ϕ
∂ϕ ∂x ∂y
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 97

Wir können also jetzt die Kettenregel im Mehrdimensionalen. Versuchen wir uns im
folgenden Mal an einer anderen nützlichen Eigenschaft aus dem Eindimensionalen: dem
Mittelwertsatz.
Wir betrachten den Mittelwertsatz nur für Funktionen, die in die reellen Zahlen abbilden.
Für Funktionen, die ins Mehrdimensionale Abbilden wird das ganze einfach komponen-
tenweise nochmal betrachtet.

Satz 3.23 Mittelwertsatz für Funktion f : Rn ⊇ Ω → R


Es sei Ω ⊆ Rn offen und f : Ω → R differenzierbar. Sind x, y ∈ Ω mit {x + t(y − x) | t ∈
[0, 1]} ⊆ Ω (hinreichend: Konvexität von Ω), dann existiert ξ ∈ (0, 1) mit

f (y) − f (x) = f 0 (x + ξ (y − x))(y − x)T = (y − x) grad f (x + ξ (y − x))T

Wenn ein Mathematiker in einem differenzierbaren Gebirge auf einer Geraden im Defini-
tionsbereich (Mathematiker laufen immer auf Geraden) wandert, dann weiß er, dass er
in kleinen Schritten vor und zurück gehen kann, und auch nur in kleinen Schritten hoch
oder runter gehen muss. Er wird nie abrupt runter fallen oder hoch springen.

Beweis Sei h(t) = f (x + t(yx)), dann ist h : [0, 1] → R. Nach dem Mittelwertsatz im
Eindimensionalen gilt
MW S
f (y) − f (x) = h(1) − h(0) = h0 (ξ ) · 1

Mit der Kettenregel folgt

h0 (ξ ) = f 0 (x + ξ (y − x))(y − x)T

Taylor-Formel (entwickelt in (x0 , y0 ), f : R2 → R)

0. Ordnung: f (x, y) ≈ f (x0 , y0 )


1. Ordnung: f (x, y) ≈ f (x0 , y0 ) + (x − x0 , y − y0 )(grad f (x0 , y0 ))T
2. Ordnung: f (x, y) ≈ f (x0 , y0 ) + (x − x0 , y − y0 )(grad f (x0 , y0 ))T
1
fx,x (x0 , y0 )(x − x0 )2 + fy,y (x0 , y0 )(y − y0 )2 + 2 fx,y (x0 , y0 )(x − x0 )(y − y0 )

+
|2 {z   }
1 x − x0
(x − x0 , y − y0 )H f (x0 , y0 )
2 y − y0

wobei  
fx,x (x0 , y0 ) fx,y (x0 , y0 )
H f (x0 , y0 ) = = ∇T ∇ f (x0 , y0 )
fy,x (x0 , y0 ) fy,y (x0 , y0 )
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 98

ist die Hesse-Matrix (Ludwig Otto Hesse, 1811–1874)


Für die Taylor-Entwicklung zweiter Ordnung entsteht jetzt ein Parabel-Kugel-Gebilde,
dass in eine Richtung anders verzerrt ist, als in die andere.

Vorlesung XXIX

Satz 3.24 Taylor-Formel 2. Ordnung


Sei B = BR (x0 ) ⊆ Rn eine offene Kugel um den Punkt x0 mit Radius R. Weiter sei
f : B → R1 eine zweimal stetig partiell differenzierbare Funktion. Dann existiert eine
Funktion r : BR (0) → R1 mit
r(h)
lim =0
h→h khk2

und für alle khk < R gilt

1
f (x0 + h) = f (x0 ) + h(∇ f (x0 ) )T + hH f (x0 )hT + r(h).
| {z } 2
grad f (x0 )

Das Skalarprodukt h(∇ f (x0 ))T kann natürlich auch geschrieben werden als

∇ f (x0 )hT .

Das ist tatsächlich eine Verallgemeinerung ins Multivariable, d. h. das Eindimensionale


steckt in der Formel drin.
Die eigentliche Aussage der Formel steckt in der Vorraussetzung verlangten Grenzwert

r(h)
lim = 0.
h→h khk2

Denn wir teilen durch ein sehr kleines khk und gehen noch immer gegen 0. Der Rest muss
also sehr stark gegen 0 gehen. Wäre das nicht verlangt, könnte die gesamte Funktion in
der Taylor-Formel durch den Rest r(h) übernommen werden. Dann wäre die Näherung
wertlos.
Die Norm ist nur eine feste Norm im Rn . Wie immer sind auch hier alle Normen in
endlich dimensionalen Vektorräumen äquivalent.
Dabei ist
∂2 f
 
H f (x0 ) = (x0 )
∂ xi ∂ x j i, j=1,...,n
die Hesse-Matrix.
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 99

H f ist symmetrisch, d. h.
 
∂1
 ∂2 
H f = hTf = ∇T ∇ f (x0 ) =  ..  (∂1 , ∂2 , . . . , ∂n ).
 
.
∂n

Beweis Wir betrachten die Gerade λh (t) = x0 + th für t ∈ R. Dieser Gerade ist für
h ∈ BR (0) und t ∈ [−1, 1] eine Gerade in BR (x0 ).
Damit sei
g(t) := ( f ◦ λh )(t) = f (x0 + th) ∈ C2 ([−1, 1]).
Dann folgt mit der Kettenregel
!0
n  
00 ∂f
g (t) = ∑ ◦ λh (t) · hi
i=1 ∂ xi
n  0
∂f
=∑ ◦ λh (t) · hi
i=1 ∂ xi
n n 
∂2

=∑∑ ◦ λh (t) · hi h j
i=1 j=1 ∂ xi ∂ x j
n n
∂2 f
=∑∑ (x0 + th)ḣi h j
i=1 j=1 ∂ xi ∂ x j

Mit dem eindimensionalen »Taylor« folgt parallel


1
∃ξ (0,t) : g(t) = g(0) + g0 (0)t + g00 (0)t 2 + η(t)t 2
2
mit
1 00
g (ξ ) − g00 (0)

η(t) =
2
also
lim η(t) = 0.
t→0

Für t = 1 gilt
1
f (x0 + h) = g(1) = g(0) + g0 (0) · 1 + g00 (0) · 1 + η(1)
2
1
= f (x0 ) + h(grad f (x0 ))T + hH f (x0 )hT + η(1)
2
3 Differenzialrechnung in Rn
3.2 Reellwertige Funktionen mehrerer reeller Vektorräume 100

Wir sehen also, wie sich die gewaltige Doppelsumme in eine Vektor-Matrix-Vektor-
Multiplikation verwandelt hat.
Nun müssen wir noch das Abklingen des Restgliedes zeigen!

1
r(h) = η(1) = h H f (x0 + ξ h) − H f (x0 ) hT

2
1 n n 
∑∑ fxi ,x j (x0 + ξ h) − fxi ,x j (x0 ) hi h j
2 i=1 i=1

Um den Grenzwert 0 für h → 0 zu zeigen, betrachten wir zunächst den Betrag.


n n
|r(h)| ≤ max fxi ,x j (x0 + ξ h) − fxi ,x j (x0 ) · ∑∑ |hi h j |
1≤i, j≤n i=1 j=1
| {z } | {z }
=o(1) für khk→0   

 
 n n





|hi | |h |
 


i=1
∑ 

 j=1
∑ j



| {z } 


√ | √{z }
≤ nkhk2 ≤ nkhk2

Damit folgt
|r(h)|
= o(1) für khk → 0
nkhk22


Beispiel n = 2
Wir betrachten f (x, y) = x3 + y3 − 3xy und die Taylor-Entwicklugn 2. Ordnung im Ent-
wicklungspunkt (−1, 1).

grad f (x, y) = (3x2 − 3y, 3y2 − 3x) ⇒ grad f (−1, 1) = (0, 6)


   
6x −3 −6 −3
H f (x, y) = ⇒ h f (−1, 1) =
−3 6y −3 6
f (−1, 1) = 3

Für den Vektor h gilt in diesem Fall

h := (x, y) − (−1, 1).


3 Differenzialrechnung in Rn
3.3 Extremwerte 101

1
f (x, y) ≈ 3 + ((x, y) − (−1, 1))(grad f (−1, 1))T + ((x, y) − (−1, 1))H f (−1, 1)((x, y) − (−1, 1))T
2
    
0 1 −6 −3 x+1
= 3 + (x + 1, y − 1) + (x + 1, y − 1)
6 2 −3 6 y−1
 
−6x − 6 − 3y + 3
= 3 + (y − 1)6 + (x + 1, y − 1)
−3x − 3 + 6y − 6
1 1
= 6y − 3 + (x + 1)(−6x − 3y − 3) + (y − 1)(6y − 3x − 9)
2 2
= −3x − 3y − 3x2 + 3y2 − 3xy

[ 12 (x + 1)2 (−6) + 21 (y − 1)2 6 + (−3)(x + 1)(y − 1)]


In diesem Spezialfall ergibt sich aus dem Eindimensionalen

x3 ≈ −1 + 3(x + 1) − 3(x + 1)2


y3 ≈ 1 + 3(y − 1) + 3(y − 1)2
−3xy = −3(x + 1)(y − 1) + 3y − 3y
= −3(x + 1)(y − 1) + 3(y − 1) − 3(x + 1) + 3 + 3

Vorlesung C

3.3 Extremwerte
Wir werden jetzt die Erkenntnisse über Extremwerte und deren Bestimmung aus dem
Eindimensionalen ins Mehrdimensionale übertragen.

Definition 3.25
Sei Ω ⊆ Rn offen, f : Ω → R1 eine Funktion und a ∈ Ω. Dann hat f in a ein lokales
Maximum (Minimum), falls eine offene Umgtebung Uε (a) ⊂ Ω, so dass für alle x ∈ Uε (a)
gilt:
f (x) ≤ f (a) ( f (x) ≥ f (a))

Gilt diese Ungleichung für alle x ∈ Ω, dann handelt es sich um ein globales Maximum
(Minimum).
3 Differenzialrechnung in Rn
3.3 Extremwerte 102

Lemma 3.26 notwendiges Kriterium für Extremwerte


Sei Ω ⊆ Rn offen und f : Ω → R eine in a differenzierbare Funktion.
Wenn f ein ein lokales Extremwert in a besitzt, dann folgt daraus

grad f (a) = 0

Analog zum Eindimensionalen liefert dieses Lemma nur eine Implikation. Die Aussage gilt
also nicht in der Richtung, dass aus grad f (a) = 0 unbedingt eine Extremstelle folgt!
Wenn der Gradient der Nullvektor ist, dann müssen alle partiellen Ableitungen (also die
Richtungsableitungen entlang aller Koordinatenachsen) null sein.
[Landmasse in der x-y-Ebene. Zwei Geraden durch die Masse parallel zur x- und y-Achse.
Oben drüber Teppich und Hochpunkt. Beide Geraden auch oben. Die sind gerade eindi-
mensionale Funktionen, die beide einen Hochpunkt haben müssen, damit der Teppich dort
auch einen Hochpunkt hat.]

Beweis Für alle i = 1, . . . , n sei gi (t) = f (a + tei ) mit t ∈ R und a + tei ∈ Ω.


Wenn die Funktion gi in t = 0 ein lokales Extremum besitzt, dann gilt nach Satz 2.16
[Verweis] für alle i ∈ {1, . . . , n}

† ‡ ∂f
0 = g0i (0) = grad f (a + 0ei )eTi = (a)
∂ xi


An der Stelle † wurde Satz 2.16 [Verweis] angewendet. An der Stelle ‡ wurde die Ket-
tenregel verwendet
Wie im Eindimensionalen liefert dieses Lemma nur ein notwendige Bedingung. Es gibt
aber auch hier fälle wie f (x) = x3 im Eindimensionalen, wo an der Stelle x0 = 0 durchaus
die Bedingung erfüllt ist, aber keine Extremstelle vorliegt.

Definition 3.27
Sei f : Ω → R differenzierbar und gilt grad f (a) = 0, so heißt a ein stationärer Punkt
von f .
Ein stationärer Punkt a heißt Sattelpunkt von f , falls in jeder Umgebung von a Vektoren
b und c existieren, sodass
f (b) < f (a) < f (c)
3 Differenzialrechnung in Rn
3.3 Extremwerte 103

»Jeder der sich einen Pferdesattel vorstellt weiß, wenn Sie dass Pferd quer durchschnei-
den, gibt es in Richtung Maximum ein Minimum.«

Definition 3.28
Sei A ∈ Rn×n eine symmetrische n × n Matrix, d. h. AT = A.

q(h) = hAhT , h ∈ Rn
heißt die quadratische Form.
q bzw. A heißt positiv semidefinit genau dann, wenn für alle h ∈ Rn gilt q(h) ≥ 0.
q bzw. A heißt positiv definit genau dann, wenn für alle h ∈ Rn \{0} gilt q(h) ≥ 0.
Analog für negativ (semi)definit.
q bzw. A heißt indefinit genau dann, wenn zwei Vektoren h1 und h2 existieren, sodass
q(h1 ) < 0 < q(h2 ).

Da wir diese Erkenntnisse auf die Hesse-Matrix anwenden wollen, ist die Einschränkung
auf symmetrische Matrizen durchaus annehmbar. Schließlich ist die Hesse-Matrix immer
symmaterisch, wenn sich der Satz von Schwarz [Verweis] anwenden lässt.

Beispiel

 
a b
A= , h = (h1 , h2 )
b d
  
a b h1
T
q(h) = hAh = (h1 , h2 ) = ah21 + 2bh1 h2 + dh22
b d h2

 
1 0 0
A = 0 ±1 0 , h = (h1 , h2 , h3 )
0 0 1
  
1 0 0 h1
q(h) = hAhT = (h1 , h2 , h3 ) 0 ±1 0 h2  = h21 ± h22 + h23
0 0 1 h3

Bemerkung 1. q(th) = t 2 q(h), t ∈R


3 Differenzialrechnung in Rn
3.3 Extremwerte 104

2. q(0) = 0
3. Die Definitheit von q lässt sich durch die Eigenwerte von A beschreiben.

Lemma 3.29
 
a b
A=
b d

Gilt det A = ad − b2 < 0, dann gilt q ist indefinit.


Gilt det A > 0 dann ist q positiv definit, wenn a > 0 und q negativ definit, wenn a < 0.

Beweis 1. a > 0
 
2 2h d 2
q(h1 , h2 ) = a( h1 + h1 h2 + h2 )
a a

Die quadratische Gleichung in h1 hat die Diskriminante


 2  2
2b d h2
h22 − h22 = · (b2 − ad)
2a a a

Falls die Diskriminante negativ ist, dann liegen keine Nullstellen vor. Falls die Dis-
kriminante positiv ist, dann existieren positive und negative Funktionswerte zwi-
schen den Nullstellen.
2. a < 0 analog
3. a = 0, b 6= 0

q(h1 , h2 ) = 2bh1 h2 + dh22


Wir betrachten nur q(h1, 1) = 2bh1 + d, dann sehen wir, dass h1 existieren mit
q(h1 , 1) > 0 und q(h1 , 1) < 0.


Aus der Sicht der moderne Algebra ist das kein sinnvoller Ansatz. Der Weg über die
Eigenwerte der Matrix A führt schneller zum Ziel.

Satz 3.30 Hinreichendes Kriterium für Extremwerte


Sei f : Ω → R mit Ω ⊆ Rn offen und f ∈ C2 (Ω) ( f ist zweimal stetig partiell differen-
zierbar). a ∈ Ω sei ein stationärer Punkt. Dann gilt
3 Differenzialrechnung in Rn
3.3 Extremwerte 105

1. H f (a) positiv definit =⇒ f hat in a lokales Minimum


2. H f (a) negativ definit =⇒ f hat in a lokales Maximum
3. H f (a) indefinit =⇒ f hat in a einen Sattelpunkt

Beweis 1. H f (a) positiv definit.

q(h) = hH f (a)hT

Mit der Taylor-Formel gilt


1
f (∨a + h) = f (a) + h grad f (a)T + q(g) + r(h)
2

Es gilt h grad f (a)T = 0, da grad f (a) = 0. Es bleibt also zu zeigen, dass 12 q(g) +
r(h) ≥ 0.
Stetige Funktionen nehmen auf beschränkten und abgeschlossen Gebieten ihr Mi-
nimum und Maximum an.
q ist stetig und positiv (außer in 0), also nimmt q auf der Sphäre {x | kxk = 1}
(beschränkt und abgeschlossen!) ein Minimum m > 0 an. Damit gilt
 
2 h
n
∀h ∈ R \{0} : q(h) = khk q > khk2 m
khk


1
khk h = 1

m
Außerdem gilt für alle 0 < ε < 2 gibt es ein R = R(ε) mit

∀h ∈ UR (0) : |r(h)| ≤ εkhk2

In der Taylor-Formel steht eigentlich r(h) = o(khk2 ), aber die Landau-Symbolik


meint genau die oben stehende Aussage.
Also gilt
1 m 
f (a + h) − f (a) = q(h) + r(h) ≥ − ε khk2 ≥ 0
2 2
2. H f (a) negativ deinit analog mit anderem Vorzeichen.
3 Differenzialrechnung in Rn
3.3 Extremwerte 106

3. H f (a) indefinit, d. h. es existieren Vektoren h1 , h2 mit q(h1 ) < 0 < q(h2 ).

f1 (t) = f (a + th1 )
f2 (t) = f (a + th2 )
f10 (0) = f20 (0) = 0
f100 (0) = q(h1 ) < 0
f200 (0) = q(h2 ) > 0

Also ist t = 0 ein lokales Maximum für f1 und ein Minimum für f2 .
Also ist q ein Sattel.


Vorlesung CI

Beispiel
Wir untersuchen folgende Funktion auf Extrema:

f : R2 → R, f (x, y) = x3 + y3 − 3xy

Dazu betrachten wir zunächst die notwendige Bedingung

∇ f (x) = (3x2 − 3y, 3y2 − 3x) = 0


(
y = x2
⇒ ⇒ x = x4 ⇒ x4 − x = (x − 0)(x − 1)(x2 + x + 1) = 0
x = y2
⇒ x1 = 0 ⇒ y1 = 0
x2 = 0 ⇒ y2 = 1

Nun betrachten wir die hinreichende Bedinung


 
6x −3
H f (x, y) =
−3 6y
 
0 −3
H f (0, 0) =
−3 0
 
6 −3
H f (1, 1) =
−3 6

det H f (0, 0) = −9 < 0 ⇒ indefinite Matrix, also Sattelstelle

det H f (1, 1) = 27 > 0 ∧ fx,x (1, 1) = 6 > 0 ⇒ positiv definite Matrix, also Minimalstelle
3 Differenzialrechnung in Rn
107

In diesem Fall kann man die Aufgabe auch ohne höhere Mathematik lösen. Dazu formt
man die Funktion um zu
1 1 3
f (x, y) = (x − 1)2 (x + ) + (y − 1)2 (y − ) + (x − y)2 − 1 ≥ −1
2 2 2
und kann jetzt das Ergebnis direkt ablesen.
Aber wir haben ja zum Glück die höhere Mathematik und müssen da nichts direkt ablesen
können. . .

Beispiel

[ f : R2 → R, f (x, y) = 2x4 + y4 − 2x2 − 2y2


Wir betrachten zunächst die notwendige Bedingung

∇ f (x, y) = (8x3 − 4x, 4y3 − 4y) = 0


√ √
0 = 2x3 − x = x(2x2 − 1) = x( 2x − 1)( 2x + 1)
0 = y3 − y = y(y − 1)(y + 1)

2
x1,2,3 = 0; ±
2
y1,2,3 = 0; ±1

Für die hinreichende Bedingung betrachten wie die Hesse-Matrix


 2 
24x − 4 0
H f (x, y) =
0 12y2 − 4

(x, y) det H f (x, y) fx,x


(0, 0) 16 -4 Maximum
(0, 1) -32 Sattel
(0,

−1) -32 Sattel
( √22 , 0) -32 Sattel
(− √22 , 0) -32 Sattel
( 2 , 1)
√ 2
64, 8 Minimum
( 22√, −1) 64 8 Minimum
(− √22 , 1) 64 8 Minimum
(− 22 , 1) 64 8 Minimum
[Tabelle schön machen!]
4 Integralrechnung
4 Integralrechnung 108

4 Integralrechnung

Aufgaben a) Umkehrung der Differentiation, d. h. Berechnung der Stammfunktion −→


»unbestimmte Integration« (nicht eindeutig)
b) Flächenberechnung (Volumina, Arbeit) −→ »bestimme Integraion« (eindeutig)
Probleme a) Berechnung von Integralen
b) Zusammengang von bestimmten und unbestimmten Integralen

4.1 Unbestimmte Integrale

Definition 4.1
Sei I ⊆ R ein Intervall. Die Funktion F : I → R heißt eine Stammfunktion von f : I → R,
wenn gilt
∀x ∈ I : F 0 (x) = f (x)

Bekannt aus Folgerung 2.18 [Verweis]: Jede andere Stammfunktion von f auf I hat die
From F(x) +C mit einer beliebigen Konstante C.

Beispiel
x2 x2 x2
• f (x) = x, F(x) = , + 1, − Π, . . .
2 2 2
• f (x) = e , F(x) = e , e + 5, ex − 1, . . .
x x x

Ist F eine Stammfunktion von f , so heißt F(x) +C (wobei C eine unbestimmte Konstante
ist) das unbestimmte Integral von f . Schreibweise
Z
f (x) dx = F(x) +C

4.1.1 Rechenregeln für unbestimmte Integrale


4 Integralrechnung
4.1 Unbestimmte Integrale 109

Satz 4.2 Rechenregeln für unbestimmte Integrale

1. Seien f , g : I → R zwei Funktion, die Stammfunktionen bestitzen. Dann gilt für be-
liebige λ , µ ∈ R Z Z Z
λ f (x) + µg(x) dx = λ f (x) + µ g(x)

2. Substitutionsregel f : I → R besitze eine Stammfunktion. Weiter sei ϕ : D → I


stetif differenzierbar und x = ϕ(t).
f (x) dx = F(x) +C ,d. h. ∀x ∈ I : F 0 (x) = f (x). Dass heißt
R
a) Sei

dF(ϕ(t))
= F 0 (ϕ(t)) · ϕ 0 (t) = f (ϕ(t))ϕ 0 (t)
dt
und damit ergibt sich
Z
f (ϕ(t))ϕ 0 (t) dt = F(ϕ(t)) +C

b) Sei außerdem ϕ bijektiv, d. h. ϕ 0 (t) 6= 0 (ϕ −1 (x) = t)


dG(ϕ −1 (x)))
Sei f (ϕ(t))ϕ 0 (t) dt = G(t) + C, also G0 (t) = f (ϕ(t))ϕ 0 (t), also
R
dx =
G0 (ϕ −1 (x))(ϕ −1 )0 (x), also f (x) dx = G(ϕ −1 (x)) ∗C.
R

[HILFE!!!]
c) Partielle Intergration
Seien u, v stetig differenzierbar in I, dann gilt
Z Z
0
u(x)v (x) dx = u(x)v(x) − u0 (x)v(x) dx

Beweis 1. Folgt aus der Linearität der Ableitung.:

(λ F(x) + µG(x) +C)0 = λ F 0 (x) + µG0 (x)

2. Beweis in Formulierung enthalten.


d 0 0
3. Mit der Produktregel dx (u(x)v(x)) = u (x)v(x) + u(x)v (x) ergibt sich
Z
u0 (x)v(x) + u(x)v0 (x) dx = u(x)v(x) +C


4 Integralrechnung
4.1 Unbestimmte Integrale 110

Beispiel
x−b
f besitze Stammfunktion F. Dann gilt für a 6= 0 und ϕ(t) = at + b = x(⇔ t = a )

1
Z Z Z
f (φ (t)) dt = f (at + b) dt = f (x) dx
a

Eselsbrücke: Für x = ϕ(t), d. h.


dx
= ϕ 0 (t)
dt
schreiben wir einfach mathematisch falsch

ϕ 0 (t) dt = dx

Damit ergibt sich


1
Z Z
f (at + b) dt = f (x) dx.
a

Vorlesung CII

Liste der Grundintegrale


(
xα+1
+C für α ∈ R\{−1}
Z
α α+1
1. x dx =
ln |x| +C für α = −1
1
Z
2. dx = ln |x| +C für x > 0 oder x < 0
x
Z
3. sin x dx = − cos x +C
Z
4. cos x dx = sin x +C

dx
Z
5. = tan x +C für (x + Π2 + kΠ)
cos2 x
dx
Z
6. = − cot x +C für x 6= kΠ
sin2 x
dx
Z
7. √ = arcsin x für |x| < 1
1 − x2
dx
Z p
8. √ = arsinh x +C = ln(x + 1 + x2 ) +C
1 + x2
4 Integralrechnung
4.1 Unbestimmte Integrale 111

dx
Z p
9. √ = arcosh x +C = ln(x + x2 − 1) +C für |x| > 1
x2 − 1
dx
Z
10. = arctan x +C
1 + x2
Z
11. ex dx = ex +C

ax
Z
12. ax dx = +C für a > 0 und a 6= 1
ln a

Beispiel Substitution
Wir betrachten das Integral Z √
5x + 2 dx.

Die innere Funktion lautet


1
y = 5x + 2 ⇒ x = (y − 2).
5
Für die Ableitung der inneren Funktion gilt
dy 1
= 5 ⇒ dy = 5 dx ⇒ dx = dy.
dx 5
Damit ergibt sich für das Integral
Z √
√ 1
Z
5x + 2 dx = y dy
5
2 31
= y 2 +C
3 5
2 3
= (5x + 2) 2 +C
15

Beispiel
Sei ϕ(t) 6= 0 und stetig differenzierbar.

ϕ 0 (t)
Z
dt = ln |ϕ(t)| +C
ϕ(t)

Betrachten wir dazu das angewandte Beispiel für x 6= kΠ


cos x
Z Z
cot x dx = dx = ln | sin x| +C
sin x
4 Integralrechnung
4.1 Unbestimmte Integrale 112

Beispiel partielle Integration


Betrachten wir das Integral Z
xex dx

dann bietet sich folgende Wahl an

u(x) = x ⇒ u0 (x) = 1
v0 (x) = ex ⇒ v(x) = ex

Damit ergibt sich


Z Z
xex dx = xex − ex dx
= (x − 1)ex +C

Beispiel weiteres Grundintegral


Wir verwenden die partielle Integration für folgendes Integral
Z Z
ln x dx = 1 ln x dx

indem wir wählen

u0 (x) = 1 ⇒ u(x) = x
1
v(x) = ln x ⇒ v0 (x) =
x
Damit ergibt sich
1
Z Z
1 ln x dx = x ln x − x dx
x
= x ln x − x +C für x > 0

Bemerkung Differentiation ist »nur« ein Handwerk. Wir können jede Funktion mit-
hilfe der uns bekannten Mitteln ableiten. Mit algorithmischen Methoden erhalten wir zu
jeder Funktion eine Ableitung.
Integration ist hingegen eine Kunst. Nicht jede Funktion lässt sich integrieren.

Wir eine elementare Funktion differenziert, erhalten wir wieder eine elementare Funktion.
Aber was passiert, wenn eine elementare Funktion integriert wird? Erhalten wir auch dann
in jedem Fall eine elementare Funktion. Die erstaunliche Antwort lautet Nein.
4 Integralrechnung
4.2 Integraion rationaler Funktionen 113

Beispiel nicht elementarer Stammfunktionen

• Die Funktion zur Gaußschen Glockenkurve ist stetig differenzierbar (also wunderbar
glatt) und es existiert auf jeden Fall eine Stammfunktion.
Z
2
e−x dx = F(x) +C

Diese Stammfunktion F lässt sich aber nicht als elementare Funktion schreiben!
sin x
• dx
x
• sin x2 dx

Fazit: Es gibt nur wenige Klassen von Funktionen, deren Integration in geschlossener
Form möglich ist, d. h. deren Integration wieder zu einer Darstellung mit endlich vielen
elementaren Funktionen führt.
Das wichtigste Beispiel für diese Klassen sind die rationalen Funktionen.

4.2 Integraion rationaler Funktionen


Rationale Funktionen bestehen im Zähler und Nenner aus Polynomen. Damit sind sie
von folgender Bauart:

p(x) a0 + a1 x + . . . an xn
R(x) = =
q(x) b0 + b1 x + . . . bm xm

Wenn das Nenner-Polynom q Nullstellen hat, dann hat die Funktion R Lücken. Wir
können natürlich nicht über diese Lücken hinweg integrieren. Also betrachten wir nur
Intervalle zwischen den Nullstellen von q.
Z
Wir suchen R(x) dx für an , bm 6= 0.

Wir nehmen ohne Beschränkung der Allgemeinheit n < m an, denn andernfalls können
wir die Funktion zerlegen als
R(x) = ∏ +R1 (x)
n−m
mit R1 echt gebrochen, d. h. n < m.

Satz 4.3 Partialbruchzerlegung


p(x)
Jede echt gebrochene rationale Funktion R(x) = q(x) lässt sich in eine Summe von reellen
Partialbrüchen zerlegen.
4 Integralrechnung
4.2 Integraion rationaler Funktionen 114

Sei q(x) = c(x − b1 )k1 (x − b2 )k2 . . . (x − bα )kα q1 (x)l1 q2 (x)l2 . . . qβ (x)lβ mit paarweise ver-
schiedenen reellen Nullstellen b j und paarweise verschiedenen quadratischen Polynomen
q j ohne reelle Nullstellen.
Für den Grad des Polynoms R ergibt sich damit

α β
m= ∑ k j + 2 ∑ l j.
j=1 j=1

Für das Polynom R ergibt sich


!
p(x) α A j1 A j2 A jk j
R(x) = =∑ + + . . . +
q(x) j=1 x − b j (x − b j )2 (x − b j )k j
!
B B j1 x +C j1 B j2 x +C j2 B jl1 +C jl j
+∑ + + . . . +
j=1 q j (x) (q j (x))2 (q j (x))l j
kj
! lj
!
α A jµ B B jµ x +C jµ
= ∑ ∑ +∑ ∑
µ=1 (x − b j ) j=1 µ=1 (q j (x))
µ µ
j=1

mit reellen Koeffizienten A jµ , B jµ ,C jµ .

Beweis ohne Beweis. 

Beispiel abgefahrenes Beispiel ohne Lösung

1
(x + 3)4 (x − 1)(x2 − 2x − 2)3 (x2 + 2)

√ √
x2 + 2 = (x − 2i)(x + 2i)
x2 − 2x − 2 = (x − 1)2 + 1 > 0

1
(x + 3)4 (x − 1)(x2 − 2x − 2)3 (x2 + 2)
A11 A12 A13 A14 A21
= + 2
+ 3
+ 4
+
x + 3 (x + 3) (x + 3) (x + 3) x−1
B11 x +C11 B12 x +C12 B13 x +C13 B21 x +C21
2
+ 2 2
+ 2 3
+
x − 2 + 2 (x − 2x + 2) (x − 2x + 2) x2 + 2
Bestimmung der Koeffizienten A, B,C durch
4 Integralrechnung
4.2 Integraion rationaler Funktionen 115

a) Koeffizientenvergleich
b) Einsetzen spezieller Werte

Beispiel realistisches Beispiel

x4 + x3 + 2x x − x2
=x
x3 + x2 + x + 1 (x + 1)(x2 + 1)
x − x2 A Bx +C
2
= + 2
(x + 1)(x + 1) x + 1 x + 1
⇒ x − x2 = A(x2 + 1) + (Bx +C)(x + 1)
0 = x2 (A + B + 1) + x(B +C − 1) + A +C
| {z } | {z } | {z }
=0 =0 =0

A +C = 0
B +C = 1
A + B = −1

B−A = 1

2B = 0
B=0
C=1
A = −1

Wir erhalten also


A Bx +C −1 1
+ 2 = + 2
x+1 x +1 x+1 x +1

Alternativ hätte auch das Einsetzen von x = −1 sofort zu A = −1 geführt. Das funktio-
niert nicht immer, aber manchmal geht es schneller.

Vorlesung CIII

Beispiel noch ein realistisches Beispiel

x2 + 3x + 4
R(x) =
(x2 − 1)2
4 Integralrechnung
4.2 Integraion rationaler Funktionen 116

Zählerpolynom hat einen geringeren Grad als das Nennerpolynom. Also ist keine Poly-
nomdivision nötig um einen nicht gebrochenen Teil abzuspalten.
Wir wissen aus dem Satz, dass wir das Polynom folgendermaßen aufteilen können.

x2 + 3x + 4
R(x) =
(x − 1)2 (x + 1)2
A B C D
= + 2
+ +
x − 1 (x − 1) x + 1 (x + 1)2

Durch Umstellen erhalten wir nun eine Gleichung, in die wir geschickt einsetzen können,
um die Gleichung zu lösen.

x2 + 3x + 4 = A(x − 1)(x + 1)2 + B(x + 1)2 +C(x − 1)2 (x + 1) + D(x − 1)2

x = 1 : 8 = 4B ⇒ B = 2
1
x = −1 : 2 = 4D ⇒ D =
2
1
x = 0 : 4 = A + 2 +C +
2
1
x = 2 : 14 = 9A + 18 + 3C +
2
3 3
⇒A = − ,C =
4 4

Zur Integration der Partialbrüche


dx
Z
• = ln |x − a| +C für x 6= a
x−a
Basierend auf dem Integral von 1/x. Denn es gilt

1
Z
dx = ln |x| +C.
x
Die Betragstriche sind hier sehr wichtig, denn die Logarithmus-Funktion ist nur
für positive Zahlen definiert. Für den Fall x < 0 gilt
d 1 d 1 1
ln |x| = · |x| = · (−1) = .
dx |x| dx |x| x
4 Integralrechnung
4.2 Integraion rationaler Funktionen 117

dx −1
Z
• k
= +C für x 6= a und k = 2, 3, . . .
(x − a) (k − 1)(x − a)k−1
!
dx 2 2x + p
Z
• =p arctan p +C
x2 + px + q 4q − p2 4q − p2
falls Diskriminante D = p2 − 4q < 0, also keine reelle Nullstelle.
Denn:
2
 p 2 p2
x + px + q = x + +q−
2 4
!2

p 2 
2x + p
= q− · p +1
4 4q − p2

ax + b a ap  dx
Z  Z
2
• = ln(x + px + q) + b −
x2 + px + q 2 2 x2 + px + q
!
a 2b − ap 2x + p
= ln(x2 + px + q) + p arctan p +C
2 4q − p2 4q − p2

Basierend auf dem logarithmischen Integrieren:


f 0 (x)
Z
dx = ln f (x) +C
f (x)

Hat ein Polynom zweiter Ordnung (der Form x2 + px + q) keine reelle Nullstelle,
so ist (der Realteil vom) Funktionswert stets positiv. Das logarithmische Integrie-
ren kann also für positive Zahlen problemlos (und ohne Betragstriche) verwendet
werden.
Falls Terme mit zwei nicht reellen Nullstellen in höheren Potenzen vorkommen,
kann man dieses Problem rekursiv lösen. Das ist allerdings von Hand mehr als
unangenehm.

dx 2x + p
Z
=
(x2 + px + q)k (k − 1)(4q − p2 )(x2 + px + q)k−1
2(2k − 3) dx
Z
+ 2 2
(k − 1)(4q − p ) (x + px + q)k−1

ax + b bp − 2aq + (2b − ap)x


Z
dx =
(x2 + px + q)k (k − 1)(4q − p2 )(x2 + px + q)k−1
(2k − 3)(2b − ap) dx
Z
+ 2 2
(k − 1)(4q − p ) (x + px + q)k−1
4 Integralrechnung
4.2 Integraion rationaler Funktionen 118

Beispiel zurück zum ersten Beispiel zur Partialbruchzerlegung

x4 + x3 + 2x 1 1
= x − +
x3 + x2 + x + 1 x + 1 x2 + 1

x4 + x3 + 2x 1 1
Z Z Z Z
dx = x dx − dx + dx
x3 + x2 + x + 1 x+1 x2 + 1
x2
= − ln |x + 1| + arctan x +C
2

Wir haben zunächst mit der Polynomdivision begonnen und anschließend »nur« die oben
gefundenen Regeln angewendet um die einzelnen Integrale aufzulösen.

Beispiel zuruück zum Beispiel von eben

x2 + 3x + 4
Z
= A(x + 1)(x + 1)2 + B(x + 1)2 +C(x − 1)2 (x + 1) + D(x − 1)2
(x − 1)2 (x + 1)2
3 3 1
= − (x + 1)(x + 1)2 + 2(x + 1)2 + (x − 1)2 (x + 1) + (x − 1)2
4 4 2
3 2 3 1 1
= − ln |x − 1| − + ln |x − 1| − +C
4 x−1 4 2 x+1

Jetzt können wir also alle rationale Funktionen problemlos entlang dieses Schemas inte-
grieren. Das ist jetzt ohne Magie und streng nach Algorithmus machbar.

4.2.1 Integration weiterer Funktionenklassen

Idee: Zurückführung auf rationale Funktionen mit Substitution


Z √
a) A = r(x, n ax + b) dx mit a 6= 0 und r rationaler Ausdruck.


n tn − b
t= ax + b ⇔ x =
a
dx nt n−1
=
dt a

t n − b nt n−1
Z
A= r( ,t) dt
a a
4 Integralrechnung
4.2 Integraion rationaler Funktionen 119

Beispiel

x+ x
Z
√ dx
x− x


t= x ⇒ x = t2
dx
= 2t
dt

√ Z 2
x+ x t +t
Z
√ dx = 2t dt
x− x t2 − t
dt
Z Z
= 2 (t + 2) dt + 4 = t 2 + 4t + 4 ln |t − 1| +C
t −1
√ 2 √ √
= x + 4 x + 4 ln | x − 1| +C
√ √
= x + 4 x + 4 ln | x − 1| +C für0 < x < 1 oder 1 < x

r(ex ) dx mit r rationaler Ausdruck


R
b)

t = ex ⇒ x = lnt
dx 1
=
dt t

dt
Z Z
r(ex ) dx = r(t)
t

Beispiel

e2x + 1
Z
dx
ex − 1

t = ex ⇒ x = lnt
dx 1
=
dt t
4 Integralrechnung
4.2 Integraion rationaler Funktionen 120

e2x + 1 t 2 + 1 dt
Z Z
dx =
ex − 1 t −1 t
Z 2
t +1 dt dt
Z Z Z
= 2
dt = 1 dt + 2 −
t −t t −1 t
= t + 2 ln |t − 1| − ln |t| +C
= ex + 2 ln |ex − 1| − ln |ex | +C
= ex + 2 ln |ex − 1| − x +C für x < 0, x > 0

Z
c) r(sin x, cos x) dx mit r rationaler Ausdruck

x
t = tan ⇒ x = 2 arctant
2
dx 2
=
dt 1 + t2

sin 2x = 2 sin x cos x


2 sin 2x cos 2x
sin x = x x
sin2 + cos2
| 2 {z 2}
=1
2
= sin 2x cos 2x
cos 2x + sin 2x
2 2t
= 1
= 2
t+ t t +1

cos2 2x − sin2 2x
cos x =
cos2 2x + sin2 2x
x
sin2
1 − cos2 2x 1 − t2
2
= =
sin2 2x 1 + t2
1+ cos2 2x

2 1 − t 2 2 dt
Z Z
r(sin x, cos x) dx = r( , )
t2 + 1 1 + t2 1 + t2
4 Integralrechnung
4.2 Integraion rationaler Funktionen 121

Beispiel

dx t 2 + 1 2 dt
Z Z
=
sin x 2t t 2 + 1
dt
Z
= = ln |t| +C
t
x
= ln | tan | +C
2
Z p
d) r(x, ax2 + bx + c) dx mit a > 0, b2 − 4ac 6= 0 und r rationaler Ausdruck

p √ √ p
t= ax2 + bx + c − x a ⇒ x at = ax2 + bx + c
√ t2 − c
⇒ ax2 + bx + c = t 2 + ax2 + 2tx a ⇒ x = √
b − 2t a
√ √
dx 2t 2 a + 2bt − 2 ac
= √
dt (b − 2t a)2

Beispiel

x − x2 − 5x + 1
Z
dx
x2

p
t= x2 − 5x + 1 − x


x − x2 − 5x + 1 2t 3 + 10t 2 + 2t
Z Z
dx = dt
x2 (1 − t 2 )2
= ...

weiteres Vorgehen wie im Eingangsbeispiel

Vorlesung CIV

Wir haben jetzt an vielen Beispielen gesehen, dass die Integration kein Handwerk sondern
vielmehr eine tiefe Magie (oder eine Kunst, ganz wie man will) ist. Hier noch einige
Beispiele dafür, dass man einer Funktion alles ansehen kann, aber nicht ihr Integral.
4 Integralrechnung
4.3 Das bestimmte Integral 122

dx 1
Z
= − +C
(x − 1)2 x−1

dx 1 x − 1
Z
= ln +C
x2 − 1 2 x + 1
dx
Z
2
= arctan x +C
x +1

4.3 Das bestimmte Integral


[Sinnlose Skizze mit Fläche von a bis b unter kryptischer Kurve.]
[a = x0 , b = xn , dazwischen x1 , . . . , xn−1 ]
[Zwischen den xi jeweils ein ξi ]
[einen Balken einzeichnen]

ξi ∈ [xi−1 , xi ] für i = 1, 2, . . . , n
∆xi = xi − xi−1

Definition 4.4
Wir betrachten eine Funktion f : [a, b] → R. Konvergiert
n
∑ f (ξi)∆xi
i=1

für maxi ∆xi → 0 und beliebige Wahl von ξi ∈ [xi−1 , xi ] gegen den gleichen Grenzwert, so
nennen wir diesen Grenzwert das Riemann-Integral von f über [a, b].
Wir definieren die Schreibweise
n Z b
∑ f (ξi)∆ximax ∆xi→0 f (x) dx
i=1 → a

und schreiben weiter f ∈ R([a, b]).


Dieses Integral hat bisher nichts mit dem unbestimmten Integral zu tun. Es wird erstmal
nur die gleiche Symbolik verwendet.
Ferner gill:
Z a Z a Z b
f (x) dx = 0, f (x) dx = − f (x) dx
a b a
4 Integralrechnung
4.3 Das bestimmte Integral 123

Wir können das Riemann-Integral als Flächeninhalt unter dem Graphen betrachten. Im
Allgemeinen wird dieses Konzept aber schwierig, wenn man Vorzeichen behaftete Flä-
cheninhalte – also Graphen unterhalb der x-Achse betrachtet:
Z 2Π
sin x dx = 0
0

Beispiel

1. f (x) = 1 in [a, b]
n
∑ ∆xi = xn − x0 = b − a −→ b − a
i=1

Die konstante Funktion 1 ist also Riemann integrierbar, denn der Grenzwert exis-
tiert immer und ist immer genau b − a. (Schließlich betrachtet wir ein Rechteck
über der x-Achse mit der Höhe 1.)
2. Dirichlet-Funktion (
1 für x ∈ Q
f (x) =
0 sonst
(
n
b − a für ξi ∈ Q∀i
∑ f (ξi)∆xi = 0 für ξi 6∈ Q∀i
i=1

Wir erhalten hier verschiedene Grenzwerte, je nach dem, wie man die xi wählt. f
ist also nicht Riemann integrierbar.

f 6∈ R([a, b])

4.3.1 Eigenschaften des Riemann-Integrals

Satz 4.5
Seien f , g ∈ R([a, b]).
Z b Z b Z b
a) (α f (x) + β g(x)) dx = α f (x) dx + β g(x) dx∀α, β ∈ R
a a a
Z b Z c Z b
b) f (x) dx = f (x) dx + f (x) dx
a a c
4 Integralrechnung
4.3 Das bestimmte Integral 124

c) Sei f (x) ≤ g(x)∀x ∈ [a, b], dann gilt


Z b Z b
f (x) dx ≤ g(x) dx.
a a

d) f ∈ C([a, b]) ⇒ f ∈ R([a, b]).


Ist f eine stetige Funktion auf dem Intervall [a, b], dann ist f auch Riemann inte-
grierbar. Die Umkehrung gilt nicht. Es gibt durchaus unstetige Funktionen, die sich
integrieren lassen.
e) (Folgerung aus c))
[Bild mit krytoschem Grapgen über x-Acchse und unterer sowie oberer Schranke.]
Gilt m ≤ f (x) ≤ M ∀x ∈ [a, b], dann wissen wir
Z b
m(b − a) ≤ f (x) dx ≤ M(b − a).
a

f) Dreiecksungleichung:
Z b Zb

∀a ≤ b :
f (x) dx ≤ | f (x)| dx
a a

Denn es gilt für alle x: −| f (x)| ≤ f (x) ≤ | f (x)|. Also gilt mit Aussage c) auch
Z b Z b Z b
− | f (x)| dx ≤ f (x) dx ≤ | f (x)| dx.
a a a

Beweis ohne Beweis, bis auf den Beweis im Satz – argh! 

Satz 4.6 Mittelwertsatz der Integralrechnung


Sei f ∈ C([a, b]), g ∈ R([a, b]) und g(x) ≥ 0 für alle x ∈ [a, b], dann gilt
Z b Z b
∃ξ ∈ [a, b] : f (x)g(x) dx = f (ξ ) g(x) dx
a a

Beispiel

g(x) = 1
4 Integralrechnung
4.4 Hauptsätze der Integralrechnung 125

Z b
f (x) dx = f (ξ )(b − a)
a

[Skizze einer stetigen Funktion über [a, b] und g parallel zur x-Achse schneidet f , sodass
Fläche unter g gerade Fläche unter f ]

Beweis Seien m = mina≤x≤b f (x) und M maxa≤x≤b f (x), dann gilt mit g ≥ 0
⇒ mg(x) ≤ f (x)g(x) ≤ Mg(x)
Z b Z b Z b
⇒m g(x) dx ≤ f (x)g(x) dx ≤ M g(x) dx
a a a

Sei c definiert durch


Z b Z b
c g(x) dx := f (x)g(x) mit m ≤ c ≤ M.
a a

Mit dem Zwischenwertsatz (Satz 2.8 c) [Verweis]) gilt


∃ξ ∈ [a, b] mit c = f (ξ )
Also wissen wir
Z b Z b
∃ξ ∈ [a, b] mir f (ξ ) g(x) dx = f (x)g(x) dx.
a a

Wir müssen noch einen Sonderfalls berachten:


Rb
Falls a g(x) dx = 0 kann man alle c mit m ≤ c ≤ M wählen. 

Korollar 4.7
Sei f ∈ C([a, b]) dann gilt
Z b
∃ξ ∈ [a, b] : f (x) dx = f (ξ )(b − a)
a

Beweis siehe Beispiel weiter oben 

4.4 Hauptsätze der Integralrechnung


Wir suchen jetzt den Zusammenhang zwischen der Stammfunktion (also der der unbe-
stimmten) und der bestimmten Integration.
4 Integralrechnung
4.4 Hauptsätze der Integralrechnung 126

Satz 4.8
Sei f ∈ C([a, b]), dann besitzt f eine Stammfunktion F : [a, b] → R mit
Z x
F(x) f (t) dt
a

Dass heißt Z x
d
F 0 (x) = f (t) dt = f (x)
dx a

Eigentlich zu zeigen ist die Gleichheit am Ende des Satzes:


Z x
d
F 0 (x) = f (t) dt = f (x)
dx a

Beweis Wir bilden


Z x+h Z x 
F(x + h) − F(x) 1
= f (t) dt − f (t) dt
h h a a
1 x+h
Z
= f (t) dt
h x
§ 1
= f (ξ )h = f (ξ ) −→ f (x)
h |h|→0

denn |x − ξ | ≤ |h|. 

An der Stelle § wird Korollar 4.7 [Verweis] verwendet.


Jetzt passierts – wir führen alles zusammen

Korollar 4.9
Sei f ∈ C([a, b]) mit der Stammfunktion F, dann gilt
Z b
f (x) dx = F(b) − F(a) =: F(x)|x = ax = b =: F(x)|ba
a

Beweis Nach Korollar 4.9 existiert eine Stammfunktion F1 mit


Z x
F1 (x) = f (t) +C dt
a

das heißt für alle F gilt Z x


F(x) = f (t) dt +C
a
4 Integralrechnung
4.4 Hauptsätze der Integralrechnung 127

Setzen wir x = a ein, ergibt sich


Z b
F(a) = C (denn f (x) dx = 0)
a

Setzen wir x = b ein, ergibt sich


Z b
F(b) = f (t) dt +C
a

Zusammen gilt
Z b
F(b) − F(a) = f (t) dt
a


Vorlesung CV

Beispiel einfach

Z π
sin x dx = − cos x|π0
0
= − cos π − (− cos 0) = 2

Beispiel aus der Physik


Welche Arbeit A ist erforderlich um eine Rakete von der Erdoberfläche senkrecht nach
oben auf die Höhe h zu bringen?

Arbeit = Kraft · Weg

Erdanziehungskraft:
mM
k(x) =
x2
mit
x: Entfernung zum Erdmittelpunkt
M: Erdmasse
m: Raktenmasse
R: Erdradius
4 Integralrechnung
4.4 Hauptsätze der Integralrechnung 128

Z R+h
γMm
A= dx
R x2
−γmM R+h

=
x R
 
1 1 ymM
= γmM − −→
R R + h h→∞ R

4.4.1 Substitution und partielle Integration bei bestimmten


Integralen

a) Substitution
1. Weg Betrachten das unbestimmte Integral und bilden die Stammfunktion F und
bilden danach F(b) − F(a).

Beispiel Substitution

Z π/2
sin2 x cos x dx
0
Wir setzen für die Substitution u = sin x und erhalten

du = cos x dx.

Damit erhalten wir das unbestimmte Ingeral


Z Z
2
sin x cos x dx = u2 du
u3
= +C
3
sin3 x
= +C
3

Also ergibt sich für das bestimmte Integral


π/2
sin3 x 1
Z π/2
2
sin x cos x dx = =
0 3 0 3

2. Weg Substitution im bestimmten Integral mit Substitution der Grenzen


4 Integralrechnung
4.4 Hauptsätze der Integralrechnung 129

Satz 4.10 Substitution im bestimmten Integral


Gegeben sei f ∈ R([a, b]), f ∈ C1 ([α, β ]) mit ϕ : [α, β ] → [a, b] und ϕ streng monoton
wachsend, also ϕ(α) = aϕ(β ) = b. Dann gilt
Z b Z β
f (x) dx = f (ϕ(t))ϕ 0 (t) dt.
a α

Beweis Sei F Stammfunktion von f , das heißt nach Korollar 4.9 auf Seite 126
Z b
f (x) dx = F(b) − F(a)
a

dann gilt
Z β
f (ϕ(t))ϕ 0 (t) dt = F(ϕ(t))|α
β
α
= F(ϕ(β )) − F(ϕ(α))
= F(b) − F(a)

Beispiel
Wir betrachten das Integral
Z π/2
sin2 cos x dx
0
mit der Substitution u = sin x, also du = cos x dx.
sin x auf dem abgeschlossenen Intervall [0, π/2] streng monoton. Weiter gilt ϕ(0) = 0
und ϕ(π/2) = 1

1
u3 1
Z π/2
2
sin cos x dx = =
0 3 0 3

Beispiel

Z e 4
ln x
dx
1 x
4 Integralrechnung
4.4 Hauptsätze der Integralrechnung 130

1. Weg Wir setzen u = ln x und erhalten du = 1x dx und erhalten

ln4 x
Z Z
dx = u4 du
x
u5 ln5 x
= +C = +C
5 5

Also ergibt sich


e
Z e 4
ln x ln5 x 1
dx = =
1 x 5 5
1

2. Weg Wir setzen u = ln x und erhalten du = 1x dx, ln 1 = 0 und ln e = 1. Weiter


ist ln streng monoton wachsend. Es ergibt sich

Z e 4 1
u5
Z 1
ln x 4 1
dx = u du = =
1 x 0 5 0 5

Beispiel Berechnung der Halbkreisfläche

y≥0
y2 + x2 = r2
y2 = r2 − x2
p
y = r 2 − x2

Z rp
A= r2 − x2 dx
−r

Wir substituieren x = r sint und erhalten dx = cost dt. Weiter ist sint monoton auf
dem Intervall [−r, r].
4 Integralrechnung
4.4 Hauptsätze der Integralrechnung 131

Z π/2 p Z π/2 p
2
r2 − r2 sin2 tr cost dt =r 1 − sin2 t cost dt
−π/2 −π/2
Z π/2
= r2 cos2 t dt
−π/2
r2
Z π/2
= (1 + cos 2t) dt
2 −π/2
 π/2
r2

sin 2t
= t+
2 2
−π/2
πr2
=
2

Wir können uns dieses Integral auch durch folgenden Trick überlegen.
Z π/2 Z π/2
2
sin x dx = cos2 x dx
−π/2 −π/2
sin2 x + cos2 x
Z π/2
= dx
−π/2 2
1
Z π/2
= dx
−π/2 2
π
=
2

b) partielle Integration

Satz 4.11 partielle Integration von bestimmten Integralen


Seien f , g ∈ C1 ([a, b]), dann
Z b Z b
0
f (x)g (x) dx = f (x)g(x)|ba − f 0 (x)g(x) dx
a | {z } a
f (b)g(b)− f (a)g(a)

Beweis Nach Korollar 4.9 auf Seite 126 gilt


Z b Z b Z b
0 0 ¶
f (x)g(x) dx + f (x)g (x) dx = ( f (x)g(x))0 dx
a a a
= f (x)g(x)|ba

An der Stelle ¶ wurde die Produktregel innerhalb der Integrale angewendet.



4 Integralrechnung
4.5 Uneigentliche Integrale 132

4.5 Uneigentliche Integrale


Z b
bisher f (x) nur erklärt falls
a
– [a, b] endlich
– f (x) beschränkt ist

a) uneigentliche Integrale mit unendlichen Grenzen

Definition 4.12
Sei a fest vorgegeben und sei f ∈ R([a, b]) für alle b > a.
Z ∞ Z b
f (x) dx := lim f (x) dx
a b→∞ a

Existiert der Grenzwert sagen wir »das uneigentliche Integral konvergiert« (ansonsten
»divergiert«).
Analog
Z b Z b
f (x) dx := lim f (x) dx
−∞ a→−∞ a

Z ∞ Z c Z ∞
f (x) dx := f (x) dx + f (x) dx
−∞ −∞ c
Unabhängig von der konkreten Wahl von c.

Beispiel Standardbeispiel

Z ∞
1 cZ
1 ∞ 1
Z
2
dx = 2
dx + 2
dx
−∞ x + 1 −∞ x + 1 c x +1
= lim (arctan c − arctan a) + lim (arctan b − arctan c) = π
a→−∞ b→∞

[Plot von f (x) und arctan x und Asymptoten π/2 und −π/2]

Beispiel Negativbeispiel

Z ∞
1 dx = lim x|b0 = ∞
0 b→∞

Das uneigentliche Integral konvergiert also nicht. Es divergiert gegen ∞.


4 Integralrechnung
4.5 Uneigentliche Integrale 133

Beispiel Signumfunktion
Sei die Funktion sgn : R → {−1, 0, 1} gegeben durch

−1 für x < 0

sgn(x) = 0 für x = 0

1 für x > 0

Z ∞ Z
sgn x dx = sgn x dx
−∞
R

ist divergent, da von zwei Summanden bereits der positive Bereich divergent ist (siehe
vorheriges Beispiel).
Aber mit dem Cauchy’scher Hauptwert
Z ∞ Z c
CH f (x) dx = lim f (x) dx
−∞ c→∞ −c

ergibt sich Z ∞
CH sgn x dx = 0
−∞

Achtung: Der Cauchy’sche Hauptwert ist nicht unsere Definition von einem uneigent-
lichen Integral. Wir betrachten stets zwei Grenzwerte und in diesem Fall kann der
Grenzwert nicht angegeben werden, da beide Grenzwerte divergent sind.

b) Uneigentliche Integrale mit unbeschränkten Integranden


Es sei [a, b] endliches Intervall mit Polstelle b von f .

Definition 4.13
Sei f ∈ R([a, β ]) für alle β mit a < β < b.

Z b Z β
f (x) dx = lim f (x) dx
a β →b− a

Existiert der Grenzwert sagen wir »das uneigentliche Integral konvergiert« (ansonsten
»divergiert«).
Analog für Polstellen in a und innerhalb von [a, b].

Beispiel
4 Integralrechnung
4.5 Uneigentliche Integrale 134

Z 1
1
√ dx = lim (arcsin β − arcsin 0)
0 1 − x2 β →−1
π π
= −0 =
2 2

Die Funktion passt genau in das Schema, denn sie hat bei 1 eine Polstelle.
[Skizze von Sinus und Arcussinus von −π/2 bis π/2]

Beispiel

Z 1 Z 1
ln x dx = lim ln x dx
0 α→0+ α
= lim x ln x − x|1α
α→0+
= −1

Denn mit L’Hospital gilt


1
ln α α
lim 1
= lim =0
α→0+ α→0+ − 12
α α

Beispiel Verallgemeinerung des vorherigen Beispiels


Wir betrachten drei Fälle. Für γ = 1 ergibt sich
Z 1
1
= ln x|1α = divergent
0 xγ

Für gamma 6= 1 ergibt sich


1 ( 1
x−γ+1
Z 1
1 für γ < 1
= lim = 1−γ
0 xγ α→0+ 1 − γ α divergent für γ > 1

Beispiel und noch eins. . .


4 Integralrechnung
4.5 Uneigentliche Integrale 135

Z 3 Z −1 Z 0 Z 1 Z 3
1 1
2
= + + + 2
dx
−3 x − 1 −3 −1 0 1 x +1
1 x − 1 β

= lim ln + . . . divergent!
β →−1− 2 x + 1 −3

Denn mit der Partialbruchzerlegung gilt


1 1
1 2 2
2
= −
x −1 x−1 x+1

Aber Cauchy’scher Hauptwert existiert:

Z 3 Z −1−α
1 1
CH 2
dx = lim
−3 x − 1 α→0+ −3 x2 − 1
Z 1−α Z 3
!
1 1
+ 2
dx + 2
dx = − ln 2
−1+α x −1 1+α x −1

[Skizze]

c) Vergleichssätze (nur am Beispiel)


x+1
Z ∞

1 x + x2 + 5
3

Für hinreichend große x gilt √


x+1 1
3 2
< 2
x +x +5 x
also folgt √
x+1 1
Z ∞ Z ∞
3 2
dx < c + 2
dx < ∞
1 x +x +5 1 x

Beispiel Die Gamma-Funktion

n
n! = ∏ k, 0! = 1
k=1
Die Fakultät ist nur diskret definiert. Gibt es eine stetige Funktion, die die Punkte
der Fakultät enthält? Ja!
4 Integralrechnung
4.5 Uneigentliche Integrale 136

Wir definieren die Gamma-Funktion als uneigentliches Integral für x > 0


Z ∞ Z 1 Z ∞
Γ(x) = t x−1 e−t dt = t x−1 e−t dt + t x−1 e−1 dt
0 0 1

Beide Teilintegrale konvergieren, denn


Z 1 Z 1
x−1 −t
t e dt < t x−1 dt < ∞
0 0
t x−1
Z ∞
t x−1 e−t dt < ∞ denn lim =0
1 t→∞ et

Damit folgt

t x−1 t x−1 1
∃t0 ∀t > t0 < 1 ⇒ <
eZt et t2
∞ 1
aber 2
dt < ∞
1 t

Es gilt Z ∞
Γ(1) = e−t dt = −e−t |∞
0 = 1 = 1!
0

Und für 0 < a < b < ∞ gilt


Z b Z b
x −t
t e dt = −t x e−t |ba + xt x−1 e−t dt
a a
Z b
= ax e−a − bx e−b + xt x−1 e−t dt
a

Betrachten wir den Grenzwert a → 0+ und b → ∞, dann ergibt sich

Γ(x + 1) = xΓ(x) ∀x > 0

Damit gilt

Γ(2) = 1
Γ(3) = 2
Γ(4) = 6
Γ(5) = 24

Mit vollständiger Induktion kann man leicht zeigen, dass für n ∈ N gilt

Γ(n) = (n − 1)!

Vorlesung CVI
4 Integralrechnung
4.5 Uneigentliche Integrale 137

Wir betrachten nun einen speziellen Zwischenwert. Wer hat sich nicht schon immer
gefragt: »Was ist die Fakultät von 12 ?«
Z ∞ −t
1 e
Γ( ) = √
2 0 t

√ dt
Mit der Substitution t = x, dx = 2x ergibt sich
Z ∞ −x2
1 e
Γ( ) = dx
2 0 2x
−x 2 √
=R
Re dx = π

Beispiel Integralsinus

Z x
sint
Si := dt
0 t

Der Integralsinus lässt sich mit uns bekannten Funktionen nicht mit endlichen Schrit-
ten angeben. Wir führen also einfach ein neues Symbol ein statt eine Stammfunktion
anzugeben.
Wir betrachten
lim Si(x)
x→a

[Plot]

− cost x
Z 1 Zx  
sint sint cost
Z ∞
dt = dt + lim − 2
dt
0 t 0 t x→∞ t 1 1 t
Z 1
sint cost
Z ∞
= dt + cos 1 − dt < ∞
0 t t2
| 1 {z }
<∞
Πk
=
2

Die Gleichheit an der Stelle k ergibt sich an dieser Stelle nicht. Dafür werden später
folgende Sätze benötigt. Das steht hier also einfach nur so zum Spaß.
aber Z ∞
sint cost
Z ∞
t dt = ∞, dt < ∞

t2

0 0
5 Funktionenreihen, Funktionenfolgen
138

5 Funktionenreihen, Funktionenfolgen

Wiederholung
n
Zahlenreihen: sn = ∑ ak
k=0

Wir haben definiert ∑ := n→∞
lim sn
n=0
Jetzt betrachten wir mit der gleichen Idee Reihen von Funktionen
Gegeben sei eine Folge ( fk (x))∞
k=0 fk : D → R(C) mit D ⊆ R(C).
Für jedes feste x erhalten wir eine Zahlenfolge. Konvergiert
n
sn (x) = ∑ fk (x)
k=0

für alle x ∈ D gegen s(x) so heißt die Funktionenfolge bzw. -reihe punktweise konvergent
gegen die Summe

s(x) = ∑ fk (x)
k=0

Beispiel


xk
∑ k! =: ex
k=0

Beispiel


x2k+1
∑ (2k + 1)! (−1)k =: sin x
k=0

Beispiel

x2k

∑ (2k)! (−1)k =: cos x
k=0
5 Funktionenreihen, Funktionenfolgen
5.1 Gleichmäßige Konvergenz 139

Frage: Wie übertragen sich Eigenschaften der Summanden auf die Summe?

Beispiel
Wir betrachten eine unendliche Summe und bilden die Ableitung der Summanden

d xk ∞
xk−1
∑ =∑
k=0 dx k! k=1 (k − 1)!

xk
= ∑
k=0 k!
∗∗ d ∞ xk
= ex = ∑ k!
dx k=0

Die Gleichheit an der Stelle ∗∗ gilt auf Grund komplizierter Beweise in Kapitel 2.
Es ergibt sich also die Frage, wann man aus der Ableitung der Summanden die Ableitung
der unendlichen Summe folgern kann.

5.1 Gleichmäßige Konvergenz

Definition 5.1
Für alle k = 0, 1, 2, . . . sei eine beschränkte Funktion fk : [a, b] → R. Die Folge (sn (x))∞
n=0
bzw. die Reihe ∞
∑ fk (x)
k=0
heißt gegen x(x) gleichmäßig Konvergent in [a, b], wenn gil

∀ε > 0∃N = N(ε)∀x ∈ [a, b]∀n ≥ N : |s(x) − sn (x)| < ε

In dieser Definition ist N unabhängig von x!


Anders dargestellt gilt
punktweise∀x ∈ [a, b]∃ Nullfolge (an (x))n∈N0 mit |sn (x) − s(x)| < an (x)
gleichmäßig∃ Nullfolge (an (x))n∈N0 ∀x ∈ [a, b] mit |sn (x) − s(x)| < an (x)

Noch anders dargestellt gilt


punktweise∀x ∈ [a, b] lim |sn (x) − s(x)| = 0
n→∞
gleichmäßig∀(x1 ) < [a, b] lim |sn (xn ) − s(xn )| = 0
n→∞
5 Funktionenreihen, Funktionenfolgen
5.1 Gleichmäßige Konvergenz 140

Beispiel

1
fn (x) = x + x ∈ [a, 1]
n
lim fn (x) = x = f (x)
n→∞
1
| f (x) − fn (x)| =
n

1/n ist unabhängig von x eine Nullfolge.

Beispiel

fn (x) = xn x ∈ [a, 1]
(
0 für 0 ≤ x < 1
f (x) := lim fn (x) =
n→∞ 1 für x = 1
(
xn für 0 ≤ x < 1
| fn (x) − f (x)| =
0 für x = 1

Angenommen ∀ε > 0∀n ≥ N(ε)∀x ∈ [a, 1]| fn (x) − f (x)| < ε



Wähle ε < 1 und x = N ε < 1, dann gilt | fn (x) − f (x)| = ε
Also gilt keine gleichmäßige Konvergenz.

Beispiel

x2
fk (x) = für |x| ≤ 1
(1 + x2 )k
n
x2
sn (x) = ∑ 2 k
k=0 (1 + x )
1 − (1 + x2 )−n−1
= x2 1
1 − 1+x 2

1 + x2 − (1 + x2 )−n
= x2
1 + x2 − 1 (
1 1 + x2 für x 6= 0
= 1 + x2 − −→ s(x) =
(1 + x2 )n n→∞ 0 für x = 0
5 Funktionenreihen, Funktionenfolgen
5.1 Gleichmäßige Konvergenz 141

Also ergibt sich


(R
(1 + x2 )−n für x 6= 0
|s(x) − sn (x)| =
0 für x = 0

Es gilt ∀x ∈ [−1, 1]∀n ≥ N|s(x) − sn (x)| < ε ist äquivalent zu ∀x ∈ [−1, 1]|s(x) −
sN (x)| < ε ist äquivalent zu ∀x ∈ [−1, 1]\{0} : (1 + x2 )−N < ε ist äauivalent zu
− ln ε
∀x ∈ [−1, 1]\{0}N > ln(1+x 2 ) . Also kann ich nicht nur in Abhängigkeit von ε ein x finden.

Fazit N = N(ε, x), also liegt keine gleichmäßige Konvergenz vor.

Vorlesung CVII

Beispiel

sn = 1 + x2 − (1 + x2 )−n
s(x) − sn (x) = (1 + x2 )−n

Hier ist keine gleichmäßige Konvergenz vorhanden.


[Ich glaube das war die Wiederholung vom letzten Mal?]

Satz 5.2
[Ist das Satz 5.2?]
Gegeben fx ∈ C([a, b]), k ∈ N0 und

∑ fk (x)
k=0
gleichmäßig konvergent in [a, b].
Dann gilt

s(x) = ∑ fk (x) ∈ C([a, b])
k=0

Wenn die Summe gleichmäßig konvergent und die Funktion stetig ist, dann ist auch die
Summe stetig.

Beweis Sei s(x) = sn (x) + rn (x). Wir betrachten


|s(x) − s(y)| ≤ |sn (x) − sn (y)| + |rn (x) − rn (y)|
≤ |sn (x) − sn (y)| + |rn (x)| + |rn (y)| (∗)
5 Funktionenreihen, Funktionenfolgen
5.2 Beweistechnik für punktweise und gleichmäßige Konvergenz 142

Sei jetzt ε > 0 vorgegeben.


a) ∃N(ε) mit ∀x ∈ [a, b] gilt ∀n ≥ N : rn (x) < ε (gleichmäßige Konvergenz)
b) ∃δ (ε) mit ∀|x − y| < δ gilt |sN (x) − sN (y)| < ε (gleichmäßige Stetigkeit in [a, b], Satz
2.8 d))
Setze n = N in (∗), dann ergibt sich ∀x, y ∈ [a, b] mit |x − y| < δ gilt |s(x) − s(y)| < 3ε 

Bemerkung Gegenbeispiele bereits behandelt.

Umformulierung für Funktionenfolgen

lim lim sn (x) = lim lim sn (x)


x→x0 n→∞ n→∞ x→x0

Obige Aussage (»Wenn die gleichmäßige Konvergent erfüllt ist, dann kann die Grenz-
wertbildung vertauscht werden«) ist direkt in Satz 5.2 enthalten.
Als Gegenbeispiel für die Vertauschbarkeit betrachte man die Funktion f (x) = xn . Hier
gilt

lim lim xn = 0
x→1 n→∞
lim lim xn = 1
n→∞ x→1

denn die Konvergenz ist nicht gleichmäßig.

5.2 Beweistechnik für punktweise und gleichmäßige


Konvergenz
Aus der Übung mit Rony Bergmann.
Bei der punktweisen Konvergenz konvergiert der allgemeine Grenzwert (also der Grenz-
wert für alle x) gegen eine Funktion s.

∀x∀ε > 0∃N∀n ≥ N : |sn (x) − s(x)| < ε

Bei der gleichmäßigen Konvergenz kann die ganze Funktionenfolge ab einem n in einen ε-
Schlauch gepresst werden. Dieser Schlauch muss unabhängig von x beliebig klein werden
können. (Dies schließt durchaus keine Sprünge in der Grenzwertfunktion aus.)
Teste zunächst, ob für alle x ∈ I ein

lim sn (x) ∈ R
n→∞
5 Funktionenreihen, Funktionenfolgen
5.3 Differentiation und Integration 143

existiert.
Nein: Die Funktionenfolge ist nicht punktweise konvergent und damit auch nicht gleich-
mäßig konvergent.
Ja: Die Funktion ist punktweise konvergent. Prüfe nun auf gleichmäßige Konvergenz:
Stelle eine gute Vermutung an, ob die Funktionenfolge konvergiert.
Konvergiert die Funktionenfolge gleichmäßig, so existiert eine nicht von x abhängige
Nullfolge (an )n∈N , die den ε-Schlauch erzeugen kann. Es gilt

∀x ∈ I : |sn (x) − s(x)| < an

Konvergiert die Funktionenfolge nicht gleichmäßig, dann existiert eine von x abhängige
Folge (xn )n∈N , die als Argument für sn dafür sorgt, dass der Abstand von sn (xn ) und
s(xn ) nicht 0 wird. Es bleibt also immer ein Rest, der verhindert, dass der ε-Schlauch
beliebig klein werden kann. Es gilt

(sn (xn ) − s(xn ))n∈N

konvergiert nicht gegen 0. (Es liegt also Konvergenz gegen u 6= 0 oder Divergenz vor.)

5.3 Differentiation und Integration

Satz 5.3
Sei fk ∈ C([a, b])∀k ∈ N0 und

∑ fk (x)
k=0
konvergiere gleichmäßige in [a, b]. Dann gilt
Z b ∞ ∞ Z b

a k=0
∑ fk (x) dx = ∑ fk (x) dx
k=0 a

Beweis 1. Nach Satz 5.2 ist



∑ fk (x) ∈ C([a, b])
k=0

d. h. alle Integrale existieren, da alle Funktionen stetig sind.


5 Funktionenreihen, Funktionenfolgen
5.3 Differentiation und Integration 144

2. ∀n ∈ N0 gilt
Z b ∞ Z b n Z b ∞
∑ fk (x) dx = ∑ fk (x) dx + ∑ fk (x) dx
a k=0 a k=0 a k=n+1
n Z b Z b ∞
= ∑ fk (x) dx + ∑ fk (x) dx ∀n ∈ N
k=0 a a k=n+1

Wir sind fertig, falls


Z b ∞
lim ∑ fk (x) dx = 0
n→∞ a
k=n+1

3. Wir nutzen die gleichmäßige Konvergenz




∀ε > 0∃N(ε)∀x ∈ [a, b]∀n ≥ N ∑ fk (x) < ε

k=n+1

Damit folgt
Z b ∞
∑ fk (x) dx ≤ (b − a)ε∀n ≥ N

a k=0

Damit ist die offene Aussage am Ende von von 2. gezeigt.




Beispiel

x2k+1
Z b Z b ∞

a
sin x dx =
a
∑ (2k + 1)! (−1)k dx
k=0
| {z }
gleichmäßig konvergent für alle x ∈ R (Beweis später)

x2k+1
∞ Z b
=∑ a (2k + 1)! (−1)k dx
k=0
b

x2k+2 k+1

=∑ (−1)
k=0 (2k + 2)! a
b
x2k+2


(−1)k

=∑−
k=0 (2k + 2)! a
= cos a − cos b
5 Funktionenreihen, Funktionenfolgen
5.3 Differentiation und Integration 145

Satz 5.4
Sei fk0 ∈ C([a, b])∀k ∈ N0 ,

∑ fk (a)
k=0
konvergiere und

∑ fk0 (x)
k=0
konvergiere gleichmäßig in [a, b].
Dann gilt

∑ fk (x)
k=0
ist für alle x ∈ [a, b] differenzierbar und

d ∞ ∞
d
∑ f k (x) = ∑ fk (x)
dx k=0 k=0 dx

Bemerkung Die Vorraussetzung ist komplizierter als in Satz 5.3.

Beispiel


sin k2 x
∑ 2
k=1 k
ist gleichmäßig konvergent und

sin k2 x
∈ C([a, b])
k2


d sin k2 x ∞
∑ 2
= ∑ cos k2 x
k=0 dx k k=1

ist nicht konvergent, zumindestens für x = 0.

Beweis Sei ∞
s ∗ (x) = ∑ fk0 (x),
k=0
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 146

dann gilt nach Satz 5.2 s∗ ∈ C([a, b]). Also gilt nach Satz 5.3
Z x ∞ Z x
s ∗ (t) dt = ∑ fk0 (t) dt
a k=0 a

= ∑ ( fk (x) − fk (a)) =: s(x) − s(a)
k=0

Mit dem Hauptsatz der Integralrechnung ergibt sich

s ∗ (x) = s0 (x)

Also wissen wir, dass die Summe der Ableitungen der Ableitung der Summe entspricht.


5.4 Potenzreihen

Definition 5.5
Seien x0 ∈ R (oder C) und ak ∈ R (oder C), k ∈ N0

∑ ak (x − x0)k
k=0

heißt Potenzreihe mit Enwicklungspunkt x0 .

Beispiel

∞ ∞
xk
∑ xk , ∑
k=0 k=0 k!

Nur für den Fall, dass es noch keiner gemerkt hat: An dieser Stelle fügt sich alles ganz
wunderbar zusammen, da alle bekannten Funktionen als Potenzreihen sauber definiert
werden können. Im Folgenden werden wir jetzt die Frage der Konvergenz für Potenzreihen
untersuchen.
Jede Potenzreihe konvergiert im Entwicklungspunkt x0 . Wie sieht der Konvergenzbereich
in R (oder C) aus?
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 147

Satz 5.6

a) ∑ ak (x − x0)k konvergiere für x = x1 6= x0. Dann folgt damit, dass die Konvergenz-
k=0
reihe absolut konvergiert für alle x mit |x − x0 | < |x1 − x0 |

b) ∑ ak (x − x0)k divergiere für x = x2 . Dann folgt damit, dass die Konvergenzreihe
k=0
divergiert für alle x mit |x − x0 | > |x1 − x0 |

Geometrische Veranschaulichung
Wenn es bei x1 auf dem Zahlenstrahl konvergiert, dann konvergiert es auch für alle x, die
dichter dran sind an x0 , als x1 . Divergiert es für x2 , dann divergiert es auch für alle x, die
weiter weg von x0 sind als x2 .
In der Gaußschen Zahlenebene funktioniert das ganze genauso mit dem euklidischen Ab-
stand. Es entstehen also Kreise in der Ebene statt Bereiche auf der Zahlenebene.

Vorlesung CVIII

Beweis a) Aus der Konvergenz der Reihe



∑ ak (x1 − x0)k
k=0

folgt
∃C > 0 : ∀k : |ak (x1 − x0 )k | < C

Damit gilt
|x − x0 | = q|x1 − x0 | mit 0 ≤ q < 1
Also ergibt sich
|ak (x − x0 )k | = |ak ||x1 − x0 |k qk < Cqk
und wir erhalten die konvergente Majorante

C ∑ qk
k=0

b) Wir führen einen indirekten Beweis und nehmen zum Zwecke des Widerspruchs an,
die Reihe ∞
∑ ak (x − x0)k
k=0
sei konvergent. Dann ergibt sich mit a) die Konvergenz für x2 und wir erhalten einen
Widerspruch zur Annahme.

5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 148

Zusammenfassung des Satzes: Es gibt ein r (wobei r = ∞ möglich) mit

∀x mit |x − x0 | < r gilt Konvergenz (absolut!)


∀x mit |x − x0 | > r gilt Divergenz
∀x mit |x − x0 | = r keine Aussage

Dabei ist r der Konvergenzradius.

Beispiel
Zur Vereinfachung setzen wir x0 := 0.

a) Für die Folg


∞ ∞
xk ∞ xk
∑ xk , ∑ k
,∑ 2
k=0 k=0 k=0 k

gilt r = 1. Auf dem Rand liegt immer Divergenz vor, da die Folge x1 keine Nullfolge
ist.
Für die Folge
∞ ∞
xk ∞ xk
∑ xk , ∑ ,∑ 2
k=0 k=0 k k=0 k
gilt r = 1. Die harmonische und die alternierende harmonische Reihe (relle Zahlen -1,
1) sind bekannt. Für komplexe Zahlen ist der Rand verschieden.
Für die Folge
∞ ∞
xk ∞ xk
∑ xk , ∑ ,∑ 2
k=0 k=0 k k=0 k
gilt r = 1. Auf dem Rand liegt immer Konvergenz vor, da die unendliche Summe von
1/k2 immer konvergent ist.
b) Wir betrachten die Folge

xk
∑ k! =: ex .
k=0
Die Folge konvergiert für alle x ∈ C. Also gilt r = ∞.
c) Die Folge

∑ k!xk
k=0
ist immer divergent für x 6= 0. Also gilt r = 0.

Nachdem wir jetzt wissen, dass uns der Konvergenzradius schlaue Dinge liefern kann,
bleibt noch eine wesentliche Frage: Wie erhalten wir den Konvergenzradius?
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 149

Satz 5.7 Cauchy(1789–1857)-Hadamard(1865–1963)


Gegeben sei eine Potenzreihe mit Koeffizientem ak . Wir definieren
p
lim sup k |ak | =: A
k→∞

Der Konvergenzradius von



∑ ak (x − x0)k
k=0
ist 
∞
 falls A = 0
r = A1 falls 0 < A < ∞

0 falls A = ∞

Erinnerung: Wurzelkriterium für Zahlenreihen (Satz 1.26 b))



∑ ak (x − x0)k
k=0

konvergiert, falls q
lim sup k |ak ||x − x0 |k < 1
k→∞
und divergiert, falls q
k
lim sup |ak ||x − x0 |k > 1
k→∞

Beweis
p
k
p
lim sup |ak ||x − x0 | = lim sup k |ak ||x − x0 |
k→∞ k→∞
= A|x − x0 |
1
⇒r = , r = ∞(A = 0), r = 0(A = ∞)
A


Bemerkung Es gilt auch



ak
∑ ak (x − x0)k

∃ lim =r⇒
k→∞ a k+1

k=0

hat Konvergenzradius r.
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 150

Beispiel


∑ k(x + 1)k
k=0
p
k
lim sup |k| = 1 = A
k→∞
⇒r=1

Beispiel

∞ ∞ ∞
∑ 2k x2k = ∑ 2k (x2)k = ∑ 2k yk
k=0 k=0 k=0
konvergiert genau dann, wenn |2y| < 1, also r = 1/2

(
2k/2 falls k gerade
ak =
0 falls k ungerade
p √
lim sup k |ak | = 2 = A
k→∞

1 2
r= √ =
2 2

5.4.1 Rechnen mit Potenzreihen

Wir betrachten ohne Beschränkung der Allgemeinheit Potenzreihen mit x0 = 0.


∑ ak xk habe Konvergenzradius r > 0
k=0

Wir definieren für |x| < r die Funktion f mit



f (x) = ∑ ak x k
k=0
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 151

Lemma 5.8
Für alle b mit 0 < b < r konvergiert

∑ ak xk
k=0

gleichmäßig in |x| ≤ b.

Beweis Sei ε > 0 gegeben. Wir wählen dann N so, dass



∑ |ak bk | < ε.
k=N

Damit ergibt sich


∞ ∞
∀|x| ≤ b : ∑ ak xn ≤ ∑ |ak bk | < ε

k=N k=N


Satz 5.9
Die Funktion ∞
f (x) = ∑ ak x k
k=0
habe einen Konvergenzradius r > 0 (also |x| < r). Dann gilt
1. f : (−r, r) → R(C) ist stetig.
2. Für −r < x < r gilt
Z x Z x ∞

0
f (t) dt = ∑ akt k dt
0 k=0
∞ Z
= ∑ ak t k dt
k=0

a
= ∑ k +k 1 xk+1
k=0

ak+1 k
= ∑ x
k=1 k

Wir erhalten wieder eine Potenzreihe mit Potenzradius r.


5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 152

3. f ist beliebig differenzierbar in (−r, r) mit



f 0 (x) = ∑ ak kxk−1
k=1

Rekursiv ergibt sich für alle p ∈ N


∞ ∞
k! (k + p)! k
f (p) = ∑ ak xk−p = ∑ ak+p x
k=p (k − p)! k=0 k!

Beweis 1. Lemma 5.8 und Satz 5.2


2. Lemma 5.8 und Satz 5.3
3.
∑ ak kxk−1
k
hat den Konvergenzradius r. Nach Lemma 5.8 gilt für alle ε > 0

∑ ak kxk−1
k=1

gleichmäßig konvergent in |x| < r − ε.


Außerdem ist ∞
∑ ak x k
k=0
konvergent. Damit liefert Satz 5.4 die Behauptung.


Vorlesung CIX

Bemerkung • Abelsche Stetigkeit : Konvergiert



∑ ak rk ,
k=0

dann konvergiert

∑ ak x k
k=0
gleichmäßig in [0, r]. Analoges gilt für x = −r.
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 153

• Weierstraß’sches Maiorantenkriterium : Gegeben eine Funktion fa : D → R(C).


Existiert eine von x ∈ D unabhängige Folge (cn ), so dass

∀n ≥ N∀x ∈ D| fn (x)| ≤ cn

und ∞
∑ cn
k=0
ist konvergent. Dann ist

∑ fn(x)
k=0
gleichmäßg konvergent gegen s : D → R(C).

Beispiel


1
= ∑ xk für − 1 < x < 1
1 − x k=0

Z x
1
− ln(1 − x) = dt
0 1−t
∞ Z x
= ∑ t k dt
k=0 0

xk+1
= ∑
k=0 k + 1
∞ k
x
= ∑ für − 1 < x < 1
k=1 k

Für x = −1 ergibt sich

(−1)k

− ln 2 =∑ k
k=0
1 1 1 1 1
= 1− + − + − +...
2 3 4 5 6
Ersetzen wir x durch −x, so ergibt sich

xk+1 k

− ln(1 + x) = ∑ x für − 1 < x < 1
k=0 k
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 154

Beispiel


1
=
1 + x2 k=0∑ (−1)k x2k für |x| < 1
Z x
dt
arctan x = 2
0 1+t

(−1)k 2k+1
=∑ x für |x| < 1
k=0 2k − 1

π ∞
(−1)k
arctan 1 = =∑
4 k=0 2k + 1
1 1 1
= 1− + − +...
3 5 7

Beispiel


2 1
e−x = ∑ k! (−x2)k
k=0

1
= ∑ k! (−1)k x2k
k=0

Beispiel

2 xZ
2
erf(x) = √ e−t dt
π 0
2 ∞ (−1)k 2k+1
= ∑ x ∀x ∈ C
π k=0 k!(2k + 1)
lim erf(x) = 1
x→∞

Beispiel
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 155

sin x ∞
(−1)k 2k+1
=∑ x ∀x ∈ C
x k=0 (2k − 1)!

Beispiel Integralsinus

Z x
sint
Si(x) = dt
0 t

(−1)k x2k+1
= ∑ (2k + 1)!(2k + 1)
k=0

Satz 5.10
Gegeben seien die Funktion

f (x) = ∑ ak x k
k=0
mit Konvergenzradius r1 > 0 und die Funktion

g(x) = ∑ bk x k
k=0

mit Konvergenzradius r2 > 0. Dann gilt für alle x mit |x| < min(r1 , r2 )

α f (x) + β g(x) = ∑ (αak + β bk )xk
k=0

Insbesondere gilt
∞ ∞
f (x)g(x) = ∑ xn ∑ ak bn−k
n=0 n=0

= ∑ xn(a0bn + a1bn−1 + a2bn−2 + . . . + anb0)
n=0

Beweis nach Kapitel 2 

Beispiel
5 Funktionenreihen, Funktionenfolgen
5.4 Potenzreihen 156


xk
ex = ∑ ∀x ∈ C
k=0 k!

1
= ∑ xk ∀|x| < 1
1 − x k=0
!
n
ex ∞
1
=∑
1 − x k=0 ∑ k! · 1 xk ∀|x| < 1
k=0

Satz 5.11 Identitätssatz für Potenzreihen


Gegeben seien die Potenzreihen

∑ ak xk
k=0
und ∞
∑ bk xk
k=0
mit positiven Konvergenzradien r1 und r2 . Weiter sei ein ε derart gegeben, dass 0 < ε <
min(r1 , r2 ) mit
∞ ∞
∑ ak xk = ∑ bk xk ∀|x| < ε.
k=0 k=0
Dann gilt für alle k ∈ N0
ak = bk .

Beweis Für x = 0 ergibt sich a0 = b0 . Durch Subtraktion von a0 , b0 und Division durch
x ergibt sich
∞ ∞
∑ ak xk−1 = ∑ bk xk−1∀|x| < ε, x 6= 0.
k=1 k=1
Jetzt ergibt sich für x = 0 die Aussage a1 = b1 . Verfahre rekursiv weiter . . . 

Bemerkung 1. Der Identitätssatz für Polynome heißt auch Methode des Koeffizi-
entenvergleichs für Polynome.
2. Die Rückrichtung ist trivial.
3. Eine Funktion kann bei festem x0 auf höchstens eine Weise in eine Potenzreihe
entwickelt werden. Aber allgemein gilt zum Beispiel

xk ∞
e
ex = ∑ k! = eex−1
= ∑ k! (x − 1)k
k=0 k=0
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 157

4. Der Beweisschritt der Division durch x kann durch die Differntiation ersetzt wer-
den.
Sei dazu

f (x) = ∑ ak (x − x0)k
k=0
ak = f (x0 )
a1 = f 0 (x0 )
f 00 (x0 )
s2 =
2!
(k)
f (x0 )
ak =
k!

Dass heißt, jede Potenzmenge ist seine eigene Taylor-Reihe



f (k) (x0 )
f (x) = ∑ (x − x0 )k
k=0 k!

5. I sei ein offenes Intervall auf R. Dann heißt die Funktion f : i → R in I reell analy-
tisch, falls f in jedem Punkt von I in eine Potenzreihe mit positivem Konvergenz-
radius entwickelbar ist.

5.5 Fourier-Reihen
Wärmeausbreitung in endlichem Staal. Frz. Zeitung 19. Jahrhundert; Wettbewerb.
Signalanalyse von akustischen und optischen Wellen.

Definition Periodische Funktionen


Sei T > 0, f : R ⊃ D → C heißt T − Periodisch, falls

∀x ∈ D f (x ± T ) = f (x)

Beispiel
sin x, cos x sind 2π-periodisch
Die Peridizität ergibt sich sofort, wenn man die trigonometrischen Funktionen geome-
trisch erklärt. Aber wir wissen ja inzwischen, dass es viel toller ist, alles Funktionen als
Reihen zu definieren. Also tun wir das:
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 158


1
eix = ∑ k! (ix)k ∀x ∈ C
k=0

1 1
= ∑ (2k)! (−1)k x2k +i ∑ (2k + 1)! (−1)k x2k+1
k=0 k=0
| {z } | {z }
cos x sin x
= cos x + i sin x

Nach dem Leibnitz-Kriterium ergibt sich folgende Fehlerabschätzung

22 24 1
cos 2 ≤ 1 − + =−
2! 4! 3
x 3 x 2 22 x
sin x ≥ x − ≥ x(1 − ) ≥ x(1 − ) = ∀x ∈ [0, 2]
3! 3! 3! 3

d
cos x = − sin x < 0 ∀0 ≤ x ≤ 2
dx
Also ist auf dem betrachteten Intervall cos x steng monoton fallend.
1
cos 2 ≤ −
3
cos 0 = 1

Mit dem Zwischenwertsatz erhalten wir: Es existiert genau eine Nullstelle. Wir nennen
diese π/2 und haben damit π rein analytisch definiert.

eiπ/2 = i sin π/2


e−iπ/2 = −i sin π/2
eiπ/2+(−iπ/2) = 1 = sin2 π/2
⇒ sin π/2 = 1(da sin π/2 > 0)

Mit dieser Definition von π erhalten wir nun

eiπ/2 = i

eiπ = −1

Diese Formel ist nicht aufgrund ihrer besonderen Bedeutung, sondern aufgrund ihrer
besonderen Esthetik hervorgehoben: Alle zentralen Symbole der Analysis in einer Formel
verein: π, e, i, −, 1, =.
e2πi = 1
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 159

∀x ∈ C : ei(x+π/2) = eix

Also ist ei◦ ist 2π-periodisch.


f (x) = const ist T -periodisch für alle T > 0. Es gibt also keine kleinste Periode.
Diriklet-Funktion
(
1 wenn x ∈ Q
ΞQ (x) =
0 sonst

hat genau jedes rationale T > 0 als Periode.

Aus der T -Periodizität von f folgt die nT -Periodizität von f für alle n ∈ N.
Sinf f und g T -periodisch, dann ist die Funktion α f + β g T -periodisch.
Es sei eine T -periodische Funktion f auf R gegeben. Dann gilt
Z a+T Z T
f (x) dx = f (x) dx
a 0
Z T /2
= f (x) dx
−T /2

Ist f T -periodisch, dann gilt  


xT
F(x) = f

ist 2π-periodisch.
F ist keine Stammfunktion. Aus irgendwelchen Gründen sind uns aber schon wieder die
Buchstaben ausgegangen.
Wir können also jetzt nur noch 2π-periodische Funktionen betrachten und können die
Ergebnisse durch diese einfache Transformationen auf T -periodische Funktionen über-
tragen.

Beweis Es gilt für alle x ∈ C


 
(x + 2π)T
F(x + 2π) = f

 
xT
=f +T

 
xT
=f = F(x)


5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 160

5.5.1 »Periodische Fortsetzung«

Gegeben sei eine Funktion f : [0, T ] → C. Diese kann fortgestzt werden


• T -periodisch (nur für [0, T ) → C) [Skizze von Fleischerhaken immer wieder]
• gerade 2T -periodisch
Eine Funktion ist gerade, falls f (x) = f (−x)
[Skizze von Möwen immer wieder]
• ungerade 2T -periodisch (nur für f : (0, T ) → C) und f (0) = f (T ) = f (−T ) = 0
Eine Funktion ist ungerade, falls f (x) = − f (−x)
[Skizze von Fleischerhaken am Nullpunkt gespiegelt immer wieder.] Meist wird f
und seine periodische Fortsetzung gleich bezeichnet.

5.5.2 Trigonometrische Polynome

Grundbausteine der Fourier-Analyse


n ∞ ∞
f (k) k
Polynom ∑ ck xk liefert die Potenzreihe ∑ ck xk und die Taylor-Reihe ∑ k!
x
k=0 k=0 k=0

Trigonometrische Polynome sind Polynome in z = eix . Dabei gilt für alle x ∈ R : eix =
cos x + i sin x und bildet den Einheitskreis.
Für alle x gilt
n
Tn (x) = ∑ ck eikx
k=−n
= c0 + c1 eix + c−1 e−ix + . . . + cn einx + c−n e−inx
= c0 + (c1 + c−1 ) cos x + i(c1 − c−1 ) cos x + . . . + (cn + c−n ) cos x + i(cn + c−n )i sin x

n
a0
= + ∑ (ak cos kx + bk sin kx)
2 k=1
n
= ∑ ck eikx
k=−n

mit den Ersetzungsformelm von Euler-Moivre

ak = ck + c−k
bk = i(ck − c−k )
(a0 = 2c0 )
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 161

für alle k = 1, 2, 3, . . .
Umgekehrt ergibt sich
1
ck = (ak − ibk )
2
1
c−k = (ak + ibk )
2
a0
c0 =
2
für alle k = 1, 2, 3, . . .

Satz 5.12
Sei tn ein trigonometrische Polynom vom Grad n, dann gilt
a) Tn ist 2π-periodisch
b) Tn hat in [0, 2π) höchstens 2n Nullstellen
c) ∀x ∈ C Tn (x) = 0 ⇐⇒ ∀k ∈ {−n, . . . , n} ck = 0 ⇐⇒ ∀k ∈ {1, . . . , n} ak = bk = 0
und a0 = 0
d) Tn ist genau dann reell (d. h. Tn (x) ∈ R∀x ∈ R), wenn ck = −c−k für alle −n ≤ k ≤ n.
(Was genau dann der Fall ist, wenn alle ak und bk reell sind.)
e) Euler-Moivre: Es gilt für alle k ∈ Z

1 2π
Z
ck = Tn (x)eikx dx
2π 0
1 2π
Z
ak = Tn (x) cos kx dx
π 0
1 2π
Z
bk = Tn (x) sin kx dx
π 0

Betrachten wir das Polynom


n
∑ ck xk pn(x),
k=0
dann gilt
(k)
pn (0)
ck =
k!

Vorlesung CX
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 162

eix = cos x + i sin x


n
Tn (x) = ∑ ck eikx
k=0
n
a0
Tn (x) = + ∑ ak cos kx + bk sin kx
2 k=0

Beweis 1. ist trivial


2. Wir schreiben das Polynom ein wenig um und definieren ein z, sodass gilt:
n
Tn (x) = ∑ ck eikx
k=0
| {z }
x∈[0,2π]
n
= ∑ ck zk
k=−n
| {z }
z auf dem Einheitskreis in C

Der Übergang von x ∈ [0, 2π) zu z auf dem Einheitskreis in C ist eine Bijektion.
Also fragen wir nach den Nullstellen von
2n
z−n ∑ ck−n zk
k=0

auf dem Einheitskreis.


Nach dem Fundamentalsatz der Algebra (»Ein Polynom n-ten Gerades hat höchs-
tens genau n Nullstellen.«) hat das Polynom höchstens 2n Nullstellen.
3. Hat Tn mehr als 2n Nullstellen auf dem Einheitskreis, dann gilt nach b): Das Poly-
nom ist identisch 0, also ist ck = 0 für alle k ∈ Z.
4. Tn ist reellwertig genau dann, wenn alle ak , bk ∈ R.
Nach dem Umrechungsformeln von Euler-Moivre gilt

ak = ck + ck

Also sind genau dann alle ak reell, wenn gilt

∀k = 0, . . . , n Im ck = − Im c−k

Weiter gilt nach Euler-Moivre

bk = i(ck − c−k )
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 163

Also sind genau dann alle bk reell, wenn gilt

∀k = 0, . . . , n Re ck = Re c−k

5. Es gilt für alle l = −n, . . . , n


Z 2π n Z 2π
−ilx
Tn (x)e dx = ∑ ck ei(k−l)x dx
0 k=−n 0

n 2π für k = l
= ∑ ck k=2π
ei(k−l)x
für k 6= l

k=−n

i(k−l) k=0
= 2πcl

n Z 2π
1
Tn (x) = ∑ Tn (x)e−ikx dx eikx
k=−n |2π 0
{z }
ck

Im reellen ergibt sich für alle l = 0, . . . , n


Z 2π Z 2π
a0
Tn (x) cos lx dx = cos lx dx
0 2 0
n Z 2π
+ ∑ ak cos kx cos lx dx
k=0 0
n Z 2π
+ ∑ bk sin kx cos lx dx
k=1 0
|

{z }
−π ungerade · gerade=0
(
πa0 für l = 0
=
πal für l > 0
= πal

a0 für l = 0 ergibt sich aus dem ersten Integral. al für l > 0 ergibt sich aus dem
zweiten Integral für den Fall k 6= l, denn es gilt

cos(k + l) + cos(k − l)x


cos kx cos lx = .
2
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 164

Z 2π
1
Tn (x) = Tn (t) dt
π 0
n Z 2π
1
+∑ Tn (t) cos kt dt cos kx
k=1 |π 0
{z }
ak =ak (Tn )
n
1 2π
Z
+∑ Tn (x) sin kt dt sin kx
k=1 π | 0
{z }
bk =bk (Tn )

ck (Tn ), ak (Tn ) und bk (Tn ) heißen Fourier-Koeffizienten.




Bemerkung Es gelten die Orthogonalitätsrelationen:


Z 2π
1
eilt
eikt |{z}
2π 0
e−ilt
(
1 für k = l
= δkl =
0 für k 6= l

1 2π
Z 2 für l = k = 0

cos lt cos kt dt = 1 für l = k 6= 0
π 0 
0 für l 6= k

(
1 π 1 für k = l > 0
Z
sin kt + sin lt dt =
π 0 0 sonst
1
sin kt cos lt dt = 0
π

Beispiel »Dirichlet-Kern«

n n
Dn (x) = ∑ eikx = ∑ (cos kx + i sin kx)
k=−n k=−n
n
= 1 + 2 ∑ cos kx
k=1
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 165

Mit dem immer gegenwärtigen z := eix ergibt sich


2n
−n
Dn (x) = z ∑ zk
k=0
z2n+1 −z
(
zn (z−1) für z 6= 1
=
2n + 1 für z = 1

Im Falle z 6= 1 ergibt sich weiter

zn+1/2 − z−n−1/2
Dn (x) =
z1/2 − z−1/2
ei(n+1/2)x − ei(n+1/2)x
=
eix/2 − eix/2
sin(n + 1/2)x
=
sin x/2

Wir haben jetzt den Fall z 6= 1, also x 6= 2πl für alle l ∈ Z betrachtet. Im anderen Fall
z = 1, also x = 2πl für alle l ∈ Z gilt weiterhin 2n + 1.
andere Beweisidee

2 sin x/2 cos kx = sin(k + 1/2) − sin(x − 1/2)x

Den Dozenten juckt es an dieser Stelle in den Fingern endlich wieder einen Grenzwert
zu berachten, also widmen wir uns jetzt dieser Fragestellung.


lim Dn (x) = 1 + ∑ cos kx
n→∞
( k=1
∞ (bestimmt diveregnt) für x = 2lπ
=
unbestimmt divergent sonst

Die ganze Gleichheit ist also irgendwie Mist, da der Grenzwert garnicht existiert. Also
sowas besser nicht hinschreiben. (Außer Du bist Dozent einer Analysis-Vorlesung.)
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 166

Trigonometrische Reihen sind Reihen der Form


∞ n
∑ ck eikx := lim ∑ ck eikx
k=−∞ k→∞ k=−n
n
a0
= + lim ∑ (ak cos kx + bk sin kx)
2 n→∞ k=1

a0
= + ∑ ak cos kx + bk sin kx
2 k=1

Wir gelangen zu der grundsätzlichen Frage:


Existiert der Grenzwert?
Beispiel gutartig
Da |eix | = 1 konvergiert folgende Reihe genau für |r| < 1:
∞ n ∞
∑ reix = ∑ rneinx
n=0 n=0
∞ ∞
= ∑ rn cos nx + i ∑ rn sin nx
n=0 n=0
1
=
1 − reix
1 − r cos x + ir sin x r sin x
= 2 2
+i
(1 − r cos x) + (r sin x) (1 − cos x)2 + (r sin x)2

Also erhalten wir durch diese Umformung



1 − r cos x + ir sin x
∑ rn cos nx = (1 − r cos x)2 + (r sin x)2
n=0
1 − r cos x
=
1 + r2 − 2r cos x


r sin x
∑ rn sin nx = (1 − cos x)2 + (r sin x)2
n=0
r sin x
=
1 + r2 − 2r cos x

Beispiel für obiges Beispiel


5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 167

Wir betrachten den Fall r = 1/2:



cos nx 1 − 1/2 cos x
∑ n
=
n=0 2 5/4 − cos x
4 − 2 cos x
=
5 − 4 cos x

Vorlesung CXI


r sin x
∑ rk sin kx = 1 − 2r cos x + r2
k=1
mit x ∈ R und −1 < r < 1. Die Reihe konvergiert gleichmäßig in x.

Satz 5.13
Die Reihe ∞
∑ ck eikx
k=−∞

konvergiere gleichmäßig auf [0, 2π] gegen eine Funktion f in Abhängigkeit von x. Dann
gilt
a) f ist stetig auf R und 2π-periodisch. Diese Funktionenklasse bezeichnen mir mit C2π .
b)
1
Z π
ck = ck ( f ) = f (t)e−ikt dt
2π −π

Beweis a) Satz 5.2:


Eine gleichmäßig konvergente Reihe stetiger Funktionen konvergiert stets gegen eine
stetige Funktion.
b) Nach Satz 5.3 (?) ist die gliedweise Integration erlaubt.

f (x) = ∑ ck eikx
k=−∞
Z 2π ∞
1 1
eilx f (x) = ∑ ck eikx e−ilx dx
2π 0 k=−∞ 2π
∞ Z 2π
1
= ∑ ck eix(k−l) dx = cl
k=−∞ 2π 0
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 168


 eix(k−l) 2π

1 2π ix(k−l) falls k − l 6= 0
Z
e dx = i(k−l) 0

2π 0 1 falls k = l

Bemerkung Theorie der nicht gleichmäßig konvergenten trigonometrischen Reihen


hat Analysis der letzten 200 Jahre wesentlich geprägt.

[prestin-antritt.pdf / Fourier-Analyse]

das Fundamentalbeispiel

Im folgenden sei

1
s(x) = ∑ k sin kx
k=1
−i ikx
= ∑ e
k∈Z\{0}
2k

Satz 5.14

a) Es gilt für alle x ∈ R (punktweise Konveregenz)



1
 2 (π − x)
 für 0 < x < 2π
s(x) = 0 für x = 2nπ, n ∈ Z

2π-periodisch forgesetzt sonst

b) s konvergiert auf jedem Intervall [a, b], das kein 2nπ enthält.
s(x+) + s(x−)
c) s(x) =
2
d) Gibbs-Phänomen (1839–1909)
1 30 1
[Skizze von ∑∞
k=1 k sin kx und ∑k=0 k sin kx]

Für hinreichend große n überschwingen die Partialsummen


n
1
sn (x) = ∑ k sin kx
k=1

den Sprung von s um ≈ 17.89%.


5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 169

Beispiel
Wir verwenden die Aussage b) aus obigem Satz: Im Interval 0 < x < 2π liegt gleichmäßige
Konvergenz vor; also dürfen wir gliedweise integrieren.
∞ Z x Z x
sin kt 1
∑ π k dt = π 2 (π − t) dt
k=0


cos kx π x2
−∑ 2
= x − +C
k=1 k 2 4
Also konvergiert

cos kx
∑ 2
k=1 k
gleichmäßig auf R. Somit gilt die Gleichung für 0 ≤ x ≤ 2π.
Bestimmung von C:
Z 2π ∞
cos kt
0= ∑ dt
0 k=1 k2
t2
Z 2π  
π
= t − +C dt
0 2 4
2π 3 π2
= π3 − + 2πC ⇒ C = −
3 6

(x−π)2
(  2 3 2


cos kx − π2 x − x4 − π6 = 4 − π12 falls 0 ≤ x ≤ 2π
∑ 2
=
k=1 k 2π-periodisch forgesesetzt sonst

[Skizze]
Für x = 0 erhalten wir

1 π2
∑ k2 = 6
k=1

Für x = π erhalten wir



(−1)k π2
∑ 2 = −
k=1 k 12

Zusammen erhalten wir



1 π2
∑ (2k)2 = 24
k=1
1 π2
∑∞ =
k=1 (2k + 1)2 8
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 170

5.5.3 Fourier-Reihen

Gegeben ein 2π-periodisches f . Üblicherweise muss vorrausgesetzt werden, dass f Rie-


mann integrierbar über [0, 2π] ist. Angenehmer wird es, wenn f ∈ C2π . Weiter Vorraus-
setzungen ermöglichen oft weitere Betrachtungen.
Die trigonometrische Reihe

∑ ck eikx
k=−∞
heißt Fourier-Reihe einer Funktion f , falls
Z 2π
1
∀k ∈ Z : ck = ck ( f ) = f (t)eikt dt
2π 0

Die ck heißen Fourier-Koeffizienten


Wir schreiben
˜∞
f (x)∑ c ( f )eikx
k=−∞ k

Approximative Variante
n
Sn f (x) = ∑ ck ( f )eikx
k=−n

Satz 5.15
Sei f zweimal stetig differenzierbar und 2π-periodisch auf R. Dann gilt

∀x ∈ R : f (x) = ∑ ck ( f )eikx
k=−∞

n Z 2π
1
Sn f (x) = ∑ f (t)e−ikt dteikt
k=−n 2π 0
n
1 2π
Z
= f (t) ∑ eik(x−t) dt
2π 0 k=−n
| {z }
Dirichlet-Kern Dn (x − t)
1 2π
Z
= f (x − t)Dn (t) dt
2π 0
1 2π
Z
= f (t)Dn (x − t) dt
2π 0
5 Funktionenreihen, Funktionenfolgen
5.5 Fourier-Reihen 171

FFT
n
∑ ck eikxl
k=−n
für l = 1, . . . , N bei gegebenen Koeffizientenn ck .
2n + 1 Operationen für ein xl .
(2n + 1)2 Operationen für N = 2n + 1.
FFT benötigt n log n Operationen.