Sie sind auf Seite 1von 188

Analysis 2

für Technische Mathematik

Dezember 2010

Michael Kaltenbäck
Inhaltsverzeichnis

8 Das Riemannsche Integral 1


8.1 Ober- und Untersummen . . . . . . . . . . . . . . . . . . . . . . . . 1
8.2 Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . 5
8.3 Integrale von stetigen Funktionen . . . . . . . . . . . . . . . . . . . . 10
8.4 Differential und Integralrechnung . . . . . . . . . . . . . . . . . . . . 12
8.5 Weitere Eigenschaften des Integrals . . . . . . . . . . . . . . . . . . 16
8.6 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . 17
8.7 Vertauschung von Integralen mit Grenzwerten . . . . . . . . . . . . . 20
8.8 Mittelwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

9 Normen, Banachräume und Fourierreihen 33


9.1 Normierte Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
9.2 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . 39
9.3 Reihen, Integrale, etc. mit Werten in einem normierten Raum . . . . . 43
9.4 Skalarprodukträume und Orthogonalsysteme . . . . . . . . . . . . . . 54
9.5 Fourierkoeffizienten und Konvergenz von Fourierreihen . . . . . . . . 57
9.6 Gleichmäßige Konvergenz von Fourierreihen . . . . . . . . . . . . . 62
9.7 Fejér Kern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

10 Ableitungen nach mehreren Variablen 69


10.1 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 69
10.2 Hauptsatz über implizite Funktionen . . . . . . . . . . . . . . . . . . 78
10.3 Der Umkehrsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
10.4 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
10.5 Extremwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
10.6 Lagrange Multiplikatoren . . . . . . . . . . . . . . . . . . . . . . . . 99

11 Wegintegrale 103
11.1 Wege . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
11.2 Wegintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
11.3 Homotopie, einfacher Zusammenhang . . . . . . . . . . . . . . . . . 121
11.4 Holomorphe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 126

12 Topologische Grundlagen 135


12.1 Topologische Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . 135
12.2 Abgeschlossene Mengen . . . . . . . . . . . . . . . . . . . . . . . . 140
12.3 Stetige Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . 143
12.4 Basis, Subbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

i
ii INHALTSVERZEICHNIS

12.5 Initiale Topologie und Finale Topologie . . . . . . . . . . . . . . . . 151


12.6 Trennungseigenschaften . . . . . . . . . . . . . . . . . . . . . . . . 157
12.7 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
12.8 Kompaktheit in metrischen Räumen . . . . . . . . . . . . . . . . . . 166
12.9 Alexandroff-Kompaktifizierung lokalkompakter Räume . . . . . . . . 171
12.10Der Satz von Stone Weierstraß . . . . . . . . . . . . . . . . . . . . . 173

Literaturverzeichnis 181

Index 182
Kapitel 8

Das Riemannsche Integral

8.1 Ober- und Untersummen


Schon die Mathematik der Antike beschäftigte man sich mit der Problemstellung, die
Fläche gewisser Figuren zu berechnen. Bei Polygonen ist dies durch Zerlegung in Drei-
ecke unmittelbar möglich, bei krummlinigen Figuren ist dagegen nicht einmal so klar,
wie Fläche überhaupt zu definieren ist.
8.1.1 Beispiel. Betrachte die Parabel gegeben durch f (x) = x2 .
Wir sind an der Fläche, die von der x-Achse, der Parabel und der Geraden x = 1
begrenzt wird, interessiert. Dazu könnte man, unserer intuitiven Vorstellung von Fläche
folgend, so vorgehen, dass man die Fläche in Streifen der Breite △x zerlegt, z.B.
△x = 1n , und die Fläche eines Streifens durch das Rechteck mit der Breite △x und
der Höhe min f (x) approximiert, wobei das Minimum über die im betrachteten Strei-
fen liegenden x-Koordinaten genommen wird. Ist △x sehr klein, so wird man hoffen,
dass die Summe der Flächen aller dieser Rechtecke fast gleich der zu bestimmenden
Fläche ist.

f (x) = x2 f (x) = x2
1 1

n=4 n=8

0 1 0 1

Abbildung 8.1: Approxiomation der Fläche von unten

In unserem Fall erhält man auf dieser Art und Weise die folgende Näherung für die
Gesamtfläche A:

X
n
1 1 1
An = min{ f (x) : (k − 1) ≤ x≤k }· =
k=1
n n n

1
2 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

X !2
1 X 2
n n−1
k−1 1 1 (n − 1)n(2n − 1)
= · = 3 k = 3 .
k=1
n n n k=0
n 6

Lässt man in dieser Formel n immer größer werden, so erhält man A = limn→∞ An = 31 .
Genauso könnte man natürlich die Fläche des Streifens durch das Rechteck mit
der Breite △x und der Höhe max f (x) approximieren. Unserer Vorstellung von Fläche
folgend sollte bei dieser zweiten Methode zur Flächenbestimmung das selbe heraus-
kommen.

f (x) = x2 f (x) = x2
1 1

n=4 n=8

0 1 0 1

Abbildung 8.2: Approxiomation der Fläche von oben

In der Tat gilt


X
n
1 1 1 X k2 1
n
Ân = max{ f (x) : (k − 1) ≤ x≤k }· = =
k=1
n n n k=1 n2 n

1 X 2
n
1 n(n + 1)(2n + 1)
= k = 3 ,
n3 k=1 n 6

und für n → ∞ erhält man wieder A = limn→∞ Ân = 31 .


Wir wollen den Zugang aus dem letzten Beispiel formalisieren.

8.1.2 Definition. Sei [a, b] ein endliches Intervall in R. Wir nennen eine endliche Teil-
menge Z von [a, b] eine Zerlegung des Intervalls [a, b], falls a, b ∈ Z.
Wir bezeichnen mit Z die Menge aller solcher Zerlegungen, versehen diese Menge
mit der Relation ⊆, und erhalten damit eine gerichtete Menge (vgl. Definition 5.3.1).
Wollen wir die Elemente einer Zerlegung Z aufzählen, so werden wir das immer
so tun, dass n(Z) + 1 die Mächtigkeit von Z bezeichnet, und dass
Z = {ξ j : j = 0, . . . , n(Z)}, wobei

a = ξ0 < ξ1 < · · · < ξn(Z) = b.

Sei nun f : [a, b] → R eine beschränkte Funktion. Zu einer gegebenen Zerlegung


Z = {ξ j : j = 0, . . . , n(Z)} ∈ Z bezeichnen wir mit U(Z) die zu Z gehörige Unter-
summe von f , also die Summe der Flächen der Rechtecke unter der Funktion f , die zur
gegebenen Zerlegung gehört:

X
n(Z)
U(Z) = (ξ j − ξ j−1 ) inf f (t). (8.1)
t∈[ξ j−1 ,ξ j ]
j=1
8.1. OBER- UND UNTERSUMMEN 3

Entsprechend definieren wir die Obersumme


X
n(Z)
O(Z) = (ξ j − ξ j−1 ) sup f (t). (8.2)
j=1 t∈[ξ j−1 ,ξ j ]

f (x)

Z: a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 = b

f (x)

Z: a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 = b

Abbildung 8.3: Veranschaulichung einer Unter- bzw. Obersumme

Da wir f als beschränkt voraussetzen, existieren diese Ober- und Untersummen.


P
Klarerweise gilt wegen b − a = n(Z)
j=1 (ξ j − ξ j−1 )
(b − a) inf f (t) ≤ U(Z) ≤ O(Z) ≤ (b − a) sup f (t).
t∈[a,b] t∈[a,b]

Wir sehen also, dass alle Ober- und Untersummen gleichmäßig nach oben und nach
unten beschränkt sind. Somit ist folgende Definition sinnvoll.
8.1.3 Definition. Wir setzen
b
Z− Zb
f dx := inf Z∈Z O(Z), f dx := supZ∈Z U(Z),
a −
a

und bezeichnen die erste Zahl als das obere- und die zweite als das untere Integral von
f über [a, b].
Die Funktion f heißt integrierbar auf [a, b], falls das obere mit dem unteren Integral
übereinstimmt. In diesem Fall bezeichnen ihren gemeinsamen Wert als das Integral1
1 Man spricht auch vom Darbouxschen Integral.
4 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

von f über [a, b]:


b
Z b Z− Zb
D− f dx = f dx = f dx.
a
a −
a

8.1.4 Bemerkung. Da die Menge Z aller Zerlegungen von [a, b] bezüglich ⊆ eine ge-
 
richtete Menge ist, können wir von den Netzen U(Z) Z∈Z und O(Z) Z∈Z sprechen.
Sei nun Z1 ⊆ Z2 , wobei Z1 = {ξ j : j = 0, . . . , n(Z1 )} sowie
Z2 = {ηk : k = 0, . . . , n(Z2 )}. Ist j ∈ {1, . . . , n(Z1 )}, so gibt es Indizes k( j − 1) < k( j),
sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
| {z }
k( j)−k( j−1)−1 viele
Pk( j)
Wegen (ξ j − ξ j−1 ) = k=k( j−1)+1 (ηk − ηk−1 ) folgt

k( j)
X
(ξ j − ξ j−1 ) inf f (t) = (ηk − ηk−1 ) inf f (t) ≤
t∈[ξ j−1 ,ξ j ]
k=k( j−1)+1 t∈[ξ j−1 , ξ j ]
| {z }
⊇[ηk−1 ,ηk ]

k( j)
X
(ηk − ηk−1 ) inf f (t).
t∈[ηk−1 ,ηk ]
k=k( j−1)+1

Summiert man über alle j ∈ {1, . . . , n(Z1 )} auf, so erhält man U(Z1 ) ≤ U(Z2 ). Wir

sehen also, dass U(Z) Z∈Z ein monoton wachsendes Netz ist. Nach (5.8) gilt daher

Zb
lim U(Z) = sup U(Z) = f dx.
Z∈Z Z∈Z

a

Entsprechend ist das Netz O(Z) Z∈Z der Obersummen monoton fallend, und

b
Z−
lim O(Z) = inf O(Z) = f dx.
Z∈Z Z∈Z
a

Klarerweise ist damit auch das Netz O(Z) − U(Z) Z∈Z monoton fallend, und besteht
aus nicht negativen reellen Zahlen. Also gilt auch (vgl. Nach (5.8))

inf (O(Z) − U(Z)) = lim (O(Z) − U(Z)), (8.3)


Z∈Z Z∈Z

und wegen der Rechenregeln für R-wertige Netze (siehe Anschnitt 5.3) gleicht dieser
Ausdruck
b
Z− Zb
lim O(Z) − lim U(Z) = f dx − f dx. (8.4)
Z∈Z Z∈Z
a −
a

Also ist die Integrierbarkeit einer Funktion f äquivalent dazu, dass der Ausdruck in
(8.3) verschwindet.
8.2. DAS RIEMANN-INTEGRAL 5

8.2 Das Riemann-Integral


Der oben vorgestellte Zugang zur Definition eines Integrals ist zwar befriedigend um
dem Begriff Fläche unter einer Kurve einen Sinn zu geben, um aber etwa komplex-
oder vektorwertige Funktionen integrieren zu können, benötigen wir einen alternativen
Ansatz.
n(R) 
8.2.1 Definition. Wir nennen das Paar R = (ξ j )n(R)
j=0 ; (α j ) j=1 eine Riemann-Zerlegung
eines Intervalls [a, b], falls n(R) ∈ N und (ξ j )n(R)
j=0 ∈ R
n(R)+1
, (α j )n(R)
j=1 ∈ R
n(R)
, wobei

a = ξ0 < ξ1 < · · · < ξn(R) = b; α j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R),

und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Riemann-
Zerlegung. Die Punkte ξ j heißen Stützstellen und die Punkte α j Zwischenstellen.
Weiters sei R1  R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Riemann-
Zerlegungen, dann ist (R, ) eine gerichtete Menge2 .
Ist f eine beschränkte reell- bzw. komplexwertige Funktion, so betrachtet man das

Netz S (R) R∈R , wobei die Riemannsumme 3 zur Riemann-Zerlegung R durch

X
n(R)
S (R) = (ξ j − ξ j−1 ) f (α j ).
j=1

definiert ist. Konvergiert dieses Netz, so nennen wir die Funktion f Riemann-
integrierbar und bezeichnen
Zb
f dx := lim S (R)
R∈R
a

als das Riemann Integral von f über [a, b].

f (x)

a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8 ξ9 =b
R: α1 α2 α3 α4 α5 α6 α7 α8 α9

Abbildung 8.4: Veranschaulichung einer Riemannsumme

Für limR∈R S (R) schreibt man auch lim|R|→0 S (R), um deutlich zu machen, dass R
durch die Feinheit der Riemann-Zerlegung gerichtet wird. Da es zu jedem δ > 0, δ ≤
2  ist sicher nicht antisymmetrisch und unterscheidet sich wesentlich von der Halbordnung ⊆ auf Z aus

Definition 8.1.2.
3 Bernhard Riemann, 17.9.1826-20.7.1866
6 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

b −a eine Riemann-Zerlegung R gibt mit |R| = δ, ist die Existenz von I = lim|R|→0 S (R)
äquivalent zu
∀ǫ > 0 ∃δ > 0 : |S (R) − I| < ǫ ∀R ∈ R, |R| ≤ δ.

8.2.2 Bemerkung. Ist f : [a, b] → C, so folgt aus Re S ( f, R) =


S (Re f, R), Im S ( f, R) = S (Im f, R) und der Tatsache, dass ein komplexwertiges
Netz genau dann konvergiert, wenn Real- und Imaginärteil es tun, dass die Riemann-
Integrierbarkeit von f zu der von Re f und Im f äquivalent ist.
8.2.3 Bemerkung. Ist M eine endliche Teilmenge von [a, b] mit m Elementen, und setzt
man für eine Riemann-Zerlegung R

X
n(R)
S M (R) = (ξ j − ξ j−1 ) f (α j ),
j=1
M∩[ξ j−1 ,ξ j ]=∅

so hat diese Summe höchstens 2m Summanden weniger als S (R). Somit folgt

X
n(R)
S M (R) − S (R) ≤ (ξ j − ξ j−1 )| f (α j )| ≤ 2m|R| · k f k∞ , (8.5)
j=1
M∩[ξ j−1 ,ξ j ],∅


wobei k f k∞ = sup{| f (t)| : t ∈ [a, b]}, und wir sehen, dass S M (R) genau dann
 R∈R
konvergiert, wenn S (R) R∈R es tut. In diesem Fall gilt
Z b
f dx = lim S (R) = lim S M (R).
a |R|→0 |R|→0

Als Anwendung dieser Bemerkung sieht man, dass, wenn sich zwei Funktionen f und g
nur auf einer endlichen Menge M unterscheiden, aus der Riemann-Integrierbarkeit von
f auch die von g folgt. In der Tat ist dann S M ( f, R) = S M (g, R), wobei das Argument
f bzw. g andeutet, von welcher Funktion die entsprechende Riemann-Summe gebildet
wird.
Mit Hilfe dieser Bemerkung können wir einen ersten Zusammenhang zwischen
Riemann-Summen und Ober- bzw. Untersummen herstellen.

8.2.4 Lemma. Sei f : [a, b] → R eine beschränkte reellwertige Funktion, und sei
Z0 ∈ Z, ǫ > 0. Dann gibt es ein δ > 0, sodass

∀R ∈ R, |R| ≤ δ ⇒ U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ.

Beweis. Man überzeugt sich leicht, dass für eine relle Konstante c

U( f + c, Z0 ) = U( f, Z0 ) + c(b − a), O( f + c, Z0 ) = O( f, Z0 ) + c(b − a)

und S ( f + c, R) = S ( f, R) + c(b − a). Setzen wir c = k f k∞ , so erkennt man, dass es


genügt, das Lemma mit der zusätzlichen Annahme f (x) ≥ 0, x ∈ [a, b] zu beweisen.
Man schreibe Z0 = {ηk : k = 0, . . . , n(Z0 )} ∈ Z, und setze M = Z0 . Mit (8.5)
erhalten wir
S M (R) − S (R) ≤ |R| · 2(n(Z0) + 1) · k f k∞ .
8.2. DAS RIEMANN-INTEGRAL 7

n(R) 
Für R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R, bedeutet M ∩ [ξ j−1 , ξ j ] = ∅, dass [ξ j−1 , ξ j ] sicher ganz
enthalten in einem gewissen Intervall [ηk( j)−1 , ηk( j) ] enthalten ist. Bezeichnen wir mit J
die Menge aller dieser Indizes, so folgt

X
n(R) X0 )
n(Z X
S M (R) = (ξ j − ξ j−1 ) f (α j ) = (ξ j − ξ j−1 ) f (α j ) ≤
j∈J k=1 j∈J,k( j)=k

X0 )
n(Z X X0 )
n(Z
(ξ j − ξ j−1 ) sup f (t) ≤ (ηk − ηk−1 ) sup f (t) = O(Z0 ).
k=1 j∈J,k( j)=k t∈[ηk−1 ,ηk ] k=1 t∈[ηk−1 ,ηk ]

Es folgt

S (R) ≤ S M (R) − S (R) + O(Z0 ) ≤ O(Z0 ) + |R| · 2(n(Z0 ) + 1) · k f k∞ .

Die erste Aussage des Lemmas folgt nun, wenn man |R| hinreichend klein macht. Die
zweite zeigt man analog.

Wir werden nun zeigen, dass die beiden vorgestellten Zugänge zur Integration für
reellwertige beschränkte Funktionen f äquivalent sind.

8.2.5 Satz. Für eine beschränkte Funktion f : [a, b] → R sind folgende Aussagen
äquivalent:

(i) Das obere und das untere Integral von f stimmen überein.

(ii) inf Z∈Z (O(Z) − U(Z)) = 0.

(iii) f ist Riemann-integrierbar, d.h. lim|R|→0 S (R) existiert.


n(R) 
(iv) Setzt man für eine beliebige Riemann-Zerlegung R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R
4

X
n(R) X
n(R)
O(R) := (ξ j − ξ j−1 ) sup f (t), U(R) := (ξ j − ξ j−1 ) inf f (t),
t∈[ξ j−1 ,ξ j ] t∈[ξ j−1 ,ξ j ]
j=1 j=1

so gilt lim|R|→0 (O(R) − U(R)) = 0.

(v) Es gibt eine Folge (Rn )n∈N von Riemann-Zerlegungen, sodass


limn→∞ (O(Rn ) − U(Rn )) = 0.

In einem dieser Fälle gilt


Z b Z b
D− f dx = f dx = lim O(R) = lim U(R) =
a a |R|→0 |R|→0

lim S (Rn ) = lim O(Rn ) = lim U(Rn ),


n→∞ n→∞ n→∞

für jede beliebige Folge (Rn )n∈N von Riemann-Zerlegungen mit limn→∞ |Rn | = 0.

Beweis.
4 Klarerweise gilt O(R) = O(Z) und U(R) = U(Z), wobei Z = {ξ j : j = 0, . . . , n(R)} ∈ Z.
8 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

(iii) ⇒ (iv) : Setzen wir R := lim|R|→0 S (R), so wollen zeigen, dass R = lim|R|→0 O(R).
Zu jedem ǫ > 0 gibt es wegen der vorausgesetzten Konvergenz ein R0 , sodass
|R − S (R)| < ǫ für alle R  R0 .
n(R) 
Sei R = (ξ j )n(R) j=0 ; (α j ) j=1  R0 eine feste Riemann-Zerlegung. Wähle nun für
j = 1, . . . , n(R) und k ∈ N ein αkj ∈ [ξ j−1 , ξ j ], sodass
1
sup f (t) − < f (αkj ) ≤ sup f (t).
t∈[ξ j−1 ,ξ j ] k t∈[ξ j−1 ,ξ j ]

k n(R) 
Setzt man Rk = (ξ j )n(R)
j=0 ; (α j ) j=1 , so folgt

X n(R)
1 1
O(R) − S (Rk ) ≤ |ξ j − ξ j−1 | = (b − a) .
j=1
k k

Aus |Rk | = |R| ≤ |R0 | folgt Rk  R0 , und somit


b−a
|R − O(R)| ≤ |R − S (Rk )| + |S (Rk ) − O(R)| < ǫ + .
k
Für k → ∞ folgt |R − O(R)| ≤ ǫ und zwar für alle R  R0 . Also gilt
lim|R|→0 O(R) = R. Genauso sieht man, dass lim|R|→0 U(R) = R.
Aus den Rechenregeln für Grenzwerte folgt damit
0 = R − R = lim|R|→0 (O(R) − U(R)).
(iv) ⇒ (v) : Ist (Rn )n∈N eine Folge von Riemann-Zerlegungen mit limn→∞ |Rn | = 0, so

besagt dieses Grenzverhalten für die Feinheit gerade, dass O(Rn ) − U(Rn ) n∈N

eine Teilfolge des Netzes O(R) − U(R) R∈R im Sinne von Definition 5.3.5 ist.
Nach (5.4) folgt
lim (O(Rn ) − U(Rn )) = lim (O(R) − U(R)) = 0.
n→∞ |R|→0

Schließlich sei noch bemerkt, dass es offensichtlich eine Folge von Riemann-
Zerlegungen mit limn→∞ |Rn | = 0 gibt. Man nehme etwa die Folge (Rn )n∈N , wo
Rn genau n +1 viele äquidistante Stützstellen hat, und wobei die Zwischenstellen
genau in der Mitte zwischen den angrenzenden Stützstellen liegt.
(v) ⇒ (ii) : Das ist klar, wenn man baechtet, dass O(R) = O(Z), U(R) = U(Z), wenn
Z = {ξ j : j = 0, . . . , n(R)} ∈ Z die Menge der Stützstellen einer gegebenen
n(R) 
Riemann-Zerlegung R = (ξ j )n(R)j=0 ; (α j ) j=1 ∈ R ist.

(i) ⇔ (ii) : Das haben wir schon in Bemerkung 8.1.4 gesehen (vgl. (8.3) und (8.4)).
b
R− Rb
(i) ⇒ (iii) : Nun gelte also I := f dx = f dx. Zu einem beliebigen ǫ > 0 wähle Z0
a −
a
so, dass
I − ǫ < U(Z0 ) ≤ O(Z0 ) < I + ǫ.
Nach Lemma 8.2.4 folgt die Existenz eines δ > 0, sodass
I − 2ǫ < U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ < I + 2ǫ
für |R| ≤ δ. Also lim|Z|→0 S (R) = I.
8.2. DAS RIEMANN-INTEGRAL 9

Dass limn→∞ O(Rn ) = lim|R|→0 O(R), limn→∞ U(Rn ) = lim|R|→0 U(R) und
limn→∞ S (Rn ) = lim|R|→0 S (R) für limn→∞ |Rn | = 0 gilt, sieht man genauso, wie im
zweiten Beweisschritt.

8.2.6 Beispiel. Nehmen wir einmal an, dass wir schon wissen, dass die Funktion f (x) =
x2 aus Beispiel 8.1.1 Riemann-integrierbar ist. Dann können wir uns mit Satz 8.2.5
sicher sein, dass die Folgen An und Ân tatsächlich gegen das Integral von f über [0, 1]
konvergieren. Sie stimmen nämlich mit U(Rn ) bzw. mit O(Rn ) überein, wobei Rn eine
Riemann-Zerlegung ist, die genau n + 1 viele äquidistante Stützstellen hat.
Wir werden später sehen, dass alle stetigen Funktionen integrierbar sind, und wie
man mit Hilfe der Differenzialrechnung das Integral konkret ausrechnet. Dass bei wei-
tem nicht alle Funktionen integrierbar sind, sieht man am übernächsten Beispiel.
8.2.7 Beispiel. Betrachte die konstante Funktion f : [0, 1] → C, d.h. f (t) = c, t ∈
[a, b]. Ist R eine Riemann-Zerlegung, so rechnet man
X
n(R) X
n(R)
S (R) = (ξ j − ξ j−1 ) f (α j ) = c (ξ j − ξ j−1 ) = c(b − a),
j=1 j=1
Rb
und damit a c dx = lim|R|→0 S (R) = c(b − a).
Wegen Bemerkung 8.2.3 sehen wir auch, dass jede Funktion, die konstant gleich c
bis auf eine endliche Menge M ist, integrierbar ist und dass das Integral gleich c(b − a)
ist.
Diese Tatsache lässt sich aber nicht auf den Fall eines abzählbaren M ausdehnen.
8.2.8 Beispiel. Betrachte die Funktion f : [0, 1] → R definiert durch



0, x irrational
f (x) := 
 .
1, x rational

Ist nun Z = {ξ j : j = 0, . . . , n(Z)} eine Zerlegung von [0, 1], so enthält jedes Intervall
[ξ j−1 , ξ j ] sowohl rationale als auch irrationale Zahlen. Somit folgt
U(Z) = 0, O(Z) = 1.
Also ist f nicht integrierbar.
Im Folgenden wollen wir einige Eigenschaften von Integralen auflisten, die unmit-
telbar aus der Tatsache folgen, dass wir Integrale als Grenzwerte von Netzen auffassen.
8.2.9 Lemma. (i) Seien f1 , f2 Riemann-integrierbar über [a, b] und c eine reelle
bzw. komplexe Konstante. Dann sind auch f1 + f2 und c f1 Riemann-integrierbar,
und es gilt
Zb Zb Zb Zb Zb
( f1 + f2 ) dx = f1 dx + f2 dx, (c f1 ) dx = c f1 dx.
a a a a a

(ii) Ist f Riemann-integrierbar über [a, b], so gilt


b
Z Z
b −

f dx ≤ | f (x)| dx ≤ (b − a) · k f k∞ , (8.6)
a a

wobei sogar |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b].


10 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

(iii) Sind g1 , g2 reellwertige Riemann-integrierbare Funktionen über [a, b] mit g1 (x) ≤


g2 (x) für alle x ∈ [a, b], so gilt
Zb Zb
g1 dx ≤ g2 dx.
a a

Beweis. Zunächst folgt unmittelbar aus der Definition der Riemannsummen und der
Obersummen S ( f1 + f2 , R) = S ( f1 , R) + S ( f2 , R), S (c f1 , R) = cS ( f1 , R) und S (g1 , R) ≤
S (g2 , R). Durch den Grenzübergang |R| → 0 erhalten wir (i) und (iii).
Nun sei ǫ > 0 und Z0 eine Zerlegung von [a, b]. Weiters sei δ > 0, sodass |R| ≤
δ ⇒ S (| f |, R) ≤ O(| f |, Z0 ) + ǫ (siehe Lemma 8.2.4).
Ist R eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so folgt leicht aus der Defini-
tion der Riemannsummen und der Obersummen und der Dreiecksungleichung

|S ( f, R)| ≤ |S (| f |, R)| ≤ O(| f |, Z0 ) + ǫ ≤ k f k∞ (b − a) + ǫ.

(8.6) folgt durch die Grenzwertbildung, zuerst |R| → 0 und dann Z0 ∈ Z, sowie der
Tatsache, dass ǫ > 0 beliebig ist.
Schließlich folgt |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b]
unmittelbar aus der Dreiecksungleichung.

8.3 Integrale von stetigen Funktionen


Ehe wir uns konkret dem Problem der Integrierbarkeit einer stetigen Funktion wid-
men, werden wir als Hilfsmittel ein Lemma herleiten, das besagt, dass in vollständigen
metrischen Räumen nicht nur jede Cauchy-Folge, sondern auch jedes Cauchy-Netz
konvergiert:
8.3.1 Definition. Sei hX, di ein metrischer Raum und (I, ) eine gerichtete Menge.
Dann heißt ein Netz (xi )i∈I in X Cauchy-Netz, wenn

∀ǫ > 0 ∃i0 ∈ I : d(xi , x j ) < ǫ ∀i, j  i0 . (8.7)

Für Folgen ist (8.7) genau die Cauchy-Folgen Bedingung. Also liegt die Aussage
des nächsten Lemma nahe.
8.3.2 Lemma. In einem vollständigen metrischen Raum ist ein Netz genau dann kon-
vergent, wenn es ein Cauchy-Netz ist. .
Beweis. Ist nun (xi )i∈I ein Netz, und konvergiert dieses gegen x ∈ X, so gibt es zu
jedem ǫ > 0 ein i0 ∈ I, sodass d(xi , x) < 2ǫ für i  i0 . Wegen der Dreiecksungleichung
folgt d(xi , x j ) < ǫ für i, j  i0 . Also folgt (8.7).

Gilt umgekehrt (8.7), so definieren wir induktiv eine Folge von in ∈ I, n ∈ N, durch
die Forderung, dass
1
in+1  in und d(xi , x j ) < , i, j  in ,
n
indem wir zuerst i1 ∈ I so wählen, dass d(xi , x j ) < 1 für i, j  i1 . Zu gegebenem in ∈ I
1
wähle dann gemäß (8.7) jn+1 ∈ I so, dass d(xi , x j ) < n+1 für i, j  jn+1 . Nun sei in+1 ∈ I
gemäß (5.1) so gewählt, dass in+1  in , jn+1 .
8.3. INTEGRALE VON STETIGEN FUNKTIONEN 11

Offensichtlich ist (xin )n∈N eine Cauchyfolge und damit konvergent gegen ein x ∈ X.
Ist n ≤ m, so folgt aus d(xim , xin ) < n1 durch Grenzübergang m → ∞ die Tatsache, dass
d(x, xin ) ≤ n1 , n ∈ N.
Ist nun ǫ > 0, so wähle n ∈ N, sodass n2 ≤ ǫ. Für i  in folgt

2
d(x, xi ) ≤ d(x, xin ) + d(xin , xi ) < ≤ ǫ,
n
bzw. xi ∈ Uǫ (x), und somit konvergiert (xi )i∈I gegen x.

8.3.3 Satz. Ist f eine stetige reell- oder komplexwertige Funktion auf einem reellen
Intervall [a, b], so ist f Riemann-integrierbar.
Beweis. Wir bemerken zuerst, dass wegen Satz 6.3.3 die Funktion f sogar gleichmäßig
stetig ist. Also gibt es zu ǫ > 0 ein δ > 0, sodass |x−y| ≤ δ ⇒ | f (x)− f (y)| < ǫ. Definiert
man für beliebiges γ > 0

ρ(γ) := sup{| f (s) − f (t)| : s, t ∈ [a, b], |s − t| ≤ γ},

so gilt daher ρ(δ) ≤ ǫ.



Gemäß Lemma 8.3.2 folgt die Konvergenz von S (R) R∈R , wenn wir zeigen

können, dass S (R) R∈R ein Cauchy-Netz ist.
ǫ 
Dazu sei ǫ > 0, und sei δ > 0 so, dass ρ(δ) ≤ 3(b−a) . Dafür, dass S (R) R∈R ein
Cauchy-Netz ist, genügt es zu zeigen, dass für Riemann-Zerlegungen R und R1 von
[a, b] aus |R|, |R1 | ≤ δ folgt, dass

|S (R) − S (R1 )| < ǫ. (8.8)

Dazu sei R2 eine Riemann-Zerlegung, deren Stützstellen die von R1 und R umfasst.
Das bedeutet, dass mit
n(R1 )  n(R) 
R1 = (ξ j )n(R 1) n(R)
j=0 ; (α j ) j=1 , R = (ζ j ) j=0 ; (γ j ) j=1 ,

n(R2 ) 
R2 = (η j )n(R 2)
j=0 ; (β j ) j=1 ,

die Beziehung

{ξ j : j = 0, . . . , n(R1 )} ∪ {ζ j : j = 0, . . . , n(R)} ⊆ {η j : j = 0, . . . , n(R2 )}

gilt. Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass

ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
| {z }
k( j)−k( j−1)−1 viele

Es folgt
 
n(RX1 )  X
k( j) 
S (R1 ) − S (R2 ) = (ξ j − ξ j−1 ) f (α j ) − (ηk − ηk−1 ) f (βk ) ≤

j=1 k=k( j−1)+1

X1 )
n(R X
k( j)
(ξ j − ξ j−1 ) f (α j ) − (ηk − ηk−1 ) f (βk ) ≤

j=1 k=k( j−1)+1
12 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

X1 )
n(R X
k( j)
(ηk − ηk−1 ) · | f (α j ) − f (βk )|.
j=1 k=k( j−1)+1

Bemerkt man, dass |α j − βk | ≤ (ξ j − ξ j−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)}, so folgt


X2 )
n(R
|S (R2 ) − S (R1 )| ≤ (ηk − ηk−1 ) ρ(δ) = (b − a) · ρ(|R1 |), (8.9)
k=1

und wegen |R1 | ≤ δ ist dieser Ausdruck ≤ (b − a) · ρ(δ) ≤ 3ǫ . Genauso zeigt man
|S (R2 ) − S (R)| ≤ 3ǫ . (8.8) folgt nun sofort aus der Dreicksungleichung.

Für einen späteren Gebrauch sei bemerkt, dass aus (8.9) für zwei Riemann-
Zerlegungen R1 , R mit Hilfe der Dreiecksungleichung unmittelbar

S (R) − S (R1 ) ≤ 2(b − a) · ρ(max(|R|, |R1 |)). (8.10)
folgt, wobei ρ(γ) := sup{| f (s) − f (t)| : s, t ∈ [a, b], |s − t| ≤ γ}. Da wir zur Herleitung
von (8.9) die Stetigkeit von f nicht benötigt haben, ist der Fall eines nicht stetigen f
nicht ausgeschlossen.

8.4 Differential und Integralrechnung


Um das Integral einer Funktion tatsächlich ausrechnen zu können, wollen wir einen
wichtigen Zusammenhang zur Differentialrechnung herstellen. Bevor wir das tun, brau-
chen wir folgendes Lemma.
8.4.1 Lemma. Sei f eine reell- oder komplexwertige Funktion auf einem reellen Inter-
vall [a, b], und sei c < d, [c, d] ⊆ [a, b]. Weiters bezeichne 1[c,d] die charakteristische
Funktion , d.h. (
1 , falls t ∈ [c, d]
1[c,d] (t) = .
0 , falls t < [c, d]
Dann ist f |[c,d] auf [c, d] genau dann Riemann-integrierbar, wenn es 1[c,d] · f auf [a, b]
ist, wobei Z Z
b d
1[c,d] · f dx = f |[c,d] dx.
a c
Das ist sicher der Fall, wenn f auf ganz [a, b] Riemann-integrierbar ist.
Beweis. Wir bezeichnen mit R ∈ R die Riemann-Zerlegungen von [a, b] und mit R′ ∈
R′ die Riemann-Zerlegungen von [c, d].
Sei zunächst f über [a, b] Riemann-integrierbar. Wir zeigen, dass dann
 
S ( f |[c,d] , R′ ) R′ ∈R′ ein Cauchy-Netz ist. Dazu sei ǫ > 0. Da S ( f, R) R∈R konvergent
und daher ein Cauchy-Netz ist, gibt es ein δ > 0, sodass |S ( f, R) − S ( f, R1 )| < ǫ, wenn
nur |R|, |R1 | ≤ δ.
Sind nun R′ , R′1 ∈ R′ mit |R′ |, |R′1 | ≤ δ, so wähle eine beliebige Fortsetzung R und
R1 von R′ bzw. R′1 zu Riemann-Zerlegungen von [a, b] mit einer Feinheit kleiner oder
gleich δ und so, dass die Stütz- und Zwischenstellen von R und R1 außerhalb von [c, d]
übereinstimmen.
Die Summanden (ξ j −ξ j−1 ) f (α j ) zu Intervallen [ξ j−1 , ξ j ] mit [ξ j−1 , ξ j ] * [c, d] treten
dann bei S ( f, R) und bei S ( f, R1 ) auf. Also folgt

S ( f, R) − S ( f, R ) = S ( f | , R′ ) − S ( f | , R′ ) ≤ δ.
1 [c,d] [c,d] 1
8.4. DIFFERENTIAL UND INTEGRALRECHNUNG 13


Somit ist S ( f |[c,d] , R′ ) R′ ∈R′ auch ein Cauchy-Netz und f |[c,d] daher auf [c, d]
Riemann-integrierbar.

Wegen (1[c,d] · f )|[c,d] = f |[c,d] folgt aus dem eben bewiesenen auch aus der
Riemann-Integrierbarkeit von 1[c,d] · f die von f |[c,d] .

Wir setzen M = {c, d}, und wissen aus Bemerkung 8.2.3, dass der Beweis vollendet
ist, wenn wir

I = lim

S M ( f |[c,d] , R′ ) ⇒ I = lim S M (1[c,d] · f, R),
|R |→0 |R|→0

beweisen können. Dazu sei ǫ > 0, und δ > 0, sodass |R′ | ≤ δ ⇒ |I − S M ( f |[c,d] , R′ )| < ǫ.
n(R) 
Ist nun R = (ξ j )n(R) j=0 ; (α j ) j=1 eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so sei

n(R′ ) 
R′ = (η j )n(R )
j=0 ; (β j ) j=1 die Riemann-Zerlegung von [c, d], für die {η1 , . . . , ηn(R′ )−1 } =
{ξ1 , . . . , ξn(R)−1 } ∩ (c, d), und für die {β2 , . . . , βn(R′ )−1 } = {α1 , . . . , αn(R) } ∩ [η1 , ηn(R′ )−1 ].
Es folgt
X
n(R)
S M (1[c,d] · f, R) = (ξ j − ξ j−1 )1[c,d] (α j ) f (α j ) =
j=1
c,d<[ξ j−1 ,ξ j ]

X
n(R) X
n(R )−1
(ξ j − ξ j−1 ) f (α j ) = (η j − η j−1 ) f (β j ) = S M ( f |[c,d] , R′ ).
j=1 j=2
c<ξ j−1 ,ξ j <d

Wegen |R′ | ≤ |R| ≤ δ folgt |I − S M (1[c,d] · f, R)| < ǫ. Daher gilt


I = lim|R|→0 S M (1[c,d] · f, R).

8.4.2 Bemerkung. Mit Hilfe von Bemerkung 8.2.3 sieht man leicht, dass die Riemann-
Integrierbarkeit von 1[c,d] · f über [a, b] zu der von 1(c,d) · f bzw. 1(c,d] · f oder auch der
von 1[c,d) · f äquivalent ist. Die entsprechenden Integrale stimmen alle überein.

8.4.3 Definition. Eine Abbildung f : [a, b] → R (C) heißt stückweise stetige Funktion
, falls es eine Zerlegung a = t0 < t1 < · · · < tn = b von [a, b] gibt, sodass sich die
Funktionen f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lassen.

8.4.4 Bemerkung. Aus Lemma 8.4.1 folgt nun, dass jede stückweise stetige Funktion
Riemann-integrierbar ist.
Ist nämlich f : [a, b] → R (C) und sind a = t0 < t1 < · · · < tn = b, sodass sich
für alle j = 1, . . . , n, die Funktion f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lässt, so sind
alle Funktionen 1(t j−1 ,t j ) · f und daher auch ihre Summe Riemann-integrierbar. Diese
Summe unterscheidet sich aber von f nur an endlich vielen Punkten und ist daher
selbst Riemann-integrierbar.
Im Folgenden stellt es sich als praktisch heraus, auch Integrale über Intervalle der
Länge Null bzw. Integrale zu definieren, die von der oberen zur unteren Grenze durch-
laufen werden. Ist also c > d, und f : [d, c] → R (C) Riemann-integrierbar, so setzen
wir Z Z Z
c d c
f (x) dx := 0, f (x) dx := − f (x) dx.
c c d
Mit dieser Konvention sei zunächst bemerkt:
14 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

8.4.5 Bemerkung. Sei nun f auf [a, b] reell- bzw. komplexwertig und Riemann-
integrierbar und sei a ≤ u ≤ v ≤ w ≤ b. Dann folgt aus Lemma 8.4.1, Lemma 8.2.9
und Bemerkung 8.4.2
Z w Z b Z b

f (t) dt = 1[u,v] (t) · f (t) dt = 1[u,v) (t) + 1[v,w] (t) · f (t) dt =
u a a
Z b Z b Z v Z w
1[u,v) (t) · f (t) dt + 1[v,w] (t) · f (t) dt = f (t) dt + f (t) dt.
a a u v

8.4.6 Satz (Hauptsatz der Diff.-Int.Rechnung). Sei f eine reell- oder komplexwertige
Funktion auf [a, b], die über [a, b] Riemann-integrierbar ist. Für x ∈ [a, b] definiere5
Zx
F(x) := f (t) dt.
a

Dann ist die Funktion F : [a, b] → R (C) stetig auf [a, b].
Ist f in einem Punkt x0 stetig, so ist F bei x0 differenzierbar, und es gilt6

F ′ (x0 ) = f (x0 ).

Beweis. Per definitionem ist f als Riemann-integrierbare Funktion beschränkt. Ist a ≤


x < y ≤ b, so folgt (siehe Bemerkung 8.4.5)
y
Z
|F(y) − F(x)| = f (t) dt ≤ k f k∞ · (y − x).

x

Insbesondere ist F stetig7 .


Sei nun f stetig bei einem x0 ∈ [a, b). Ist ǫ > 0 gegeben, so existiert δ > 0, sodass

| f (t) − f (x0 )| < ǫ für |t − x0 | < δ.

Ist x0 < x < x0 + δ ≤ b, so gilt wegen (8.6) 8



Zx
F(x) − F(x0 ) − f (x ) = f (t) − f (x0 )
0 dt < ǫ.
x − x0 x − x 0
x0

F(x)−F(x0 )
Also folgt F ′ (x0 )+ = lim x→x0 + x−x0 = f (x0 ). Entsprechend zeigt man
F ′ (x0 )− = f (x0 ), wenn x0 ∈ (a, b].

8.4.7 Bemerkung. Mit den Voraussetzungen von Satz 8.4.6 betrachte man G(x) =
Rb Rb Rx
f (t) dt. Wegen G(x) = a f (t) dt − a f (t) dt gilt G′ (x) = − f (x).
x Rx
Somit folgt für ein festes c ∈ [a, b], dass ( c f (t) dt)′ = f (x) egal, ob x ≥ c oder
x ≤ c.
5 DieExistenz dieses Integrals für alle x ∈ [a, b] folgt aus Lemma 8.4.1.
6 Ist
x0 gleich a oder b, so meinen wir die links- bzw. rechtsseitige Differenzierbarkeit bzw. Ableitung.
7 Wir sehen, dass diese Funktion sogar Lipschitz stetig ist, d.h. dass |F(y) − F(x)| ≤ M · |y − x| für alle

x, y ∈ [a, b] mit einer festen Konstante M ≥ 0 gilt.


8 Man beachte, dass die Länge das Integrationsintervalles gerade |x − x | ist.
0
8.4. DIFFERENTIAL UND INTEGRALRECHNUNG 15

Folgendes Korollar ist die Grundlage dafür, Integrale mit Hilfe der Stammfunktion
berechnen zu können.
8.4.8 Korollar. Ist f : [a, b] → R (C) stetig, und ist H : [a, b] → R (C) eine Stamm-
funktion von f , d.h. H ist auf [a, b] differenzierbar mit H ′ (x) = f (x) für alle x ∈ [a, b],
so gilt
Z b
f (t) dt = H(b) − H(a).
a
Rx
Beweis. Nach Satz 8.4.6 ist die Funktion F(x) = a f (t) dt ebenfalls eine Stamm-
funktion von f auf [a, b]. Somit unterscheiden sich H und F nur um eine Konstante,
F ≡ H +c auf [a, b] (vgl. Bemerkung 7.4.2). Wegen 0 = F(a) = H(a) +c ist H(a) = −c,
und somit Z b
f (t) dt = F(b) = H(b) + c = H(b) − H(a).
a


8.4.9 Beispiel. Wir wollen das Integral der Funktion ln x über das Intervall [1, 3] be-
rechnen. Eine Stammfunktion von ln x auf (0, +∞) ist x(ln(x) − 1). Also folgt mit der
Konvention, dass g(x)|ba = g(b) − g(a),
Z 3
ln t dt = x(ln(x) − 1)|31 = 3(ln 3 − 1) − (−1) = 3 ln 3 − 2.
1
Rπ x 2ix
8.4.10 Beispiel. Um 0 te2it dt zu berechnen, nehmen wir die Stammfunktion 2i e −
1 2ix
(2i)2
e von xe2ix und erhalten
Z π ! π
2it x 2ix 1 2ix π
te dt = e − e = .
0 2i (2i)2 0 2i

8.4.11 Bemerkung. Aus dem Hauptsatz sieht man insbesondere, dass für eine überall
auf [a, b] stetige Funktion f die Funktion F eine stetig differenzierbare Funktion ist,
die noch dazu F(a) = 0 erfüllt.
Ist umgekehrt F(x) eine stetig differenzierbare Funktion auf [a, b] mit F(a) = 0, so
Rx
ist ihre Ableitung f stetig und wegen Satz 8.3.3 integrierbar. Die Funktion f (t) dt hat
a
nach dem Hauptsatz die selbe Ableitung wie F. Außerdem verschwinden sie beide bei
Rx
a, und daher F(x) = f (t) dt, x ∈ [a, b] (vgl. Korollar 8.4.8).
a
Also wird C[a, b] durch den Integraloperator bijektiv auf {F ∈ C1 [a, b] : F(a) = 0}
abgebildet. Man sieht auch leicht, dass diese beiden Mengen Vektorräume sind, und
dass dieser Integraloperator linear ist.
Rb
8.4.12 Korollar. Ist f : [a, b] → R stetig und f (x) ≥ 0, x ∈ [a, b], wobei a f (x) dx =
0, so verschwindet f identisch auf [a, b].
Rx
Beweis. Die Funktion F(x) = f (t) dt, x ∈ [a, b] ist in C1 [a, b], erfüllt
a
F(a) = F(b) = 0 und hat für x ∈ (a, b) die Ableitung F ′ (x) = f (x) ≥ 0. Also
ist F(x) monoton wachsend, und somit 0 = F(a) ≤ F(x) ≤ F(b) = 0.

16 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

Folgender Satz wird ebenfalls Hauptsatz der Differential-Integralrechnung genannt. Dieser ist dem Satz 8.4.6 zwar
sehr ähnlich, aber auf den zweiten Blick unterscheiden sie sich doch durch die Voraussetzungen wesentlich.

8.4.13 Satz. Sei f : [a, b] → R Riemann-integrierbar über [a, b], sodass es eine stetige Funktion F : [a, b] → R gibt, die
auf (a, b) differenzierbar ist und die dort F ′ (x) = f (x) erfüllt. Dann gilt

Zb
f (x) dx = F(b) − F(a).
a

Beweis. Sei {ξ j : j = 0, . . . , n} eine Zerlegung von [a, b]. Dann existieren nach dem Mittelwertsatz der Differentialrechnung
Satz 7.2.5 Zwischenstellen αi , ξi−1 ≤ αi ≤ ξi , sodass

F(ξi ) − F(ξi−1 ) = (ξi − ξi−1 ) f (αi ).


Somit ist R = (ξ j )n(R)
j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung von [a, b]. Es folgt

X
n
 X
n
F(b) − F(a) = F(ξi ) − F(ξi−1 ) = (ξi − ξi−1 ) f (αi ) = S (R).
i=1 i=1

Rb
Für |R| → 0 strebt die rechte Seite gegen f (x)dx.
a

Man beachte, dass Satz 8.4.13 nur auf reellwertige Funktionen anwendbar ist, da im Beweis der Mittelwertsatz der
Differentialrechnung verwendet wird, der ja nur für reellwertige Funktionen gilt.

Die in Lemma 7.4.3 kennengelernten Regeln zur Auffindung von Stammfunktionen


führen auf entsprechende Regeln zur Berechnung von Integralen.

8.4.14 Lemma (Substitutionsregel). Sei f reell- oder komplexwertig und stetig auf
[a, b], sei und g ∈ C1 [α, β] und stetig auf [α, β]. Ist nun g([α, β]) ⊆ [a, b], so gilt
Z g(β) Z β
f (x) dx = f (g(t))g′ (t)dt.
g(α) α
R
Beweis. Nach Lemma 7.4.3 ist ( f ) ◦ g eine Stammfunktion von f (g(t))g′ (t). Aus
Korollar 8.4.8 folgt daher die behauptete Gleichheit.

Genauso beweist man folgendes Lemma.

8.4.15 Lemma (Partielle Integration). Seien f, g ∈ C1 [a, b]. Dann gilt

Zb Zb

f g dx = f (b)g(b) − f (a)g(a) − f g′ dx.
a a

Für f (b)g(b) − f (a)g(a) schreibt man auch f g|ba .

8.5 Weitere Eigenschaften des Integrals


Sind f und g im folgenden Satz stetig, so ist die Aussage des Satzes eine einfache Konsequenz aus der Tatsache, dass stetige
Funktionen integrierbar sind.
8.6. UNEIGENTLICHE INTEGRALE 17

8.5.1 Satz. Sind f, g reellwertig und über [a, b] Riemann-integrierbar, so sind es auch | f |, f 2 , f g und

Z Z
b b

f dx ≤ | f |dx.
a a

Beweis. Sei ǫ > 0 gegeben. Nach Satz 8.2.5 existiert eine Zerlegung
Z = {ξi : i = 0, . . . , n(Z)} von [a, b], sodass
O( f, Z) − U( f, Z) < ǫ.
Setze für i = 0, . . . , n(Z)
Mi = sup f (x), mi = inf f (x),
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]

Mi∗ = sup | f (x)|, m∗i = inf | f (x)|.


x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]

Für x, y ∈ [ξi−1 , ξi ] folgt | f (x)| − | f (y)| ≤ | f (x) − f (y)| ≤ Mi − mi , und mit Hilfe von Lemma 2.7.10

Mi∗ − m∗i = sup | f (x)| + sup (−| f (x)|) = sup (| f (x)| − | f (y)|) ≤ Mi − mi .
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ] x,y∈[ξi−1 ,ξi ]

Es folgt
X
n(Z)
O(| f |, Z) − U(| f |, Z) = (Mi∗ − m∗i )(ξi − ξi−1 ) ≤
i=1

X
n(Z)
≤ (Mi − mi )(ξi − ξi−1 ) = O( f, Z) − U( f, Z) < ǫ.
i=1

und nach (8.3) ist | f | integrierbar. Die behauptete Ungleichung folgt aus Lemma 8.2.9, (ii).
Ist Z wie oben, so folgt aus der Tatsache, dass x 7→ x2 monton wachsend auf R + ∪{0} ist,

sup f (x)2 − inf f (x)2 = (Mi∗ )2 − (m∗i )2


x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]

= (Mi∗ + m∗i )(Mi∗ − m∗i ) ≤ 2k f k∞ · (Mi∗ − m∗i ).


Nun sehen wir wegen
 
X
n(Z)
 
O( f 2 , Z) − U( f 2 , Z) =  sup f (x)2 − inf f (x)2  (ξi − ξi−1 ) ≤
x∈[ξi−1 ,ξi ] x∈[ξi−1 ,ξi ]
i=1

X
n(Z)

≤ 2k f k∞ (Mi∗ − m∗i )(ξi − ξi−1 ) = 2k f k∞ O(| f |, Z) − U(| f |, Z) < 2k f k∞ · ǫ
i=1

wie oben, dass auch f 2 integrierbar ist. Die Behauptung für f g folgt aus der Beziehung

1 
fg = ( f + g)2 − f 2 − g2 .
2


8.5.2 Bemerkung. Sind die Funktionen in Satz 8.5.1 komplexwertig, so sind mit f, g auch Re f, Im f, Re g, Im g Riemannin-
tegrierbar. Da man | f |2 , Re f g, Im f g als Summe von Produkten von Re f, Im f, Re g, Im g darstellen kann, sind auch | f |2 , f g
Riemann-integrierbar. p
Man zeigt auch ähnlich wie im Beweis von Satz 8.5.1, dass mit | f |2 auch | f |2 = | f | Riemann-integrierbar ist.

8.6 Uneigentliche Integrale


Sei f : [a, b) → R (C), und angenommen f lässt sich zu einer Riemann-integrierbaren
Funktion f˜ : [a, b] → R (C) fortsetzen, dann folgt aus dem Hauptsatz
Z x Z b
lim f (t) dt = f˜(t) dt. (8.11)
x→b a a

Hat die Funktion f : [a, b) → R (C) nicht die Eigenschaft, dass sie sich auf [a, b]
zu einer Riemann-integrierbaren Funktion
R x fortsetzen lässt, so kann man immer noch
versuchen, für x ∈ [a, b) das Integral a f (t) dt zu berechnen, und dann x gegen b
streben zu lassen.
18 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

8.6.1 Definition. Sei f : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] für alle
x ∈ [a, b) Riemann-integrierbar. Dann heißt f uneigentlich integrierbar, falls
Z b Z β
f (t) dt := lim f (t)dt
a β→b− a

existiert. Entsprechend definiert man uneigentliche Integrale für Funktionen


f : (a, b] → R (C), wenn −∞ ≤ a < b.
Ist f : (a, b) → R (C), so definiert man mit einem beliebigen c ∈ (a, b)
Z b Z β Z c
f (t) dt := lim f (t)dt + lim f (t)dt, (8.12)
a β→b− c α→a+ α

falls die Grenzwerte existieren.


Man sieht leicht, dass (8.12) nicht von der Wahl von c ∈ (a, b) abhängt.
8.6.2 Beispiel.
(i) Für a ∈ R rechnet man
Z +∞ Z β
e−t dt = lim e−t dt = lim −(e−β − e−a ) = e−a .
a β→+∞ a β→+∞

(ii) Mit der Regel von de l’Hospital erhält man für ein b > 0
Z b Z b
ln t dt = lim ln t dt = b(ln(b) − 1) − lim α(ln(α) − 1) = b(ln(b) − 1).
0 α→0+ α α→0+

(iii) Bei der Berechnung von Z +∞


sin πt
dt
t 1
sieht man, dass bei uneigentlichen Intragralen ähnliche Phänomene auftreten, wie
bei Reihen. In der Tat existiert dieses Integral:
Z β Z [β] Z β
sin πt sin πt sin πt
dt = dt + dt =
1 t 1 t [β] t

X
[β]−1 Z n+1 Z β
| sin πt| sin πt
(−1)n dt + dt.
n=1 n t [β] t
R n+1
Man erkennt unschwer, dass n | sint πt| dt monoton gegen Null für n → ∞ kon-
vergiert. Mit Hilfe des Leibnizschen Kriteriums und wegen
Z β Z [β]+1
sin πt 1 2 β→+∞
dt ≤ | sin πt| dt = −→ 0,
[β] t [β] [β] π[β]
sieht man nun, dass unser Integral konvergiert, falls β → +∞.

Das Integral ist aber nicht absolut konvergent in dem Sinne, dass auch 1 sint πt dt
existiert, da
Z β X Z n+1 | sin πt|
[β]−1 Z 1 X 1
[β]−1
sin t dt ≥ dt = | sin πt| dt ·
t n+1 n+1
1 n=1 n 0 n=1

für β → +∞ divergiert.
8.6. UNEIGENTLICHE INTEGRALE 19

Das wohl am meisten verwendete und ähnlich wie bei den Folgen zu beweisende
Kriterium für die absolute Konvergenz ist das folgende Resultat.
8.6.3 Lemma. Seien f, g : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] und g|[a,x]
sowie der Betrag dieser Funktionen für alle x ∈ [a, b) Riemann-integrierbar.
Rb
Ist a g(x) dx absolut konvergent, so ist es auch konvergent. Ist obendrein |g(x)| ≥
Rb
| f (x)| für alle x ab einem c ∈ [a, b), so ist auch a f (x) dx absolut konvergent.
Beweis. Wegen den Ungleichungen
Z x Z x Z x2 Z x2
2 2

g(t) dt ≤ |g(t)| dt, | f (t)| dt ≤ |g(t)| dt,


x1 x1 x1 x1
R x 
vererbt sich die Eigenschaft, dass a |g(t)| dt ein Cauchy-Netz ist auch auf
R x  R x  x≥a

a
g(t) dt bzw. a | f (t)| dt . Nun folgt die behauptete Konvergenz aus Lemma
x≥a x≥a
8.3.2.

8.6.4 Bemerkung. Man kann Lemma 8.6.3 anwenden, um aus der Divergenz eines
Rb Rb
uneigentlichen Integrales a | f (x)| dx auf die Divergenz von a |g(x)| dx zu schließen,
wenn |g(x)| ≥ | f (x)| für alle x ∈ (a, b).
8.6.5 Beispiel. Man betrachte das uneigentliche Integral
Z +∞ Z 1 Z β
x ln x x ln x x ln x
2 + 1)3
dx := lim 2 + 1)3
dx + lim 2 + 1)3
dx.
0 (x α→0+ α (x β→+∞ 1 (x
Da die Funktion h(x) := x ln x nur für x ∈ (0, +∞) definiert ist, ist dieses Integral
uneigentlich an beiden Integrationsgrenzen. Die Funktion h(x) lässt sich aber stetig auf
[0, +∞) durch h(x) = 0 stetig fortsetzen. Somit bleibt nur die Uneigentlichkeit bei der
Stelle +∞ (vgl. (8.11)).
Für x ≥ 1 ist der Integrand nicht negativ. Daher ergeben dort sich folgende
Abschätzungen:

x ln x = x ln x ≤ x2

x2 1
(x2 + 1)3 (x2 + 1)3 (x2 + 1)3 (x2 )3 = x4 .

Wegen Z
1 ∞
1 ∞ 1
4
dx = − 3 =
1 x 3x 0 3
folgt aus Lemma 8.6.3 die absolute Konvergenz unseres Integrals.
8.6.6 Beispiel. Man betrachte das uneigentliche Integral
Z 1
ln x
2x x
dx.
0 e −e

Dieses ist nur uneigentlich bei 0. Für x ∈ (0, 1] gilt



ln x = − ln x .
e2x − e x e2x − e x

Wegen e−x ≥ 1/e für alle x ∈ [0, 1] folgt


− ln x − ln x 1 − ln x
= e−x x ≥ .
2x
e −e x e − 1 e ex − 1
20 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

Weiters gilt − ln x ≥ 1 für alle x ∈ (0, 1/e], d. h.

− ln x 1 1
≥ 1(0,1/e] (x) · ≥ 0, x ∈ (0, 1].
e2x − e x e ex − 1
Dabei ist 1(0,1/e] die Charakteristische Funktion des Intervalls (0, 1/e]. Für alle ǫ ∈
(0, 1/e) erhalten wir mit der Monotonie des Integrals
Z Z 1/e Z
ln x dx ≥ 1
1
1 1 1/e e−x
Iǫ := e2x − e x dx = dx .
ǫ e ǫ ex − 1 e ǫ 1 − e−x

Nun steht im Zähler die Ableitung des Nenners, d. h. eine Stammfunktion des Integran-
den ist ln(1 − e−x ). (Wegen x > 0 ist das Argument des Logarithmus positiv.) Daraus
ergibt sich
1 1/e 1 1 − e−1/e
Iǫ ≥ ln(1 − e−x ) = ln .
e ǫ e 1 − e−ǫ
Für ǫ → 0+ wird die rechte Seite jedoch beliebig groß, d. h. das uneigentliche Integral
Z
ln x dx
1

e2x − e x
0

ist divergent, und damit auch das im Beispiel angegebene.

8.7 Vertauschung von Integralen mit Grenzwerten


Das folgende Lemma ist eine unmittelbare Verallgemeinerung von Lemma 6.6.11.
Auch den Beweis kann man fast wörtlich übernehmen.

8.7.1 Lemma. Seien (I, I ) und (J,  J ) zwei gerichtete Mengen, und sei hY, di ein
vollständiger metrischer Raum.
Weiters seien H : I × J → Y und h : I → Y Funktionen, sodass für alle j ∈ J die
Funktion i 7→ H(i, j) beschränkt ist, und sodass

h(i) = lim H(i, j)


j∈J

gleichmäßig auf I, d.h.

∀ǫ > 0 ∃ j0 ∈ J : ∀ j  j0 , ∀i ∈ I : d(H(i, j), h(i)) ≤ ǫ,

bzw. äquivalent dazu h = lim j∈J H(., j) in hB(I, Y), d∞i. Schließlich existiere für alle
j ∈ J der Limes A j := limi∈I H(i, j).
Unter diesen Voraussetzungen ist auch (h(i))i∈I konvergent, wobei

lim A j = lim h(i), (8.13)


j∈J i∈I

oder einprägsamer geschrieben:

lim lim H(i, j) = lim lim H(i, j).


j∈J i∈I i∈I j∈J
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 21


Beweis. Sei ǫ > 0 gegeben. Wegen der gleichmäßigen Konvergenz von H(i, j) j∈J ist

H(., j) j∈J in B(I, Y) ein Cauchy-Netz. Es existiert also ein j0 ∈ J, sodass für j, k  j0
und alle i ∈ I gilt
dY (H(i, j), H(i, k)) ≤ ǫ.
Hält man j und k fest, so folgt dY (A j , Ak ) = limi∈I dY (H(i, j), H(i, k)) ≤ ǫ. Damit ist
(A j ) j∈J ein Cauchy-Netz, und wegen Lemma 8.3.2 konvergent. Setzen wir lim j∈J A j =:
A, so gilt
dY (h(i), A) ≤ dY (h(i), H(i, j)) + dY (H(i, j), A j) + dY (A j , A).
Wähle j nach der vorausgesetzten gleichmäßigen Konvergenz so, dass für alle i ∈ I gilt
dY (h(i), H(i, j)) < ǫ und so, dass dY (A j , A) < ǫ. Für dieses j existiert ein i0 ∈ I, sodass
aus i  i0 , die Ungleichung dY (H(i, j), A j) < ǫ folgt. Insgesamt erhalten wir

dY (h(i), A) < 3ǫ für i ∈ I und i  i0 .


Aus diesem Lemma folgen nun eine Reihe von wichtigen Ergebnissen.

8.7.2 Satz. Sei ( fn )n∈N eine Folge von Riemann-integrierbaren Funktionen auf [a, b],
fn , n ∈ N. Gilt limn→∞ fn = f gleichmäßig auf [a, b], so ist auch f Riemann-
integrierbar, wobei
Zb Zb
lim fn dx = f dx.
n→∞
a a

Entsprechendes gilt für gleichmäßig konvergente Netze von Funktionen.

Beweis. Um das letzte Lemma anwenden zu können, sei I = R die Menge aller
Riemann-Zerlegungen von [a, b] versehen mit der durch die Feinheit induzierte Ord-
nung und (J,  J ) = (N, ≤). Weiters sei Y = R (C), versehen mit der Euklidischen
Metrik, je nachdem, wohin die Funktionen abbilden.
Wir setzen H(R, n) := S ( fn , R), h(R) = S ( f, R). Wegen Lemma 8.2.9, (ii), gilt

|H(R, n) − h(R)| = |S ( fn − f, R)| ≤ k fn − f k∞ · (b − a) = d∞ ( fn , f ) · (b − a),

und daher konvergiert H(., n) gleichmäßig gegen h. Nach Lemma 8.7.1 folgt

Zb
lim fn dx = lim lim S ( fn , R)
n→∞ n→∞ |R|→0
a

Zb
= lim lim S ( fn , R) = lim S ( f, R) = f dx,
|R|→0 n→∞ |R|→0
a

wobei limn→∞ S ( fn , R) = S ( f, R) für ein festes R ∈ R leicht aus der Tatsache folgt,
dass diese Riemann-Summen endliche Summen sind.
Der Beweis für Netze verläuft fast identisch.

22 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

P
8.7.3 Beispiel. Sei ∞ n
n=0 an x eine Potenzreihe mit positivem Konvergenzradius R.
Dann gilt für [a, b] ⊆ {x : |x| < R}

Zb X ∞ 
 X
∞ Z b X∞
 n  an n+1 b
 an x  dx = an xn dx = x | x=a
n=0 n=0 a n=0
n+1
a

Somit haben wir eine weitere Möglichkeit, Stammfunktionen auszurechnen. So ist


2
etwa die Stammfunktion von e−x nicht als Summe von Produkten von Funktionen wie
Polynome, e hoch Polynomen, oder dergleichen darstellbar. Aber zumindest lässt sich
eine Stammfunktion F(x) als
Z x Z xX
∞ X ∞
2 (−1) j 2 j (−1) j
F(x) = e−t dt = t dt = x2 j+1 ,
0 0 j=0
j! j=0
( j!)(2 j + 1)

anschreiben.
Mit Hilfe des Hauptsatzes können wir auch Differentiation und Limes vertauschen
(siehe auch Satz 7.2.19).
8.7.4 Korollar. Sei ( fn )n∈N eine Folge von reell- bzw. komplexwertigen Funktionen, aus
C1 [a, b].
Es existiere ein Punkt x0 ∈ [a, b], sodass ( fn (x0 ))n∈N konvergiert. Ist dann die Folge
( fn′ )n∈N gleichmäßig konvergent auf [a, b], so ist auch die Folge ( fn )n∈N gleichmäßig
konvergent auf [a, b], und es gilt
d d
lim fn (x) = lim fn (x), x ∈ [a, b].
dx n→∞ n→∞ dx

Entsprechendes gilt für Netze von Funktionen.


Rx
Beweis. Nach Satz 8.4.6 gilt fn (x) = x fn′ (t) dt + fn (x0 ) für alle x ∈ [a, b]. Setzen
0
wir g := limn→∞ fn′ und A := limn→∞ fn (x0 ), so ist g wegen Korollar 6.6.13 stetig.
Außerdem folgt für x ∈ [a, b] aus Satz 8.7.2
Z x Z x !

g(t) dt + A = lim fn (t) dt + fn (x0 ) = lim fn (x) =: f (x),
x0 n→∞ x0 n→∞

womit ( fn )n∈N zumindest punktweise gegen f (x) konvergiert. Nach Satz 8.4.6 ist die
linke Seite ableitbar, und daher gilt f ′ (x) = g(x) = limn→∞ fn′ (x), x ∈ [a, b].
Die Gleichmäßigkeit der Konvergenz folgt aus
Z x

sup | fn (x) − f (x)| = sup ( fn (x) − g(t)) dt + fn (x0 ) − A ≤

x∈[a,b] x∈[a,b] x0
n→∞
(b − a) · k fn′ − gk∞ + | fn (x0 ) − A| −→ 0. (8.14)


Wir können das nun auf Taylorreihen anwenden.
P
8.7.5 Proposition. Sei ∞ a zn eine Potenzreihe mit Konvergenzradius R > 0. Dann
P∞ n=0 n
hat die Potenzreihe n=0 (n + 1)an+1 zn hat denselben Konvergenzradius R.
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 23

Die Funktion
X

f : (−R, R) → C, f (t) = an t n
n=0
ist auf (−R, R) differenzierbar und hat die Ableitung
X

f ′ (x) = (n + 1)an+1 xn .
n=0

Sie ist sogar beliebig oft differenzierbar mit (l ∈ N)


X

f (l) (x) = (n + l) · · · (n + 1)an+l xn , (8.15)
n=0

wobei auch diese Potenzreihe Konvergenzradius R hat. Insbesondere gilt

f (l) (0) = l!al .


P
Beweis. Dass der Konvergenzradius von ∞ n
n=0 (n + 1)an+1 z auch R ist, prüft man ent-
P
weder mit Hilfe des Majorantenkriteriums durch einen Vergleich mit ∞ n
n=0 |an z | nach,
oder man zeigt, dass
1 1
√n = lim sup n+1
√ = R,
lim supn→∞ |(n + 1)an+1 | n→∞ |an+1 |
vgl. Satz 6.7.8 und Lemma 7.3.1.
Für jedes feste r ∈ (0, R) konvergiert wegen Satz 6.7.8 die Funktionenfolge
PN
( n=0 an tn )N∈N auf [−r, r] gleichmäßig gegen f . Analog konvergiert die Funktionen-
PN
folge ( n=0 (n + 1)an+1 tn )N∈N auf [−r, r] gleichmäßig und zwar wegen Korollar 8.7.4

gegen f . Da r < R beliebig war, folgt die Behauptung.
Die Verallgemeinerung in (8.15) folgt nun leicht durch vollständige Induktion.

8.7.6 Beispiel. Für x ∈ (−1, 1) ist die Funktion x 7→ ln(1 − x) beliebig oft differenzier-
P
bar. Da ln(1 − x)′ = − 1−x1
=− ∞ n
n=1 x nach Proposition 8.7.5 mit der Ableitung von
P∞ xn P xn
x 7→ − n=1 n , x ∈ (−1, 1) übereinstimmt, und da ln(1 − x) und − ∞ n=1 n für x = 0
beide den Wert Null annehmen, folgt aus Korollar 7.2.7, dass
X∞
xn
ln(1 − x) = − für alle x ∈ (−1, 1).
n=1
n
P∞ (−1)n
Da diese Reihe auch für x = −1 (bedingt) konvergiert, folgt aus Satz 6.7.13, dass − n=1 n = ln(2).

Als Vorspiel zum nächsten Ergebnis wollen wir uns kurz mit dem Produkt zweier
metrischer Räume beschäftigen.
8.7.7 Fakta.
1. Seien (X, dX ) und (Y, dY ) zwei metrische Räume. Ist X × Y die Menge aller ge-
ordneten Paare, und definiert man

d (a, b), (x, y) := max(dX (a, x), dY (b, y)), (8.16)

so sieht man unmittelbar, dass (X × Y, d) ein metrischer Raum ist, und dass
(xn , yn ) → (x, y) genau dann, wenn xn → x und yn → y.
24 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

2. Sind K1 ⊆ X und K2 ⊆ Y jeweils kompakt, so ist es auch K1 × K2 , denn ist



(xn , yn ) n∈N eine Folge in K1 × K2 , so gibt es eine Teilfolge (xn(k) )k∈N , sodass
xn(k) → x ∈ K1 und weiter eine Teilfolge (yn(k( j)) ) j∈N mit yn(k( j)) → y ∈ K2 , also
(xn(k( j)) , yn(k( j)) ) → (x, y).

3. Die offene Kugel Uǫ (a, b) um ein (a, b) ∈ X × Y ist nichts anderes als

Uǫ (a) × Uǫ (b), da d (a, b), (x, y) = max(dX (a, x), dY (b, y)) < ǫ ⇔ dX (a, x) <
ǫ ∧ dY (b, y) < ǫ.

4. Sind O1 ⊆ X, O2 ⊆ Y offen, so auch O1 × O2 ⊆ X × Y, da es zu (a, b) ∈ X × Y


sicherlich ein ǫ > 0 mit Uǫ (a) ⊆ O1 und Uǫ (b) ⊆ O2 gibt, und dann Uǫ (a, b) ⊆
O1 × O2 .

5. Die Definition von d∞ auf R p passt genau in dieses Bild, denn haben wir p1 +
p2 = p, und sind sowohl R p1 als auch R p2 versehen mit d∞ , und versieht man
R p = R p1 × R p2 mit der Metrik aus (8.16), so erhält man genau wieder d∞ .

8.7.8 Korollar. Ist f : [a, b] × K → R (C) stetig, wobei K eine kompakte Teilmenge
eines metrischen Raumes (Y, dY ) ist, so ist auch die Funktion (Parameterintegral) R :
K → R (C), wobei Z b
R(t) = f (s, t) ds,
a
stetig.

Beweis. Zunächst ist [a, b] × K eine kompakte Teilmenge von R × Y. Somit ist die
Funktion f sogar gleichmäßig stetig (vgl. Satz 6.3.3). Zu gegebenen ǫ > 0 gibt es
somit ein δ > 0, sodass

d (s, t), (s′ , t′ ) < δ ⇒ | f (s, t) − f (s′ , t′ )| < ǫ.

Insbesondere dY (t, t′ ) < δ ⇒ | f (s, t) − f (s, t′ )| < ǫ und somit d∞ ( f (., t) − f (., t′ )) ≤ ǫ.
Somit folgt für t0 ∈ K, dass f (., t) → f (., t0 ) gleichmäßig, wenn t → t0 . Wegen Satz
8.7.2 gilt daher für das Netz ( f (s, t))t∈K\{t0 } von Funktionen auf [a, b], geordnet durch
t1  t2 ⇔ dY (t0 , t1 ) ≥ dY (t0 , t2 ),
Z b Z b Z b
lim R(t) = lim f (s, t) ds = lim f (s, t) ds = f (s, t0 ) ds = R(t0 ).
t→t0 t→t0 a a t→t0 a

Also ist R stetig bei einem beliebigen Punkt t0 .



Mit unserem Grenzwertvertauschungssatz lässt sich auch die Vertauschbarkeit der
Integrationsreihenfolge zeigen.

8.7.9 Satz (Satz von Fubini). Ist f : [a, b] × [c, d] → R (C) stetig, so gilt
Z b Z d ! Z d Z b !
f (s, t)dt ds = f (s, t)ds dt.
a c c a

Beweis. Die Existenz der inneren und der äußeren Integrale wird durch Korollar 8.7.8
gewährleistet.
Sei I = R die Menge aller Riemann-Zerlegungen von [a, b] und sei J = P
die Menge aller Riemann-Zerlegungen von [c, d] beide gerichtet mit der durch die
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 25

n(R) 
Feinheit induzierten Ordnung. Wir definieren für R = (ξ j )n(R)
j=0 ; (α j ) j=1 und P =

(η j )n(P) n(P)
j=0 ; (β j ) j=1

n(R) X
X n(P)
H(R, P) := (ξ j − ξ j−1 )(ηk − ηk−1 ) f (α j , βk ), (8.17)
j=1 k=1

und bemerken, dass


n(R) 
X
n(P) X 
H(R, P) = (ηk − ηk−1 )  (ξ j − ξ j−1 ) f (α j , βk ) = S (S ( f1 , R), P),
k=1 j=1

wobei f1 die Funktion f mit festgehaltener zweiter Variablen ist, und S ( f1 , R) als
Funktion eben dieser Variable aus [c, d] betrachtet wird. Entsprechend gilt H(R, P) =
S (S ( f2 , P), R).
Wegen (8.10) gilt

|H(R, P) − H(R, P1 )| = |S (S ( f1 , R), P) − S (S ( f1 , R), P1 )| ≤ (8.18)

2(d − c) · sup{ |S ( f1 , R)(t) − S ( f1 , R)(t′ )| : t, t′ ∈ [c, d], |t − t′ | ≤ max(|P1 |, |P|) }.


Außerdem ist wegen Lemma 8.2.9, (ii),
  
|S ( f1 , R)(t) − S ( f1 , R)(t′ )| = S f (, t) − f (., t′ ) , R ≤ (b − a) · k f (., t) − f (., t′ )k∞ .

Da unsere Funktion f gleichmäßig stetig ist, gibt es zu gegebenen ǫ > 0 ein δ > 0,
sodass k f (., t) − f (., t′ )k∞ ≤ ǫ. Aus (8.18) folgt dann

|H(R, P) − H(R, P1 )| ≤ 2(d − c)(b − a)ǫ,



wenn nur |P1 |, |P| < δ. Somit ist H(., P) P∈J ein Cauchy-Netz in B(I, C)9 und kon-
vergiert daher wegen Lemma 8.3.2 in B(I, C) bzgl. d∞ , also gleichmäßig gegen eine
Funktion h : I → C, wobei

h(R) = lim H(R, P) = lim S (S ( f2 , P), R) =


|P|→0 |P|→0

Z d
S ( lim S ( f2 , P), R) = S ( f (., t) dt, R).
|P|→0 c
Daraus folgt
Z d Z b Z d !
lim lim H(R, P) = lim S ( f (., t) dt, R) = f (s, t)dt ds.
|R|→0 |P|→0 |R|→0 c a c

Wegen der gleichmäßigen Konvergenz können wir nun Lemma 8.7.1 anwenden und
erhalten
lim lim H(R, P) = lim lim H(R, P),
|R|→0 |P|→0 |P|→0 |R|→0
R d R b 
wobei letzterer Doppellimes aus Symmetriegründen c a
f (s, t)ds dt ist.

9 Das ist der vollständig metrische Raum aller auf I beschränkten C-wertigen Funktionen versehen mit

d∞ , vgl. Definition 6.6.3.


26 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

8.7.10 Bemerkung. Ist eine stetige reell- oder komplexwertige Funktion auf einem
Q
Quader pj=1 [a j , b j ] = [a1 , b1 ] × · · · × [a p , b p ] ⊆ R p definiert, so ist wegen Korollar
R bp Q p−1
8.7.8 (t j ) p−1
j=1 7→ a p f (t1 , . . . , t p−1 , s) ds stetig auf j=1 [a j , b j ] ⊆ R
p−1
.
Nun kann man nach der vorletzten Variablen integrieren, dann nach der vorvorletz-
ten, usw. . Schließlich erhält man.
Z b1 Z bp
... f (t1 , . . . , t p ) dt p . . . dt1 . (8.19)
a1 ap

Wendet man Satz 8.7.9 mehrere male an, so sieht man, dass es hier nicht auf die Inte-
grationsreihenfolge ankommt.
Man kann das als Ausgangspunkt für die Integrationstheorie für Funktionen, die auf
Q
einem Rechteck oder allgemeiner über einem Quader Q = pj=1 [a j , b j ] ⊆ R p definiert
sind, nehmen, indem man Z
f (t)dt
Q

als (8.19) definiert. Dieser Ausdruck hängt zumindest für stetige f nicht von der Inte-
grationsreihenfolge ab, ist also in einem gewissen Sinne sinnvoll definiert.
Größere Probleme tauchen auf, wenn man etwa das Integral einer stetigen Funk-
tion über einen Kreis definieren will. Solche Integrale werden wir in der Analysis 3
Vorlesung behandeln.
Als Folgerung erhält man unmittelbar eine Aussage über die Differenzierbarkeit
von Parameterintegralen.
8.7.11 Korollar. Sei f : [a, b] × [c, d] → R(C) stetig und so, dass die Ableitung nach
der ersten Variablen für alle (s, t) ∈ [a, b] × [c, d] existiert, und dass
d
f (s, t)10 ,
f1 (s, t) =
ds
Rd
ebenfalls stetig ist. Dann ist die Funktion s 7→ c f (s, t) dt für s ∈ [a, b] stetig differen-
zierbar mit der Ableitung
Z d Z d
d
f (s, t) dt = f1 (s, t) dt. (8.20)
ds c c

Beweis. Wegen Satz 8.7.9 und dem zweiten Hauptsatz gilt


Z xZ d Z dZ x Z d
f1 (s, t) dtds = f1 (s, t) dsdt = ( f (x, t) − f (a, t)) dt.
a c c a c

Differenziert man diese Gleichung nach der Variablen x, so erhält man (8.20). Dass
(8.20) stetig von s ∈ [a, b] abhängt, folgt aus Korollar 8.7.8.

8.7.12 Beispiel. Als Anwendung der Grenzwertvertauschungen wollen wir folgende
besonders in der Statistik und Wahrscheinlichkeitstheorie wichtige Tatsache zeigen:
Z +∞
2 √
e−t dt = π. (8.21)
−∞
10 Dafür ∂
werden wir später ∂s f (s, t) schreiben.
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 27

Dazu betrachte man (x ∈ [0, C] mit C > 0 beliebig)


Z 1 2 2
π e−x (t +1)
F(x) = − dt. (8.22)
4 0 t2 + 1
2 2
Die Ableitung des Integranden nach x ist −2xe−x (t +1) . Somit ist diese und offensicht-
lich der Integrand selber auf [0, C] × [0, 1] stetig. Aus Korollar 8.7.11 schließen wir
Z 1
′ −x2 2 2
F (x) = 2xe e−x t dt.
0

Außerdem gilt
Z 1
π 1 π
F(0) = − 2
dt = − arctan |10 = 0.
4 0 t +1 4
R x 2 2 2
Rx 2
Ist andererseits G(x) = 0 e−t dt , so gilt G′ (x) = 2e−x 0 e−t dt, und aus der Sub-
stitutionsregel folgt F ′ (x) = G′ (x). Wegen G(0) = 0 = F(0) folgt F(x) = G(x) und
zwar für alle x ≥ 0, da ja C > 0 beliebig war.
−x2 (t 2 +1) 2
Wegen e t2 +1 ≤ e−x konvergiert der Integrand in (8.22) für x → +∞ gleichmäßig
gegen die Nullfunktion, und mit Satz 8.7.2 erhält man
π
lim G(x) = lim F(x) = .
x→+∞ x→+∞ 4
Aus der Stetigkeit der Wurzelfunktion folgt
Z x √
2 π
lim e−t dt = ,
x→+∞ 0 2
und damit (8.21).
8.7.13 Beispiel. Wir betrachten die Funktion
Z +∞ Z 1 Z β
sin x −xt sin x −xt sin x −xt
F(t) = · e dx := lim · e dx + lim · e dx.
0 x γ→0+ γ x β→+∞ 1 x

Diese ist wohldefiniert für t ∈ [0, +∞), da obiges uneigentliches Integral für alle t ≥ 0
konvergiert, wobei es aber nur für t > 0 absolut konvergiert.
Man beachte dabei auch, dass 0 nicht wirklich eine Uneigentlichkeitsstelle obigen
Integrales ist, da sich die Funktion g(x) := sinx x , x ∈ (0, +∞) stetig auf [0, +∞) durch
g(0) := 1 = lim x→0+ sinx x fortsetzen lässt. Also gilt nach dem Hauptsatz der Differential-
und Integralrechnung
Z 1 Z 1
sin x −xt
lim · e dx = g(x) · e−xt dx.
δ→0+ δ x 0

Man beachte, dass das Netz (α > 1)


Z α
sin x −xt
Fα (t) = · e dx
1
α
x

von Funktionen auf [0, +∞). Es konvergiert


punktweise
gegen F(t).
Weiters wollen wir bemerken, dass sinx x ≤ 1, x > 0, da die Funktion sin x − x
bei Null verschwindet, und auf [0, +∞) eine Ableitung kleiner gleich Null hat und
28 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

somit monoton fallend ist. Also gilt sin x − x ≤ 0, x ∈ [0, +∞) und daher sinx x ≤ 1
sicher für x ∈ (0, 1]. Für x > 1 ist diese Ungleichung
klarerweise auch richtig, da
| sin x| ≤ 1, x ∈ R, und für x < 0 gilt sinx x = sin(−x)
−x
.
Wir wollen nun limt→+∞ F(t) berechnen. Dazu betrachten wir F(t) für t ∈ [δ, +∞)
für ein festes δ > 0, und bemerken, dass für t ≥ δ
Z 1 Z β
α sin x
−xt sin x −xt
|F(t) − Fα (t)| = lim · e dx + lim · e dx ≤
γ→0+ γ x β→+∞ α x
Z 1 Z β
α
lim e−δx dx + lim e−δx dx =
γ→0+ γ β→+∞ α
Z 1 Z +∞ 1
α
−δx 1 − e− α + e−α
( + )e dx = .
0 α δ
Der Ausdruck rechts konvergiert für α → +∞ gegen 0 und zwar unabhängig von t ∈
[δ, +∞). Also konvergiert Fα gegen F gleichmäßig auf [δ, +∞).
Andererseits gilt nach Satz 8.7.2 für ein festes α > 1
Z α
sin x −xt
lim Fα (t) = lim · e dx =
t→+∞ t→+∞ 1
α
x
Z α Z α
sin x −xt
lim · e dx = 0 dx = 0,
1 t→+∞ x 1
α α

da wegen sinx x · e−xt ≤ e−t α das Netz von Funktionen x 7→ sinx x · e−xt , x ∈ [ α1 , α] für
1

t → +∞ gleichmäßig gegen 0 konvergiert.


Setzen wir also H(t, α) := Fα (t) für (t, α) ∈ [δ, +∞)×(1, +∞), wobei diese Intervalle
jeweils gegen +∞ gereichtet sind, so folgt aus Lemma 8.7.1

lim F(t) = lim lim Fα (t) = lim lim Fα (t) = lim 0 = 0.


t→+∞ t→+∞ α→+∞ α→+∞ t→+∞ α→+∞

Nun wollen wir F ′ (t) für t > 0 berechnen. Dazu halten wir wieder δ > 0 fest und
betrachten t ∈ [δ, +∞). Wir wissen schon, dass Fα → F und zwar gleichmäßig auf
dieser Menge. Betrachten wir nun für ein festes α > 1 die das Integral
Z α
sin x −xt
Fα (t) = · e dx,
1
α
x

so ist der Integrand stetig in (x, t) ∈ [ α1 , α] × [δ, +∞), und auch die Ableitung

∂ sin x −xt
· e = − sin x · e−xt
∂t x
des Integranden nach t (∈ [δ, +∞)) ist stetig in (x, t) ∈ [ α1 , α] × [δ, +∞). Also gilt nach
Korollar 8.7.11 Z α
Fα′ (t) = − sin x · e−xt dx.
1
α

Wegen (t ∈ [δ, +∞))


Z +∞ Z α


−xt
− sin x · e dx − − sin x · e dx ≤
−xt
0 1
α
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN 29

Z 1 Z +∞ 1
α 1 − e− α + e−α
( + ) e−δx dx =
0 α δ
konvergiert Fα′ (t) für α → +∞ unabhängig von t, daher gleichmäßig in t ∈ [δ, +∞),
gegen
Z +∞
− sin x · e−xt dx.
0

Nach Korollar 8.7.4 ist daher das genau die Ableitung von F(t). Wegen (Stammfunkti-
on in x)
Z
1
− sin x · e−xt = (t sin x + cos x)e−xt + c
1 + t2

folgt F ′ (t) = − 1+t


1
2 , t > 0, und somit F(t) = C − arctan x, x ∈ (0, +∞) für ein festes

reelles C. Lässt man t gegen +∞ streben, so sieht man, dass C = π2 .


Schließlich gilt für t ≥ 011
Z 1 Z +∞
sin x −xt 1 −xt
F(t) = · e dx + · e sin x dx.
0 x 1 x

Das erste Integral ist gemäß Korollar 8.7.8 stetig auf [0, 1]. Für das zweite stimmt nach
einer partiallen Integraltion überein mit
" #β Z β
1 t sin x + cos x −xt 1 t sin x + cos x −xt
lim − 2
e − lim e dx. (8.23)
β→+∞ x 1+t β→+∞ 1 x2 1 + t2
1

Man beachte, dass der erste Grenzwert genau

t sin 1 + cos 1 −t
e
1 + t2

x+cos x −xt
ist, und somit auch stetig auf [0, +∞) ist. Wegen t sin1+t 2 e ≤ 1 gilt für t ≥ 0
Z +∞ Z β Z +∞
1 t sin x + cos x −xt 1 t sin x + cos x −xt 1
e dx − e dx ≤ dx.
1 x 2 1+t 2
1 x
2 1+t 2 β x2

Also konvergiert das Netz


Z β
1 t sin x + cos x −xt
e dx
1 x2 1 + t2

von stetigen (siehe Korollar 8.7.6) Funktion in t ∈ [0, +∞) gleichmäßig gegen den
zweiten Grenzwert aus (8.23). Also ist auch dieser stetig (vgl. Korollar 6.6.11). Damit
haben wir die Stetigkeit von F(t) auf ganz [0, +∞) nachgewiesen.
Da aber F(t) = π2 − arctan t für t > 0 folgt für t → 0+ die Gleichung
Z +∞
sin x π
dx = F(0) = .
0 x 2
11 Man sin x
denke sich wieder x bei x = 0 zu eins fortgesetzt.
30 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL

8.8 Mittelwertsätze
Folgende Tatsache liegt unmittelbar auf der Hand.

8.8.1 Satz (Mittelwertsatz der Integralrechnung). Sei f eine reelle und Riemann-
integrierbare Funktion auf [a, b]. Dann existiert ein µ ∈ [inf t∈[a,b] f (t), supt∈[a,b] f (t)]
mit
Zb
f (t) dt = µ(b − a). (8.24)
a

Ist f stetig, so gibt es ein x ∈ [a, b], sodass µ = f (x).

Beweis. Aus inf t∈[a,b] f (t) ≤ f (s) ≤ supt∈[a,b] f (t) folgt nach Lemma 8.2.9 durch Inte-
gration nach s

Zb
(b − a) · inf f (t) ≤ f (s) ds ≤ (b − a) · sup f (t),
t∈[a,b] t∈[a,b]
a

und damit unmittelbar (8.24). Für ein stetiges f ist nach dem Zwischenwertsatz
f (x) = µ für ein x ∈ [a, b].

Dieser Beweis lässt sich leicht so umändern, dass man folgenden Satz erhält.

8.8.2 Satz (Erweiterter Mittelwertsatz der Integralrechnung). Seien f und g reelle und
Riemann-integrierbare Funktion auf [a, b], wobei g(t) ≥ 0, t ∈ [a, b]. Dann existiert
ein µ ∈ [inf t∈[a,b] f (t), supt∈[a,b] f (t)] mit

Zb Zb
f (t)g(t) dt = µ g(t) dt. (8.25)
a a

Ist f stetig, so gibt es ein x ∈ [a, b], sodass µ = f (x).

Beweis. Man betrachte die Ungleichung

g(s) inf f (t) ≤ g(s) f (s) ≤ g(s) sup f (t),


t∈[a,b] t∈[a,b]

und integriere alle Funktionen nach s. Nach Lemma 8.2.9 erfüllen die Integrale die
selbe Ungleichungskette. Daraus folgt unmittelbar (8.25). Für ein stetiges f ist nach
dem Zwischenwertsatz f (x) = µ für ein x ∈ [a, b].

Als eine Anwendung beweisen wir die Taylorsche Formel (vgl. Satz 7.3.6) mit
einem Restglied in Integralform. Dabei sind die Voraussetzungen etwas stärker.
8.8.3 Beispiel. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b, und sei
n ∈ N ∪ {0}. Weiters sei f : I → R mit f ∈ Cn+1 (I).
Seien x, y ∈ I, x , y. Dann gilt

f ′ (y) f ′′ (y) f (n) (y)


f (x) = f (y) + (x − y) + (x − y)2 + · · · + (x − y)n +
1! 2! n!
8.8. MITTELWERTSÄTZE 31

Zx
(x − t)n
+ f (n+1) (t) dt.
n!
y

Um diese Formel einzusehen, starten wir mit


Zx
f (x) − f (y) = f ′ (t) dt,
y

und integrieren partiell:


Zx Zx
′ ′
f (x) − f (y) = − f (t)(−1) dt = f (y)(x − y) + f ′′ (t)(x − t) dt =
y y

Zx
′ (x − y)2
′′ (x − t)2
= f (y)(x − y) + f (y) + f ′′′ (t) dt =
2 2
y

X
n Zx
(x − y)k (x − t)n
= ··· = f (k) (y) + f (n+1) (t) dt.
k=1
k! n!
y
n+1
Mit dem Satz 8.8.2 folgt, dass sich das Restglied in der Form f (n+1) (ξ) (x−y)
(n+1)! für ein
geeignetes ξ ∈ [min(x, y), max(x, y)] schreiben lässt (vgl. Satz 7.3.6).
32 KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
Kapitel 9

Normen, Banachräume und


Fourierreihen

9.1 Normierte Räume


In diesem Kapitel wollen wir eine spezielle Klasse von metrischen Räumen betrachten.
Diese Räume stellen eine Schnittstelle zwischen Linearer Algebra und Analysis dar.
9.1.1 Definition. Sei X ein Vektorraum über R (C). Eine Abbildung k.k : X → [0, ∞)
heißt Norm, wenn gilt:
(i) Dreiecksungleichung: kx + yk ≤ kxk + kyk, x, y ∈ X.
(ii) kλxk = |λ| · kxk, x ∈ X, λ ∈ R (∈ C).
(iii) kxk > 0 für alle x , 0.
Ist auf dem Vektorraum X eine Norm gegeben, so spricht man von (X, k · k) als einem
normierten Raum.
Ist X ein normierter Raum, so folgt unmittelbar aus den Eigenschaften einer Norm,
dass

d(x, y) := kx − yk, x, y ∈ X , (9.1)


eine Metrik auf X ist. Diese Metrik hat ganz spezielle Eigenschaften.
9.1.2 Lemma. Sei (X, k · k) ein normierter Raum, und seien (xn )n∈N , (yn )n∈N Folgen in
X, x, y ∈ X, und (λn )n∈N eine Folge bzw. λ ein Element im Skalarkörper von X, also in
R bzw. C. Ist xn → x, yn → y, λn → λ für n → ∞, so folgt

lim kxn k = kxk, lim xn + yn = x + y, lim λn xn = λx.


n→∞ n→∞ n→∞

Entsprechende Aussagen gelten auch für Netze.


Beweis. Den Beweis führt man genauso, wie für Folgen von Zahlen. Die erste Glei-
chung folgt aus Lemma 3.2.12 wegen kxn k = d(xn , 0) → d(x, 0) = kxk.
Wir zeigen nur noch die dritte Grenzwertbeziehung. Die zweite ist noch einfacher
zu verifizieren.

33
34 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es ein N ∈ N, sodass |λ − λn |, kxn − xk < ǫ für alle
n ≥ N. Es folgt kxn k ≤ kxn − xk + kxk < 1 + kxk und damit

kλn xn − λxk ≤ kλn xn − λxn k + kλxn − λxk = |λn − λ|kxn k + |λ|kxn − xk ≤ (1 + kxk + |λ|)ǫ.

Wir sehen also, dass λn xn → λx.


9.1.3 Korollar. Sei (X, k · k) ein normierter und (Y, d) ein metrischer Raum, und seien
f, g : D → X und λ : D → R (C) stetig, wobei D ⊆ Y. Dann sind auch λ f und f + g
stetige Funktionen von D nach X.

Beweis. Aus yn → y in (Y, d) folgt wegen der Stetigkeit f (yn ) → f (y) und g(yn ) → g(y)
in (X, k·k). Aus Lemma 9.1.2 folgt ( f +g)(yn ) = f (yn ) +g(yn) → f (y) +g(y) = ( f +g)(y)
und mit Proposition 6.1.4 die Stetigkeit von f + g. Entsprechend zeigt man die Stetig-
keit von λ f .

9.1.4 Definition. Ist die von (X, k·k) erzeugte Metrik vollständig, so heißt der normierte
Raum Banachraum.

9.1.5 Beispiel.

(i) Klarerweise ist (R, |.|) ein Banachraum über R. (C, |.|) ist auch ein Banachraum,
wobei man ihn als Vektorraum über C und als Vektorraum über R betrachten
kann.
p
qP Paradebeispiel eines normierten Raumes über R ist (R , k.k2 ), wobei kxk2 :=
(ii) Das
p 2 1 T
j=1 |x j | . Dabei ist x = (x1 , . . . , x p ) . Die erzeugte Metrik ist die wohlbe-
kannte Euklidische Metrik:
v
u
tX p
d2 (x, y) = kx − yk2 = |x j − y j |2 .
j=1

qP
p
(iii) Man kann auch den normierten Raum (C p , k.k2 ) über C mit kzk2 := j=1 |z j |
2

betrachten, wobei z = (z1 , . . . , z p ).


Identifiziert man dabei die j-te Komponente z j mit dem Paar (Re z j , Im z j ), so
sieht man leicht, dass sich C p mit R2p identifizieren lässt. Wegen
v
u
tX v
u
tX
p p X
p
|z j |2 = | Re z j |2 + | Im z j |2 ,
j=1 j=1 j=1

bleiben dabei auch die Normen erhalten.


P
(iv) Man kann auch R p mit anderen Normen versehen: kxk1 := pj=1 |x j |, kxk∞ :=
max pj=1 |x j |. Die dazugehörigen Metriken sind gerade die wohlbekannten Metri-
ken d1 und d∞ .
1 Ab hier wollen wir die Elemente von R p als stehende Vektoren betrachten.
9.1. NORMIERTE RÄUME 35

9.1.6 Bemerkung. Wir wissen schon aus dem ersten Semester, dass R p versehen mit
einer der Metriken d1 , d2 , d∞ vollständig ist. Somit sind obige Beispiele Banachräume.
Außerdem haben wir gesehen, dass die Konvergenz einer Folge in R p (bzgl. einer dieser
Metriken) äquivalent zur komponentenweisen Konvergenz ist:

xk → x ⇔ xk, j → x j , j = 1, . . . , p. (9.2)

Eine Konsequenz daraus ist, dass eine Funktion f : D → R p , wobei D Teilmenge eines
metrischen Raumes (X, d) ist, genau dann stetig ist, wenn alle Komponentenfunktionen
f j : D → R, j = 1, . . . , p stetig sind. Dabei ist
 
 f1 (x) 
 
f (x) =  ...  .
 
f p (x)

Diese Tatsache kann man auch etwas struktureller betrachten. Bezeichne mit π j , j =
1, . . . , p, die j-te Projektion



 Rp → R

  


  x1 
 
πj : 

 x =  ..  7→ x .


  .  j

 
xp

Aus (9.2) folgert man leicht, dass π j stetig ist. Das haben wir aber auch schon in Bei-
spiel 6.1.2
Mit obiger Notation gilt f j = π j ◦ f , und f ist genau dann stetig, wenn alle π j ◦ f
es sind.

9.1.7 Bemerkung. Für eine Funktionen g : D → X, wobei (X, d) ein metrischer Raum
und D ⊆ R p ist, ist wegen (9.2) die Stetigkeit g nicht abhängig von der auf R p gewähl-
ten Metrik d1 , d2 oder d∞ .
Setzen wir nun voraus, dass g stetig ist. Sei [a, b] ein reelles Intervall, x2 , . . . , x p
fest in R, sodass (t, x2 , . . . , x p )T ∈ D für t ∈ [a, b]. Dann ist auch Funktion h : t 7→
g(t, x2 , . . . , x p )T als Funktion [a, b] → X stetig.
Die gleiche Aussage gilt natürlich, wenn man nicht x1 , sondern eine der Variablen
x2 , x3 , . . . , x p durch t ersetzt.
Diese Tatsache lässt sich auch struktureller betrachten. Mit ιk , k = 1, . . . , p bezeich-
nen wir die Einbettung
(
R → Rp
ιk : .
x 7→ (a1 , . . . , ak−1 , x, ak+1 , . . . , a p )T

Man sieht unmittelbar, dass die ιk ’s alle stetige Funktionen sind. Mit obiger Notation
ist nun h(t) = g(ι1 (t)), falls wir a2 = x2 , . . . , a p = x p setzen. Also sieht man wieder,
dass h stetig ist.
Man könnte nun glauben, dass auch die Umkehrung gilt. Dem ist aber nicht so:
g ◦ ιk stetig für k = 1, . . . , n und alle (a1 , . . . , an )T ∈ D ; g stetig (vgl. Beispiel
9.1.8 oder Beispiel 9.1.9).
36 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

9.1.8 Beispiel. Betrachte die Funktion f : R2 → R definiert durch


!   ξη T T
ξ 
 ξ2 +η2 , (ξ, η) , (0, 0)
f := 

η 0 , (ξ, η)T = (0, 0)T
 
Ist η0 festgehalten, η0 , 0, so ist f ηξ0 offenbar eine stetige Funktion von ξ. Im Fall
   
η0 = 0 gilt immer f ηξ0 = 0, also ist f ηξ0 auch in diesem Fall stetig in ξ. Genauso
 
sieht man, dass f ξη0 für jedes feste ξ0 eine stetige Funktion von η ist. Die Funktion f
ist also in jeder der beiden Variablen ξ und η einzeln stetig. Trotzdem
 ist f bei (0, 0)T
2 ξ 1
nicht stetig als Funktion f : R → R, denn es gilt offenbar f ξ = 2 für alle ξ , 0.
Man hat in diesem Beispiel also die folgende Situation: läuft der Punkt x gegen 0,
und zwar längs einer der beiden Koordinatenachsen, so strebt f (x) gegen 0. Kommt
x jedoch längs eines anderen Strahls, z.B. längs des Strahles mit 45◦ , so strebt f (x)
nicht gegen 0. Liegt allgemeiner x auf dem Strahl mit Winkel ϕ ∈ [0, 2π), also x =
(r cos ϕ, r sin ϕ)T , so gilt
1
f (x) = cos ϕ sin ϕ = sin 2ϕ.
2
Diese Funktion f kann man sich als folgendermaßen enstanden vorstellen. Man nehme

x
1
f (x) → 2 sin 2ϕ

ϕ x
f (x) → 0

f (x) → 0
x

Abbildung 9.1: Konvergenzverhalten bei geradliniger Annäherung

eine Gerade, z.B. die x-Achse, verdrehe sie und führe sie dabei auf und ab. Die Höhe
in Abhängigkeit des Drehwinkels ϕ ist dann gerade gegeben durch 12 sin 2ϕ.

9.1.9 Beispiel. Wir definieren die Funktion f : R2 → R durch in Polarkoordinaten


durch  2

 r sin ϑ
 r4 +sin4 ϑ , r > 0
f (x) := 
 ,
0 , r=0
wobei x = (r cos ϑ, r sin ϑ)T . Lässt man den Punkt x nun längs eines Strahls gegen 0
streben, d.h. hält man ϑ fest und strebt r → 0, so erhält man stets f (x) → 0.
Um das einzusehen, stellt man im Fall sin ϑ = 0 sofort f ((r cos ϑ, r sin ϑ)T ) = 0
für alle r fest. Im Fall sin ϑ , 0 ist sicher der Nenner r4 + sin4 ϑ ≥ sin4 ϑ > 0. Also
ist limr→0 f ((r cos ϑ, r sin ϑ)T ) = 0. Trotzdem ist f nicht stetig bei 0 als Funktion in
beiden Variablen gleichzeitig, denn strebt x so gegen Null, dass r = sin ϑ, so gilt
1
f (x) = → +∞,
2r
9.1. NORMIERTE RÄUME 37

d.h. f ist nicht einmal beschränkt in einer Umgebung von 0. Man bemerke, dass die
Beziehung r = sin ϑ gerade die Gleichung eines Kreises ist der die x-Achse bei 0
berührt. Nähert man sich in diesem Beispiel also radial an 0 an, so strebt f stets gegen
0. Kommt man jedoch längs der Kreislinie r = sin ϑ, so gilt sogar f (x) → +∞.

x r = sin ϑ

f (x) → 0 x
f (x) → +∞

f (x) → 0

Abbildung 9.2: Funktionsgraphen bei festem Winkel

Ehe wir uns mehr Beispiele normierter bzw. Banachräume anschauen, brauchen
wir ein kleines Lemma.

9.1.10 Lemma. Ist (X, d) ein vollständiger metrischer Raum und ist Y eine abgeschlos-
sene Teilmenge von X, so ist (Y, d|Y×Y ) auch ein vollständiger metrischer Raum.
Ist umgekehrt (Y, d|Y×Y ) vollständig, wobei Y Teilmenge eines metrischen Raumes
(X, d) ist, so ist Y abgeschlossen in X.

Beweis. Klarerweise ist Y versehen mit der eingeschränkten Metrik selber ein metri-
scher Raum.
Ist (xn )n∈N eine Cauchyfolge in Y, so konvergiert diese nach Voraussetzung gegen
ein x ∈ X. Ist nun Y abgeschlossen und enthält daher alle seine Häufungspunkte, so
folgt x ∈ Y.
Ist (xn )n∈N eine Folge in Y, die gegen ein x ∈ X konvergiert, so ist diese sicherlich
eine Cauchy-Folge bzgl. d und somit auch bzgl. d|Y×Y . Ist Y vollständig, so konvergiert
(xn ) bzgl. d|Y×Y und somit auch bzgl. d gegen ein y ∈ Y. Da aber Grenzwerte eindeutig
sind, folgt x = y ∈ Y. Also ist Y abgeschlossen.

Folgende Situation tritt bei der Betrachtung konkreter Räume auf. Ist (X, k · k) ein
normierter Raum und Y ein linearer Unterraum (Untervektorraum), so kann man k.k
auf Y einschränken und erhält wieder einen Normierten Raum.
Ist (X, k · k) ein Banachraum und ist Y als Teilmenge von X abgeschlossen, so muss
nach Lemma 9.1.10 auch (Y, k · k) ein Banachraum sein.

9.1.11 Lemma. Ist (X, k · k) ein normierter Raum und Y ein linearer Unterraum, so ist
der Abschluss c(Y) von Y in X ebenfalls ein linearer Unterraum und somit der kleinste
abgeschlossene Teilraum von X, der Y enthält.

Beweis. Sind x, y ∈ c(Y) und λ, µ ∈ R (C), so gibt es Folgen xn , yn ∈ Y mit


limn→∞ xn = x und limn→∞ yn = y. Wir wissen, dass dann die Folge λxn + µyn ∈ Y
gegen λx + µy konvergiert und somit diese Linearkombination auch in c(Y) liegt.

9.1.12 Beispiel. Wir wollen uns nun weitere Beispiele von normierten Räumen be-
trachten.
38 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

(i) Ist E eine nichtleere Menge und (Y, k.kY ) ein normierter Raum. Wir betrachten den
Raum B(E, Y) aller beschränkten Abbildungen von E nach Y. Diesen Raum ha-
ben wir schon im ersten Semester betrachtet (vgl. Definition 6.6.3), wobei aber Y
allgemeiner ein metrischer Raum war. In unserem Fall ist mit Y auch B(E, Y) ein
Vektorraum über dem selben Skalarkörper, wie Y, wobei die Operationen punkt-
weise definiert sind.
Setzen wir für f ∈ B(E, Y)

k f k∞ := sup{k f (x)kY : x ∈ E},

so prüft man leicht nach, dass k f k∞ eine Norm auf B(E, Y) ist. Die von dieser
Norm erzeugte Metrik ist genau die in Definition 6.6.3 eingeführte Metrik

k f − gk∞ = d∞ ( f, g) = sup k f (x) − g(x)kY .


x∈E

Im Falle, dass (Y, k.kY ) ein Banachraum ist, folgt aus Satz 6.6.15, dass
(B(E, Y), d∞) vollständig und damit (B(E, Y), k.k∞) auch ein Banachraum ist.

(ii) Ist E = N und Y = R oder Y = C, so ist B(E, Y) die Menge aller beschränkten
reellen bzw. komplexen Folgen und wird auch als l∞ = l∞ (N) bezeichnet. Diese
sind Banachräume, da R und C vollständig sind.

(iii) Vom Teilraum c0 von l∞ , der aus allen Nullfolgen besteht, kann man leicht zeigen
(Lemma 8.7.1), dass er abgeschlossen ist. Also ist auch (c0 , k.k∞ ). ein Banach-
raum.

(iv) Mit der Notation aus (i) setzen wir noch zusätzlich voraus, dass E ⊆ X, wobei
(X, d) ein metrischer Raum ist, und dass (Y, k.kY ) ein Banachraum ist.
Dann kann man die Menge C(E, Y) aller f ∈ B(E, Y) betrachten, die stetig sind.
Diese Menge stellt einen linearen Unterraum von B(E, Y) dar (siehe Korollar
9.1.3). Somit ist auch (C(E, Y), d∞) ein normierter Raum.
Ist nun ( fn )n∈N eine Folge von Funktionen aus C(E, Y), die bzgl. d∞ gegen ein
f ∈ B(E, Y) konvergiert, so wissen wir aus Korollar 6.6.13, dass auch f stetig
ist, also f ∈ C(E, Y). Somit ist C(E, Y) sogar eine abgeschlossene Teilmenge von
B(E, Y).
Daher ist neben B(E, Y) auch C(E, Y) ein Banachraum, wenn nur (Y, k.kY ) ein
solcher ist.

(v) Ist Y = R oder Y = C, so schreiben wir für den Banachraum C(E, Y) auch C(E).
Ist E etwa [a, b] ⊆ R, so schreiben wir C[a, b].
Auf dem Raum C[a, b] können wir auch andere Normen betrachten. Beispiels-
weise
Z b
k f k1 := | f (t)| dt. (9.3)
a

Diese Norm unterscheidet sich von k.k∞ wesentlich, denn es gibt bzgl. k.k1
Cauchyfolgen, die bezgl. k.k∞ keine sind. Daraus kann man herleiten, dass
bezüglich k.k1 C[a, b] kein Banachraum ist.
9.2. LINEARE ABBILDUNGEN 39

(vi) Sind (X, k.kX ) und (Y, k.kY ) zwei normierte Räume über dem selben Körper R oder
C, so auch (X × Y, k.kmax ), wobei

k(x, y)kmax = max{kxkX , kykY }.

In der Tat ist X × Y ein Vektorraum, und die Axiome, die für eine Norm erfüllt
sein müssen, lassen sich auch ganz leicht nachweisen.
Die Konstruktion ist analog der von R2 mit k.k∞ . Auch hier ist eine Folge

(xn , yn ) n∈N in X ×Y konvergent gegen (x, y) bzw. eine Cauchy-Folge genau dann,
wenn (xn )n∈N und (yn )n∈N gegen x und y konvergiert bzw. beide Cauchy-Folgen
sind.
Damit sieht man auch, dass (X × Y, k.kmax ) ein Banachraum ist, wenn X und Y es
sind.

(vii) Ist im vorigen Beispiel X = Y, so folgt aus Lemma 9.1.2, dass die Abbildung
+ : X × X → X stetig ist.

9.2 Lineare Abbildungen


9.2.1 Definition. Zwei Normen k.k1 und k.k2 auf einem linearen Raum X heißen äqui-
valent, falls es Konstanten α > 0, β > 0 gibt sodass

αkxk1 ≤ kxk2 ≤ βkxk1 , x ∈ X.

Betrachtet man die Definition der Konvergenz einer Folge, so sieht man, dass äqui-
valente Normen die gleichen konvergenten Folgen haben (die gleichen abgeschlosse-
nen und offenen Mengen, die gleichen Cauchy-Folgen, etc.).
9.2.2 Beispiel.

(i) Sei X = R p . Die Normen k.k∞ , k.k2 und k.k1 sind äquivalent, denn es gilt
((x1 , . . . , x p )T ∈ X = R p )

X
p
1
X
p
max |xi | ≤ ( |xi |2 ) 2 ≤ |xi | ≤ p · max |xi |.
i=1,...,p i=1,...,p
i=1 i=1

Man kann zeigen, dass auf R p alle Normen äquivalent sind. Insbesondere ist R p
mit jeder Norm vollständig.

(ii) Betrachte auf X = C([0, 1]) neben der Supremumsnorm k.k∞ noch die Norm aus
(9.3). Diese beiden Normen sind nicht äquivalent. Es gilt zwar k f k1 ≤ k f k∞ , aber
es gibt kein β > 0, sodass k f k∞ ≤ βk f k1 gleichzeitig für alle f ∈ C([0, 1]). Um
das einzusehen, betrachte
(
1 − n t , t ∈ [0, n1 ],
fn (t) = .
0 , t ∈ [ n1 , 1]
1
Dabei ist k fn k∞ = 1, aber k fn k1 ≤ 2n .

Thematisch verwandt mit der Äquivalenz von Normen ist der Begriff der Be-
schränktheit einer linearen Abbildung.
40 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

9.2.3 Definition. Seien (X, k.kX ) und (Y, k.kY ) zwei normierte Räume, und sei A : X →
Y eine lineare Abbildung. Dann heißt A beschränkt , wenn es ein C ≥ 0 gibt, sodass

kAxkY ≤ CkxkX , für alle x ∈ X. (9.4)

Ist A beschränkt, so sei kAk die kleinst mögliche aller dieser Konstanten C in (9.4), und
diese heißt Abbildungsnorm von A.
9.2.4 Bemerkung. Ist A beschränkt, so gibt es tatsächlich eine kleinste Konstante C ≥ 0,
sodass (9.4) gilt. In der Tat gilt (9.4) genau dann, wenn
kAxkY
C≥ , für alle x ∈ X \ {0},
kxkX
n o
also genau dann, wenn C obere Schranke von kAxk kxkX : x ∈ X \ {0} ist. Also ist kAk die
Y

kleinste obere Schranke dieser Menge. Wegen kAxk 1 1


kxkX = kA( kxkX x)kY und k kxkX xkX = 1
Y

sieht man unmittelbar, dass auch


( )
kAxkY
kAk = sup : x ∈ X \ {0} =
kxkX

sup{kAxkY : x ∈ X, kxkX = 1} = sup{kAxkY : x ∈ X, kxkX ≤ 1}.


Wegen dieser Gleichung folgt ganz leicht, dass A = 0 ⇔ kAk = 0.
Aus obiger Definition sieht man unmittelbar, dass zwei Normen k.k1 und k.k2 auf
einem Vektorraum genau dann äquivalent sind, wenn idX sowohl als Abbildung von
(X, k.k1 ) nach (X, k.k2 ) als auch als Abbildung von (X, k.k2 ) nach (X, k.k1 ) beschränkt ist.
9.2.5 Satz. Eine lineare Abbildung A : X → Y ist genau dann stetig, wenn sie be-
schränkt ist. Ist das der Fall, so ist sie sogar gleichmäßig stetig.
Beweis. Ist A die Nullabbildung, so folgt die Behauptung unmittelbar. Also sei A , 0.
ǫ
Sei A beschränkt. Ist ǫ > 0 und ist kx − yk < kAk , so folgt

kAx − Ayk = kA(x − y)k ≤ kAk · kx − yk < ǫ.

Also ist A gleichmäßig stetig und daher insbesondere stetig.


Ist umgekehrt A stetig, sodass kxk ≤ δ ⇒ kAxk ≤ 1.
so gibt es ein δ > 0 zu ǫ = 1,
Ist x ∈ X beliebig, so ist kxk x ≤ δ, und somit A( kxk x) ≤ 1 bzw. kAxk ≤ kxk
δ δ
δ .

9.2.6 Satz. Die Menge L(X, Y) aller beschränkten linearen Abbildungen, wobei
(X, k.kX ) und (Y, k.kY ) zwei normierte Räume sind, versehen mit der Abbildungsnorm
k.k, ist selber ein normierter Raum.
Ist (Y, k.kY ) ein Banachraum, so auch (L(X, Y), k.k).
Beweis. Klarerweise ist L(X, Y) ein Vektorraum. Außerdem haben wir schon gesehen
(Bemerkung 9.2.4), dass kAk = 0 ⇔ A = 0. Die beiden anderen Norm-Eigenschaften
folgen aus (A, B ∈ L(X, Y), λ ∈ R (C))

kλAk = sup{kλAxkY : x ∈ X, kxkX ≤ 1} =

|λ| · sup{kAxkY : x ∈ X, kxkX ≤ 1} = |λ| · k Ak,


9.2. LINEARE ABBILDUNGEN 41

k(A + B)xkY ≤ kAx + BxkY ≤ kAxkY + kBxkY ≤


kAk · kxkX + kBk · kxkX = (kAk + kBk)kxkX .
Um die Vollständigkeit zu zeigen, könnten wir direkt vorgehen. Wir werden uns aber
der schon bekannten Tatsache bedienen, dass C(E, Y) vollständig ist, wenn E Teilmen-
ge eines metrischen Raumes ist.
Dazu setze E = {x ∈ X : kxk ≤ 1}. Für A ∈ L(X, Y) ist A|E sicherlich eine stetige
Funktion, wobei
kA|E k∞ = sup{kAxkY : kxkX ≤ 1} = kAk.
Also ist A 7→ A|E eine Isometrische Einbettung von L(X, Y) in C(E, Y). Das Bild dieser
Einbettung ist genau die Menge L aller f ∈ C(E, Y), sodass

x ∈ E, λ ∈ R (C), λx ∈ E ⇒ f (λx) = λ f (x), und

x, y, x + y ∈ E ⇒ f (x + y) = f (x) + f (y).
In der Tat, mit einem solchen f sieht man leicht, dass die Abbildung A : X → Y
definiert durch A(x) := kxkX f ( kxk1 X x) eine beschränkte lineare Abbildung ist, sodass
A|E = f .
Die Menge L ⊆ C(E, Y) ist abgeschlossen, denn aus fn → f mit fn ∈ L und
f ∈ C(E, Y) folgt f (x + y) = lim fn (x + y) = lim fn (x) + lim fn (y) = f (x) + f (y), falls
x, y, x + y ∈ E und genauso f (λx) = λ f (x), falls x, λx ∈ E und somit f ∈ L. Wegen
Lemma 9.1.10 ist (L, k.k∞ ), und daher auch (L(X, Y), k.k), ein Banachraum.

Ähnlich wie im vorhergehenden Beweis sieht man, dass für A ∈ L(X, Y) und B ∈
L(Y, Z)
kBAk = sup{kBAxkZ : x ∈ X, kxkX ≤ 1} ≤ (9.5)
sup{kBk · kAxkY : x ∈ X, kxkX ≤ 1} = kBk · kAk.
Für die Räume L(X, Y) gilt in Analogie zu Lemma 9.1.2 folgendes Lemma, welches
später hauptsächlich im Falle von endlichdimensionalen Räumen Anwendung findet.

9.2.7 Lemma. Seien X, Y, Z normierte Räume, und seien (An )n∈N , (Bn)n∈N , (xn )n∈N Fol-
gen in L(X, Y), L(Y, Z) bzw. X. Weiters seien A ∈ L(X, Y), B ∈ L(Y, Z) und x ∈ X. Gilt
An → A, Bn → B und xn → x für n → ∞, so folgt

lim Bn An = BA und lim An xn = Ax,


n→∞ n→∞

wobei die erste Folge in L(X, Z) bzgl. der Abbildungsnorm und die zweite in Y bzgl.
der Norm auf Y konvergiert. Entsprechende Aussagen gelten auch für Netze.

Beweis. Wir zeigen die erste Grenzwerteigenschaft. Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es
ein N ∈ N, sodass kAn −Ak, kBn −Bk < ǫ für alle n ≥ N. Es folgt kAn k ≤ kAn −Ak+kAk <
1 + kAk und damit

kBn An −BAk ≤ kBn An −BAn k+kBAn −BAk = kBn −BkkAn k+kBkkAn −Ak ≤ (1+kAk+kBk)ǫ.

Wir sehen also, dass Bn An → BA.



Genauso wie in Korollar 9.1.3 folgt daraus
42 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

9.2.8 Korollar. Seien X, Y, Z normierte Räume und (Y, d) ein metrischer Raum und
D ⊆ Y. Sind f : D → L(X, Y), g : D → L(Y, Z) und h : D → X stetig, so
auch g f : D → L(X, Z) und f h : D → Y. Dabei sind diese Funktionen definiert
durch g f (t) := g(t) f (t) (Hintereinanderausführung von zuerst f (t) und dann g(t)) so-
wie f h(t) := f (t)h(t) (Anwenden von f (t) auf h(t)).
9.2.9 Beispiel.
(i) Sei Y ein normierter Raum über R und y0 ∈ Y. Dann ist die Abbildung λ → λy0
von R nach Y linear und beschränkt durch ky0 k. Entsprechendes gilt für C.
(ii) Sei T : R p → Y linear, wobei Y ein normierter Raum ist. Ist R p mit k.k∞ oder
mit einer zu ihr äquivalenten Norm versehen, so ist T beschränkt und somit ste-
P
tig. Denn ist x = (x1 , . . . , x p )T = pj=1 x j e j ∈ R p , wobei e j der j-te kanonische
Basisvektor in R p ist, so folgt
X
p X
p X
p
kT (x)k = k x j T (e j )k ≤ |x j | · kT (e j )k ≤ kxk∞ kT (e j )k.
j=1 j=1 j=1

(iii) Sei X = R p und Y = Rq , beide versehen mit k.k∞ . Wegen des letzten Beispieles
ist jede lineare Abbildung A : R p → Rq beschränkt. Somit ist L(R p , Rq ) gleich
Rq×p .
(iv) Versieht man X = R p mit k.k∞ und auch Y = Rq mit k.k∞ , so hat man mit der
Abbildungsnorm k.k auf Rq×p  R pq eine weitere Norm. Auch diese ist zu k.k∞
äquivalent. In der Tat ist für A = (ai j ) ∈ Rq×p und x ∈ R p
X
p
kAxk∞ = max | ai j x j | ≤
i=1,...,q
j=1

max p max |ai j | · kxk∞ = p max |ai j | · kxk∞ .


i=1,...,q j=1,...,p i=1,...,q; j=1,...,p

Also kAk ≤ pkAk∞ . Bezeichnet {e j } j=1,...,p die kanonische Basis von R p , so ist
sicherlich auch ( j = 1, . . . , p)
kAk ≥ kAe j k∞ = max |ai j |,
i=1,...,q

und daher kAk ≥ kAk∞ .


Allgemeiner kann man X = R p und Y = Rq jeweils mit einer der Normen
k.k1 , k.k2 , k.k∞ versehen, wobei die Norm auf R p nicht dieselbe wie auf Rq sein
muss. Die daraus resultierenden Abbildungsnormen sind verschieden. Ähnlich
wie oben zeigt man aber, dass sie alle äquivalent sind.
2 2×2
(v) Sei X = Y  = R mit k.k2 versehen und A ∈ R von der spetiellen Form
a −b
A = b a mit festen a, b ∈ R. Um die Abbildungsnorm von A zu berechnen,
bemerken wir, dass der erste und zweite Eintrag von
! ! !
a −b x xa − yb
=
b a y xb + ya

genau Real- bzw. Imaginärteil von (a + ib) · (x + iy) ist. Wegen k dc k2 = |c + id|
 
gilt kA yx k2 = |(a + ib) · (x + iy)| = |a + ib| · |x + iy| = |a + ib| · k yx k2 . Daraus

folgt unmittelbar, dass kAk = |a + ib| = k ab k2 .
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM43

(vi) Sei X = Y = C[0, 1], und A : X → Y definiert durch


Z x
A( f )(x) := f (t) dt.
0

Man sieht sofort, dass A linear ist. Außerdem ist mit f ∈ C[0, 1]
kA( f )k∞ = sup |A( f )(x)| ≤ sup (x sup | f (t)|) ≤ k f k∞ .
x∈[0,1] x∈[0,1] t∈[0,x]

Also kAk ≤ 1.

9.3 Reihen, Integrale, etc. mit Werten in einem nor-


mierten Raum
Zunächst verallgemeinern wir den Begriff von Zahlenreihen auf Reihen mit Summan-
den, die in einem normierten Raum liegen. Die Definition ist genau die gleiche.
9.3.1 Definition. Ist (an )n∈N eine Folge in einem normierten Raum (X, k.k), so heißt die
P
Reihe ∞ n=1 an konvergent, falls die Folge (S N )N∈N der Partialsummen

X
N
S N := an
n=1

in X, d.h. bzgl. der von k.k erzeugten Metrik, konvergiert.


P P∞
Die Reihe ∞ n=1 an heißt absolut konvergent, falls n=1 kan k in R konvergiert, dh.
P∞
falls n=1 kan k < +∞, vgl. Definition 3.7.12.
Nicht nur die Definition lässt sich unmittelbar auf Reihen mit Werten in normierten
Räumen übertragen, sondern auch viele der im ersten Semester hergeleiteten Ergeb-
nisse. Im Folgenden seien (X, k.k) und (Y, k.k) normierte Räume. Für die Beweise der
Verallgemeinerungen muss man in allen Fällen nur an geeigneten Stellen |.| durch k.k
ersetzen:
P P∞ P∞
(i) Rechenregeln (siehe Korollar 3.7.11): ∞ n=1 λan = λ n=1 an und n=1 (an + bn ) =
P∞ P∞
n=1 an + n=1 bn , wobei λ ∈ R bzw. λ ∈ C je nachdem was der Skalarkörper von
X ist.
Ist T : X → Y linear und stetig, so folgt
X
∞ X
N X
N X

T( an ) = T ( lim an ) = lim T ( an ) = T (an ). (9.6)
N→∞ N→∞
n=1 n=1 n=1 n=1

(ii) Manipulationsregeln wie in Fakta 3.7.4, (1) und (2), d.h. man darf endlich viele
Summanden umändern, ohne das Konvergenzverhalten zu ändern. Der Grenzwert
ändert sich im Allgemeinen. Außerdem kann man in einer Reihe Klammern set-
zen.
P
(iii) Ist ∞n=1 an konvergent, so folgt limn→∞ an = 0 in X (siehe Proposition 3.7.7).

Die Resultate für reel- bzw. komplexwertige Reihen, die die Vollständigkeit von
R (C) verwenden, lassen sich auf vollständige normierte Räume, d.h. Banachräume
verallgemeinern. Ist also (X, k.k) ein Banachraum, dann gelten folgende Verallgemei-
nerungen.
44 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

P
(iv) Cauchysches Konvergenzkriterium (siehe Korollar 3.7.11): ∞ n=1 an konvergiert
genau dann, wenn

X m
∀ǫ > 0 ∃N ∈ N : a j < ǫ, ∀m > n ≥ N.

j=n+1

P
(v) Ist eine Reihe ∞n=1 an absolut konvergent, so folgt aus dem Cauchysches Kon-
P
vergenzkriterium und der Dreiecksungleichung sofort, dass ∞ n=1 an auch konver-
giert, wobei wegen der Stetigkeit von k.k : X → R

X ∞ X
N X∞
an = lim an ≤ kan k.
n=1 N→∞ n=1 n=1

(vi) Majorantenkriterium (siehe Satz 3.7.8): Ist kan k ≤ αn ∈ R+ ∪ {0} und konvergiert
P∞ P∞
n=1 αn , so konvergiert n=1 an absolut, wobei

X ∞ X∞ X∞
an ≤ kan k ≤ αn . (9.7)
n=1 n=1 n=1

(vii) Quotienten- und Wurzelkriterium wie in Satz 3.8.1.


(viii) Das Lemma 3.9.2 lässt sich nicht vollständig auf Banachraum-wertige Reihen übertragen, da der Beweisschritt
(iii) ⇒ (ii) nicht funktioniert. Also gilt eine abgeschwächte Version von Lemma 3.9.2, wobei (i) ⇔ (ii), (i) ⇒
(iv) ⇒ (iii). Wir wollen hier (i) ⇔ (ii) und (i) ⇒ (iv) ausführen:
P∞
P Banachraumwertige Reihe j=1 a j ist genau dann absolut konvergent, wenn es ein C > 0 gibt, sodass
Eine
j∈M ka j k ≤ C für alle endlichen Teilmengen M von N.
P P
Beweis. Für endliche Teilmengen M ⊆ N gilt klarerweise j∈M ka j k ≤ max(M)j=1 ka j k. Somit ist obige Bedingung
P
äquivalent zur Beschränktheit der Folge der Partialsummen der Reihe ∞ j=1 ka j k und damit äquivalent zur
P
Konvergenz von max(M) j=1 ka j k, vgl. Satz 3.7.8, (i).

P∞
Aus der absoluten Konvergenz eine Banachraumwertige Reihe j=1 a j mit Grenzwert s folgt, dass es ein s in dem
betrefflichen Banachraum gibt, sodass

X
∀ǫ > 0 ∃M0 ⊆ N, M0 endlich : a j − s < ǫ, (9.8)

j∈M

für alle endlichen M, M0 ⊆ M ⊆ N.


P 
Das bedeutet gerade, dass das Netz j∈M a j M⊆N, endlich im betrefflichen Banachraum gegen s konvergiert.

Beweis. Sei ǫ > 0 gegeben. Wegen der absoluten Konvergenz gibt es ein N ∈ N, sodass für n > m ≥ N

X
n
kak k < ǫ.
k=m+1

Setze M0 = {1, . . . , N}. Ist M eine endliche Teilmenge von N, die M0 enthält, so sind alle j ∈ M \ M0 größer als N.
Also gilt für beliebiges m > N

max(M)
X Xm X Xm X Xm
aj −
a j = aj − a j ≤ ka j k + ka j k < 2ǫ.
j=N+1
j∈M j=1 j∈M j=N+1
j=N+1
j>N

P
Strebt nun m gegen ∞, so folgt k j∈M a j − sk ≤ 2ǫ. Da ǫ > 0 beliebig war folgt (9.8).

P∞
Schließlich folgt aus (9.8) sicherlich, dass j=1 a j = s (nicht notwendigerweise absolut), da die Folge der Partial-
P P P P 
summen ( nj=1 a j )n∈N wegen nj=1 a j = j∈{1,...,n} a j ein Teilnetz von j∈M a j ist.
M⊆N, endlich
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM45

(ix) Mit dem gerade gezeigten lässt sich jetzt Satz 3.9.3 im Banachraumwertigen Fall wie im skalarwertiegen Fall zeigen:
P
Ist eine Reihe ∞ P an mit Werten in einem Banachraum X absolut konvergent, und ist σ : N → N bijektiv, so
n=1
konvergiert auch ∞ n=1 aσ(n) absolut, und zwar gegen den selben Grenzwert s, wie die ursprüngliche Reihe.
P∞ P∞
Beweis. Zunächst ist nach
P dem klassischen Satz 3.9.3 P∞ im skalaren Fall mit n=1 kan k auch n=1 kaσ(n) k konvergent;
also konvergiert auch ∞ n=1 a σ(n) absolut. Sei s̃ := n=1 aσ(n) (∈ X).
P  P 
Nach (9.8) konvergiert das Netz j∈M a j M⊆N, endlich gegen s und j∈M aσ( j) M⊆N, endlich gegen s̃.

Ist ǫ > 0 und M0 so, dass (9.8) gilt, und ist σ−1 (M0 ) ⊆ M, so folgt wegen M0 ⊆ σ(M)

X X X
aσ( j) − s = aσ( j) − s = ak − s < ǫ.

j∈M σ( j)∈σ(M) k∈σ(M)

P 
Somit konvergiert j∈M aσ( j) auch gegen s, dh. s = s̃.
M⊆N, endlich

Schließlich gilt der Riemannsche Umordnungssatz, dh. die Umkehrung des gezeigten, im Banachraumfall im All-
gemeinen nicht.

(x) Da sich Satz 3.9.3 auf Banachraum-wertige Reihen verallgemeinern lässt, können wir auch Banachraum-wertige
Doppelreihen mit Hilfe von linearen Anordnungen betrachten. Insbesondere bleibt Satz 3.9.10 richtig. Man beachte,
dass in dessen Beweis nur die für Banachraum-wertige Reihen richtigen Teile von Lemma 3.9.2 verwendet werden.

9.3.2 Beispiel. Sei B ∈ R p×p (versehen z.B. mit der Abbildungsnorm) mit kBk < 1, und
definiere (B0 = I)
X∞
S := Bn .
n=0
P
Wegen (9.5) hat man kB k ≤ kBk , und daher ist ∞
n n n
n=0 kBk eine konvergente Majorante,
P∞ n
und somit konvergiert S = n=0 B absolut, wobei (vgl. (9.7))
X
∞ X

1
kS k ≤ kBn k ≤ kBkn = .
n=0 n=0
1 − kBk

Die Tatsache, dass C 7→ BC eine beschränkte lineare Abbildungen von R p×p nach R p×p
ist, erlaubt uns die Vertauschung von Grenzübergängen (vgl. (9.6)):
X
N X
N X
N+1
BS = B lim Bn = lim Bn+1 = lim (−I + Bn ) = −I + S .
N→∞ N→∞ N→∞
n=0 n=0 n=0

Also I = (I − B)S . Genauso sieht man I = S (I − B). Also ist I − B invertierbar mit
S = (I − B)−1 .
9.3.3 Korollar. Ist T ∈ R p×p invertierbar, und ist S ∈ R p×p mit kT − S k < kT1−1 k , so ist
auch S invertierbar.
Insbesondere ist die Menge GL(p, R) aller invertierbaren p×p-Matrizen eine offene
Menge, und die Funktion S 7→ S −1 ist stetig auf GL(p, R) ⊆ R p×p .
Beweis. Nach Voraussetzung ist k(T − S )T −1 k < 1. Gemäß Beispiel 9.3.2 existiert
(I − (T − S )T −1 )−1 und

S T −1 (I − (T − S )T −1 )−1 = (T − (T − S ))T −1 (I − (T − S )T −1 )−1 =

(I − (T − S )T −1 )(I − (T − S )T −1 )−1 = I.
Also hat S eine Rechtsinverse. Entsprechend ist (I − T −1 (T − S ))−1 T −1 eine Linksin-
verse. Aus der Linearen Algebra ist bekannt, dass diese dann übereinstimmen müssen.
46 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

Um die Stetigkeit von S 7→ S −1 einzusehen, sei S n → S , wobei alle Matrizen


invertierbar sind. Es folgt
kS n−1 − S −1 k = kS n−1 (S − S n )S −1 k ≤ kS n−1 k · kS − S n k · kS −1 k, (9.9)
und daher kS n−1 k ≤ kS −1 k + kS n−1 − S −1 k ≤ kS −1 k + kS −1 k · kS n−1 k · kS − S n k. Für
hinreichend großes n hat man somit
kS −1 k
kS n−1 k ≤ .
1 + kS −1 k · kS − S n k
Also ist kS n−1 k beschränkt, und aus (9.9) folgt S n−1 → S −1 .

9.3.4 Bemerkung. Im vorangegangenen Beispiel und Korollar haben wir zwar von qua-
dratischen Matrizen gesprochen. Es gilt aber der selbe Sachverhalt, wenn die auftre-
tenden Objekte allgemeiner beschränkte lineare Abbildungen eines Banachraumes in
einen anderen, also Elemente von L(X, X) sind. Die Beweise sind so gewählt, dass sie
auch funktionieren für diesen allgemeineren Fall.
Man kann auch Funktionen mit Werten in normierten Räumen betrachten. Dabei
heißt eine Folge ( fn )n∈N von beschränkten Funktionen fn : E → X gleichmäßig kon-
vergent gegen f , falls limn→∞ fn = f in dem normierten Raum B(E, X)2.
Ist (X, k.k) sogar ein Banachraum, so gelten folgend Aussagen, die für X = R (C)
schon bekannt sind.
(i) Mit (X, k.k) ist auch B(E, X) ein Banachraum. Somit ist ( fn )n∈N in B(E, X) genau
dann konvergent, wenn diese Folge bzgl. k.k∞ eine Cauchyfolge ist.
(ii) Ist E Teilmenge eines metrischen Raumes, so wissen wir schon, dass C(E, X)
abgeschlossen in B(E, X) ist, was zur Folge hat, dass die Grenzfunktion f stetig
ist, wenn alle fn es sind, vgl. Korollar 6.6.13.
P
(iii) Weierstraßsche Konvergenzkriterium (siehe Korollar 6.7.4): Ist ∞ n=1 fn eine Rei-
he von X-wertigen beschränkten Funktionen, so folgt aus der absoluten Konver-
P P∞
genz ∞ n=1 k fn k∞ < +∞ die gleichmäßige Konvergenz der Reihe n=1 fn .
Die absolute Konvergenz gilt insbesondere, wenn es eine konvergente Reihe
P∞
n=1 αn von nichtnegativen reellen Zahlen mit k fn k∞ ≤ αn gibt.
Das Weierstraßsche Konvergenzkriterium ist nichts anderes, als das Majoranten-
kriterium angewandt auf den Banachraum B(E, X), siehe (9.7).
(iv) Für Potenzreihen zeigt man fast genauso wie in Satz 6.7.8 folgenden Sachverhalt.
Seien an ∈ X, n ≥ 0, und sei R das Supremum aller |z|, wobei je nach Skalarkörper
P
z ∈ R bzw. z ∈ C, sodass die Reihe ∞ n
n=0 z an konvergiert, so konvergiert die Reihe
P∞ n
n=0 z an in X absolut, wenn z ∈ R (C), |z| < R. Im Falle |z| > R divergiert sie.
Für |z| ≤ r < R konvergiert sie gleichmäßig. Also ist auf {z ∈ R (C) : |z| ≤ r} die
P
Funktion z 7→ ∞ n
n=0 z an (∈ X) stetig und beschränkt (d.h. sie liegt in C(rD, X)),
und auf {z : |z| < R} ist sie stetig.
kan+1 k −1 kan+1 k −1
Für R gilt auch (lim supn→∞ kan k ) ≤ R ≤ (lim inf n→∞ kan k ) und

R = (lim supn→∞ n kan k)−1 .
2 Dieses Konzept ist schon aus Definition 6.6.5 bekannt, wenn sogar X allgemeiner ein metrischer Raum
ist.
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM47

Auch die Differentialrechnung lässt sich auf Funktionen mit Werten in normierten
Räumen ausdehnen.

9.3.5 Definition. Ist I ein reelles Intervall und f : I → X, so heißt f im Punkt x ∈ I


differenzierbar, wenn der Grenzwert
d 1
f (x) = f ′ (x) := lim ( f (t) − f (x))
dx t→x t − x

in X existiert, wobei dieser Grenzwert einseitig zu verstehen ist, wenn x ein Randpunkt
von I ist. Ist f bei allen x ∈ I differenzierbar, so heißt f differenzierbar. Die Funktion
x 7→ f ′ (x) (Ableitung von f ) ist dann eine Abbildung von I nach X. Ist diese stetig, so

heißt f stetig differenzierbar. Mit C 1 I, X wird die Menge aller stetig differenzierbaren
X-wertigen Funktionen auf I bezeichnet.
Analog zum skalaren Fall definiert man auch die höheren Ableitungen.

9.3.6 Bemerkung. Im Falle X = R p kann man sich f (I) als Kurve vorstellen. Die
Ableitung f ′ (x) ist dann der Anschauung nach nichts anderes, als der Tangentialvektor
an diese Kurve im Punkt f (x).
Wir wollen uns auch ein Beispiel einer Funktion von einem Intervall in einen un-
endlich dimensionalen Banachraum anschauen.
9.3.7 Beispiel. Sei X = C(0, 1) der Banachraum aller reellwertigen, beschränkten und
stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm k.k∞ .
Die Funktion f : R → X sei so definitert, dass f (t) die Funktion

s 7→ et s(1 − s)

aus X = C(0, 1) ist. Für x ∈ R gilt



1 ( f (t) − f (x)) − f (t) = sup 1 et s(1 − s) − e x s(1 − s) − e x s(1 − s) =
t − x ∞ s∈(0,1) t − x

1 et − e x  − e x · sup |s(1 − s)| = 1 et − e x  − e x · 1
.
t − x s∈(0,1) t − x 2
1  1
Wegen limt→x t−x et − e x = e x konvergiert somit t−x ( f (t) − f (x)) in X für t → x

gegen f (x). Also gilt f (x) = f (x).
Es gelten u.a. folgende Regeln:

(i) Die Ableitung von konstanten Funktionen ist 0 ∈ X.

(ii) Ist f bei x ableitbar, so ist f bei x stetig.

(iii) ( f + g)′ (x) = f ′ (x) + g′ (x), (λ f )′ (x) = λ f ′ (x), (α f )′ (x) = α′ (x) f (x) + α(x) f ′ (x),
wobei λ ∈ R (C), f, g : I → X und α : I → R (C). Siehe Satz 7.1.7. Die
Gleichheitszeichen sind dabei so zu interpretieren, dass die linke Seite existiert,
wenn die rechte Seite existiert und dann die Gleichheit gilt.
Ähnlich wie bei den Reihen sieht man, dass T ( f ′ (x)) = (T f )′ (x), wenn T : X →
Y linear und beschränkt ist.

(iv) Kettenregel (Satz 7.1.9): Sei f : (c, d) → X und α : (a, b) → R mit α (a, b) ⊆
(c, d). Dann folgt ( f ◦ α)′ (x) = α′ (x) f ′ (α(x)).
48 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

9.3.8 Beispiel. Sei X = C(0, 1) wieder der Banachraum aller reellwertigen, beschränk-
ten und stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm
k.k∞ . Die Funktion f : [0, 1] → X sei so definitert, dass f (t) die Funktion

t
s 7→
s+t
aus X = C(0, 1) ist. Klarerweise ist f (0) die Nullfunktion und somit (t > 0)
√ √
t t 1
k f (t) − f (0)k∞ = sup = lim = √ .
s∈(0,1) s + t s→0+ s + t t
Der Grenzwert dieses Ausdruckes für t → 0 ist aber sicherlich nicht 0. Also ist f bei
t = 0 nicht stetig und daher insbesondere nicht differenzierbar. √
Man beachte, dass für feste s ∈ (0, 1) die Funktion t 7→ s+tt bei t = 0 sehr wohl
stetig ist.

9.3.9 Bemerkung. Kann man Arten von Produkten von Funktionen bilden, so gelten
jeweils auch Formen von Produktregeln.
(i) Sei I ein reelles Intervall und f : I → L(X, Y), g : I → L(Y, Z). Für x ∈ I und
t ∈ I \ {x} gilt
1 
k g(t) f (t) − g(x) f (x) − g′ (x) f (x) − g(x) f ′ (x)k =
t−x

1 
kg(t) f (t) − f (x) − g(t) f ′ (x) + g(t) f ′ (x) − g(x) f ′ (x)+
t−x
1 
g(t) − g(x) f (x) − g′ (x) f (x)k ≤
t−x

1 
kg(t)k · k f (t) − f (x) − f ′ (x)k + kg(t) − g(x)k · k f ′ (x)k+
t−x
1 
k g(t) − g(x) − g′ (x)k · k f (x)k.
t−x
Sind f und g bei x differenzierbar, so sind sie dort auch stetig und daher konver-
gieren für t → x alle Summanden gegen Null. Damit ist auch g f bei x differen-
zierbar mit der Produktregel

(g f )′ (x) = g′ (x) f (x) + g(x) f ′ (x). (9.10)

(ii) Entsprechend zeigt man ( f h)′ (x) = f ′ (x)h(x) + f (x)h′ (x), wenn f : I → L(X, Y)
und h : I → X.
(iii) Sind f, g : I → R p in einem Punkt x ∈ I differenzierbar, so zeigt man ähnlich wie
oben aber unter Zuhilfenahme der Cauchy-Schwarzschen Ungleichung, dass die
Funktion t 7→ ( f (t), g(t)) (Skalarprodukt) von I nach R auch in x differenzierbar
ist, wobei ( f, g)′ (x) = ( f (x), g′ (x)) + ( f ′ (x), g(x)).
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM49

Viele Resultate, die sich aus dem Mittelwertsatz (Satz 7.2.5) herleiten haben lassen,
können nicht unmittelbar auf Funktionen mit Werten in normierten Räumen verallge-
meinert werden. Manches lässt sich jedoch mit Hilfe des folgenden Lemmas retten.
9.3.10 Lemma. Ist f : [a, b] → X stetig, f |(a,b) differenzierbar und gilt f ′ (x) = 0 für
alle x ∈ (a, b), so ist f konstant.
Beweis. Subtrahieren wir von f (x) immer den Wert f (a), so können wir annehmen,
dass o.B.d.A. f (a) = 0.
Seien x, t ∈ (a, b), so folgt aus der Dreiecksungleichung k f (x)k ≤ k f (t) − f (x)k +
k f (t)k sowie k f (t)k ≤ k f (t) − f (x)k + k f (x)k. Also gilt −k f (t) − f (x)k ≤ k f (t)k − k f (x)k ≤
k f (t) − f (x)k, und daher

1  k f (t)k − k f (x)k 1 
− f (t) − f (x) ≤ ≤ f (t) − f (x) .
t−x t−x t−x
Da k.k : X → R stetig ist, konvergieren für t → x die linke und die rechte Seite laut
Voraussetzung gegen 0 und nach dem Einschlusskriterium für Netze somit auch der
mittlere Ausdruck.
Also ist x 7→ k f (x)k auf (a, b) differenzierbar mit k f (x)k′ = 0 und klarerweise auf
[a, b] stetig. Da k f (a)k = 0, folgt aus dem Mittelwertsatz auf k f (x)k angewandt, dass
k f (x)k = 0, und somit f (x) = 0, für alle x ∈ [a, b].

Als Folgerung erhält man z.B. dass zwei ableitbare X-wertige Funktionen überein-
stimmen, wenn sie es an einer Stelle tun, und wenn ihre Ableitungen gleich sind.
9.3.11 Definition. Sei f : [a, b] → X eine beschränkte Funktion. Konvergiert das Netz
(S ( f, R))R∈R in X, wobei (vgl. Definition 8.2.1)
X
n(R)
S ( f, R) = (ξ j − ξ j−1 ) f (α j ),
j=1

so heißt f Riemann-integrierbar. Wir schreiben in diesem Fall


Z b
f (t) dt := lim S ( f, R).
a |R|→0

Der Zugang zu Integralen mit Ober- und Untersummen funktioniert offensichtlich


hier nicht. Man kann jedoch genauso wie im skalaren Fall folgendes unmittelbar auf
den Fall von normierten Räumen übertragen, indem man in den jeweiligen Beweisen
an den richtigen Stellen |.| durch k.k ersetzt.
(i) Rechenregeln (Lemma 8.2.9):
Zb Zb Zb
(λ f + µg) dx = λ f dx + µ g dx,
a a a
b
Zb Z−
f dx ≤ k f (x)k dx ≤ k f k∞ (b − a). (9.11)

a a
wobei f, g : [a, b] → X Riemann-integrierbar sind, und λ, µ ∈ R (C) je nachdem,
was der Skalarkörper von X ist. Zur Erinnerung: k f k∞ = supx∈[a,b] k f (x)k.
50 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

(ii) Ist T : X → Y beschränkt und linear, so folgt aus der Stetigkeit, dass
Z Z
T ( f (t) dt) = T ( lim S ( f, R)) = lim S (T f, R) = T f (t) dt. (9.12)
|R|→0 |R|→0

Rb
Insbesondere gilt für g : [a, b] → R (C) und x ∈ X, dass a
(g(t)x) dt =
Rb
( a g(t) dt)x.

Setzt man noch voraus, dass (X, k.k) ein Banachraum ist, so gelten auch folgende
Aussagen.

(iii) Ist f : [a, b] → X stetig, so ist f Riemann-integrierbar, vgl. Satz 8.3.3.


(iv) Sei f : [a, b] → X und c < d, [c, d] ⊆ [a, b]. Dann ist f |[c,d] über [c, d] Riemann-
integrierbar genau dann, wenn 1[c,d] f es über [a, b] ist. Das ist insbesondere der
Fall, wenn f über [a, b] Riemann-integrierbar ist. vgl. Lemma 8.4.1.
(v) Der Hauptsatz der Differential- und Integralrechnung (Satz 8.4.6) gilt auch für
Banachraum-wertige Funktionen:
Ist f : [a, b] → X Riemann-integrierbar, und setzt man für a ≤ x ≤ b
Zx
F(x) := f (t) dt.
a

Dann ist F stetig auf [a, b]. Ist f in einem Punkt x0 stetig, so ist F bei x0 differen-
zierbar und es gilt F ′ (x0 ) = f (x0 ).
(vi) Ist f : [a, b] → X stetig, und ist G : [a, b] → X stetig und stetig differenzierbar auf
Rx
(a, b), sodass G′ (x) = f (x), x ∈ (a, b), so erfüllt G(x)− f (t) dt die Voraussetzung
a
von Lemma 9.3.10. Also ist diese Funktion konstant, und daraus folgt
Zb
f (t) dt = G(b) − G(a). (9.13)
a

Man erhält somit wie im skalaren Fall, dass der Integrationsoperator C([a, b], X)
bijektiv auf die Hyperebene aller bei a verschwindenden Funktionen in
C 1 ([a, b], X) abbildet.
(vii) Sei I ⊆ R ein Intervall mit endlicher linker Intervallgrenze a, die in I liege. Ist f : I → X eine Funktion, dann
gilt f ∈ C1 (I, X) genau dann, wenn f ∈ C(I, X), f |I\{a} ∈ C1 (I \ {a}, X) und der X-wertige Grenzwert limtցa f ′ (t)
existiert, vgl. Korollar 7.2.10. Eine entsprechende Aussage gilt für die rechte Intervallgrenze von I.

Um das einzusehen, sei f ∈ C(I, X), f |I\{a} ∈ C1 (I \ {a}, X) und existiere limtցa f ′ (t). Setzen wir g(t) = f ′ (t), t ∈
I \ {a}, und g(a) = limtցa f ′ (t), so gilt klarerweise g ∈ C(I, X), vgl. Bemerkung 6.4.4. Die X-wertige Funktion
Rx
F(x) = f (x) − a g(t) dt, x ∈ I, ist auf I stetig, hat auf I \ {a} eine verschwindende die Ableitung, und ist somit
Rx
wegen Lemma 9.3.10 auf jedem Intervall der Form [a, s] mit s ∈ I konstant. Also ist mit x 7→ a g(t) dt, x ∈ [a, s]
(vgl. (v)) auch f (x) auf [a, s] stetig differenzierbar. Die Umkehrung ist offensichtlich.

(viii) Es gilt auch die Substitutionsregel mit skalarer Funktion g und X-wertiger Funk-
tion f (vgl. Lemma 8.4.14) und die Regel der partiellen Integration (vgl. Lemma
8.4.15), wobei eine Funktion skalarwertig sein muss, damit das Produkt von zwei
Funktion erklärt ist.
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM51

(ix) Uneigentliche Riemann-Integrale lassen sich genauso wie im skalaren Fall defi-
nieren, siehe Definition 8.6.1.
Insbesondere zeigt man wie in Lemma 8.6.3, dass aus absoluten Konvergenz von
Rb Rb
a R
g(x) dx einer Funktion g : [a, b) → X, dh. a
kg(x)k dx < +∞, die Konvergenz
b Rβ
von a g(x) dx, dh. von limβրa a g(x) dx in X folgt. Ist obendrein |g(x)| ≥ | f (x)|
Rb
für alle x ab einem c ∈ [a, b), so ist auch a f (x) dx absolut konvergent, wobei
f : [a, b) → X.
Bei diesem Schluss von absoluter Konvergenz auf die Konvergenz muss man
voraussetzen, dass für alle β ∈ [a, b) die Funktionen g, f, kg(.)k, k f (.)k auf [a, β]
Riemann-integrierbar sind.
(x) Wie im skalaren Fall kann man auch Integral und Grenzübergang vertauschen
(siehe Satz 8.7.2)
Zb Zb
lim fn dx = f dx. (9.14)
n→∞
a a

(xi) Man kann auch genauso wie im skalaren Fall die Integrationsreihenfolge vertau-
schen, siehe Satz 8.7.9. Weiters kann man Integral und Ableitung vertauschen
(siehe Korollar 8.7.11):
Z d Z d
d d
f (s, t) dt = f (s, t) dt, (9.15)
ds c c ds
d
wenn f (s, t) und ds f (s, t) für alle (s, t) ∈ [a, b] × [c, d] stetig sind.
(xii) Man kann nun auch die Rechnung aus Beispiel 8.8.3 nochmals für f : I → X
durchführen, um für eine (n + 1)-mal stetig differenzierbare Funktion die Taylor-
sche Entwicklung

Xn Z x
f (k) (y) k (x − t)n
f (x) = (x − y) + f (n+1) (t) dt. (9.16)
k=0
k! n!
y

zu erhalten. Nur eine Abschätzung des Restgliedes wie im R-wertigen Fall hat
man nicht, da diese ja den Mittelwertsatz der Differentialrechnung bzw. Integral-
rechnung verwendet.

9.3.12 Bemerkung. Alle oben erwähnten Konzepte (Reihen, gleichmäßig konvergente


Funktionen, Ableitung, Integral) hängen nicht von der Norm auf X ab, solange diese
zur ursprünglich auf X gegenen Norm äquivalent sind, denn Grenzwerte und deren
Existenz in X bleiben unverändert, wenn man zu einer äquivalenten Norm wechselt.
9.3.13 Bemerkung. Ist X = Rd , so wissen wir, dass die Konvergenz eines Netz zur kom-
ponentenweisen Konvergenz äquivalent ist, wobei die Komponenten des Grenzwertes
genau die Grenzwerte der Komponentennetze sind.
Somit erhalten wir
  P∞    d 
X∞ an,1   n=1 an,1   f1 
 
 dt f1 (t)

 ..   ..  d  ..   . 
 .  =  .  ,  .  (t) =  ..  ,
n=1   P∞  dt   d 
an,d n=1 an,d fd dt fd (t)
52 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

  R b 
Z  f   f1 (t) dt

b 1   a
 ..   .. 
 ,
 .  (t) dt =  . 
a   R b 
fd fd (t) dt
a

in dem Sinne, dass die linken Seiten genau dann existieren, wenn die rechten es tun.

Als Anwendung für obige eher abstrakt wirkende Konzepte wollen wir die Expo-
nentialfunktion, die einer p × p-Matrix wieder eine p × p-Matrix. zuweist betrachten.
9.3.14 Beispiel. Sei A ∈ R p×p . Man betrachte die R p×p -wertige Potenzreihe (t ∈ R)

X

1 n
etA := tn A .
n=0
n!

Dabei sei R p×p mit einer Abbildungsnorm versehen. Wegen

1 n (|t| kAk)n
ktn A k≤
n! n!
folgt nach dem Majorantenkriterium die absolute Konvergenz von etA für alle t ∈ R, da
ja
X∞
(|t| kAk)n
(= e|t| kAk )
n=0
n!

konvergiert. Somit ist der Konvergenzradius R = +∞. Als Grenzfunktion einer Potenz-
reihe ist t 7→ etA eine stetige Funktion von R nach R p×p .
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen
von R p×p nach R p×p gilt wegen (9.6)
∞ 
X n 1 n  X ∞
1
tA
Ae = A  t  A  = tn An+1 = etA A. (9.17)
n=0
n! n=0
n!

Sei x ∈ R. Die Potenzreihe für auf [−|x|, |x|] gleichmäßig konvergiert, kann man im
Folgenden Integration und Grenzwert vertauschen (vgl. (9.14)):
Z x ∞ Z
X x X xn+1 ∞
1 n n
etA dt = t A dt = An .
0 n=0 0 n! n=0
(n + 1)!

Wegen (9.12) und (9.6) gilt somit


Z x Z x X
∞ X 1 ∞
xn+1
AetA dt = A etA dt = An+1 = xn An = e xA − I.
0 0 n=0
(n + 1)! n=1
n!

Aus dem Hauptsatz der Differential und Integralrechnung folgt daher dtd etA = AetA =
etA A.
Übrigens konvergiert etA auch für alle t ∈ R, wenn man R p×p mit einer anderen
Norm versieht, da diese alle äquivalent sind. Wir haben oben aber die Tatsache kAn k ≤
kAkn verwendet, welche i.A. nur von der Abbildungsnorm erfüllt wird.
9.3. REIHEN, INTEGRALE, ETC. MIT WERTEN IN EINEM NORMIERTEN RAUM53

9.3.15 Proposition. Für jede p × p-Matrix A ∈ R p×p konvergiert die Reihe (A0 := I)
X∞
1 n
eA := A .
n=0
n!

absolut im Banchraum R p×p versehen mit der Abbildungsnorm, wobei keA k ≤ ekAk und zwar gleichmäßig auf jeder Menge
der Form
Er = {A ∈ R p×p : kAk ≤ r}
für jedes beliebige 0 < r < +∞.
Die Abbildung A 7→ eA als Abbildung von R p×p nach R p×p ist stetig.
P kAkn P∞ 1 n
Beweis. Wegen (9.5) gilt kAn k ≤ kAkn für alle n ∈ N. Somit ist ∞ n=0 n! eine konvergente Majorante und n=0 n! A
konvergiert absolut, wobei keA k ≤ ekAk (siehe (9.7)).
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen von R p×p nach R p×p gilt wegen (9.6)
∞ 
X 1 n  X ∞
1 n+1
AeA = A  A  = A = eA A.
n=0
n! n=0
n!

Nun betrachte für ein r > 0 die Teilmenge


Er = {A ∈ R p×p : kAk ≤ r}
n
p×p 1 n r
von R . Für A ∈ Er gilt n! A ≤ n! , und daher können wir das Weierstraßsche Konvergenzkriterium anwenden. Insbe-
P 
N 1 n A
sondere konvergiert dann n=0 n! A N∈N für N → ∞ gleichmäßig auf Er gegen die Funktion A 7→ e .
PN 1 n
Nach Korollar 9.2.8 ist A 7→ An stetig auf Er für alle n ∈ N, und nach Korollar 9.1.3 ist auch A 7→ n=0 n! A stetig auf
Er .
Da die Grenzfunktion von einer Folge stetiger Funktionen bei gleichmäßiger Konvergenz wieder stetig ist, folgt die
Stetigkeit von A 7→ eA auf Er . Weil die Stetigkeit eine lokale Eigenschaft ist, folgt diese damit auf ganz R p×p .

9.3.16 Bemerkung. Sei nun R eine weitere beliebige p × p-Matrix. Dann sieht man mit
Hilfe der Produktregel wie in (9.10), dass die Funktion f (t) = etA R eine Lösung des
Randwertproblems
f ′ (t) = A f (t), f (0) = R (9.18)
ist. Ist umgekehrt f : R → R p×p eine weitere auf ganz R differenzierbare Lösung die-
ses Problems, so folgt aus der Produktregel für R p×p  L(R p , R p )-wertige Funktionen
(9.10)
d −tA
(e f (t)) = −e−tA A f (t) + e−tA f ′ (t) = −e−tA A f (t) + e−tA A f (t) = 0,
dt
und daher e−tA f (t) = e−0A f (0) = R. Da insbesondere etA eine Lösung von (9.18) mit
R = I ist, erhalten wir e−tA etA = I und somit e−tA = (etA )−1 .
Für unsere zunächst beliebige Lösung folgt daher auch f (t) = etA R. Also ist etA R
die einzige Lösung von (9.18).
Mit dieser Tatsache lässt sich nun auch die Frage behandeln, ob für die Exponenti-
alfunktion wie im skalaren Fall gilt, dass eA+B = eA eB . Im Allgemeinen ist das nämlich
nicht richtig. Sollten aber A und B kommutieren (AB = BA), so gilt (vgl. (9.6))
∞ 
X tn n  X
∞ n
t X∞ n
t
e B = 
tA
A  B = (An B) = (BAn) = BetA ,
n! n=0
n! n=0
n! n=0

und daher
d tA tB
(e e ) = AetA etB + etA BetB = (A + B)etA etB .
dt
Somit ist etA etB eine Lösung von (9.18) mit A ersetzt durch A + B und R ersetzt durch
I, und wegen der Eindeutigkeit der Lösung folgt et(A+B) = etA etB .
9.3.17 Bemerkung. Ganz ähnlich wie in Bemerkung 9.3.4 gelten auch Beispiel 9.3.14
und die Aussagen von Proposition 9.3.15 und Bemerkung 9.3.16 für den Fall, dass
A ∈ L(X, X) mit einem beliebigen Banachraum X. Die Beweise sind im wesentlichen
die selben.
54 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

9.4 Skalarprodukträume und Orthogonalsysteme


Genauso wie im obigen Beispiel zeigt man, dass durch
√ jedes positiv definite Skalar-
produkt (., .) auf einem Vektorraum H durch kxk := (x, x) eine Norm definiert ist.

9.4.1 Definition. Ist H ein Vektorraum über R oder C, und ist (., .) : H × H →
R bzw. (., .) : H × H → C ein Skalarprodukt, dh. eine hermitsche positiv definite
Sesqulinearform, so nennen wir (H, (., .)) einen Skalarproduktraum. Weiters setzen
wir für x ∈ H p
kxk := (x, x).

Nicht ganz zufällig wird für (x, x) das Symbol kxk gewählt. In der Tat ist k.k eine
Norm, denn es gilt offensichtlich wegen der positiven Definitheit (x, x) = 0 ⇔ x = 0
und (x, x) ≥ 0, es gilt kλxk2 = (λx, λx) = |λ|2 · kxk2 und schließlich liefert die aus der
Linearen Algebra bekannten Cauchy-Schwarzschen Ungleichung |( f, g)| ≤ k f k · kgk

k( f + g)k2 = |( f, ( f + g)) + (g, ( f + g))| ≤ k f k · k f + gk + kgk · k f + gk,

und daher k( f + g)k ≤ k f k + kgk. Also ist (H, k.k) ein normierter Raum (siehe Definition
9.1.1).

9.4.2 Definition. Ein Skalarproduktraum (H, (., .)) heißt Hilbertraum, wenn (H, k.k)
sogar ein Banachraum ist.

9.4.3 Beispiel.
P
Versehen wir etwa C p mit dem natürlichen Skalarprodukt (x, y) := pj=1 x j ȳ j , so
ist die von (., .) erzeugte Norm gerade k.k2 und (C p , (., .)) ist ein Hilbertraum.

Betrachten wir C[a, b]3 aber jetzt versehen mit


s
Z b
k f k2 := | f (t)|2 dt.
a

p
Für diese Norm gilt k f k2 = ( f, f ), wenn wir C[a, b] mit dem positiv definiten
Skalarprodukt ( f, g ∈ C[a, b])4
Z b
( f, g) = f (t)g(t) dt
a

versehen. Der normierte Raum (C[a, b], k.k2) ist nicht vollständig und damit
(C[a, b], (., .)) kein Hilbertraum.

Sei Q[a, b] die Menge aller auf [a, b] stückweise stetigen Funktionen mit Werten
in C (vgl. Definition 8.4.3).
Man überprüft in elementarer Weise, dass f ∈ Q[a, b] genau dann, wenn für
alle x ∈ [a, b) die Grenzwerte f (x+) = limt→x+ f (t) und für alle x ∈ (a, b] die
Grenzwerte f (x−) = limt→x− f (t) existieren und für alle bis auf endlich viele
x ∈ (a, b) gilt f (x−) = f (x) = f (x+).
3 In diesem Kapitel steht C[a, b] für alle komplexwertigen stetigen Funktionen auf [a, b]. Alle Ergebnisse

gelten sinngemäß auch für den Raum aller reellwertigen stetigen Funktionen auf [a, b].
4 Das Quer ist nicht nötig, wenn C[a, b] für alle stetigen und reellwertigen Funktionen steht.
9.4. SKALARPRODUKTRÄUME UND ORTHOGONALSYSTEME 55

Daraus erkennt man leicht, dass mit f, g ∈ Q[a, b], α ∈ C auch α f, f + g, f · g ∈


Q[a, b], und dass für jedes Intervall I ⊆ [a, b] die charakteristische Funktion 1I
in Q[a, b] liegt.
Insbesondere ist Q[a, b] ein Vektorraum. Definieren wir für f, g ∈ Q[a, b] die
hermitsche Form Z b
( f, g) = f (x)g(x) dx,
a
p
so ist k f k := ( f, f ) fast eine Norm. In der Tat folgt aus Korollar 8.4.12 und
Bemerkung 8.4.4, dass wenn k f k = 0, immer f (x) = 0 für alle bis auf endlich
viele x ∈ [a, b]. Wenn wir zwei Funktionen in Q[a, b] identifizieren, wenn sie
sich nur an endlich vielen Stellen unterscheiden, dann wird (Q[a, b], (., .)) zu
einem Skalarproduktraum und k.k ist daher ein Norm.
Die Identifizierung von Funktionen, die sich nur auf einer endlichen Menge un-
terscheidet ist eigentlich ein Übergang von Q[a, b] zum Faktorraum

Q[a, b] / f ∈ Q[a, b] : f (x) = 0 für alle bis auf endlich viele x ∈ [a, b] .

Ein Beispiel eines unendlich dimensionalen Hilbertraumes ist


 


 X
∞ 


2 N 2
l (N) = 
(zn ) n∈N ∈ C : |zn | < +∞ 

 
n=1

versehen mit
X

((zn )n∈N , (wn )n∈N ) := zn w̄n ,
n=1
wobei diese Reihe wegen
v
u
t N v
t∞
XN X X
N X X

|zn w̄n | ≤ 2
|zn | · 2
|wn | ≤ |zn |2 · |wn |2
n=1 n=1 n=1 n=1 n=1
pP∞
2
sogar absolut konvergiert. Die von (., .) erzeugte Norm ist n=1 |zn | .

Um die Vollständigkeit nachzuweisen, sei (zkn )n∈N k∈N eine Cauchy-Folge in
l2 (N) bezüglich der von (., .) erzeugten Norm. Für ein festes m ∈ N gilt (k, l ∈ N)
|zkm − zlm | ≤ k(zkn )n∈N − (zln )n∈N k,
und man sieht, dass (zkm )k∈N eine Cauchy-Folge in C ist. Also zkm → zm , k → ∞
für ein zm ∈ C. Sei ǫ > 0 und K ∈ N so, dass k, l ≥ K ⇒ k(zkn )n∈N − (zln )n∈N k < ǫ.
Für ein festes N ∈ N und k ≥ K gilt dann
X
N X

|zkn − zln |2 ≤ |zkn − zln |2 < ǫ 2 .
n=1 n=1
PN k
Lassen wir l → ∞ streben, so erhalten wir n=1 |zn − zn |2 ≤ ǫ 2 , und da N beliebig
P∞ k
war sogar n=1 |zn − zn | ≤ ǫ . Daraus folgt einerseits (zkn − zn )n∈N ∈ l2 (N) und
2 2

somit (zn )n∈N ∈ l2 (N) und andererseits


k(zkn )n∈N − (zn )n∈N k ≤ ǫ.

Also konvergiert (zkn )n∈N k∈N für k → ∞ bezüglich k.k gegen den Grenzwert
(zn )n∈N .
56 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

9.4.4 Definition. Sei (H, (., .)) ein Skalarproduktraum. Eine Familie (ei )i∈I von nicht-
verschwindenden Elementen aus H, d.h. 0 , ei ∈ H, i ∈ I, heißt Orthogonalsystem,
wenn (ei , e j ) = 0, i , j. Ein Orthogonalsystem heißt Orthonormalsystem, wenn zusätz-
lich kei k = 1, i ∈ I.
Klarerweise ist jedes Orthogonalsystem (ei )i∈I linear unabhängig und lässt sich
durch Normierung in ein Orthonormalsystem überführen: ( ke1i k ei )i∈I .
Aus der Linearen Analysis ist folgender Aussage bekannt (siehe Satz 11.5.5 und
die drei Zeilen unmittelbar nach dem Beweis von Satz 11.5.5 im Buch Lineare Algebra
von Hans Havlicek).
9.4.5 Proposition. Sei I = {1, . . . , n} endlich und (ei )i∈I ein Orthonormalsystem in ei-
nem Skalarproduktraum (H, (., .)). Weiters sei G der von (ei )i∈I aufgespannte Teilraum
in H.
Dann gilt H = G ⊕ G⊥ , und
X
P : H → G, P(x) := (x, ei )ei
i∈I

ist eine Projektion von H auf G mit Kern G .
9.4.6 Lemma. Mit der Notation aus Proposition 9.4.5 gilt
kxk2 = kPxk2 + k(I − P)xk2 .
P P
Sind c1 , . . . , cn ∈ C, so gilt k i∈I ci ei k2 = i∈I |ci |2 . Insbesondere gilt
X
kPxk2 = |(x, ei )|2 .
i∈I
P
Schließlich ist y = i∈I (x, ei )ei der Vektor in G mit minimalen Abstand zu x.
Beweis. Sind u, v ∈ H und u⊥v, so gilt (u + v, u + v) = (u, u) + (v, v). Wenden wir diese
Tatsache auf u = Px und v = (I − P)x an, so erhalten wir die erste Gleichung.
Wenden wir sie n-mal auf die Summe c1 e1 + · · · + cn en an, und beachten, dass
kc j e j k2 = |c j |2 , so folgt die zweite Gleichung.
Um die letzte Behauptung zu zeigen, sei y ∈ G beliebig. Der Abstand zum Quadrat
von y zu x ist wegen (x − Px)⊥(y − Px)
(x − y, x − y) = (x − Px + (Px − y), x − Px + (Px − y)) =
(x − Px, x − Px) + (Px − y, Px − y) = kx − Pxk2 + kPx − yk2 .
Also ist immer kx − yk > kx − Pxk außer kPx − yk2 = 0 bzw. y = Px.

Ist nun (ek )k∈N ein abzählbares Orthonormalsystem, so kann man für jedes n ∈ N
die orthogonale Projektion Pn : H → Gn wie in Proposition 9.4.5 betrachten, wobei
Gn die lineare Hülle von e1 , . . . , en . Dabei ist
X
n
Pn x = (x, ek )ek .
k=1

Aus Lemma 9.4.6 wissen wir, dass


X
n
kxk2 = k(I − Pn )xk2 + |(x, ek )|2 .
k=1

Wir erhalten somit folgenden Satz.


9.5. FOURIERKOEFFIZIENTEN UND KONVERGENZ VON FOURIERREIHEN57

P 
9.4.7 Satz. Die Reihe ∞ 2 2
k=1 |(x, ek )| konvergiert, d.h. (x, ek ) k∈N ∈ l (N). Insbesondere
ist diese Folge von komplexen Zahlen eine Nullfolge.
P
Außerdem konvergiert die Reihe ∞ k=1 (x, ek )ek in H bzgl. k.k gegen x genau dann,
P∞ 2 2
wenn k=1 |(x, ek )| = kxk .
P
9.4.8 Definition. Man bezeichtnet ∞ k=1 (x, ek )ek als Fourierreihe von x bezüglich dem
Orthonormalsystem (en )n∈N , ob sie nun konvergiert, oder nicht. Konvergiert die Fou-
rierreihe von jedem x ∈ H und ist ihr Grenzwert x, so bezeichnet man (ek )k∈N als
Orthonormalbasis.

9.4.9 Bemerkung. Man beachte, dass wegen


2
X n Xn
ck ek = |ck |2 (9.19)
k=l+1 k=l+1

PN  P
mit ck = (x, ek ) die Folge k=1 (x, ek )ek N∈N der Partialsummen der Reihe ∞ k=1 (x, ek )ek
zwar eine Cauchy-Folge, aber, da H nicht vollständig sein muss, nicht notwendiger-
weise konvergiert.
Ist jedoch H ein Hilbertraum, so konvergiert unsere Reihe immer. In der Tat kon-
P
vergiert in solchen Räumen wegen (9.19) jede Reihe der Form ∞ k=1 ck ek , wenn nur
(ck )k∈N ∈ l2 (N).

9.5 Fourierkoeffizienten und Konvergenz von Fourier-


reihen
Betrachten wir den Skalarproduktraum Q[−π, π] so überprüft man leicht, dass

1 1 1 1 1 1 1
√ , √ cos t, √ sin t, √ cos 2t, √ sin 2t, √ cos 3t, √ sin 3t, . . .
2π π π π π π π

ein Orthonormalsystem in von Q[−π, π] ist. Traditionsgemäß wird die Fourierreihe ei-
ner Funktion f ∈ Q[−π, π] bzgl. dieses Orthonormalsystem geschrieben als

a0 X

+ (an cos nt + bn sin nt),
2 n=1

wobei die Fourierkoeffizienten definiert sind durch


1
an = f (t) cos nt dt, n = 0, 1, 2, . . . , (9.20)
π
−π


1
bn = f (t) sin nt dt, n = 1, 2, . . . . (9.21)
π
−π

Man beachte, dass für reellwertige Funktionen f offensichtlich auch die an und bn
reellwertig sind.
58 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

9.5.1 Beispiel. Betrachte die Funktion


 π


 , 0 < x ≤ π,
 4
f := 
 0 , x = 0, ±π,

 −π
4 , −π ≤ x < 0.

Die Funktion ist ungerade, die Fourierreihe wird also eine reine Sinusreihe:

X

sin(2k − 1)t
.
k=1
2k − 1

Wir können aber bis jetzt nichts über die Konvergenz dieser Fourierreihe also der Folge
der Partialsummen
XN 
sin (2k − 1)t
gN (t) := , N = 1, 2, 3, . . .
k=1
2k − 1

bzgl. k.k bzw. über die punktweise Konvergenz aussagen.

π
4

t
−π 0 π
f (t)
− π4 g1 (t)
g2 (t)
g3 (t)

Wir wenden uns nun der Frage nach punktweiser Konvergenz der Fourierreihe zu.
Sei zunächst f (x) ein trigonometrisches Polynom vom Grad ≤ l.

9.5.2 Definition. Eine Abbildung f : R → C heißt trigonometrisches Polynom vom


Grad kleiner oder gleich l, falls f eine Linearkombination von Funktionen eint , |n| ≤ l,
bzw. äquivalent, eine Linearkombination von 1, cos t, . . . , cos lt, sin t, . . . , sin lt ist.

Da die n-te Partialsumme

a0 X
n
sn (x) = + (am cos mx + bm sin mx)
2 m=1

gerade die Projektion Pn ( f ) von f auf die lineare Hülle von


1, cos t, . . . , cos nt, sin t, . . . , sin nt ist, folgt sn (x) = f (x) für n ≥ l. Also konver-
giert (sn (x))n∈N trivialerweise gegen f (x) für alle x.
Allgemein lässt sich die n-te Partialsumme umschreiben

Zπ Zπ Zπ
1 X
n 
1
sn (x) = f (t) dt + f (t) cos mt dt · cos mx + f (t) sin mt dt · sin mx =
2π π m=1
−π −π −π
9.5. FOURIERKOEFFIZIENTEN UND KONVERGENZ VON FOURIERREIHEN59

Zπ  
1  1 Xn 
= 
f (t) ·  + (cos mt cos mx + sin mt sin mx) dt =
π 2 m=1
−π

Zπ  
1  1 Xn 
= f (t)  + cos m(x − t) dt.
π 2 m=1
−π

Schreibt man
1 X
n
1
Dn (t) := + cos mt, D0 (t) := ,
2 m=1 2
so erhält man

1
sn (x) = f (t)Dn (x − t) dt. (9.22)
π
−π

Die Funktion Dn (t) heißt Dirichlet-Kern und ist 2π periodisch. Man sieht leicht mit
Hilfe der Formel für die endliche geometrische Reihe, dass sich Dn schreiben lässt als

1 X ikt sin(n + 2 )t 1
n 1
t 
Dn (t) = e = = cos nt + cot · sin nt . (9.23)
2 k=−n 2 sin 2t 2 2

D0 (t)
D1 (t)
D2 (t)
D3 (t)

1
2

t
−π 0 π

Abbildung 9.3: Dirichlet-Kern

Nehmen wir uns eine Funktion f ∈ Q[−π, π] her, vernachlässigen den Funktions-
wert bei π, und setzen f |[−π,π) , 2π-periodisch auf ganz R zu einer Funktion f˜ fort, so
können wir (9.22) in der Form

1
sn (x) = f˜(x + t)Dn (t) dt (9.24)
π
−π

schreiben. Man beachte, dass dieser Ausdruck für alle x ∈ R existiert und so wie f˜
auch 2π-periodisch ist. Wegen
Z π
Dn (t) dt = π,
−π
60 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

konvergiert die Folge der Partialsummen sn in einem Punkt x gegen ein s(x) ∈ C genau
dann, wenn

 n→∞
f˜(x + t) − s(x) Dn (t) dt −→ 0. (9.25)
−π

9.5.3 Satz (Lokalisationsprinzip). Für jedes δ > 0 und für die 2π-periodische Fortsetzung g̃ von g ∈ Q[−π, π) auf R gilt
Z
lim g̃(x + t)Dn (t) dt = 0. (9.26)
n→∞
[−π,−δ]∪[δ,π]

Somit hängt das Verhalten der Partialsummen sn (x) einer Funktion f ∈ Q[−π, π) nur von den Werten von f˜ lokal bei x ab.
Genauer gesagt konvergiert sn (x) gegen einen Wert s(x) genau dann, wenn
Z
lim ( f˜(x + t) − s(x))Dn (t) dt = 0. (9.27)
n→∞
[−δ,δ]

Beweis. Setze  


g̃(t + x) , δ < |t| ≤ π, 

g̃(t + x) cot t
, δ < |t| ≤ π,
α(t) :=  β(t) :=  2

 0

0 , |t| ≤ δ, , |t| ≤ δ.
t
Beachte, dass cot 2 auf δ ≤ |t| ≤ π stetig ist und daher β ∈ Q[−π, π]. Es gilt (siehe (9.23))

Z Zπ Zπ
1 1
g̃(t + x)Dn (t) dt = α(t) cos nt dt + β(t) sin nt dt.
2 2
[−π,−δ]∪[δ,π] −π −π

Somit ist die rechte Seite die Summe von Fourierkoeffizienten von Q[−π, π]-Funktionen und somit nach Satz 9.4.7 gegen
Null konvergent
Schließlich folgt (9.27) aus (9.25) und (9.26), wobei wir g(t) = f (t) − s(x) setzen.

9.5.4 Bemerkung. Das Lokalisationsprinzip zeigt einen grundlegenden Unterschied zwischen trigonometrischen Reihen
und Potenzreihen auf. Denn stimmen zwei Funktionen in einer Umgebung des Entwicklungspunktes überein, so haben sie
die selbe Taylorreihe. Dagegen folgt für die entsprechenden Fourierreihen nur, dass sie sich lokal bei diesem Punkt gleich
verhalten.

Folgender Satz liefert uns ein hinreichendes Kriterium für die Konvergenz der Fol-
ge (sn (x))n∈N , das einfach zu überprüfen ist.
9.5.5 Satz. Sei f ∈ Q[−π, π], und sei f˜ die 2π-periodisch Fortsetzung von f |[−π,π) auf
ganz R. Weiters sei x ∈ R. Existieren die einseitigen Limites
f˜(x+) := lim f˜(t), f˜(x−) := lim f˜(t),
t→x+ t→x−

und die verallgemeinerten einseitigen Ableitungen


f˜(x + h) − f˜(x+) ˜′ f˜(x + h) − f˜(x−)
f˜′ (x+) := lim , f (x−) := lim ,
h→0+ h h→0− h
dann folgt
f˜(x+) + f˜(x−)
lim sn (x) = . (9.28)
n→∞ 2
Beweis. Wegen (9.25) lässt sich die gewünschte Beziehung (9.28) umformulieren zu5
Zπ !
f˜(x+) + f˜(x−)
lim f˜(x + t) − Dn (t) dt =
n→∞ 2
−π
5 Man beachte, dass Dn (t) eine gerade Funktion ist.
9.5. FOURIERKOEFFIZIENTEN UND KONVERGENZ VON FOURIERREIHEN61



lim f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) Dn (t) dt = 0.
n→∞
0

Mit Hilfe von (9.23) sehen wir, dass dieses Integral übereinstimmt mit


1 
f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) · cos nt dt+
2
0
Zπ !
f˜(x + t) + f˜(x − t) − f˜(x+) − f˜(x−) t
+ cos · sin nt dt. (9.29)
2 sin 2t 2
0

Die Funktion in der Klammer im ersten Integral ist offenbar in Q[−π, π]. Das erste
Integral ist also der Fourierkoeffizient von cos nt in der Fourierreihe dieser Funktion
multipliziert mit 1(0,π) , und nach Satz 9.4.7 eine Nullfolge für n → ∞.
Die Funktion g in der Klammer des zweiten Integrals liegt ebenfalls ebenfalls in
Q[−π, π], denn es gilt

f˜(x + t) − f˜(x+) + f˜(x − t) − f˜(x−) t


lim · cos =
t→0+ 2 sin 2t 2
!
f˜(x + t) − f˜(x+) f˜(x − t) − f˜(x−) t t
lim + · t · cos = f˜′ (x+) − f˜′ (x−),
t→0+ t t 2 sin 2 2
und weg von der Null überträgt sich die Tatsache, dass t 7→ f˜(x + t) + f˜(x − t)
stückweise stetig auf [−π, π] ist, auf g. Also ist das zweite Integral in (9.29) der
Fourierkoeffizient von sin nt in der Fourierreihe von g multipliziert mit 1(0,π) und nach
Satz 9.4.7 ebenfalls eine Nullfolge für n → ∞.

9.5.6 Bemerkung. Mit einer nur etwas verfeinerten Argumentation sieht man, dass (9.28) gilt, wenn für ein hinreichend
kleines δ > 0 Z Z
| f (x + t) − f (x+)| | f (x − t) − f (x−)|
dt < +∞, dt < +∞,
(0,δ) t (0,δ) t

gilt.

9.5.7 Definition. Eine Abbildung f : [a, b] → R (C) heißt stückweise stetig differen-
zierbar , falls es eine Zerlegung a = t0 < · · · < tn = b von [a, b] gibt, sodass jede
Einschränkung f |(t j−1 ,t j ) eine stetig differenzierbare Fortsetzung auf [t j−1 , t j ] hat.

9.5.8 Bemerkung. Ist f stückweise stetig differenzierbar auf [−π, π], so sind die Vor-
aussetzungen von Satz 9.5.5 für alle x ∈ R erfüllt.
Also konvergiert die Fourierreihe bei Stetigkeitspunkten x von f˜ gegen f˜(x) und
˜ ˜
sonst gegen f (x+)+2 f (x−) .
9.5.9 Beispiel. Wir betrachten f (x) = |x|, x ∈ [−π, π]. Die 2π-periodische Fortsetzung
dieser Funktion6 ist stückweise stetig differenzierbar. Also konvergiert die Fourierreihe
punktweise gegen f . Die Fourierkoeffizienten berechnet man folgendermaßen (n > 0):
Z Z
1 π 2 π
an = |t| cos nt dt = t cos nt dt =
π −π π 0
6 Sägezahnfunktion.
62 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN
Z π
2 2 2
− sin nt dt = (cos nπ − cos 0) = 2 ((−1)n − 1),
nπ 0 n2 π n π
a0 = π und die bn = 0, da die Funktionen |t| sin nt ungerade sind. Also gilt (x ∈ [−π, π])

π 4X

1
|x| = − cos(2n − 1)x.
2 π n=1 (2n − 1)2

Setzen wir x = 0, so erhalten wir

π2 X

1
= .
8 n=1
(2n − 1)2

9.5.10 Bemerkung. Hat man eine Funktion f gegeben mit Periode 2T , so kann man
diese mittels einer Umskalierung in eine Fourierreihe entwickeln. Diese schaut folgen-
dermaßen aus: !
a0 X

πkx πkx
+ ak cos + bk sin
2 k=1 T T
mit
ZT
1 πkx
ak = f (x) cos dx, k = 0, 1, 2, . . . ,
T T
−T

ZT
1 πkx
bk = f (x) sin dx, k = 1, 2, . . . .
T T
−T

Hat man nun zum Beispiel eine Funktion y0 (x) am Intervall [0, 1] gegeben und
möchte diese in eine reine Sinusreihe entwickeln, so geht man vor wie folgt: Zunächst
definiert man eine Funktion f auf [−1, 1] indem man y0 ungerade fortsetzt. D.h. man
setzt 


 −y0 (−x) , −1 ≤ x < 0.



f (x) := 
 0 ,x=0



y0 (x) ,0 < x ≤ 1
Diese Funktion entwickelt man auf [−1, 1] in eine Fourierreihe. Das ist eine reine Si-
nusreihe, da wir f ja als ungerade definiert haben. Eingeschränkt auf [0, 1] erhalten wir
die gewünschte Entwicklung von y0 .

9.6 Gleichmäßige Konvergenz von Fourierreihen


Sei f ∈ Q[−π, π] und
a0 X

+ (an cos nt + bn sin nt),
2 n=1
ihre Fourierreihe. Falls diese Reihe auf [−π, π] (und wegen der 2π-Periodizität damit
auf R) gleichmäßig konvergiert, so ist die Grenzfunktion als gleichmäßiger Grenzwert
stetiger Funktionen sicherlich stetig. Damit die Fourierreihe dann f als gleichmäßigen
Grenzwert hat, ist es notwendig, dass auch f stetig ist.
Für ein hinreichendes Kriterium betrachten wir ein stetiges und stückweise stetig
differenzierbares f : [−π, π] → C mit f (−π) = f (π). Da insbesondere f ∈ Q[−π, π],
9.6. GLEICHMÄSSIGE KONVERGENZ VON FOURIERREIHEN 63

P
können wir die Fourierreihe a20 + ∞ n=1 (an cos nt + bn sin nt) von f betrachten. Nun sei
g : [−π, π] → C definiert durch g(x) = f ′ (x), wenn f bei x differenzierbar ist, und
g(x) = 0 sonst.
Da f stetig und stückweise stetig differenzierbar ist, gibt es eine Zerlegung −π =
t0 < t1 < · · · < tn = π von [−π, π], sodass sich die Funktionen f |(t j−1 ,t j ) stetig differen-
zierbar auf [t j−1 , t j ] fortsetzen lassen. Wegen der Stetigkeit von f ist diese Fortsetzung
gerade f |[t j−1 ,t j ] .
Also gilt g(x) = f ′ (x) für alle x ∈ [−π, π] \ {t0 , . . . , tn }, und g|(t j−1 ,t j ) hat die stetige
Fortsetzung ( f |[t j−1 ,t j ] )′ auf [t j−1 , t j ], dh. g ∈ Q[−π, π].
Bezeichnet αn , n ∈ N ∪ {0}, und βn , n ∈ N, die Fourierkoeffizienten von g, so folgt
mittels partieller Integration

Zπ Zt j
1X
n
1
αn = g(t) cos nt dt = ( f |[t j−1 ,t j ] )′ (t) cos nt dt =
π π j=1
−π t j−1

Zt j
1X 1X
n n
( f (t j ) cos nt j − f (t j−1 ) cos nt j−1 ) − f |[t j−1 ,t j ] (t)(−n sin nt) dt =
π j=1 π j=1
t j−1

f (π) cos nπ − f (−π) cos(−nπ) + nbn = nbn .


Ganz ähnlich berechnet man βn = −nan , n ∈ N. Aus diesen Überlegungen ergibt sich
folgender Satz.

9.6.1 Satz. Ist f : [−π, π] → C stetig und stückweise stetig differenzierbar mit f (−π) =
P
f (π), so konvergiert ihre Fourierreihe a20 + ∞ n=1 (an cos nt +bn sin nt) gleichmäßig gegen
die 2π-periodisch Fortsetzung f˜ von f |[−π,π) .

Beweis. Wir verwenden obige Notation. Nach Satz 9.4.7 sind die Folgen der Fourier-
koeffizienten (αn )n∈N und (βn )n∈N von g quadratisch summierbar, dh. sie liegen in l2 (N).
Aus der Cauchy-Schwarzschen Ungleichung, Lemma 3.1.4, folgt

X X X X ! N ! 1 1
1 2 X 2 2
N N N N
|nan | |βn |
|an | = = ≤ |βn | ,
n=1 n=1
|n| n=1
|n| n=1
n2 n=1

P P 1 PN 1
und für N → ∞, dass n∈N |an | ≤ ( n∈N n12 ) 2 ( n=1 |βn |2 ) 2 < ∞. Genauso sieht man
P
n∈N |bn | < +∞. Nach
P
dem Kriterium von Weierstraß, Korollar 6.7.4, konvergiert die
Fourierreihe a20 + ∞n=1 n cos nt + bn sin nt) gleichmäßig auf R und zwar wegen Satz
(a
9.5.5 gegen f˜.

Ist f : [−π, π] → C nur stetig mit f (−π) = f (π), so lässt sich f beliebig gut etwa
durch stetige und stückweise lineare Funktionen approximieren. In Kombination mit
Satz 9.6.1 folgt daraus, dass sich jede stetige Funktion auf [−π, π] mit den gleichen
Werten bei ±π beliebig gut gleichmäßig durch trigonometrische Funktionen approxi-
mieren lässt. Diese Tatsache lässt sich auch mit den Mitteln des Fejér Kerns zeigen,
vgl. Satz 9.7.2. Daraus leitet man wiederum her, dass für jedes stetige f : [−π, π] → C
mit f (−π) = f (π) die Fourierreihe von f bzgl. k.k2 in Q[−π, π] gegen f konvergiert.
Siehe diesbezüglich Korollar 9.7.3 samt Beweis.
64 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

P
9.6.2 Bemerkung. Die Fourierreihe a20 + ∞ n=1 (an cos nt + bn sin nt) der Funktion f (x) =
|x|, x ∈ [−π, π], aus Beispiel 9.5.9 konvergiert nach Satz 9.6.1 sogar gleichmäßig gegen
die 2π-periodische Fortsetzung von f . Also gilt

lim ksn − gk∞ = 0,


n→∞

wobei k.k∞ die Supremumsnorm [−π, π] ist, und

a0 X
n
sn (t) = + (am cos mt + bm sin mt).
2 m=1

Da f reellwertig ist, liegen die Koeffizienten an , bn in R.


Da die Funktionen cos mt, sin mt und damit sn (t) in Potenzreihen mit Konvergenzra-
dius +∞ entwickelbar sind, konvergiert die Potenzreihe auf [−π, π] sogar gleichmäßig
(vgl. Satz 6.7.8).
Nimmt man eine Partialsumme dieser Potenzreihe mit hinreichend großem Index,
so hat man ein Polynom pn (t) mit reellen Koeffizienten, sodass ksn − pn k∞ ≤ 1n . Mit der
Dreiecksungleichung folgt

1 n→∞
kg − pn k∞ ≤ + kg − sn k∞ −→ 0.
n
Also gibt es eine Folge (pn )n∈N von Polynomen mit reellen Koeffizienten, die auf
[−π, π] gleichmäßig gegen f konvergiert.
Ist c > 0 bliebig, so konvergiert dann s 7→ πc pn ( πc s), n ∈ N, gleichmäßig auf [−c, c]
gegen s 7→ πc f ( πc s) = πc πc |s| = |s|. Also ist auch auf [−c, c] die Funktion s 7→ |s|
gleichmäßiger Grenzwert einer Folge von Polynomen mit reellen Koeffizienten.
Wenn man die Methoden aus Bemerkung 9.6.2 mit den davor erwähnten kombi-
niert, erhält man allgemeiner, dass man auf jedem Intervall [a, b] jede stetig Funktion
beliebig gut durch eine Folge von Polynomen gleichmäßig approximieren kann, vgl.
Satz 9.7.5 sowie Satz 12.10.4.

9.7 Fejér Kern


Man überzeugt sich leicht, dass für eine
 Nullfolge (an )n∈N∪{0} bestehend aus nichtnegativen reellen Zahlen auch die Folge
1 Pn
der arithmetischen Mittel n+1 j=0 a j n∈N∪{0} eine Nullfolge bildet. Daraus schließt man leicht, dass für eine konvergente
Folge (sn )n∈N0 auch die Folge (σn )n∈N0 der arithmetischen Mittel

s0 + s1 + . . . + sn
σn := ,
n+1

konvergiert, und zwar gegen den gleichen Grenzwert. Die Umkehrung gilt jedoch nicht, wie man am Beispiel der Folge
1, 0, 1, 0, 1, 0, . . . sieht. P
a
Somit ist es einen Versuch wert, für eine Funktion f mit Fourierreihe 20 + ∞n=1 (an cos nx + bn sin nx), die Reihe in
diesem verallgemeinerten Sinne zu summieren. Man betrachtet also die sogenannten Cesaro-Mittel:

s0 (x) + s1 (x) + . . . sn (x)


σn (x) :=
n+1
a P
wobei sn (x) = 20 + nm=1 (am cos mx + bm sin mx) ist. Man beachte, dass genauso wie die sn (x) auch die σn (x) trigonometri-
sche Polynome vom Grad ≤ n sind.
Die Vorgangsweise ist nun ähnlich wie vorher. Mit (9.24) können wir σn (x) für n ∈ N ∪ {0} als


1
σn (x) = f˜(x + t)Fn (t) dt, (9.30)
π
−π
9.7. FEJÉR KERN 65

schreiben, wobei f˜ die 2π-periodische Fortsetzung von f |[−π,π) auf R ist und wobei Fn (t) den Fejér-Kern7

1 
Fn (t) = D0 (t) + . . . + Dn (t)
n+1

bezeichnet. Aus (9.23) folgt


!
1 1 1
Fn (t) = t sin(0 + )t + . . . + sin(n + )t =
2(n + 1) sin 2
2 2
   !
1 Xn  1  1 exp i(n + 1)t − 1
t Im  exp ( j + )it  = t Im t t =
2(n + 1) sin 2 j=0
2 2(n + 1) sin 2 exp(i 2 ) − exp(−i 2 )

!  2
1  t  sin(n + 1) 2t 1  sin (n+1)t 
t Im exp i(n + 1) t =  2
 . (9.31)
2(n + 1) sin 2
2 sin 2 2(n + 1) sin 2t

F0 (t)
F1 (t)
F2 (t)
F3 (t)

1
2

t
−π 0 π

Abbildung 9.4: Fejér-Kern


Der Fejér Kern hat folgende Eigenschaften.

9.7.1 Lemma. Für alle n ∈ N ∪ {0} gilt

Fn (t) ≥ 0,

1

π Fn (t) dt = 1
−π

Für jedes δ > 0 gilt limk→∞ Fk (t) = 0 gleichmäßig auf [−π, −δ] ∪ [δ, π].

Beweis. Die Eigenschaft Fn (t) ≥ 0 ist klar wegen der Darstellung (9.31).
Rπ Rπ
Fn (t) dt = π folgt wegen Dn (t) dt = π und der Definition von Fn . Um die letzte Aussage zu zeigen, genügt es zu
−π −π
bemerken, dass auf Grund von (9.31)

1
Fn (t) ≤ , t ∈ [−π, π] \ {0}.
2(n + 1) sin2 t
2


9.7.2 Satz (Fejér). Sei f : [−π, π] → C stetig, wobei f (π) = f (−π). Weiters sei f˜ die 2π-periodische Fortsetzung auf R.
Bezeichne σn die Folge der Cesaro-Mittel der Fourierreihe, dann gilt

lim σn (x) = f˜(x)


n→∞

n→∞
gleichmäßig für alle x ∈ R, d.h. σn −→ f˜ bzgl. k.k∞ . Für reellwertiges f sind die σn dabei auch reellwertig.

7 Leopold Fejér, geb.9.2.1880 Pecs, gest.15.10.1959 Budapest


66 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

Beweis. Zuerst sei bemerkt, dass f auf [−π, π] wegen Satz 6.3.3 gleichmäßig stetig ist. Man sieht sofort, dass dann auch f˜
gleichmäßig stetig ist.
Wegen (9.30) und Lemma 9.7.1 ist die Behauptung äquivalent zu


 n→∞
π(σn (x) − f (x)) = f˜(x + t) − f˜(x) Fn (t) dt −→ 0,
−π

und zwar gleichmäßig in x. Sei also ǫ > 0 und wähle gemäß der gleichmäßigen Stetigkeit δ > 0 so, dass | f˜(x + t) − f˜(x)| < ǫ,
wenn nur |(x + t) − x| = |t| < δ.
Wegen Lemma 9.7.1 gibt es ein N ∈ N, sodass 0 ≤ Fn (t) < ǫ für alle t ∈ [−π, −δ] ∪ [δ, π] und n ≥ N. Wir erhalten
(durch mehrfache Verwendung von Lemma 9.7.1)
π
Z
˜f (x + t) − f˜(x)Fn (t) dt ≤

−π

Zδ Z Z π!
f˜(x + t) − f˜(x) F (t) dt + f˜(x + t) − f˜(x) F (t) dt ≤
−δ
n + n
−π δ
−δ

Zδ Z −δ Z π!
ǫ · Fn (t) dt + + 2 · k f˜k∞ · ǫ dt ≤ ǫ + 4π · k f˜k∞ · ǫ.
−π δ
−δ

Damit konvergiert σn gleichmäßig gegen f˜. Für reellwertiges f sind die Fourierkoeffizienten reell und daher auch die σn
reellwertig.


9.7.3 Korollar. Für jedes stetige f : [−π, π] → C mit f (π) = f (−π) konvergiert seine Fourierreihe bezüglich k.k (= (., .))
gegen f .

Beweis. Klarerweise ist kgk2 = −π |g(x)|2 dx ≤ 2πkgk2∞ , und somit kσn − f k → 0. Nach Lemma 9.4.6 ist die Partialsumme
sn der Fourierreihe von f das eindeutige Element in der linearen Hülle von 1, cos t, . . . , cos nt, sin t, . . . , sin nt mit kleinstem
Abstand zu f . Da auch σn in dieser Hülle liegt, gilt kσn − f k ≥ ksn − f k und somit sn → f bezüglich k.k.

2
9.7.4 Bemerkung. Es gilt in der Tat, dass die Fourierreihe einer jeden Funktion f aus L [−π, π] und somit jeder Funktion
aus Q[−π, π] gegen f bezüglich k.k konvergiert. L2 [−π, π] ist dabei die Menge aller auf [−π, π] quadratisch Lebesgue-
integrierbaren Funktionen. Diese Art von Räumen wird in der Maßtheorie betrachtet.
Als weiteres Korollar erhalten wir folgenden wichtigen Satz.

9.7.5 Satz (Weierstraß). 8 Sei f eine stetige reellwertige (komplexwertige) Funktion auf dem Intervall [a, b]. Dann existiert
eine Folge (pn )n∈N von reellen (komplexen) Polynomen, sodass

lim pn = f
n→∞

gleichmäßig auf [a, b]. Anders ausgedrückt ist die Menge aller reellen (komplexen) Polynome auf [a, b] ist dicht im metri-
schen Raum C([a, b], R) bzw. C([a, b], C).

Beweis. Zunächst bearbeiten wir den komplexen Fall. Man überzeugt sich leicht mit Hilfe einer affinen Abbildung von
[−1, 1] auf [a, b], dass man oBdA. [a, b] = [−1, 1] annehmen kann. Nun sei g eine stetige Fortsetzung von f : [−1, 1] → C
auf [−π, π], sodass g(−π) = g(π).
Nach Satz 9.7.2 gibt es ein trigonometrisches Polynom

X
m
1
qn (t) = c + c j cos jt + d j sin jt mit kqn − gk∞ < .
j=1
2n

Da die Funktionen cos jt, sin jt und damit qn (t) in Potenzreihen mit Konvergenzradius +∞ entwickelbar sind, konvergiert
die Potenzreihe auf [−1, 1] sogar gleichmäßig (vgl. Satz 6.7.8). Nimmt man eine Partialsumme dieser Potenzreihe mit
1
hinreichend großem Index, so hat man ein Polynom pn (t), sodass kpn − qn k∞ < 2n . Mit der Dreiecksungleichung folgt
kpn − gk∞ < n1 und somit die Behauptung.
Den reellwertigen Fall zeigt man analog. Man muss nur beachten, dass man das reellwertige f zu einem stetigen
g : [−π, π] → R mit g(−π) = g(π) fortsetzen kann. Zu diesem sind dann auch die qn (t) reellwertig (vgl. Satz 9.7.2).

Wir bringen hier einen Beweis des Satzes von Weierstraß ohne Mitteln der Fourieranalysis.

8 Karl Theodor Wilhelm Weierstraß, geb.31.10.1815 Ostenfelde, gest.19.2.1897 Berlin


9.7. FEJÉR KERN 67

9.7.6 Satz (Weierstraß). Sei f eine stetige reellwertige Funktion auf dem Intervall [a, b]. Dann existiert eine Folge (Pn )n∈N
von reellen Polynomen, sodass
lim Pn = f
n→∞

gleichmäßig auf [a, b]. Anders ausgedrückt: Die Menge aller Polynome auf [a, b] ist dicht im metrischen Raum C([a, b], R).

Beweis. Wir können o.B.d.A. voraussetzen, dass [a, b] = [0, 1] ist, denn sonst betrachte f˜(x) := f (a + x(b − a)). Weiters sei
o.B.d.A. f (0) = f (1) = 0, denn sonst betrachte f˜(x) := f (x) − f (0) − x( f (1) − f (0)).
Sei also f : [0, 1] → R stetig mit f (0) = f (1) = 0. Setze f fort zu einer Funktion auf ganz R durch die Vorschrift
f (x) = 0, x < [0, 1], dann ist f sogar gleichmäßig stetig auf ganz R.
Betrachte die Funktion (n ∈ N)
(
cn (1 − x2 )n , x ∈ [−1, 1]
Qn (x) :=
0 , sonst

R1 1
R1
wobei cn so gewählt ist, dass Qn (x)dx = 1 gilt, also cn = (1 − x2 )n dx.
−1 −1
Wegen der Bernouillschen Ungleichung sieht man (1 − x2 )n ≥ 1 − nx2 für x ∈ [0, 1), und mittels Einsetzen auch für
x = 1. Aus
Z1 Z1
(1 − x2 )n dx = 2 (1 − x2 )n dx ≥
−1 0

√ √
Z n
1/ 1/
Z n
4 1
≥2 (1 − x2 )n dx ≥ 2 (1 − nx2 )dx = √ > √ ,
3 n n
0 0

erhalten wir cn < n. Es folgt für jedes δ > 0

Qn (x) = cn (1 − x2 )n ≤ n(1 − δ2 )n , δ ≤ |x|.

D.h. limn→∞ Qn (x) = 0 gleichmäßig auf [−1, 1] \ (−δ, δ).


R1
Setze Pn (x) := f (x + t)Qn (t) dt, x ∈ [0, 1]. Da f außerhalb von [0, 1] verschwindet, sieht man mit der Substitutions-
−1
regel
Z1−x Z1
Pn (x) = f (x + t)Qn (t) dt = f (t)Qn (t − x) dt,
−x 0

also ist Pn ein Polynom.


Sei ǫ > 0 gegeben. Wähle δ > 0 so, dass für |y − x| < δ stets | f (y) − f (x)| < ǫ gilt. Weiters sei n so groß, dass |Qn (t)| < ǫ
für t ∈ [−1, 1] \ (−δ, δ). Es gilt (M := sup | f (x)|)

Z1
|Pn (x) − f (x)| = ( f (x + t) − f (x))Qn (t) dt ≤
−1

Z1
≤ | f (x + t) − f (x)|Qn (t) dt ≤
−1

Z−δ Zδ Z1
≤ 2M Qn (t) dt + ǫ Qn (t) dt + 2M Qn (t) dt ≤
−1 −δ δ

≤ 4Mǫ + ǫ ≤ (4M + 1)ǫ.


9.7.7 Bemerkung. Die wesentlichen Eigenschaften von Qn sind

(i) Qn (x) ≥ 0,

R1
(ii) Qn (x)dx = 1,
−1

(iii) Für jedes δ > 0 gilt limn→∞ Qn (t) = 0 gleichmäßig auf 1 ≥ |t| ≥ δ,
68 KAPITEL 9. NORMEN, BANACHRÄUME UND FOURIERREIHEN

und natürlich, daß Qn Polynome sind, denn daher ist auch das Faltungsintegral Pn ein Polynom.
Man könnte glauben, dass diese Polynome nichts anderes sind, als Partialsummen einer Taylorreihe. Dem ist aber im
Allgemeinen nicht so, da sonst ja jede stetige Funktion gleichmäßiger Limes einer Potenzreihe wäre und somit unendlich
oft ableitbar.
Schließlich wollen wir noch bemerken, dass dieser Satz auch für komplexwertige stetige Funktionen auf einem kom-
pakten reellen Intervall und Polynome mit komplexen Koeffizienten gilt. Das sieht man unmittelbar ein, wenn man obigen
Satz auf den Realteil und auf den Imaginärteil der Funktion anwendet.
9.7.8 Beispiel. Sei f ∈ C([0, 1]) := C([0, 1], R) und gelte

Z1
f (t)tn dt = 0, n = 0, 1, 2, . . . . (9.32)
0

Dann folgt f = 0. Denn: Sei A die Menge aller aller reellen Polynome. Wegen (9.32) gilt

Z1
f h dt = 0, h ∈ A, (9.33)
0

R1
und nach dem Satz von Weierstraß gemeinsam mit Satz 8.7.2 folgt sogar f h dt = 0, h ∈ C([0, 1]). Insbesondere gilt
0
R1
f 2 dt = 0 und damit wegen der Stetigkeit von f auch f = 0.
0
R1
Man könnte ausgehend von (9.32) auch wie folgt argumentieren: Es gilt f (t)Qn (t − x) dt = 0, wobei die Qn so wie
0
im Beweis des Satzes von Weierstraß sind. Diese Ausdrücke konvergieren für n → ∞ gegen f (x), also folgt f = 0.
Kapitel 10

Ableitungen nach mehreren


Variablen

10.1 Partielle Ableitungen


Wir wollen in diesem Kapitel die Differentialrechnung für auf D ⊆ Rn definierte Funk-
tionen entwickeln. Dazu wollen wir im folgenden mit ei den i-ten kanonischen Basis-
vektor ei = (0, . . . , 0, 1, 0, . . . , 0)T mit der 1 an der i-ten Stelle bezeichnen.
10.1.1 Definition. Sei (X, k.k) ein Banachraum1. Sei f : D → X definiert auf einer
offenen Menge D ⊆ Rn . Existiert für ein x ∈ D der Limes
∂f 1 
(x) := lim f (x + tei ) − f (x) , (10.1)
∂xi t→0 t

so heißt dieser die partielle Ableitung von f nach der Variablen xi an der Stelle x.
∂f
Anstatt ∂x i
(x) schreibt man auch Di f (x) oder f xi (x).

Ist allgemeiner v = (α1 , . . . , αn )T ∈ R p ein sogenannter Richtungsvektor, und exis-


tiert für x ∈ D der Limes
∂f 1 
(x) := lim f (x + tv) − f (x)
∂v t→0 t

so heißt dieser die Richtungsableitung von f an der Stelle x in Richtung v.


Offensichtlich gilt für den Richtungsvektor ei
∂f ∂f
(x) = (x).
∂xi ∂ei

10.1.2 Bemerkung. Für x ∈ D und v ∈ R p ist die Abbildung t 7→ x + tv von R nach


Rn stetig, wobei 0 auf x abgebildet wird. Da D ⊆ Rn offen ist, gibt es daher ein reelles
Intervall (−δ, δ) mit δ > 0 um die Null, sodass x + tv ∈ D für alle t ∈ (−δ, δ). Setz man

g(t) := f (x + tv), t ∈ (−δ, δ),


1 Man sollte anfangs einfach an R oder Rm denken.

69
70 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

so bildet g das Intervall (−δ, δ) nach X hinein ab. Wegen


1  1 
f (x + tv) − f (x) = g(t) − g(0)
t t
∂f
ist g genau dann bei Null differenzierbar, wenn ∂v (x) existiert. In dem Fall gilt dann

∂f
g′ (0) = (x).
∂v
Richtungsableitungen sind ihrer Natur nach also “eindimensional“. Denn man betrach-
tet ja f eingeschränkt auf die Strecke x + tv, t ∈ (−δ, δ). Insbesondere variiert bei
der Bildung der partiellen Ableitung nach xi wie in (10.1) beim Differenzenquotienten
f (x+tei )− f (x)
t im Vektor x + tei , t ∈ (−δ, δ) nur die i-te Koordinate.

e2 e2
v
x
x + te1 x
x + tv

e1 e1

Abbildung 10.1: Ableitung in Richtung der Koordinate x1 bzw. des Vektors v

10.1.3 Definition. Sei f : D ⊆ Rn → X definiert auf der offenen Menge D. Existieren


∂f ∂f
alle partiellen Ableitungen ∂x 1
(x), . . . , ∂x n
(x), x ∈ D, so heißt f partiell differenzierbar
auf.
∂f
Sind alle X-wertigen Funktionen x 7→ ∂x j
(x), j = 1, . . . , n, darüberhinaus stetig auf
D, so heißt f stetig partiell differenzierbar. Wir schreiben dafür f ∈C 1 oder f ∈ C 1 (D).
Wir wissen, dass Netze in Rm genau dann konvergieren, wenn sie komponen-
tenweise konvergieren. Ist also X = Rm , so ist die Tatsache, dass eine Funktion
f : D ⊆ Rn → Rm , f = ( f1 , . . . , fm )T , (stetig) partiell differenzierbar ist, äquivalent
dazu, dass jede ihrer Komponenten fk (stetig) partiell differenzierbar ist.
10.1.4 Lemma. Sei f : D ⊆ Rn → X, v = (α1 , . . . , αn )T ∈ R p ein Richtungsvektor und
sei x ∈ D. Wähle δ > 0 so, dass x + tv ∈ D für t ∈ (−δ, δ). Falls f ∈ C 1 (D), so ist die
Funktion g : (−δ, δ) → X definiert durch

g(t) := f (x + tv), t ∈ (−δ, δ),

stetig differenzierbar auf (−δ, δ), dh. g ∈ C 1 (−δ, δ), wobei


X
n
∂f
g′ (t) = αi (x + tv), t ∈ (−δ, δ).
i=1
∂xi

Beweis. Sei t ∈ (−δ, δ), und setze y = x+tv, und wähle ρ > 0 so klein, dass2 Uρ·kvk∞ (y) ⊆
D. Betrachte die Vektoren

v0 := 0, vi := α1 e1 + . . . + αi ei , i = 1, . . . , n.
2 Wir versehen hier praktischerweise Rn mit k.k∞ .
10.1. PARTIELLE ABLEITUNGEN 71

Offensichtlich ist vn = v. Da die ganze Kugel mit Radius ρ und Mittelpunkt y in D


liegt, sind alle Punkte y + svi in D für |s| < ρ, und damit auch alle Verbindungsstrecken
zwischen ihnen (Kugeln sind konvex, vgl. Bemerkung 10.1.23).
Für |s| < ρ gilt nach dem Hauptsatz der Differental- und Integralrechnung (vgl.
(9.13))

X
n
 
g(t + s) − g(t) = f (y + sv) − f (y) = f (y + svi ) − f (y + svi−1 ) = (10.2)
i=1

n Z
X sαi
∂f
(y + svi−1 + τei ) dτ,
i=1 0 ∂xi

und daher
g(t + s) − g(t) X ∂ f
n
− αi (y) = (10.3)
s i=1
∂xi

X
n Z sαi !
1 ∂f ∂f
(y + svi−1 + τei ) − (y) dτ.
i=1
s 0 ∂xi ∂xi

Wegen (9.11) ist die Norm dieses Ausdruckes kleiner oder gleich

X
n
∂f ∂ f
|αi | sup (y + svi−1 + τei ) − (y) .
i=1 τ∈[0,sαi ] ∂xi ∂xi

Wegen der Stetigkeit der partiellen Ableitungen in y konvergiert dieser Ausdruck


gegen 0, wenn s → 0.

Zusammen mit Bemerkung 10.1.2 erhalten wir unmittelbar aus Lemma 10.1.4

10.1.5 Korollar. Für eine Funktion f : D ⊆ Rn → X mit f ∈ C 1 (D) existieren alle


Richtungsableitungen ∂∂vf (x) für x ∈ D und v ∈ Rn . Für v = (α1 , . . . , αn )T gilt dabei

∂f X ∂f n
(x) = αi (x). (10.4)
∂v i=1
∂xi

∂f
Insbesondere ist auch x 7→ ∂v (x) eine stetige Funktion von D nach X.

10.1.6 Bemerkung. Wir haben im Beweis von Lemma 10.1.4 die Stetigkeit der parti-
ellen Ableitungen (in allen Variablen gleichzeitig) benützt, um zu zeigen, dass (10.3)
gegen Null strebt, wenn s → 0.
Beachte, dass z.B. die Funktion aus Beispiel 9.1.8 stets Richtungsableitungen
in Richtung der Koordinatenachsen besitzt, die Richtungsableitung in Richtung v =
√1 (e1 + e2 ) jedoch bei 0 nicht existiert. Man kann also in Lemma 10.1.4 die Vorausset-
2
∂f
zung der Stetigkeit der ∂xi nicht weglassen.
∂f
Die Tatsache, dass für festes x die Richtungsableitung ∂v (x) in (10.4) linear von v
abhängt, legt folgende Begriffsbildung nahe.
72 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

10.1.7 Definition. Sei f : D ⊆ Rn → X stetig partiell differenzierbar, und x ∈ D. Dann


bezeichne d f (x) ∈ L(Rn , X) die lineare Abbildung
 
α1  Xn
 .  ∂f
 ..  7→ αi (x).
  i=1
∂x i
αn

Sie heißt die Ableitung von f im Punkt x.


Nach Korollar 10.1.5 ist d f (x)v gerade ∂∂vf (x), also die Richtungsableitung von f in
∂f
x in Richtung v. Insbesondere gilt d f (x)ei = ∂x i
(x).
10.1.8 Fakta.
1. Ist D ⊆ R, dh. n = 1, so ist d f (x) gerade jene lineare Abbildung R → X, die 1
auf f ′ (x) abbildet.
2. Wir wissen, dass Netze in Rm genau dann konvergieren, wenn sie komponenten-
weise konvergieren. Für X = Rm (versehen mit zB. k.k∞ ) ist somit die Tatsache,
dass eine Funktion f : D ⊆ Rn → Rm , f = ( f1 , . . . , fm )T , (stetig) partiell diffe-
renzierbar ist, äquivalent dazu, dass jede ihrer Komponenten fk (stetig) partiell
differenzierbar ist.
3. Ist f : D ⊆ Rn → Rm stetig differenzierbar, und x ∈ D, und zerlegen wir f (x)
in seine Komponenten, f (x) = ( f1 (x), . . . , fm (x))T , so hat d f (x) ∈ L(Rn , Rm ) 
Rm×n als Matrix die Darstellung
!
∂ fi
d f (x) = (x) .
∂x j i=1,...,m
j=1,...,n

Ist dabei m = 1, d.h. f ist R-wertig, so nennt man den Vektor d f (x)T auch den
Gradienten und schreibt auch grad f (x) dafür.
4. Ist f : D ⊆ Rn → X eine affine Abbildung, also von der Form x 7→ x0 + Ax mit
x0 ∈ X und einer linearen Abbildung A : Rn → X, so hat man

x0 + A(x + tei ) − x0 + A(x) A(tei )
d f (x)ei = lim = lim = A(ei ),
t→0 t t→0 t
und damit d f (x) = A für alle x ∈ D. Das ist eine Verallgemeinerung der Tatsache,
dass im eindimensionalen die Ableitung einer linearen Funktion kx + d konstant
gleich der Steigung k ist.

10.1.9 Beispiel. Sei D = R+ × R ⊆ R2 und T : D → R2 definiert durch


! !
r r cos t
T = .
t r sin t

Diese Polarkoordinatenfunktion kennen wir schon aus dem ersten Semester (siehe De-
finition 6.8.12 und Bemerkung 6.8.13). Nun gilt offensichtlich
! ! ! !
∂T r cos t ∂T r −r sin t
= und = .
∂r t sin t ∂t t r cos t
10.1. PARTIELLE ABLEITUNGEN 73

Also sind ∂T ∂T
∂r und ∂t stetig, und damit T stetig partiell differenzierbar. Die Ableitung
T
dT (r, t) ∈ L(R , R2 ) ist damit
2

! !
r cos t −r sin t
dT = , (10.5)
t sin t r cos t

und die Richtungsableitung von T im Punkt (r, t)T in Richtung v = (α1 , α2 )T ist nach
Korollar 10.1.5
! ! ! !
∂T r r α1 α cos t − α2 r sin t
= dT = 1 .
∂v t t α2 α1 sin t + α2 r cos t

Berechnen wir diese Richtungsableitung gemäß Bemerkung 10.1.2 direkt dadurch,



dass wir g′ (0) mit g(s) = T (r, t)T + s(α1 , α2 )T bestimmen, so erhalten wir auch
d  !
(r + sα1 ) cos(t + sα2 ) | s=0
g′ (0) = dsd  =
ds (r + sα1 ) sin(t + sα2 ) | s=0
 ! !
α1 cos(t + sα2 ) − (r + sα1 )α2 sin(t + sα2 ) | s=0 α cos t − α2 r sin t
 = 1 .
α1 sin(t + sα2 ) + (r + sα1 )α2 cos(t + sα2 ) | s=0 α1 sin t + α2 r cos t

10.1.10 Proposition. Sei f : D ⊆ Rn → X mit f ∈ C 1 (D).

Versieht man L(Rn , X) mit der Abbildungsnorm (Rn versehen mit k.k∞ und X mit
k.k), so ist die Abbildung d f : D ⊆ Rn → L(Rn , X), x 7→ d f (x) stetig.

Für festes x ∈ D gilt

f (x + z) = f (x) + d f (x)z + kzk∞ ǫ(z), (10.6)

wenn x + z ∈ D \ {x}, mit einer Funktion3 ǫ : (D \ {x} − x) → X, sodass


limz→0 ǫ(z) = 0.

Beweis.

Für x, y ∈ gilt

kd f (x) − d f (y)k = sup kd f (x)v − d f (y)vk =


kvk∞ ≤1

Xn Xn ∂ f
∂f
sup α j (d f (x)e j − d f (y)e j ) ≤ (x) − (y) .

|α1 |,...,|αn |≤1 j=1
j=1 ∂x j ∂x j

Wegen der vorausgesetzten Stetigkeit der partiellen Ableitungen folgt


d f (y) → d f (x) für y → x.

Wir setzen (x ∈ D und z , 0, sodass x + z ∈ D)


1
ǫ(z) := ( f (x + z) − f (x) − d f (x)z) .
kzk∞
3 Man beachte, dass D \ {x} − x eine Menge der Bauart U δ (0) \ {0} enthält.
74 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

Ist ρ > 0, sodass Uρ (x) = x + Uρ (0) ⊆ D und kzk < ρ, so ist ǫ(z) definiert, und
wir haben wegen (10.3) mit t = 0, s = kzk∞ , v = (α1 , . . . , αn )T := kzkz ∞ , wobei
offensichlich max j=1,...,n |α j | = kvk∞ = 1,
Z !
X n
1 sαi ∂ f ∂f
kǫ(z)k = (x + svi−1 + τei ) − (x) dτ ≤
i=1 s 0 ∂xi ∂xi

X
n
∂f ∂f
|αi | sup (x + svi−1 + τei ) − (x) ≤
i=1 τ∈[0,sαi ] ∂x i ∂x i

X
n
sup ∂ f (x + y) − ∂ f (x) .
∂xi
i=1 kyk∞ ≤kzk∞ ∂xi

Dieser Ausdruck konvergiert wegen der Stetigkeit der partiellen Ableitungen für
z → 0 gegen 0.


10.1.11 Bemerkung. Wir sehen also, dass sich f lokal bei x durch die affine Abbildung
x + z 7→ f (x) + d f (x)z approximieren lässt, wobei der Fehler mit kzk∞ ǫ(z) verhält-
nismäßig klein ist.

Ist X = Rm und stellt man sich f (D) als n-dimensionale Fläche im Rm vor, so ist
deshalb der affine Teilraum

{ f (x) + d f (x)z : z ∈ Rn }

der Anschauung nach gerade die Tangentialebene an f (D) im Punkt f (x).


Aus (10.6) erhält man sofort:

10.1.12 Korollar. Ist f ∈ C 1 auf der offenen Menge D, so ist f stetig auf D.
∂f
10.1.13 Bemerkung. Man kann die Voraussetzung der Stetigkeit der ∂x i
in Korollar
10.1.12 zwar etwas abschwächen aber nicht gänzlich weglassen. Z.B. hat die Funktion
aus Beispiel 9.1.9 Richtungsableitungen bei 0 in allen Richtungen, ist aber selbst bei 0
unstetig.
Man kann auch umgekehrt folgendermaßen starten.

10.1.14 Definition. Sei f : D ⊆ Rn → X und x ∈ D. Gibt es ein d f (x) ∈ L(Rn , X),


sodass (10.6) mit einer X-wertigen Funktion ǫ definiert auf Uρ (0) \ {0} für ein gewis-
ses ρ > 0, mit x + Uρ (0) ⊆ D, sodass limz→0 ǫ(z) = 0 erfüllt ist, so heißt f bei x
differenzierbar.
f heißt stetig differenzierbar, wenn f bei allen x ∈ D differenzierbar ist, und wenn
x 7→ d f (x) stetig auf D ist.

10.1.15 Fakta.

1. Wir haben oben gesehen, dass jede stetig partiell differenzierbaren Funktion ste-
tig differenzierbar ist.
10.1. PARTIELLE ABLEITUNGEN 75

2. Ist f bei x differenzierbar, so existieren wegen (0 , v ∈ R p , s ∈ R, sv ∈ Uρ (0))

f (x + sv) − f (x) s→0


= d f (x)v + sgn(s)kvk∞ ǫ(sv) −→ d f (x)v,
s
auch alle Richtungsableitungen, insbesondere alle partiellen Ableitungen, wobei
∂f
∂v (x) = d f (x)v.
Man sieht damit auch, dass d f (x) eindeutig durch f bestimmt ist, es also kein
weiters d̃ f (x) ∈ L(Rn , X) mit d̃ f (x) , d f (x) geben kann, das auch (10.6) erfüllt.

3. Ist f stetig differenzierbar, so sind auch die partiellen Ableitungen stetig, da ja



∂ f (x) − ∂ f (y) = kd f (x)e − d f (y)e k ≤ kd f (x) − d f (y)k · ke k .
∂xi ∂xi
i i i ∞

Somit folgt aus stetig differenzierbar die Eigenschaft stetig partiell differenzier-
bar.

Wir haben somit folgenden Satz bewiesen.

10.1.16 Satz. Eine Funktion f : D ⊆ Rn → X ist genau dann stetig differenzierbar,


wenn sie stetig partiell differenzierbar ist.

10.1.17 Bemerkung. Wenn X mit einer zweiten, zu k.k äquivalenten Norm versehen ist,
bleiben die partiellen Ableitungen und die Ableitung unverändert.

10.1.18 Proposition. Sei D ⊆ Rn offen. Sind f, g : D → X zwei stetig differenzierbare


Funktionen und λ, µ ∈ R, so ist es auch λ f + µg und es gilt für alle x ∈ D

d(λ f + µg)(x) = λd( f )(x) + µdg(x).

Beweis. Der Beweis folgt unmittelbar durch eine entsprechende Linearkombination


der Gleichungen
f (x + z) = f (x) + d f (x)z + kzk∞ ǫ(z)

und
g(x + z) = g(x) + dg(x)z + kzk∞ ǫ̃(z).


Wie im Eindimensionalen lassen sich auch im Mehrdimensionalen viele Funktio-
nen als Zusammenstzung von einfacheren Funktionen schreiben. Zur Berechnung der
Ableitung dient dann folgender Satz, der die bekannte Kettenregel verallgemeinert.

10.1.19 Proposition (Kettenregel). Seien f : D̃ ⊆ Rm → X, und sei g : D ⊆ Rn → Rm


stetig differenzierbar, sodass g(D) ⊆ D̃. Hierbei seien Rm und Rn mit k.k∞ versehen.
Dann ist auch f ◦ g : D ⊆ Rn → X stetig differenzierbar, und es gilt für x ∈ D

d( f ◦ g)(x) = d f g(x) dg(x),

wobei die rechte Seite ein Hintereinanderausführen von linearen Abbildungen ist.
76 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

Beweis. Laut Voraussetzung haben wir für a, a + b ∈ D̃, b , 0 gemäß (10.6)

f (a + b) = f (a) + d f (a)b + kbk∞ ǫ̃(b),

und falls x, x + z ∈ D, z , 0

g(x + z) = g(x) + dg(x)z + kzk∞ ǫ(z).

Wegen limb→0 ǫ̃(b) = 0 und limz→0 ǫ(z) = 0 können wir durch ǫ(0) = 0 und ǫ̃(0) = 0
diese beiden Funktion so fortsetzen, dass sie bei z = 0 bzw. b = 0 stetig sind.
Ist nun a = g(x) und b so, dass a + b = g(x + z), so folgt aus der ersten Gleichung
und durch Einsetzen der zweiten

f g(x + z) =
  
f g(x) + d f g(x) g(x + z) − g(x) + kg(x + z) − g(x)k∞ ǫ̃(g(x + z) − g(x)) =

  
f g(x) + d f g(x) dg(x)z + kzk∞ ǫ(z) +

dg(x)z + kzk∞ ǫ(z) ∞ ǫ̃ g(x + z) − g(x) =
 
f g(x) + d f g(x) dg(x)z + kzk∞ γ(z),
wobei
 1
γ(z) = d f g(x) (ǫ(z)) + kdg(x)( z) + ǫ(z)k∞ ǫ̃(g(x + z) − g(x)).
kzk∞
Wir haben

kγ(z)k ≤ kd f (g(x))k · kǫ(z)k∞ + (kdg(x)k + kǫ(z)k∞ ) kǫ̃(g(x + z) − g(x))k.

Wegen ǫ̃(0) = 0 und der Stetigkeit von ǫ̃ bei 0 folgt aus limz→0 (g(x+z) −g(x)) = 0, dass
limz→0 ǫ̃(g(x + z) − g(x)) = 0 (vgl. Proposition 6.1.4), und somit auch γ(z) → 0, z → 0.
Wir haben also d( f ◦ g)(x) = d f (g(x))dg(x) gezeigt. Um mit Hilfe von Satz
10.1.16 sicher zu gehen, dass f ◦ g ∈ C 1 , brauchen wir noch die Stetigkeit von
x 7→ d f (g(x))dg(x). Diese folgt aber aus Korollar 9.2.8.

10.1.20 Bemerkung. Hat man n = 1 in Proposition 10.1.19, dh. D ⊆ R, so gilt dg(t) = g′ (t), wenn man g′ (t) mit der linearen
Abbildung ξ 7→ ξ · g′ (t) aus L(R, Rm ) identifiziert, siehe Fakta 10.1.8, 1. Entsprechendes gilt für ( f ◦ g)′ (t). Also liest sich
die Kettenregel in dem Fall als 
( f ◦ g)′ (t) = d f g(t) g′ (t), t ∈ D. (10.7)
Wir nehmen im Fall n = 1 nun sogar an, dass g ∈ C1 (I) für irgendein Intervall I ⊆ R mit g(I) ⊆ D̃. Dann gilt (10.7) sogar
für in I enthaltene Randpunkte t von I.
Dazu setze man g auf ein etwas größeres Intervall J := I ∪ (t − ǫ, t + ǫ) durch g(s) := (s − t)g′ (t) + g(t) für s ∈ J \ I
fort. Man überprüft unmittelbar, dass g ∈ C1 (J), und dass für eine hinreichend kleine Wahl von ǫ > 0 auch g(J) ⊆ D̃. Die
Kettenregel angewandt auf g|(t−ǫ,t+ǫ) ergibt dann (10.7).

10.1.21 Beispiel. Als Beispiel wollen wir sogenannte Parameterintegrale betrachten.


Sei h : (a, b) × (c, d) → X stetig und so, dass die Ableitung nach der ersten Variablen
für alle (s, t) ∈ (a, b) × (c, d) existiert, und dass

h1 (s, t) = h(s, t),
∂s
10.1. PARTIELLE ABLEITUNGEN 77

ebenfalls stetig ist. Weiters seien α, β : (a, b) → (c, d) zwei stetig differenzierbare
Funktionen. Wir wollen die Ableitung der Funktion
Z β(s)
I(s) := h(s, t) dt
α(s)

berechnen. Dazu wenden wir die eben gewonnene Kettenregel auf


Z η
f : (c, d) × (c, d) × (a, b) ⊆ R3 → X, (ξ, η, ζ)T 7→ h(ζ, t) dt
ξ

und
g : (a, b) ⊆ R → R3 , s 7→ (α(s), β(s), s)T
an. Die partiellen Ableitungen von f sind nach dem Hauptsatz und nach Korollar 8.7.11
stetig, und die Matrixdarstellung von d f (x) ist (x = (ξ, η, ζ)T )
∂f Z η
∂f ∂f  ∂h
d f (x) = (x), (x), (x) = (−h(ζ, ξ), h(ζ, η), (ζ, t) dt).
∂ξ ∂η ∂ζ ξ ∂ζ

Auch dg(s) = (α′ (s), β′ (s), 1)T ist stetig, und die Kettenregel ergibt

d( f ◦ g)(s) = d f (g(s))dg(s) =
 
 R β(s)  α′ (s)
∂h 
 β′ (s)  =
−h(s, α(s)) h(s, β(s)) α(s) ∂s (s, t) dt   
1
 Z β(s)   
∂h
h(s, β(s))β′ (s) − h(s, α(s))α′ (s) + (s, t) dt = I ′ (s) .
α(s) ∂s
Siehe Fakta 10.1.8, 1.

10.1.22 Lemma. Sei D ⊆ Rn offen und f : D → X stetig differenzierbar. Sind mit x, y


auch alle Punkte auf ihrer Verbindungsgeraden in D, also tx + (1 − t)y ∈ D, t ∈ [0, 1],
so folgt
k f (x) − f (y)k ≤ max kd f (tx + (1 − t)y)k · kx − yk∞ .
t∈[0,1]

Beweis. Wegen der Stetigkeit von t 7→ tx + (1 − t)y ist das Bild der kompakten Men-
ge [0, 1] ebenfalls kompakt. Somit hat die stetige Funktion z 7→ kd f (z)k darauf ein
Maximum.
Die Funktion g(t) := f (x + t(y − x)) ist nach Lemma 10.1.4 stetig differenzierbar
mit g′ (t) = d f (x + t(y − x))(y − x). Nach dem Hauptsatz (9.13) gilt
Z 1

k f (y) − f (x)k = kg(1) − g(0)k = d f (x + t(y − x))(y − x) dt ≤
0

sup kd f (x + t(y − x))(y − x)k ≤ max kd f (x + t(y − x))k · ky − xk∞ .


t∈[0,1] t∈[0,1]


78 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

10.1.23 Bemerkung. Teilmengen A von Vektorräumen Y (über R oder C) heißen kon-


vex, falls für alle x, y ∈ A folgt, dass auch alle Punkte auf ihrer Verbindungsgeraden in
D liegen, also tx + (1 − t)y ∈ D, t ∈ [0, 1].
Ist Y sogar mit einer Norm k.k versehen und ist A = Uǫ (z) oder A = Kǫ (z) die
offene bzw. abgeschlossene Kugel vom Radius ǫ, so ist A konvex, denn aus den aus
den Ungleichungen kz − xk, kz − yk < (≤)ǫ folgt

kz − (tx + (1 − t)y)k = kt(z − x) + (1 − t)(z − y)k ≤


tkz − xk + (1 − t)kz − yk < (≤) tǫ + (1 − t)ǫ = ǫ.

Aus Lemma 10.1.22 folgt unmittelbar


10.1.24 Korollar. Gilt mit der Notation aus Lemma 10.1.22 die Ungleichung
kd f (x)k ≤ C für alle x ∈ M, wobei M ⊆ D konvex ist, so gilt

k f (x) − f (y)k ≤ Ckx − yk∞ , x, y ∈ M.

Insbesondere ist dann f auf M gleichmäßig stetig.


10.1.25 Bemerkung. Man kann auch Funktionen f : D → X betrachten, wo D offene
Teilmenge eines allgemeinen Banachraumes Y ist, und sich fragen, ob und in welcher
Hinsicht f differenzierbar ist.
Es stellt sich heraus, dass der Zugang aus Definition 10.1.14 der zweckmäßigste
ist. Man spricht dann von der sogenannten Fréchet-Differenzierbarkeit. Mit fast den
selben Beweisen wie hier angegeben bleiben alle Behauptungen ab Definition 10.1.14
bis zum Ende dieses Abschnitt und darüber hinaus auch der Hauptsatz über implizite
Funktionen und der Umkehrsatz aus den beiden folgenden Kapiteln richtig.
Eine Ausnahme stellt Satz 10.1.16 dar. Es gilt nur, dass aus der Differenzierbarkeit
folgt, dass alle Richtungsableitungen existieren. Die Umkehreung gilt nicht, da es in
dieser allgemeinen Situation kein Analogon zu Lemma 10.1.4 gibt.

10.2 Hauptsatz über implizite Funktionen


In diesem Kapitel betrachten wir nur Banachräume X der Form Rn .
10.2.1 Bemerkung. Erfüllt eine stetig differenzierbare Funktion η(ξ) eine Beziehung
der Gestalt
g(ξ, η(ξ)) = 0, (10.8)
mit einer Funktion g : D ⊆ R2 → R, g ∈ C 1 , so kann man mittels der Kettenregel
die Ableitung von η(ξ) ausrechnen: Setzt man f1 (t) := t, f2 (t) := η(t) und f (t) :=
( f1 (t), f2 (t))T ∈ R2 , so besagt (10.8) h(t) := g( f (t)) = 0. Also ist auch die Ableitung
h′ (t) stets gleich Null. Nach der Kettenregel gilt daher
∂g ∂g
0 = h′ (t) = (ξ, η(ξ)) · 1 + (ξ, η(ξ)) · η′ (ξ).
∂x1 ∂x2
∂g
Im Fall ∂x 2
(ξ, η(ξ)) , 0 kann man aus dieser Gleichung η′ (ξ) ausrechnen. Wir werden
später sehen (vgl. Satz 10.2.4), dass diese Bedingung gerade bedeutet, dass die Funk-
tion η an der Stelle ξ durch die Beziehung (10.8), also durch die implizite Gleichung
g(ξ, η(ξ)) = 0 sicher wohldefiniert ist. Man spricht von der Ermittlung von η′ (ξ) durch
implizites Differenzieren.
10.2. HAUPTSATZ ÜBER IMPLIZITE FUNKTIONEN 79

10.2.2 Beispiel. Betrachte die Gleichung g(ξ1 , ξ2 )T = 0 wobei


(
R2 → R
g: .
x = (ξ1 , ξ2 )T 7→ ξ12 + ξ22 − 1

Ist durch die implizite Gleichung g(ξ, η(ξ))T = 0 eine Funktion η(ξ) wohldefiniert?
Nein, denn stets erfüllt ja mit einer Zahl η(ξ) auch −η(ξ) diese Beziehung. Man sieht

ξ 
0
η0 η(.)

ξ0

ξ 
g η =0

Abbildung 10.2: Lokale Darstellbarkeit von g(ξ, η)T = 0 als Funktion η(ξ)

jedoch, dass, solange ξ0 , ±1 ist, zumindest lokal um ξ0 eine stetige (und differen-
zierbare) Funktion η(.) mit g(ξ, η(ξ)) = 0 definiert ist, wenn man sich nur im Punkt ξ0
selbst auf einen der beiden möglichen Werte η0 bzw. −η0 festlegt. Die Ableitung dieser
Funktion η lässt sich nun durch implizites Differenzieren ermitteln:

d ∂g ∂g
0= g(ξ, η(ξ)) = (ξ, η(ξ)) · 1 + (ξ, η(ξ)) · η′ (ξ) = 2ξ + 2η(ξ)η′ (ξ),
dξ ∂x1 ∂x2
ξ
also η′ (ξ) = − η(ξ) . Beachte, dass wegen ξ0 , ±1 die Funktion η(ξ) lokal bei ξ0 ungleich
0 ist.

Wie wir eben gesehen haben, ist es in keinster Weise klar, ob durch eine implizite
Gleichung g(ξ, η(ξ)) = 0 nun tatsächlich eine Funktion definiert ist. Man sieht in die-
∂g
sem Beispiel auch, dass die Bedingung ∂x 2
(ξ0 , η0 ) , 0 eine wesentliche Bedeutung für
die Auflösbarkeit der Gleichung g(ξ, η) = 0 nach η zu haben scheint. Der in diesem
Abschnitt bewiesene Hauptsatz über implizite Funktionen (Satz 10.2.4) gibt die exakte
und allgemein formulierte Bestätigung dieser Beobachtung.
Doch zunächst benötigen wir den Banachschen Fixpunktsatz. 4

10.2.3 Satz. Sei (M, d) ein vollständiger metrischer Raum. Weiters sei T : M → M
eine Abbildung, die
d(T x, T y) ≤ q · d(x, y), x, y ∈ M,
mit einem festen 0 ≤ q < 1 erfüllt.
4 Stefan Banach, geb. 30.3.1892 Krakow, gest.31.8.1945 Lwow (Lemberg)
80 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

Dann hat die Fixpunktgleichung x = T x genau eine Lösung z in M. Ist y0 ∈ M, und


definiert man yn := T n y0 , so konvergiert yn gegen z mit

qn
d(yn , z) ≤ d(y1 , y0 ).
1−q

Beweis. Zunächst folgt aus der Voraussetzung unmittelbar, dass T : M → M


gleichmäßig stetig ist, denn aus d(x, y) < ǫ folgt d(T x, T y) ≤ qd(x, y) < qǫ < ǫ.
Sind z1 , z2 Fixpunkte von T , also T z1 = z1 , T z2 = z2 , so folgt d(z1 , z2 ) =
d(T z1 , T z2 ) ≤ qd(z1 , z2 ). Wegen 0 ≤ q < 1 ist das nur für d(z1 , z2 ) = 0 möglich.
Also kann es höchstens einen Fixpunkt geben.
Mittels Induktion zeigt man die Ungleichung

d(yn , yn+1 ) ≤ qn d(y0 , y1 ), (10.9)

denn für n = 0, ist sie klar, und der Induktionsschritt folgt aus d(yn+1 , yn+2 ) =
d(T yn , T yn+1 ) ≤ q d(yn , yn+1 ) ≤ qn+1 d(y0 , y1 ).
Sei nun n ≤ m gegeben. Dann folgt

d(yn , ym ) ≤ d(yn , yn+1 ) + . . . + d(ym−1 , ym ) ≤

qn
≤ (qn + . . . + qm−1 ) d(y0 , y1 ) ≤ d(y0 , y1 ),
1−q
P
da ja wegen 0 ≤ q < 1 die geometrische Reihe ∞ k
k=0 q konvergiert. Also ist die Folge
(yn )n∈N eine Cauchy-Folge, und es existiert der Grenzwert z := limn→∞ yn . Dass z ein
Fixpunkt ist, folgt wegen der Stetigkeit von T aus

T z = lim T yn = lim yn+1 = z.


n→∞ n→∞


Neben dem nun folgenden Hauptsatz über implizite Funktionen findet der Banach-
sche Fixpunktsatz auch Anwendung in der Theorie der Differentialgleichungen.

Die Ausgangssituation beim Hauptsatz über implizite Funktionen ist die, dass man
eine stetig differenzierbare Funktion F : D → Rm mit einer offenen Menge D ⊆ Rn+m
hat. Wir schreiben die Elemente von Rn+m als (x, y), wobei x ∈ Rn , y ∈ Rm .
Für (x, y) ∈ D schreiben wir dF(x, y) ∈ L(Rn+m , Rm ) als m × (n + m) Matrix. Nun
nehmen wir die ersten n Spalten und fassen sie zur Matrix dF1 (x, y) zusammen. Ent-
sprechend seien dF2 (x, y) die letzten m Spalten. Man hat also dF(x, y) =
 ∂F1 ∂F1 ∂F1 ∂F1
 ∂x1 (x, y) ··· ∂xn (x, y) ∂xn+1 (x, y) ··· 
∂xn+m (x, y)
 
 .. .. .. .. 
 . . . . 
 ∂Fm ∂Fm ∂Fm ∂Fm 
∂x1 (x, y) · · · ∂xn (x, y) (x, y) · · · (x, y)
| {z } | ∂xn+1 {z ∂xn+m }
=dF1 (x,y) =dF2 (x,y)

Mit dF(x, y) sind klarerweise auch dF1 (x, y) und dF2 (x, y) stetig in (x, y).
Ist y fest, so ist x 7→ dF1 (x, y) ∈ Rm×n nichts anderes, als die Ableitung der Funktion
x 7→ F(x, y) als Funktion von x. Entsprechendes gilt für y 7→ dF2 (x, y) ∈ Rm×m .
10.2. HAUPTSATZ ÜBER IMPLIZITE FUNKTIONEN 81

10.2.4 Satz (Hauptsatz über implizite Funktionen5). Sei D ⊆ Rn+m offen, und sei F :
D → Rm , F ∈ C 1 . Weiters sei (a, b) ∈ D, sodass F(a, b) = 0 und sodass dF2 (a, b)
invertierbar ist, d.h. !m
∂Fi
det (a, b) , 0.
∂xn+ j i, j=1

(i) Dann existieren offene Kugeln U = Uδ (a) ⊆ Rn um a und V = Uρ (b) ⊆ Rm um b


mit U × V ⊆ D, sowie eine stetige Funktion g : U → V, sodass

F x, g(x) = 0, x ∈ U. (10.10)

(ii) Die Funktion g löst die Gleichung F(x, y) = 0, x ∈ U, y ∈ V, vollständig in dem


Sinn, dass, wenn (x, y) ∈ U × V mit F(x, y) = 0, immer y = g(x) gelten muss.
Insbesondere ist b = g(a).

(iii) Die Funktion g hat in a partielle Ableitungen ( j = 1, . . . , n)

∂g  ∂F 
(a) = −dF2 a, g(a) −1 a, g(a) .
∂x j ∂x j

(iv) dF2 u, v für alle (u, v) ∈ U × V invertierbar ist; die Funktion g ist auf U stetig
differenzierbar und es gilt
−1 
dg(x) = −dF2 x, g(x) dF1 x, g(x) .

Beweis.

(i) Sei B = dF2 (a, b). Die gesuchte Funktion soll (10.10) erfüllen. Man kann das als
Fixpunktgleichung anschreiben:

g(x) − B−1 F x, g(x) = g(x). (10.11)

Um die Existenz und die Eindeutigkeit herzuleiten, werden wir den Banachschen
Fixpunktsatz bemühen.
Dazu sei ρ > 0 so klein, dass Uρ (a, b) ⊆ D (bzgl. k.k∞ ) und dass

1
kB − dF2 (x, y)k ≤ , (x, y) ∈ Uρ (a, b). (10.12)
2kB−1 k

Das ist möglich wegen der Stetigkeit von (x, y) 7→ dF2 (x, y) bei (a, b)6. Nun
wählen wir δ > 0, δ ≤ ρ so, dass
ρ
kF(x, b)k∞ ≤ , x ∈ Uδ (a), (10.13)
4kB−1 k
und setzen U := Uδ (a), V := Uρ (b).
Sei h0 : U → Rm die identische Funktion x 7→ b. Nun betrachten wir die ab-
geschlossene Kugel K 2ρ (h0 ) =: M um h0 mit Radius ρ2 in dem Banachraum
C(U, Rm ) (versehen mit der Supremumsnorm k| f k| := sup x∈U k f (x)k∞ ), welche
5
Oft auch zitiert als “Implicit function theorem“
6 Wir wissen übrigens aus Korollar 9.3.3, dass für diese (x, y) auch die Matrix dF2 (x, y) invertierbar ist.
82 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

für sich selbst versehen mit d(h1 , h2 ) := k|h1 − h2 k| ein vollständig metrischer
Raum ist.

Für h ∈ M und x ∈ U gilt kh(x) − bk∞ ≤ k|h − h0 k| ≤ 2ρ und daher x, h(x) ∈
Uρ (a, b) ⊆ D. Also können wir definieren

T (h)(x) := h(x) − B−1 F x, h(x) .

Als Zusammensetzung von stetigen Funktionen ist T (h) stetig. Wir werden zei-
gen, dass T (h) wieder in M liegt, und dass k|T (h1 ) − T (h2 )k| ≤ 12 k|h1 − h2 k|.
Dazu betrachte für ein festes x ∈ Uδ (a) die Funktion

Ψ x : Uρ (b) → Rm , y 7→ y − B−1 F(x, y).

Man beachte, dass Uδ (a) × Uρ (b) ⊆ Uρ (a, b) ⊆ Rn+m .


Also gilt dΨ x (y) = I − B−1 dF2 (x, y), und wegen (10.12)
1
kdΨ x (y)k ≤ kB−1 k · kB − dF2 (x, y)k ≤ .
2
Nach Korollar 10.1.24 ist daher (y, z ∈ Uρ (b))
1
kΨ x (y) − Ψ x (z)k∞ ≤ ky − zk∞ . (10.14)
2
Da x ∈ Uδ (a) beliebig war, folgt für solche Vektoren und h1 , h2 ∈ M
  kh1 (x) − h2 (x)k∞
kT (h1 )(x) − T (h2 )(x)k∞ = kΨ x h1 (x) − Ψ x h2 (x) k∞ ≤ .
2
Daraus und aus (10.13) folgt insbesondere (h ∈ M)

kT (h)(x) − h0 (x)k∞ ≤ kT (h)(x) − T (h0 )(x)k∞ + kT (h0 )(x) − h0 (x)k∞ ≤


ρ ρ
≤ + kB−1 F(x, b)k∞ ≤ .
4 2
Wir sehen, dass T (h) beschränkt ist, und dass T (h) ∈ K 2ρ (h0 ) = M.
Nach dem Banachschen Fixpunktsatz gibt es eine eindeutige Funktion g ∈ M,

die (10.11) und damit F x, g(x) = 0 erfüllt.
(ii) Ist (x, y) ∈ U × V, und gilt F(x, y) = 0, so folgt Ψ x (y) = y − B−1 F(x, y) = y und

klarerweise auch Ψ x g(x) = g(x). Wegen (10.14) sieht man
 1
kg(x) − yk∞ = kΨ x (y) − Ψ x g(x) k∞ ≤ kg(x) − yk∞ ,
2
also y = g(x). Insbesondere gilt g(a) = b.
(iii) Für x ∈ Uδ (a) wollen wir nochmals die Funktion Ψ x : Uρ (b) → Rm definiert
durch Ψ x (y) = y − B−1 F(x, y) bemühen. Ihre Ableitung

dΨ x (y) = I − B−1 dF2 (x, y) = B−1 B − dF2 (x, y)

ist stetig in (x, y). Für 0 < η < 1 setzen wir

ψ(η) = sup kdΨ x (y)k.


x∈Kδη (a),y∈Kρη (b)
10.2. HAUPTSATZ ÜBER IMPLIZITE FUNKTIONEN 83

Wegen der Stetigkeit und weil B = dF2 (a, b), strebt ψ(η) gegen Null, wenn η → 0.
Da Kρη (b) eine konvexe Teilmenge von Rm ist, folgt aus Korollar 10.1.24, dass
(y, z ∈ Kρη (b), x ∈ Kδη (a))

kΨ x (y) − Ψ x (z)k∞ ≤ ψ(η) ky − zk∞ . (10.15)

Für kzk∞ < δ gilt wegen F(a, g(a)) = F(a + z, g(a + z)) = 0

g(a + z) − g(a) = (10.16)


 
g(a + z) − B−1 F(a + z, g(a + z)) − g(a) − B−1 F(a + z, g(a)) −

B−1 F(a + z, g(a)) − F(a, g(a)) =

Ψa+z (g(a + z)) − Ψa+z (g(a)) − B−1 dF1 (a, g(a))z + kzk∞ ǫ1 (z)
mit einer Funktion ǫ1 : (U \ {a}) − a → Rm , sodass limz→0 ǫ1 (z) = 0, wobei hier
verwendet wurde, dass F in der ersten Variablen bei (a, b) differenzierbar ist, vgl.
(10.6). Aus (10.15) folgt
kg(a + z) − g(a)k∞ ≤

1 1 
ψ max( kzk∞ , kg(a + z) − g(a)k∞) kg(a + z) − g(a)k∞+
δ ρ
| {z }
=:β(z)

kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )kzk∞

bzw.
kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )
kg(a + z) − g(a)k∞ ≤ kzk∞ ,
1 − β(z)
wobei limz→0 β(z) = 0. Addieren wir zu (10.16) den Ausdruck B−1 dF1 (a, g(a))z,
so folgt wieder aus (10.15)

kg(a + z) − g(a) + B−1dF1 (a, b)k∞ ≤ β(z)kg(a + z) − g(a)k∞ + kB−1 k kǫ1 (z)k∞ kzk∞ ≤
!
β(z)kB−1 k(kdF1 (a, g(a))k + kǫ1 (z)k∞ )
+ kB−1 k kǫ1 (z)k∞ kzk∞ .
1 − β(z)
Da für z → 0 der Klammerausdruck gegen Null strebt, erhalten wir die Dif-
ferenzierbarkeit von g bei a mit der Ableitung dg(a) = −B−1 dF1 (a, b) =
dF2 (a, b)−1dF1 (a, b).
(iv) Der letzte Punkt folgt ganz leicht, wenn man das schon Bewiesene nochmals
betrachtet. Ist a′ ∈ U, so sei b′ = g(a′ ).
Wir haben schon in einer Fußnote gesehen, dass dF2 (a′ , b′ ) invertierbar ist. Also
können wir das schon Bewiesene auf (a′ , b′ ) ∈ U × V anwenden, und erhalten
eine Kugel U ′ ⊆ U um a′ und eine Kugel V ′ ⊆ V um b′ , sowie eine Funktion

g′ : U ′ → V ′ mit g′ (a′ ) = b′ und F x, g′ (x) = 0, x ∈ U ′ .
Nach (ii) muss g′ (x) = g(x), x ∈ U ′ gelten, und nach (iii) ist
 
dg(a′ ) = dg′ (a′ ) = −dF2 a′ , g(a′ ) −1 dF1 a′ , g(a′ ) .

Die rechte Seite ist nach Korollar 9.3.3 aber stetig in a′ . Also ist g stetig differen-
zierbar und die Ableitung lässt sich wie behauptet berechnen.
84 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

10.2.5 Beispiel. Wir betrachten die Funktion f : R3 → R, definiert als

f (ζ1 , ζ2 , ζ3 )T := c1 ζ12 + c2 ζ22 + c3 ζ32 − 1,

wobei c1 , c2 , c3 > 0 vorgegeben sind, und untersuchen die Lösungen der Gleichung
f (ζ1 , ζ2 , ζ3 )T = 0. Die Nullstellenmenge F := {z ∈ R3 : f (z) = 0} von f bildet in
diesem Beispiel offenbar ein Ellipsoid. Sei α = (α1 , α2 , α3 )T eine Lösung von f (z) =
0. Wir wollen die Gleichung f (ζ1 , ζ2 , ζ3 )T = 0 lokal bei α nach ζ3 auflösen. Anders
ausgedrückt, wir fragen ob, man die durch die implizite Gleichung f (z) = 0 gegebene
Fläche F lokal um den Punkt α welcher auf ihr liegt, in der expliziten Form ζ3 =
g(ζ1 , ζ2 )T darstellen kann. Dazu wenden wir den Hauptsatz über implizite Funktionen
an, und zwar mit der folgenden Rollenvergabe: m = 1, n = 2, y = ζ3 , x = (ζ1 , ζ2 )T ,
b = α3 , a = (α1 , α2 )T . Die Voraussetzung f ∈ C 1 ist in unserem Fall klarerweise erfüllt,
f ist ja ein Polynom.  ∂ f Die entscheidende Funktionaldeterminante ist die Determinante
der 1 × 1-Matrix ∂ζ 3
(α) , also

∂f
(α) = 2c3 α3 .
∂ζ3

Liegt der Punkt α nicht am Äquator des Ellipsoids, d.h. ist α3 , 0, so existiert ei-
ne offene Umgebung U ⊆ R2 von (α1 , α2 )T und eine C 1 -Funktion g : U → R mit
g(α1 , α2 )T = α3 und f (ζ1 , ζ2 , g(ζ1 , ζ2 )T )T = 0 für alle (ζ1 , ζ2 )T ∈ U. Liegt α dagegen
am Äquator, so können wir den Hauptsatz nicht anwenden. Tatsächlich ist in solchen
Punkten ein Auflösen nach ζ3 auch nicht möglich. Wir bemerken einen Unterschied

ξ3

 
α1 
 
α2 
U
ξ2
0

ξ1

Abbildung 10.3: Darstellung eines Teils von F als Graph einer Funktion g(ζ1 , ζ2 )T

zwischen der impliziten und expliziten Darstellung der Fläche F . Die implizite Glei-
chung f (z) = 0 definiert die Fläche global, d.h. in ihrer Gesamtheit. Eine explizite
Darstellung, z.B. in der Form ζ3 = g(ζ1 , ζ2 )T ist nur lokal, d.h. für gewisse Teilstücke
10.2. HAUPTSATZ ÜBER IMPLIZITE FUNKTIONEN 85

der Fläche möglich, und nicht einmal um beliebige Punkte der Fläche (beim Äquator
geht’s ja nicht). Eine explizite Darstellung hat also den Nachteil immer nur auf klei-
nen Teilen zu funktionieren und Punkten die geometrisch gar nicht ausgezeichnet sind
(Äquator) einen anderen Stellenwert zu verleihen als allen anderen. Natürlich hat sie
dem gegenüber den Vorteil, dass man mit einer expliziten Darstellung besser rechnen
kann.
In unserem Beispiel kann man für jeden Punkt α ∈ F lokal nach zumindestens
einer Variablen ζ1 , ζ2 oder ζ3 auflösen. In der Tat ist einer der Werte α1 , α2 , α3 si-
cher nicht Null. Löst man z.B. nach ζ2 auf, so erhält man eine Funktion ĝ, sodass
f (ζ1 , ĝ(ζ1 , ζ3 )T , ζ3 )T = 0 für (ζ1 , ζ3 ) lokal um (α1 , α3 ). Man hat also sicher lokal um
jeden Punkt α ∈ F eine Parameterdarstellung der Form: entweder ζ1 = t, ζ2 = u, ζ3 =
g(t, u)T oder ζ1 = t, ζ3 = u, ζ2 = ĝ(t, u)T oder auch ζ2 = t, ζ3 = u, ζ1 = g̃(t, u)T . Will
man F global erfassen, so hat man die Gesamtheit aller dieser lokalen Ausschnitte zu
betrachten (wie man in einem Weltatlas, um die gesamte Erde zu sehen, die Karten von
allen Ländern und Meeren anschauen muss).

ξ3
h U

ξ2
h̃ ĥ



ξ1

Abbildung 10.4: Darstellung von F durch verschiedene Karten

( (
U ⊆ R2 → R3 Û ⊆ R2 → R3
h: , ĥ : ,
(t, u)T 7→ (t, u, g(t, u)T )T (t, u)T 7→ (t, ĝ(t, u)T , u)T
(
Ũ ⊆ R2 → R3
h̃ : .
(t, u)T 7→ (g̃(t, u)T , t, u)T
In unserem Beispiel kann man das gesamte Ellipsoid F beschreiben durch die sechs
Teilstücke “obere Hälfte“, “untere Hälfte“, “rechte/linke/vordere/hintere Hälfte“. Auf
diesen hat man die expliziten Darstellungen
q
(ζ1 , ζ2 )T 7→ + 1 − aζ12 − bζ22 , obere Hälfte
q
(ζ1 , ζ2 )T 7→ − 1 − aζ12 − bζ22 , untere Hälfte
86 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
q
(ζ2 , ζ3 )T 7→ + 1 − bζ22 − cζ32 , rechte Hälfte

usw. . Solche Teilmengen, die lokal derart beschrieben werden können werden als zwei-
dimensionale Mannigfaltigkeiten im R3 bezeichnet. Diese werden in der Analysis 3
Vorlesung ausführlicher behandelt werden.

10.3 Der Umkehrsatz


Sei f : Rn → Rn eine affine Abbildung der Form
    
y1  c11 ··· c1n  u1 
    
f (u) =  ...  +  ... ..   ..  .
.   . 
    
yn cn1 ··· cnn un

Die affine Abbildung f ist genau dann injektiv (und damit aus Dimensionsgründen
bijektiv), wenn det(ci j )ni, j=1 , 0. In diesem Fall existiert die Inverse f −1 von f oder,
anders ausgedrückt, die Gleichung f (u) = v lässt sich in eindeutiger Weise nach v
auflösen.
Die affine Abbildung f ist stetig differenzierbar mit d f (u) = (ci j )ni, j=1 . Ausschlagge-
bend für die Invertierbarkeit in unserer speziellen Situation ist also die Invertierbarkeit
von d f (u).
Es ist eine wesentliche Feststellung, dass im Allgemeinen zumindestens lokal das
gleiche Verhalten vorliegt.

10.3.1 Satz (Satz über die Inverse Funktion). Sei f : C → Rn stetig differenzierbar auf
der offenen Menge C ⊆ Rn . Weiters sei c ∈ C, sodass

det d f (c) , 0,

und sei E ⊆ Rn offen mit d := f (c) ∈ E. Dann existieren offene Mengen O ⊆ C und
R ⊆ E mit den folgenden Eigenschaften:

(i) c ∈ O und d ∈ R.

(ii) f |O ist eine Bijektion von O auf R.

(iii) Die inverse Abbildung g : R → O von f |O : O → R ist stetig differenzierbar mit



dg f (u) = d f (u)−1 .

10.3.2 Bemerkung. Dieser Satz gibt ein lokales Analogon zu obiger Bemerkung über
affine Funktionen. Denn ist f affin, so kann man O = Rn und R = Rn wählen. Im allge-
meinen muss man sich jedoch wirklich auf gewisse offene Umgebungen O und R von
c bzw. d einschränken um Existenz und Differenzierbarkeit der Inversen zu erhalten.
Beweis. (von Satz 10.3.1) Wir wenden Satz 10.2.4 mit x = v, y = u, a = d, b = c
auf die Funktion F(x, y) = f (y) − x definiert auf der Menge D := E × C an. Diese
ist eine stetig differenzierbare Funktion von E × C ⊆ Rn × Rn = Rn+n nach Rn mit

dF(x, y) = − I|d f (y) .
Verwenden wir die Notation von Satz 10.2.4, so gilt

dF2 (x, y) = d f (y), dF1 (x, y) = −I.


10.3. DER UMKEHRSATZ 87

f
R
C

c f |O d = f (c)

O
g = ( f |O )−1

Abbildung 10.5: Umkehrfunktion g von f |O

Bei (a, b) = (d, c) ist dF2 (a, b) = d f (c) voraussetzungsgemäß invertierbar. Nach Satz
10.2.4 gibt es offene Mengen U ∋ a und V ∋ b mit U × V ⊆ E × C, dh. U ⊆ E, V ⊆ C,
sowie eine C 1 -Funktion g : U → V mit
  
F x, g(x) = 0, dg(x) = −dF2 x, g(x) −1 dF1 x, g(x) , x ∈ U.

Setzen wir nun R := U, so folgt aus der speziellen Form von F


 
v = f g(v) , dg(v) = d f g(v) −1 , v ∈ R.

Somit ist g : R → V injektiv. Nun ist O := V ∩ f −1 (U) = {u ∈ V : f (u) ∈ U} als Schnitt


zweier offen Mengen wieder offen; f −1 (U) ist ja als Urbild einer offenen Menge unter
einer stetigen Funktion offen.

Für v ∈ R ist g(v) ∈ V und f g(v) = v ∈ R = U, also g(v) ∈ O, und daher
g : R → O. Außerdem gilt klarerweise f |O : O → R.
Wir wissen schon f |O ◦ g = idR . Für u ∈ O ist f (u) ∈ R und F( f (u), u) = 0. Aus

Satz 10.2.4, (ii), folgt u = g f (u) und somit gilt auch g ◦ f |O = idO .

10.3.3 Korollar. Sei f : C ⊆ Rn → Rn stetig differenzierbar auf der offenen Menge C.


Gilt det d f (c) , 0 für alle c ∈ C, so ist f (C) eine offene Teilmenge von Rn .
Ist zusätzlich f injektiv auf C, so ist auch f −1 : f (C) → C ⊆ Rn stetig differenzier-

bar, wobei d( f −1 )( f (u)) = d f (u) −1 .

Beweis. Nach Satz 10.3.1 gibt es um jedes c ∈ C offene Mengen Oc ⊆ C und Rc ⊆ Rn


mit c ∈ Oc , sodass f |Oc : Oc → Rc bijektiv ist. Somit ist
 
[  [ [
f (C) = f  Oc  = f (Oc ) = Rc
c∈C c∈C c∈C

als Vereinigung offener Mengen wieder offen (vgl. Proposition 5.1.6). Der zweite Teil
des Korollars folgt unmittelbar aus Satz 10.3.1, (iii).

10.3.4 Beispiel. Wir betrachten abermals die Funktion T : C → R2 definiert durch


! !
r r cos t
T = .
t r sin t
88 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN


mit C = R+ × R ⊆ R2 . In (10.5) aus Beispiel 10.1.9 haben wir dT (r, t)T berechnet.
Die Determinante davon ist r(cos t) + r(sin t) = r > 0 und somit für alle (r, t)T ∈ C
2 2

regulär.
Nach Korollar 10.3.3 ist T (C) offen in R2 . Aus dem ersten Semester (vgl. Definition
6.8.12 und Bemerkung 6.8.13) wissen wir, dass in der Tat

T (C) = R2 \ {(0, 0)T }.

Sei nun (ρ, τ)T ∈ C fest, so gibt es nach Satz 10.3.1 offene Teilmengen O und R von R,

sodass (ρ, τ)T ∈ O, T (ρ, τ)T ∈ R und sodass T |O : O → R bijektiv und in beide Rich-

tungen stetig differenzierbar ist. Die Ableitung von T −1 im Punkt (ξ, η) = T (r, t)T ∈ R,
2 2 2
dh. r = ξ + η und r cos t = ξ, r sin t = η, ist dabei

  !−1
−1 T T  −1 cos t −r sin t
dT (ξ, η) = dT (r, t) = =
sin t r cos t

!  √ ξ √ η2


1 r cos t r sin t  2 2 ξ +η2 
=  ξ η+η  .

r − sin t cos t − ξ2 +η2 2
ξ
2
ξ +η

Mit O ist auch O ∩ (R+ × (τ − π, τ + π)) offen in R2 . Schränkt man T auf diese Menge
ein, so folgt aus Korollar 10.3.3, dass T (O′ ) =: R′ ⊆ R offen in R2 ist. Klarerweise
ist auch T |O′ : O′ → R′ bijektiv und in beide Richtungen stetig differenzierbar. Somit
können wir das ursprüngliche O und R schon so wählen, dass O ⊆ R+ × (τ − π, τ + π).
In diesem Fall wissen wir schon aus Bemerkung 6.8.13, dass T |O injektiv ist. In der
Tat bildet T die ganze Menge R+ × (τ − π, τ + π) bijektiv auf
( ! )
cos(τ + π)
R2 \ s : s ∈ [0, +∞)
sin(τ + π)

ab (siehe Proposition 6.8.14). T als Abbildung von C nach R2 ist dagegen nicht injektiv.

10.4 Höhere Ableitungen


Sei f definiert auf einer offenen Menge D ⊆ Rn mit Werten in einem Banachraum X -
man stelle sich z.B. wieder R vor -, und existiere für alle x ∈ D die partielle Ableitung
∂f ∂f
∂xi (x). Dann ist ∂xi selbst eine Funktion

∂f
: D → X.
∂xi
Also macht es Sinn, von der Differenzierbarkeit o.ä. dieser Funktion zu sprechen. Exis-
tiert an einer Stelle x ∈ X die Ableitung
!
∂ ∂f
(x),
∂x j ∂xi
2
so spricht man von einer zweiten Ableitung von f und schreibt kürzer ∂x∂j ∂x
f
i
, d.h. f wird
zuerst nach xi differenziert und dann nach x j . Höhere partielle Ableitungen definiert
10.4. HÖHERE ABLEITUNGEN 89

man induktiv fortfahrend: Ist schon definiert, was partielle Ableitungen k-ter Ordnung
sind, und ist (i1 , i2 , . . . , ik+1 ) ein (k + 1)-Tupel von Indizes il ∈ {1, . . . , n}, so setzt man
!
∂k+1 f ∂ ∂k f
(x) := (x),
∂xik+1 ∂xik · · · ∂xi1 ∂xik+1 ∂xik · · · ∂xi1
falls diese Ableitungen existieren.
10.4.1 Definition. Sei f : D ⊆ Rn → X definiert auf der offenen Menge D und sei
k ∈ N. Wir sagen, f ist k-mal stetig differenzierbar auf D, und schreiben f ∈ C k oder
f ∈ C k (D), falls alle partiellen Ableitungen k-ter Ordnung von f auf ganz D existieren
und stetig sind.
Falls f ∈ C k (D) für alle k ∈ N, so schreibt man f ∈ C ∞ oder f ∈ C ∞ (D) für diesen
Sachverhalt.
10.4.2 Bemerkung. Bezeichnet man mit C(D) die Menge aller stetigen Funktionen auf
D, dann gilt
C(D) ⊇ C 1 (D) ⊇ . . . ⊇ C k (D) ⊇ C k+1 (D) ⊇ . . . .
Die erste Inklusion gilt wegen Korollar 10.1.12. Zu den anderen Inklusionen:
Ist f ∈ C k+1 (D), dann existieren alle partiellen Ableitungen (k + 1)-ter Ordnung.
Nach der induktiven Definition der (k + 1)-ten partiellen Ableitungen müssen auch alle
k
partiellen Ableitungen k-ter Ordnung existieren. Sei g = ∂xi ∂···∂x
f
i
eine solche. Dann
k 1
existieren alle partiellen Ableitungen von g und sind stetig, d.h. g ∈ C 1 . Wegen C 1 (D) ⊆
C(D) folgt, dass g selbst stetig ist, vgl. Korollar 10.1.12. D.h. f ∈ C k (D).
10.4.3 Satz (Satz von Schwarz7 ). Sei f ∈ C 2 (D), D ⊆ Rn , und seien i, j ∈ {1, . . . , n},
2 2
sodass ∂x∂i ∂xf j und ∂x∂j ∂xf j auf ganz D existieren und stetig sind. Dann gilt

∂2 f ∂2 f
= .
∂xi ∂x j ∂x j ∂xi
Mehrmalig angewandt besagt dieser Satz: Ist f ∈ C k (D), so kommt es bei der Bil-
dung einer partiellen Ableitung (höchstens k-ter Ordnung) nicht darauf an in welcher
Reihenfolge differenziert wird.
Beweis. (von Satz 10.4.3) Sei x ∈ D und δ > 0, so dass Uδ (x) ⊆ D (Rn ist mit k.k∞
versehen). Nach dem Hauptsatz der Differential- und Integralrechnung (siehe (9.13))
gilt (|ξ|, |η| < δ)
Z ξ
∂f
f (x + ξei + ηe j ) − f (x + ηe j ) = (x + ζei + ηe j ) dζ.
0 ∂x i
2
Die Ableitung des Integranden nach η ist gerade ∂x∂j ∂x f
i
(x + ζei + ηe j ), und daher stetig in
ζ und η. Somit können wir (9.15) (siehe auch Korollar 8.7.11) anwenden und erhalten
bei der Ableitung obiger Gleichung nach η
Z ξ 2
∂f ∂f ∂ f
(x + ξei + ηe j ) − (x + ηe j ) = (x + ζei + ηe j ) dζ.
∂x j ∂x j 0 ∂x j ∂xi

Leiten wir nun nach ξ ab, so folgt mit dem Hauptsatz


∂2 f ∂2 f
(x + ξei + ηe j ) = (x + ξei + ηe j ).
∂xi ∂x j ∂x j ∂xi
7 Hermann Schwarz 25.1.1843 - 30.11.1921
90 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

10.4.4 Beispiel. Wir betrachten abermals die Funktion T : D → R2 definiert durch


! !
r r cos t
T = .
t r sin t

mit D = R+ × R ⊆ R2 . Um die höheren Ableitungen dieser speziellen Funktion zu


studieren, bietet es sich an, die Bildmenge R2 als C zu betrachten, da man dann
!
r
T = r · exp(it)
t

schreiben kann. Die höheren partiellen Ableitungen sind dann


!   
∂l r l π  r cos  t + l π2  
T = r · i exp(it) = r · exp i(t + l )   ,
∂tl t 2 r sin t + l π2 

!   
∂1+l r cos t + l π 
T = i exp(it)   
l 2   ,
∂r ∂tl t sin t + l π2 
und !
∂k+l r
T = 0, k ≥ 2.
∂rk ∂tl t

10.4.5 Bemerkung. Für f ∈ C 1 (D) haben wir die Ableitung d f : D → L(Rn , X) so


definiert, dass d f (x)v genau die Richtungsableitung von f in Richtung v ist. Siehe
Lemma 10.1.4.
P P
Ist nun f ∈ C k (D) und sind v1 = nl=1 α1,l el , . . . , vk = nl=1 αk,l el Richtungsvektoren,
so erhält man mit Lemma 10.1.4

∂f X n
∂f
(x) = α1,l (x).
∂v1 l=1
∂x l

Wendet man Lemma 10.1.4 nochmals an, so folgt

∂ ∂ Xn
∂ ∂f X n X n
∂2 f
f (x) = α1,l (x) = α1,l1 α2,l2 (x).
∂v2 ∂v1 l=1
∂v2 ∂xl l =1 l =1
∂xl1 ∂xl2
1 2

Macht man das nun insgesamt k-mal, so sieht man, dass die k-malige Hintereinander-
ausführung der Richtungsableitungen nach v1 bis vk existiert und mit

∂ ∂ X n
∂k f
... f (x) = α1,l1 · · · · · αk,lk (x) (10.17)
∂vk ∂v1 l ,...,l =1
∂xl1 . . . ∂xlk
1 k

übereinstimmt. Diesen Ausdruck bezeichnen wir mit dk f (x)(v1 , . . . , vk ). Im Falle k = 1


stimmt dieser gerade mit der Ableitung d f (x)v1 übereinstimmt.
10.4. HÖHERE ABLEITUNGEN 91

Für allgemeines k ∈ N ist d k f (x)(v1 , . . . , vk ) linear in jedem Argument, d.h.

dk f (x)(v1 , . . . , µvl + νv′l , . . . , vk ) =


µdk f (x)(v1 , . . . , vl , . . . , vk ) + νdk f (x)(v1 , . . . , v′l , . . . , vk ).

Außerdem ist dk f (x)(v1 , . . . , vk ) symmetrisch in v1 , . . . , vk , hängt daher nicht von der


Reihenfolge der Richtungsvektoren ab. Das folgt unmittelbar aus Satz 10.4.3 und
(10.17).
Somit ist dk f (x) : Rk×n → X eine symmetrische, multilineare Abbildung, sodass
d f (x)(v1 , . . . , vk ) gerade ∂v∂k . . . ∂v∂1 f (x) ist. Wir nennen sie die k-te Ableitung von f an
k

der Stelle x.
Im Fall n = 1, also D ⊆ R, gilt dk f (x)(v1 , . . . , vk ) = v1 · · · · · vk f (k) (x).

Für einen späteren Gebrauch stellen wir noch heraus, dass wenn y, h ∈ Rn mit
y + th ∈ D, t ∈ [0, 1], die k-te (einseitige) Ableitung der Funktion

φ(t) = f (y + th), t ∈ [0, 1],


∂ ∂
nichts anderes als ∂h . . . ∂h f (y + th) = dk f (y + th)(h, . . . , h) ist.

10.4.6 Beispiel. Wir betrachten die Funktion T aus Beispiel 10.4.4. Lineare Abbildung

dT (r, t)T haben wir in (10.5) berechnet.
Für m ∈ N, m ≥ 2 folgt aus Beispiel 10.4.4 mit x1 = r, x2 = t, α j,1 = ρ j , α j,2 = τ j
! ! !! X
2 !
m r ρ1 ρm ∂m T r
d T ,..., = α1,l1 · · · · · αm,lm =
t τ1 τm ∂xl1 . . . ∂xlk t
l1 ,...,lm =1
! !
∂m r ∂m r
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm ) T + τ1 · · · · · τm m T =
∂r ∂tm−1 t ∂t t
     
cos t + (m − 1) π  r cos t + m π 
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm )   2 
 + τ1 · · · · · τm   2 
.
sin t + (m − 1) 2π  r sin t + m π2 
Man sieht unmittelbar aus (10.5), dass diese Beziehung auch für m = 1 richtig ist.

Wir können nun die mehrdimensionale Taylorsche Formel herleiten.


10.4.7 Satz (Taylorsche Formel8 ). Sei f : D (⊆ Rn ) → X und q ∈ N, sodass f ∈ C q (D).
Weiters sei y ∈ D fest und x ∈ D so, dass die gesamte Strecke von y bis x in D liegt9 .
Dann gilt
X
q−1
1 l
f (x) = f (y) + d f (y)(x − y, . . . , x − y) + Rq (x),
l! | {z }
l=1
l−mal

wobei sich das Restglied Rq schreiben lässt als

Z1
1 
Rq (x) = (1 − t)q−1 · dq f (1 − t)y + tx (x − y, . . . , x − y) dt. (10.18)
(q − 1)! | {z }
0 q−mal

8 Brook Taylor 18.8.1685 - 29.12.1731 London


9 Das stimmt immer, wenn D konvex ist.
92 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

Beweis. Wir entwickeln die Funktion (h = x − y)


φ(t) = f (y + th), t ∈ [0, 1]

nach Taylor, wie in (9.16). Also gilt

X
q−1 (l) Z1
φ (0) (1 − t)q−1 (q)
φ(1) = φ(0) + + φ (t) dt.
l=1
l! (q − 1)!
0

Aus Bemerkung 10.4.5 wissen wir, dass φ(l) (t) = dk f (y + th)(h, . . . , h), woraus
unmittelbar die behauptete Entwicklung folgt.

10.4.8 Bemerkung. Den Ausdruck
X
q−1
1 l
pq−1 (x) = f (y) + d f (y)(x − y, . . . , x − y)
l! | {z }
l=1
l−mal

nennt man das (q − 1)-te mehrdimensionale Taylorsche Polynom der Funktion f an


der Anschlussstelle y. Schreibt man x = (ξ1 , . . . , ξn )T , so ist pq−1 (x) tatsächlich ein
Polynom in den n Variablen ξ1 , . . . , ξn mit Werten in X.
10.4.9 Proposition. Mit der Notation aus Satz 10.4.7 gilt:
(i) Ist C ≥ 0 so, dass sich die partiellen Ableitungen q-ter Ordnung abschätzen
lassen durch
∂q f
(u) ≤ C, (10.19)
∂xl1 · · · ∂xlq
für alle l1 , . . . , lq ∈ {1, . . . , n} und u auf der Strecke von y bis x, dann gilt
nq
kRq (x)k ≤ C kx − ykq .
q!

(ii) Ist D konvex und f sogar in C ∞ (D) und gelte (10.19) für alle q und alle u ∈ D, so
konvergiert die Reihe
X∞
1 l
d f (y)(x − y, . . . , x − y)
l! | {z }
l=1
l−mal

(gleichmäßig auf beschränkten Teilmengen von D) gegen f (x).


Beweis.
(i) Aus (10.19) folgt wegen (10.17) (u = (1 − t)y + tx und h = (h1 , . . . , hn )T )

X
n
∂q f
q
kd f (u)(h, . . . , h)k ≤ |hl1 | . . . |hlq | · (u) ≤ Cnq khkq∞ .
∂xl1 . . . ∂xlq
l1 ,...,lq =1

Nun folgt aus (10.18)


Z1
1 
kRq (x)k ≤ (1 − t)q−1 · kd f q (1 − t)y + tx (x − y, . . . , x − y)k dt ≤
(q − 1)!
0
10.4. HÖHERE ABLEITUNGEN 93

Z1
nq nq q
C khkq (1 − t)q−1 dt = C khk .
(q − 1)! ∞ q! ∞
0
q
(ii) Bei fest gewähltem y konvergiert nq! kx − ykq und damit Rq (x) für jedes x gegen
0. In der Tat geht diese Konvergenz für x in beschränkten Teilmengen von D
gleichmäßig von statten.

10.4.10 Beispiel. Sei T : D → R2 wie in Beispiel 10.4.4, wobei aber jetzt D : (0, α)×R
für irgend ein festes α ∈ R+ , α > 1. Wendet man Satz 10.4.7 für den Punkt y = (r, t)T =
(1, 0) an, so erhalten wir mit x − y = (ρ, τ)T aus Beispiel 10.4.6
q−1
X 1 l
T (x) = T (y) + d T (y)(x − y, . . . , x − y) + Rq (x) =
l! | {z }
l=1
l−mal

! q−1 ! !!
1 X1 l−1 cos(l − 1) 2
π
l cos l 2
π
= + lρτ +τ + Rq (x). (10.20)
0 l! sin(l − 1) π2 sin l π2
l=1

In Beispiel 10.4.4 haben wir insbesondere gesehen, dass (10.19) für C = α und k.k =
k.k∞ erfüllt ist. Also konvergiert die entsprechende Reihe in (10.20) gegen T (x).

Am Ende dieses Kapitels wollen wir nochmals mit dem Hauptsatz über implizite Funktionen und den Umkehrsatz in
Zusammenhang mit höheren Ableitungen betrachten.

10.4.11 Lemma. Sei I ⊆ R ein Intervall, X und Y Banachräume und h : I → L(X, Y), sodass h(t) für alle t ∈ I invertierbar
ist, wobei (h(t))−1 ∈ L(Y, X). Ist dann h in einem Punkt x ∈ I differenzierbar, so auch t 7→ (h(t))−1 , wobei
 ′
(h(x))−1 = −h(x)−1 h′ (x)h(x)−1 .

Beweis. Für t ∈ I \ {x} gilt

1  1 
(h(t))−1 − (h(x))−1 = −(h(t))−1 h(t) − h(x) (h(x))−1 .
t−x t−x

Da h bei x differenzierbar ist, ist sie dort auch stetig. Wegen Korollar 9.3.3 ist auch die Zusammensetzung t 7→ (h(t))−1 bei
x stetig. Aus Lemma 9.2.7 folgt, dass für t → x obiger Ausdruck gegen −h(x)−1 h′ (x)h(x)−1 konvergiert.

10.4.12 Lemma. Sei X ein Banachraum und seien D ⊆ Rm , I ⊆ R offen. Weiters seien H : I × D → X - wir schreiben
H(x, y1 , . . . ym ) - sowie h : I → D (⊆ Rm ) stetig differenzierbar, so ist auch t 7→ H(t, h(t)) stetig differenzierbar auf I mit
Ableitung
d ∂H Xm
∂H
H(t, h(t)) = (t, h(t)) + hl (t)′ (t, h(t))
dt ∂x l=1
∂yl

wobei h = (h1 , . . . , hm )T .

Beweis. φ : t 7→ H(t, h(t)) ist die Hintereinanderausführung von t 7→ (t, h(t)) und H. Aus der Kettenregel folgt
! Xm
d 1 ∂H ∂H
H(t, h(t)) = dφ(t)1 = dH(t, h(t)) ′ = (t, h(t)) + hl (t)′ (t, h(t)).
dt h (t) ∂x ∂yl
l=1


10.4.13 Proposition. Mit den selben Voraussetzungen und der selben Notation wie im Hauptsatz über implizite Funktionen,
Satz 10.2.4, sei F ∈ Ck (D) mit k ∈ N, k ≥ 2. Dann ist auch die Funktion g : U → V immer k-mal stetig differenzierbar.
94 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

Beweis. Wir wissen aus Satz 10.2.4, dass g zumindest einmal stetig differenzierbar ist, wobei (u ∈ U)
 
dg(u) = −dF2 u, g(u) −1 dF1 u, g(u) .

Nach Voraussetzung sind (x, y) 7→ dF1 (x, y) und (x, y) 7→ dF2 (x, y) stetig partiell differenzierbar. Wegen (9.10), Lemma
10.4.11 und Lemma 10.4.12 ist u 7→ dg(u) partiell differenzierbar mit
 
 X ∂
m
∂   ∂ ∂   
dg(u) = dF2 u, g(u) −1  dF2 u, g(u) + gl (u) dF2 u, g(u)  dF2 u, g(u) −1 dF1 u, g(u)
∂u j ∂x j l=1
∂u j ∂yl

 
 X ∂
m
  ∂ ∂ 
−dF2 u, g(u) −1  dF1 u, g(u) + gl (u) dF1 u, g(u)  ,
∂x j l=1
∂u j ∂yl

wobei g = (g1 , . . . , gm )T . Nach Korollar 9.1.3 und Korollar 9.2.8 ist diese Funktion stetig in u, womit g ∈ C2 (U). Außerdem
 
ist ∂u∂ dg(u) endliche Summe von endlichen Produkten von dF2 u, g(u) −1 , dF1 u, g(u) und von gewissen ersten partiellen
j
Ableitungen

∂  ∂  ∂  ∂  ∂
dF1 u, g(u) , dF1 u, g(u) , dF2 u, g(u) , dF2 u, g(u) , gl (u), l = 1, . . . , m.
∂x j ∂yl ∂x j ∂yl ∂u j

∂ ∂
Ist nun k ≥ 3, so sind letztere Funktionen nochmals stetig partiell differenzierbar, und man zeigt wie oben, dass ∂ui ∂u j dg(u)
existiert und stetig ist. Außerdem ist diese Funktion wieder eine endliche Summe von endlichen Produkten von obigen
Funktionen (mit i statt j) und dazu von zweiten partiellen Ableitungen

∂2  ∂2  ∂2 
dF1 u, g(u) , dF1 u, g(u) , dF1 u, g(u) ,
∂xi ∂x j ∂xi ∂yl ∂yr ∂yl

∂2  ∂2  ∂2  ∂2
dF2 u, g(u) , dF2 u, g(u) , dF2 u, g(u) , gl (u).
∂xi ∂x j ∂xi ∂yl ∂yr ∂yl ∂ui ∂u j

Damit ist g ∈ C3 (U). Man fährt induktiv fort und erhält schließlich g ∈ Ck (U).

10.4.14 Korollar. Mit den selben Voraussetzungen und der selben Notation wie im Umkehrsatz, Satz 10.3.1, sei f ∈ Ck (D)
mit k ∈ N, k ≥ 2. Dann ist auch die Funktion g : R → O immer k-mal stetig differenzierbar.

Beweis. Im Beweis von Satz 10.3.1 haben wir Satz 10.2.4 auf F(x, y) = f (y) − x angewandt, um die Funktion g als Lösung
von F(x, f (x)) = 0 zu erhalten. Aus Proposition 10.4.13 folgt somit g ∈ Ck (D).

10.5 Extremwerte
Wir haben im ersten Semester in Definition 7.2.1 definiert, was es bedeutet, dass eine
reellwertige Funktion f : D → R (D ist Teilmenge eines metrischen Raumes) in einem
Punkt x ∈ D ein lokales Maximum (lokales Minimum):

∃δ > 0 : ∀t ∈ Uδ (x) : f (t) ≤ (≥) f (x).

Ist D offene Teilmenge von R, und ist f differenzierbar in einem lokalen Maximum
(Minimum) x, so haben wir in Satz 7.2.2 gesehen, dass dann f ′ (x) = 0. Wir wollen
diese Tatsache nun für auf D ⊆ Rn definierte Funktionen herleiten.
10.5.1 Satz. Sei x0 ein lokales Extremum, d.h. Maximum oder Minimum, von
f : D ⊆ Rn → R, und existieren bei x0 alle Richtungsableitungen
∂f f (x0 + tv) − f (x0 )
(x0 ) = lim ,
∂v t→0 t
so sind diese alle gleich Null. Ist sogar f ∈ C 1 , so gilt d f (x0 ) = 0.
10.5. EXTREMWERTE 95

Beweis. Sei v ∈ Rn ein beliebiger Vektor. Betrachte die Funktion φ(t) = f (x0 + tv). Da
D offen ist, ist φ in einer Umgebung von 0 definiert, und wegen unserer Voraussetzung
ist auch φ bei 0 differenzierbar und hat die Ableitung φ′ (0) = ∂∂vf (x0 ). Da x0 ein relatives
Extremum von f ist, hat auch φ ein relatives Extremum bei 0. Somit gilt φ′ (0) = 0.
Für f ∈ C 1 ist d f (x0 ) derart definiert, dass d f (x0 )v = ∂∂vf (x0 ) für alle v ∈ Rn . Es
folgt also d f (x0 ) = 0.

Also ist d f (x0 ) = 0 eine notwendige Bedingung für ein Extremum. Punkte mit
d f (x0 ) = 0 heißen stationäre Punke. Wie im eindimensionalen ist diese aber nicht
hinreichend. Um dieses Problem genauer studieren zu können, wollen wir folgende
sprechweise einführen.

10.5.2 Definition. Für gerades k heißt die k-te Ableitung dk f (x0 ) : Rk×n → R von f
im Punkt x0 positiv definit bzw. positiv semidefinit, wenn dk f (x0 )(h, . . . , h) > 0 bzw.
dk f (x0 )(h, . . . , h) ≥ 0 für alle 0 , h ∈ Rn .
Entsprechend definiert man negativ definit bzw. negativ semidefinit.

10.5.3 Bemerkung. Ist n = 1, d.h. f : D ⊆ R → R, so gilt ja d k f (x0 )(h, . . . , h) =


hk · f (k) (x0 ), und man sieht, dass dk f (x0 ) genau dann positiv definit (semidefinit) ist,
wenn f (k) (x0 ) > (≥) 0. Entsprechendes gilt für den negativ definiten (semidefiniten)
Fall.
10.5.4 Bemerkung. Der für die meisten Anwendungen relevante Fall ist k = 2. Hier
lassen sich die Definitheitseigenschaften von d 2 f (x0 ) mit Mitteln der Linearen Algebra
betrachten. In diesem Fall ist d2 f (x0 ) : R2×n → R eine symmetrische Bilinearform:
X
n
∂2 f
d2 f (x0 )(u, v) = ul1 vl2 (x0 ) =
l1 ,l2 =1
∂xl1 ∂xl2

 ∂2 f 
 (x0 ) . . . ∂2 f  v1 
∂x1 ∂xn (x0 )
   ∂x1 ∂x.1 ..
  
  . 
u1 ... un   ..   .  .
 .   . 
 ∂2 f ∂2 f vn
∂xn ∂x1 (x0 ) . . . ∂xn ∂xn (x0 )
2
Diese symmetrische n × n-Matrix H f (x0 ) = ∂x∂i ∂xf j (x0 ) heißt auch Hesse-Matrix.
Aus der Linearen Algebra ist bekannt, dass die Bilinearform positiv definit (semi-
definit) ist, wenn alle Eigenwerte λ1 , . . . , λn (nicht notwendigerweise paarweise ver-
schieden) von H f (x0 ) größer (größer gleich) Null sind. Entsprechendes gilt für den
negativen Fall.
Weiters ist diese Bilinearform positiv definit genau dann, wenn alle Hauptmino-
ren10 von H f (x0 ) größer Null sind. Entsprechend ist sie genau dann negativ definit,
wenn die Hauptminoren nicht verschwinden und abwechselndes Vorzeichen beginnend
mit − haben.
Für den Beweis des folgenden Satzes benötigen wir ein Lemma.

10.5.5 Lemma. Für k, n ∈ N sei ω : Rk×n → R eine symmetrische, multilineare


Abbildung. Gilt ω(v, . . . , v) = 0 für alle v ∈ Rn , so verschwindet ω(v1 , . . . , vk ) für alle
v1 , . . . , vk ∈ Rn .
10 Hauptminoren einer quadratischen Matrix (α )
i j i, j=1,...,n sind die Determinanten aller Untermatrizen
(αi j )i, j=1,...,k für k = 1, . . . , n.
96 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

Beweis. Für k = 1 ist nichts zu beweisen. Für größere k’s zeigen wir die Aussage durch vollständige Induktion nach k. Ist
k = 2, so gilt für beliebige v, w ∈ Rn

0 = ω(v + w, v + w) = ω(v, v) + ω(v, w) + ω(w, v) + ω(w, w) = ω(v, w) + ω(w, v).

Also gilt ω(v, w) = −ω(w, v) und wegen der Symmetrie auch ω(v, w) = ω(w, v) und damit ω(v, w) = 0.
Ist k > 2, so seien wieder v, w ∈ Rn beliebig. Weiters sei λ ∈ R. Nun gilt wegen der Symmetrie

ω(v + λw, . . . , v + λw) =

X
k−1 !
k
ω(v, . . . , v) + λj ω(v, . . . , v, w, . . . , w) + λk ω(w, . . . , w)
j=1
j | {z } | {z }
j−mal (k− j)−mal
n
Für feste v, w ∈ R und variablem λ steht links immer Null und rechts ein Polynom in λ, dessen Koeffizienten somit alle
verschwinden müssen. Für j = k − 1 gilt daher insbesondere

ω(v, . . . , v , w) = 0,
| {z }
(k−1)−mal

und zwar für alle v, w ∈ R . Somit erfüllt für festes w ∈ Rn die offensichtlich symmetrische und multilineare Abbildung
n

(v1 , . . . , vk−1 ) 7→ ω(v1 , . . . , vk−1 , w)

die Voraussetzungen unseres Lemmas für k − 1 anstatt für k. Nach Induktionsvoraussetzung verschwindet diese multilineare
Abbildung für alle v1 , . . . , vk−1 ∈ Rn . Da w zwar fest, aber beliebig war, verschwindet auch ω.

10.5.6 Satz. Für ein offenes D ⊆ Rn sei f : D → R, f ∈ C r (D) mit r ∈ N, und sei
x0 ∈ D mit d f (x0 ) = 0, . . . , dq−1 f (x0 ) = 0, d q f (x0 ) , 0, wobei q ≤ r. Dann gilt
(i) Hat f ein lokales Maximum bei x0 , so ist q gerade und dq f (x0 ) ist negativ semi-
definit.
(ii) Ist q gerade und dq f (x0 ) negativ definit, so hat f ein lokales Maximum bei x0 .
(iii) Hat f ein lokales Minimum bei x0 , so ist q gerade und dq f (x0 ) ist positiv semide-
finit.
(iv) Ist q gerade und dq f (x0 ) positiv definit, so hat f ein lokales Minimum bei x0 .
Beweis.
(i) Sei x0 ein relatives Maximum von f . Dann existiert ein δ > 0, sodass

f (x) ≤ f (x0 ) für alle x ∈ Uδ (x0 ).

Für ein v ∈ Rn \ {0} definieren wir φv (t) = f (x0 + tv), |t| < kvk δ , und sehen
wie in Satz 10.5.1, dass φv bei Null ein lokales Maximum hat. Außerdem ist
(q−1)
φ(k) k ′
v (0) = d f (x0 )(v, . . . , v), k = 1, . . . , q. Also φv (0) = · · · = φv (0) = 0.
Nach Voraussetzung ist dq f (x0 ) , 0, und wegen Lemma 10.5.5 muss
dq f (x0 )(v, . . . , v) , 0 in zumindest eine Richtung v. Also folgt φ(q)
v (0) , 0. Wäre
q ungerade, so wäre nach Korollar 7.3.11 die Zahl 0 aber kein lokales Extremum
von φv .
(q)
Damit ist q gerade. Wäre nun dq f (x0 ) nicht negativ semidefinit, d.h. φv (0) =
dq f (x0 )(v, . . . , v) > 0 in zumindest eine Richtung v, so folgt wieder aus Korollar
7.3.11, dass 0 ein lokales Minimum von φv ist. Somit ist 0 lokales Minimum und
lokales Maximum. Also muss φv auf einem hinreichend kleinen Intervall um 0
konstant sein, was aber φ(q) v (0) = 0 implizieren würde.
10.5. EXTREMWERTE 97

(ii) Sei q gerade und dq f (x0 ) negativ definit. Nun gibt es ein δ > 0, sodass dq f (x)
ebenfalls negativ definit ist für alle x ∈ Uδ (x0 ).
Um das einzusehen, nehme man das Gegenteil an. Dann gibt es zu jedem n ∈ N
ein xn , kxn − x0 k∞ < n1 , sodass dq f (xn ) nicht negativ definit ist. Es gibt daher ein
0 , hn ∈ Rn mit dq f (xn )(hn , . . . , hn ) ≥ 0. Wegen
 hn hn  1
dq f (xn ) ,..., = dq f (xn )(hn , . . . , hn ) ≥ 0
khn k∞ khn k∞ khn kq∞
können wir annehmen, dass die hn immer khn k∞ = 1 erfüllen, also in der abge-
schlossenen und beschränkten Teilmenge

K1 (0) \ U1 (0) = {h : khk∞ = 1} ⊆ Rn

liegen. Da diese Menge nach Korollar 5.2.13 kompakt ist, gilt hn( j) → h, j → ∞,
für eine Teilfolge und für ein h ∈ K1 (0) \ U1 (0).
Somit konvergieren die Komponenten von hn( j) gegen die entsprechenden
k
Komponenten von h und alle partiellen Ableitungen ∂xl ∂...∂x
f
l
(xn( j) ) gegen
1 k
∂k f
(x0 ). Wegen (10.17) konvergiert dann auch dq f (xn( j) )(hn( j) , . . . , hn( j) ) ge-
∂xl1 ...∂xlk
gen d f (x0 )(h, . . . , h), und wir erhielten d q f (x0 )(h, . . . , h) ≥ 0 im Widerspruch
q

zur Voraussetzung.
Nach Satz 10.4.7 hat man für x ∈ Uδ (x0 )
q−1
X 1 l
f (x) = f (x0 ) + d f (x0 )(x − x0 , . . . , x − x0 ) + Rq (x) = f (x0 ) + Rq (x),
l! | {z }
l=1 l−mal

Z1
1
Rq (x) = d f q ((1 − t)x0 + tx)(x − x0 , . . . , x − x0 )(1 − t)q−1 dt.
(q − 1)! | {z }
0 q−mal

Wegen der Wahl von δ ist aber der Integrand < 0. Also gilt f (x) = f (x0 )+Rq (x) <
f (x0 ) für x , x0 , und somit ist x0 ein lokales Maximum.
Die Aussagen (iii) und (iv) zeigt man genauso wie (i) und (ii).

Sucht man ein lokales Extremum einer überall differenzierbaren Funktion, so
braucht man nur unter jenen Punkten x0 mit d f (x0 ) = 0 zu suchen. In der Praxis wird
man die Gleichung d f (x0 ) = 0 aber meistens nicht explizit nach x0 auflösen können.
10.5.7 Bemerkung. Ob ein lokales Maximum (Minimum) ein globales Maximum (Mi-
nimum) ist, bedarf einer weiteren Prüfung. Eine Möglichkeit ist, alle lokalen Extrema
zu suchen, und diese dann untereinander zu vergleichen.

10.5.8 Beispiel. Wir betrachten die Funktion


(
R2 → R
f : .
(ξ1 , ξ2 )T 7→ 1 − ξ12 − ξ22

Der Graph dieser Funktion, daher alle Punkte (ξ1 , ξ2 , ξ3 )T ∈ R3 mit ξ3 = f (ξ1 , ξ2 )T , ist
ein Paraboloid.
98 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

ξ3

ξ2

ξ1

ξ 
Abbildung 10.6: Graph der Funktion ξ3 = f 1
ξ2 für ξ12 + ξ22 ≤ 1

Die Ableitung von f berechnet sich als


 ∂f ∂f 
d f (x) = (x), (x) = (−2ξ1 , −2ξ2 ).
∂x1 ∂x2
Schreibt man y ∈ R2 in Koordinaten (η1 , η2 )T bezüglich der kanonischen Basis,
so ergibt sich
d f (x)y = −2ξ1 η1 − 2ξ2 η2 .
Der einzige Punkt x mit d f (x) = (0, 0) ist offenbar x = (0, 0)T . Die zweiten
partiellen Ableitungen von f sind
∂2 f ∂2 f ∂2 f ∂2 f
2
= −2, = = 0, = −2.
∂x1 ∂x1 ∂x2 ∂x2 ∂x1 ∂x22
Die zweite Ableitung ist daher gleich

d2 f (x)(h, h) = −2h21 − 2h22 ,

und sie ist offenbar stets < 0, also negativ definit. Insbesondere ist (0, 0)T ein
lokales Maximum. Ist 0 nun auch ein globales Maximum? Das Bild, das man
von der Fläche hat, legt das sicherlich nahe. Aber wie lässt sich das zeigen?
Eine Möglichkeit ist, festzustellen, dass für (ξ1 , ξ2 )T , (0, 0)T sicherlich
f (ξ1 , ξ2 )T = 1 − (ξ12 + ξ22 ) < 1 = f (0, 0)T .
Man kann auch nach einem (globalen,lokalen) Minimum von f fragen. Ein
globales Minimum gibt es offensichtlich nicht, da z.B. für festes ξ2 und für
|ξ1 | → +∞ der Ausdruck f (ξ1 , ξ2 )T nach −∞ strebt.
Man kann aber z.B. fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 < 1}
ein lokales oder globales Minimum y = (η1 , η2 )T hat. Das ist aber auch nicht der
Fall, denn dann wäre dort d f (y) = 0, was aber nur für y = 0 der Fall ist.
Nun kann man z.B. auch fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 ≤
1} ein Minimum y = (η1 , η2 )T hat. Man beachte, dass man hier nicht unmittelbar
die Resultate dieses Abschnittes anwenden kann, da ja D nicht offen ist. In der
Tat ist D kompakt, und somit muss f auf D mindestens ein Minimum haben.
Ein solches kann aber nicht in D liegen, da es dann ein Minimum von f |D wäre,
von dem wir ja wissen, dass es diese nicht gibt.
10.6. LAGRANGE MULTIPLIKATOREN 99

Also muss y ∈ D \ D = T = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 = 1}. Aber f ist auf T


konstant. Also sind alle y ∈ T Minima von f |D .
Wollen wir die Extrema von f auf dem abgeschlossenen Dreick ∆ mit den Eck-
punkten (0, 1)T , (2, 0)T , (2, 2)T finden, so gehen wir folgendermaßen vor.
Zunächst existieren zumindest ein Minimum und zumindest ein Maximum von
f auf ∆, da f stetig und ∆ abgeschlossen, beschränkt und somit kompakt ist.
Das Innere ∆o von ∆ ist eine offene Teilmenge von R2 , welche (0, 0)T nicht
enthält. Also kann ein Extremum von f nicht in ∆o liegen, da d f dort verschwin-
den müsste. Wir haben aber schon gesehen, dass (0, 0)T der einzige Punkt ist, wo
d f verschwindet.
Also müssen die Extrema am Rand ∂∆, dh. in der Vereinigung der drei Seiten
! ! !
2α 2α 2
a={ : α ∈ [0, 1]}, b = { : α ∈ [0, 1]}, c = { : α ∈ [0, 1]},
1−α 1+α 2α
suchen. Die Extrema von f auf a (b, c) sind aber die Extrema von
!

fa (α) = f = 1 − 4α2 − 1 + 2α − α2 = −5α2 + 2α,
1−α
!

fb (α) = f = 1 − 4α2 − 1 − 2α − α2 = −5α2 − 2α, bzw.
1+α
!
2
fc (α) = f = 1 − 4 − 4α2 = −3 − 4α2 ,

jeweils auf [0, 1].
Für fa gilt fa′ (α) = −10α + 2 und fa′′ (α) = −10. Also ist α = 51 ein lokales
Maximum mit fa ( 15 ) = 51 . Für die Randpunkte von [0, 1] gilt fa (0) = 0, fa (1) =
−3. Insgesamt hat fa auf [0, 1] ein Maximum bei α = 15 und ein Minimum bei
α = 1.
Die Funktion fb ist auf [0, 1] offensichtlich monoton fallend. Also ist α = 0 ein
Maximum mit fb (0) = 0 und α = 1 ein Minimum mit fb (1) = −7.
Die Funktion fc ist auf [0, 1] auch monoton fallend. Also ist α = 0 ein Maximum
mit fc (0) = −3 und α = 1 ein Minimum mit fc (1) = −7.
Somit hat f auf ∂∆ das Minimum bei (2, 2)T mit Wert f (2, 2)T = −7 und das
 2 
Maximum bei 1−5 2 mit Wert 15 .
5

10.6 Lagrange Multiplikatoren


In diesem Abschnitt wollen wir die Suche nach lokalen Minima bzw. Maxima auf
folgende Situation ausdehen.
Sei f : D ⊆ Rn → R und sei g : D ⊆ Rn → Rm mit m < n. Nun wollen wir die
lokalen Maxima von f unter der Nebenbedingung g = 0 suchen, also alle y ∈ Rn mit
g(y) = 0, sodass für eine gewisse Kugel Uδ (y) ⊆ D gilt
x ∈ Uδ (y), g(x) = 0 ⇒ f (x) ≤ f (y). (10.21)
Entsprechend sind lokale Minima von f unter der Nebenbedingung g = 0 definiert.
Um diese lokalen Extrema mit Nebenbedingung zu finden, wendet man folgenden
Satz an.
100 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN

10.6.1 Satz (Lagrangesche Multiplikatorenregel). Hat die Funktion f an der Stelle y


ein lokales Extremum unter der Nebenbedingung g = 0 und hat die Ableitung dg(y) ∈
Rm×n Rang m, so gibt es ein µ11 ∈ Rm derart, dass für die Funktion
H : D × Rm ⊆ Rn+m → R,
X
m
H(x, λ) := f (x) + (λ, g(x)) = f (x) + λ j g j (x)
j=1

(y, µ) ein stationärer Punkt ist, d.h. dH(y, µ) = 0. Es gelten also an dieser Stelle die
Gleichungen
∂f X m
∂g j
(y) + µj (y) = 0, i = 1, . . . , n,
∂xi j=1
∂xi
g j (y) = 0, j = 1, . . . , m.
Beweis. Laut Voraussetzung ist Matrix dg(y) mit n Spalten und m Zeilen vom Rang m.
Also gibt es m Spalten dieser Matrix, die linear unabhängig sind. Durch eine Umbe-
nennung der Variablen ξ1 , . . . , ξn , also eine Permutation der Koordinaten, kann man es
immer bewerkstelligen, dass die letzten m Spalten linear unabhängig sind.
Das heißt aber nun, dass, wenn wir Vektoren x ∈ Rn als (x1 , x2 ) ∈ R(n−m)+m und die

Matrix dg(y) entsprechend als dg1 (y)|dg2(y) mit dg1 (y) ∈ Rm×(n−m) , dg2 (y) ∈ Rm×m
schreiben, die Matrix dg2 (y) invertierbar ist.
Ist Uδ (y) ⊆ D wie in (10.21), so können wir den Hauptsatz über implizite Funktio-
nen, Satz 10.2.4, auf g|Uδ (y) anwenden und erhalten in einer offenen Menge der Form
U × V ⊆ Uδ (y) ⊆ R(n−m)+m mit y1 ∈ U, y2 ∈ V, wobei y = (y1 , y2 ), die eindeutige
Auflösbarkeit von g(x1 , x2 ) = 0. Also gibt es h : U ⊆ Rn−m → V ⊆ Rm in C 1 , sodass
(x1 , x2 ) ∈ U × V, g(x1 , x2 ) = 0 ⇔ x1 ∈ U, h(x1 ) = x2 .
Somit ist y1 eine Extremum von k(x1 ) := f (x1 , h(x1 )), x1 ∈ U. Wegen Satz 10.5.1 gilt
dk(y1 ) = 0. Nun ist wegen Satz 10.2.4 dh(y1 ) = −dg2 (y)−1 dg1 (y), und daher nach der
Kettenregel
! !
I I
0 = dk(y1 ) = d f (y) = (d f1 (y), d f2 (y)) =
dh(y1 ) −dg2 (y)−1 dg1 (y)

d f1 (y) + −d f2 (y)dg2 (y)−1 dg1 (y) .
|{z} | {z } |{z}
∈R1×(n−m) =:µT ∈R1×m Rm×(n−m)

Ausgeschrieben bedeutet das

∂f Xm
∂g j
(y) + µj (y) = 0, i = 1, . . . , n − m.
∂xi j=1
∂xi

Andererseits haben wir µ so definiert, dass µT dg2 (y) = −d f2 (y), also

∂f Xm
∂g j
(y) + µj (y) = 0, i = n − m + 1, . . . , n.
∂xi j=1
∂xi

Schließlich gilt g j (y) = 0, j = 1, . . . , m nach Voraussetzung.


11 Man spricht von den Lagrangeschen Multiplikatoren.


10.6. LAGRANGE MULTIPLIKATOREN 101

10.6.2 Beispiel. Als einfaches Beispiel betrachte die Funktion f : R2 → R,


!
ξ
f = ξ2 η2 .
η

Wir wollen alle Extrema dieser Funktion auf T = {x ∈ R2 : kxk2 = 1} finden. Offen-
sichtlich entspricht das dem Aufsuchen aller Extrema der Funktion f unter der Neben-
bedingung g(x) = 0, wobei !
ξ
g = ξ2 + η2 − 1.
η
 
Wegen dg ηξ = (2ξ 2η) , (0 0) für ηξ ∈ T, ist die Regularitätsbedingung von Satz

10.6.1 erfüllt. Setzen wir ( ηξ ∈ R2 , λ ∈ R)

H(ξ, η, λ) = f (x) + λ · g(x) = ξ2 η2 + λξ2 + λη2 − λ,

so wissen wir aus Satz 10.6.1, dass alle Lösungen von dH(x, y, λ) = 0 Kandidaten für
lokale Extrema sind. Wir lösen also
∂H
(ξ, η, λ) = 2ξη2 + 2λξ = 2ξ(η2 + λ) = 0,
∂ξ
∂H
(ξ, η, λ) = 2ξ2 η + 2λη = 2η(ξ2 + λ) = 0,
∂η
!
∂H ξ
(ξ, η, λ) = g = ξ2 + η2 − 1 = 0.
∂λ η
(i) Ist ξ = 0, so muss η = ±1 und daher λ = 0.
(ii) Ist η = 0, so muss ξ = ±1 und daher λ = 0.
(iii) Sind beide ξ, η , 0, so folgt aus den ersten beiden Gleichungen ξ2 + η2 = −2λ
und aus der letzten ξ2 + η2 = 1. Also λ = − 21 sowie ξ = ± √12 , η = ± √12 .
 
Aus f ηξ = ξ2 η2 folgt sofort, dass überall f ηξ > 0 wenn beide ξ, η , 0. Somit sind die
vier Punkte (±1, 0)T , (0, ±1)T Minima auf T.
An jedem der vier Punkte (± √12 , ± √12 )T nimmt f den Wert 41 . Da T kompakt ist,
muss f darauf ein oder mehrere Maxima haben, welche in unserer Kandidatenmenge
enthalten sein muss. Also sind die vier Punkte (± √12 , ± √12 )T alle Maxima von f auf T.

10.6.3 Beispiel. Sei A = (ai, j )ni, j=1 ∈ Rn×n symmetrisch, d.h. AT = A. Wir suchen das
Maximum und das Minimum von f : Rn → R, x 7→ xT Ax auf der Kugeloberfläche
{x ∈ Rn : kxk2 = 1}. Also suchen wir Extrema von f unter der Nebenbedingung
P
g(x) = 1 − xT x = 1 − nj=1 ξ2j , wobei x = (ξ1 , . . . , ξn )T .
Zunächst ist dg(x) = −2xT vom Rang eins für alle x auf der Kugeloberfläche. Also
liefert uns Satz 10.6.1 ein notwendiges Kriterium für die gesuchten Extrema. Man hat

H(x, λ) = xT Ax + λ(1 − xT x) = xT (A − λI)x + λ = ((A − λI)x, x) + λ.

Mit der Produktregel für Skalarprodukte und wegen der Symmetrie von A folgt
∂H
(x, λ) = ((A − λI)ei , x) + ((A − λI)x, ei ) = 2(Ax − λx)T ei ,
∂xi
102 KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN


dH(x, λ) = 2(Ax − λx)T | 1 − xT x .
Die stationären Punkte müssen also (Ax − λx) = (A − λI)x = 0 und 1 − xT x = 0 erfüllen.
Somit kommen nur Eigenvektoren für die Extrema in Frage. Ist x ein Eigenvektor zum
Eigenwert λ, so folgt f (x) = xT Ax = xT λx = λ.
Da die Kugeloberfläche kompakt ist, existieren Minimum und Maximum. Wir er-
halten also für x ∈ Rn , kxk2 = 1

λmin ≤ xT Ax ≤ λmax ,

wobei λmin der kleinste und λmax der größte Eigenwert von A ist.
Mit den üblichen Überlegungen, wobei man komplexe n-Vektoren und n × n-
Matrizen mit reellen (2n)-Vektoren bzw. (2n) × (2n)-Matrizen identifiziert, ergibt sich
für komplexe, symmetrische n × n-Matrizen A, dass λmin ≤ z∗ Az ≤ λmax , z ∈ Cn , kzk22 =
Pn 2
j=1 |ζ j | = 1.
Kapitel 11

Wegintegrale

11.1 Wege
Wege im Rn sind der Anschauung nach etwas eindimensionales.

11.1.1 Definition. Ein Weg γ im Rn ist eine Abbildung von einem Intervall [a, b] nach
Rn . Ist γ stetig, so sprechen wir von einem stetigen Weg.
Dabei heißen zwei Wege γ : [a, b] → Rn und γ̃ : [ã, b̃] → Rn äquivalent, falls sie
Umparametrisierungen von einander sind, d.h. falls es eine streng monoton wachsende
Bijektion α : [a, b] → [ã, b̃] gibt, sodass γ̃ ◦ α = γ.1 Wir schreiben auch γ ∼ γ̃ dafür.
Ist γ ein Weg, so sei
γ− : [a, b] → Rn der Weg [a, b] → Rn , t 7→ γ(a + b − t), also der in der Gegenrichtung
durchlaufene Weg.
Sind γ1 : [a1 , b1 ] → Rn , γ2 : [a2 , b2 ] → Rn zwei (stetige) Wege mit b1 = a2 und
γ1 (b1 ) = γ2 (a2 ), so sei γ1 ⊕ γ2 : [a1 , b2 ] → Rn die (stetige) Funktion mit

(γ1 ⊕ γ2 )|[a1 ,b1 ] = γ1 , (γ1 ⊕ γ2 )|[a2 ,b2 ] = γ2 .

Sind x0 , . . . , xm Punkte aus Rn , so bezeichnet −


x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
−−−−x→
m den stetigen
n
Weg γ : [0, m] → R definiert durch γ(t) = x j−1 + (t − ( j − 1))(x j − x j−1 ), wenn
t ∈ [ j − 1, j], j = 1, . . . , m. Solche Wege nennt man Polygonzüge. Ist m = 1, so nennt
man γ(t) = tx2 + (1 − t)x1 die gerade Strecke von x0 nach x1 und schreibt auch − x−0−→
x1
dafür.

11.1.2 Beispiel. Sind x0 , . . . , xm Punkte aus Rn , und definiert man die Wege x] j−1 x j :
[ j−1, j] → Rn , j = 1, . . . , m, durch x] j−1 x j (t) := x j−1 +(t−( j−1))(x j −x j−1 ), t ∈ [ j−1, j],
so sind offensichtlicherweise x] −−−−− →
j−1 x j und x j−1 x j äquivalent, und

xg ]xm = −
0 x1 ⊕ · · · ⊕ xm−1 x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
−−−−x→
m.

11.1.3 Fakta.

1. Da mit α auch α−1 eine streng monoton wachsende Bijektion ist, ist ∼ eine Äqui-
valenzrelation. Man sieht auch unmittelbar, dass γ ∼ γ′ ⇔ γ− ∼ −γ′ −.
1 Wegen Korollar 6.5.3 ist eine solche Bijektionen α stetig. Umgekehrt ist eine stetige Bijektion α :

[a, b] → [ã, b̃] entweder streng monoton wachsend oder streng monoton fallend, vgl. Lemma 6.5.4.

103
104 KAPITEL 11. WEGINTEGRALE

2. Ist γ : [a, b] → Rn ein Weg und ist α(t) = a + t(b − a), so ist γ äquivalent zu
γ ◦ α : [0, 1] → Rn , also äquivalent zu einem Weg mit Parametermenge [0, 1].
3. Das Bild eines stetigen Weges ist als stetiges Bild einer kompakten und zusam-
menhängenden Menge wieder kompakt und zusammenhängend, siehe Proposi-
tion 6.1.11 und Proposition 6.2.4.
4. Man könnte glauben, dass das Bild zumindest eines stetigen Weges den Weg
schon bestimmt. Das ist aber nicht der Fall, wenn man nur an ein Geradenstück
denkt, das man zuerst in die Hin- und dann in die Rückrichtung durchläuft.
5. Das Bild eines stetigen Weges kann auch ganz unerwartet aussehen. Man kann
z.B. einen Weg in R2 konstruieren, der [0, 1] × [0, 1] als Bild hat.
Um einem Weg eine Länge ℓ(γ) zuzuordnen, liegt es nahe, das zuerst bei den ein-
fachsten Arten von Wegen, nämliche den geraden Strecken γ = → −
xy mit x, y ∈ Rn zu
tun:
ℓ(γ) := kx − yk2 .
Die Länge eines beliebigen Weges γ : [a, b] → Rn approximiert man dadurch, dass
man eine beliebige Zerlegung Z = {ξ j : j = 0, . . . , n(Z)} von [a, b] wie in Definition
8.1.2 hernimmt und die Länge des dazugehörigen Polygonzuges
−−−−−−−−→ −−−−−−−−−−−−−−−→
γ(ξ0 )γ(ξ1 ), . . . , γ(ξn(Z)−1 )γ(ξn(Z) ) (11.1)
nämlich
X
n(Z)
L(Z) := kγ(ξ j ) − γ(ξ j−1 )k2
j=1

a = ξ0 ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 = b :Z

γ(ξ7 )
γ

γ(ξ1 ) γ(ξ0 )
γ(ξ6 )

γ(ξ2 )
γ(ξ5 ) γ([a, b])
γ(ξ3 ) γ(ξ4 )

Abbildung 11.1: Polygonzüge zur Approximation der Weglänge

berechnet, und dann das Supremum über alle Zerlegungen nimmt:


ℓ(γ) := sup L(Z). (11.2)
Z∈Z
11.1. WEGE 105

Der Fall ℓ(γ) = +∞ kann dabei auftreten. Ist jedoch ℓ(γ) < +∞, so spricht man von
einem rektifizierbaren Weg.

11.1.4 Fakta.

1. Ist γ : [0, 1] → Rn , γ(t) = ty + (1 − t)x eine gerade Strecke, so gilt für eine
beliebige Zerlegung Z

X
n(Z)
L(Z) = k(ξ j − ξ j−1 )(y − x)k2 = kx − yk2 .
j=1

Also ist unser Zugang zur Weglänge in sich konsistent.

2. Da Z bezüglich ⊆ eine gerichtete Menge ist, und da wegen der Dreiecksunglei-


chung, kγ(w) − γ(u)k2 ≤ kγ(w) − γ(v)k2 + kγ(v) − γ(u)k2, aus Z1 ⊆ Z2 folgt, dass
L(Z1 ) ≤ L(Z2 ), kann man ℓ(γ) als Limes eines monoton wachsenden Netzes
über (Z, ⊆) schreiben.

3. Aus der Monotonie (vgl. 2) folgt unmittelbar für ein endliches A ⊆ [a, b], dass

ℓ(γ) = sup L(Z).


Z∈Z, Z⊇A

4. Ist γ nicht konstant, also ∃ t1 , t2 : γ(t1 ) , γ(t2 ), so folgt


L({a, b, t1 , t2 }) ≥ kγ(t1 ) − γ(t2 )k2 > 0, und damit ℓ(γ) > 0.
Ist γ konstant, so folgt sofort aus der Definition ℓ(γ) = 0.

5. Da sich die Zerlegungen der Definitionsbereiche von äquivalenten Wegen bi-


jektiv entsprechen, überzeugt man sich leicht, dass äquivalente Wege die selbe
Länge haben. Genauso leicht sieht man ℓ(γ) = ℓ(−γ).

6. Seien γ1 : [a1 , b1 ] → Rn , γ2 : [a2 , b2 ] → Rn zwei Wege mit b1 = a2 und


γ1 (b1 ) = γ2 (a2 ), und sei Z1 , Z2 bzw. Z die Menge aller Zerlegungen von [a1 , b1 ],
[a2 , b2 ] bzw. [a1 , b2 ].
Sind Z1 ∈ Z1 und Z2 ∈ Z2 , so folgt L(γ1 ⊕γ2 , Z1 ∪Z2 ) = L(γ1 , Z1 )+L(γ2 , Z2 ),
und daher (vgl. 3)

ℓ(γ1 ⊕ γ2 ) = sup L(γ1 ⊕ γ2 , Z) = sup L(γ1 , Z1 ) + L(γ2 , Z2 ) =


Z∈Z, Z⊇{a2 } (Z1 ,Z2 )∈Z1 ×Z2

sup sup L(γ1 , Z1 ) + L(γ2 , Z2 ) = sup L(γ1 , Z1 ) + ℓ(γ2 ) = ℓ(γ1 ) + ℓ(γ2 ).


Z1 ∈Z1 Z2 ∈Z2 Z1 ∈Z1

7. Ist Z eine Zerlegung von [a, b], und betrachtet man den in (11.1) erwähnten
Polygonzug p : [0, n(Z)],

t − ξ j−1 
p(t) = γ(ξ j−1 ) + γ(ξ j ) − γ(ξ j−1 ) . (11.3)
ξ j − ξ j−1

Da dieser Weg eine Zusammensetzung von geraden Strecken - genauer eine Zu-
sammensetzung von zu geraden Strecken äquivalenten Wegen - ist, folgt aus dem
letzten Punkt, dass ℓ(p) = L(Z).
106 KAPITEL 11. WEGINTEGRALE

11.1.5 Lemma. Ist γ : [a, b] → Rn ein rektifizierbarer Weg, so ist die Funktion ℓ(x) :=
ℓ(γ|[a,x] ), x ∈ [a, b] monoton wachsend. Ist γ bei x rechtsstetig (linksstetig, stetig), so
ist auch ℓ dort rechtsstetig (linksstetig, stetig)2 .
Beweis. x 7→ ℓ(γ|[a,x] ) ist offensichtlich monoton steigend (vgl. Fakta 11.1.4, 6). Sei γ
in einem Punkt x ∈ [a, b) rechtsstetig. Wegen ℓ(γ|[a,b] ) = ℓ(γ|[a,x] ) + ℓ(γ|[x,b] ) ist auch
ℓ(γ|[x,b] ) endlich und somit das Supremum aller L(Z), wenn Z alle Zerlegungen von
[x, b] durchläuft.
Somit gibt es zu gegebenen ǫ eine Zerlegung Z0 von [x, b], sodass

ℓ(γ|[x,b] ) − ǫ < L(Z0 ) ≤ ℓ(γ|[x,b] ).

Wegen der Rechtsstetigkeit gibt es ein δ > 0, sodass kγ(x) − γ(s)k2 < ǫ, s ∈ [x, x +
δ). Da die L(Z) monoton von Z abhängen, können wir Z0 so wählen, dass die erste
Stützstelle ξ rechts von x einen Abstand kleiner als δ hat. Es folgt

ℓ(γ|[x,ξ] ) ≤ ℓ(γ|[x,ξ] ) + ℓ(γ|[ξ,b] ) − (L(Z0 ) − kγ(ξ) − γ(x)k2 ) .

Diese Ungleichung gilt, da die letzte Klammer nichtnegativ ist, denn L(Z0 ) − kγ(ξ) −
γ(x)k2 stimmt mit L(Z0 ∩ [ξ, b]) überein, und ist damit höchstens ℓ(γ|[ξ,b] ). Nun stimmt
der rechte Ausdruck in obiger Relation überein mit

kγ(ξ) − γ(x)k2 + ℓ(γ|[x,b] ) − L(Z0 ) < 2ǫ.

Also ist ℓ(γ|[x,ξ] ) < 2ǫ. Wegen der Monotonie gilt auch ℓ(γ|[a,s] ) − ℓ(γ|[a,x] ) = ℓ(γ|[x,s] ) ≤
ℓ(γ|[x,ξ] ) < 2ǫ, wenn s ∈ [x, ξ].
Die Linksstetigkeit zeigt man analog.

Konkret ausrechnen lässt sich die Weglänge für stetig differenzierbare Wege.
11.1.6 Satz. Falls γ ∈ C 1 [a, b], so ist γ rektifizierbar, und ℓ(x) ist differenzierbar mit
der Ableitung kγ′ (x)k2 . Dabei gilt
Z b
ℓ(γ) = kγ′ (x)k2 dx.
a

Beweis. Wegen dem Hauptsatz der Differential- und Integralrechnung sowie (9.11) gilt
Z ξ Z ξj
j ′
kγ(ξ j ) − γ(ξ j−1 )k2 = γ (t) dt ≤ kγ′ (t)k2 dt.
ξ j−1 ξ j−12
Rb
Also L(Z) ≤ a kγ′ (t)k2 dt für jede Zerlegung Z von [a, b], und damit ℓ(γ) ≤
Rb
a
kγ′ (t)k2 dt.
Für a ≤ x < y ≤ b gilt
Z y
kγ(y) − γ(x)k2 ≤ ℓ(γ|[x,y] ) ≤ kγ′ (t)k2 dt.
x

Dividiert man diese Ungleichung durch (y − x) und lässt x → y streben, so konvergiert


die linke und die rechte Seite gegen kγ′ (y)k2 ; also auch der Ausdruck ℓ(y)−ℓ(x)
y−x in der
2 Rechtsstetig bedeutet lim s→x+ ℓ(s) = ℓ(x) und linksstetig lim s→x− ℓ(s) = ℓ(x)
11.1. WEGE 107

Mitte, und damit ℓ′ (y)− = kγ′ (y)k2 . Lässt man y → x streben, so sieht man genauso
ℓ′ (x)+ = kγ′ (x)k2 , und insgesamt ℓ′ (x) = kγ′ (x)k2 , x ∈ [a, b], wobei wir an den
Rändern die jeweiligen einseitigen Grenzwerte meinen.

n
Die Funktion γ : [a, b] → R ist offensichtlicherweise stetig und stückweise stetig
differenzierbar (vgl. Definition 9.5.7), wenn es eine Zerlegung Z = {ξ j }n(Z) j=0 gibt, sodass
γ|[ξ j−1 ,ξ j ] ∈ C 1 [ξ j−1 , ξ j ] für j = 1, . . . , n(Z). Wendet man Satz 11.1.6 n(Z)-mal auf
γ|[ξ j−1 ,ξ j ] , j = 1, . . . , n(Z) an, so erhalten wir
11.1.7 Korollar. Ist γ : [a, b] → Rn ein stetiger und stückweise stetig differenzierbarer
Rb
Weg, so ist dieser rektifizierbar mit ℓ(γ) = a kγ′ (x)k2 dx.

11.1.8 Beispiel. Man betrachte den Weg (siehe Definition 6.8.12, Beispiel 10.1.9)
!
cos s
γ(s) = ∈ R2 , s ∈ [0, 2π].
sin s

Für ein t ∈ [0, 2π] gilt nach Satz 11.1.6


Z t ! Z tp
− sin s
ℓ(γ|[0,t] ) = ds = sin2 s + cos2 s ds = t.
0 cos s 2 0

γ(t) ≃ exp(it)
sin t

t
Also ist t genau die Weglänge
des Bogens γ|[0,t] .
−1 0 cos t 1

Das erklärt, warum man für ein w ∈ C ≃ R2 dargestellt in Polarkoordinaten (siehe


Definition 6.8.12), dh. w = r exp(it) = r(cos t + i sin t), die Zahl t auch als Bogenlänge
bezeichnet.

11.1.9 Bemerkung. Ist γ : [a, b] → Rn ein rektifizierbarer und stetiger Weg, so wissen
wir nun, dass ℓ das Intervall [a, b] monoton wachsend und surjektiv auf [0, ℓ(γ)] abbil-
det. Ist ℓ sogar bijektiv, so ist β = γ ◦ ℓ−1 ein zu γ äquivalenter Weg, sodass die Länge
des Weges β|[0,t] genau t ist.
Ist ℓ nicht injektiv, so kann man für t ∈ [0, ℓ(γ)], β(t) := γ(x) setzen, wobei x ∈
[a, b], sodass ℓ(x) = t. Im Fall, dass ℓ(x1 ) = t = ℓ(x2 ), hat γ|[x1 ,x2 ] Weglänge Null und
ist somit konstant. Also ist γ(x1 ) = γ(x2 ) und β daher wohldefiniert, sodass γ = β ◦ ℓ.
Aus der Kompaktheit von [0, ℓ(γ)] folgert man daraus leicht die Stetigkeit von β.
Also ist β auch in diesem Fall ein zu γ fast äquivalenter“ Weg, sodass die Länge

des Weges β|[0,t] genau t ist.
108 KAPITEL 11. WEGINTEGRALE

11.1.10 Bemerkung. Bisher haben wir bei der Behandlung von Wegen und Weglängen
nirgends verwendet, dass γ in den Rn mit der k.k2 -Norm hinein abbildet. Wir haben die
euklidische Norm nur verwendet, weil sie dem als natürlich empfundenen Längenbe-
griff entspricht.
In der Tat kann man genauso ℓ(γ) definieren, wenn γ eine beliebige Funktion von
[a, b] in einen Banachraum (X, k.k) ist.
Es gelten dann dieselben Eigenschaften, die wir eben aufgezählt haben, und ist
ℓ(γ) < +∞, so spricht man von γ als einer Funktion von beschränkter Variation.
Äquivalente Normen k.k und |k.k|, d.h. αk.k ≤ |k.k| ≤ βk.k, induzieren zwar verschie-
dene Längenbegriffe, aber diese sind dennoch vergleichbar:
αℓk.k (γ) ≤ ℓ|k.k| (γ) ≤ βℓk.k (γ).
Versieht man etwa Rn mit der Norm k.k∞ oder k.k1 , so erhält man für ein und dieselbe
Funktion verschiedene Längenbegriffe. Von besonderen Interesse ist der Fall X = R.

11.2 Wegintegrale
11.2.1 Beispiel. Wir betrachten ein Objekt im Gravitationsfeld einer Punktmasse, und
wollen die Arbeit berechnen, die verrichtet wird wenn man das Objekt von einer Positi-
on zu einer anderen verschiebt. Dabei denken wir uns diese Punktmasse im Nullvektor
des R3 .
Das Newtonsche Gravitations gesetz besagt, dass abgesehen von multiplikativen
Konstanten sich die Gravitationskraft umgekehrt proportional zum Quadrat ihres Ab-
standes r zur Punktmasse verhält, dh. r12 . Zerlegt man diese Kraft, die auf einen Punkt
x = (ξ, η, ζ)T ∈ R3 wirkt, in ihre Komponenten, so erhält man den Vektor
 
ξ 
1  
F(x) = − 3 η .
kxk2 ζ 

Verschiebt man nun einen Punkt P von x zu einer sehr nahen Position x + h, so ist die
Arbeit, die verrichtet wird, wegen der Formel Arbeit = Kraft × Weg“ ungefähr gleich


− F(x), h = −F(x)T h.
Sei nun P ein Punkt in der Position x0 , und werde P längs einer Kurve γ in die Po-
sition x1 verschoben. Sei γ gegeben in Parameterdarstellung γ : [0, 1] → R3 , γ(0) =
x0 , γ(1) = x1 , und sei vorausgesetzt, dass γ hinreichend glatt ist (z.B. stetig und stück-
weise stetig differenzierbar). Wir zerlegen die Kurve in kleine Abschnitte. Sei also
0 = t0 < t1 < t2 < . . . < tn−1 < tn = 1. Wird γ durch den Polygonzug mit Ecken in γ(ti )
approximiert, dann berechnet sich die verrichtete Arbeit ungefähr durch
X
n
T 
ω≈ −F(γ(ti ) γ(ti ) − γ(ti−1 ) .
i=1

Wir werden unten sehen, dass dieser Ausdruck konvergiert, wenn man die Approxima-
tion immer genauer macht. Für diesen Grenzwert werden wir
Z
−F(x)T dx,
γ

schreiben, und ihn das Wegintegral des Vektorfeldes φ = −F T längs des Weges γ
nennen.
11.2. WEGINTEGRALE 109

Verallgemeinert haben wir folgende Ausgangssituation: Eine Menge D ⊆ Rn , eine


Funktion φ, die jedem Punkt x in D eine Abbildung von Rn nach R (oder allgemeiner in
einen Banachraum X) zuordnet, d.h. φ : D → L(Rn , X)3 , und einen Weg γ : [a, b] → D.
Die oben erwähnte Approximation der Arbeit entspricht bei gegebener Riemannscher
n(R) 
Zerlegung R = (ξ j )n(R)
j=0 ; (α j ) j=1 der Summe

X
n(R)
 
W(R) := φ γ(α j ) γ(ξ j ) − γ(ξ j−1 ) . (11.4)
j=1

11.2.2 Definition. Konvergiert das Netz W(R) R∈R in X, so nennen wir seinen Grenz-
wert Z
φ(x) dx := lim W(R)
γ |R|→0

das Wegintegral von φ längs des Weges γ.


Wegintegrale sind spezielle Riemann-Stieltjes Integrale : Ist f : [a, b] → L(Rn , X)
und g : [a, b] → Rn ein Weg, so sei (R ∈ R)

X
n(R)

P(R) := f (α j ) g(ξ j ) − g(ξ j−1 ) .
j=1

Rb
Das Riemann-Stieltjes Integral a
f dg ist definiert als limR∈R P(R), falls letzterer Li-
mes in X existiert.
Der Zusammenhang von Wegintegral und Riemann-Stieltjes Integral ist der, dass
Rb R
P(R) = W(R) und dass a f dg = γ f (x) dx, wenn g = γ und f = φ ◦ γ,.

11.2.3 Fakta.
1. Ist γ̃ : [ã, b̃] → D ⊆ Rn ein Weg und γ = γ̃ ◦ β : [a, b] → D ein zu γ̃ äquivalenter
Weg mit einer streng monoton wachsenden Bijektion
n(R) 
β : [a, b] → [ã, b̃]. Ist R = (ξ j )n(R)
j=0 ; (α j ) j=1 eine Riemannzerlegung von [a, b],
  n(R) 
so ist β(R) := β(ξ j ) n(R)j=0 ; β(α j ) j=1 eine solche von [ã, b̃] und umgekehrt. Da-
bei bleibt die Ordnung erhalten, also |R1 | ≤ |R2 | ⇔ |β(R1 )| ≤ |β(R2 )|. Außerdem
gilt W(R) = W(β(R)). Man folgert daraus auf elementare Weise, dass
Z Z
φ(x) dx = φ(x) dx.
γ̃ γ

In dem Sinne, dass wenn eines dieser Integrale existiert, dann auch das andere
existiert und diese übereinstimmen.
Ist γ− der in die Gegenrichtung durchlaufene Weg, so entsprechen sich die Rie-
mannsummen auch bijektiv, wobei die korrespondierenden
R R Summen W(R) nur
im Vorzeichen unterscheiden, und somit γ− φ(x) dx = − γ φ(x) dx.

2. Ist unser Weg rektifizierbar und stetig, d.h. ℓ(γ) < +∞, und ist φ stetig, so exis-
tiert das Integral.
Rb
Das folgt aus der allgemeineren Tatsache, dass a f dg existiert, falls f stetig
auf [a, b] und g rektifizierbar ist. Der Beweis für diese Tatsache ist ähnlich, wie
3 Man spricht von Vektorfeldern.
110 KAPITEL 11. WEGINTEGRALE

der Beweis für die Riemannintegrierbarkeit stetiger Funktionen mit Hilfe des
Cauchy-Kriteriums.
n(R1 )  n(R2 ) 
Beweis. Sind R1 = (ξ j )n(R 1)
j=0 ; (α j ) j=1 und R2 = (η j )n(R 2)
j=0 ; (β j ) j=1 zwei Rie-
mann Zerlegungen von [a, b], sodass die Stützstellen von R2 die von R1 umfas-
sen.
Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass

ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
| {z }
k( j)−k( j−1)−1 viele

Pk( j)
Es folgt mit g(ξ j ) − g(ξ j−1 ) = k=k( j−1)+1 g(ηk ) − g(ηk−1 )

kP(R2 ) − P(R1 )k ≤

X1 )
n(R
 X
k( j)

f (α j ) g(ξ j ) − g(ξ j−1 ) − f (βk ) g(ηk ) − g(ηk−1 )

j=1 k=k( j−1)+1

X1 )
n(R X
k( j)
≤ k f (α j ) − f (βk )k · kg(ηk ) − g(ηk−1 )k2 .
j=1 k=k( j−1)+1

Dabei ist k f (α j ) − f (βk )k die Abbildungsnorm auf L(Rn , X), wenn Rn mit der
euklidischen Norm versehen ist.
Wegen |α j − βk | ≤ (ηk − ηk−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)} folgt

X2 )
n(R
kP(R2 ) − P(R1 )k ≤ ρ(|R1 |) · kg(ηk ) − g(ηk−1 )k2 = ρ(|R1 |) · ℓ(g), (11.5)
k=1

wobei ρ(δ) := sups,t∈[a,b],|s−t|≤δ k f (s) − f (t)k. Wegen der gleichmäßigen Stetigkeit


von f gilt limδ→0 ρ(δ) = 0.
Seien nun R, R1 ∈ R beide mit einer Feinheit ≤ δ, wobei δ > 0 so ist, dass
ρ(δ) < ǫ. Wählt man eine gemeinsame Verfeinerung R2 von R und R1 , so
folgt aus (11.5), dass kP(R) − P(R1 )k < 2ℓ(g)ǫ. Also ist betreffliches Netz ein
Cauchy-Netz und daher konvergent.

3. Als Grenzwert von Netzen mit Werten im Banachraum X erfüllen Wegintegrale


(µ, ν ∈ R (C)):
Z Z Z
(µφ(x) + νψ(x)) dx = µ φ(x) dx + ν ψ(x) dx
γ γ γ

Entsprechend sind Riemann-Stieltjes Integrale linear nicht nur in f , sondern auch


in g.

4. Sind γ1 : [a1 , b1 ] → D, γ2 : [a2 , b2 ] → D zwei stetige und rektifizierbare Wege


mit b1 = a2 und γ1 (b1 ) = γ2 (a2 ), und ist φ : D → L(Rn , X) stetig, dann gilt
Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx. (11.6)
γ1 ⊕γ2 γ1 γ2
11.2. WEGINTEGRALE 111

Allgemeiner folgt für ein stetiges f : [a, c] → L(Rn , X), ein rektifizierbares
g : [a, c] → Rn und ein b ∈ (a, c), dass
Z c Z b Z c
f dg = f dg + f dg.
a a b

Beweis. Die Voraussetzungen gewährleisten, dass alle Integrale existieren. Zu


Rb
gegebenem ǫ > 0 sei δ > 0 so klein, dass kP(R1 ) − a f dgk < ǫ,
Rc Rc
kP(R2 ) − b f dgk < ǫ und kP(R) − a f dgk < ǫ für jede Riemann-Zerlegung R1
von [a, b], jede Riemann-Zerlegung R2 von [b, c] und jede Riemann-Zerlegung
R von [a, c] mit |R1 |, |R2 |, |R| < δ.
Sind R1 und R2 zwei beliebige Riemann-Zerlegungen von [a, b] bzw. [b, c] mit
|R1 |, |R2 | < δ, so sei R jene Riemann-Zerlegungen von [a, c], deren Stütz- und
Zwischenstellen genau jene von R1 und R2 umfasst. Dann gilt |R| < δ und P(R) =
P(R1 ) + P(R2 ). Somit folgt aus der Dreiecksungleichung
Z b Z c Z c

f dg + f dg − f dg ≤
a b a
Z b Z c Z c
+ P(R) − < 3ǫ.
P(R1 ) − f dg + P(R2 ) − f dg f dg
a b a

Da ǫ > 0 beliebig war, gilt die behauptete Gleichheit.



5. Es gilt
X
n(R)
kP(R)k ≤ k f (α j )k · kg(ξ j ) − g(ξ j−1 )k2 ≤
j=1

X
n(R)
max k f (t)k kg(ξ j ) − g(ξ j−1 )k2 ≤ max k f (t)k · ℓ(g).
t∈[a,b] t∈[a,b]
j=1

Daraus sieht man, dass für konstantes g das Riemann-Stieltjes Integral existiert
und verschindet. Entsprechend verschwindet das Wegintegral über einen kon-
stanten Weg.
Existiert das Riemann-Stieltjes Integral (Wegintegral), so ist seine Norm kleiner
oder gleich maxt∈[a,b] k f (t)k · ℓ(g) bzw. maxt∈[a,b] kφ ◦ γ(t)k · ℓ(γ).
6. Ist γ : [0, 1] → D ein gerade Strecke, also γ(t) = ty + (1 − t)x, und ist φ stetig, so
P 
gilt W(R) = n(R) j=1 (ξ j − ξ j−1 )φ γ(α j ) (y − x) und daher
Z Z 1 Z 1 !
 
φ(x) dx = φ ty + (1 − t)x (y − x) dt = φ ty + (1 − t)x dt (y − x).
γ 0 0

Um konkret Riemann-Stieltjes Integrale bzw. in Folge Wegintegrale auszurechnen


dient am besten folgender Satz.
11.2.4 Satz. Ist g ∈ C 1 [a, b] und f stetig, so folgt
Z b Z b
f dg = f (t) g′ (t) dt.
a a
112 KAPITEL 11. WEGINTEGRALE

Ist γ ∈ C 1 [a, b] und φ stetig, so gilt


Z Z b

φ(x) dx = φ γ(t) γ′ (t) dt.
γ a

Dasselbe gilt für stetige und stückweise stetig differenzierbare Wege g bzw. γ.

Beweis. Nach dem Haupsatz der Differential- und Integralrechnung gilt (R ∈ R)

X
n(R)

P(R) = f (α j ) g(ξ j ) − g(ξ j−1 ) =
j=1

X
n(R) Z ξj Z b
f (α j ) g′ (t) dt = fR (t) g′ (t) dt,
j=1 ξ j−1 a

wobei fR (t) die stückweise konstante Funktion mit fR (t) = f (α j ), t ∈ [ξ j−1 , ξ j ), j =


1, . . . , n(R), und fR (b) = f (αn(R) ) ist. Für t ∈ [ξ j−1 , ξ j ), 1 ≤ j < n(R), bzw. für t ∈
[ξn(R)−1 , ξn(R) ] gilt

k fR (t) g′ (t) − f (t) g′ (t)k ≤ k fR (t) − f (t)k · kg′ (t)k2 =

k f (α j ) − f (t)k · kg′ (t)k2 ≤ ρ(|R|) · max kg′ (s)k2 .


s∈[a,b]
′ ′
Somit gilt limR∈R fR (t) γ (t) = f (t) γ (t) und zwar gleichmäßig in t ∈ [a, b]. Nach Satz
8.7.2 angewandt auf ein gleichmäßig konvergentes Netz von Funktionen erhalten wir
Z b
lim P(R) = lim fR (t) g′ (t) dt =
R∈R R∈R a
Z b Z b

lim fR (t) g (t) dt = f (t) g′ (t) dt.
a R∈R a
Für stetige und stückweise stetig differenzierbare Kurven folgt die Behauptung aus
dem gerade bewiesenen und Fakta 11.2.3, 4.

11.2.5 Bemerkung. Ist X = Rm , so stellt man φ : D → L(Rn , X) meist als m × n-Matrix
dar. Sind γ j (t) die Komponenten unseres Weges, so berechnet man das Wegintegral
durch   ′ 
Z b  φ11 (γ(t)) · · · φ1n (γ(t))  γ1 (t)
 .. ..   .. 
 . .   .  dt.
a   
φm1 (γ(t)) · · · φmn (γ(t)) γn′ (t)

11.2.6 Definition. Ist D ⊆ C, h : D → C und γ : [a, b] → D ein Weg, so ist das


komplexe Wegintegral definiert durch
Z X
n(R)
 
h(z) dz := lim h γ(α j ) · γ(ξ j ) − γ(ξ j−1 ) , (11.7)
γ |R|→0
j=1

falls dieser Limes existiert.


11.2. WEGINTEGRALE 113

Man beachte, dass die Summanden in (11.7) Produkte zweier komplexer Zahlen
sind. Zum Vergleich sind die Summanden in (11.4) Elemente aus X, die man erhält,
 
wenn man γ(ξ j ) − γ(ξ j−1 ) ∈ Rn auf die lineare Abbildung φ γ(α j ) ∈ L(Rn , X) an-
wendet. Um dennoch komplexe Wegintegrale als Wegintegrale betrachten zu können
sei bemerkt, dass für z, w ∈ C
! ! !
Re(zw) Re w − Im w Re z
= . (11.8)
Im(zw) Im w Re w Im z

Identifizieren wir C mit R2 , so lässt sich also die komplexe Multiplikation als An-
wendung eins Zweivektors auf eine lineare Abbildung aus L(R2 , R2 ) realisieren. Somit
nimmt (11.7) die Form
Z X
n(R) Z
 
h(z) dz  lim φ γ(α j ) γ(ξ j ) − γ(ξ j−1 ) = φ(x) dx (11.9)
γ |R|→0 γ
j=1

an, wenn wir γ(ξ j ) − γ(ξ j−1 ) als Zweivektor betrachten und
!
Re h(z) − Im h(z)
φ(z) :=
Im h(z) Re h(z)
setzen.
Insbesondere existiert dieses Wegintegral für stetiges h sowie stetiges und rektifi-
zierbares γ. Ist γ sogar C 1 , so folgt aus Satz 11.2.4
Z Z b
φ(x) dx = φ(γ(t)) γ′ (t) dt.
γ a

′ 2
Da φ(γ(t)) γ (t) (∈ R ) als komplexe Zahl aufgefasst nichts anderes als die komplexe
Multiplikation h(γ(t)) · γ′ (t) ist, lässt sich das komplexe Wegintegral in diesem Fall
durch Z Z b
h(z) dz = h(γ(t)) · γ′ (t) dt (11.10)
γ a
berechnen. Schließlich folgt aus Fakta 11.2.3, 5, zusammen mit Beispiel 9.2.9, (v), dass
Z

h(z) dz ≤ max |h ◦ γ(t)| · ℓ(γ). (11.11)
γ t∈[a,b]

11.2.7 Bemerkung. Wie im Abschnitt über Wege ist bisher auch nirgends eingegangen,
dass g bzw. γ in den (Rn , k.k2 ) hinein abbildet.
Die obigen Resultate samt Beweise bleiben gültig, wenn g bzw. γ das Intervall
[a, b] in eine Menge D ⊆ Y (Y ist Banachraum) abbilden, und f : [a, b] → L(Y, X) bzw.
φ : D → L(Y, X), also jedem t ∈ [a, b] bzw. y ∈ D eine beschränkte lineare Abbildung
von Y nach X zuordnet.
Mit Hilfe dieser Wegintegrale lässt sich nun ein mehrdimensionales Analogon der
Rb
Tatsache a f ′ (t) dt = f (b) − f (a) herleiten.
11.2.8 Satz. Sei f : D ⊆ Rn → X eine stetig differenzierbare Funktion mit der Ablei-
tung d f (x) ∈ L(Rn , X). Ist γ ein stetiger und stückweise stetig differenzierbarer Weg, so
gilt Z
 
d f (x) dx = f γ(b) − f γ(a) .
γ
114 KAPITEL 11. WEGINTEGRALE

Beweis. Ist a = t0 < t1 < · · · < tl = b so, dass γ|[t j−1 ,t j ] ∈ C 1 [t j−1 , t j ], so folgt aus der
Kettenregel und dem Hauptsatz
Z Z b Z b

d f (x) dx = d f γ(t) γ′ (t) dt = ( f ◦ γ)′ (t) dt =
γ a a

X
l 
   
f γ(t j ) − f γ(t j−1 ) = f γ(b) − f γ(a) .
j=1


11.2.9 Definition. Vektorfelder φ : D → L(Rn , X), die Ableitungen d f stetig differen-
zierbarer Funktionen f : D → X sind, heißen auch Gradientenfelder.
Stetige Vektorfelder φ : D → L(Rn , X) mit der Eigenschaft, dass Wegintegrale
von φ über stetige und stückweise stetig differenzierbare Wege nur von Anfangs- und
Endpunkt des Weges abhängen nennt man wegunabhängige Vektorfelder.
Satz 11.2.8 besagt also, dass Gradientenfelder wegunabhängig sind.
11.2.10 Beispiel. Wir betrachten nochmals Beispiel 11.2.1. Dort war das Vektorfeld
φ : R3 \ {0} → L(R3 , R) durch φ(x) = kxk1 3 (ξ, η, ζ) gegeben. Nun ist aber, φ(x) =
2
d f (x), wobei f (x) = − kxk1 2 . Insbesondere berechnet sich die Arbeit, die man verrichten
muss, um einen Punkt P von x0 nach x1 entlang eines stetigen und stückweise stetig
differenzierbaren Weges γ zu bewegen, durch
Z
1 1
φ(x) dx = − .
γ kx k
0 2 kx 1 k2

11.2.11 Lemma. Sei hY, di ein metrischer Raum und M ⊆ Y eine feste nichtleere Teilmenge. Wir definieren für x ∈ Y

d(x, M) = inf d(x, y) : y ∈ M , (11.12)

und für Teilmengen A, B von Y 


d(A, B) = inf d(x, y) : x ∈ A, y ∈ B . (11.13)
Dann gilt

Die Funktion x 7→ d(x, M) eine stetige Funktion von Y nach [0, +∞).

Es gilt y ∈ M ⇒ d(y, M) = 0. Ist M ⊆ Y abgeschlossen, so gilt auch d(y, M) = 0 ⇒ y ∈ M.

Sind A und B disjunkt und A kompakt, so gibt es ein x ∈ A, sodass d(x, B) = d(A, B).

Sind A und B disjunkt und A kompakt und B abgeschlossen, so ist d(A, B) > 0

Beweis. Sind x1 , x2 ∈ Y, so folgt leicht aus (11.12), dass d(x1 , M) ≤ d(x1 , x2 ) + d(x2 , M) und aus Symmetriegründen
d(x2 , M) ≤ d(x1 , x2 ) + d(x1 , M). Also gilt |d(x1 , M) − d(x2 , M)| ≤ d(x1 , x2 ), und daraus folgt die Stetigkeit.
Aus y ∈ M folgt trivialerweise d(y, M) ≤ d(y, y) = 0. Andererseits folgt aus d(y, M), dass d(y, yn ) → 0 für eine Folge
(yn )n∈N aus M. Wegen der Abgeschlossenheit folgt y ∈ M.
Ist A kompakt, so hat gemäß Proposition 6.1.11 die stetige Funktion x 7→ d(x, B) auf der kompakten Menge
A ein Minimum bei einem Punkt x ∈ A. Also gilt d(x, B) ≤ d(z, B), z ∈ A. Wegen Lemma 2.7.10 gilt somit
d(A, B) = inf{d(z, B) : z ∈ A} = d(x, B). Ist noch dazu B abgeschlossen, so muss auch d(A, B) = d(x, B) > 0.

n
11.2.12 Bemerkung. Eine einfache aber hilfreiche Tatsache ist folgende. Sei D ⊆ R eine offene Menge und γ : [a, b] → D
stetig. Nach Proposition 6.1.11 ist γ([a, b]) kompakte Teilmenge von Rn . 
Ist D , Rn , so wissen wir aus Lemma 11.2.11, dass 0 < d γ([a, b]), Rn \ D . Im Fall D = Rn setzen wir einfach
d γ([a, b]), Rn \ D = +∞. 
Ist nun x ∈ Rn mit d(x, γ([a, b])) < d γ([a, b]), Rn \ D , so folgt klarerweise x ∈ D.
11.2. WEGINTEGRALE 115

Ist γ : [a, b] → Rn ein Weg und ist R eine Riemannzerlegung von [a, b], so sei zunächst γ̃R : [0, n(R)] → Rn der
Polygonzug
−−−−−−−−→ −−−−−−−−−−−→
γ(ξ0 )γ(ξ1 ), . . . , γ(ξ p−1 )γ(ξ p ).
Nun bezeichne γR : [a, b] → Rn die Umparametrisierung γ̃R ◦ α von γ̃R , wobei α : [a, b] → [0, n(R)], sodass ( j =
1, . . . , n(R))
t − ξ j−1
α(t) = j − 1 + , t ∈ [ξ j−1 , ξ j ].
ξ j − ξ j−1
Offensichtlich gilt dann γR (ξ j ) = γ(ξ j ), j = 0, . . . , n(R).

11.2.13 Lemma. Sei D ⊆ Rn eine offene Menge und γ : [a, b] → D stetig. Zu jedem ǫ ∈ R, 0 < ǫ < d γ([a, b]), Rn \ D
gibt es ein δ > 0, sodass für jede Riemannzerlegungen R von [a, b] mit |R| ≤ δ gilt


kγ(s) − γR (t)k2 ≤ ǫ, s, t ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R), (11.14)

 supt∈[a,b] kγ(t) − γR (t)k2 ≤ ǫ, also insbesondere d(γR (t), γ([a, b])) ≤ ǫ für alle t ∈ [a, b],

 der stetige Weg γR und auch alle Konvexkombinationen (α ∈ [0, 1])

γα := α · γ + (1 − α) · γR

ganz in D verlaufen, dh. γα (t) ∈ D, t ∈ [a, b], α ∈ [0, 1],



Beweis. Wir setzen ρ := d γ([a, b]), Rn \ D . Nach Bemerkung 11.2.12 gilt ρ > 0. Wegen Satz 6.3.3 ist γ gleichmäßig stetig.
Also gibt es zu jedem ǫ ∈ (0, ρ) ein δ > 0, sodass

ǫ
kγ(s) − γ(t)k2 ≤ , wenn |s − t| ≤ δ. (11.15)
2

Sei R = (ξ j )n(R) j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung mit |R| ≤ δ, also |ξ j − ξ j−1 | ≤ δ. Für s, t ∈ [ξ j−1 , ξ j ] gilt wegen
γR (ξ j ) = γ(ξ j )
kγ(s) − γR (t)k2 ≤ kγ(s) − γ(ξ j )k2 + kγR (ξ j ) − γR (t)k2 ≤ ǫ.
Also gilt (11.14). Unmittelbar daraus folgt supt∈[a,b] kγ(t) − γR (t)k2 ≤ ǫ.
Aus d(γR (t), γ([a, b])) ≤ kγ(t) − γR (t)k2 ≤ ǫ < ρ folgt mit Bemerkung 11.2.12, dass γR (t) ∈ D. Schließlich folgt aus

kγ(t) − γα (t)k2 = kγ(t) − α · γ(t) − (1 − α) · γR (t)k2 = (1 − α) · kγ(t) − γR (t)k2 < ρ.

genauso, dass auch γα (t) ∈ D.



11.2.14 Lemma. Sei D ⊆ Rn eine offene Menge und φ : D → L(Rn , X) stetig und γ : [a, b] → Rn rektifizierbar und stetig.
Dann gilt Z Z Z
lim φ(x) dx = lim φ(x) dx = φ(x) dx, (11.16)
|R|→0 γR |R|→0 γ̃R γ

wobei die Wegintegrale von φ über die Wege γR bzw. γ̃R für alle hinreichend kleinen |R| definiert sind.

Beweis. Nach
R Lemma 11.2.13
R verläuft γR bzw. γ̃R ganz in D für alle hinreichend kleinen |R|. Da γR und γ̃R äquivalent sind,
gilt immer γ φ(x) dx = γ̃ φ(x) dx.
R R 
d γ([a,b]),Rn \D
Wir setzen ρ := min( 2 , 1) > 0. Die Menge

Kρ γ([a, b]) = {x ∈ Rn : d(x, γ([a, b])) ≤ ρ}

ist als Urbild der abgeschlossenen Menge (−∞, ρ] unter der stetigen  Abbildung x 7→ d(x, γ([a, b])) abgeschlossen. Da
γ([a, b]) kompakt und daher beschränkt ist, hat auch Kρ γ([a, b]) die Eigenschaft. Wegen Korollar 5.2.13 ist diese Menge
sogar kompakt. Nach Bemerkung 11.2.12  ist sie in D enthalten. 
Sei nun ǫ ∈ (0, d γ([a, b]), Rn \ D ). Wegen Satz 6.3.3 ist φ auf Kρ γ([a, b]) gleichmäßig stetig. Somit können wir ein
η > 0 finden, sodass
ǫ 
kφ(x) − φ(y)k ≤ ℓ(γ) · , wenn x, y ∈ Kρ γ([a, b]) , kx − yk2 ≤ η. (11.17)
2 · ℓ(γ)
Das ǫ von Lemma 11.2.13 sei jetzt min(ǫ,
R η). Also erhalten wir ein δ > 0 mit alle den Eigenschaften in Lemma 11.2.13.
Gemäß Fakta 11.2.3, 2, existiert γ φ(x) dx. Somit gibt es ein θ ∈ (0, δ] > 0, sodass

Z
ǫ
W(R) − φ(x) dx ≤
γ 2


wenn nur |R| ≤ θ. Sei R = (ξ j )n(R)
j=0
; (α j )n(R)
j=1
eine Riemann-Zerlegung mit |R| ≤ θ (≤ δ).
116 KAPITEL 11. WEGINTEGRALE

 R1 
Mit Fakta 11.2.3, 4, 6, und wegen φ γ(α j ) = 0 φ γ(α j ) dt erhalten wir folgende Abschätzung
Z n(R) Z
X 1   
W(R) − φ(x) dx ≤ φ γ(α j ) − φ tγ(ξ j ) + (1 − t)γ(ξ j−1 ) dt · kγ(ξ j ) − γ(ξ j−1 )k2 . (11.18)
γR j=1 0

Wegen |ξ j − α j |, |ξ j−1 − α j | ≤ δ und (11.14)4 folgt

ktγ(ξ j ) + (1 − t)γ(ξ j−1 ) − γ(α j )k2 ≤ tkγ(α j ) − γ(ξ j )k2 + (1 − t)kγ(α j ) − γ(ξ j−1 )k2 ≤ min(ǫ, η) ≤ η, (11.19)
  ǫ
und wegen (11.17) auch kφ tγ(ξ j ) + (1 − t)γ(ξ j−1 ) − φ γ(α j ) k ≤ 2·ℓ(γ) für t ∈ [0, 1]. Somit lässt sich (11.18) nach oben
abschätzen durch (vgl. (9.11))
X
n(R)
ǫ ǫ
· kγ(ξ j ) − γ(ξ j−1 )k2 ≤ .
j=1
2 · ℓ(γ) 2

Aus der Dreiecksungleichung schließlich


Z Z

φ(x) dx − φ(x) dx ≤ ǫ.
γ γR


11.2.15 Bemerkung. Aus Lemma 11.2.14 erkennen wir, dass ein stetiges Vektorfeld φ : D → L(Rn , X) bereits wegun-
abhängig ist, wenn Wegintegrale von φ nur über Polygonzüge jeweils nur von Anfangs- und Endpunkt abhängen.
In dem Fall sind Wegintegrale von φ sogar über alle stetigen und rektifizierbaren Wege wegunabhängig.

Als Umkehrung von Satz 11.2.8 gilt folgender Satz 11.2.16, wobei zwei Punkte
x, y in einer Menge D ⊆ Rn durch den Weg γ : [a, b] → D verbindbar heißen, wenn
γ(a) = x und γ(b) = y.
11.2.16 Satz. Sei D ⊆ Rn eine offene Menge, sodass sich je zwei Vektoren in D
durch einen stetigen und stückweise stetig differenzierbaren Weg verbinden lassen. Sei
φ : D → L(Rn , X) stetig und wegunabhängig. Dann gilt φ(x) = d f (x) für die stetig
differenzierbare Funktion f : D → X
Z
f (x) = φ(y) dy,
γ

wobei x0 ein fester Punkt ist, und γ irgend ein stetiger und stückweise stetig differen-
zierbarer Weg mit γ(a) = x0 , γ(b) = x ist.
Die Funktion f : D → X mit der Eigenschaft, dass φ(x) = d f (x), ist dabei eindeutig
bis auf eine additive Konstante aus X.
∂f
Beweis. Nach Voraussetzung ist f wohldefiniert. Wir zeigen ∂x i
(x) = φ(x)ei für alle
i = 1, . . . , n.
Seien x ∈ D und δ > 0 so, dass Uδ (x) ⊆ D. Sei γ : [a, b] → D ein Weg mit
γ(a) = x0 , γ(b) = x. Für t ∈ (−δ, δ) sei βt : [0, 1] → Rn die gerade Strecke βt (s) =
s(x+tei )+(1− s)x und γt : [b, b+1] → Rn der zu βt äquivalente Weg γt (τ) = βt (τ−b) =
x + t(τ − b)ei . Es folgt
Z Z Z
f (x + tei ) = φ(x) dx = φ(x) dx + φ(x) dx.
γ⊕γt γ γt

Also
Z Z Z 1
f (x + tei ) − f (x) 1 1
= φ(x) dx = φ(x) dx = φ(x + tsei ) ei ds.
t t γt t βt 0
4 Man beachte, dass γR (ξ j ) = γ(ξ j ).
11.2. WEGINTEGRALE 117

Wegen der Stetigkeit der Funktion φ konvergiert der Integrand für t → 0 gleichmäßig
∂f
in s ∈ [0, 1] gegen die Konstante φ(x)ei . Nach Satz 8.7.2 folgt ∂x i
(x) = φ(x)ei .
Die Eindeutigkeit folgt sofort aus Satz 11.2.8.

11.2.17 Bemerkung. Die Bedingung an die Menge D in dem Satz wird insbesondere
von konvexen Mengen D erfüllt, da zwei Punkte durch eine gerade Strecke verbunden
werden können.

Wir wollen an den Begriff einer zusammenhängender Teilmenge E eines metrischen Raumes erinnern, siehe Definition
6.2.2: E heißt zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen schreiben kann.
Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅.
11.2.18
T Lemma. Ist (Ei )i∈I eine
S Familie bestehend aus zusammenhängenden Teilmengen eines metrischen Raumes, sodass
i∈I Ei , ∅, so ist auch E := i∈I Ei zusammenhängend.
T
Beweis. Wir halten einen Punkt x ∈ i∈I Ei fest. Angenommen E = A∪B ˙ mit getrennten, nichtleereren Mengen A und B.
Wir wählen die Bezeichnung so, dass x ∈ A.
˙ ∩ Ei ) für jedes i ∈ I. Wegen c(A ∩ Ei ) ∩ (B ∩ Ei ) ⊆ c(A) ∩ B = ∅ und (A ∩ Ei ) ∩ c(B ∩ Ei ) ⊆
Es folgt Ei = (A ∩ Ei )∪(B
A ∩ c(B) = ∅ sind auch A ∩ Ei und B ∩ Ei getrennt.
Da Ei zusammenhängend
S ist, muss eine dieser Menge leer sein. Wegen x ∈ A ∩ Ei muss B ∩ Ei = ∅. Das gilt für alle
i ∈ I, und somit B ∩ E = i∈I (B ∩ Ei ) = ∅ im Widerspruch zur Wahl von A und B.

11.2.19 Lemma. Ist D ⊆ Rn eine nichtleere, offene Menge, so sind je zwei Punkte aus D genau dann durch einen stetigen
Weg verbindbar, wenn D zusammenhängend ist (vgl. Definition 6.2.2). In diesem Fall sind je zwei Punkte aus D sogar durch
einen achsenparallelen Polygonzug5 verbindbar.
Beweis. Angenommen je zwei Punkte aus D sind durch einen stetigen Weg verbindbar. Dann sei x irgendein fester Punkt
aus D. Zu jedem y ∈ D gibt es einen stetigen Weg γy : [ay , by ] → D mit γy (ay ) = x und γy (ay ) = y. Es folgt
[ [
D= {y} ⊆ γy ([ay , by ]) ⊆ D.
y∈D y∈D

Also ist D die Vereinigung der nach Proposition 6.2.4 zusammenhängenden Mengen γy ([ay , by ]), y ∈ D. Nach unserer Wahl
von γy haben diese Mengen zumindest den Punkt x gemein. Nach Lemma 11.2.18 ist D zusammenhängend.
Sei nun umgekehrt D zusammenhängend und x ∈ D wieder fest. Wir bezeichnen mit A die Menge aller Punkte y ∈ D,
die mit x durch einen achsenparallelen Polygonzug verbindbar sind. Da − →
xx auch ein solcher ist, folgt x ∈ A, also A , ∅.
Klarerweise ist B := D \ A die Menge aller y ∈ D, die mit x nicht durch einen achsenparallelen Polygonzug verbindbar sind.
Sei y ∈ A und δ > 0 so klein, dass Uδ (y) - definiert bezüglich der k.k∞ -Norm auf Rn - ganz in D enthalten ist. Ist
nun −x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m ein achsenparalleler Polygonzug von x nach y, daher x0 = x und xm = y, und z ∈ Uδ (y), so gilt
z = y + λ1 e1 + · · · + λn en mit |λ1 |, . . . , |λn | < δ und daher ist

− −−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−→
x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m , y (y + λ1 e1 ), . . . , (y + λ1 e1 + . . . λn−1 en−1 ) (y + λ1 e1 + . . . λn en )

ein achsenparalleler Polygonzug von x nach z. Also ist z ∈ A und daher Uδ (y) ⊆ A. Somit ist A offen, und kein Punkt y aus
A kann Häufungspunkt von B sein, da ja Uδ (y) keine Punkte aus B enthält. Also gilt A ∩ c(B) = ∅.
Sei nun y ∈ B und δ > 0 so klein, dass Uδ (y) ⊆ D. Ist z = y + λ1 e1 + · · · + λn en ∈ Uδ (y) und wäre z ∈ A mit einem
achsenparalleler Polygonzug −x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m von x nach z, so wäre

− −−−−−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−→
x−0−→
x1 , . . . , −
x−m−1
−−−−x→
m , z (y + λ1 e1 + . . . λn−1 en−1 ), . . . , (y + λ1 e1 ) y

ein achsenparalleler Polygonzug von x nach y, und daher y ∈ A. Dieser Widerspruch zeigt, dass z ∈ B und somit Uδ (y) ⊆ B.
Also ist auch B offen, und kein Punkt y aus B kann Häufungspunkt von A sein, da ja Uδ (y) keine Punkte aus A enthält. Somit
gilt auch c(A) ∩ B = ∅.
Da D zusammenhängend ist, und da A , ∅, muss B = ∅ bzw. D = A, was aber genau bedeutet, dass alle Punkte aus D
mit x durch einen achsenparalleler Polygonzug verbindbar sind. Klarerweise sind dann auch zwei beliebige Punkte aus D
durch einen achsenparalleler Polygonzug - zumindest via x - verbindbar.

Offene zusammenhängende Teilmengen von Rn heißen Gebiete.
11.2.20 Bemerkung. Da Polygonzüge stetig und stückweise stetig differenzierbarer sind, treffen die in Satz 11.2.16 gemach-
ten Voraussetzungen an die Menge D genau auf Gebiete zu.
Man kann die Voraussetzungen für Satz 11.2.16 noch dahingehend abschwächen, dass nur Wegintegrale von φ über
achsenparalleler Polygonzüge wegunabhängig sind. Das ist möglich, da man die Wege γ in der Aussage und im Beweis von
Satz 11.2.16 wegen Lemma 11.2.19 als achsenparallele Polygonzüge wählen kann. Der im Beweis verwendete Weg βt ist
auch eine achsenparallele gerade Strecke, womit γ ⊕ γt ebenfalls ein achsenparalleler Polygonzug ist.

ist ein Polygonzug −


5 Das x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
−−−−x→
m , wo x j − x j−1 ein skalares Vielfaches eines gewissen
kanonischen Basisvektors ei( j) für j = 1, . . . , m ist.
118 KAPITEL 11. WEGINTEGRALE

11.2.21 Lemma. Ist D ⊆ Rn eine nichtleere, offene Menge, so lässt sich D als Vereinigung von paarweise disjunkten
Gebieten schreiben: [
D= Di
i∈I

Ist γ : [a, b] → D ein stetiger Weg, so liegt das Bild von γ in genau einem dieser Gebiete.

Beweis. Wir definieren auf D eine Relation. x ∼ y gelte genau dann, wenn es ein Gebiet G ⊆ D gibt, sodass x, y ∈ G. Da
für ǫ > 0 hinreichend klein die offene Kugel Uǫ (x) ein in D enthaltenes Gebiet ist (siehe Lemma 11.2.19), ist ∼ reflexiv. Die
Symmetrieeigenschaft ist offensichtlich, und die Translativität folgt sofort aus Lemma 11.2.18.
Somit ist ∼ eine Äquivalenzrelation. Also zerfällt D in Äquivalenzklassen [x]∼ , x ∈ D. Klarerweise ist [x]∼ die
Vereinigung aller Gebiete, die x enthalten, und daher offen und zusammenhängend (vgl. Lemma 11.2.18) und daher ein
Gebiet.
Ist γ : [a, b] → D stetig, so ist
[
Di (11.20)
i∈I,γ([a,b])∩Di ,∅

als Vereinigung offener Mengen offen und enthält γ([a, b]). Für i ∈ I, γ([a, b]) ∩ Di , ∅ ist nach Lemma 11.2.18 jede der
Mengen γ([a, b]) ∪ Di zusammenhängend. Lemma 11.2.18 nochmals auf alle diese Mengen angewandt zeigt, dass (11.20)
zusammenhängend ist. Also ist diese Menge ein Gebiet und daher gleich einer der Di .

11.2.22 Bemerkung. Wendet man Satz 11.2.16 auf jedes der disjunkten Gebiete in Lemma 11.2.21 an, so erhält man
gemeinsam mit Satz 11.2.8, dass ist ein Vektorfeld genau dann Gradientenfeld ist, wenn es wegunabhängig ist.

Die Bedingung aus Satz 11.2.16 ist zwar von theoretischer Bedeutung, aber sie zu
überprüfen ist bei den meisten Vektorfeldern praktisch unmöglich. Bei stetig differen-
zierbaren Vektorfeldern gibt es eine greifbarere Bedingung.
Sei also D ⊆ Rn offen, φ : D → L(Rn , X) stetig differenzierbar. Angenommen, φ ist
die Ableitung einer Funktion f : D → X, also φ = d f . Klarerweise ist dann f ∈ C 2 (D)
und wegen dem Satz von Schwarz (x ∈ D)

∂ ∂2 f ∂2 f ∂
φ(x)e j = (x) = (x) = φ(x)ei . (11.21)
∂xi ∂x j ∂xi ∂xi ∂x j ∂x j

Wir sehen also, dass


∂ ∂
φ(.)e j = φ(.)ei , i, j ∈ {1, . . . , n}, (11.22)
∂xi ∂x j

eine notwendige Bedingung dafür ist, dass φ ein Gradientenfeld ist.


11.2.23 Beispiel. Sei D = {(x, y)T ∈ R2 : x , 0, y < π2 + πZ}, und
φ : D → L(R2 , R)  R1×2 definiert durch
! !
x tan y 1
φ = − 2 + 2xy + x2 , + x 2
+ y 2
.
y x x cos2 y

Man rechnet nun ! !


∂ x 1 ∂ x
φ e1 = − 2 + 2x = φ e2 .
∂y y x cos2 y ∂x y
Wegen (11.22) ist φ ein Kandidat für ein Gradientenfeld. Wir sind aber zu diesem
Zeitpunkt weder sicher ob es sich um ein Gradientenfeld handelt, noch haben wir es
explizit in der Hand. Um jetzt konkret auf die Suche zu gehen, nehmen wir einmal
unbestimmt f : D → R so an, dass d f = φ. Also
! !
∂f x tan y 2 ∂f x 1
= − 2 + 2xy + x , = + x2 + y2 .
∂x y x ∂y y x cos2 y
11.2. WEGINTEGRALE 119

Wegen der ersten Gleichung folgt


! Z
x tan y tan y x3
f = − 2 + 2xy + x2 dx + c(y) = + x2 y + + c(y),
y x x 3

mit einer C 2 Funktion c(y), die nur von y abhängt. Nun leiten wir das nach y ab, ver-
wenden die zweite Gleichung von oben und erhalten
!
1 2 ′ ∂f x 1
2
+ x + c (y) = = + x2 + y2 .
x cos y ∂y y x cos2 y
3
Also muss c(y) von der Gestalt c(y) = y3 + c sein. Wir sehen, dass tatsächlich φ = d f
ist, wobei !
x tan y x3 + y3
f = + x2 y + .
y x 3
Wir wollen nun zeigen, dass (11.22) für den einfachen Fall eines offenen Quaders
Q
D = ni=1 (ai , bi ) auch hinreichend ist. In der Tat gilt allgemein, dass sie sogar für so-
genannte einfach zusammenhängende Gebiete6 hinreichend ist. Die Methoden um die
allgemeinere Variante zu beweisen, bedürfen eines größeren Apparates von Mathema-
tischen Begriffen (siehe Definition 11.3.1).
Q
11.2.24 Satz. Sei D = ni=1 (ai , bi ) ⊆ Rn , und sei φ : D → L(Rn , X) stetig differenzier-
bar. Gilt dann (11.22), so ist φ ein Gradientenfeld.

Beweis. Sei c = (c j )nj=1 ∈ D fest. Für x = (x j )nj=1 ∈ D seien

v0 = c, vi := c + (x1 − c1 )e1 + . . . + (xi − ci )ei , i = 1, . . . , n.

Somit gilt insbesondere v0 = c, vn = x. Weiters sei γ der Polygonzug −


v−0−→
v1 , . . . , −
v−n−1
−−−→vn ,
und (siehe Beispiel 11.1.2 und (11.6))
Z n Z
X
f (x) := φ(y) dy = φ(y) dy.
γ −
v−j−1
−−→vj
j=1

Mit Satz 11.2.4 und mit der Substitution s = (x j − c j )t folgt


n Z
X 1 n Z
X x j −c j
f (x) = φ((1−t)v j−1 +tv j ) (v j −v j−1 ) dt = φ(v j−1 +se j ) e j ds. (11.23)
j=1 0 j=1 0

Nun leiten wir diese Gleichung nach xi ab, und werten bei x aus. Da für j < i im j-ten
Summanden von (11.23) die Variable xi nicht vorkommt, ist seine Ableitung gleich
Null.
Beim i-ten Summanden tritt xi in der oberen Integralgrenze auf, weswegen seine
Ableitung nach xi wegen der Kettenregel gleich φ(vi−1 + (xi − c j )ei )ei = φ(vi )ei ist.
Für j > i tritt xi nur im Integranden auf. Wegen Korollar 8.7.11 ist seine Ableitung
gleich Z x j −c j

φ(v j−1 + se j )e j ds
0 ∂xi
6 In der Ebene kann man sich das als Gebiet ohne Löcher vorstellen.
120 KAPITEL 11. WEGINTEGRALE

und wegen (11.22) weiter gleich


Z x j −c j

φ(v j−1 + se j )ei ds = φ(v j )ei − φ(v j−1 )ei .
0 ∂x j

Also ist die Ableitung von (11.23) nach xi gleich

∂f Xn

(x) = φ(vi )ei + φ(v j )ei − φ(v j−1 )ei = φ(vn )ei = φ(x)ei .
∂xi j=i+1

11.2.25 Beispiel. Sei I ein reelles Intervall und x : I → Rn eine C 1 -Funktion mit x(I) ⊆
D für eine gewisse offene Teilmenge D von Rn . Nun genüge x der Differentialgleichung
X
n

f j x(t) · x′j (t) = 0, t ∈ I, (11.24)
j=1

wobei f1 , . . . , fn : D → R alle in C(D) sind. Ziel ist es, mehr über die Funktion x in
Erfahrung zu bringen.
Das geht sicher dann, wenn ( f1 , . . . , fn ) : D → L(Rn , R) ein Gradientenfeld ist,
dh. wenn ( f1 , . . . , fn ) = dF für ein F ∈ C 1 (D). Man nennt (11.24) dann eine exakte
Differentialgleichung. In der Tat liest sich in diesem Fall (11.24) wegen der Kettenregel
(siehe auch Bemerkung 10.1.20) als
(F ◦ x)′ (t) = 0, t ∈ I,
und daher F ◦ x ≡ c für eine gewisse reelle Konstante c.
Ist D ein offener Quader und sind die f j alle sogar C 1 , so ist gemäß Satz 11.2.24
∂ ∂
fj = fi , i, j ∈ {1, . . . , n},
∂xi ∂x j
eine hinreichende Bedingung dafür, dass (11.24) eine exakte Differentialgleichung ist.
Nun kann es sein, dass zwar (11.24) keine exakte Differentialgleichung ist, aber es
dennoch eine Funktion m : D → R gibt, sodass die aus (11.24) abgeleitete Differenti-
algleichung

 X X
n n
 
m x(t) · f j x(t) · x′j (t) = (m · f j ) x(t) · x′j (t) = 0, t ∈ I,
j=1 j=1

eine solche ist. Dann folgt nämlich auch G ◦ x ≡ c für eine gewisse reelle Konstante c,
wobei G eine Stammfunktion des Gradientenfeldes (m · f1 , . . . , m · fn ) ist. Eine solche
Funktion m nennt man Integrierenden Faktor.

11.2.26 Beispiel. Sei b > 0 und y : (0, b) → R eine C 1 -Funktion, die der Differential-
gleichung
4x + 3y(x)2 + 2xy(x)y′ = 0 (11.25)
genügt. Um diese Gleichung mit der in Beispiel 11.2.25 vorgestellten Methode behan-
deln zu können, betrachten wir ! !
x(t) t
=
y(t) y(t)
11.3. HOMOTOPIE, EINFACHER ZUSAMMENHANG 121

als Abbildung von (0, b) nach (0, b) × R. Dann schreibt sich unsere Gleichung als
! !
x(t) ′ x(t)
f · x (t) + g · y′ (t) = 0, (11.26)
y(t) y(t)
 
wobei f (x, y)T = 4x + 3y2 und g (x, y)T = 2xy. Wegen
! !
∂ x ∂ x
f = 6y , 2y = g
∂y y ∂x y

ist (11.26) nicht exakt. Durch Multiplizieren mit m (x, y)T = x2 folgt aus (11.26) aber
! ! ! !
x(t) x(t) ′ x(t) x(t)
m ·f · x (t) + m ·g · y′ (t) = 0. (11.27)
y(t) y(t) y(t) y(t)
Wegen ! !
∂ x 2 2 ∂ x
(m · f ) = 6yx = 6x y = (m · g)
∂y y ∂x y
zusammen mit Satz 11.2.24 ist (11.27) exakt.

Man sieht leicht, dass G (x, y)T = x4 +x3 y2 eine Stammfunktion von (m· f, m·g) ist.
T
Also muss G (x(t), y(t)) = c, t ∈ (0, b) für eine Konstante c ∈ R sein. Das bedeutet
t4 + t3 y2 (t) = c bzw.
c
y2 (t) = 3 − t.
t
Da dieser Ausdruck für alle t ∈ (0, b) nichtnegativ ist, muss c ≥ b4 . Also muss
r
c
y(x) = ε · − x, x ∈ (0, b),
x3
für gewisse ε ∈ {+1, −1}, c ∈ [b, +∞). Man überprüft sofort, dass auch jede derartige
Funktion tatsächlich eine Lösung von (11.25) ist.

11.3 Homotopie, einfacher Zusammenhang


11.3.1 Definition. Sei D ⊆ Rn ein Gebiet, und seien γ0 , γ1 : [a, b] → D zwei stetige Wege. Eine Abbildung Γ : [a, b] ×
[c, d] → D (c, d ∈ R, c < d) mit
Γ(t, c) = γ0 (t), Γ(t, d) = γ1 (t), t ∈ [a, b],
heißt Homotopie zwischen γ0 und γ1 .
Haben γ0 und γ1 gleichen Anfangs- und gleichen Endpunkt, dh. γ0 (a) = γ1 (a) und γ0 (b) = γ1 (b), so heißen diese
Wege homotop in D, wenn es eine Homotopie Γ : [a, b] × [c, d] → D zwischen γ0 und γ1 gibt, sodass

Γ|{a}×[c,d] ≡ γ0 (a), Γ|{b}×[c,d] ≡ γ0 (b).

Ein Gebiet D ⊆ Rn heißt einfach zusammenhängend, wenn je zwei stetige Wege mit gleichem Anfangs- und gleichem
Endpunkt homotop sind.

Offensichtlich kann man durch affines Umskalieren immer [c, d] = [0, 1] oder dergleichen annehmen.

11.3.2 Fakta.

1. Betrachtet man statt der Homotopie Γ : [a, b]×[c, d] → D zwischen γ0 und γ1 die Homotopie (s, t) 7→ Γ(s, c+d −t),
so sieht man sofort, dass homotop zu sein eine symmetrische Eigenschaft ist.

2. Seien γ0 , γ1 : [a, b] → D stetig mit jeweils gleichem Anfangs- und gleichem Endpunkt, und sei α : [ã, b̃] → [a, b]
eine streng monoton wachsende Bijektion. Sind γ0 und γ1 homotop über die Homotopie Γ : [a, b] × [0, 1] → D, so
ist Γ̃ : [ã, b̃]×[0, 1] → D definiert durch Γ̃(s, t) = Γ(α(s), t) eine Homotopie. Also sind auch γ0 ◦α, γ1 ◦α : [ã, b̃] → D
homotop.
122 KAPITEL 11. WEGINTEGRALE

3. Sind γ0 , γ1 : [a, b] → D stetig und äquivalent, dh. γ1 = γ0 ◦ α für eine streng monoton wachsende Bijektion
α : [a, b] → [a, b], so ist
(t, r) 7→ γ0 ((1 − r)t + r · α(t))

eine Homotopie zwischen γ0 und γ1 . Wegen α(a) = a, α(b) = b sind γ0 und γ1 auch homotop.

4. Sind γ0 , γ1 , γ2 : [a, b] → D stetig mit jeweils gleichem Anfangs- und gleichem Endpunkt und sind γ0 und γ1
sowie γ1 und γ2 homotop über Homotopien Γ01 : [a, b] × [0, 1] → D und Γ12 : [a, b] × [1, 2] → D, so ist
Γ : [a, b] × [0, 2] → D definiert durch Γ(t, r) = Γ01 (t, r) falls r ∈ [0, 1] und Γ(t, r) = Γ12 (t, r) falls r ∈ [1, 2] wegen
Γ01 (t, 1) = γ1 (t) = Γ12 (t, 1) wohldefiniert.
Man zeigt leicht mit Hilfe der Charakterisierung der Stetigkeit durch Folgen, dass Γ stetig ist. Also sind auch γ0
und γ2 homotop.

5. Ist D ⊆ Rn ein Gebiet, und sind γ0 , γ1 : [a, b] → D zwei stetige Wege mit gleichem Anfangs- und gleichem
Endpunkt, sodass die Konvexkombinationen

γα (t) := α · γ1 + (1 − α) · γ0

für alle α ∈ [0, 1] und alle t ∈ [a, b] in D liegen, so ist Γ(t, α) := γα (t) stetig auf [a, b] × [0, 1] (vgl. Korollar 9.1.3).
Also sind γ0 und γ1 homotop.
Insbesondere sind konvexe Gebiete D einfach zusammenhängend.

6. Ist γ : [a, b] → D irgendein stetiger Weg, so folgt aus Lemma 11.2.13, dass für ein gewisses δ > 0 und alle
Riemannzerlegungen R von [a, b] mit |R| ≤ δ alle Konvexkombinationen

α · γR (t) + (1 − α) · γ(t)

für alle α ∈ [0, 1] und alle t ∈ [a, b] in D liegen. Also sind γ und der Polygonzug γR homotop.

7. Sei Γ : [a, b] × [c, d] → D ist stetig, und seien h0 , h1 : [a, b + d − c] → [a, b] × [c, d] definiert durch
 


 t, c t ∈ [a, b]
h0 (t) := 
 
 b, c + (t − b) t ∈ [b, b + d − c]

und durch 
 

 a, c + (t − a) t ∈ [a, a + d − c]
 t − d + c, d 
h1 (t) = 
 t ∈ [a + d − c, b + d − c]
.

Man sieht sofort, dass h0 , h1 beide stetig sind und somit auch χ0 , χ1 : [a, b+d −c] → D, wobei χ j = Γ◦h j , j = 0, 1.
Außerdem haben χ0 und χ1 den gleichen Anfangs- und den gleichen Endpunkt. Zudem ist Θ : [a, b+d−c]×[0, 1] →
D wegen der Konvexität von [a, b] × [c, d] wohldefiniert durch

Θ(t, α) = Γ(αh1 (t) + (1 − α)h0 (t)), (t, α) ∈ [a, b + d − c] × [0, 1],

wobei Θ(t, j) = χ j (t) für j = 0, 1 und t ∈ [a, b + d − c], sowie Θ(a, s) = χ0 (a) = χ1 (a) und Θ(b, s) = χ0 (b) = χ1 (b).
Als Zusammensetzung stetiger Funktionen ist Θ auch stetig. Somit sind χ0 und χ1 homotop.

11.3.3 Definition. Sei D ⊆ Rn eine offene Menge und sei φ : D → L(Rn , X) ein stetiges Vektorfeld. Dann heißt φ lokal
wegunabhängig, wenn es zu jedem x ∈ D ein offenes D(x) ⊆ D 7 gibt, sodass φ|D(x) wegunabhängig ist.

11.3.4 Bemerkung. Wegen Bemerkung 11.2.22 ist φ genau dann lokal wegunabhängig, wenn es ein lokales Gradientenfeld
ist, dh. es existiert ein offenes D(x) ⊆ D und eine f ∈ C1 (D(x)), sodass d f (y) = φ(y) für alle y ∈ D(x).
11.3.5 Bemerkung. Da mit x = (ξ j )nj=1 die Kugel Uǫ (x) (bzgl. k.k∞ gebildet) gerade der offene Quader
Q
D = nj=1 (ξ j − ǫ, ξ j + ǫ) ist, folgt aus Satz 11.2.24 und Bemerkung 11.3.4, dass für stetig differenzierbare Vektorfelder,
die Bedingung (11.22) hinreichend und wegen dem Satz von Schwarz, siehe (11.21), auch notwendig dafür ist, dass ein
Vektorfeld lokal wegunabhängig ist.

11.3.6 Satz. Sei D ⊆ Rn ein Gebiet, und sei φ : D → L(Rn , X) ein stetiges lokal wegunabhängiges Vektorfeld. Sind
γ0 , γ1 : [a, b] → D zwei stetige und rektifizierbare Wege mit gleichen Anfangs- und gleichen Endpunkten, die homotop sind,
so gilt Z Z
φ(x) dx = φ(x) dx.
γ0 γ1

Ist D sogar einfach zusammenhängend, so ist φ sogar wegunabhängig auf ganz D.

7 Klarerweise kann man D(x) kleiner machen und daher immer als ǫ-Kugel vzgl. bezüglich der k.k -Norm

annehmen.
11.3. HOMOTOPIE, EINFACHER ZUSAMMENHANG 123

Beweis. Sei ǫ > 0. Nach Lemma 11.2.14 angewandt auf γ0 bzw. γ1 ergibt ein θ > 0, sodass aus |R| ≤ θ für j = 0, 1 folgt,
dass (γ̃ j )R ganz in D verläuft und dass Z
Z
φ(x) dx − φ(x) dx ≤ ǫ. (11.28)
γj (γ̃ j )R
Weiters sei Γ : [a, b] × [0, 1] → D wie in Definition 11.3.1. Voraussetzungsgemäß gibt es zu jedem x ∈ Γ([a, b] × [0, 1])
ein ρ x > 0 mit U2ρ x (x) ⊆ D, sodass φ|U2ρ x (x) wegunabhängig ist. Also ist (Uρ x (x))x∈Γ([a,b]×[0,1]) eine offene Überdeckung
der kompakten Menge Γ([a, b] × [0, 1]). Wir werden im letzten Kapitel sehen, dass dann schon endlich viele dieser offenen
Mengen genügen, um Γ([a, b] × [0, 1]) zu überdecken. Also gibt es x1 , . . . , xm ∈ Γ([a, b] × [0, 1]), sodass

[
m
Uρ x j (x j ) ⊇ Γ([a, b] × [0, 1]). (11.29)
j=1

Wir setzen ρ := min(ρ x1 , . . . , ρ xm ) > 0. Ist x ∈ Γ([a, b] × [0, 1]) und y ∈ Uρ (x), so gilt d∞ (x, x j ) < ρ ≤ ρ x j für ein
j ∈ {1, . . . , m}, und daher d∞ (y, x j ) < 2ρ. Es folgt Uρ (x) ⊆ U2ρ x j (x j ). Somit ist φ|Uρ (x) wegunabhängig.

Gemäß Satz 6.3.3 gibt es ein η ∈ (0, θ], sodass aus max(|s1 − s2 |, |t1 − t2 |) = d∞ (s1 , t1 ), (s2 , t2 ) < η folgt, dass
kΓ(s1 , t1 ) − Γ(s2 , t2 )k∞ < ρ. Seien a = s0 < s1 < · · · < s p = b, 0 = t0 < t1 · · · < t p = 1, sodass |s j − s j−1 |, |tk − tk−1 | < η für
alle j, k = 1, . . . , p. Also verlaufen die Polygonzüge
−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→
α jk := Γ(s j−1 , tk−1 ) Γ(s j−1 , tk ), Γ(s j−1 , tk ) Γ(s j , tk ) und β jk := Γ(s j−1 , tk−1 ) Γ(s j , tk−1 ), Γ(s j , tk−1 ) Γ(s j , tk )

ganz in Uρ (Γ(s j , tk )) ⊆ D, und somit


Z Z Z
0= φ(x) dx − φ(x) dx = φ(x) dx,
α jk β jk γ jk

−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−−−−→


wobei γ jk : [0, 4] → D den Polygonzug Γ(s j−1 , tk−1 ) Γ(s j−1 , tk ), Γ(s j−1 , tk ) Γ(s j , tk ), Γ(s j , tk ) Γ(s j , tk−1 ), Γ(s j , tk−1 ) Γ(s j−1 , tk−1 )
bezeichnet. Aufsummieren über j und k ergibt

p Z
X p Z
X p Z
X
0= φ(x) dx = −−−−−−−−−−−−−−−−−−−−−−−→
φ(x) dx + −−−−−−−−−−−−−−−−−−→
φ(x) dx
j,k=1 γ jk j,k=1 Γ(s j−1 ,tk−1 ) Γ(s j−1 ,tk ) j,k=1 Γ(s j−1 ,tk ) Γ(s j ,tk )

p Z
X p Z
X
− −−−−−−−−−−−−−−−−−−−−−−−→
φ(x) dx − −−−−−−−−−−−−−−−−−−→
φ(x) dx.
j,k=1 Γ(s j−1 ,tk−1 ) Γ(s j ,tk−1 ) j,k=1 Γ(s j ,tk−1 ) Γ(s j ,tk )

Nach Indexverschiebungen (k k + 1 bzw. j j − 1) in den letzten beiden Summen kürzen sich die meisten Summanden
der ersten (zweiten) Summe mit welchen aus der vierten (dritten) Summe. Übrig bleibt

p Z
X p Z
X
0= −−−−−−−−−−−−−−−−−−→
φ(x) dx + −−−−−−−−−−−−−−−−−−→
φ(x) dx
k=1 Γ(s0 ,tk−1 ) Γ(s0 ,tk ) j=1 Γ(s j−1 ,t p ) Γ(s j ,t p )

p Z
X p Z
X
− −−−−−−−−−−−−−−−−−−−→
φ(x) dx − −−−−−−−−−−−−−−−−−−→
φ(x) dx. (11.30)
k=1 Γ(s p ,tk−1 ) Γ(s p ,tk ) j=1 Γ(s j−1 ,t0 ) Γ(s j ,t0 )

Man beachte, dass Γ(s0 , t) = Γ(a, t) = γ0 (a) und Γ(s p , t) = Γ(b, t) = γ0 (b) für alle t ∈ [0, 1]. Also sind die gerade Strecken
−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−−→
Γ(s0 , tk−1 ) Γ(s0 , tk ) und Γ(s p , tk−1 ) Γ(s p , tk ) konstant, und somit verschwinden alle Wegintegrale in der ersten und in der
dritten Summe in (11.30). Setzen wir
−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−→ −−−−−−−−−−−−−→
γ̃0 := Γ(s0 , 0) Γ(s1 , 0), . . . , Γ(s p−1 , 0) Γ(s p , 0) = γ0 (s0 ) γ0 (s1 ), . . . , γ0 (s p−1 ) γ0 (s p ),

−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→ −−−−−−−−−−−→ −−−−−−−−−−−−−→


γ̃1 := Γ(s0 , 1) Γ(s1 , 1), . . . , Γ(s p−1 , 1) Γ(s p , 1) = γ1 (s0 ) γ1 (s1 ), . . . , γ1 (s p−1 ) γ1 (s p ),
R R
so gilt γ̃ φ(x) dx = γ̃ φ(x) dx. Außerdem gilt (γ̃ j )R = γ̃ j für j = 0, 1, wenn R eine Riemannzerlegung von [a, b] derart ist,
0 1
dass s0 , . . . , s p genau die Stützstellen von R sind. Wegen |R| < η ≤ θ folgt aus (11.28) und der Dreiecksungleichung, dass
Z Z

φ(x) dx − φ(x) dx < 2ǫ.
γ γ
0 1

Da ǫ > 0 beliebig war, folgt die erste Behauptung. Wenn D einfach zusammenhängend ist, dann sind zwei Wegen mit
gleichen Anfangs- und Endpunkt immer homotop.

11.3.7 Definition. Ein stetiger Weg γ : [a, b] → D heißt geschlossen, wenn γ(a) = γ(b).
Seien γ0 , γ1 : [a, b] → D zwei geschlossene und stetige Wege. Wir sagen, dass diese beiden radial homotop in D sind,
falls für eine gewisse Homotopie Γ : [a, b] × [c, d] → D zwischen γ0 und γ1 gilt Γ(a, s) = Γ(b, s), s ∈ [c, d].
Ein geschlossener Weg γ : [a, b] → D heißt nullhomotop, wenn er zu irgendeinem konstanten Weg β : [a, b] → D, dh.
β ≡ c ∈ D, radial homotop ist.
124 KAPITEL 11. WEGINTEGRALE

Auch hier kann [c, d] durch eine affine Transformation immer durch andere kompakte Intervalle, etwa [0, 1], ersetzt
werden.

11.3.8 Fakta.

1. Ganz ähnlich wie in Fakta 11.3.2 sieht man, dass auch radial homotop zu sein symmetrische Eigenschaft ist.

2. Seien γ0 , γ1 : [a, b] → D stetig geschlosen, und sei α : [ã, b̃] → [a, b] eine streng monoton wachsende Bijektion.
Sind γ0 und γ1 radial homotop, so sieht man wie in Fakta 11.3.2, dass auch γ0 ◦ α, γ1 ◦ α : [ã, b̃] → D radial
homotop sind.

3. Ähnlich wie in Fakta 11.3.2 sieht man auch, dass zwei stetige, geschlossene und äquivalente Wege γ0 , γ1 : [a, b] →
D radial homotop im Sinne von Definition 11.3.7 sind.

4. Wie in Fakta 11.3.2 zeigt man auch für drei stetige, geschlossene Wege γ0 , γ1 , γ2 : [a, b] → D, sodass γ0 und γ1
sowie γ1 und γ2 radial homotop sind, dass dann auch γ0 und γ2 radial homotop sind.

5. Seien γ0 , γ1 : [a, b] → D zwei stetige Wege mit gleichen Anfangs- und gleichen Endpunkt, und sei γ : [a, 2b−a] →
D definiert duch
γ|[a,b] = γ0 und γ(b + t − a) = γ1 (a + b − t), t ∈ (a, b]. (11.31)

Dann ist γ offensichtlich stetig und geschlossen. Ist umgekehrt γ : [a, 2b − a] → D stetig und geschlossen, und
definiert man γ0 , γ1 : [a, b] → D durch (11.31), so sind das zwei stetige Wege mit gleichen Anfangs- und gleichen
Endpunkt.

6. Gilt für zwei geschlossene und stetige Wege γ0 , γ1 : [a, b] → D

Γ(t, α) := αγ0 (t) + (1 − α)γ1 (t) ∈ D,

für alle t ∈ [a, b], α ∈ [0, 1], so sind γ0 und γ1 radial homotop.

11.3.9 Bemerkung. Sei D ⊆ Rn offen und φ : D → L(Rn , X) ein stetiges Vektorfeld. Sind γ0 , γ1 , γ stetige Wege wie in Fakta
11.3.8, 5, sodass sie obendrein rektifizierbar sind, so folgt aus Fakta 11.2.3, 4 und 1, dass
Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx = φ(x) dx − φ(x) dx.
γ γ|[a,b] γ|[b,2b−a] γ0 γ1

Daraus erkennt man, dass φ genau denn wegunabhängig ist (vgl. Definition 11.2.9), wenn Wegintegrale über stetige, rekti-
fizierbare und geschlossene Wege verschwinden.
Da oben γ genau dann ein Polygonzug ist, wenn γ0 und γ1 beide Polygonzüge sind, reicht gemäß Bemerkung 11.2.15
für die Wegunabhängigkeit schon, dass Wegintegrale über geschlossene Polygonzüge verschwinden.
Gemäß Bemerkung 11.2.22 ist das notwendig und hinreichend dafür, dass φ ein Gradientenfeld ist.

11.3.10 Lemma. Sei D ⊆ Rn ein Gebiet.

Ein stetiger, geschlossener Wege γ : [0, 2π] → D ist genau dann nullhomotop, wenn es eine stetige Abbildung
Λ : D → D8 gibt, sodass γ(t) = Λ(exp(it)).

Seien γ0 , γ1 : [a, b] → D und zwei stetige Wege mit gleichen Anfangs- und gleichen Endpunkt, und sei γ : [a, 2b −
a] → D stetig und geschlossen, sodass (11.31) gilt. γ0 und γ1 sind genau dann homotop, wenn γ nullhomotop ist.

D ist einfach zusammenhängend genau dann, wenn alle stetigen geschlossenen Wege nullhomotop sind.

Beweis.

Sei γ nullhomotop, und Γ : [0, 2π] × [0, 1] → D, sodass γ(t) = Γ(t, 1), t ∈ [0, 2π], Γ(t, 0) ≡ c ∈ D, und Γ(0, s) =
Γ(2π, s).
Wir definieren Λ : D → D durch Λ(r exp(it)) := Γ(t, r). Λ ist bei 0 wohldefiniert, da Γ(t, 0) = c für alle t ∈ [0, 2π],
und Λ ist bei allen Punkten der Form r exp(i0) = r exp(i2π) wohldefiniert, da Γ(0, s) = Γ(2π, s).
Nun gilt Γ = Λ ◦ ((t, r) 7→ r exp(it)). Um einzusehen, dass Λ stetig ist, zeigen wir, dass das Urbild jeder abgeschlos-
senen Menge wieder abgeschlossen in D. Ist A ⊆ Rn abgeschlossen, so auch Γ−1 (A) ⊆ [0, 2π] × [0, 1]. Da letztere
Menge kompakt ist, ist auch Γ−1 (A) kompakt und daher auch ihr Bild unter der stetigen Abbildung (t, r) 7→ r exp(it),
welches aber genau Λ−1 (A) ⊆ D ist. Insbesondere ist Λ−1 (A) abgeschlossen.
Die Umkehrung ist einfacher, da bei gegebenen Λ die Funktion Γ(t, r) := Λ(r exp(it)) zeigt, dass γ und der konstante
Weg t 7→ Λ(0) radial homotop sind.

8D ist der abgeschlossene Einheitskreis K1 (0) im R2  C.


11.3. HOMOTOPIE, EINFACHER ZUSAMMENHANG 125

Durch affine Variablentransformation können wir [a, b] = [−1, 1] annehmen.


Sind γ0 und γ1 homotop, so gibt es eine Homotopie Γ : [−1, 1] × [−1, 1] → D zwischen γ0 und γ1 mit γ j (t) =
Γ(t, 2 j − 1), j = 0, 1, t ∈ [−1, 1].
Wir definieren Λ : D → D durch Λ(x + iy) := Γ(−x, − √ y ) für |x + iy| ≤ 1, |x| < 1 und durch Λ( j) = γ0 (− j) für
1−x2
j = −1, 1. Wege Wegen Γ(−1, s) = γ0 (−1) = γ1 (−1) und Γ(1, s) = γ0 (1) = γ1 (1) gilt
p 
Γ = Λ ◦ (s, t) 7→ (−s − it · 1 − s2 ) .

Um einzusehen, dass Λ stetig ist, sei A ⊆ Rn abgeschlossen. Nun ist Γ−1 (A) ⊆ [−1, 1] × [−1, 1]. Da letztere Menge
kompakt
√ ist, ist auch Γ−1 (A) kompakt und daher auch ihr Bild unter der stetigen Abbildung (s, t) 7→ (−s − it ·
1 − s2 ), welches aber genau Λ−1 (A) ⊆ D ist. Insbesondere ist Λ−1 (A) abgeschlossen.
Nach dem letzten Punkt ist t 7→ Λ(exp(it)), t ∈ [0, 2π] ein ein nullhomotoper Weg. Nun gilt



γ0 (− cos t) = γ(− cos t) t ∈ [0, π]
Λ(exp(it)) = Γ(− cos t, − sgn(sin t)) = 
γ (− cos t) = γ(2 + cos t) t ∈ [π, 2π]
 1

Also Λ(exp(it)) = γ(φ(t)), wobei φ(t) = − cos t, t ∈ [0, π] und φ(t) = 2+cos t, t ∈ [π, 2π]. Wir definieren schließlich
Θ : [−1, 3] × [0, 2] → D durch


Λ(α exp(i(s + 1) π2 ))
 α ∈ [0, 1]
Θ(s, α) = 
γ((2 − α)φ((s + 1) π ) + (α − 1)s) α ∈ [1, 2]
 2

Dann gilt Θ(s, 0) = Λ(0), Θ(s, 2) = γ(s) und Θ(−1, α) = Θ(3, α) = Λ(α), α ∈ [0, 1], Θ(−1, α) = Θ(3, α) = γ(−1) =
γ(3), α ∈ [1, 2]. Also ist γ nullhomotop.
Ist umgekehrt γ nullhomotop, so offensichtlich auch t 7→ γ( 2tπ − 1), t ∈ [0, 2π]. Also gibt es nach dem ersten Punkt
eine Abbildung Λ : D → D mit Λ(exp(it)) = γ( 2tπ − 1).

Wir definieren Γ : [−1, 1] × [−1, 1] → D stetig durch Γ(s, t) = Λ(−s − it · 1 − s2 ), und sehen Γ(−1, t) = Λ(1) =
γ(−1) = γ(3) = γ0 (−1) = γ1 (−1), Γ(1, t) = Λ(−1) = γ(1) = γ0 (1) = γ1 (1).
Außerdem gilt für s ∈ [−1, 1] mit cos t = −s, t ∈ [0, π]

p 2t 2t
Γ(s, −1) = Λ(−s + i 1 − s2 ) = γ( − 1) = γ0 ( − 1)
π π

und für s ∈ [−1, 1] mit cos t = cos(2π − t) = −s, t ∈ [0, π]

p 2(2π − t) 2(2π − t) 2t
Γ(s, 1) = Λ(−s − i 1 − s2 ) = γ( − 1) = γ1 (3 − ) = γ1 ( − 1).
π π π

π(δ+1)
Also ist (δ, η) 7→ Γ(− cos 2 , η), (δ, η) ∈ [−1, 1] eine Homotopie zwischen γ0 und γ1 .

Die letzte Aussage folgt sofort aus Fakta 11.3.8.


11.3.11 Korollar. Sei D ⊆ Rn ein Gebiet, und sei φ : D → L(Rn , X) ein stetiges lokal wegunabhängiges Vektorfeld. Sind
γ0 , γ1 : [a, b] → D zwei stetige, geschlossene und rektifizierbare Wege, die radial homotop sind, so gilt
Z Z
φ(x) dx = φ(x) dx. (11.32)
γ0 γ1

Ist γ ein geschlossener, rektifizierbarer und nullhomotoper Weg, so gilt


Z
φ(x) dx = 0. (11.33)
γ

Ist D sogar einfach zusammenhängend, so verschwindet dieses Integral immer.

Beweis. Sei Γ : [a, b] × [c, d] → D eine Homotopie zwischen γ0 und γ1 , sodass β(s) := Γ(a, s) = Γ(b, s), s ∈ [c, d]. Wegen
Fakta 11.3.2, 6, gibt einen zu β homotopen Polygonzug β̃ : [c, d] → D. Insbesondere ist β̃ rektifizierbar und stetig.
Wir setzen nun die Wegen γ j , j = 0, 1, fort zu Abbildungen γ̃ j : [a − 1, b + 1] → D, indem wir γ̃ j (s) = γ j (a) (= γ j (b))
für s ∈ [a − 1, a) ∪ (b, b + 1] setzen. Dadurch erhalten wir zwei offensichtlich stetige, geschlossene und vermöge der
Homotopie Γ̃ : [a − 1, b + 1] × [c, d] → D

Γ̃|[a,b]×[c,d] ≡ Γ, Γ̃(a − 1 + λ, s) = (1 − λ)β̃(s) + λβ(s), Γ̃(b + 1 − λ, s) = (1 − λ)β̃(s) + λβ(s), λ ∈ [0, 1), s ∈ [c, d],
126 KAPITEL 11. WEGINTEGRALE

homotope Wege. Die Stetigkeit von Γ̃ folgt leicht mit Hilfe der Charakterisierung der Stetigkeit durch Folgen. Man beachte,
dass Γ̃(a − 1, s) = β̃(s) = Γ(b + 1, s), s ∈ [c, d].
Da γ j |[a−1,a]∪[b,b+1] konstant ist, folgt aus (11.6), dass ( j = 0, 1)
Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx + φ(x) dx = φ(x) dx.
γ̃ j γ̃ j |[a−1,a] γj γ̃ j |[b,b+1] γj

Um (11.32) zu zeigen, können wir daher zusätzlich annehmen, dass für die Homotopie Γ : [a, b] × [c, d] → D zwischen γ0
und γ1 der stetige Weg β(s) := Γ(a, s) = Γ(b, s), s ∈ [c, d] auch rektifizierbar ist.
Wegen Fakta 11.3.2, 7, haben die Wege χ0 , χ1 : [a, b + d − c] → D definiert duch

χ0 (t) = Γ(t, c) = γ0 (t), t ∈ [a, b], χ0 (t) = Γ(b, c + (t − b)) = β(c + (t − b)), t ∈ [b, b + d − c],

χ1 (t) = Γ(a, c + (t − a)) = β(c + (t − a)), t ∈ [a, a + d − c], χ1 (t) = Γ(t − d + c, d) = γ1 (t − d + c), t ∈ [a + d − c, b + d − c],
gleichen Anfangs- und den gleichen Endpunkt, und sind als solche homotop. Also folgt aus Satz 11.3.6
Z Z
φ(x) dx = φ(x) dx.
χ0 χ1

Nun gilt aber (siehe Fakta 11.2.3, 1, und (11.6))


Z Z Z Z Z Z
φ(x) dx = φ(x) dx + φ(x) dx, φ(x) dx = φ(x) dx + φ(x) dx,
χ0 γ0 β χ1 γ1 β

und somit folgt (11.32).


Ist γ nullhomotop, so ist er per definitionem radial homotop zu einem konstanten Weg. Da Wegintegrale über konstante
Wege verschwinden, folgt aus (11.32), dass das Wegintegral über γ verschwinden.
Ist D einfach zusammenhängend, so folgt aus Lemma 11.3.10, dass jeder stetige und geschlossene Weg nullhomotop
ist.

11.4 Holomorphe Funktionen


Sei X ein Banachraum über dem Skalarkörper C. Wir wollen zunächst Funktionen f : D → X betrachten, wobei D ⊆ C offen
ist. Ist f in einem Punkt z ∈ D differenzierbar (siehe Definition 10.1.14), so existieren in z auch alle Richtungsableitungen.
Folgende Bedingung wird von zentraler Bedeutung sein:
∂f ∂f
(z) = −i · (z), (11.34)
∂x ∂y
wobei x die erste Koordinate, also den Realteil und y die zweite Koordinate, also den Imaginärteil von z ∈ D ⊆ C  R2
bezeichnet.
11.4.1 Bemerkung. Sei X ein Vektorraum über C, wobei auch X = C nicht ausgeschlossen ist. Betrchtet man dann X als
Vektorraum über R, so ist die (R-lineare) Abbildung

JX : X → X, u 7→ i · u,

offensichtlich linear. Ist X sogar ein Banachraum über C, so ist JX : X → X auch beschränkt mit Abbildungsnorm 1.
Im Fall X = C  R2 hat J := JC ∈ L(R2 , R2 ) als Matrix die Gestalt,
!
0 −1
J= .
1 0

Sind X und Y zwei Vektorräume über C, so folgt leicht, dass eine R-lineare Abbildung A : Y → X genau dann C-linear ist,
wenn
JX A = AJY .
Insbesondere kann eine R-lineare Abbildung A : R2 → X genau dann als C-lineare Abbildung A : C → X gedeutet werden
- ist also von der Form
Aζ = ζ · v, ζ ∈ C, (11.35)
 
mit einem festen v ∈ X, wenn AJ = JX A, bzw. weil 10 , 01 eine Basis von R2 ist, wenn (Je1 = e2 , Je2 = −e1 , )

Ae2 = i · Ae1 , − Ae1 = i · Ae2

als Elemente von X. Nun ist aber die zweite Bedingung offensichtlich zur ersten äquivalent. Also ist A : R2  C → X genau
dann C-lineare, wenn Ae1 = −i · Ae2 . Der Vektor v in (11.35) ist offensichtlich Ae1 = −i · Ae2 .
Im Spezialfall X = C, dh. A : R2 → R2  C, ist bedeutet AJ = JA gerade, dass A von der Form
!
a −b
A= (11.36)
b a

mit a, b ∈ R ist.
11.4. HOLOMORPHE FUNKTIONEN 127

Ist f : D → X in einem Punkt z ∈ D differenzierbar und ist d f (z) ∈ L(R2 , X) die Ableitung wie in Definition 10.1.14
und damit d f (z)e1 = ∂∂xf (z) und d f (z)e2 = ∂∂yf (z), so so ist wegen Bemerkung 11.4.1 Bedingung (11.34) dazu äquivalent,
dass d f (z) : C → X sogar C-linear ist, dh. als

d f (z)ζ = ζ · g(z), ζ ∈ C, (11.37)

für ein g(z) ∈ X geschrieben werden kann, wobei

∂f ∂f
g(w) = d f (z)e1 = (z) = −i (z).
∂x ∂y

Definieren wir schließlich für eine gegebene Funktion f : D → X das Vektorfeld φ f : D → L(R2 , X) durch

φ f (.)e1 = f (.), φ f (.)e2 = i f (.), (11.38)

∂ ∂
so ist im Falle der Differenzierbarkeit von f bei z Bedingung (11.34) äquivalent dazu, dass ∂y φ f (z)e1 = ∂x φ f (z)e2 .

11.4.2 Bemerkung. Im Fall X = C ist Bedingung (11.34) offensichtlich nichts anderes, als (Cauchy-Riemannschen Diffe-
rentielgleichungen)
∂u ∂v ∂v ∂u
(z) = (z), (z) = − (z), (11.39)
∂x ∂y ∂x ∂y
wobei u(z) := Re f (z) und v(z) := Im f (z), oder wegen (11.36) nichts anderes, als dass d f (z) von der Form
!
a(z) −b(z)
d f (z) = , (11.40)
b(z) a(z)

∂u ∂v ∂v
ist, wobei a(z) = ∂x
(z) = ∂y
(z) und b(z) = ∂x
(z) = − ∂u
∂y
(z).

11.4.3 Lemma. Sei D ⊆ C offen, X ein komplexer Banachraum, f : D → X eine Funktion und z ∈ D. Die Tatsache, dass
f in z differenzierbar ist zusammen mit der Bedingung (11.34) ist äquivalent zu der Tatsache, dass der Grenzwert - man
spricht von der komlpexen Ableitung -
df f (z + h) − f (z)
(z) := lim
dz h→0 h
in X existiert. In dem Fall gilt
df ∂f ∂f
(z) = (z) = −i · (z). (11.41)
dz ∂x ∂y

Beweis. Gemäß Definition 10.1.14 und wegen der Äquivalenz der Normen k.k2 = |.| und k.k∞ auf C ist f bei z genau dann
differenzierbar, wenn
f (z + h) = f (z) + d f (z)h + |h|ε(h), h , 0, (11.42)
für irgendeine Funktion ε : (D − z) \ {0} → X mit limh→0 ε(h) = 0. Der Ausdruck d f (z)h ist dabei die Anwendung von
h = h1 + ih2 , interpretiert als Element hh1 von R2 , auf lineare Abbildung d f (z) ∈ L(R2 , X)
2
∂f ∂f
Ist dabei (11.34) erfüllt, so wissen wir wegen (11.37), dass d f (z)h = h · g(z) für ein g(z) = ∂x (z) = −i · ∂y (z) ∈ X und
daher
f (z + h) − f (z) |h|
lim = g(z) + lim · ε(h) = 0,
h→0 h h→0 h

da k |h|
h · ε(h)k = kε(h)k → 0, h → 0.
f (z+h)− f (z)
Angenommen es existiert umgekehrt der komplexe Grenzwert g(z) := limh→0 , so folgt mit ε(h) :=
 f (z+h)− f (z)  h
h
|h| h − g(z) für h , 0 unmittelbar

f (z + h) = f (z) + h · g(z) + |h| ε(h), h , 0,

mit ε(h) → 0 für h → 0. Da die Ableitung d f (z) eindeutig ist, folgt hier d f (z)h = h · g(z) und wegen der Ausführung nach
Bemerkung 11.4.1, dass (11.34) gilt.

11.4.4 Bemerkung. Gilt die Aussage von Lemma 11.4.3 im Fall X = C, so folgt unmittelbar aus (11.40)

∂u 2 ∂v 2 d f 2
det d f (z) = (z) + (z) = (z) . (11.43)
∂x ∂x dz

Wie für komplexwertige Funktionen in Definition 11.2.6 wollen wir komplexen Wegintegrale für Banachraum-wertige
Funktionen definieren.
128 KAPITEL 11. WEGINTEGRALE

11.4.5 Definition. Ist D ⊆ C, X ein komplexer Banchraum, h : D → X und γ : [a, b] → D ein Weg, so ist das komplexe
Wegintegral definiert durch
Z X
n(R)
 
h(z) dz := lim γ(ξ j ) − γ(ξ j−1 ) · h γ(α j ) , (11.44)
γ |R|→0
j=1

falls dieser Limes in X existiert.

11.4.6 Bemerkung. Ist für h : D → X die Abbildung φh : D → L(R2 , X) definiert durch (vgl. (11.38))

φh (.)e1 = h(.), φh (.)e2 = ih(.),

so nimmt (11.44) wegen der Überlegungen für (11.35) die Form

Z X
n(R) Z
 
h(z) dz = lim φh γ(α j ) γ(ξ j ) − γ(ξ j−1 ) = φh (x) dx (11.45)
γ |R|→0 γ
j=1


an, wenn wir γ(ξ j ) − γ(ξ j−1 ) als Zweivektor betrachten.
Insbesondere existiert dieses Wegintegral für stetiges h sowie stetiges und rektifizierbares γ. Ist γ sogar C1 , so folgt
aus Satz 11.2.4 Z Z b
φh (x) dx = φh (γ(t)) γ′ (t) dt.
γ a

Da φh (γ(t)) γ′ (t) (∈ X) mit den Überlegungen für (11.35) nichts anderes als γ′ (t) · h(γ(t)) ist, lässt sich das komplexe
Wegintegral in diesem Fall durch
Z Z b
h(z) dz = γ′ (t) · h(γ(t)) dt (11.46)
γ a

berechnen. Schließlich folgt aus Fakta 11.2.3, 5, dass


Z

h(z) dz ≤ max kh ◦ γ(t)k · ℓ(γ). (11.47)
γ t∈[a,b]

11.4.7 Definition. Sei D ⊆ C offen. Eine Funktion f : D → X heißt holomorph auf D, falls sie einmal stetig differenzierbar
ist, und falls (11.34) für alle z ∈ D gilt.
Ist f : C → X auf ganz C holomorph, so nennt man f ganz.

Als Folgerung aus Lemma 11.4.3 erhalten wir

11.4.8 Korollar. Sei f : D → X eine Funktion mit offenen D ⊆ C. Folgende Aussagen sind äquiavlent.

(i) f ist holomorph.

(ii) Für alle z ∈ D existiert der Grenzwert


df f (z + h) − f (z)
(z) = lim ,
dz h→0 h
df
in X und die Funktion f ′ : D → X, f ′ (z) := dz
(z) ist stetig.

1 2
(iii) f ∈ C (D) und das Vektorfeld φ f : D → L(R , X) definiert in (11.38) ist lokal wegunabhängig bzw. ein ein lokales
Gradientenfeld.

(iv) f ∈ C1 (D) und zu jedem w ∈ D existiert eine offenes D(w) ⊆ D, und eine holomorphe Funktion F : D(w) → X mit
F ∈ C2 (D(w)), sodass F ′ (z) = f (z) für alle z ∈ D(w).

Ist schließlich f : D → C holomorph, D ⊆ C ein Gebiet, und φ f : D → L(R2 , X) sogar auf ganz D wegunabhängig
- das ist insbesondere der Fall, wenn D einfach zusammenhängend ist, so gilt F ′ = f auf D für eine bis auf eine komplexe
Konstante eindeutige holomorphe Funktion F ∈ C1 (D), wobei
Z
F(z) − F(w) = f (ζ) dζ,
γ

für alle z, w ∈ D. Es gilt sogar F ∈ C2 (D). Dabei ist die rechte Seite ein komplexes Wegintegral und γ ist irgend ein stetiger,
rektifizierbarer und in D verlaufender Weg mit Anfangspunkt w und Endpunkt z.
df
Beweis. Aus Lemma 11.4.3 folgt, dass die Existenz von dz (z) für alle z ∈ D äquivalent zur Differenzierbarkeit von f für
alle z ∈ D zusammen mit (11.34) ist. Dabei gilt ddzf (z) = ∂∂xf (z) = −i · ∂∂yf (z), siehe (11.41). Somit ist zusätzlich f noch stetig
differenzierbar genau dann, wenn f ′ stetig ist.
Es bleiben die letzten beiden Punkte zu betrachten. Aus der Überlegung rund um (11.38) folgt sofort, dass die Holo-
∂ ∂
morphie von f äquvalent zu der Tatsache ist, dass φ f : D → L(R2 , X) stetig differenzierbar ist und ∂y φ f (z)e1 = ∂x φ f (z)e2
für alle z ∈ D erfüllt. In Bemerkung 11.3.5 haben wir gesehen, dass das äquivalent zur lokalen Wegunabhängigkeit ist.
11.4. HOLOMORPHE FUNKTIONEN 129

Aus Bemerkung 11.3.4 wiederum wissen wir, dass die lokale Wegunabhängigkeit nichts anderes besagt als, dass auf
einer hinreichend kleinen offenen Menge D(w) ⊆ D gilt, dass dF(z) = φ f (z) für ein F ∈ C1 (D(w)). Offensichtlich gilt dabei
F ∈ C2 (D(w)) geanu dann, wenn φ f stetig differenzierbar ist.
Schließlich bedeutet dF(z) = φ f (z) wegen (11.34) gerade, dass F holomorph auf D(w) ist, wobei

∂F
F ′ (z) = (z) = φ f (z)e1 = f (z),
∂x

siehe (11.41).
Ist schließlich D ein Gebiet, φ f wegunabhängig - wegen Satz 11.3.6 gilt das sicher für einfach zusammenhängende D,
so folgt aus Satz 11.2.16 bzw. Bemerkung 11.2.15, dass für z, w ∈ D
Z
φ f (x) dx = F(z) − F(w),
γ

für alle in D verlaufenden, stetigen und rektifizierbaren Wege γ : [a, b] → D mit γ(a) = w und γ(b) = z. Zudem besagt Satz
11.2.16, dass F mit dF = φ f , bzw. äquivalent dazu F ′ = f , bis auf eine Konstante in XReindeutig ist. Schließlich genügt ein
Verweis auf Bemerkung 11.4.6, um obiges Wegintegral als das komplexe Wegintegral γ f (ζ) dζ zu identifizieren.

Ist X = C, so ist wegen Bemerkung 11.4.2 die Abbildung f : D → C genau dann holomorph ist, wenn f ∈ C1 (D) und
(11.39) für alle z ∈ D gilt, bzw. wenn f ∈ C1 (D) und (11.40) für alle z ∈ D gilt.
11.4.9 Bemerkung. In der Tat gilt sogar, dass f genau dann holomorph ist, wenn f auf ganz D nur differenzierbar ist und
dort (11.34) gilt, bzw. wenn der komplexe Limes limh→0 f (z+h)− h
f (z)
für alle z ∈ D existiert. Die Forderung, dass die Ableitung
stetig ist, ist also unnötig. Dieser Sachverhalt ist zwar interessant, aber für den weiteren Aufbau der Theorie holomorpher
Funktionen nicht von nöten.

11.4.10 Proposition. Sei X ein komplexer Banachraum, D, G ⊆ C offen, α, β ∈ C und f, g : D → X, φ : D → C sowie


h : G → X holomorphe Funktionen, so

 ist α f + βg : D → X holomorph mit (α f + βg)′ (z) = α f ′ (z) + βg′ (z) für z ∈ C,

 ist φ · f : D → X holomorph mit (φ · f )′ (z) = φ′ (x) f (z) + φ(z) f ′ (z) (Produktregel),

f
 f ′ f ′ (z)φ(z)− f (z)φ′ (z)
 ist im Fall, dass nicht g ≡ 0, : {z ∈ D : φ(z) , 0} → X 9 holomorph mit (z) =
φ φ φ(z)2
(Quotientenregel).

 ist im Fall, dass10 φ−1 (G) = {z ∈ D : φ(z) ∈ G} , ∅, h ◦ φ : φ−1 (G) → X holomorph mit (h ◦ φ)′ (z) = h′ (φ(z)) · φ′ (z)
(Kettenregel),

 ist im Fall, dass φ injektiv ist und dass φ′ (z) , 0 für alle z ∈ D, das Bild φ(D) offen in C und ist die Umkehrfunktion
φ−1 : φ(D) → D ⊆ C holomorph mit (φ−1 )′ (φ(z)) = φ′1(z) .

Beweis. Mit Hilfe von Korollar 11.4.8 zusammen mit Korollar 6.1.8 zeigt man ganz ähnlich wie in Satz 7.1.7 bzw. Satz
7.1.9 alle bis auf die letzte Ableitungsregeln. Wir ersparen uns die Details dazu.
Zur letzten Regel sei bemerkt, dass zunächst wegen (11.43) die Matrix dφ(z) für alle z ∈ D invertierbar ist. Aus Korollar
10.3.3 folgt somit, dass φ(D) offen ist. Die Verifikation von (φ−1 )′ (φ(z)) = φ′1(z) geschieht wie im Beweis von Satz 7.1.12.

11.4.11 Beispiel.

(i) Für jedes λ ∈ C ist die konstante Funktion f (z) = λ, z ∈ C, an jeder Stelle z ∈ C stetig differenzierbar, und ihre
Ableitung d f (z) ist immer die Nullmatrix, erfüllt somit (11.34) und ist daher holomorph.

(ii) Für die Funktion idC : z 7→ z gilt an jedem Punkt z ∈ C

(z + h) − z
lim = 1.
h→0 h

Da die konstante 1-Funktion stetig ist, folgt aus Korollar 11.4.8 die Holomorphie von idC .

(iii) Durch wiederholte Anwendung von Proposition 11.4.10 folgt, dass alle Polynome f (z) = a0 + a1 z + · · · + an zn mit
festen a0 , . . . , an ∈ C auf C holomorph sind. Dabei gilt f ′ (z) = a1 + a2 2z + · · · + an nzn−1

9 {z ∈ D : φ(z) , 0} ist als Urbild der offenen Menge C \ {0} unter der stetigen Funktion φ selber offen,

vgl. Proposition 6.1.10.


10 Man beachte, dass φ−1 (G) als Urbild einer offenen Menge unter der stetigen Funktion φ selber offen ist,

vgl. Proposition 6.1.10.


130 KAPITEL 11. WEGINTEGRALE

(iv) Aus Proposition 11.4.10 folgt auch, dass sogar alle Funktionen der Form

1 1
f (z) = a−m + · · · + a−1 + a0 + · · · + an zn
zm z

mit festen a−m , . . . , a−1 , a0 , . . . , an ∈ C holomorph und zwar nur auf C \ {0} sind.

(v) Mit der Kettenregel oder auch direkt folgt, dass für festes w ∈ C auch alle Funktionen der Form

1 1
f (z) = a−m + · · · + a−1 + a0 + · · · + an (z − w)n
(z − w)m z−w

mit festen a−m , . . . , a−1 , a0 , . . . , an ∈ C holomorph und zwar auf C \ {w} sind. Dabei gilt

1 1
f (z) = a−m (−m) + · · · + a−1 (−1) + a1 + a2 2(z − w) + · · · + an n(z − w)n−1 .
(z − w)m+1 (z − w)2

Weitere holomorphe Funktionen liefert das nächste Lemma.

11.4.12 Lemma. Sei D ⊆ C offen und [a, b] ein kompaktes reelles Intervall. Weiters sei f : D × [a, b] (⊆ R3 ) → X stetig als
Funktion auf einer Teilmenge des R3 . Zudem sei für jedes feste t ∈ [a, b] die Funktion z 7→ f (z, t) auf D holomorph. Ist dann
d
Rb
auch die Funktion (z, t) 7→ dz f (z, t) auf D×[a, b] stetig als Funktion auf einer Teilmenge des R3 , so ist z 7→ a f (z, t) dt (∈ X)
holomorph auf D und es gilt
Z b Z b
d d
f (z, t) dt = f (z, t) dt. (11.48)
dz a a dz

Beweis. Aus (11.41) folgt wegen der Holomorphie-Voraussetzung (z = x + iy ∈ D, t ∈ [a, b])

∂ d ∂ d
f (z, t) = f (z, t), f (z, t) = i f (z, t). (11.49)
∂x dz ∂y dz

Sei nun w ∈ D fest. Da D offen ist, gibt es zu jedem w ∈ D eine abgeschlossene Kugel Kρ (w) ⊆ D, wobei wir praktischer-
weise die Kugel bzgl. der k.k∞ -Norm betrachten wollen, da dann Kρ (w) = w + [−ρ, ρ] × [−ρ, ρ].
d ∂
Für festes µ ∈ [Im w − ρ, Im w + ρ] sind die Funktionen (s, t) 7→ f (s + iµ, t) und (s, t) 7→ ds f (s + iµ, t) = ∂x f (s + iµ, t)
wegen (11.49) und gemäß Voraussetzung als Funktionen von [Re w − ρ, Re w + ρ] × [a, b] nach X stetig. Gemäß (9.15) - siehe
Rb
auch Korollar 8.7.11 - ist s 7→ a f (s + iµ, t) dt auf [Re w − ρ, Re w + ρ] stetig differenzierbar, wobei für z = s + iµ ∈ Uρ (w)

Z b Z b Z b Z b
∂ d d ∂
f (z, t) dt = f (s + iµ, t) dt = f (s + iµ, t) dt = f (z, t) dt.
∂x a ds a a ds a ∂x
Rb
Da µ ∈ [Im w − ρ, Im w + ρ] beliebig war, ist insbesondere z 7→ a f (z, t) dt auf Uρ (w) stetig nach x = Re z differenzierbar.
Genauso sieht man, dass diese Funktion auch stetig nach y = Im z differenzierbar ist, wobei
Z b Z b
∂ ∂
f (z, t) dt = f (z, t) dt.
∂y a a ∂y
Rb
Also ist z 7→ a
f (z, t) dt in C1 (D). Aus obigen Gleichungen folgt wegen der Holomorphie des Integranden

Z b Z b Z b Z b
∂ ∂ ∂ ∂
f (z, t) dt = f (z, t) dt = −i · f (z, t) dt = −i · f (z, t) dt,
∂x a a ∂x a ∂y ∂y a

Rb
und daher die Holomorphie von z 7→ a
f (z, t) dt. Wegen (11.41) folgt aus dieser Gleichung auch (11.48).

11.4.13 Satz (Cauchyscher Integralsatz und Cauchysche Integralformel). Sei f : D → X holomorph.

 Ist γ : [a, b] → D stetig, rektifizierbar und nullhomotop, so gilt11


I
f (ζ) dζ = 0.
γ

t−a
 Ist w ∈ C und ρ > 0 so klein, dass Kρ (w) ⊆ D, und ist γ : [a, b] → D \ {w} der Weg t 7→ w + ρ · exp(2πi b−a ) oder in
D \ {w} radial homotop zu diesem Weg, so gilt
I
1 f (ζ)
f (w) = dζ. (11.50)
2πi γ ζ−w
H
11 Komplexe Wegintegrale über einen geschlossenen Weg schreibt man mit einem -Zeichen an.
11.4. HOLOMORPHE FUNKTIONEN 131

Beweis. Nach Korollar 11.4.8 ist φ f lokal wegunabhängig. Die erste Aussage folgt damnach sofort aus Korollar 11.3.11,
wenn man Bemerkung 11.4.6 beachtet. Für die zweite betrachte man die Funktion

f (z) − f (w)
G(z) = , z ∈ D \ {w}.
z−w

Nach Proposition 11.4.10 ist G : D \ {w} → X holomorph. Da limz→w f (z)−


z−w
f (w)
existiert, kann man G auf D durch G(w) :=
f ′ (w) stetig fortsetzen, vgl. Bemerkung 6.4.4.
Wieder wegen Korollar 11.3.11 zusammen mit Bemerkung 11.4.6 gilt
I I
G(ζ) dζ = G(ζ) dζ,
γρ γǫ

t−a
für alle ǫ ∈ (0, ρ], wobei γǫ (t) = w + ǫ · exp(2πi b−a ), da γρ und γǫ offensichtlich radial homotop in D \ {w} sind. Andererseits
kann man den Betrag der rechten Seite mit Hilfe von (11.47) nach oben abschätzen durch
Z b
max kG ◦ γǫ (t)k · ℓ(γǫ ) ≤ max kG(z)k · |γǫ′ (t)| dt = max kG(z)k · 2πǫ.
t∈[a,b] z∈Kρ (w) a z∈Kρ (w)

Da G auf Kρ (w) stetig fortgesetzt wurde, geht obiger Ausdruck für ǫ ց 0 gegen Null. Also gilt, da komplexe Wegintegrale
linear im Integranden sind, I I I
f (ζ) 1
0= G(ζ) dζ = dζ − f (w) · dζ.
γρ γρ ζ − w γρ ζ − w
H 1
Mit Hilfe von (11.10) berechnet man leicht γ ζ−w dζ = 2πi. Somit folgt (11.50) für γ = γρ . Ist γ in D \ {w} radial homotop
ρ
zu γρ , so folgt (11.50) aus Korollar 11.3.11 unter Beachtung von Bemerkung 11.4.6.

11.4.14 Bemerkung. Mit der Notation aus Satz 11.4.13 sei w ∈ D und ρ > 0 so klein, dass Kρ (w) ⊆ D. Wie man aus der
Dreiecksungleichung sofort erkennt, gilt für jedes z ∈ Uρ (w) die Relation Kr (z) ⊆ Kρ (w), wobei r = ρ − |z − w| (> 0).
Setzen wir (t ∈ [a, b])

t−a t−a
γρ (t) := w + ρ · exp(2πi ), und γ(t) := z + r · exp(2πi ),
b−a b−a

so gilt für α ∈ [0, 1]


t−a
αγ(t) + (1 − α)γρ (t) = αz + (1 − α)w + (αr + (1 − α)ρ) · exp(2πi ), (11.51)
b−a
und daher
|αγ(t) + (1 − α)γρ (t) − w| ≤ α|z − w| + (ρ − α|z − w|) = ρ.
Also liegt (11.51) in D. Andererseits gilt wegen der umgekehrten Dreiecksungleichung

t−a
0 < ρ − |z − w| = (ρ − α|z − w|) − (1 − α)|z − w| ≥ (ρ − α|z − w|) · exp(2πi ) − (1 − α)(z − w) = αγ(t) + (1 − α)γρ (t) − z .
b−a

Damit liegt (11.51) sogar immer in D \ {z}. Aus Fakta 11.3.8, 6, folgt daher, dass die Wege γρ und γ radial homotop in D \ {z}
sind. Wegen (11.50) gilt daher für alle z ∈ Uρ (w)

I Z b t−a
1 f (ζ) 1 f (w + ρ exp(2πi b−a )) t−a
f (z) = dζ = t−a · ρ exp(2πi ) dt. (11.52)
2πi γρ ζ−z b−a a w + ρ exp(2πi b−a )−z b−a

Die letzte Gleichheit gilt wegen (11.10).

11.4.15 Korollar. Ist f : D → X holomorph, so ist auch f ′ : D → C holomorph. Damit sind alle Funktionen f (n) : D → C,
n ∈ N rekursiv definiert durch f (n+1) = ( f (n) )′ , holomorph auf D. Dabei gilt für alle w ∈ D
I
n! f (ζ)
f (n) (w) = dζ. (11.53)
2πi γ (ζ − w)n+1

t−a
Hier ist γ : [a, b] → D \ {w} der Weg t 7→ w + ρ · exp(2πi b−a ) oder in D \ {w} radial homotop zu diesem Weg, wobei ρ > 0
so klein ist, dass Kρ (w) ⊆ D. Insbesondere ist f ∈ C∞ (D).

Beweis. Sei ρ > 0 so, dass Kρ (w) ⊆ D. Der Integrand von der rechten Seite von (11.52) ist offensichtlich stetig als Funktion
von (z, t) ∈ Uρ (w) × [a, b] nach C (vgl. Korollar 6.1.8).
Weiters beachte man, dass der Integrand bei festem t ∈ [a, b] als Funktion von z ∈ Uρ (w) holomorph ist, vgl. Beispiel
11.4.11. Die komplexe Ableitung des Integranden nach z ist dabei

t−a
f (w + ρ exp(2πi b−a )) t−a
t−a · ρ exp(2πi ).
(w + ρ exp(2πi b−a ) − z)2 b−a
132 KAPITEL 11. WEGINTEGRALE

Diese Funktion ist wieder offensichtlich stetig als Funktion von (z, t) ∈ Uρ (w) × [a, b] nach C (vgl. Korollar 6.1.8). Also
können wir Lemma 11.4.12 anwenden und erhalten für z ∈ Uρ (w)
Z b t−a I
1 f (w + ρ exp(2πi b−a )) t−a 1 f (ζ)
f ′ (z) = t−a · ρ exp(2πi ) dt = dζ.
b−a a (w + ρ exp(2πi b−a ) − z)2 b−a 2πi γρ (ζ − z)2

Wiederholt man obige Argumentation mit dem mittleren Riemann-Integral, so folgt aus Lemma 11.4.12, dass auch f ′ (z) auf
z ∈ Uρ (w) holomorph ist, wobei
Z b t−a I
2 f (w + ρ exp(2πi b−a )) t−a 2 f (ζ)
f ′′ (z) := ( f ′ )′ (z) = t−a · ρ exp(2πi ) dt = dζ.
b−a a (w + ρ exp(2πi b−a ) − z)3 b−a 2πi γρ (ζ − z)3

Aus (11.41) angewandt auf f ′ und f folgt f ∈ C2 (Uρ (w)). Da w ∈ D beliebig war, gilt f ∈ C2 (D), und - da Holomorphie
eine lokale Eigenschaft ist - ist f ′ holomorph auf D.
Verfährt man induktiv weiter, so folgt insbesondere (11.53) und f ∈ Cn (D) für alle n ∈ N, wobei γ = γρ in (11.53).
Für in D \ {w} zu γρ radial homotope γ folgt (11.53) aus Korollar 11.3.11 unter Beachtung von Bemerkung 11.4.6.

11.4.16 Korollar (Satz von Liouville). Ist f : C → X holomorph auf C, also ganz, und ist f beschränkt, so ist f eine
konstante Funktion.
t−a
Beweis. Es gelte k f (z)k ≤ M, z ∈ C. Ist ρ > 0 und γ(t) = w + ρ · exp(2πi b−a ), so folgt wegen (11.53) und (11.11)
I
1 f (ζ) 1 1 M
k f ′ (z)k = dζ ≤ M · ·2πρ = .
2π γ (ζ − z)
2 2π ρ2 ρ

Da wir ρ > 0 beliebig groß wählen können, folgt f ′ (w) = 0. Da auch 0′ = 0, folgt aus der Eindeutigkeitsaussage im letzten
Teil von Korollar 11.4.8, dass f konstant ist.

11.4.17 Satz (Satz von Morera). Sei D ⊆ C offen. Dann ist eine Funktion f : D → X genau dann holomorph, wenn f stetig
ist, und es zu jedem w ∈ D ein offenes D(w) ⊆ D gibt, sodass
I
f (ζ) dζ = 0
γ

für alle geschlossenen Polygonzüge γ in D(w).


In dem Fall gilt obige Aussage für D(w) = Uρ (w), wenn nur Uρ (w) ⊆ D.

Beweis. Jedes holomorphe f ist offensichtlich stetig. Wählt man zu w ∈ DH die Zahl ρ > 0 so klein, dass D(w) := Uρ (w) ⊆ D,
so ist D(w) einfach zusammenhängend, vgl. Fakta 11.3.2, 5. Nun folgt γ f (ζ) dζ aus Satz 11.4.13 sogar für alle stetigen,
rektifizierbaren und geschlossenen Wegen γ in D(w).
Gelte nun umgekehrt die im Satz gemachte Voraussetzung, und sei zu w ∈ D das offene D(w) ⊆ C wie in der Voraus-
setzung. Gemäß Bemerkung 11.4.6 gilt I Z
0= f (ζ) dζ = φ f (x) dx
γ γ

für das stetige Vektorfeld φ f : D(w) → L(R2 , X) definiert in (11.38). Gemäß Bemerkung 11.3.9 ist dieses Vektorfeld auf
D(w) wegunabhängig und daher ein Gradientenfeld. Somit gilt φ f (z) = dF(z), z ∈ D(w) für ein X-wertiges F ∈ C1 (D).
Wegen (11.34) bedeutet dF(z) = φ f (z) gerade, dass F holomorph auf D(w) ist, wobei

∂F
F ′ (z) = (z) = φ f (z)e1 = f (z).
∂x

Gemäß Korollar 11.4.15 ist auch F ′ = f auf D(w) holomorph. Da w beliebig war, und da Holomorphie eine lokale
Eigenschaft ist, folgt die Behauptung.

11.4.18 Korollar. Sei D ⊆ C offen, und fn : D → X, n ∈ N, eine Folge holomorpher Funktionen, die lokal gleichmäßig
gegen eine Funktion f : D → X konvergiert, dh. für jede kompakte Teilmenge K ⊆ D konvergiert ( fn |K )n∈N gleichmäßig auf
K gegen f |K . Dann ist auch f holomorph.

Beweis. Wähle zu w ∈ D die offene Menge D(w) wie Satz 11.4.17. Gemäß diesem Satz können wir sie sogar unabhängig
von n so wählen, dass für alle n ∈ N I
fn (ζ) dζ = 0,
γ

wenn nur γ : [0, m] → D(w) ein geschlossener Polygonzug ist. K := γ([0, m]) ist als stetiges Bild einer kompakten Menge
selber kompakt. Nun stimmt wegen (11.10) obiges Wegintegral überein mit
Z m
γ′ (t) · fn (γ(t)) dt = 0.
0
11.4. HOLOMORPHE FUNKTIONEN 133

Wegen kγ′ (t) · fn (γ(t)) − γ′ (t) · f (γ(t))k ≤ k fn − f k∞,K · kγ′ k∞,[0,m] , t ∈ [a, b], und da γ ein Polygonzug ist und daher
kγ′ k∞,[0,m] < +∞, konvergiert die Funktionenfolge γ′ · fn ◦ γ gleichmäßig gegen γ′ · f ◦ γ auf [a, b]. Aus Satz 8.7.2 folgt
somit I Z m Z m
f (ζ) dζ = γ′ (t) · f (γ(t)) dt = lim γ′ (t) · fn (γ(t)) dt = 0.
γ 0 n→∞ 0

Nach Satz 11.4.17 ist daher f holomorph.



P
11.4.19 Korollar. Seien an ∈ X, n ∈ N ∪ {0} derart, dass die Potenzreihe ∞ n
n=0 an z Peinen Konvergenzradius R > 0 hat, vgl.
Abschnitt 9.3 sowie (6.7) und Satz 6.7.8. Ist w ∈ C, so ist die Grenzfunktion f (z) = ∞ n
n=0 an (z − w) auf UR (w) holomorph.
Dabei ist UR (w) die offene Kugel bzgl. k.k2 = |.|, dh. UR (w) = {z ∈ C : |z − w| < R}.

Beweis. Sei K ⊆ UR (w) kompakt. Nun existiert r = maxz∈K |z|, da z 7→ |z| stetig auf der kompakten Menge K ist. Ist
z ∈ K ⊆ UR (w) mit |z| = r, so folgt λ z ∈ UR (w) für allePλ ∈ C mit |λ| ≤ 1. Daraus folgt unmittelbar K ⊆ Kr (0) ⊆ UR (w).
N
Nach Satz 6.7.8 konvergiert die Funktionenreihe n=0 a (z − w)n für N → ∞ gleichmäßig auf Kr (w) gegen f (z); somit
PN n
auch auf K. Da gemäß Beispiel 11.4.11 alle Polynome n=0 an (z − w)n holomorph sind, ist nach Korollar 11.4.18 auch f
auf UR (w) holomorph.

11.4.20 Satz. Sei D ⊆ C offen. Dann ist eine Funktion f : D → X genau dann holomorph, wenn f analytisch ist, dh. es zu
P∞ w ∈ D eine
jedem
n
offene Kreisscheibe Uρw (w) ⊆ D bzgl. |.| gibt, sodass sich f darauf als Grenzfunktion einer Potenzreihe
n=0 an (z − w) mit Konvergenzradius ≥ ρw darstellen lässt, vgl. Bemerkung 6.7.12.
Dabei sind die Koeffizienten an eindeutig durch f auf folgende Weise

f (n) (w)
a0 = f (w), und an := , n ∈ N.
n!

Das größt mögliche ρw , sodass sich ein holomorphes f als Potenzreihe auf Uρw (w) darstellen lässt, ist ρw = d(w, Dc ), wobei
ρw = +∞, wenn D = C.

Beweis. Lässt sich f um jedes w auf einem Uρw (w) ⊆ D lokal als Grenzfunktion einer Potenzreihe darstellen, so ist f dort
gemäß Korollar 11.4.19 holomorph. Da Holomorphie eine lokale Eigenschaft ist, muss f auf ganz D holomorph sein.
Sei nun f : D → X holomorph, und setze ρw = d(w, Dc ). Offensichtlich ist das das größte ρw mit Uρw (w) ⊆ D. Für
ρ ∈ (0, ρw ), ζ ∈ C mit |ζ − w| = ρ und für z ∈ Uρ (w) gilt

X
∞ !
1 z−w n 1 1 1
· = · z−w = .
ζ − w n=0 ζ − w ζ − w 1 − ζ−w ζ−z

Aus (11.52) folgt


I !n Z b !n
f (ζ) X z − w X
∞ ∞
1 1 t−a z−w
f (z) = · dζ = f (w + ρ exp(2πi )) · t−a dt.
2πi γρ ζ − w n=0 ζ − w b−a a b−a n=0
ρ exp(2πi b−a )

n
P P∞  |z−w| n
Wegen ∞
n=0
z−w
t−a ) = n=0 ρ < +∞ konvergiert die Reihe im obigen Riemann-Integral gleichmäßig, vgl.
ρ exp(2πi b−a
12
Korollar 6.7.4. Aus Satz 8.7.2 folgt daher

X
∞ Z b !n X
∞ I !
1 t−a z−w 1 f (ζ)
f (z) = f (w + ρ exp(2πi )) · t−a dt = n+1
dζ ·(z − w)n .
n=0
b−a a b−a ρ exp(2πi b−a ) n=0
2πi γ (ζ − w)
| {z }
=:an

P∞ n
Die letzte Gleichheit folgt aus (11.10). Also konvergiert n=0 an (z − w) und stimmt mit f (z) überein, wobei wegen (11.50)
(n)(w)
bzw. (11.53) a0 = f (w) und an := f n! , n ∈ N.
Aus (6.7) (vgl. auch Abschnitt 9.3) folgt schließlich, dass diese Potenzreihe einen Konvgenzradius R ≥ |z − w| hat, und
da z ∈ Uρ (w) beliebig war, gilt R ≥ ρ. Da auch ρ ∈ (0, ρw ) beliebig war, folgt R ≥ ρw .

Wir wollen noch den Zusammenhang zu sogenannten harmonischen Funktionen herstellen.

11.4.21 Definition. Sei X ein Banachraum über R. Ist g : G → Rm mit offenem G ⊆ R2  C zweimal stetig differenzierbar,
so bezeichnet △g : G → X (Laplace g) die Abbildung
! ! !
x ∂2 g x ∂2 g x
△g := 2 + 2 .
y ∂x y ∂y y

Funktionen g : G → X, g ∈ C2 (G) heißen harmonisch, falls △g ≡ 0.

12 Insbesondere konvergiert diese Reihe!


134 KAPITEL 11. WEGINTEGRALE

11.4.22 Proposition. Ist G ⊆ C offen und f : G → C holomorph, so ist f auch harmonisch. Insbesondere sind dann Real-
und Imaginärteil von f harmonisch, dh. ∂u
∂x (z).
Ist umgekehrt u : G → R harmonisch für ein einfach zusammenhängendes Gebiet G ⊆ C, so gibt es ein bis auf eine
imaginäre Konstante eindeutiges holomorphes f : G → C, sodass u ≡ Re f .

Beweis. Ist f : G → C analytisch, so gelten die Cauchy-Riemannschen Differentialgleichungen Cauchy-Riemannschen


Differentielgleichungen (z = x + iy)
∂u ∂v ∂v ∂u
(z) = (z), (z) = − (z), (11.54)
∂x ∂y ∂x ∂y
wobei u = Re f und v = Im f . Offensichtlich kann man (11.54) auch schreiben als

∂f ∂f
(z) = −i · (z). (11.55)
∂x ∂y

Da holomorphe Funktionen beliebig oft differenzierbar sind, folgt aus dieser Gleichung abgeleitet nach x

∂2 f ∂2 f
(z) = −i · (z).
∂x2 ∂x∂y

Wegen dem Satz von Schwarz und wegen (11.55) abgeleitet nach y ist dieser Ausdruck gleich

∂2 f ∂2 f
−i · (z) = (−i)2 · 2 (z).
∂y∂x ∂y

Daraus folgt sofort △ f = 0, womit offensichtlich auch u = Re f und v = Im f harmonisch sind.


Ist umgekehrt u : G → R harmonisch und G ⊆ C einfach zusammenhängendes Gebiet, so setzen wir α(z) := ∂u ∂x (z),
β(z) := − ∂u
∂y
(z) und F(z) := α + iβ. Dann sind α : G → R, β : G → R und F : G → C alle drei C1 -Funktionen, wobei wegen
△u = 0 und wegen dem Satz von Schwarz

∂F ∂α ∂β ∂2 u ∂2 u
(z) = (z) + i (z) = 2 (z) − i (z) =
∂x ∂x ∂x ∂x ∂x∂y

∂2 u ∂2 u ∂β ∂α ∂F
− (z) − i (z) = (z) − i (z) = −i · (z).
∂y2 ∂y∂x ∂y ∂y ∂y
Also ist F holomorph. Da G einfach zusammenhängend ist, gibt es eine Holomorphe Stammfunktion f , dh. f : G → C mit
f ′ = F. Wegen f ′ = ∂∂xf = −i ∂∂yf gilt
∂ Im f ∂ Re f ∂u
= = Re F = α =
∂y ∂x ∂x
und
∂ Re f ∂ Im f ∂u
− = = Im F = β = − .
∂y ∂x ∂y

Insbesondere ist d(Re f )(z) = du(z) (∈ L(R2 , R)) für alle z ∈ G. Da Gradientenfelder wegunabhängig sind, und da in G je
zwei Punkte durch einen Polygonzug verbindbar sind, folgt daraus Re f = u + c für ein c ∈ R. Nun ist f − c die gesuchte
holomorphe Funktion.
Falls g : G → C eine weitere holomorphe Funktion mit Re g = u ist, so ist f − c − g : G → C auch holomorph mit
einem verschwindenden Realteil. Aus den Cauchy-Riemannschen Differentialgleichungen folgt d( f − c − g)(z) = 0 und
daraus, dass f − c − g eine Konstante sein muss, vgl. Satz 11.2.8.

Kapitel 12

Topologische Grundlagen

12.1 Topologische Grundbegriffe


Wir wollen in diesem und in den nächsten Abschnitten die Konvergenztheorie, wie wir
sie für metrische Räume entwickelt haben, verallgemeinern. Dabei werden wir Räume
betrachten, die gerade noch soviel Struktur tragen, dass wir von stetigen Funktionen,
Grenzwerten, Kompaktheit etc. sprechen können, nämlich die sogenannten topologi-
schen Räume.
12.1.1 Beispiel (Metrische Räume). Sei (Y, d) ein metrischer Raum. Es gilt also

 d(x, y) ≥ 0 und d(x, y) = 0 genau dann, wenn x = y.

 d(x, y) = d(y, x).

 d(x, y) ≤ d(x, z) + d(z, y).

Sei nun O die Menge aller offenen Teilmengen von Y (siehe Definition 5.1.4), wobei
wir eine Teilmenge O von Y offen genannt haben, wenn sie die Eigenschaft hat, dass
es zu jedem x ∈ O ein ǫ > 0 gibt, sodass die ǫ-Kugel Uǫ (x) (= {y ∈ Y : d(y, x) < ǫ})
ganz in O enthalten ist.
Wir haben in Proposition 5.1.6 gesehen, dass O folgende Eigenschaften hat.

 ∅ ∈ O, X ∈ O.

 Ist n ∈ N und O1 , O2 ∈ O, so folgt O1 ∩ O2 ∈ O.


S
 Ist I eine Indexmenge und Oi ∈ O, i ∈ I, so folgt i∈I Oi ∈ O.

Wir nehmen nun diese aufgezählten Eigenschaften als Ausgangspunkt unserer an-
gestrebten Verallgemeinerung.

12.1.2 Definition. Sei X eine nichtleere Menge und T ⊆ P(X) ein System von Teil-
mengen von X. Erfüllt T die Eigenschaften

(01) ∅ ∈ T , X ∈ T .

(02) Sind O1 , O2 ∈ T , so folgt O1 ∩ O2 ∈ T .


S
(03) Ist I eine Indexmenge und Oi ∈ T , i ∈ I, so folgt i∈I Oi ∈ T .

135
136 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

so heißt T eine Topologie auf X. Die Elemente von T heißen offene Mengen, und man
spricht von (X, T ) als topologischem Raum.
12.1.3 Bemerkung. Mittels Vollständiger Induktion sieht man sofort, dass (O2) äqui-
valent ist zu
T
(02’) Ist n ∈ N und O1 , . . . , On ∈ T , so folgt ni=1 Oi ∈ T .
12.1.4 Beispiel.
Wir haben oben gesehen, dass die Menge O aller offenen Mengen eines metri-
schen Raumes (Y, d) (01)-(03) erfüllt. Damit ist (Y, O) ein topologischer Raum.
Man sagt, O ist die von der Metrik d induzierte Topologie und schreiben auch
T (d) für O.
Ist Y = R p versehen mit der Metrik d2 , so heißt die von d2 induzierte Topologie
T (d2 ) Euklidische Topologie. Die Metriken d1 und d∞ induzieren ebenfalls die
Euklidische Topologie.
Sei T := P(X). Klarerweise sind (01)-(03) erfüllt, also ist (X, P(X)) ein topolo-
gischer Raum. Man spricht von der diskreten Topologie. Die diskreten Topologie
wird übrigens von der diskreten Metrik induziert (siehe Beispiel 3.1.5).
Sei T := {∅, X}. Wieder sind (01)-(03) trivialerweise erfüllt. Man spricht von der
Klumpentopologie.
Eines unserer Ziele wird es sein, Konvergenz gegen einen Punkt oder Stetigkeit bei
einem Punkt für unsere Räume zu verallgemeinern. Dazu benötigen wir ein Analogon
zum Begriff der ’ǫ-Kugel’.
12.1.5 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Eine Menge U ⊆ X
heißt Umgebung von x, wenn es eine offene Menge O ∈ T gibt mit x ∈ O ⊆ U. Wir
bezeichnen mit U(x) die Menge aller Umgebungen von x, den Umgebungsfilter von x.
Der Begriff Filter ist ein allgemeines mengentheoretisches Konzept.
12.1.6 Definition. Sei M eine nichtleere Menge. Dann heißt ein Mengensystem F ⊆
P(M) ein Filter, wenn
(F1) F , ∅ und ∅ < F,
(F2) F1 , F2 ∈ F ⇒ F1 ∩ F2 ∈ F,
(F3) F1 ∈ F, F1 ⊆ F2 ⊆ M ⇒ F2 ∈ F.
Ist (X, T ) ein topologischer Raum, so ist der Umgebungsfilter U(x) tatsächlich ein
Filter, da
offensichtlich X ∈ U(x) und jede Menge U ∈ U(x) den Punkt x enthält und damit
nicht leer ist,
aus U1 , U2 ∈ U(x) die Existenz von O1 , O2 ∈ T mit x ∈ O1 ⊆ U1 und x ∈
O2 ⊆ U2 folgt, und somit x ∈ O1 ∩ O2 ⊆ U1 ∩ U2 , wobei wegen (O2) sicherlich
O1 ∩ O2 ∈ T , und daher U1 ∩ U2 ∈ U(x),
aus U1 ∈ U(x) und U1 ⊆ U2 ⊆ X die Inklusion x ∈ O ⊆ U1 für ein gewisses
O ∈ T und somit x ∈ O ⊆ U2 bzw. U2 ∈ U(x) folgt.
12.1. TOPOLOGISCHE GRUNDBEGRIFFE 137

Die korrekte Verallgemeinerung des Systems aller ǫ-Kugeln um einen festen Punkt
in einem metrischen Raum ist nun der Begriff Filterbasis des Umgebungsfilter.

12.1.7 Definition. Sei M eine nichtleere Menge und F ein Filter. Dann heißt ein Men-
gensystem B ⊆ F eine Filterbasis von F, wenn man zu jeder Menge F ∈ F ein B ∈ B
findet, sodass B ⊆ F.

12.1.8 Bemerkung. Mit der Notation aus Definition 12.1.7 folgt, dass

F = {F ∈ P(X) : ∃B ∈ B : B ⊆ F}. (12.1)

Also ist B Filterbasis von genau einem Filter.


Betrachtet man jetzt B losgelöst von F, so erfüllt B

(FB1) B , ∅ und ∅ < B,

(FB2) B1 , B2 ∈ B ⇒ ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .

Die erste Eigenschaft ist klar wegen (F1). Die zweite folgt aus (F2): B1 , B2 ∈ B ⇒
B1 ∩ B2 ∈ F. Aus der Definition von Filterbasis folgt ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .
Nun kann man auch mit einem Mengensystem B, das (FB1) und (FB2) erfüllt,
starten, um daraus ein Mengensystem F durch (12.1) zu definieren.
Klarerweise ist ∅ < F. Sind F1 , F2 ∈ F, so gilt B1 ⊆ F1 und B2 ⊆ F2 für gewisse
B1 , B2 ∈ B, und wegen (FB2) B3 ⊆ B1 ∩ B2 ⊆ F1 ∩F2 für ein B3 ∈ B. Also F1 ∩F2 ∈ F.
Schließlich ist mit F1 auch jedes F2 ⊇ F1 Obermenge eines gewissen B ∈ B. Somit ist
F ein Filter, der B als eine Filterbasis hat.

12.1.9 Definition. Man sagt ein topologischer Raum (X, T ) erfüllt das erste Abzähl-
barkeitsaxiom (ABI), wenn für jedes x ∈ X der Umgebungsfilter U(x) eine Filterbasis
bestehend aus abzählbar vielen Mengen hat.

12.1.10 Beispiel.

(i) Klarerweise ist ein Filter eine Filterbasis von sich selbt.

(ii) Ist (X, T ) ein topologischer Raum und x ∈ X, so ist z.B. {O ∈ T : x ∈ O} eine
Filterbasis von U(x).

(iii) Sei (Y, d) ein metrischer Raum und T (d) die von der Metrik erzeugte Topologie.
Ist x ∈ Y, so ist {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x).
Dass Uǫ (x) eine Umgebung ist, folgt aus der Tatsache, dass Uǫ (x) sogar offen ist.
Nun sei U ∈ U(x). Dann gibt es eine offene Menge O ∈ T (d), sodass O ⊆ U. Aus
der Definition der offenen Mengen in metrischen Räumen folgt Uǫ (x) ⊆ O ⊆ U,
und damit ist obiges Mengensystem eine Filterbasis.
Auf ähnliche Weise sieht man, dass {Kǫ (x) : ǫ > 0} oder auch {Uǫn (x) : n ∈
N}, wenn (ǫn )n∈N eine Nullfolge aus positiven reellen Zahlen ist, eine Basis des
Umgebungsfilter U(x) ist. Insbesondere erfüllt jeder metrische Raum das erste
Abzählbarkeitsaxiom.

Folgendes Lemma passt nun zu der Konstruktion einer Topologie aus einer Metrik.
138 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.1.11 Lemma. Sei (X, T ) ein topologischer Raum und sei für jeden Punkt x ∈ X
das System W(x) eine Filterbasis von U(x)1 . Dann ist eine Menge O ⊆ X genau dann
offen, d.h. O ∈ T , wenn
∀x ∈ O ⇒ O ∈ U(x), (12.2)
bzw. genau dann, wenn
∀x ∈ O ∃W ∈ W(x) : W ⊆ O. (12.3)

Beweis. Für ein festes x ∈ X bedeutet die Tatsache ∃W ∈ W(x) : W ⊆ O gemäß der
Definition einer Filterbasis nicht anderes als O ∈ U(x). Also sind (12.2) und (12.3)
äquivalent.
Ist O ∈ T und x ∈ O, so folgt daraus O ∈ U(x), vgl. Beispiel 12.1.10, (ii). Gilt
umgekehrt O ∈ U(x), ∀x ∈ O, so gibt es wegen der Definition von U(x) zu jedem
x ∈ O eine Menge O x ⊆ O, O x ∈ T , und daher
[ [
O= {x} ⊆ O x ⊆ O.
x∈X x∈X

Als Vereinigung der offenen Mengen O x muss O nach (O3) selber offen sein.

Nun können wir den Grenzwert eines Netzes auch für topologische Räume definie-
ren.

12.1.12 Definition. Sei (I, ) eine gerichtete Menge und (xi )i∈I ein Netz in X, wobei
(X, T ) ein topologischer Raum ist. Man sagt, dass dieses Netz gegen einen Punkt x ∈ X
i∈I
konvergiert, in Zeichen xi −→ x, falls

∀U ∈ U(x) ∃i0 ∈ I : ∀i  i0 ⇒ xi ∈ U,

d.h. falls in jeder beliebigen Umgebung ab einem Index alle Glieder xi des Netzes
enthalten sind.

12.1.13 Fakta.

Ist W(x) eine Filterbasis von U(x), so ist die Konvergenzbedingung aus Definition
12.1.12 äquivalent zu

∀W ∈ W(x) ∃i0 ∈ I : ∀i  i0 ⇒ xi ∈ W,

da einerseits wegen W(x) ⊆ U(x) diese Bedingung sicherlich eine Konsequenz


aus der in Definition 12.1.12 ist, und da andererseits aus U ∈ U(x) die Existenz
eines W ∈ W(x) mit W ⊆ U folgt, und dann mit der gegenwärtigen Bedingung,
dass xi ∈ W ⊆ U, ∀i  i0 für ein gewisses i0 ∈ I.

Ist (xi( j) ) j∈J ein Teilnetz von (xi )i∈I , d.h.

∀i ∈ I∃ j0 ∈ J : ∀ j  J j0 ⇒ i( j) I i,

und konvergiert (xi )i∈I gegen x, so auch (xi( j) ) j∈J . Um das zu sehen, sei U ∈ U(x)
und i0 ∈ I, sodass i I i0 ⇒ xi ∈ U. Ist nun j0 ∈ J so, dass j  J j0 ⇒ i( j) I i0 ,
so folgt auch xi( j) ∈ U für alle j  J j0 .
1 Es ist nicht ausgeschlossen, dass W(x) = U(x).
12.1. TOPOLOGISCHE GRUNDBEGRIFFE 139

12.1.14 Bemerkung. Wir sehen nun aus Fakta 12.1.13, dass diese Definition der Kon-
vergenz mit der in metrischen Räumen konform geht. In der Tat haben wir x = limi∈I xi
in einem metrischen Raum (Y, d) genau dann, wenn

∀ǫ > 0 ∃i0 ∈ I : xi ∈ Uǫ (x) ∀i  i0 .

Da {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x) ist, stimmt diese Bedingung mit der aus
Fakta 12.1.13 überein.
Wir sehen insbesondere, dass die Konvergenz nicht von der konkreten Metrik, son-
dern nur von der von ihr erzeugten Topologie abhängt (vgl. Beispiel 12.3.10).
Wir haben in der Definition der Konvergenz absichtlich nicht die Schreibweise x =
limi∈I xi verwendet, denn es kann sein, dass x nicht der einzige Grenzwert ist.
12.1.15 Beispiel. Man betrachte eine Menge X mit mindestens zwei Elementen verse-
hen mit der Klumpentopologie. Dann ist U(x) = {X} für alle x ∈ X. Damit konvergiert
aber jedes Netz gegen jeden Punkt x ∈ X.
Man muss eine zusätzliche Eigenschaft vom gegebenen topologischen Raum for-
dern, damit Grenzwerte eindeutig sind.

12.1.16 Definition. Ein topologischer Raum (X, T ) heißt T 2 -Raum (oder Hausdorff-
Raum) 2 , wenn gilt:

(T 2 ) Zu je zwei Punkten x, y ∈ X, x , y, gibt es disjunkte offene Mengen O x und Oy ,


sodass x ∈ O x , y ∈ Oy .

Oy
y
Ox
x

Abbildung 12.1: Zweites Trennungsaxiom (T 2 )

Man sieht unmittelbar, dass diese Eigenschaft zu der Tatsache äquivalent ist, dass
es zu zwei verschiedenen Punkten x, y zwei Umgebungen U ∈ U(x), V ∈ U(y) gibt mit
U ∩ V = ∅.
12.1.17 Beispiel. Die von einer Metrik d auf einer Menge Y induzierte Topologie ist
Hausdorff. Sind nämlich x, y ∈ Y, x , y, so gilt d(x, y) > 0. Setze ǫ := 31 d(x, y) und
betrachte die Umgebungen

U := Uǫ (x), V := Uǫ (y) .

Angenommen es wäre z ∈ U ∩ V, dann erhielten wir den Widerspruch


1 1 2
d(x, y) ≤ d(x, z) + d(z, y) < d(x, y) + d(x, y) = d(x, y) .
3 3 3
2 Felix Hausdorff, 8.11.1868 (Breslau) -26.1.1942 (Bonn)
140 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

Der Beweis der Eindeutigkeit des Grenzwertes eines Netzes wird nun fast wörtlich
vom metrischen Fall übertragen.
12.1.18 Lemma. Sei (xi )i∈I ein konvergentes Netz in einem topologischen (T 2)-Raum.
Dann ist Grenzwert eindeutig.
Beweis. Wären x, y zwei verschiedene Grenzwerte, so wähle man disjunkte Umge-
bungen U ∈ U(x) und V ∈ U(y). Dann wähle man i1 ∈ I und i2 ∈ I mit i  i1 ⇒ xi ∈ U
und i  i2 ⇒ xi ∈ V. Da I gerichtet ist, gibt es ein i ∈ I, i  i1 , i  i2 , und somit
xi ∈ U ∩ V, was aber ein Widerspruch zu U ∩ V = ∅ ist.

12.2 Abgeschlossene Mengen


12.2.1 Definition. Sei (X, T ) ein topologischer Raum. Eine Menge A ⊆ X heißt abge-
schlossen, wenn Ac offen ist.
12.2.2 Lemma. Sei X eine Menge. Ist T eine Topologie auf X und bezeichnet A die
Menge aller abgeschlossenen Mengen in (X, T ), so gilt:
(A1) ∅, X ∈ A.
(A2) A1 , . . . , An ∈ A, n ∈ N, so folgt A1 ∪ . . . ∪ An ∈ A.
T
(A3) Ai ∈ A, i ∈ I, so folgt i∈I Ai ∈ A.
Beweis. Die Axiome (A1) - (A3) gehen bei Komplementbildung genau in die Axiome
(O1) - (O3) über.

12.2.3 Definition. Sei (X, T ) ein topologischer Raum, und sei B ⊆ X. Die Menge
\n o
B := A ⊆ X : A abgeschlossen, A ⊇ B (12.4)

heißt der Abschluss von B. Wenn man explizit klarstellen will, bezüglich welcher To-
T
pologie der Abschluss zu bilden ist, dann schreibt man für B oft auch B .
Ist C ⊆ B ⊆ X und gilt B ⊆ C, so heißt C dicht in B. Ist C dicht in X, so sagt man,
C ist dicht.
Hat B ⊆ X eine in B dichte und abzählbare Teilmenge, so heißt B separabel.
12.2.4 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X. Dann ist B die kleinste abge-
schlossene Menge, die B umfasst.
Beweis. Wegen (A1) ist die Menge, über die in (12.4) der Durchschnitt gebildet wird,
nicht leer. Wegen (A3) ist B abgeschlossen. Ist A abgeschlossen und A ⊇ B, so kommt
A auf der rechten Seite von (12.4) vor, also gilt A ⊇ B.

12.2.5 Lemma. Sei (X, T ) topologischer Raum. Dann gilt:
(i) Für B ⊆ X gilt B ⊆ B.
(ii) Ist C ⊆ B ⊆ X, so folgt C ⊆ B.
12.2. ABGESCHLOSSENE MENGEN 141

(iii) Für C, B ⊆ X folgt C ∪ B = C ∪ B.


(iv) Eine Menge B ⊆ X ist genau dann abgeschlossen, wenn B = B.
Beweis.
(i) Folgt unmittelbar aus der Definition.
(ii) Wegen B ⊇ B ⊇ C ist B eine abgeschlossene Menge, die C umfasst, und da C die
kleinste derartige Menge ist, folgt B ⊇ C.
(iii) Die Menge C ∪ B ist eine abgeschlossene Menge, die C ∪ B umfasst. Also folgt
C ∪ B ⊆ C ∪ B.
Andererseits folgt aus C ⊆ C ∪ B, dass C ⊆ C ∪ B, und genauso B ⊆ C ∪ B.
Damit gilt auch C ∪ B ⊆ C ∪ B.
(iv) B = B gilt genau dann, wenn B die kleinste abgeschlossene Menge ist, die B
enthält. Somit ist das genau dann der Fall, wenn B abgeschlossen ist.


Wenn man sich an die Definition von Abschluss und abgeschlossener Menge in
metrischen Räumen zurückerinnert, so haben wir dort einen Zugang über Häufungs-
punkte gewählt. Im nächsten Lemma werden wir sehen, dass auch in allgemeinen to-
pologischen Räumen der Abschluss bzw. der Begriff der abgeschlossenen Menge so
charakterisiert werden kann. Um das einzusehen wollen wir zunächst ein kanonisches
Netz konstruieren, das gegen einen gegebenen Punkt konvergiert.
12.2.6 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X und x ∈ X, sodass U ∩ B , ∅
für alle U ∈ U(x). Nun sei

I = {(y, U) : U ∈ U(x), y ∈ U ∩ B},

versehen mit der Relation (y1 , U1 )  (y2 , U2 ) :⇔ U1 ⊇ U2 .


Ist (xi )i∈I das Netz definiert durch xi := y, wenn i = (y, U), so konvergiert es gegen x.
Beweis. Die Relation  ist offensichtlich reflexiv und transitiv. Sind (z, V), (y, U) ∈ I,
so folgt U ∩ V ∈ U(x). Voraussetzungsgemäß gibt es ein b ∈ U ∩ V ∩ B, und daher
(z, V), (y, U)  (b, U ∩ V). Daraus folgt, dass (I, ) gerichtet ist.
Definitionsgemäß ist immer xi ∈ B. Da zu U ∈ U(x) und beliebigen y ∈ U ∩ B
aus i = (z, V)  (y, U) folgt, dass xi = z ∈ V ⊆ U, sehen wir, dass (xi )i∈I gegen x
konvergiert.

12.2.7 Proposition. Sei (X, T ) topologischer Raum, B ⊆ X, x ∈ X und W(x) eine
Filterbasis von U(x). Dann sind folgende Aussagen äquivalent:
(i) x ∈ B.
(ii) ∀U ∈ U(x) : B ∩ U , ∅.
(iii) ∀W ∈ W(x) : B ∩ W , ∅.
(iv) Es gibt ein Netz (xi )i∈I mit xi ∈ B, sodass x ein Grenzwert davon ist.
142 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

Beweis. Laut Definition ist x < B zur Existenz einer abgeschlossenen Menge A mit
x < A, A ⊇ B äquivalent. Da die offenen Mengen genau die Komplemente der abge-
schlossenen sind, ist das äquivalent zu ∃O ∈ T : x ∈ O, O ∩ B = ∅. Da die offenen, x
enthaltenden Mengen eine Umgebungsbasis darstellen, ist das aber genau die Negation
von (ii), also (i) ⇔ (ii).
(ii) ⇔ (iii) folgt unmittelbar aus der Tatsache, dass W(x) eine Filterbasis von U(x)
ist. (ii) ⇒ (iv) ist eine unmittelbare Konsequenz aus Lemma 12.2.6.
Gilt schließlich (iv) und ist U ∈ U(x), so folgt xi ∈ U ∩ B für alle i  i0 mit einem
gewissen i0 . Also ist sicher U ∩ B , ∅.

In Analogie zum Begriff des Häufungspunktes einer Menge in metrischen Räumen in Definition 5.1.7 definieren wir:

12.2.8 Definition. Sei (X, T ) topologischer Raum und B ⊆ X. Ein x ∈ X heißt Häufungspunkt von B, wenn

∀U ∈ U(x) : (B \ {x}) ∩ U , ∅.

12.2.9 Bemerkung. Aus Proposition 12.2.7 erkennt man sofort, dass x genau dann Häufungspunkt von B ist, wenn x ∈
B \ {x}, bzw. wenn (xi )i∈I → x für ein Netz aus B \ {x} (vgl. Lemma 5.1.13).
Man erkennt auch leicht aus Proposition 12.2.7, dass B mit der Vereinigung von B und der Menge aller Häufungspunkt
von B übereinstimmt.

12.2.10 Bemerkung. Ist (X, d) ein metrischer Raum, B ⊆ X und nimmt man als W(x)
die Menge aller offenen ǫ-Kugeln um x, so sieht man durch einen Vergleich von Pro-
position 12.2.7 und Bemerkung 5.1.11, dass x ∈ B genau dann, wenn x ∈ c(B). Also
stimmt der Abschluss in metrischen Räumen mit dem topologischen Abschluss übe-
rein.
Der Grund, warum man in metrischen Räumen das Auslangen mit Folgen findet,
daher x ∈ B genau dann, wenn xn → x für eine Folge aus B, ist die Gültigkeit des
ersten Abzählbarkeitsaxioms. In der Tat, kann man unter der Voraussetzung (ABI) die
Konstruktion in Lemma 12.2.6 folgendermaßen abändern:
Sei W(x) = {Wn : n ∈ N} eine abzählbare Filterbasis von U(x), und wähle xn ∈
B ∩ W1 ∩ · · · ∩ Wn (∈ U(x)). Man erhält somit eine Folge (xn )n∈N in B, sodass zu
vorgegebenem U ∈ U(x) ein N ∈ N mit WN ⊆ U existiert, und daher

xn ∈ W1 ∩ · · · ∩ WN ∩ · · · ∩ Wn ⊆ U für alle n ≥ N.

Somit konvergiert (xn )n∈N für n → ∞ gegen x.


12.2.11 Bemerkung. Eng verbunden mit dem Abschluss ist das Innere B◦ einer Teil-
menge B eines topologischen Raumes (X, T ), welches durch
[
B◦ = {O ∈ T : O ⊆ B}

definiert ist. Man sieht unmittelbar, dass x ∈ B◦ ⇔ B ∈ U(x). Ähnlich wie beim
Abschluss sieht man, dass B◦ die größte in B enthaltene offene Menge ist. Damit ist B
genau dann offen, wenn B = B◦.
Da die Komplemente von den offenen Mengen genau die abgeschlossenen Mengen
sind, besteht der folgende Zusammenhang zum Abschluss von Mengen.
 c \ n oc
Bc = A ⊆ X : A abgeschlossen, A ⊇ Bc =
\ n oc
Oc ⊆ X : O offen, O ⊆ B = B◦ .
12.3. STETIGE ABBILDUNGEN 143

Begriffsbildung, die der des Häufungspunktes einer Folge entspricht, ist die des Häufungspunktes eines Netzes.

12.2.12 Definition. Sei (X, T ) ein topologischer Raum und (xi )i∈I ein Netz in X. Dann heißt x ∈ X Häufungspunkt von
(xi )i∈I , falls
∀U ∈ U(x)∀i ∈ I ∃ j ∈ I : i  j ∧ x j ∈ U.

Vergleicht man das mit Proposition 12.2.7, so ist x Häufungspunkt von (xi )i∈I genau dann, wenn er im Schnitt aller
Mengen der Form
{x j : j ∈ I, i  j},
also in \
{x j : j ∈ I, i  j} (12.5)
i∈I

enthalten ist.
Unmittelbar aus der Definition des Grenzwertes eines Netzes sieht man, dass ein Limes eines Netzes auch Häufungs-
punkt ist. Die Umkehrung gilt im Allgemeinen nicht, wie man z. B. bei Folgen in R schon unschwer erkennen kann.
Eine weiter Charakterisierung von Häufungspunkten verwendet das Konzept von Teilnetzen.

12.2.13 Lemma. Der Punkt x ist Häufungspunkt von (xi )i∈I genau dann, wenn x Limes eines Teilnetzes (xi(k) )k∈K ist.

Beweis. Ist (xi(k) )k∈K ein Teilnetz, so gibt es zu i0 ∈ I ein k0 ∈ K, sodass i0  i(k), k0  k. Also gilt

{xi : i ∈ I, i0  i} ⊇ {xi(k) : k ∈ K, k0  k},

und damit \ \
{xi : i ∈ I, i0  i} ⊇ {xi(k) : k ∈ K, k0  k}. (12.6)
i0 ∈I k0 ∈K

Ist nun x Limes von (xi(k) )k∈K , so ist er insbesondere Häufungspunkt dieses Teilnetzes, und wegen (12.6) ein Häufungspunkt
von (xi )i∈I .
Ist umgekehrt x Häufungspunkt von (xi )i∈I , so betrachte die Menge

K = {(i, U) : i ∈ I, U ∈ U(x), xi ∈ U}

versehen mit der Relation (i1 , U1 )  (i2 , U2 ) :⇔ i1  i2 ∧ U1 ⊇ U2 .


Ist (i1 , U1 ), (i2 , U2 ) ∈ K und ist i′ ∈ I, i1 , i2  i′ , so gibt es wegen der Voraussetzung zu der Umgebung U3 = U1 ∩ U2
von x ein i3 ∈ I mit i′  i3 und xi3 ∈ U3 . Also (i1 , U1 ), (i2 , U2 )  (i3 , U3 ), und wir sehen, dass (K, ) eine gerichtete Menge
ist.
Definieren wir i(i, U) = i, so ist x(i,U) = xi(i,U) , (i, U) ∈ K ein Teilnetz von (xi )i∈I , das gegen x konvergiert.

12.2.14 Lemma. Ein Netz (xi )i∈I konvergiert genau dann gegen x, wenn x Häufungspunkt eines jeden Teilnetzes von (xi )i∈I
ist.

Beweis. Sei (I, ) eine gerichtete Menge.


Konvergiert (xi )i∈I gegen x, so auch jedes Teilnetz, und daher ist x Häufungspunkt dieses Teilnetzes.
Ist (xi )i∈I nicht gegen x konvergent, so gibt es eine Umgebung U von x, sodass

∀i ∈ I∃ j ∈ I, i  j : x j < U.

Betrachte die gerichtete Menge (K,  |K×K ) mit K = {i ∈ I : xi < U}. Dann hat das Teilnetz (xi )i∈K den Punkt x sicherlich
nicht als Häufungspunkt.

12.3 Stetige Abbildungen


12.3.1 Definition. Seien (X, T ) und (Y, O) topologische Räume. Weiters sei f eine
Abbildung, f : X → Y. Ist x ∈ X, so heißt f stetig im Punkt x, wenn gilt:
(C x ) Für alle V ∈ U( f (x)) existiert ein U ∈ U(x) mit f (U) ⊆ V .
Die Abbildung f heißt stetig, wenn sie in jedem Punkt x ∈ X stetig ist.
12.3.2 Beispiel.
144 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

Sei (X, T ) topologischer Raum. Die Abbildung idX : (X, T ) → (X, T ) ist stetig.
Denn ist x ∈ X und V ∈ U(idX x) = U(x), so wähle U := V ∈ U(x), dann gilt
idX (U) = V ⊆ V.
Seien (X, T ), (Y, O) topologische Räume und sei a ∈ Y. Die Abbildung
(
(X, T ) → (Y, O)
fa :
x 7→ a
ist stetig. Denn ist x ∈ X und V ∈ U( fa (x)) = U(a), so wähle U := X ∈ U(x),
dann gilt fa (U) = {a} ⊆ V.
Sei X versehen mit der diskreten Topologie T = P(X), sei (Y, O) irgendein topo-
logischer Raum und sei f : (X, P(X)) → (Y, O) irgendeine Abbildung. Dann ist
f stetig. Denn sei x ∈ X, V ∈ U( f (x)). Da {x} offen in der diskreten Topologie
ist, ist {x} ∈ U(x). Wähle U := {x}, dann gilt f (U) = { f (x)} ⊆ V.
Zieht man in Betracht, dass in einem metrischen Raum die ǫ-Kugeln eine Umge-
bungsbasis um einen Punkt bilden, so ist das im folgenden Lemma auftretende Kriteri-
um (ii) für die Stetigkeit eine unmittelbare Verallgemeinerung des wohlbekannten ’ǫ’ -
’δ’ Kriteriums.
Bei Funktionen auf metrischen Räumen haben wir auch gesehen, dass die Stetigkeit
in einem Punkt x auch durch xn → x ⇒ limn→∞ f (xn ) = f (x), charakterisiert werden
kann. Man hat in allgemeienen topologischen Räumen eine ähnliche Charakterisierung,
wobei man jedoch nicht mehr mit Folgen das Auslangen findet, siehe (iii) im folgenden
Lemma.
12.3.3 Lemma. Seien (X, T ), (Y, O) topologische Räume, f : X → Y, x ∈ X, und seien
W(x) bzw. W( f (x)) beliebige Umgebungsbasen von x in (X, T ) bzw. von f (x) in (Y, O).
Dann sind folgende Aussagen äquivalent.
(i) f ist im Punkt x stetig.
(ii) Für jedes V ∈ W( f (x)) existiert ein U ∈ W(x) mit f (U) ⊆ V.
(iii) Für jedes gegen x konvergente Netz (xi )i∈I in X folgt, dass das Netz ( f (xi ))i∈I
gegen f (x) konvergiert.
Beweis.
(i) ⇒ (ii) : Sei V ∈ W( f (x)). Dann ist auch V ∈ U( f (x)) und daher gibt es Ũ ∈ U(x)
mit f (Ũ) ⊆ V (vgl. (C x )). Nun ist W(x) Umgebungsbasen von x. Also gibt es ein
U ∈ W(x) mit U ⊆ Ũ und daher f (U) ⊆ V.
(ii) ⇒ (i) : Sei V ∈ U( f (x)), und wähle W ∈ W( f (x)) mit W ⊆ V. Dann gibt es
U ∈ W(x) ⊆ U(x) mit f (U) ⊆ W ⊆ V, also gilt (C x ).
(i) ⇒ (iii) : Konvergiert (xi )i∈I gegen x, und ist V ∈ U( f (x)), so existiert wegen der
Stetigkeit ein U ∈ U(x) mit f (U) ⊆ V. Wegen der Konvergenz findet man ein
ein i0 ∈ I, sodass i  i0 ⇒ xi ∈ U und damit auch f (xi ) ∈ V. Also konvergiert
( f (xi ))i∈I gegen f (x).
(iii) ⇒ (i) : Wäre f nicht bei x stetig, so gäbe es eine Umgebung V von f (x), sodass
f (U) ∩ V c , ∅, oder äquivalent U ∩ f −1 (V c ) , ∅, für alle U ∈ U(x). Nach
Lemma 12.2.6 gibt es ein Netz (xi )i∈I in f −1 (V c ), welches gegen x konvergiert.

Andererseits ist aber f (xi ) ∈ V c für alle i ∈ I, womit f (xi ) i∈I sicherlich nicht
gegen f (x) konvergieren kann.
12.3. STETIGE ABBILDUNGEN 145


12.3.4 Bemerkung. Mit einer Konstruktion ähnlich wie in Bemerkung 12.2.10 sieht
man, dass, wenn X das erste Abzählbarkeitsaxiom erfüllt - daher insbesondere in me-
trischen Räumen, die Stetigkeit bei x mit Hilfe von Folgen dadurch charakterisiert wer-
den, dass xn → x ⇒ limn→∞ f (xn ) = f (x).
12.3.5 Satz. Seien (X, T ), (Y, O) topologische Räume, und sei f : X → Y. Dann sind
folgende Aussagen äquivalent:
(i) f ist stetig.
(ii) f −1 (O) ∈ T für jede offene Menge O ∈ O, d.h. die Urbilder von offenen Mengen
sind offen.
(iii) Die Urbilder von abgeschlossenen Mengen sind abgeschlossen.
(iv) Für jede Teilmenge B ⊆ X gilt f (B) ⊆ f (B).
Beweis.
(i) ⇒ (ii) : Sei O ∈ O. Ist x ∈ f −1 (O), so gilt f (x) ∈ O. Da O offen ist, gilt O ∈ U( f (x)),
und daher gibt es eine Umgebung U ∈ U(x) mit f (U) ⊆ O, d.h. U ⊆ f −1 (O).
Mit Lemma 12.1.11 folgt f −1 (O) ∈ T .
(ii) ⇒ (iii) : Sei A abgeschlossene Teilmenge von Y. Dann ist (A)c offen und wegen
(ii) gilt h ic
f −1 (A) = f −1 (Ac ) ∈ T .

Also ist f −1 (A) abgeschlossen.


(iii) ⇒ (iv) : Wegen f (B) ⊇ f (B) gilt gilt f −1 ( f (B)) ⊇ B. Da nach Voraussetzung
f −1 ( f (B)) abgeschlossen in (X, T ) ist, folgt f −1 ( f (B)) ⊇ B und daher f (B) ⊇
f (B).
(iv) ⇒ (i) : Sei x ∈ X und V ∈ U( f (x)) gegeben. Wir müssen ein U ∈ U(x) mit f (U) ⊆
V konstruieren. Dazu setze man W := f −1 (V). Dann gilt f (W c ) = f ( f −1 (V c )) ⊆
V c und daher f (W c ) ⊆ f (W c ) ⊆ V c .
Da V ∈ U( f (x)) und V ∩ V c = ∅ folgt aus Proposition 12.2.7, dass f (x) < V c und
wegen obiger Inklusion x < W c . Wir sehen, dass x ∈ (W c )c = W ◦ =: U ∈ U(x),
wobei U ⊆ W = f −1 (V), und somit f (U) ⊆ f (W) ⊆ V.


−1
Bedingung (ii) in Satz 12.3.5 lässt sich kurz durch f (O) ⊆ T beschreiben, wobei
wir für eine Abbildung f : X → Y die Schreibweise
n o 
f −1 (C) := f −1 (C) : C ∈ C ⊆ P(X) ,

und später auch n o 


f (B) := f (B) : B ∈ B ⊆ P(Y) ,
für B ⊆ P(X) bzw. C ⊆ P(Y) verwenden.
146 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.3.6 Lemma. Seien (X, T ) und (Y, O) topologische Räume, wobei (Y, O) Hausdorff
ist. Ist D eine dichte Teilmenge von X, und sind f, g zwei stetige Funktionen von X nach
Y, sodass f |D = g|D , dann folgt f = g.
Beweis. Angenommen f (x) , g(x) für ein x ∈ X \ D. Wegen der Hausdorff-
Voraussetzung gibt es O1 , O2 ∈ O mit O1 ∩ O2 = ∅ und f (x) ∈ O1 , g(x) ∈ O2 . Da
f und g stetig sind, gibt es U1 , U2 ∈ T , x ∈ U1 ∩ U2 , sodass f (U1 ) ⊆ O1 , g(U2 ) ⊆ O2 .
Insbesondere ist U1 ∩ U2 eine nichtleere offene Menge, und hat daher einen nichtleeren
Schnitt mit D. Wir erhalten den Widerspruch:

∅ , f (U1 ∩ U2 ∩ D) = g(U1 ∩ U2 ∩ D) ⊆ O1 ∩ O2 = ∅.

Alternativ kann man sich so argumentieren, dass es zu x ∈ X \ D wegen Proposition 12.2.7 ein gegen x konvergentes
 
Netz (xi )i∈I in D gibt. Die Netze f (xi ) i∈I und g(xi ) i∈I konvergieren wegen Lemma 12.3.3 gegen f (x) bzw. g(x).
 
Andererseits sind diese Netze f (xi ) i∈I und g(xi ) i∈I identisch und haben wegen Lemma 12.1.18 den selben Grenzwert;
also f (x) = g(x).

12.3.7 Lemma. Seien (X, T ), (Y, O), (Z, R) drei topologische Räume und seinen f :
X → Y, g : Y → Z Funktionen. Weiters sei x ∈ X. Ist f stetig im Punkt x und ist g stetig
im Punkt f (x), so ist g ◦ f stetig im Punkt x. Insbesondere ist g ◦ f stetig, wenn f, g es
sind.
Beweis. Sei W ∈ U((g ◦ f )(x)). Da g stetig im Punkt f (x) ist, gibt es V ∈ U( f (x))
mit g(V) ⊆ W. Da f stetig im Punkt x ist, gibt es U ∈ U(x) mit f (U) ⊆ V. Insgesamt
erhalten wir
(g ◦ f )(U) = g( f (U)) ⊆ g(V) ⊆ W .


12.3.8 Definition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y.
Dann heißt f ein Homöomorphismus von (X, T ) nach (Y, O), wenn f bijektiv ist und
wenn gilt f (T ) = O. Zwei topologische Räume (X, T ) und (Y, O) heißen homöomorph,
wenn es einen Homöomorphismus von (X, T ) nach (Y, O) gibt.
12.3.9 Lemma.
(i) Sei f : (X, T ) → (Y, O) eine bijektive Abbildung. Dann ist f genau dann
Homöomorphismus, wenn sowohl f als auch f −1 stetig sind.
(ii) Sind f : (X, T ) → (Y, O), g : (Y, O) → (Z, R) Homöomorphismen, so ist auch
g ◦ f : (X, T ) → (Z, R) ein Homöomorphismus.
(iii) Die Abbildung idX : (X, T1 ) → (X, T2 ) ist ein Homöomorphismus genau dann
wenn T1 = T2 .
Beweis.
(i) Ist f bijektiv, so ist f (T ) = O genau dann wenn f −1 (O) ⊆ T und f (T ) ⊆ O.
(ii) Folgt unmittelbar aus (i) und Lemma 12.3.7.
(iii) Das folgt unmittelbar aus idX (T1 ) = T1 .
12.4. BASIS, SUBBASIS 147


12.3.10 Beispiel.
Ist eine gegebene Menge Y mit zwei verschiedenen Metriken d1 und d2 versehen,
die aber äquivalent sind, dh. es gibt α, β > 0, sodass für alle x, y ∈ Y

αd1 (x, y) ≤ d2 (x, y) ≤ d1 (x, y),

so zeigt man leicht mit Hilfe der Charakterisierung der Stetigkeit in metrischen
Räumen durch Folgen (siehe Proposition 6.1.4), dass dann idY : (Y, d1 ) → (Y, d2 )
und idY : (Y, d2 ) → (Y, d1 ) beide stetig sind. Also induzieren diese Metriken die
selbe Topologie, dh. T (d1 ) = T (d2 ).
Sei X ein Vektorraum versehen mit zwei Normen k.k1 und k.k2 . Sind diese äqui-
valent (vgl. Definition 9.2.1), so sieht man sofort, dass die jeweils induzierten
Metriken ebenfalls äquivalent sind. Somit stimmen die Topologien, die von den
zu k.k1 und k.k2 gehörigen Metriken erzeugt werden, überein.
Man betrachte C versehen mit der euklidischen Metrik d2 und mit der chordalen
Metrik χ. Es ist wohlbekannt, dass zn → z in C bezüglich d2 genau dann, wenn
zn → z bezüglich χ. Also ist die Abbildung idC als Abbildung von (C, d2 ) nach
(C, χ) und auch als Abbildung von (C, χ) nach (C, d2 ) stetig. Somit gilt T (d2 ) =
T (χ).
Man betrachte einerseits C ∪ {∞} versehen mit der chordalen Metrik χ. Ande-
rerseits sei S die Oberfläche der Kugel mit Durchmesser 1 im R3 , die so auf
die Ebene R2 zum liegen kommt, dass Ihr Südpol den Nullpunkt berührt. Wir
versehen S mit d2 , dh.
q
d2 ((α, β, γ)T , (ξ, η, ζ)T ) = (α − ξ)2 + (β − η)2 + (γ − ζ)2 .

Die Stereographische Projektion σ : S → C ∪ {∞} ist bekannterweise eine


Isometrie, dh. χ(σ(x), σ(y)) = d2 (x, y). Also sind σ und σ−1 stetig, und σ ist
somit ein Homöomorphismus.

12.4 Basis, Subbasis


Wir betrachten nun eine feste Menge X und die Menge x(X) aller möglichen Topo-
logien auf X. Die Elemente T von x(X) sind also Teilmengen von P(X), und daher
x(X) ⊆ P(P(X)).
Wir sagen eine Topologie T1 ist gröber als eine Topologie T2 bzw. T2 feiner als
T1 , wenn T1 ⊆ T2 . Aus Satz 12.3.5 erkennt man leicht, dass T1 genau dann gröber als
T2 ist, wenn id : (X, T2 ) → (X, T1 ) stetig ist.
12.4.1 Lemma. Ist Ti , i ∈ I, eine Familie von Topologien, so ist es auch ∩i∈I Ti . In der
Tat, ist dieser Schnitt die feinste Topologie, die gröber als alle Ti ist.
Für ein Mengensystem C ⊆ P(x) ist
\
T (C) = {T ∈ x(X) : C ⊆ T } (12.7)

die gröbste Topologie, die C enthält.


148 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

Beweis. Wir müssen nachweisen, dass ∩i∈I Ti die Axiome (O1) - (O3) erfüllt. Die
Mengen ∅, X sind in allen Ti enthalten, da diese ja Topologien sind. Also sind diese
Mengen auch im Schnitt enthalten. Es folgt (O1).
Aus O1 , O2 ∈ ∩i∈I Ti folgt O1 , O2 ∈ Ti , i ∈ I, und somit O1 ∩ O2 ∈ Ti , i ∈ I. Also
O1 ∩ O2 ∈ ∩i∈I Ti , und daher (O2).
Sind O j ∈ ∩i∈I Ti , j ∈ J, so folgt für jedes i ∈ I, dass O j ∈ Ti , j ∈ J, und weiter
S S
j∈J O j ∈ Ti . Nun gilt das wieder für alle i ∈ I, also j∈J O j ∈ ∩i∈I Ti , und somit (O3).
Klarerweise ist ∩i∈I Ti in allen Ti enthalten. Ist andererseits T ⊆ Ti , i ∈ I, so auch
T ⊆ ∩i∈I Ti . Also ist der Schnitt die feinste in allen Ti enthaltene Topologie.

Nun enthält der Schnitt T (C) von Mengensystemen, die alle C enthalten, ebenfalls
C. Ist andererseits T ⊇ C, so gehört T zur Menge auf der linken Seite von (12.7) und
daher T ⊇ T (C). Also ist T (C) die gröbste Topologie, die C enthält.

12.4.2 Definition. Sei (X, T ) ein topologischer Raum. Ein Mengensystem B ⊆ P(X)
heißt Basis von T , wenn B ⊆ T und wenn es für alle O ∈ T und x ∈ O ein B ∈ B mit
x ∈ B ⊆ O gibt.
Man sagt ein topologischer Raum (X, T ) erfüllt das zweite Abzählbarkeitsaxiom (ABII), wenn T eine abzählbare Basis
besitzt.

Ein Mengensystem C ⊆ P(X) heißt Subbasis von T , wenn C ⊆ T und wenn es für
alle O ∈ T , O , X, und x ∈ O endlich viele C1 , . . . , Cn ∈ C mit x ∈ C1 ∩ · · · ∩ Cn ⊆ O
gibt.

12.4.3 Bemerkung. Sei O ⊆ X und B ⊆ P(X). Die Tatsache, dass es zu jedem x ∈ O


ein B ∈ B gibt mit x ∈ B ⊆ O, kann man kurz auch als
[
O= B
B∈B, B⊆O

schreiben.
12.4.4 Bemerkung. Offensichtlich ist C ⊆ P(X) genau dann eine Subbasis von T , wenn
das Mengensystem E aller endlichen Schnitte von C samt X, also

n\
n
E := {X} ∪ Ci : n ∈ N, C1 , . . . , Cn ∈ C}
i=1

eine Basis von T abgibt. Klarerweise enthält E das Mengensystem C.


12.4.5 Beispiel.

Ist (Y, d) ein metrischer Raum, so folgt aus der Definition der von d induzierten
Topologie T (d) sofort, dass

{Uǫ (x) : x ∈ Y, ǫ > 0}

eine Basis von T (d) ist.

Die Euklidische Topologie T (d2 ) auf R hat die Menge aller offenen Intervalle

{(a, b) ⊆ R : a, b ∈ R, a < b}
12.4. BASIS, SUBBASIS 149

als Basis. Da man zu a < x < b aus R wegen der Dichteeigenschaft von Q (siehe
Satz 2.6.3) sicherlich s, t ∈ Q findet, sodass a < s < x < t < b, ist auch

{(s, t) ⊆ R : s, t ∈ Q, s < t}

eine Basis von T (d2 ). Also ist (ABII) erfüllt.


Wegen (a, b) = (a, +∞) ∩ (−∞, b) folgt damit unmittelbar, dass

{(a, +∞) ⊆ R : a ∈ R} ∪ {(−∞, b) ⊆ R : b ∈ R}

eine Subbasis von T (d2 ) auf R ist.


Betrachte den R p versehen mit d∞ . Da dort für die ǫ-Kugeln

Uǫ (x) = (ξ1 − ǫ, ξ1 + ǫ) × · · · × (ξ p − ǫ, ξ p + ǫ)

gilt, wobei x = (ξ j ) pj=1 , folgt, dass die Menge aller p-dimensionalen Quader

{(a1 , b1 ) × · · · × (a p , b p ) : a j , b j ∈ R, a j < b j , j = 1, . . . , p}

eine Basis von T (d∞ ) abgibt. Wegen T (d∞ ) = T (d2 ) (siehe Beispiel 12.3.10)
sind diese trivialerweise auch Basis von T (d2 ).
Ähnlich wie für R sieht man, dass auch

{(s1 , t1 ) × · · · × (s p , t p ) : s j , t j ∈ Q, s j < t j , j = 1, . . . , p}

eine abzählbare Basis von T (d2 ) ist.


12.4.6 Satz. Ist B ⊆ P(X) Basis einer gegebenen Topologie T auf X, so erfüllt B
(B1) Ist B1 , B2 ∈ B, x ∈ B1 ∩ B2 , so existiert B3 ∈ B mit x ∈ B3 ⊆ B1 ∩ B2 .
S
(B2) B∈B B = X.
Außerdem ist T die gröbste Topologie, die B enthält, dh. T = T (B).
Ist C ⊆ P(X) Subbasis einer gegebenen Topologie T auf X, so ist T die gröbste
Topologie, die C enthält, dh. T = T (C).
Beweis. Wegen B ⊆ T muss T (B) ⊆ T . Ist andererseits O ∈ T , so folgt aus der
Tatsache, dass B eine Basis ist, zusammen mit Bemerkung 12.4.3
[
O= B. (12.8)
B∈B, B⊆O

Wegen B ⊆ T (B) und wegen (O3) ist jede dieser Mengen auch in T (B), dh. T ⊆ T (B).
Aus (12.8) angewandt auf O = X sieht man unmittelbar, dass (B2) erfüllt ist.
S
Für B1 , B2 ∈ B ⊆ T gilt B1 ∩ B2 ∈ T . Aus B1 ∩ B2 = {B ∈ B : B ⊆ B1 ∩ B2} folgt
für jedes x ∈ B1 ∩ B2 die Existenz eines B3 ∈ B mit x ∈ B3 ⊆ B1 ∩ B2 . Also gilt auch
(B1).
Ist schließlich C ⊆ P(X) eine Subbasis von T , so folgt aus Bemerkung 12.4.4, dass
E eine Basis von T ist, und daher T = T (E). Wegen C ⊆ E gilt T (C) ⊆ T (E).
Ist andererseits E ∈ E, so gilt E = X oder E = C1 ∩ · · · ∩ Cn für
C1 , . . . , Cn ∈ C ⊆ T (C). Aus (O1) bzw. (O2) folgt dann E ∈ T (C), und daher
E ⊆ T (C). Somit gilt auch T (E) ⊆ T (C), und insgesamt T = T (E) = T (C).

150 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.4.7 Lemma. Seien (X, T ) und (Y, O) topologische Räume und f : X → Y eine
Abbildung. Ist C eine Subbasis von O, so ist f genau dann stetig, wenn f −1 (C) ⊆ T .
Beweis. Aus der Stetigkeit folgt unmittelbar f −1 (C) ⊆ f −1 (O) ⊆ T .
Ist umgekehrt f −1 (C) ⊆ T , so prüft man leicht nach, dass
O′ := {O′ ⊆ Y : f −1 (O′ ) ∈ T }
die Axiome (O1) - (O3) erfüllt, dh. eine Topologie ist. Da laut Voraussetzung C ⊆ O′ ,
muss auch O = T (C) ⊆ O′ , und daher f −1 (O) ∈ T für alle O ∈ O.

Wir wollen nun den umgekehrten Weg wie in Satz 12.4.6 gehen.
12.4.8 Satz. Erfüllt B ⊆ P(X) die Axiome (B1) und (B2), so ist B eine Basis von T (B).
Außerdem stimmt T (B) mit dem System T aller Mengen O ⊆ X der Bauart
[
O= B
B∈V

mit einem (von O abhängigen) Teilsystem V ⊆ B überein; also T (B) = T , wobei


[
T = {O ⊆ X : ∃V ⊆ B, O = B}. (12.9)
B∈V

Ist C ⊆ P(X), so ist C eine Subbasis von T (C). Außerdem stimmt T (C) mit dem
System [
{O ⊆ X : ∃V ⊆ E, O = B} (12.10)
B∈V
überein, wobei
n\
n
E := {X} ∪ Ci : n ∈ N, C1 , . . . , Cn ∈ C}.
i=1
die Axiome (B1) und (B2) erfüllt.
Beweis.
 Wir zeigen zunächst, dass T definiert in (12.9) eine Topologie auf X ist. Zunächst
ist [
∅= B∈T,
B∈∅
und wegen (B2) [
X= B ∈ T.
B∈B
Also gilt (O1). Die Bedingung (O3) folgt aus
[ [  [
B = B.
S
i∈I B∈Vi B∈ i∈I Vi
S S
Es bleibt (O2) zu zeigen. Seien also O1 = B∈V1 B, O2 = B∈V2 B gegeben.
Jedes x ∈ O1 ∩ O2 liegt somit in einem B1 ∈ V1 und einem B2 ∈ V2 . Nach (B1)
gibt es ein B ∈ B mit x ∈ B ⊆ B1 ∩ B2 ⊆ O1 ∩ O2 . Wir erhalten (vgl. Bemerkung
12.4.3) [
O1 ∩ O2 = B,
B∈V
wobei V := {B ∈ B : B ⊆ O1 ∩ O2 }. Also O1 ∩ O2 ∈ T .
12.5. INITIALE TOPOLOGIE UND FINALE TOPOLOGIE 151

 Offensichtlich gilt B ⊆ T . Ist x ∈ O ∈ T , so folgt aus (12.9), dass x ∈ B ⊆ O für


ein gewisses B ∈ B. Also ist B Basis von T , und wegen Satz 12.4.6 ist damit T
die gröbste Topologie T (B), die B umfasst..
 Ist C ⊆ P(X), so sieht man unmittelbar, dass X ∈ E und dass mit E1 , E2 ∈ E auch
E1 ∩ E2 ∈ E. Insbesondere erfüllt E (B1) und (B2). Nach dem oben gezeigten
ist E Basis von T (E), wobei T (E) mit der Topologie in (12.10) übereinstimmt.
Wegen Bemerkung 12.4.4 bedeutet das, dass C eine Subbasis von T (E) ist, und
aus Satz 12.4.6 folgt damit schließlich T (C) = T (E).

12.5 Initiale Topologie und Finale Topologie


Mit dem Konzept Basis und Subbasis können wir auf einer gegebenen Menge ausge-
zeichnete Topologien definieren, die gewisse Eigenschaften haben.
12.5.1 Satz. Seien X eine Menge, (Yi , Ti ), i ∈ I, topologische Räume und fi : X → Yi ,
i ∈ I, Abbildungen. Dann existiert genau eine Topologie T auf X mit der Eigenschaft
(IN1 ) T ist die gröbste Topologie auf X, sodass alle Abbildungen fi : (X, T ) →
(Yi , Ti ), i ∈ I, stetig sind.
Diese Topologie heißt initiale Topologie bezüglich der fi . Für sie gilt
S
(IN2 ) i∈I fi−1 (Ti ) ist eine Subbasis von T ,
und
(IN3 ) Ist (Y, O) ein beliebiger topologischer Raum und f : Y → X, so ist f : (Y, O) →
(X, T ) genau dann stetig, wenn alle Abbildungen

fi ◦ f : (Y, O) → (Yi , Ti ), i ∈ I ,

stetig sind.
Beweis.
 Ist T ′ eine beliebige Topologie auf X, so ist fi : (X, T ′ ) → (Xi , Ti ) genau dann
stetig, wenn fi−1 (Ti ) ⊆ T ′ . Also sind alle fi genau dann stetig, wenn
[
fi−1 (Ti ) ⊆ T ′ . (12.11)
i∈I
S
Nach Lemma 12.4.1 gibt es eine gröbste Topologie T = T ( i∈I fi−1 (Ti )), die
(12.11) erfüllt. Damit ist aber auch T die gröbste Topologie, sodass alle fi stetig
sind. Also gilt (IN1 ).
S
Wegen Satz 12.4.8 ist i∈I fi−1 (Ti ) Subbasis von T , und es gilt auch (IN2 ).
 Sei f : (Y, O) → (X, T ), wobei T die initiale Topologie der fi , i ∈ I, ist. Im Falle
der Stetigkeit von f sind auch alle fi ◦ f : (Y, O) → (Yi , Ti ) als Zusammensetzung
stetiger Abbildungen stetig.
152 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

Seien umgekehrt alle fi ◦ f stetig, d.h. es gelte ( fi ◦ f )−1 (Ti ) ⊆ O. Dann folgt
f −1 ( fi−1 (Ti )) ⊆ O und damit
[
f −1 ( fi−1 (Ti )) ⊆ O.
i∈I
S
Da i∈I fi−1 (Ti ) eine Subbasis von T ist, folgt aus Lemma 12.4.7, dass f stetig
ist. Die initiale Topologie T hat also die Eigenschaft (IN3 ).



12.5.2 Bemerkung. Die initiale Topologie T ist in der Tat die einzige Topologie T mit der Eigenschaft (IN3 ). Um das
einzusehen, sei T ′ eine weiters Topologie auf X mit der Eigenschaft (IN3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (IN3 ) angewandt auf T ′ , dass alle fi ◦ idX :
(X, T ′ ) → (Yi , Ti ) stetig sind. Aus (IN1 ) folgt T ⊆ T ′ .
Für idX : (X, T ) → (X, T ′ ) sind andererseits alle Abbildungen fi ◦ idX = fi : (X, T ) → (Yi , Ti ) stetig. Mit (IN3 )
angewandt auf T ′ folgt die Stetigkeit von id X : (X, T ) → (X, T ′ ), und daher T ′ ⊆ T . Insgesamt ist T ′ = T .

12.5.3 Lemma. Mit der Notation aus Satz 12.5.1 sei (x j ) j∈J ein Netz in X. Dieses

konvergiert bzgl. T gegen ein x ∈ X genau dann, wenn fi (x j ) j∈J für alle i ∈ I gegen
fi (x) konvergiert.

Beweis. Konvergiert (x j ) j∈J gegen x bzgl. T , so folgt aus der Stetigkeit der fi mit

Lemma 12.3.3, dass fi (x j ) j∈J gegen fi (x) konvergiert.

Gelte umgekehrt, dass fi (x j ) j∈J gegen fi (x) für alle i ∈ I konvergiert. Für ein
U ∈ U(x) mit oBdA. U , X und O ∈ T mit x ∈ O ⊆ U folgt aus der Tatsache,
S
dass i∈I fi−1 (Ti ) eine Subbasis von T ist (vgl. (IN2 ) aus Satz 12.5.1), und Definition
12.4.2, dass
x ∈ fi−1
1
(O1 ) ∩ · · · ∩ fi−1
m
(Om ) ⊆ O,
wobei i1 , . . . , im ∈ I, O1 ∈ Ti1 , . . . , Om ∈ Tim . Also folgt fik (x) ∈ Ok , k = 1, . . . , m, und
laut Voraussetzung gibt es Indizes j1 , . . . , jm , ∈ J, sodass j  jk ⇒ fik (x j ) ∈ Ok , k =
1, . . . , m. Ist nun j0 ∈ J derart, dass j0  jk , k = 1, . . . , m, so folgt für j  j0 jedenfalls
fik (x j ) ∈ Ok , k = 1, . . . , m, und daher

x j ∈ fi−1
1
(O1 ) ∩ · · · ∩ fi−1
m
(Om ) ⊆ O ⊆ U.


Die Konstruktion der Initialen Topologie ist assoziativ.

12.5.4 Korollar. Seien X, Yi , i ∈ I, topologische Räume und fi : X → Yi , i ∈ I, Ab-


bildungen. Weiters seien zu jedem i ∈ I eine Indexmenge Ji und topologische Räume
(Zi, j , Ti, j ) und Abbildungen gi, j : Yi → Zi, j gegeben. Versieht man Yi mit der initialen
Topologie Ti bezüglich der Abbildungen gi, j , j ∈ Ji , so stimmt die initiale Topologie
T1 auf X bezüglich der Abbildungen fi : X → Yi , i ∈ I, mit der initialen Topologie T2
auf X bezüglich der Abbildungen gi, j ◦ fi : X → Zi, j , i ∈ I, j ∈ Ji , überein.

Beweis. Wir versehen die Xi mit der initialen Topologie Ti bezüglich der Abbildungen
gi, j , j ∈ Ji . Ist T irgendeine Topologie auf X, so ist wegen (IN3 ) angewandt auf die
(Xi , Ti ) die Tatsache, dass alle Abbildungen fi : X → Yi , i ∈ I, stetig sind, dazu
äquivalent, dass alle Abbildungen gi, j ◦ fi : X → Zi, j , i ∈ I, j ∈ Ji , stetig sind.
12.5. INITIALE TOPOLOGIE UND FINALE TOPOLOGIE 153

Also stimmt die gröbste aller Topologien, die die erste Bedingung erfüllen, -
wegen (IN1 ) ist das T1 - mit der gröbsten aller Topologien, die die zweite Bedingung
erfüllen, - wegen (IN1 ) ist das T2 - überein.

12.5.5 Beispiel. Sei (Y, T ) ein topologischer Raum und X ⊆ Y. Weiters sei ι : X →
Y die kanonische Einbettung, ι(x) = x. Die initiale Topologie auf X bezüglich der
Abbildung ι heißt die Spurtopologie von T auf X und wird bezeichnet als T |X . Man
spricht von (X, T |X ) als einem Teilraum von (Y, T ). Wegen Satz 12.5.1 ist

ι−1 (T ) = {O ∩ X : O ∈ T } ⊆ P(X)

eine Subbasis für T |X . Nun erfüllt diese Menge selbst schon (O1) − (O3), d.h. es gilt

T |X = {O ∩ X : O ∈ T } .

Damit erhält man auch, dass das System A|X der in (X, T |X ) abgeschlossenen Mengen
gegeben ist durch
A|X = {A ∩ X : A ∈ A} , (12.12)
und dass der Umgebungsfilter U|X (x) eines Elementes x ∈ X bezüglich T |X genau

U|X (x) = {U ∩ X : U ∈ U(x)}

ist. Erfüllt (Y, T ) das Axiom (T 2), so folgt somit, dass auch (X, T |X ) dieses Axiom
erfüllt.
Weiters folgt aus (12.12) für A ⊆ X
T |X T
A = A ∩X, (12.13)

und aus (IN3 ) folgt, dass eine Funktion f : (Y, O) → (X, T |X ) genau dann stetig ist,
wenn f : (Y, O) → (Y, T ) stetig ist.
Ist (x j ) j∈J ein Netz in X und x ∈ X, so erkennt man aus der letzten Behauptung von
Satz 12.5.1, dass (x j ) j∈J genau dann gegen x bzgl. T konvergiert, wenn (x j ) j∈J bzgl.
T |X gegen x konvergiert.
Ist schließlich X ⊆ Z ⊆ Y, so gilt wegen Korollar 12.5.4

T |X = (T |Z )|X . (12.14)

12.5.6 Beispiel. Sei (Y, d) ein metrischer Raum, und sei X ⊆ Y versehen mit der Ein-
schränkung von d|X×X . Klarerweise ist (X, d|X×X ) ein metrischer Raum.
Die von d|X×X auf X erzeugte Topologie ist genau die Spurtopologie, die von T (d)
auf X induziert wird:
Ist O ∈ T (d) und x ∈ O ∩ X, so gibt es ein ǫ > 0 mit Uǫ (x) ⊆ O. Daraus folgt, dass
die ǫ-Kugel Uǫ (x) ∩ X um x bezüglich d|X×X in O ∩ X enthalten ist. Also ist jede Menge
aus T (d)|X offen bezüglich d|X×X .
Ist umgekehrt P ∈ T (d|X×X ), so wähle man für jedes x ∈ P ein ǫ x > 0, sodass die
ǫ x -Kugel X ∩ Uǫx (x) in X in P enthalten ist. Es folgt
[  [
P= X ∩ Uǫx (x) = X ∩ Uǫx (x).
x∈P x∈P

Somit ist P der Schnitt einer in Y offenen Menge und X, also P ∈ T (d)|X .
154 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

Ein unscheinbares aber recht oft anwendbares Ergebnis ist folgendes.

12.5.7 Lemma. Seien (X, T ), (Y, O) topologische Räume und A, B ⊆ X mit A ∪ B = X, wobei entweder A und B beide
abgeschlossen oder beide offen sind.
Sind f : A → Y und g : B → Y zwei stetige Funktionen, wobei A bzw. B beide mit der Spurtopologie (vgl. Beispiel
12.5.5) versehen sind, sodass f und g auf A ∩ B übereinstimmen, dann ist auch die Funktion f ∪ g : X → Y 3 stetig.

Beweis. Seien A, B beide abgeschlossen. Der offene Fall ist ähnlich zu beweisen. Ist F ⊆ Y abgeschlossen, so ist

( f ∪ g)−1 (F) = f −1 (F) ∪ g−1 (F).

Wegen der Stetigkeit von f : A → Y ist f −1 (F) abgeschlossen in der Spurtopologie T |A , und somit von der Bauart C ∩ A
für eine in X abgeschlossene Menge C. Als Schnitt zweier in X abgeschlossener Mengen ist f −1 (F) in X abgeschlossen.
Genauso zeigt man, dass g−1 (F) in X abgeschlossen ist. Als Vereinigung zweier abgeschlossener Mengen ist dann
auch ( f ∪ g)−1 (F) abgeschlossen. Da F beliebig war, ist damit f ∪ g stetig.

Q
12.5.8 Definition. Seien (Xi , Ti ), i ∈ I, topologische Räume, und sei X := i∈I Xi . Die
initiale Topologie auf X bezüglich der Familie πi : X → Xi der kanonischen Projektio-
nen

πi (xk )k∈I = xi
Q
heißt die Produkttopologie der Ti auf X und wird bezeichnet mit i∈I Ti .
Für ein O ⊆ Xi gilt Y
π−1
i (O) = Ok
k∈I

wobei Ok = Xk , k , i, und Oi = O ist. Wieder mit (IN2 ) und Bemerkung 12.4.4 erhält
man daraus, dass die Mengen der Gestalt
Y
Ok ,
k∈I

wobei Ok ∈ Tk , k ∈ I, und für alle k ∈ I bis auf endlich viele Ok = Xk gilt, eine Basis
Q
für i∈I Ti bilden.
Q
Ist i ∈ I fest, so gilt klarerweise πi ( k∈I Ok ) = Oi . Also ist das Bild unter πi
Q
einer jeden Menge aus dieser Basis offen in (Xi , Ti ). Da jede offene Menge in k∈I Tk
Vereinigung von Basismengen ist, folgt
12.5.9 Proposition. Die kanonischen Projektionen πi : X → Xi bilden offene Menge
Q
in k∈I Tk auf offene Mengen in Ti ab, also sind sie offene Abbildungen.
Weiters sieht man leicht mit Hilfe obigen konstruierter Basis, dass für einen Punkt
(xi )i∈I ∈ X die Mengen Y
Ui ,
i∈I

wobei Ui ∈ U(xi ), i ∈ I, und Ui = Xi für alle bis auf endlich viele i, eine Umgebungs-
Q
basis bezüglich i∈I Ti bilden.
Q
Aus Lemma 12.5.3 folgt, dass für ein Netz (x j ) j∈J und einem Punkt x aus i∈I Xi ,
d.h. x j = (ξ j,i )i∈I und x = (ξi )i∈I mit ξ j,i , ξi ∈ Xi ,
j∈J j∈J
x j −→ x ⇔ ∀i ∈ I : ξ j,i −→ ξi . (12.15)
3 Das ist die Funktion, die auf A mit f und auf B mit g übereinstimmt.
12.5. INITIALE TOPOLOGIE UND FINALE TOPOLOGIE 155

Zusammen mit Proposition 12.2.7 folgt daraus, dass für abgeschlossene Ai ⊆


Q Q
Xi , i ∈ I, das Produkt i∈I Ai ⊆ i∈I Xi ebenfalls abgeschlossen ist. Alternativ kann
man das auch daraus erkennen, dass
Y \
Ai = π−1
i (Ai )
i∈I i∈I

als Durchschnitt von Urbildern abgeschlossener Mengen unter stetigen Funktionen sel-
ber wieder abgeschlossen ist.
12.5.10 Bemerkung. Wendet man diese Konstruktion der Produkttopologie etwa auf
zwei Räume (X1 , T1 ) und (X2 , T2 ) an, d.h. I = {1, 2}, so bilden insbesondere alle Men-
gen der Bauart O1 × O2 mit O1 ⊆ X1 , O2 ⊆ X2 eine Basis der Produkttopologie T1 × T2 .
Außerdem sind alle Mengen A1 × A2 für abgeschlossene A1 ⊆ X1 , A2 ⊆ X2 , ebenfalls
abgeschlossen.
12.5.11 Beispiel. Seien (Y1 , d1 ) un (Y2 , d2 ) zwei metrische Räume, und sei d : Y1 ×Y2 →

R definiert als d (x1 , x2 ), (y1 , y2 ) = max(d1 (x1 , y1 ), d2 (x2 , y2 )), vgl. Fakta 8.7.7.

Wir wissen schon, dass d eine Metrik auf Y1 × Y2 ist, und dass Uǫ (x1 , x2 ) =
Uǫ (x1 ) × Uǫ (x2 ).
Die von dieser Metrk erzeugte Topologie T (d) stimmt mit der Produkttopologie
von T (d1 ) und T (d2 ) überein. Um das einzusehen sei O ⊆ Y1 × Y2 . Diese Menge ist in
T (d), genau dann, wenn

∀(x1 , x2 ) ∈ O ⇒ ∃ǫ > 0 : Uǫ (x1 , x2 ) = Uǫ (x1 ) × Uǫ (x2 ) ⊆ O,

was aber äquivalent zu

∀(x1 , x2 ) ∈ O ⇒ ∃O1 ∈ T (d1 ), O2 ∈ T (d2 ) : (x1 , x2 ) ∈ O1 × O2 ⊆ O

ist. Da die Mengen der Form O1 × O2 eine Basis von T (d1 ) × T (d2 ) darstellen, bedeutet
das genau O ∈ T (d1 ) × T (d2 ).
Folgendes Korollar samt Beweis funktioniert übrigens auch für Funktionen mit
Werten in einem normierten Raum.

12.5.12 Korollar. Sei (X, T ) ein topologischer Raum, und f, g : X → R (C), sowie
λ, µ ∈ R (C). Sind f und g stetig, so auch λ f +µg und f g. Ist zusätzlich f (x) , 0, x ∈ X,
so ist auch 1f stetig.

Beweis. Die Funktion (x, y) 7→ λx + µy, R × R → R ist bekannterweise stetig. Nach


(IN3 ) angewandt auf R × R ist a 7→ ( f (a), g(a)), X → R × R ebenfalls stetig. λ f + µg
ist nun als Zusammensetzung dieser Funktionen ebenfalls stetig.
Der Beweis für f g und 1f verläuft analog.

12.5.13 Satz. Sei X eine Menge, seien (Yi , Ti ), i ∈ I, topologische Räume und fi : Yi → X, i ∈ I, Abbildungen. Dann
existiert genau eine Topologie T auf X mit der Eigenschaft:

(FI1 ) T ist die feinste Topologie auf X, sodass alle Abbildungen fi : (Yi , Ti ) → (X, T ), i ∈ I, stetig sind.

Diese Topologie heißt finale Topologie bezüglich der fi . Sie ist gegeben durch

(FI2 ) T = {O ⊆ X : fi−1 (O) ∈ Ti für alle i ∈ I},

und erfüllt:
156 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

(FI3 ) Ist (Y, O) ein topologischer Raum und f : X → Y, so ist f : (X, T ) → (Y, O) stetig genau dann, wenn alle
Abbildungen
f ◦ fi : (Yi , Ti ) → (Y, O), i ∈ I ,
stetig sind.
Beweis.
 Wir betrachten die durch (FI2 ) definierte Menge T ⊆ P(X). Es gilt

fi−1 (O1 ∩ . . . ∩ On ) = fi−1 (O1 ) ∩ . . . ∩ fi−1 (On )

und [  [
fi−1 Oj = fi−1 (O j ) .
j∈J j∈J

S also O1 , . . . , On ∈ T bzw. O j ∈ T , j ∈ J,−1so folgt, da die


Sind
−1
Ti Topologien sind, O1 ∩ . . . ∩ On ∈ T und
j∈J O j ∈ T . D.h. T erfüllt (O2), (O3). Wegen fi (∅) = ∅ und fi (X) = Yi gilt auch (O1) für T .

Definitionsgemäß gilt fi−1 (T ) ⊆ Ti , womit alle fi : (Yi , Ti ) → (X, T ) stetig sind. Ist T ′ eine Topologie auf X,
sodass alle fi stetig sind, so folgt fi−1 (O) ∈ Ti für alle O ∈ T ′ , also O ∈ T . Also gilt T ′ ⊆ T , und T erfüllt (FI1 ).
Klarerweise gibt es höchstens eine Topologie mit der Eigenschaft (FI1 ).

 Sei T die finale Topologie bezüglich der fi , und sei f : X → Y. Ist f stetig, so ist auch f ◦ fi : (Yi , Ti ) → (X, T ) →
(Y, O) als Zusammensetzung stetiger Abbildungen stetig. Sei umgekehrt f ◦ fi stetig für alle i. Dann gilt

fi−1 ( f −1 (O)) = ( f ◦ fi )−1 (O) ⊆ Ti , i ∈ I ,

und wir erhalten f −1 (O) ⊆ T , d.h. f stetig.



12.5.14 Bemerkung. Die Finale Topologie ist einzige Topologie auf X, die (FI3 ) erfüllt. Um das einzusehen, sei T eine
weiters Topologie auf X mit der Eigenschaft (FI3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (FI3 ) angewandt auf T ′ , dass alle idX ◦ fi :
(Yi , Ti ) → (X, T ′ ) stetig sind. Aus (FI1 ) folgt T ′ ⊆ T .
Für idX : (X, T ′ ) → (X, T ) sind andererseits alle Abbildungen idX ◦ fi = fi : (Yi , Ti ) → (X, T ) stetig. Mit (FI3 )
angewandt auf T ′ folgt die Stetigkeit von id X : (X, T ′ ) → (X, T ), und daher T ⊆ T ′ . Insgesamt ist T ′ = T .
12.5.15 Bemerkung. Das Finale Topologie Bilden ist assoziativ; dh. es gilt ein Korollar 12.5.4 entsprechendes Resultat.
12.5.16 Beispiel. Sei (Y, T ) ein topologischer Raum und ∼ eine Äquivalenzrelation auf Y. Weiters sei π : Y → Y/∼ die
kanonische Projektion, π(x) = [x]∼ . Die finale Topologie auf Y/∼ bezüglich π heißt Quotiententopologie und wird bezeichnet
als T /∼ .
Ist A ⊆ Y, so heißt A gesättigt bezüglich ∼, wenn x ∈ A die Inklusion [x]∼ ⊆ A nach sich zieht. Offenbar sind alle
Mengen der Bauart π−1 (B) mit B ⊆ Y/∼ gesättigt, und A ist genau dann gesättigt, wenn π−1 (π(A)) = A. Somit stellt A 7→ π(A)
eine bijektive Abbildung von allen gesättigten Teilmengen von Y auf alle Teilmengen von Y/∼ dar, wobei B 7→ π−1 (B) ihre
Umkehrung ist.
Eine Menge P ⊆ Y/∼ ist per definitionem genau dann offen in (Y/∼ , T /∼ ), wenn π−1 (P) offen in (Y, T ) ist. Insbe-
sondere ist O 7→ π(O) eine Bijektion von allen gesättigten offenen Teilmengen von Y auf T /∼ . Entsprechendes gilt für
abgeschlossene Mengen.
12.5.17 Proposition. Sei f : (X, T ) → (Y, V) eine stetige Abbildung. Bezeichne mit ∼ die Äquivalenzrelation x ∼ y : ⇐⇒
f (x) = f (y), und seien π : X → X/∼ , ι : f (X) → Y, die kanonische Projektion bzw. Einbettung. Weiters sei g : X/∼ → f (X)
die Bijektion mit ι ◦ g ◦ π = f .
Dann ist g : (X/∼ , T /∼ ) → ( f (X), V| f (X) ) stetig. Außerdem sind folgende Aussagen äquivalent
(i) g ist ein Homöomorphismus von (X/∼ , T /∼ ) auf ( f (X), V| f (X) ).

(ii) Für jede bezüglich ∼ gesättigte offene Menge O ⊆ X ist f (O) offen in ( f (X), V| f (X) ).

(iii) Für jede bezüglich ∼ gesättigte abgeschlossene Menge A ⊆ X ist f (A) abgeschlossen in ( f (X), V| f (X) ).
Beweis. Nach Satz 12.5.1,(IN3 ), bzw. Beispiel 12.5.5 ist auch f : (X, T ) → ( f (X), V| f (X) ) stetig. Somit können wir oBdA.
Y = f (X) und damit auch ι = idY annehmen.
Jede Abbildung g : X/∼ → Y mit g ◦ π = f muss g([x]∼ ) = f (x) für x ∈ X erfüllen. Betrachten wir das als Definition, so
ist die Wohldefiniertheit davon zu zeigen. Diese folgt aber unmittelbar aus der Definition von von ∼, da [x]∼ = [y]∼ immer
x ∼ y und damit f (x) = f (y) nach sich zieht. Also gibt es ein solches g und dieses ist eindeutig. Außerdem ist g injektiv, da
aus f (x) = g([x]∼ ) = g([y]∼ ) = f (y) per definitionem x ∼ y bzw. [x]∼ = [y]∼ folgt. Wegen g(X/∼ ) = f (X) = Y ist g sogar
bijektiv.
Die Stetigkeit von g folgt unmittelbar aus Satz 12.5.13, (FI3 ), da X/∼ die finale Topologie T /∼ bzgl. π trägt und da
g ◦ π = f stetig ist.
Die Funktion g ist nun genau dann Homöomorphismus, wenn noch g−1 stetig ist, d.h. wenn g(P) ∈ V für alle P ∈ T /∼ .
Nach Beispiel 12.5.16 durchläuft π−1 (P) aber alle offenen und gesättigten Teilmengen von X. Zudem gilt

g(P) = g ◦ π(π−1 (P)) = f (π−1 (P)),

woraus man sofort die Äquivalenz von (i) und (ii) erkennt. Die Äquivalenz von (i) und (iii) zeigt man genauso.

12.6. TRENNUNGSEIGENSCHAFTEN 157

12.6 Trennungseigenschaften
Wir wollen dieses Kapitel mit der einfachen Bemerkung starten, dass in (T 2) Räumen
einpunktige Mengen {x} abgeschlossen sind. Das folgt aus der Beobachtung, dass es
zu y ∈ {x}c wegen (T 2) eine Umgebung gibt, die x nicht enthält, bzw. ganz in {x}c
enthalten ist. Wegen Lemma 12.1.11 ist {x}c offen.

12.6.1 Definition. Man sagt, dass sich zwei disjunkte Mengen A und B in einem Topo-
logischen Raum trennen lassen, wenn es disjunkte offene Mengen OA , OB gibt, sodass
A ⊆ OA , B ⊆ O B .
Ein topologischer Raum (X, T ) heißt regulär, falls er neben dem Axiom (T 2) noch
das Trennungsaxiom (T 3) erfüllt:

(T 3 ) Abgeschlossene Mengen A und einpunktige Mengen {x} mit x < A lassen sich
trennen, d.h. ∃O x , OA ∈ T : x ∈ O x , A ⊆ OA , O x ∩ OA = ∅.

OA
A
Ox
x

Abbildung 12.2: Drittes Trennungsaxiom (T 3 )

Ein topologischer Raum (X, T ) heißt normal, falls er neben dem Axiom (T 2) noch
das Trennungsaxiom (T 4) erfüllt:

(T 4 ) Disjunkte abgeschlossene Mengen A und B lassen sich trennen, d.h. ∃OA , OB ∈


T : A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅.

OB
B
OA
A

Abbildung 12.3: Viertes Trennungsaxiom (T 4 )

Da einpunktige Mengen abgeschlossen sind, folgt aus normal regulär. Im allgemei-


nen gilt aber nicht die Umkehrung.
12.6.2 Bemerkung. Zwei disjunkte Mengen A und B - die Disjunktheit ist äquivalent
zu A ⊆ Bc - lassen sich genau dann trennen, wenn es ein offenes O gibt, sodass

A ⊆ O ⊆ O ⊆ Bc . (12.16)
158 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

In der Tat folgt aus A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅, dass A ⊆ OA ⊆ OcB ⊆ Bc und


daraus A ⊆ OA ⊆ OA ⊆ OcB ⊆ Bc .
c c
Andererseits folgt aus (12.16) unmittelbar A ⊆ O, B ⊆ O , O ∩ O = ∅.

12.6.3 Korollar. Das Axiom (T 3) ist äquivalent zur Tatsache, dass man zu einer belie-
bigen Umgebung U ∈ U(x) eines Punktes x eine Umgebung V ∈ U(x) mit V ⊆ U finden
kann.

12.6.4 Bemerkung. Im Gegensatz zu (T 4) vererben sich die Axiome (T 2) und (T 3)


auf Teilräume, d.h. ist Y ⊆ X und (X, T ) ein topologischer Raum, der (T 2) bzw. (T 3)
erfüllt, so erfüllt auch (Y, T |Y ) (T 2) bzw. (T 3).
Um das einzusehen, erfülle X zunächst das (T 2). Sind dann x , y ∈ Y und O x , Oy ∈
T disjunkt mit x ∈ O x bzw. y ∈ Oy , so folgt x ∈ O x ∩ Y ∈ T |Y , y ∈ Oy ∩ Y ∈ T |Y . Also
erfüllt Y auch das Axiom (T 2).
Gilt (T 3) auf X, und ist x ∈ Y und W eine Umgebung von x in Y, so haben wir
in Beispiel 12.5.5 gesehen, dass dass W = U ∩ Y für eine Umgebung U von x in X.
Wegen (T 3) gibt es eine Umgebung V von x in X mit V ⊆ U und somit ist V ∩ Y eine
Umgebung von x in Y mit
T |Y T
x∈V∩Y = V ∩ Y ∩ Y ⊆ V ∩ Y ⊆ U ∩ Y = W.

Also gilt (T 3) auch auf Y.

12.6.5 Bemerkung.
Q Ähnlich
Q zeigt man, dass sich die Axiome (T 2) und (T 3) von topologischen Räumen (Xi , Ti ) auf den
Produktraum ( i∈I Xi , i∈I Ti ) vererben.

12.6.6 Beispiel. Metrische Räume sind nomal. Dazu seien A und B zwei disjunkte,
abgeschlossene Mengen.
Zu a ∈ A gibt es ein ǫa > 0 mit U2ǫa (a) ⊆ Bc . Entsprechend wählt man ǫb für b ∈ B.
Nun setze [ [
OA := Uǫa (a), OB := Uǫb (b).
a∈A b∈B

Ist c ∈ OA ∩ OB , so gibt es a ∈ A, b ∈ B mit c ∈ Uǫa (a) ∩ Uǫb (b). O.B.d.A. sei ǫa ≥ ǫb .


Es folgt d(a, b) ≤ d(a, c) + d(c, b) < 2ǫa , was aber b ∈ U2ǫa (a) implizieren würde, im
Widerspruch zur Wahl von ǫa . Also gilt A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅.

Zusammenhang
Eins zu eins kann man den Begriff einer Zusammenhängenden Menge auf topologische Räume verallgemeinern (vgl. Defi-
nition 6.2.2).

12.6.7 Definition. Eine Teilmenge E eines topologischen Raumes (X, T ) heißt zusammenhängend, wenn man E nicht als
Vereinigung zweier nichtleerer getrennter Mengen schreiben kann. Dabei heißen A und B getrennt, wenn A∩ B = A∩ B = ∅4 .

12.6.8 Lemma. Eine Teilmenge E eines topologischen Raumes (X, T ) ist genau dann zusammenhängend, wenn sich E
nicht als E = A ∪ B schreiben lässt, wobei A, B zwei disjunkte, nichtleere und bzgl. T |E abgeschlossene Teilmengen von E
sind.
Das ist auch dazu äquivalent, dass sich E nicht als E = A ∪ B schreiben lässt, wobei A, B zwei disjunkte, nichtleere
und bzgl. T |E offene Teilmengen von E sind.

4 Man beachte, dass zwei Mengen getrennt sind, wenn sie sich im Sinne von Definition 12.6.1 trennen

lassen, aber im Allgemeinen nicht umgekehrt.


12.6. TRENNUNGSEIGENSCHAFTEN 159

Beweis. Ist E = A ∪ B mit ∅ , A, ∅ , B, A ∩ B = ∅, so ist der Abschluss von A bzgl. T |E wegen (12.13) genau
A ∩ E = A ∪ (B ∩ A). Damit ist A bzgl. T |E genau dann abgeschlossen, wenn B ∩ A = ∅. Entsprechendes gilt für B.
Somit sind A und B genau dann getrennt, wenn A und B bzgl. T |E abgeschlossen sind. Durch Übergang zu den
Komplementen sieht man, dass das genau dann gilt, wenn A und B bzgl. T |E offen sind.

Das wichtige Resultat Proposition 6.2.4 lässt sich unmittelbar auf topologische Räume übertragen, wobei man fast
den selben Beweis nehmen kann. Man muss nur Folgen durch Netze ersetzen. Wir wollen diesen Beweis aber etwas anders
führen.

12.6.9 Proposition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y eine stetige Funktion. Ist E ⊆ X
zusammenhängend, so auch f (E).

Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A ∪ B mit A, B , ∅ und A ∩ B = A ∩ B = ∅.
Für die nichtleeren Mengen E ∩ f −1 (A), E ∩ f −1 (B) folgt
   
E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅.

Nach Satz 12.3.5 gilt

      
f E ∩ f −1 (A) ∩ E ∩ f −1 (B) ⊆ f E ∩ f −1 (A) ∩ f E ∩ f −1 (B) ⊆ A ∩ B = ∅.


Entsprechend gilt (E ∩ f −1 (B) ∩ E ∩ f −1 (A) = ∅, und E wäre somit nicht zusammenhängend, was unserer Annahme
widerspricht.

Folgender recht trivialer Sachverhalt ist jedoch sehr nützlich.

12.6.10 Lemma. Sei E eine zusammenhängende Teilmenge eines topologischen Raumes (X, T ). Weiters seien A, B ⊆ X
getrennt und so, dass E ⊆ A ∪ B. Dann folgt entweder E ⊆ A oder E ⊆ B.

Beweis. Offensichtlich sind A∩E und B∩E als Teilmengen zweier getrennter Mengen getrennt. Wegen E = (A∩E)∪(B∩E)
und da E zusammenhängend ist, folgt A ∩ E = ∅ oder B ∩ E = ∅ bzw. E ⊆ B oder E ⊆ A. Beides kann nicht der Fall sein,
da getrennte Mengen immer disjunkt sind.

Damit können wir auch das im letzten Kapitel bewiesene Resultat Lemma 11.2.18 über die Vereinigung von zusam-
mengängenden Mengen in allgemeinen topologischen Räumen mit einem etwas kürzeren Beweis versehen.

12.6.11TKorollar. Ist (Ei )i∈I eine Familie


S bestehend aus zusammenhängenden Teilmengen eines topologischen Raumes,
sodass i∈I Ei , ∅, so ist auch E := i∈I Ei zusammenhängend.

Beweis. Sei E = A ∪ B mit getrennten A und B. Nach Lemma 12.6.10 folgt für jedes i ∈ I immer entweder Ei ⊆ A oder
Ei ⊆ B. Ist es nicht der Fall, dass immer der erste Fall eintritt oder dass immer der zweite Fall eintritt, so hätten wir Ei ⊆ A
und E j ⊆ B für i, j ∈ I. Laut Voraussetzung sind aber Ei und E j nicht disjunkt, was aber der Getrenntheit von A und B
widerspricht. Somit muss E ganz in A bzw. ganz in B entahlten sein; dh. B = ∅ oder A = ∅.

12.6.12 Korollar. Mit E ist auch jede Teilmenge C eines topologischen Raumes mit E ⊆ C ⊆ E abgeschlossen.

Beweis. Sei C = A ∪ B mit getrennten A und B. Nach Lemma 12.6.10 folgt E ⊆ A oder E ⊆ B. Im ersten Fall folgt aus
C ∩ B ⊆ E ∩ B ⊆ A ∩ B = ∅, dass E ⊆ A und daher B = ∅. Im zweite Fall schließt man entsprechend auf A = ∅.

12.6.13 Korollar. Sei (X, T ) ein topologischer Raum. Ist ∼⊆ X × X die Relation auf X definiert durch

x ∼ y ⇔ ∃E ⊆ X : x, y ∈ E, E ist zusammenhängend,

so ist ∼ eine Äquivalenzrelation. Für ein x ∈ X ist die Äquivalenzklasse [x]∼ die größte zusammenhängende Menge, die x
enthält. Schließlich ist [x]∼ abgeschlossen.

Beweis. Da die einpunktige Menge {x} zusammenhängend ist, ist ∼ reflexiv. Die Symmetrie ist klar. Ist x ∼ y, y ∼ z, und sind
E und F zusammenhängende Mengen, sodass x, y ∈ E und y, z ∈ F, so ist nach Korollar 12.6.11 E ∪ F zusammenhängend,
wobei x, z ∈ E ∪ F. Also ist ∼ ein Äquivalenzrelation. Schließlich ist für x ∈ X die Menge
[
[x]∼ = E,
x∈E
E ist zusammenhängend

wegen Korollar 12.6.11 zusammenhängend. Klarerweise ist diese Menge dann auch die größte Zusammenhängende Menge,
die x enthält. Wegen Korollar 12.6.12 ist sie auch abgeschlossen.

160 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.7 Kompaktheit
Bei metrischen Räumen haben wir den Begriff der Kompaktheit mit Hilfe von Folgen
eingeführt. Für allgemeine topologische Räume wollen wir anders starten. Wir werden
weiter unten sehen, dass dieser Zugang zur Kompaktheit bei metrischen Räumen mit
dem schon bekannten äquivalent ist.

12.7.1 Definition. Eine Teilmenge K eines topologischer Raum (X, T ) heißt kompakt,
wenn jede offene Überdeckung eine endliche Teilüberdeckung besitzt. D.h., ist {Ui :
i ∈ I} ⊆ T eine Familie offener Mengen mit
[
Ui ⊇ K,
i∈I

so gibt es bereits endlich viele Ui1 , . . . , Uin mit

Ui1 ∪ . . . ∪ Uin ⊇ K .

Eine Teilmenge A ⊆ X heißt relativ kompakt, wenn A ⊆ X kompakt ist. Der Raum
(X, T ) heißt lokalkompakt, wenn jeder Punkt x eine kompakte Umgebungen besitzt.

Sei (Ai )i∈I eine Familie von Mengen. Wir sagen, dass (Ai )i∈I die endliche Durch-
schnittseigenschaft hat, wenn für je endlich viele i1 , . . . , in ∈ I stets Ai1 ∩ . . . ∩ Ain , ∅
gilt.

12.7.2 Proposition. Sei (X, T ) ein topologischer Raum und K ⊆ X. Dann sind äqui-
valent:

(K1 ) K ist kompakt.

(K2 ) K betrachtet als Teilmenge von (K, T |K ) ist kompakt.

(K3 ) Jede Familie bzgl. T |K abgeschlossener Teilmengen von K mit der endlichen
Durchschnittseigenschaft hat nichtleeren Durchschnitt.

(K4 ) Jedes Netz (xi )i∈I in K hat ein gegen ein x ∈ K konvergentes Teilnetz.

Beweis.

(K1 ) ⇒ (K2 ): Sei V ⊆ T |K eine offene Überdeckung von K in (K, T |K ). Zu V ∈ V


existiert ein UV ∈ T mit UV ∩ K = V. Also ist U := {UV : V ∈ V} eine
Familie offener Mengen in X, die K überdeckt. Es gibt also UV1 , . . . , UVn mit
UV1 ∪ . . . ∪ UVn ⊇ K. Damit ist auch

V1 ∪ . . . ∪ Vn = (UV1 ∩ K) ∪ . . . ∪ (UVn ∩ K) = (UV1 ∪ . . . ∪ UVn ) ∩ K = K .

(K2 ) ⇒ (K1 ): Ist K als Teilmenge von (K, T |K ) kompakt, und ist U ⊆ T eine Überde-
ckung aus offenen Mengen in (X, T ), so ist

V := {U ∩ K : U ∈ U}

eine offene Überdeckung von (K, T |K ). Daher existiert eine endliche Teilüberde-
ckung {U1 ∩ K, . . . , Un ∩ K}, und daher U1 ∪ . . . ∪ Un ⊇ A.
12.7. KOMPAKTHEIT 161

(K2 ) ⇒ (K3 ): Sei F eine Familie in (K, T |K ) abgeschlossener Teilmengen von K mit
T
der endlichen Durchschnittseigenschaft. Angenommen F∈F F = ∅. Dann folgt
[
K \ F = K,
F∈F

wobei die K \ F in (K, T |K ) offen sind. Also gibt es eine endliche Teilüberde-
ckung, K \ F1 ∪ . . . ∪ K \ Fn = K, und wir erhalten F1 ∩ . . . ∩ Fn = ∅, was aber
der endlichen Durchschnittseigenschaft widerspricht.

(K3 ) ⇒ (K2 ): Sei V ⊇ T |K eine offene Überdeckung von K. Würde V keine endli-
che Teilüberdeckung besitzen, so wäre (K \ V1 ) ∩ . . . ∩ (K \ Vn ) , ∅ für jede
endliche Auswahl V1 , . . . , Vn ∈ V. Also hätte F = {K \ V : V ∈ V} die end-
liche Durchschnittseigenschaft, und nach Voraussetzung wäre der Schnitt aller
Mengen K \ V, V ∈ V nichtleer. Damit wäre V aber keine Überdeckung.

(K3 ) ⇒ (K4 ): Sei (xi )i∈I ein Netz in K. Für i ∈ I ist Ai = {xk : k  i} ∩ K abgeschlossen
in (K, T |K ). Das System Ai , i ∈ I, hat die endliche Durchschnittseigenschaft,
denn sind i1 , . . . , in ∈ I und ist i ∈ I, i  i1 , . . . , in , so gilt

∅ , {xk : k  i} ⊆ {xk : k  i1 } ∩ · · · ∩ {xk : k  in }.

Nach Voraussetzung gibt es ein x ∈ ∩i∈I Ai .


Jetzt sei J = {( j, U) : j ∈ I, U ∈ U(x), x j ∈ U} versehen mit der offensichtlich
reflexiven und transitiven Relation

( j, U)  (k, V) :⇔ j  k ∧ U ⊆ V.

Für ( j1 , U1 ), ( j2 , U2 ) ∈ J sei k ∈ I mit k  j1 , j2 . Wegen x ∈ {x j : j  k} gibt es


ein x j ∈ U1 ∩ U2 mit j  k, und somit ( j, U1 ∩ U2 )  ( j1 , U1 ), ( j2 , U2 ). Also ist
J gerichtet.
Mit xi( j,U) := x j erhalten wir offensichtlich ein Teilnetz (xi( j,U) )( j,U)∈J von (xi )i∈I .
Zu V ∈ U(x) gibt es ein k ∈ I mit xk ∈ V. Für ( j, U)  (k, V) folgt dann
xi( j,U) = x j ∈ U ⊆ V, und somit konvergiert dieses Teilnetz gegen x.

(K4 ) ⇒ (K3 ): Hat (Ai )i∈I die endliche Durchschnitteseigenschaft, so sei T die Menge
aller endlichen Teilmengen von I gerichtet durch die Relation M1  M2 :⇔
M1 ⊆ M2 .
Für M ∈ T sei x M irgend ein Punkt aus ∩i∈M Ai . Man beachte, dass nach Voraus-
setzung dieser Schnitt nicht leer ist. Das Netz (x M ) M∈T hat wegen (K4) ein gegen
ein x ∈ X konvergentes Teilnetz (x M( j) ) j∈J .
Ist k ∈ I, so gibt es ein j0 ∈ J mit M( j) ⊇ {k} für alle j  j0 , und somit x M( j) ∈
∩i∈M( j) Ai ⊆ Ak . Also liegt das ebenfalls gegen x konvergente Netz (x M( j) ) j∈J j0 in
der abgeschlossenen Menge Ak . Mit Proposition 12.2.7 folgt daraus x ∈ Ak , und,
da k ∈ I beliebig war, auch dass der Schnitt aller Ak ’s x enthält und damit nicht
leer ist.


162 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.7.3 Bemerkung. Wegen Lemma 12.2.13 ist die Bedingung (K4) zu der Tatsache äquivalent, dass jedes Netz einen
Häufungspunkt in K hat.
Wenden wir nun Lemma 12.2.14 an, und beachten, dass Häufungspunkte von Teilnetzen von (xi )i∈I auch Häufungs-
punkte von (xi )i∈I sind (vgl. Lemma 12.2.13), so erhalten wir aus Bemerkung 12.7.3

12.7.4 Satz. Ein Netz (xi )i∈I in einer kompakten Menge K ⊆ X konvergiert genau dann gegen ein x ∈ X, wenn x der einzige
Häufungspunkt von (xi )i∈I ist.

12.7.5 Definition. Eine Teilmenge A eines topologischer Raum (X, T ) heißt abzählbar kompakt, wenn jede unendliche
Teilmenge von A einen Häufungspunkt in A hat.
Eine Teilmenge A eines topologischer Raum (X, T ) heißt folgenkompakt, wenn jede Folge in A eine gegen ein x ∈ A
konvergente Teilfolge hat.

12.7.6 Bemerkung. Ist M ⊆ A unendlich, so gibt es sicher eine injektive Funktion x : N → M. Das ist aber nichts anderes
als eine Folge, daher x(n) = xn .
Ist A folgendkompakt, so folgt x = limk→∞ xn(k) für eine Teilfolge (xn(k) )k∈N und ein x ∈ A. Für jede Umgebung U von
x gibt es somit einen Index k0 ∈ N, sodass xn(k) ∈ U für alle k ≥ k0 . Da die Folgenglieder alle verschieden sind, enthält U
sicherlich einen Punkt y := xn(k) ∈ M, der ungleich x ist. Also hat M einen Häufungspunkt in A (vgl. Definition 12.2.8).
Somit folgt aus folgendkompakt abzählbar kompakt. Die Umkehrung gilt im Allgemeinen nicht.
Ist A kompakt, so folgt wegen Proposition 12.7.2 x = limi∈I xn(i) für ein Teilnetz (xn(i) )i∈I und ein x ∈ A. Für jede
Umgebung U von x gibt es somit einen Index i0 ∈ I, sodass xn(i) ∈ U für alle i  i0 .
Da die Folgenglieder alle verschieden sind, gibt es höchstens ein n0 ∈ N, sodass xn0 = x. Die Teilnetzeigenschaft
bedingt die Existenz eines i1 ∈ I, sodass i  i1 ⇒ n(i) ≥ n0 + 1 ∧ xn(i) ∈ U. Für solche i liegt der Punkt y := xn(i) ∈ M in U
und ist ungleich x. Also hat M einen Häufungspunkt in A (vgl. Definition 12.2.8). Somit folgt auch aus kompakt abzählbar
kompakt. Die Umkehrung gilt im Allgemeinen auch hier nicht.
Überraschenderweise gilt im Allgemeinen weder, dass kompakt folgendkompakt impliziert, noch, dass folgendkom-
pakt kompakt impliziert. In metrischen Räumen sind alle drei Begriffe äquivalent, siehe Satz 12.8.3.

12.7.7 Lemma. Sei (X, T ) ein topologischer Raum, A ⊆ X, sowie A1 , . . . , Am ⊆ X. Es


gilt:
(i) Sei A kompakt, B ⊆ A abgeschlossen in (A, T |A ). Dann ist B ⊆ X kompakt.
(ii) Sind A1 , . . . , Am kompakt, so auch A1 ∪ . . . ∪ Am .
Sei zusätzlich vorausgesetzt, dass (X, T ) Hausdorff ist. Dann gilt:
(iii) Ist A kompakt, so ist A abgeschlossen.
(iv) A ist relativ kompakt genau dann, wenn es eine kompakte Menge B ⊆ X gibt mit
A ⊆ B.
Beweis.
(i) Die Menge A \ B ist offen in (A, T |A ). Also existiert O ∈ T mit O ∩ A = A \ B. Sei
U eine Überdeckung von B aus in X offenen Mengen, dann überdeckt U ∪ {O}
ganz A. Daher gibt es U1 , . . . , Un ∈ U mit U1 ∪ . . . ∪ Un ∪ O ⊇ A. Es folgt

U1 ∪ · · · ∪ Un = U1 ∪ . . . ∪ Un ∪ (O ∩ B) ⊇
| {z }
=∅

⊇ (U1 ∩ B) ∪ . . . ∪ (Un ∩ B) ∪ (O ∩ B) = (U1 ∪ . . . ∪ Un ∪ O) ∩ B ⊇ B .

(ii) Sei U eine Überdeckung von A1 ∪ . . . ∪ Am aus in X offenen Mengen. Dann


überdeckt U jedes Ai , also existieren Uki , k = 1, . . . , ni , i = 1, . . . , m, mit

U1i ∪ . . . ∪ Uni i ⊇ Ai ,

und es folgt [
Uki ⊇ A1 ∪ . . . ∪ Am .
k,i
12.7. KOMPAKTHEIT 163

(iii) Sei A kompakt, und sei x < A. Da (X, T ) Hausdorff ist, gibt es zu jedem Punkt
y ∈ A offene Umgebungen Uy ∈ U(y), Vy ∈ U(x), mit Uy ∩ Vy = ∅. Klarerweise
ist {Uy : y ∈ A} eine offene Überdeckung von A. Daher gibt es y1 , . . . , yn ∈ A,
sodass bereits Uy1 ∪ . . . ∪ Uyn ⊇ A gilt. Die Menge Vy1 ∩ . . . ∩ Vyn ist als endlicher
Durchschnitt von Umgebungen von x ebenfalls eine Umgebung von x, und es gilt
   
Uy1 ∪ . . . ∪ Uyn ∩ Vy1 ∩ . . . ∩ Vyn = ∅.

Also ist x ein innerer Punkt von Ac . Nach Lemma 12.1.11 ist Ac offen und daher
A abgeschlossen.
(iv) Ist A relativ kompakt, so ist A kompakt und klarerweise gilt A ⊆ A. Sei umgekehrt
A ⊆ B mit B kompakt. Dann ist wegen (iii) die Menge B auch abgeschlossen, also
folgt A ⊆ B und (i) zeigt, dass A kompakt ist.


12.7.8 Lemma. Sei f : (X, T ) → (Y, O) stetig. Ist A ⊆ X kompakt, so ist auch f (A) ⊆ Y
kompakt.
Beweis. Ist U ⊆ O eine Überdeckung von f (A), so ist f −1 (U) eine Überdeckung von A,
die wegen der Stetigkeit von f aus offenen Mengen besteht. Es gibt also U1 , . . . , Un ∈
U, sodass
f −1 (U1 ) ∪ . . . ∪ f −1 (Un ) ⊇ A .
Wendet man darauf f an, so folgt U1 ∪ . . . ∪ Un ⊇ f (A).

Nimmt man die Charakterisierung (K4) aus Proposition 12.7.2 her, so kann man Lemma 12.7.8 auch ganz ähnlich
wie in Proposition 6.1.11 beweisen. Ist nämlich (yi )i∈I ein Netz in f (A), und wählt man zu jedem i ∈ I ein xi ∈ A, sodass
f (xi ) = yi , so hat nach (K4) das Netz (xi )i∈I ein gegen ein x ∈ A konvergentes Teilnetz (xi( j) ) j∈J . Aus Lemma 12.3.3

schließen wir, dass (yi( j) ) j∈J = f (xi( j) ) j∈J gegen f (x) =: y konvergiert. Also hat jedes Netz aus f (A) ein gegen ein y ∈ f (A)
konvergentes Teilnetz. Nach (K4) aus Proposition 12.7.2 ist f (A) somit kompakt.

12.7.9 Korollar. Es gilt:


(i) Sei (X, T ) kompakt und (Y, O) Hausdorff. Weiters sei f : (X, T ) → (Y, O) bijektiv
und stetig. Dann ist f ein Homöomorphismus.
(ii) Sei X eine Menge und T , O Topologien auf X, sodass T kompakt und O Hausdorff
ist, und sodass O ⊆ T . Dann gilt sogar O = T .
Beweis.
(i) Wir müssen nachweisen, dass f −1 stetig ist. Dazu zeigen wir, dass das Urbild
unter f −1 einer in (X, T ) abgeschlossenen Menge in (Y, O) abgeschlossen ist, siehe
Satz 12.3.5. Sei A ⊆ X abgeschlossen, dann ist A kompakt, und daher ist nach
Lemma 12.7.8 auch
( f −1 )−1 (A) = f (A) ⊆ Y
kompakt. Nach Lemma 12.7.7, (iii), ist ( f −1 )−1 (A) auch abgeschlossen.
(ii) Wegen O ⊆ T ist idX : (X, T ) → (X, O) stetig, und (i) zeigt, dass idX sogar ein
Homöomorphismus ist, d.h. T = O.
164 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.7.10 Lemma. Sei (X, T ) ein topologischer Raum.

(i) Ist X Hausdorffsch, und ist A ⊆ X kompakt und x ∈ X \ A, so lassen sich x und A
trennen, d.h. es gibt disjunkte offene Mengen O x ∋ x und OA ⊇ A.

(ii) Erfüllt X das Axiom (T 3), und sind A ⊆ X kompakt, B ⊆ X abgeschlossen und
A ∩ B = ∅, so lassen sich A und B trennen.

(iii) Ist (X, T ) kompakt und Hausdorffsch, so ist (X, T ) sogar normal.

Beweis.

(i) Zu jedem y ∈ A gibt es zwei disjunkte offene Mengen Qy ∋ y und Py ∋ x. Kla-


rerweise ist dann {Qy : y ∈ A} eine Überdeckung von A. Wegen der Kompaktheit
gibt es y1 , . . . , yn ∈ A, sodass A ⊆ Qy1 ∪ · · · ∪ Qyn := OA . Außerdem ist mit
O x := Py1 ∩ · · · ∩ Pyn

O x ∩ OA = O x ∩ (Qy1 ∪ · · · ∪ Qyn ) ⊆ (Py1 ∩ Qy1 ) ∪ · · · ∪ (Pyn ∩ Qyn ) = ∅.

(ii) Zu jedem y ∈ A gibt es wegen (T 3) zwei disjunkte offene Mengen Qy ∋ y und


Py ⊇ B. Dann ist {Qy : y ∈ A} eine Überdeckung von A. Wegen der Kompaktheit
gibt es y1 , . . . , yn ∈ A, sodass A ⊆ Qy1 ∪ · · · ∪ Qyn := OA . Außerdem gilt für
OB := Py1 ∩ · · · ∩ Pyn

OB ∩ (Qy1 ∪ · · · ∪ Qyn ) ⊆ (Py1 ∩ Qy1 ) ∪ · · · ∪ (Pyn ∩ Qyn ) = ∅.

Also lassen sich A und B trennen.

(iii) Da jede abgeschlossene Teilmenge von X nach Lemma 12.7.7 kompakt ist, folgt
aus (i), dass X regulär ist, dh. es gilt (T 2) und (T 3). Nach (ii) ist X dann sogar
normal.

Der Satz von Tychonoff


Q
12.7.11 Satz (Tychonoff).
Q Q Sei (Xi , Ti ), i ∈ I, eine Familie topologischer Räume, und sei i∈I Ti die Produkttopologie auf
Q
X
i∈I i . Dann ist ( X
i∈I i , T
i∈I i ) genau dann kompakt, wenn alle Räume (X i , Ti ), i ∈ I, kompakt sind.

Dieser Satz ist einer der ganz wichtigen Sätze in der Topologie. Wir wollen bemerken, dass die interessante Implikation
jene ist, die von der Kompaktheit der einzelnen Räume auf die des Produktes schließt. Die Umkehrung ist ganz elementar.
Es gibt verschiedene Zugänge, um diesen Satz zu beweisen, wir wählen hier jenen über den Filterbegriff, vgl. Definition
12.1.6.
Sei X eine Menge. Betrachte die Menge aller Filter auf X. Dies ist eine gewisse Teilmenge von P(P(X)), und da die
Potenzmenge jeder Menge mit der mengentheoretischen Inklusion geordnet ist, ist auch die Menge aller Filter auf X in
dieser Weise eine geordnete Menge. Ist F1 ⊆ F2 , so sagt man, dass F2 feiner als F1 ist oder, dass F1 gröber als F2 ist.

12.7.12 Definition. Sei X eine Menge. Ein Filter F auf X heißt Ultrafilter, wenn er ein maximales Element in der Menge
aller Filter auf X, geordnet mit der mengentheoretischen Inklusion, ist.

12.7.13 Proposition. Sei X eine Menge, und F ein Filter auf X. Dann existiert ein Ultrafilter F1 mit F1 ⊇ F.
12.7. KOMPAKTHEIT 165

Beweis. Wir wollen das Lemma von Zorn anwenden, und zwar auf die Menge aller Filter auf X, die feiner als F sind. Diese
Menge ist nichtleer und als Teilmenge der Menge aller Filter bezüglich der mengentheoretischenS Inklusion geordnet.
Sei (Fi )i∈I , I , ∅ eine totalgeordnete Menge von Filtern Fi mit Fi ⊇ F. Definiere F̃ := i∈I Fi . Dann gilt F̃ ⊇ F, denn
I , ∅ und alle Fi enthalten F. Insbesondere ist F̃ nichtleer. Seien F1 , F2 ∈ F̃. Dann existiert i1 , i2 ∈ I mit F1 ∈ Fi1 und
F2 ∈ Fi2 . Nun gilt entweder Fi1 ⊆ Fi2 oder Fi2 ⊆ Fi1 . Im ersten Fall sind F1 , F2 beide Elemente des Filters Fi2 , und daher
ist auch F1 ∩ F2 ∈ Fi2 ⊆ F̃. Im zweiten Fall erhält man genauso F1 ∩ F2 ∈ Fi1 ⊆ F̃. Schließlich sei F1 ∈ F̃, und F2 ⊇ F1
gegeben. Sei i ∈ I, sodass F1 ∈ Fi , dann ist auch F2 ∈ Fi ⊆ F̃. Also ist F̃ ein Filter.
Nach dem Lemma von Zorn existiert in der Menge aller Filter auf X, die feiner als F sind, ein maximales Element. Es
verbleibt zu bemerken, dass ein maximales Element in der Menge aller Filter auf X, die feiner als F sind, auch maximal in
der Menge aller Filter ist.

12.7.14 Lemma. Seien X und Y nichtleere Mengen und f : X → Y eine Abbildung.
Ist F ein Filter auf X, so ist
f (F) := {B ⊆ Y : f −1 (B) ∈ F}

ein Filter auf Y. f (F) hat { f (F) : F ∈ F} als Filterbasis. Ist B eine beliebige Filterbasis von F, so ist { f (F) : F ∈ B} ein
Filterbasis von f (F).
Ist F ein Ultrafilter, so auch f (F).

Beweis. Es gilt Y, ∅ ∈ f (F), da f −1 (Y) = X, f −1 (∅) = ∅ ∈ F. Sind B1 , B2 ∈ f (F), daher f −1 (B1 ), f −1 (B2 ) ∈ F, so
folgt f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ) ∈ F und somit B1 ∩ B2 ∈ f (F). Ist schließlich B2 ⊇ B1 ∈ f (F), so folgt
f −1 (B2 ) ⊇ f −1 (B1 ) ∈ F und somit f −1 (B2 ) ∈ F, bzw. B2 ∈ f (F). Also ist f (F) ein Filter.
Ist F ∈ F, so folgt wegen f −1 ( f (F)) ⊇ F, dass f (F) ∈ f (F). Ist B ∈ f (F), also f −1 (B) ∈ F, so folgt f ( f −1 (B)) ⊆ B.
Gemäß Definition 12.1.7 ist { f (F) : F ∈ F} eine Filterbasis von f (F).
Ist B eine Filterbasis von F, und F ∈ f (F), so folgt wie eben f −1 (F) ∈ F und somit B ⊆ f −1 (F) für ein B ∈ B. Wir
erhalten f (B) ⊆ f ( f −1 (F)) ⊆ F. Wieder nach Definition 12.1.7 ist { f (B) : B ∈ B} eine Filterbasis von f (F).
Ist F ein Ultrafilter und ist f (F) ⊆ G für einen Filter G, so folgt f (F) ∩ G , ∅ und damit auch F ∩ f −1 (G) , ∅ für alle
F ∈ F, G ∈ G. Also ist die Menge {F ∩ f −1 (G) : F ∈ F, G ∈ G} die Filterbasis eines Filters, der offenbar F und f −1 (G)
umfasst. Wegen der Maximalität muss dieser mit F übereinstimmen, und daher f −1 (G) ⊆ F bzw. G ⊆ f (F).

Sei nun X versehen mit einer Topologie.

12.7.15 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Ein Filter F auf X heißt konvergent gegen x, wenn F
feiner ist als der Umgebungsfilter U(x) von x. Wir schreiben F → x dafür.

Die Tatsache F ⊇ U(x) ist wegen der Filtereigenschaft (F3) äquivalent zu

∀U ∈ U(x)∃F ∈ F : F ⊆ U. (12.17)

12.7.16 Bemerkung. Sind X und Y zusätzlich mit Topologien versehen, so bedeutet die Tatsache, dass f bei x stetig ist (vgl.
Definition 12.3.1) gerade, dass jede Menge aus dem Filter U( f (x)) eine Menge aus f (U(x)) enthält, bzw. dass U( f (x)) ⊆
f (U(x)), oder dass f (U(x)) → f (x).
Ist nun F → x, so folgt F ⊇ U(x) und weiter f (F) ⊇ f (U(x)) ⊇ U( f (x)), also f (F) → f (x).
Gelte umgekehrt diese Eigenschaft. Wegen U(x) → x folgt f (U(x)) → x und damit die Stetigkeit von f bei x.
12.7.17 Bemerkung. Die Charakterisierung der Stetigkeit in Bemerkung 12.7.16 ähnlt nicht zufällig der Charakterisierung
der Stetigkeit mit Netzen. In der Tat gibt es einen engen Zusammenhang von Netzen und Filtern:
Sei (I, ) eine gerichtete Menge, so ist
{{i : i  k} : k ∈ I}

wegen {i : i  j} ⊆ {i : i  k} ∩ {i : i  l} für ein j  k, l eine Filterbasis (vgl. Bemerkung 12.1.8).


Ist nun (xi )i∈I ein Netz in einem topologischen Raum (X, T ), so erzeugt nach Lemma 12.7.14

{{xi : i  k} : k ∈ I}

einen Filter F =: F (xi )i∈I auf X. Die Konvergenz von (xi )i∈I gegen ein x ∈ X bedeutet gerade

∀U ∈ U(x) : ∃k ∈ I : {xi : i  k} ⊆ U,

was aber genau F ⊇ U(x) bzw. F → x bedeutet.


Ist umgekehrt F ein Filter, so definiert

I = {(y, F) ∈ X × F : y ∈ F}

mit der Relation (y1 , F1 )  (y2 , F2 ) :⇔ F1 ⊇ F2 eine gerichtete Menge. Die Richtungseigenschaft folgt dabei aus der
Filtereigenschaft (F2). Weiters sei (xi )i∈I definiert durch xi = y, wenn i = (y, F).
Die Tatsache, dass F → x, daher (12.17), bedeutet aber nun gerade, dass (xi )i∈I → x.
Schließlich ist der von diesem Netz erzeugte Filter gerade F, daher F (xi )i∈I = F.
In unserem Zusammenhang ist es entscheidend, dass sich Kompaktheit mit Hilfe des Begriffes der Filterkonvergenz
charakterisieren lässt.
166 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.7.18 Proposition. Für einen topologischer Raum (X, T ) sind äquivalent:

(i) (X, T ) ist kompakt.

(ii) Zu jedem Filter auf X gibt es einen in X konvergenten feineren Filter.

(iii) Jeder Ultrafilter auf X konvergiert.

Beweis. Gelte (i), und sei F ein Filter auf X. Wegen der Filtereigenschaft hat das Mengensystem {F : F ∈ F} die endliche
T
Durchschnittseigenschaft. Gemäß Proposition 12.7.2 folgt F∈F F , ∅ und für ein x aus dieser Menge, dass U ∩ F , ∅ für
alle U ∈ U(x) und F ∈ F. Somit ist {U ∩ F : U ∈ U(x), F ∈ F} eine Filterbasis eines Filters G, der sicher G ⊇ F und
G ⊇ U(x) erfüllt; also G → x.
Gilt (ii), und ist F ein Ultrafilter auf X, so stimmt jede konvergente Verfeinerung von F mit F überein; also gilt (iii).
Gelte nun (iii), und sei M ein Mengensystem bestehend aus abgeschlossenen Mengen mit der endlichen Durch-
schnittseigenschaft. Insbesondere ist damit {M1 ∩ · · · ∩ Mn : n ∈ N; M1 , . . . , Mn ∈ M} die Filterbasis eines Filters G auf
X. Ist nun F ⊇ G ⊇ M gemäß Proposition 12.7.13 ein Ultrafilter, und ist x eine Grenzwert davon, dh. F ⊇ U(x), so folgt
T T
insbesondere U ∩ M , ∅ für alle U ∈ U(x) (⊆ F) und alle M ∈ M (⊆ F), bzw. x ∈ M∈M M = M∈M M.

Wir haben jetzt alle Hilfsmittel für den Beweis des Satzes von Tychonoff zusammengetragen.
Beweis. (Satz 12.7.11) Wir setzten Y Y
X := Xi und T := Ti ,
i∈I i∈I

und bezeichnen mit πi : X → Xi die Projektion auf die i-te Komponente. Da T die Produkttopologie ist, ist πi : (X, T ) →
(Xi , Ti ) stets stetig.
Setzt man voraus, dass (X, T ) kompakt ist, so ist jeder Raum (Xi , Ti ) als stetiges Bild eines kompakten Raumes eben-
falls kompakt, vgl. Lemma 12.7.8.
Für die Umkehrung sei nun vorausgesetzt, dass (Xi , Ti ) für jedes i ∈ I kompakt ist. Sei F ein Ultrafilter auf X. Für
jedes i ∈ I folgt aus Lemma 12.7.14, dass πi (F) ein Ultrafilter auf Xi ist. Nach Proposition 12.7.18 konvergiert πi (F) gegen
einen Punkt xi ∈ Xi . Setze x := (xi )i∈I (∈ X), Q
so wollen wir zeigen, dass F gegen x konvergiert.
Betrachte eine Menge der Gestalt U = i∈I Ui wobei Ui ∈ U(xi ), i ∈ I, und Ui = Xi für alle bis auf endlich viele i ∈ I.
Da πi (F) gegen xi konvergiert, gilt Ui ∈ πi (F) für alle i ∈ I, und daher π−1 i (Ui ) ∈ F. Sind i1 , . . . , in ∈ I jene Indizes mit
T
Ui , Xi , dann folgt U = nk=1 π−1i (Uik ) ∈ F.
Da die Mengen U von dieser Gestalt eine Umgebungsbasis von x bezüglich der Produkttopologie bilden, folgt
U(x) ⊆ F.

12.8 Kompaktheit in metrischen Räumen


In diesem Abschnitt wollen wir uns speziell kompakte metrische Räume anschauen.
Im ersten Semester haben wir die Kompaktheit einer Teilmenge K eines metrischen
Raumes (X, d) so definiert, dass jede Folge eine gegen einen Punkt aus K konvergente
Teilfolge hat.
Wir werden hier unter anderem sehen, dass die Definition aus dem ersten Semester
mit der aus Definition 12.7.1 übereinstimmt. Außerdem werden wir die Kompaktheit
auch mit Hilfe des folgenden Begriffes charakterisieren.
12.8.1 Definition. Sei (X, d) ein metrischer Raum und sei M ⊆ X. Die Menge M heißt
total beschränkt, wenn es zu jedem ǫ > 0 endlich viele Teilmengen M1 , . . . , Mn ⊆ M
vom Durchmesser d(M j ) := sup x,y∈M j d(x, y) kleiner als ǫ gibt, sodass M = M1 ∪ · · · ∪
Mn .
12.8.2 Fakta.
1. Man sieht sofort, dass Teilmengen von total beschränkten Mengen wieder total
beschränkt sind.
2. Da einerseits Kugeln mit Radius ǫ einen Durchmesser kleiner oder gleich 2ǫ
haben und da andererseits jede Teilmenge M j ⊆ M mit d(M j ) < ǫ für ein be-
liebiges η j ∈ M j in Uǫ (η j ) enthalten ist, lässt sich totale Beschränktheit auch
folgendermaßen charakterisieren:
Zu jedem ǫ > 0 gibt es y1 , . . . , yn ∈ M, sodass M ⊆ Uǫ (y1 ) ∪ · · · ∪ Uǫ (yn ).
12.8. KOMPAKTHEIT IN METRISCHEN RÄUMEN 167

3. Ist M j ⊆ X und sind x, y ∈ M j , so gibt es wegen Lemma 5.1.13 gegen x


bzw. y konvergente Folgen (xn )n∈N und (yn )n∈N aus M j . Somit folgt d(x, y) =
limn→∞ d(xn , yn ) ≤ d(M j ), und daher d(M j ) = d(M j ).
Ist M total beschränkt und ǫ > 0, so gilt M = M1 ∪ · · · ∪ Mn mit d(M j ) < ǫ, j =
1, . . . , n. Es folgt nunmehr M = M1 ∪ · · · ∪ Mn mit d(M j ) < ǫ, j = 1, . . . , n,
womit auch M total beschränkt ist.
Ist M schon selbst abgeschlossen, so erkennt man daraus, dass man die Mengen
M j auch abgeschlossen wählen kann.

12.8.3 Satz. Sei K eine Teilmenge eines metrischen Raumes (X, d). Dann sind äquiva-
lent:

(i) K ist kompakt im Sinne von Definition 12.7.1.

(ii) Jede unendliche Teilmenge von K hat einen Häufungspunkt in K.

(iii) Jede Folge in K hat eine gegen einen Punkt in K konvergente Teilfolge.

(iv) K ist total beschränkt und (K, d|K×K ) ist ein vollständiger metrischer Raum.

Beweis.

(i) ⇒ (ii): Sei M ⊆ K unendlich. Hätte M keinen Häufungspunkt in K, so gibt es zu


jedem y ∈ K ein ǫ(y) > 0, sodass (vgl. Definition 5.1.7)

M ∩ Uǫ(y) (y) ⊆ {y}.

Da y ∈ K beliebig war, ist {Uǫ(y) (y) : y ∈ K} eine offene Überdeckung von


K, die voraussetzungsgemäß eine endliche Teilüberdeckung hat. Also gibt es
y1 , . . . , yk ∈ K, sodass K ⊆ Uǫ(y1 ) (y1 ) ∪ · · · ∪ Uǫ(yk ) (yk ). Somit erhalten wir

M = M ∩ K ⊆ M ∩ (Uǫ(y1 ) (y1 ) ∪ · · · ∪ Uǫ(yk ) (yk )) ⊆ {y1 , . . . , yn },

womit M aber endlich wäre.

(ii) ⇒ (iii): Habe jede unendliche Teilmenge von K einen Häufungspunkt in K, und
sei (xn )n∈N eine Folge aus K. Ist {xn : n ∈ N} endlich, so gilt sicherlich xn = x
für ein x ∈ K und für unendlich viele n ∈ N. Somit hat (xn )n∈N eine Teilfolge, die
konstant gleich x ist. Also ist x ein Häufungspunkt unserer Folge.
Anderenfalls ist {xn : n ∈ N} ⊆ K unendlich, und laut Voraussetzung hat sie
einen Häufungspunkt x in K. Da jede ǫ-Kugel um x unendlich viele Punkte aus
{xn : n ∈ N} enthält (vgl. Bemerkung 5.1.8), muss für N ∈ N jede ǫ-Kugel auch
unendlich viele Punkte aus {xn : n ∈ N, n ≥ N} enthalten. Insbesondere gilt
x ∈ {xn : n ∈ N, n ≥ N}. Nach Lemma 5.2.2 ist x Häufungspunkt von (xn )n∈N .

(iii) ⇒ (iv): Angenommen M wäre nicht total beschränkt. Dann gibt es ein ǫ > 0, so-
dass, wenn immer M1 , . . . , Mn endlich viele Teilmengen von K sind mit Durch-
messer < ǫ, niemals M1 ∪ · · · ∪ Mn = K ist. Aus dieser Tatsache werden wir nun
auf die Existenz einer Folge ohne Häufungspunkt schließen.
Sei x1 ∈ K beliebig. Angenommen wir haben x1 , . . . , xk ∈ K definiert, dann
hat für j ∈ {1, . . . , k} nach der Dreiecksungleichung die Kugel U 3ǫ (x j ) einen
168 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

Durchmesser ≤ 2ǫ3 . Wegen unserer Wahl von ǫ ist (U 3ǫ (x1 ) ∪ · · · ∪ U 3ǫ (xk )) ∩ K


eine echte Teilmenge von K. Wir wählen

xk+1 ∈ K \ (U 3ǫ (x1 ) ∪ · · · ∪ U 3ǫ (xk )).

Diese induktiv definierte Folge (xk )k∈N hat offensichtlich die Eigenschaft, dass
für k ∈ N der Punkt xk nicht in U 3ǫ (x1 )∪· · ·∪U 3ǫ (xk−1 ) liegt, und somit d(xk , xl ) ≥
ǫ
3 für l < k.
Damit kann keine Teilfolge von (xk )k∈N eine Cauchyfolge sein und schon gar
nicht konvergieren. Das widerspricht aber der Voraussetzung (iii).

Es bleibt die Vollständigkeit von (K, d|K×K ) zu zeigen. Dazu sei (xk )k∈N eine
Cauchyfolge in K. Diese hat voraussetzungsgemäß eine konvergente Teilfolge.
Gemäß Lemma 3.4.9 ist (xk )k∈N konvergent.
(iv) ⇒ (i): Zunächst folgt wegen Lemma 9.1.10 aus der Vollständigkeit, dass K abge-
schlossen ist. Sei nun U eine offene Überdeckung von K, und sei angenommen,
dass U keine endliche Teilüberdeckung enthält.
Die Menge K ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 1. Mindestens eine von diesen Mengen
kann nicht durch endlich viele Mengen aus U überdeckt werden. Diese sei K1 .
Die Menge K1 ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 12 enthalten ist. Mindestens eine von diesen
kann nicht durch endlich viele Mengen aus U überdeckt werden. Diese sei K2 .
Verfährt man induktiv weiter, so erhält man eine Folge

K ⊇ K1 ⊇ K2 ⊇ K3 ⊇ . . .
1
von abgeschlossenen Mengen, sodass Kn einen Durchmesser kleiner als n hat,
und kein Kn durch endlich viele Mengen aus U überdeckt werden kann.
Wähle xn ∈ Kn . Dann ist (xn )n∈N eine Cauchy-Folge. Sei x ∈ K, sodass xn → x.
Also existiert V ∈ U mit x ∈ V. Da V offen ist, gibt es eine Kugel Uǫ (x) ⊆ V.
Sei n ∈ N, sodass 1n < 2ǫ und d(xn , x) < 2ǫ . Da der Durchmesser von Kn kleiner
als n1 ist, folgt für y ∈ Kn :

d(x, y) ≤ d(x, xn ) + d(xn , y) < ǫ.

Also ist Kn ⊆ V, im Widerspruch zur Tatsache, dass Kn nicht durch endlich viele
Mengen aus U überdeckt werden kann.


12.8.4 Bemerkung. Eine Situation, wo obiger Satz Anwendung findet, ist die, dass
(X, d) ein vollständig metrischer Raum ist, und dass G eine total beschränkte Teilmenge
von X ist. Der Abschluss K von G ist dann auch total beschränkt und vollständig, also
kompakt.

12.8.5 Bemerkung. Satz 12.8.3 besagt insbesondere, dass in metrischen Räumen die Begriffe kompakt, abzählbar kompakt
und folgenkompakt zusammenfallen, vgl. Definition 12.7.5.
12.8. KOMPAKTHEIT IN METRISCHEN RÄUMEN 169

12.8.6 Korollar. Sei (X, d) ein metrischer Raum. Ist K ⊆ X kompakt, dann ist K separabel, hat also eine dichte abzählbare
Teilmenge.

Beweis. Nach Satz 12.8.3 gibt es zu n ∈ N endlich viele Punkte xn1 , . . . , xnm(n) ∈ K, sodass

U 1 (xn1 ) ∪ · · · ∪ U 1 (xnm(n) ) ⊇ K. (12.18)


n n
S n n
Setzen wir D := n∈N {x1 , . . . , xm(n) }, so ist D sicher eine abzählbare Teilmenge von K. Ist y ∈ K und ǫ > 0, so sei n ∈ N so
1 1
groß, dass ǫ ≤ n. Wegen (12.18) gibt es ein j ∈ {1, . . . , m(n)} mit d(y, xnj ) < n ≤ ǫ und daher xnj ∈ Uǫ (y). Also ist y ∈ D.

12.8.7 Proposition. Ein metrischer Raum (X, d) ist genau dann separabel, wenn er das zweite Abzählbarkeitsaxiom erfüllt,
also eine abzählbare Basis hat.

Beweis. Ist B eine abzählbare Basis von T (d), so sei xB irgendein Punkt aus B für jede nichtleere Teilmenge B ∈ B.
Klarerweise ist D := {xB : ∅ , B ∈ B} abzählbar. Ist y ∈ X und O ∋ y offen, so gilt sicher y ∈ B ⊆ O für ein B ∈ B. Somit
gilt O ∩ D ∋ xB und daher y ∈ D. Also ist X separabel.
Ist umgekehrt (X, d) separabel mit einer abzählbaren und dichten Teilmenge D ⊆ X, so besteht B := {U 1 (x) : n ∈
n
N, x ∈ D} sicherlich aus abzählbar vielen Mengen. Ist nun O ⊆ X offen, so sei für jedes y ∈ O die Zahl n(y) ∈ N so groß,
dass U 2 (y) ⊆ O. Wir zeigen nun, dass
n(y) [
O= U 1 (x), (12.19)
n
x∈D∪O
n∈N:U 1 (x)⊆O
n

und somit dass B eine Basis von T (d) ist. Klarerweise ist die rechte Seite in O enthalten. Ist y ∈ O, so gibt es wegen der
Dichtheit ein x ∈ D ∩ U 1 (y) ⊆ D ∩ O. Somit folgt y ∈ U 1 (x) und für jedes t ∈ U 1 (x)
n(y) n(y) n(y)

1 1 2
d(t, y) ≤ d(t, x) + d(x, y) < + = ,
n(y) n(y) n(y)

also t ∈ U 2 (y) und somit U 1 (x) ⊆ U 2 (y) ⊆ O. Also liegt jedes y ∈ O in der Vereinigung auf der rechten Seite von
n(y) n(y) n(y)
(12.19).

12.8.8 Bemerkung. Da wir im ersten Beweisteil nicht verwendet haben, dass T (d) eine metrische Topologie ist, gilt allge-
mein in topologischen Räumen, dass aus (ABII) die Separabilität folgt.

Ein wichtiges Beispiel von kompakten Teilmengen eines vollständigen metrischen


Raumes liefert uns der Satz von Ascoli. Dabei betrachtet man den Raum C(X, R) bzw.
C(X, C) aller beschränkten, stetigen und reell- bzw. komplexwertigen Funktionen auf
einem topologischen Raum (X, T ). Wir haben solche Räume schon kennengelernt, aber
nur im Fall von metrischen Räume X.
Wir wollen zunächst bemerken, dass wenn X kompakt ist, jede stetige Funktion f
automatisch beschränkt ist, denn nach Lemma 12.7.8 ist dann f (X) kompakt und nach
Proposition 5.2.11 ist f (X) beschränkt.
12.8.9 Lemma. Die Räume C(X, R) und C(X, C) sind abgeschlossene Teilräume der
Banachräume B(X, R) und B(X, C) versehen mit k.k∞ und daher selbst Banachräume.
Beweis. Wir wissen aus Beispiel 9.1.12, dass B(X, R) und B(X, C) Banachräume sind.
Laut Definition sind C(X, R) und C(X, C) Teilmengen von B(X, R) bzw. B(X, C).
Wegen Korollar 12.5.12 sind sie sogar lineare Teilräume.
Sei nun fn ∈ C(X, R) (C(X, C)) mit fn → f in B(X, R) (B(X, C)) bezüglich k.k∞ ,
also gleichmäßig. Ist x ∈ X und (x j ) j∈J ein gegen x konvergentes Netz, so wissen wir
aus Lemma 8.7.1, dass lim j∈J limn→∞ fn (x j ) = lim j∈J f (x j ) existiert und mit

lim lim fn (x j ) = lim fn (x) = f (x)


n→∞ j∈J n→∞

übereinstimmt. Da das Netz beliebig war, ist f stetig, dh. f ∈ C(X, R) (C(X, C)).

170 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.8.10 Satz (Ascoli). Sei (X, T ) ein kompakter topologischer Raum und sei Sei Φ
eine punktweise beschränkte und gleichgradig stetige Teilmenge von C(X, C), d.h. sei
Φ ⊆ C(X, C), und es gelte:
(i) Für jedes x ∈ X ist sup{| f (x)| : f ∈ Φ} beschränkt.
(ii) Für jedes x ∈ X und ǫ > 0 gibt es eine Umgebung V ∈ U(x) mit | f (y) − f (x)| < ǫ
für alle y ∈ V, f ∈ Φ.
Dann ist Φ total beschränkt. Ist umgekehrt Φ total beschränkt, so gelten (i) und (ii).
Eine entsprechende Aussage gilt für C(X, R).
Beweis. Sei ǫ > 0 gegeben. Zu jedem x ∈ X können wir eine Umgebung V x von x
wählen, sodass (ii) für V = V x erfüllt ist. Da jede Umgebung von x eine x enthaltende
offene Menge enthält, können wir die V x offen wählen. Offensichtlich ist V x , x ∈ X,
eine offene Überdeckung von X.
S
Da X kompakt ist, existieren x1 , . . . , xn ∈ X, sodass schon X = ni=1 V xi und
| f (x) − f (xi )| < ǫ, x ∈ V xi , f ∈ Φ, i = 1, . . . , n.
Wegen (i) ist sicher
M := sup{ f (xi ) : i = 1, . . . , n, f ∈ Φ} < ∞.
Sei D die Kreisscheibe D := {λ ∈ C : |λ| ≤ M}. Dann haben wir eine Abbildung
p : Φ → Dn , definiert als

p( f ) := f (x1 ), . . . , f (xn ) .
Nun ist Dn ⊆ Cn kompakt und daher total beschränkt (vgl. Satz 12.8.3). Mit Dn ist auch
die Teilmenge p(Φ) von Dn total beschränkt, vgl. Fakta 12.8.2. Also existieren endlich
viele f1 , . . . , fm ∈ Φ, sodass für jedes f ∈ Φ immer |p( f ) − p( fk )| < ǫ, bzw. äquivalent
dazu
| f (xi ) − fk (xi )| < ǫ, i = 1, . . . , n .
für mindestens ein k ∈ {1, . . . , m}.
Jedes x ∈ X liegt in einer Menge V xi , und für dieses i gilt
| f (x) − f (xi )| < ǫ, | fk (x) − fk (xi )| < ǫ .
Es folgt
| f (x) − fk (x)| ≤ | f (x) − f (xi )| + | f (xi ) − fk (xi )| + | fk (x) − fk (xi )| < 3ǫ
für alle x ∈ X. Die Kugeln mit Radius 3ǫ und Mittelpunkt fk überdecken also ganz Φ,
und somit ist Φ total beschränkt.
Zur Umkehrung: Total beschränkte Mengen sind sicherlich beschränkt in
(C(X, C), k.k∞), und somit auch punktweise beschränkt, dh. es gilt (i).
Wegen der totalen Beschränktheit gibt es zu ǫ > 0 endlich viele f1 , . . . , fm ∈ Φ,
sodass es zu jedem f ∈ Φ ein fk mit k f − fk k∞ < ǫ gibt.
Zu einem x ∈ X gibt es wegen der Stetigkeit der fk ’s für k = 1, . . . , m Umgebungen
Vk ∈ U(x) mit | fk (y) − fk (x)| < ǫ für alle y ∈ Vk . Setzen wir V = V1 ∩ · · · ∩ Vm , so ist
V ∈ U(x) und für f ∈ Φ folgt für das richtige fk und y ∈ V
| f (y) − f (x)| < | f (y) − fk (y)| + | fk (y) − fk (x)| + | f (x) − fk (x)| < 3ǫ,
und somit (ii).

12.9. ALEXANDROFF-KOMPAKTIFIZIERUNG LOKALKOMPAKTER RÄUME171

12.8.11 Korollar. Für Φ ⊆ C(X, C) ist Φ genau dann kompakt, wenn Φ punktweise
beschränkt und gleichgradig stetig ist. Insbesondere enthält in diesem Fall jede Folge
in Φ eine gleichmäßig konvergente Teilfolge.
Eine entsprechende Aussage gilt für C(X, R).

Eine wichtige Anwendung dieses Satzes gibt es in der Theorie der gewöhnlichen
Differentialgleichungen, wo dieser die Existenz von Lösungen von einer großen Klasse
von Differentialgleichungen liefert.

12.9 Alexandroff-Kompaktifizierung lokalkompakter


Räume
Ein einfaches Beispiel von lokalkompakten Räumen liefert der Satz von Bolzano-
Weierstraß. Dieser besagt ja, dass im Rn jede Menge der Form Kr (0) = {y ∈ Rn :
kyk ≤ r} und daher (vgl. Lemma 12.7.8) auch jede Menge der Form x + Kr (0) = Kr (x)
kompakt ist. Da diese Mengen einen Umgebungsbasis von x darstellen, ist der Rn lo-
kalkompakt.

12.9.1 Satz. Ein topologischer Hausdorff Raum (X, T ) ist genau dann lokal kompakt,
wenn er offene Teilmenge eines kompakten Hausdorff Raumes ist, d.h. wenn es einen
topologischen Hausdorff Raum (Y, O) gibt, der kompakt ist, sodass X eine offene Teil-
menge von Y ist, und sodass T = O|X .
Eine mögliche Wahl von Y ist die, dass man ein Y := X ∪ {∞} mit einem Element
∞ < X und
O = T ∪ {{∞} ∪ (X \ K) : X ⊇ K kompakt}
setzt.5 .

Beweis. Sei X ein offene Teilmenge des kompakten Raumes Y. Nach Lemma 12.7.10
ist Y insbesondere regulär. Also gibt es zu der Umgebung X von x eine Umgebung V
von x in Y, sodass V ⊆ X. Aus Lemma 12.7.7 folgt die Kompaktheit von V in Y. Wegen
Proposition 12.7.2, (K2), und O|V = (O|X )|V ist V auch kompakt in X, und daher ist X
lokalkompakt.
Nun sei umgekehrt (X, T ) lokalkompakt, und sei Y und O definiert, wie im Satz.
Da für eine kompakte Menge K ⊆ X immer X \ K in X offen ist, überprüft man leicht,
dass O eine Topologie auf Y ist, und dass X offen in Y ist.
Um zu zeigen, dass diese Hausdorffsch ist, seien x, y ∈ Y zunächst so, dass x, y ∈ X.
Dann gibt es disjunkte O x , Oy ∈ T ⊆ O mit x ∈ O x , y ∈ Oy , da ja (X, T ) vorausset-
zungsgemäß Hausdorffsch ist. Ist x ∈ X und y = ∞, so gibt es wegen der Lokal-
kompaktheit eine kompakte Umgebung V von x in X. Ist O x eine x enthaltende offene
Teilmenge von V, und ist Oy := {∞} ∪ (X \ V), so gilt Oy ∈ O und O x ∩ Oy = ∅.
Wir müssen noch zeigen, dass Y kompakt ist. Dazu sei {Oi : i ∈ I} eine offene
Überdeckung von Y. Insbesondere gibt es mindestens ein j ∈ I mit ∞ ∈ O j .
Nach Konstruktion der Topologie gilt O j = {∞} ∪ X \ K für eine kompakte Teil-
menge K von X. Nun ist sicherlich {Oi \ {∞} : i ∈ I} eine offene Überdeckung von
K. Also gibt es i1 , . . . , in ∈ I mit Oi1 ∪· · ·∪Oin ⊇ K, und daher Y = Oi1 ∪· · ·∪Oin ∪O j .

5 Dieser Topologische Raum wir als Alexandroff-Kompaktifizierung bezeichnet.
172 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN

12.9.2 Korollar. Lokalkompakte Hausdorffräume (X, T ) sind regulär. Zudem gibt es


zu jedem x ∈ X und jeder Umgebung U ∈ U(x) ein offenes P ⊆ X mit x ∈ P ⊆ P ⊆ U,
sodass P kompakt ist.

Beweis. Wegen Satz 12.9.1 können wir X als offene Teilmenge eines kompakten Haus-
dorffraumes (Y, O) mit T = O|X betrachten. Nach Lemma 12.7.10 ist (Y, O) regulär und
wegen Bemerkung 12.6.4 somit auch (X, T ).
Ist U ∈ U(x), so ist U auch Umgebung von x betrachtet als Teilmenge von Y.
Wegen Korollar 12.6.3 gibt es ein offenes P ⊆ Y, sodass x ∈ P ⊆ P ⊆ U, wobei P ad
hoc der Abschluss von P in Y ist. Nach Lemma 12.7.7 ist P kompakt, wegen P ⊆ X ist
P auch offen in X, und wegen P ⊆ X zusammen mit (12.13) ist P auch der Abschluss
von P in (X, T ).

12.9.3 Beispiel. Man betrachte C ∪ {∞} versehen mit der chordalen Metrik χ. Ist O die
Topologie, die von χ auf C∪{∞} erzeugt wird, so ist (C∪{∞}, O) genau die Alexandroff-
Kompaktifizierung von C versehen mit der euklidischen Topologie.

12.9.4 Definition. Sei (X, T ) ein lokalkompakter Hausdorffraum. Dann bezeihnet


C0 (X, R) die Menge aller stetigen g : X → R, sodass

∀ǫ > 0 ∃K kompakt : ∀x ∈ X \ K ⇒ |g(x)| < ǫ.

Entsprechend definiert man C0 (X, C).

Wählt man etwa ǫ = 1 und K wie in der Definition, so ist t 7→ |g(t)| auf K wegen der
Kompaktheit beschränkt und auf X\K gilt ohnehin |g(x)| < 1. Also sind alle Funktionen
aus C0 (X, R) bzw. C0 (X, C) beschränkt.

12.9.5 Proposition. Bezeichne (Y, O) die Alexandroff-Kompaktifizierung des lokalkom-


pakten Hausdorffraumes (X, T ) wie in Satz 12.9.1.

 Für f ∈ C(Y, R) (C(Y, C)) mit f (∞) = 0 liegt die Einschränkung g := f |X in


C0 (X, R) (C0 (X, C)).

 Ist umgekehrt g ∈ C0 (X, R) (C0 (X, C)), und setzt man g zu einer Funktion f auf
Y durch f (∞) = 0 fort, so gilt f ∈ C(Y, R) (C(Y, C)).

 Dabei ist f 7→ f |X eine lineare Bijektion von

N := { f ∈ C(Y, R) (C(Y, C)) : f (∞) = 0}

auf C0 (X, R) (C0 (X, C)), wobei k f k∞ = k f |X k∞ .

 Schließlich ist die Hyperebene N abgeschlossen in C(Y, R) (C(Y, C), und


C0 (X, R) (C0 (X, C)) versehen mit der Supremumsnorm ist ein Banachraum.

Beweis.

 Ist f ∈ C(Y, R) (C(Y, C)) mit f (∞) = 0, so ist klarerweise f |X stetig auf X bzgl.
O|X = T . Außerdem gibt es wegen der Stetigkeit von f bei ∞ zu jedem ǫ > 0
eine offene Umgebung von ∞, dh. eine kompakte Menge K in X, sodass | f (x) −
f (∞)| = | f (x)| < ǫ für alle x ∈ X \ K. Somit haben wir f |X ∈ C0 (X, R) (C0 (X, C)).
12.10. DER SATZ VON STONE WEIERSTRASS 173

 Ist nun g ∈ C0 (X, R) (C0 (X, C)) und setzt man f (x) := g(x), x ∈ X und f (∞) := 0,
so ist f stetig auf Y, da die Bedingung ∀ǫ > 0 ∃K kompakt, sodass |g(x)| <
ǫ, x ∈ X \ K genau die Stetigkeit von f bei ∞ bedeutet, und da für x ∈ X wegen
der Tatsache, dass X offen in Y ist, die Stetigkeit von g bei x unmittelbar auf f
übertragen wird.
 f 7→ f |X ist nun offensichtlich eine lineare Bijektion, wobei

k f k∞ = sup | f (x)| = sup | f (x)| = k f |X k∞ ,


x∈Y x∈X

da ja Y = X ∪ {∞} und f (∞) = 0.


 Da N gerade der Kern ϕ−1 ({0}) des linearen Punktauswertungsfunktionals ϕ :
f 7→ f (∞) ist, und da dieses beschränkt und daher stetig ist, ist N als stetiges
Urbild der abgeschlossenen Menge {0} ⊆ R(C) selbst abgeschlossen.
Somit ist (N, k.k∞ ) ein Banachraum (vgl. Lemma 9.1.10) und wegen k f k∞ =
k f |X k∞ auch C0 (X, R) (C0 (X, C)).

12.10 Der Satz von Stone Weierstraß


Sei E irgendeine Menge. Dann heißt eine Menge A ⊆ B(E, R) (B(E, C)) von Funktio-
nen f : E → R (C) eine Algebra von Funktionen, falls gilt
(i) A ist ein linearer Teilraum.
(ii) Mit f, g ∈ A ist auch f · g ∈ A.
Ist E mit einer Topologie versehen, so folgt aus der Tatsache, dass das Produkt von
zwei stetigen Funktion wieder stetig ist (vgl. Korollar 12.5.12), dass die Menge aller
beschränkten und stetigen Funktionen eine Algebra darstellt.
12.10.1 Lemma. Sei A eine Algebra auf einer Menge E und bezeichne B den Ab-
schluss von A in B(E, R) (B(E, C)) (bzgl. k.k∞ ). Dann ist B wieder eine Algebra.
Beweis. Nach Lemma 9.1.11 ist B ein linearer Teilraum von B(E, R) bzw. B(E, C).
Seien fn , gn ∈ A, fn → f, gn → g. Dann folgt

k fn gn − f gk∞ = k fn k∞ kgn − gk∞ + k fn − f k∞ kgk∞ → 0

da k fn k∞ beschränkt ist. Also ist mit f, g ∈ B auch f g ∈ B.



12.10.2 Definition. Sei A eine Algebra auf E. Man sagt A ist punktetrennend, falls
es zu je zwei verschiedenen Punkten x1 , x2 ∈ E eine Funktion f ∈ A gibt mit f (x1 ) ,
f (x2 ). Man nennt die Algebra A ist nirgends verschwindend, falls es zu jedem x ∈ E
ein f ∈ A gibt, sodass f (x) , 0.
Enthält A eine konstante Funktion ungleich der Nullfunktion, so ist A offensicht-
lich nirgends verschwindend.
174 KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
 )
12.10.3 Bemerkung. Für x1 , x2 ∈ E, x1 , x2 , ist φ x1 ,x2 : f 7→ ff (x
(x2 ) als Abbildung von
1

A nach R2 linear.
Ist für jedes solche Paar x1 , x2 diese Abbildung surjektiv, dh. für alle c1 , c2 ∈ R gibt
es eine Funktion f ∈ A mit f (x1 ) = c1 , f (x2 ) = c2 , so ist A offensichtlich punktetren-
nend und nirgends verschwindend.
Ist A umgekehrt nirgends verschwindendund  punktetrennend, so enthält   φ x1 ,x2 (A)
wegen der Linearität einen Vektor der Form d1 , einen Vektor der Form 1c und einen
 
der Form ef mit e , f .
Ist cd , 1, so sind die ersten beiden Vektoren linear unabhängig. Ist c = d = 1, so
sind die ersten beiden gleich und der letzte dazu
 linear
 unabhängig. Fallscd  =10 , c,
so ist - da A sogar eine Algebra ist - auch dc = d·1 1·c
∈ φ x1 ,x2 (A). Nun ist 00 , 1−d =
c  c  1
1 − d ∈ φ x1 ,x2 (A) linear unabhängig von d . In jedem Fall ist der Teilraum φ x1 ,x2 (A)
von R2 mindestens zwei-dimensional, dh. φ x1 ,x2 (A) = R2 .

12.10.4 Satz (Stone-Weierstraß). 6 Sei (K, T ) ein kompakter topologischer Raum und
sei A ⊆ C(K, R) eine punktetrennende, nirgends verschwindende Algebra stetiger
Funktionen. Dann ist A dicht in der Algebra C(K) := C(K, R) aller stetigen Funk-
tionen auf K.
Beweis. Nach Lemma 12.10.1 ist der Abschluss B von A in B(K, R) ein Algebra. Da
C(K, R) abgeschlossen in B(K, R) ist, haben wir auch B ⊆ C(K, R). Der Beweis erfolgt
nun in vier Schritten:

(i) Ist f ∈ B, so zeigen wir, dass auch | f | ∈ B.


Nach Bemerkung 9.6.2 (bzw. nach dem Satz von Weierstraß, Satz 9.7.5) kann die
stetige Funktion y 7→ |y| auf dem Intervall [−k f k∞ , k f k∞ ] beliebig gut gleichmäßig
durch Polynome approximiert werden. Also gibt es zu ǫ > 0 ein reelles Polynom
pǫ (y), sodass
pǫ (y) − |y| ≤ ǫ, y ∈ [−k f k∞ , k f k∞ ].
P
Setzt man y = 0, so folgt |pǫ (0)| ≤ ǫ. Damit gilt für mj=1 a j y j := pǫ (y) − pǫ (0)

Xm
a j y j − |y| ≤ 2ǫ, y ∈ [−k f k∞ , k f k∞ ].
j=1

Pm j
Da B eine Algebra ist, gilt j=1 a j f ∈ B und

X
m
k a j f j − | f | k∞ ≤ 2ǫ.
j=1

Da ǫ > 0 beliebig war und da B abgeschlossen ist, folgt | f | ∈ B.

(ii) Sind f1 , . . . , fn ∈ B, so gilt auch max( f1 , . . . , fn ) und min( f1 , . . . , fn ) in B, dann


für n = 2 hat man
f1 + f2 | f1 − f2 |
max( f1 , f2 ) = + ,
2 2
6 Marshall Harvey Stone, geb.8.4.1903 New York, gest.9.1.1989 Madras (Indien)
12.10. DER SATZ VON STONE WEIERSTRASS 175

f1 + f2 | f1 − f2 |
min( f1 , f2 ) = − ,
2 2
und für n > 2 folgt die Behauptung durch vollständiger Induktion.

(iii) Ist f ∈ C(K), x ∈ K, ǫ > 0, dann existiert eine Funktion g x